TOP  >  がん情報サポート  >  がん関連情報  >  データの信憑性を評価するために

がん情報サポート

データの信憑性を評価するために

カテゴリ : 
がん関連情報
閲覧 (4582)
 がん治療における臨床試験の効果指標に関する議論が多くなっている印象がありますが,最近の臨床試験について,疑問に思うことを述べてみたいと思います。
 がん治療における臨床試験の効果指標に関する議論が多くなっている印象がありますが,最近の臨床試験について,疑問に思うことを述べてみたいと思います。

1.探索研究(第II相試験)と検証研究(第III相試験)
 一般に第II相試験は,用量設定などや効果に関係する因子を検討する探索研究,第III相試験は第II相試験までで得られた所見や仮説を検証する試験と考えられています。
 最近は,第II相試験でもランダム化比較試験が行われることも珍しくありませんが,症例数は,多くありません。探索研究ですので,第III相試験につながる所見や仮説を得ることが目的となります。すなわち,効果に影響する因子や適切な用量を設定することが重要になると思います。
 しかし,第III相試験で芳しくないデータが得られた時に,後層別解析で,効果に関連する因子を特定化して,ある因子でも効果を主張することも見受けられます。
 先日紹介したペメトレキセド(商品名アリムタ)のドセタキセルとの比較を行った非小細胞肺がんの第III相試験がその例の一つですが,この第III相試験では,この対象では,両薬剤の効果に差がないということが結論です。その後の後層別解析で,ペメトレキセドは扁平上皮がん患者に効果がなく,非扁平上皮がん患者ではドセタキセルより良好な結果を示すことが示されています。後層別によるretrospective analysisですので,EBMの考え方でいうと,質の高いエビデンスとはなりません。すなわち,ペメトレキセドの非扁平上皮がん患者に対する有効性に関しては,改めて第III相試験を行わなければ,非扁平上皮がんにペメトレキセドが効果があるとは結論できないことになります。
アリムタは扁平上皮がんに効果はない?!
http://clinicalscience.info/modules/cancer_research/details.php?bid=1194

 上皮増殖因子受容体(EGFR)の抗体医薬であるセツキシマブやパニツムマブの効果は,K-ras遺伝子変異がない例に認められ,遺伝子変異ある例には効果がないとの研究も,同じことが言えると思います。
パニツムマブの効果予測因子 Part2
http://clinicalscience.info/modules/cancer_research/details.php?bid=1184

 これらの臨床的な意味を疑問視しているのではなく,第III相試験の後層別によるretrospective analysisをあたかも質の高いエビデンスとするのには抵抗があるのです。
これらの臨床的な意義を質のエビデンスとするには,改めて第III相試験を行う必要があると思いますが。
 第III相試験は,あくまでも仮説検証試験で,探索研究ではなく,第III相試験結果で後層別解析をしなければならない時には,第II相試験が十分に行われなかったということを意味していると思います。

2.データの表記と有意水準(p値)
 臨床試験結果を相対リスク減少率で示す論文が多くなっていると思います。また,治療群間の差が小さいときには対象症例数を多くする傾向があります。
 相対リスクや症例数とp値の関係については,以前お伝えしていますので,下記の記事を参考にしていただきたいと思います。
相対リスク
http://clinicalscience.info/modules/cancer_research/details.php?bid=1067
P-value syndrome
http://clinicalscience.info/modules/cancer_research/details.php?bid=1066

 相対リスク減少率で薬剤の効果を主張することは,効果をデフォルメしているだけかもしれません。
 例えば,HER2陽性乳がん患者のトラスツズマブ(商品名ハーセプチン)の術後補助療法を評価した論文では,トラスツズマブ投与群は,対照群に比較して,死亡リスクが軽減していることが示されています(ハザード比0.66,95%信頼区間0.47-0.91,p=0.0115)。ハザード比0.66ですから,かなりの効果があると考えるのは当然なのですが,3年生存率の差は,1.84%しかありません。すなわち,絶対リスク減少率は1.84%であり,トラスツズマブ投与で恩恵が受けられるのは,54.3例に1例ということになります(NNT54.3)。
 ハザード比から死亡リスクが34%低下したと主張されることは間違いないことなのですが,これでは3年生存率の差が1.84%である事実はよくわからないことになります。
 HER2陽性乳がん患者のトラスツズマブの術後補助療法としての意義はあることは間違いないことかもしれませんが,トラスツズマブ投与で恩恵が受けられるのは,54.3例に1例であることをもう少し考えるべきと思います。
ハーセプチンの術後補助療法の成績
http://clinicalscience.info/modules/cancer_research/details.php?bid=1147

 また,最近は,幾つかの臨床試験を統合してpooled analysisをすることもあります。
 臨床試験結果を統合するメタ分析にはルールがあります。関連する全ての論文を検索して,適切な採用条件を予め決めて,論文を特定化してメタ分析を行うことが必要なのですが,pooled analyasisの中には,都合の良い臨床試験だけを統合していると思われるものもあります。これでは,有意差を出すため(p値を小さくするため)に症例数を多くしているにしか過ぎないと言われても仕方がありません。仮説検証試験は,仮説を検証するために必要な症例数を明確にして,臨床試験を行い,その結果を重んじることが必要と思われます。
 不適切なpooled analysisは,臨床試験の概念,理論を損なうものでしかないと思います。

3. 適切な症例数の必要性
 臨床試験,特に第III相試験では,比較する対照群と,効果に影響する背景因子に差がないことを確認する必要がありますし,予後因子として明確であるものは,層別因子とする必要があります。すなわち,背景因子の群間差がないことを適切に確認できる症例数が必要になると思います。各群40例以下の場合には,背景因子が両群に均一かどうかを評価するのが難しく,治療効果があるのかないのか明確にならないと思われます。
 特に,神経障害性疼痛の治療薬に関しては,症例数が少ないことに加えて,末梢神経障害の経験(末梢神経障害の有害反応がある薬剤の使用経験),痛みの性質などについて,層別化もされておりませんし,検討もされていないのが実情です。神経障害性疼痛は種々の要因で引き起こされると言われていますので,これらの因子に対する効果を検討する必要があると思います。
 臨床試験の場合には,仮説検証するために必要と思われる症例で試験が行われる必要があります。症例数が少なくても,症例数が多すぎても,適切な結論にはならないと思います。
 
4. 経済的評価
 英国の医療技術評価機関であるNICE(National Institute for Clinical Excellece)では,費用対効果をも重視し,いくつかの薬剤が,費用対効果がないと理由で推奨されていません。
 世界的にも,費用対効果が注目されていますが,その状況のなかで,臨床試験結果に基づいて,モンテカルロ・シミュレーションで推定して,費用対効果を主張している論文もあります。
 モンテカルロ・シミュレーションで推定できる条件は,多くの試験が十分な観察期間(がんで言えば,5年生存率が確立した段階)での結果に基づくことが適切と思います。しかし,最近は,3年生存率しかない,また都合の良い臨床結果に基づいて,モンテカルロ・シミュレーションで推定して,費用対効果を評価する論文が散見します。
 また,がん医療の場合には,患者の選好(preference)を考慮した費用対効用値分析(Cost-utility analysis)が必要となると思いますが,多くの試験で,効用値を測定していませんので,モンテカルロ・シミュレーションを利用せざるを得ません。しかし,あくまでも,推定ですので,正確には,効用値を測定した比較試験で評価すべきと思います。
  • 前へ
  • 次へ