臨床試験,とりわけランダム化比較試験は,臨床診療における介入や治療の根拠となるため,その結果は完全で正確であることが求められる。しかし,主要なアウトカムに有意差が認められなかったにも関わらず,二次アウトカムやサブグループ解析の結果を強調して治療の効果を印象づける行為—“spin(都合のよい解釈)”—が多く行われていることがBoutronらの研究により示され,2010年5月のThe Journal of the American Medical Association誌に報告された[PubMed]。ここではその概要を紹介する。(編集部)
この研究の対象となったのは,2006年12月に発表され,2007年3月までにPubMedに収載されたRCTのうち,並行群間試験かつ一次アウトカムに有意差のなかった72本。これらについてspin(主要アウトカムが統計的に有意ではないにも関わらず,試験で実施された治療の有効性を強調したり,有意差がないことから読者の注意を逸らすような報告方法)の有無や内容について検証した。その結果,spinが論文タイトルに含まれていたのは18.0%,アブストラクトの「結果」に含まれていたのは37.5%,アブストラクトの「結論」には58.3%であった。本文でのspinは,「結果」には29.2%,「ディスカッション」には43.1%,「結論」には50.0%に認められ,spinが2ヵ所以上に記載されている論文が40%以上あった。また,結論部分で,報告している結果に何の疑念も述べず,新たなRCTの必要性も述べず,さらには結果に有意差がみられなかったことについてなにも言及していないにも関わらず,試験で検討された治療を臨床に応用することを推奨しているものを「高レベル」のspinとした。このような高レベルのspinは,アブストラクトで33.3%,本文で26.4%に認められた。
アブストラクトは読者の論文全体に対する評価の基準となることが多く,また無料で配布されているため,単独で臨床上の判断の基準となる場合もあり,アブストラクトにspinが含まれていることは重大な意味をもつ。
スポンサーや試験関係者はRCTに多大な時間と費用を費やしているため,試験の結果に対して中立であることは少ない。そのため,RCTの結果が統計的に有意でない場合は,spinが行われるリスクが増大するとBoutronらは述べている。さらに,統計的に有意であったRCTにはよいエビデンスがあるとしながらも,「著者が二次アウトカムやサブグループ解析,群間比較から有効性を結論づけたり,統計的に有意でない結果について,有効性や安全性を"同等性を示すもの"として不適切に解釈している場合には,とくに注意しなければならない」とコメントしている。