ホーム   >  トピックス   >   2011年のトピックス   > エビデンスから推奨を作成するために —GRADEシステムの発展に向けて
[インタビュー] Gordon H. Guyatt 氏
THERAPEUTIC RESEARCH vol.32 no.5 2011掲載
エビデンスから推奨を作成するために —GRADEシステムの発展に向けて
Gordon H. Guyatt氏

近年,わが国の診療ガイドラインでもEvidence-based Medicine(EBM)の概念が導入され,推奨作成のプロセスにクリニカル・クエスチョンやシステマティックレビューなどのEBM的手法が用いられつつある。海外ではさらに,推奨作成の一連のプロセスを標準化し,その標準プロセスを多くのガイドライン作成グループで共有する,という取り組みが進んでいる。標準プロセス普及のために開発されたGRADEシステムは,すでに50組織に支持され利用されるに至った。ここでは,GRADEワーキンググループの中心人物である,Gordon H. Guyatt氏にGRADEシステムの現状について聞いた。

(インタビュアー: 米国医療ライターMary Mosley)

Gordon H. Guyatt氏
McMaster University, Hamilton, Canada
GRADEワーキンググループの創設者

インタビュー
—EBMの概念がGRADEシステム開発につながった経緯をお話し下さい

約20年前まで,診療での意思決定の際にエビデンスを意識していた医師はほとんどいなかったと思います。当時は,原著論文をどのように読んだらいいのか,また,どのように解釈すればよいのかを知る医師は非常に少なかったといえるでしょう。いま振り返ると,治療の「推奨」を提示していた専門家ですら,エビデンスの批判的吟味を行い,そこから正しい理解を得ていたのはほんの一握りでした。そのような状況下で,「エビデンスに基づく医療(Evidence-based Medicine: EBM)」の概念が生まれたのです。私は,この概念をEBMという言葉で表し,1991年に論文で発表しました。こうしてEBMという言葉が初めて公に発信されたわけです。

EBMの概念を広めると同時に,医学論文を理解し,正しく利用するための原則を作る取り組みもはじまりました。「その研究結果がエビデンスとして質が高いのか低いのか」,「そのエビデンスと診療をどう結びつけるのか」,といった判断の基準を作ろうという試みです。

その後,われわれがエビデンスを上手に用いるようになるにつれ,エビデンスの限界もみえてきました。最近では,治療を行うことによる望ましい転帰と望ましくない転帰のかね合いを考慮した意思決定が迫られます。つまり,臨床における意思決定の際に,患者の価値観や好みが関与しうることとなったのです。

エビデンスによると,1例の乳がん死を予防するには300人の女性が10年間にわたって検診を受けなければなりません。その検診では多数の擬陽性が生じるため,不必要な生検とそれによる合併症を生じさせるリスクがあります。また,心房細動患者に対するワルファリンは,脳卒中予防には有効ですが,出血リスクが伴います。副作用や潜在的な害(harm),あるいはコストの問題が関与しない治療法など存在しません。ですから,私たちは患者の価値観や好みを考慮した選択を繰り返すことになったのです。

エビデンスそのものは,医師が何をすべきかという臨床的判断を与えてはくれません。しかし,判断の基礎とすべきはエビデンスなのですから,私たちは,これを中心に据えた意思決定を行える,なんらかのシステムが必要だと考えました。また,個々の医師や医療従事者が,エビデンスの評価の方法を理解することはたいへん望ましいことですが,一人の臨床医がすべてのエビデンスを評価し,適切な結論を導くのは極めて困難です。ですから,エビデンスを系統的に集約するシステマティックレビューを行い,これを基にした診療ガイドラインを作ることが必要とされました。そのシステムとしてわれわれが開発したのが,GRADEシステムです。

診療ガイドラインを作成する人は,エビデンスを適切に理解・評価し,適切にガイドラインに反映させなければなりません。そして,推奨を提示する際は,患者の価値観や好みとのバランスをよく考慮することが非常に重要なのです。これまでも多くの機関がさまざまなシステムを開発してきましたが,ほとんどは問題の多いシステムだったと言わざるを得ません。そして問題の多いシステムの乱立は,多くの混乱を招きました。ですから私は,エビデンスの質を評価し,推奨の強さを定めるための,明瞭かつ標準化された包括的アプローチが必要だと考えたのです。

1999年に,私とAndrew D. Oxman氏(Norwegian Knowledge Centre for the Health Services)は,システム乱立がもたらしていた問題について話し合いました。その話し合いのなかで,十分に質が高く,十分に周到で,誰もが利用することのできる,そんな理想的なシステム,"GRADEシステム"を作る話が持ち上がりました。それ以来,ガイドライン作成者や研究手法の方法論学者など,この領域の専門家たちとともにGRADEワーキンググループを作り,GRADEシステムが現実のものとなったのです。

—GRADEシステムではどのようなことが行えるのですか

GRADEシステムは,システマティックレビュー,医療技術評価(health technology assessment),診療ガイドライン策定の際に,透明性のある明確なプロセスを経てエビデンスの質評価や推奨度を決定するために作られたシステムです。われわれはGRADEシステムがより広く用いられ,その結果として,臨床医がガイドライン策定の手法やグレーディングの手法を知り,また,エビデンスレベルと推奨度の強さについて容易に理解できるようになることを望んでいます。

GRADEシステムは,ガイドライン開発の方法,とくにエビデンスの質評価の方法(推定効果の信頼性が高い場合はレベル「高」,信頼性が低い場合はレベル「低」)と,患者の価値観と好みがどのような役割を担うべきかを提供するものです。GRADEシステムはまた,介入の有用性と害のかね合いを考慮するプロセスも提供します。GRADEシステムのプロセスは次のとおりです。

とくに,ガイドラインでの推奨は,患者の価値観や好みを踏まえ,その介入の利益と不利益のバランスを考慮したうえで作成されるべきです。

  • クリニカル・クエスチョン(CQ)を定義する
  • システマティックレビューを実施する
  • エビデンスの質を評価する(高,中,低,非常に低)
  • GRADEが配布するフリーソフトを用いて,エビデンスのプロフィール(Evidence Profile: EP)と結果の要約(Summary of Finding: SoF)を作成する
  • それぞれのCQについてのガイドライン推奨を作成する(強い,弱い)

エビデンスの質には四つのカテゴリーがあります。

  • 高:推定効果に高い信頼性が認められる
  • 中:推定効果に中程度の信頼性が認められる
  • 低:推定効果に高い信頼性が認められない
  • 非常に低:推定効果が憶測されるに過ぎない

まず,患者にとって重要な結果を示すエビデンスが集められ,その後,GRADEが提供するガイドによってエビデンスの質が決定されます。その後,エビデンスの質に基づいてEPとSoFテーブルに,簡潔な要約とエビデンスの質,その判断の根拠がまとめられます。EPとSoFはGRADEが開発したもっとも重要な手法の一つです。

—CQはどのように作成すべきでしょうか

Journal of Clinical Epidemiologyで先頃から発表しているシリーズ論文で示したように,CQの作成はGRADEのプロセスで大変重要です。

明確に定義されたCQでは,患者集団,介入,比較対照,アウトカムが慎重に特定されています。この方法論は,一般にPICO(患者patient/介入intervention/対照comparison/アウトカムoutcomes)とよばれ,焦点を明確に絞った推奨を作成する助けとなり,これはシステマティックレビューや診療ガイドラインの開発にますます用いられるようになってきました。このプロセスでは,患者にとって重要なアウトカムをすべて同定することが重要であり,そして究極的には,患者にとって重要なアウトカムを階層化できれば,それが利害得失の重み付けにもなります。PICOの要素が一つ以上欠けていたり明らかでなかったりする推奨を載せた診療ガイドラインもしばしば見受けられますが,このような推奨は不適切と言わざるを得ません。多くみられる失敗の一つは,対照(comparison)が不明瞭なことです。対照がない,あるいは不明瞭なのに,いったいどのような推奨ができるのでしょうか。その他にも,患者にとってはあまり重要でないアウトカムを設定しているPICOも見かけます。コレステロール低下がその例です。患者にとって重要なのは心疾患や脳卒中のリスクを抑えることであり,コレステロール低下そのものではありません。PICOにおけるアウトカム設定は患者本位に考えるべきであり,コレステロール低下のようなサロゲートを用いるべきではありません。さらには,患者にとってより重要なアウトカム,たとえば介入による有害事象に関する記載が診療ガイドラインの推奨で省略されていることもあるのです。

—CQに沿って行うシステマティックレビューの情報から推奨ができあがるまでのプロセスについて教えて下さい

各CQに関するEPとSoFは,エビデンスから推奨を導くための素材となり,SoFのためのソフトウェアはGRADEのウェブサイトにて無償で配布されています(http:// www.gradeworkinggroup.org/)。これによって,利用可能なエビデンスを集約し,そのエビデンスの質を評価することができます。評価するための中心的な要素は,次の三つです。

  • エビデンスの質
  • 介入による望ましい結果と望ましくない結果の利害得失
  • 患者の価値観と好み

エビデンスの質が高いほど,強い推奨が付されることになります。そして,望ましい結果が望ましくない結果を明らかに上回ればその介入を実施する推奨は強くなり,明らかに下回ればその介入を実施しない推奨が強くなります。そして,望ましくない結果の重要性が望ましい結果の重要性に迫るほど,その介入の推奨は弱いものとなります。価値観や好みのばらつきについては,患者がある介入の望ましいアウトカムを得たい気持ちが,望ましくないアウトカムを回避したい気持ちを上回ると考えられる場合は,その介入の推奨は強くなります。

推奨の内容によっては,ガイドライン作成者は医療機関の利用やコストについても考慮することになるでしょう。これらすべてを考慮したうえで,推奨の強さが決定されるのです。ときに,診療ガイドライン作成メンバー間で患者の価値観や好みに対する解釈の違いがあり,推奨についての見解が異なる場合もあり得ます。しかしGRADEシステムは,推奨の強さを決定するための明確な道筋を提示していますから,このような場合はとくに有用でしょう。ですから,GRADEに修正を加えず,忠実に従うことが非常に重要ということを強調したいと思います。

—エビデンスの質と推奨の強さは切り離して考えるべきなのですね

そうです。エビデンスの質を評価しシステマティックレビューを実施することは,ガイドライン推奨に先行する独立したステップです。エビデンスの質は,一般に用いられている方法論を用いて評価しますが,EPとSoFがその役割を果たします。部分的には,エビデンスの質は臨床試験のデザイン(観察研究,前向き研究など),研究の水準や厳密さなどによって評価されます。

ただ,エビデンスの質は高いけれど推奨は弱いということは十分にあり得ます。たとえば,高リスク心房細動患者においてワルファリンは脳卒中の絶対リスクを1~2%減少させますが,ワルファリン服用による患者の負担や生活上の不自由さとの利害得失により,推奨は弱くなります。一方で,水疱瘡と川崎病との関連を示すエビデンスの質は高くありませんが,アセトアミノフェンをアスピリンの代替療法とすることは強い推奨として妥当でしょう。

—GRADEシステムを修正して用いることについてはどのように考えていますか

GRADEシステムを修正して用いることは,プロセスの透明性に影響を与え,ガイドラインの推奨に対する明確な理解にも影響を及ぼします。これは,透明性のある一貫したプロセスを経た推奨を作成するという,GRADEの目的そのものが壊されることになります。ですから,私たちはGRADEを修正せずに使うことを強く望みます。

GRADEは必ずしも完璧なシステムとは言えない部分もあるかもしれません。しかし,非常に熟練した専門家が,膨大な時間と労力を使って開発したものです。また,GRADEの最大の利点の一つは,皆が同じシステムを同じ方法で使用することです。こうすることによって,多くの人がGRADEをよく理解し,さまざまなガイドラインの推奨を容易に理解することが可能になるのです。GRADEは急速に普及しつつあり,すでに50組織がGRADEを支持し使用するようになりました。

GRADEの使用が困難であると思われた場合は,GRADEワーキンググループに連絡をいただければと思います。その問題について議論したいと思います。これまでに寄せられたデータや情報によって,GRADEプロセスを更新したことがあり,これはGRADE改善の助けとなりました。

—GRADEシステムについてより深く知るための資料はありますか

私たちはJournal of Clinical Epidemiologyで20論文のシリーズを発表する予定です。いずれもGRADEを使用するための各ステップについて詳細に解説し,そのほとんどは2011年中に発表します。2008年にBritish Medical Journalより6論文のシリーズを発表しましたが,システマティックレビューや医療技術評価,診療ガイドラインの作成にはより多くの詳細情報が必要だと思われました。GRADEシステムを初めて使う方には,British Medical Journalの6論文を読むことをお薦めします。

—Canadian Cardiovascular Societyはこのほど,GRADEシステムを用いた心房細動診療ガイドラインを発表しました。GRADEシステムを用いた診療ガイドラインはこのほかにどのようなものがありますか

米国の主要学会の多くがGRADEを採用しています。American College of Chest Physiciansは現在,抗血栓ガイドラインの改定にむけてGRADEシステムを利用しています。その他のGRADEシステムの画期的な使用例は,臨床医向けの電子テキストであるUpToDateです。UpToDateの影響力は極めて大きく,ポピュラーで,広く用いられています。UpToDateはGRADEの導入によって大きな前進を遂げていると思います。今後,GRADEを用いた診療ガイドラインの推奨は,UpToDateでも優先的に採用されることになるでしょう。UpToDateはどの診療ガイドラインよりもはるかにポピュラーですから,そこでGRADEが用いられたことは非常に革命的なことだと思います。

現在,GRADEは,世界保健機関(WHO)やコクラン共同計画,British Medical Journal,National Institute for Clinical Excellence,そして主要な医学組織や雑誌を含め,50の組織によって支持され,用いられています。GRADEのウェブサイト(http://www.grade workinggroup.org/)でそのリストを掲載しています。

—GRADEワーキンググループの活動について教えて下さい

GRADEワーキンググループは,1~2日間のミーティングを1年に2~3回行っています。私たちはこのミーティングを重視していますが,メンバーはそれぞれ膨大な仕事を抱えていますから,GRADEワーキンググループの活動の多くは電子媒体を用いて進めています。主な活動は,ポジション・ペーパーの作成や,疑問・論点の要約,論文執筆などで,これらを逐次行っています。電子メールでの議論を重ねたうえで,ミーティングにて意見をまとめあげ,さらに数ヵ月先までに議論を進める優先事項を決定します。

ワーキンググループのメンバーは,それぞれがこの仕事に深く関与しており,多くの時間を割いています。名前だけを貸すというスタンスのメンバーは存在しません。

GRADEシステム向上にとくに貢献しているコアメンバーは約50名,その他のメンバーを含めると合計で約250名によって支えられています。GRADEワーキンググループは極めてオープンな組織ですから,新たに参画していただけるメンバーも歓迎しています。

また,GRADEワーキンググループは,いかなる製薬企業,デバイス企業からも独立しており,一切の金銭的支援を受けていません。ときに,メンバーの在籍する団体から資金を得ることはありますが,メンバーがミーティングに参加する際の経費はすべて自腹です。そしてメンバーの費やす時間と成果物は,彼らのアカデミックワークの一部となっています。

—ありがとうございました

▲このページの上へもどる