1.ガイドラインとは何か
ガイドラインは、「エビデンスのシステマティックレビューと複数の治療選択肢の利益と害の評価に基づいて、患者ケアを最適化するための推奨を含む文書」(米国医学研究所:Institute of Medicine 2011)や「診療上の重要度の高い医療行為について、エビデンスのシステマティックレビューとその総体評価、益と害のバランスなどを考量し、最善の患者アウトカムを目指した推奨を提示することで、患者と医療者の意思決定を支援する文書」(Minds 2016)と定義されている。
日本では1998~1999年に、厚生労働省・医療技術評価推進検討会で科学的根拠に基づく医療(Evidence-Based Medicine; EBM)を普及させるために、ガイドラインの作成に研究助成を行うことが決定されてから、ガイドライン作成が促進された背景がある。診療ガイドラインは医療者向けであるが、乳がん、胃がん、大腸がん、肺がん、子宮がん・卵巣がんなど患者向けに平易な言葉で解説した「患者用」ガイドラインも存在する。
ガイドラインには以下のような効果がある。
1)最新の臨床研究に基づいた質の高い診療の普及
医学は進歩するものであり、進歩は通常、研究発表という形で表れる。しかし、臨床現場は非常に忙しく、おのおのの臨床医がすべての研究発表を絶えず情報収集していくのは至難の業である。そのため、最新の知見をわかりやすい形でまとめて、最新の標準治療や推奨グレード(推奨度)に関する情報を現場に行き渡りやすくすることが診療の質を保つために重要であり、ガイドラインがその役割を担う。
2)推奨される診療の可視化とコミュニケーション・ツールとしての役割
ガイドラインにより、専門家のみならず非専門医、医師以外の医療者、患者・家族や介護者にも、現時点での一般に推奨される診療がどのようなものであるかが簡単に理解できるようになる。
2.ガイドラインの種類
ガイドラインには、(1) 臨床的課題(クリニカルクエスチョン:CQ)形式のものと、(2) 教科書形式のものがある。(1) は、現場においてよく遭遇すると思われる疑問や課題(○○な患者に対して、△△をしたほうがよいのか)をまず設定し、その疑問に答えるために文献検索などを行った回答をもってその推奨とするものである。(2) は系統的に知見をまとめる、という形式をとる。
前者は疑問に対しては明確な答えが出るものの、対象とする臨床状況の範囲が限られる傾向にあるのに対し、後者は包括的であるが、推奨が確定していないことも対象範囲に含まれることも多くなることから、曖昧になってしまう傾向がある。
近年は(1)のガイドラインがほとんどであり、公益財団法人日本医療機能評価機構が運営する医療情報サービスMinds(マインズ)で公開している『Minds診療ガイドライン作成マニュアル』に準じて作成されることが多い。
3.ガイドライン策定プロセスとは
ガイドラインの策定は、科学的根拠に基づいた情報の下で、専門家間において標準治療や推奨グレード(推奨度)を明確に決める機会が提供されるという一面がある。
これまでに結論を出さずに曖昧に診療がなされていた部分についての議論が、ガイドライン策定のプロセスで深まる。もちろん、標準というほど確立したものが明確にできる分野がどれほどかは未知数的な部分があるが、少なくともこれを意識した議論の場が提供される。
ガイドラインの中には、科学的根拠、Evidence-Based Medicine(科学的根拠に基づく医療;EBM)の手法と意識して表題に記載しているものがある。ガイドラインは必ずしも科学的根拠に基づいたものばかりではないが、EBMの考え方が広まり、その手法に基づいて策定されるのが望ましいとされている。次に前記の『Minds診療ガイドライン作成マニュアル』にそってガイドライン策定のプロセスを解説する。
1)全体の流れ
ガイドラインを作成する組織(学会など)で、当該ガイドラインが取り扱う疾患などの診療の全体を整理し、ガイドラインで取り上げる重要な臨床課題を検討し決定する。この臨床課題に対して、検査や治療方法などガイドラインで答えるべきクリニカルクエスチョン(CQ)を設定する。
それぞれのCQに対して、(1) 発表されている研究を文献データベースから網羅的に拾い上げ、(2) それを専門家が研究方法などについて吟味することで取捨選択してまとめ、(3) それらの根拠に基づいて、さまざまな臨床状況における推奨を決定する、という流れになる。
2)臨床的課題:CQ形式で記載
CQは構成要素を抽出して表現する。抽出には一般的に以下にあげる、PICOが用いられる。
- P(Patients、Problem、Population)
介入の対象となる患者特性(性別や年齢など)
疾患や病態、症状など
特定の地理的条件や施設的要件など - I/C(Interventions/Comparisons、Controls)
Pに対して行うことを推奨するかどうか検討したい介入
介入の期間、用量、投与方法などの要素
プラセボ(偽薬)、標準治療群か、などの比較する群 - O(Outcomes)
どの介入が最も推奨されるか判断するための基準となるアウトカム
PICOであげた構成要素を、「Pにおいて,Iを用いることが(Cと比較して)推奨されるか」のような一つの文で記載する。ガイドラインの作成過程では多数のCQが作成されるが、その中でも重要もしくは重大なアウトカムを扱うCQを採用する。
3)エビデンス・レベル
研究の吟味において重視される研究方法をわかりやすいように類型化して信頼度の目安を作ったのが、エビデンスレベル(証拠のレベル)と呼ばれるものである。一般にランダム化比較試験といって、コインを振って出た表裏の面で治療群・非治療群を決めて比較する研究デザインの研究は、エビデンスレベルが高いとされる。そのランダム化比較試験を複数集めて検討した系統的レビューが最もレベルが高く、そのような科学的データによる根拠に基づかない専門家の意見は低いとされる。しかし、これも、さまざまな団体が多様な基準を作っているため、エビデンスレベルの記述のある文献を読む場合にはどのような基準が作成されているのかを確認する必要がある。下記はエビデンスレベルの1例として、「診療ガイドライン作成の手引き2014」で採用されているエビデンスレベルである。
Ⅰ | システマティック・レビュー/RCTのメタアナリシス |
---|---|
Ⅱ | 1つ以上のランダム化比較試験による |
Ⅲ | 非ランダム化比較試験による |
Ⅳa | 分析疫学的研究(コホート研究) |
Ⅳb | 分析疫学的研究(症例対照研究、横断研究) |
Ⅴ | 記述研究(症例報告やケース・シリーズ) |
Ⅵ | 患者データに基づかない、専門委員会や専門家個人の意見 |
なお、システマティック・レビュー/RCTのメタアナリシスが、最上位に位置しているが、メタアナリシスとは、複数の研究を統合して統計解析を行う手法であることから、個々のRCTの質や均一性に影響される。そのため必ずしも、RCTよりも上位に位置するわけではなく、相互補完的に臨床的知見を構築していくものとして考えるべきという意見もある。また、エビデンスレベルとは、研究の分類による結論の強さの一般的傾向を順位付けしたものであり、研究の他の要素によってもその結論の強さが影響されることにも留意して、総合的に評価する姿勢が必要である。
4)推奨グレード、推奨度
CQごとにまとめたエビデンスの総体や益と害のバランスなどに基づいて、その推奨の確信度合いについてわかりやすく分類したものが、「推奨グレード」と呼ばれるものである。このグレードの付け方はガイドラインによって異なるが、通常は以下のようにA~Dに分類される。
A | 行うよう強く勧められる |
---|---|
B | 行うよう勧められる |
C | 行うことを考慮してもよいが,十分な科学的根拠がない |
D | 行わないよう勧められる |
5)推奨グレードとエビデンス
一般にエビデンスレベルの高いことがらほど、確信をもって推奨できるとされている。しかしながら、推奨グレードはエビデンスレベルと必ずしも1対1に対応するわけではない。エビデンスレベルは、研究のデザインを中心に決定されるが、推奨のグレードは、アウトカムの適切性、測定の適切性、効果の大きさ、効果と弊害のバランス、対象者の適切な選択などについて総合的に検討される。
つまり、高いレベルのエビデンスがあれば信頼できるというわけではない。例えば、研究デザインはよくても海外の研究しかなくて、遺伝的な違いなどから日本人には当てはまらないと考えられていることがらなどもある。逆にエビデンスレベルの高い研究がないからといって知見が信頼できないわけではない。
上述のとおり、コインを振った表裏で治療を割り付けて検証するランダム化比較試験はエビデンスレベルが高いとされるが、コインなどで治療を決めることが倫理的に許されるのは、研究前に治療効果が確定しない場合のみである。例えばタバコを吸うと肺がんが増えるかどうか、ということについては、タバコを吸う群と吸わない群をくじ引きで決めることは許されないため、そのような研究は不可能である。このような場合であっても、さまざまな状況の観察研究で一致した結果が出ていて、生物学的な検討からもその結果を支持すると考えられる場合には、十分推奨に耐えると考えられる。
4.ガイドラインの評価
欧米ではガイドラインを作成・報告・評価する共通の仕組みを確定することによって、ガイドラインの質の向上を目指すAGREE Collaborationと呼ばれる共同研究が行われている(AGREE Ⅱ:Appraisal of Guidelines Research and Evaluation Ⅱ)。そこでは、ガイドライン作成の手法の検討や実態調査、同じ疾患分野のガイドライン推奨の比較などさまざまな活動が行われており、2001年に公表されたAGREEが改訂されたAGREE Ⅱが公開されている。
AGREE Ⅱでは最低2名(4名以上が望ましい)が、6つの領域の23項目と全体評価2項目、合計25項目について、7段階(1:まったく当てはまらない~7:強く当てはまる)でガイドラインを評価する。評価では各項目を得点化し、「推奨する」「推奨する(条件付き)」「推奨しない」などの全体評価をするものの、AGREE共同研究の公式見解では、得点自体はガイドライン比較の際の意思決定の道具などとして使い、合格点を定めて「合格」「不合格」といった使い方はすべきではないとしている。
領域 1.対象と目的 |
1)ガイドライン全体の目的が具体的に記載されている。 |
2)ガイドラインが取り扱う健康上の問題が具体的に記載されている。 |
3)ガイドラインの適用が想定される対象集団(患者、一般市民など)が具体的に記載されている。 |
領域 2.利害関係者の参加 |
4)ガイドライン作成グループには、関係するすべての専門家グループの代表者が加わっている。 |
5)対象集団(患者、一般市民など)の価値観や希望が調べられた。 |
6)ガイドラインの利用者が明確に定義されている。 |
領域 3.作成の厳密さ |
7)エビデンスを検索するために系統的な方法が用いられている。 |
8)エビデンスの選択基準が明確に記載されている。 |
9)エビデンス総体(body of evidence)の強固さと限界が明確に記載されている。 |
10)推奨を作成する方法が明確に記載されている。 |
11)推奨の作成にあたって、健康上の利益、副作用、リスクが考慮されている。 |
12)推奨とそれを支持するエビデンスとの対応関係が明確である。 |
13)ガイドラインの公表に先立って、専門家による外部評価がなされている。 |
14)ガイドラインの改訂手続きが示されている。 |
領域 4.提示の明確さ |
15)推奨が具体的であり、曖昧でない。 |
16)患者の状態や健康上の問題に応じて、異なる選択肢が明確に示されている。 |
17)重要な推奨が容易に見つけられる。 |
領域 5.適用可能性 |
18)ガイドラインの適用にあたっての促進要因と阻害要因が記載されている。 |
19)どのように推奨を適用するかについての助言・ツールを提供している。 |
20)推奨の適用に対する潜在的な資源の影響が考慮されている。 |
21)ガイドラインにモニタリングや監査のための基準が示されている。 |
領域 6.編集の独立性 |
22)資金提供者の見解が、ガイドラインの内容に影響していない。 |
23)ガイドライン作成グループメンバーの利益相反が記録され、適切な対応がなされている。 |
5.ガイドラインについての注意
1)強制ではない
「例外のない規則はない」といわれるが、ガイドラインの推奨は「規則」ですらなく、比較的緩やかな推奨であるといえる。したがって、ガイドラインとは診療を縛るものではない。ガイドラインは、現場において医療者と患者が参考にしながら診療方針を考えていくもの、いわば診療の「出発点」であって「到達点」ではないことに注意が必要である。そもそも言葉の定義として、「ガイドライン」とは対象となる患者の60~95%に当てはまることがらを示すものであるという意見もある。
2)推奨は時代とともに変化する
医療は進歩するものである。そのため、ガイドラインに記された標準や推奨も時がたつにつれて変化する。ある研究によると、ガイドラインの約半数が6年弱で時代遅れになるといわれている。3~5年ごとに定期的に改訂されるべきものであるが、大変な労力を要するために必ずしも改訂が可能とは限らない。そのため、古いガイドラインでの推奨には注意が必要である。
6.ガイドラインを手軽に見るには
出版されたガイドラインは医学書を扱う書店で入手可能で、インターネット書店でも取り扱っている。また、Mindsのデータベースにはがんに限らず、さまざまな疾患に関してのガイドラインが電子的に掲載されており、他にも同様のサービスが存在する。がん情報サービスには、「各種ガイドライン等の情報へのリンク集」を掲載している。
引用文献
- Graham R., Mancher M., Wolman DM., et al. Editors. Committee on Standards for Developing Trustworthy Clinical Practice Guidelines, Board on Health Care Services, Institute of Medicine of the National Academies. Clinical Practice Guidelines We Can Trust(2011). The National Academies Press.
http://www.nap.edu/catalog.php?record_id=13058(Accessed June 19, 2017) - 小島原典子,中山健夫,森實敏夫,他 編.Minds 診療ガイドライン作成マニュアルver2.0(2016.03.15).公益財団法人日本医療機能評価機構.
http://minds4.jcqhc.or.jp/minds/guideline/pdf/manual_all_2.0.pdf - 厚生労働省.医療技術評価推進検討会報告書(平成11年3月23日).
http://www1.mhlw.go.jp/houdou/1103/h0323-1_10.html(閲覧日:2017年6月21日). - 森實敏夫,吉田雅博,小島原典子 編.Minds 診療ガイドライン作成の手引き 2014,医学書院
- 中山健夫.EBMを用いたガイドライン作成・活用ガイド.2004,金原出版
- 公益財団法人日本医療機能評価機構EBM医療情報部.AGREE II 日本語訳(2013年9月更新).
http://minds4.jcqhc.or.jp/minds/guideline/pdf/AGREE2jpn.pdf - Eddy D. M. Clinical decision making: from theory to practice. Designing a practice policy. Standards, guidelines, and options. JAMA. 1990; 263: 3077, 3081, 3084
- Shekelle P. G., Ortiz E., Rhodes S., et al. Validity of the Agency for Healthcare Research and Quality clinical practice guidelines: how quickly do guidelines become outdated? JAMA. 2001; 286: 1461-1467
- 公益財団法人日本医療機能評価機構.Minds ガイドラインライブラリ.
http://minds.jcqhc.or.jp/(閲覧日:2017年6月21日)