第 7 章 データ解析の使用例
著者: David Madigan
OHDSI 共同研究は、通常、保険請求データベースや電子的健康記録(EHR)データベースなどの形式で、リアルワールドのヘルスケアデータから信頼性の高いエビデンスを生成することに重点を置いています。OHDSIが重点的に取り組む使用例は、主に以下の3つのカテゴリーに分類されます。
- 特性評価
- 集団レベルの推定
- 患者レベルの予測
以下でこれらについて詳しく説明します。すべての使用例において、生成されるエビデンスはデータの限界を継承します; これらの限界については、エビデンスの質に関して本書の第14章 ~第18章で詳しく説明しています。
7.1 特性評価
特性評価は次のような質問に答えようとします
かれらに何が起こったのか?
データを用いて、コホートやデータベース全体の集団の特性、医療行為、経時的な変化に関する問いに答えることができます。
データが答えを提供できる問いには次のような例があります:
- 新たに心房細動と診断された患者のうち、何人がワーファリンの処方を受けたのか?
- 人口股関節置換術を受けた患者の平均年齢は?
- 65歳以上の患者の肺炎の発生率は?
典型的な特性評価は以下のように定式化されます:
- 何人の患者が…?
- どのくらいの頻度で…?
- 患者の何パーセントが…?
- 検査値の分布はどのようになっているか…?
- 患者のHbA1c値は…?
- ~の患者の患者の検査値は…?
- 患者の~への曝露期間の中央値は…?
- 経時的な傾向は?
- これらの患者が使用している他の薬剤は何か?
- 併用療法は?
- 症例が十分にあるか?
- 研究Xは実施可能か?
- ~の人口統計は?
- ~のリスク要因は?(特定のリスク要因を識別する場合、予測ではなく推定)
- ~の予測因子は?
そして期待されるアプトプットは以下の通りです:
- カウントまたはパーセンテージ
- 平均
- 記述統計
- 発生率
- 有病率
- コホート
- ルールベースのフェノタイプ
- 薬剤利用
- 疾患の自然経過
- 服薬アドヒアランス
- 併存疾患のプロファイル
- 治療経路
- 治療方針
7.2 集団レベルの推定
限定的ではありますが、データは医療介入の効果に関する因果推論を裏付けることができ、次の問いに答えます
因果効果とは何か?
私たちは因果効果を理解することで、行動の結果を理解したいと考えています。例えば、ある治療法を受けると決めた場合、将来にわたって私たちの身に何が起こるのかがどう変わるのでしょうか?
データは、次のような問いに対する答えを提供することができます:
- 新たに心房細動と診断された患者において、治療開始後最初の1年間に、ワーファリンはダビガトランよりも重大な出血を引き起こすか?
- メトホルミンの下痢に対する因果効果は年齢によって異なるか?
典型的な集団レベルの効果推定の問いは次のように定式化されます:
- …の効果は?
- 介入を行った場合、どうなるのか?
- どちらの治療がより効果的か?
- Yに対するXのリスクは?
- イベント発生までの時間は?
そして、期待されるアウトプットは以下の通りです:
- 相対リスク
- ハザード比
- オッズ比
- 平均治療効果
- 因果効果
- 関連
- 相関
- 安全性監視
- 比較効果
7.3 患者レベルの予測
データベースに収集された患者の医療履歴に基づいて、将来の健康イベントに関する患者レベルの予測を行い、次の問にい答えます
私には何が起こるのか?
データは、以下のような質問に対する答えを提供することができます:
- 新たにうつ病と診断された特定の患者について、診断後1年以内に自殺を図る確率はどの程度か?
- 新たに心房細動と診断され、ワーファリンによる治療開始後1年以内に虚血性脳卒中を発症する確率どの程度か?
典型的な患者レベルの予測に関する問いは次のように定式化されます:
- この患者が…になる可能性はどの程度か?
- 誰が…の候補となるのか?
そして、期待されるアウトプットは以下の通りです:
- 個人の確率
- 予測モデル
- 高リスク/低リスクグループ
- 確率的なフェノタイプ
集団レベルの推定と患者レベルの予測はある程度重複することがあります。例えば、予測の重要な使用例としては、特定の患者に薬剤Aが処方された場合の治療結果を予測し、また薬剤Bが処方された場合の同じ治療結果を予測することが挙げられます。現実には、これらの薬剤のうちの1つだけが処方された(例えば薬剤A)と仮定すると、薬剤Aによる治療の結果が実際に起こるかどうかを確認することができます。薬剤Bは処方されていないため、薬剤Bによる治療の結果は予測可能ですが、「反事実」であり、実際には観察されません。予測作業はそれぞれ患者レベルの予測に該当します。しかし、2つの結果の差(または比率)は単位レベルの因果効果であり、代わりに因果効果推定法を用いて推定すべきです。
人々は予測モデルを因果モデルとして誤って解釈する傾向があります。しかし、予測モデルは相関関係のみを示すことができ、因果関係を示すことはできません。例えば、糖尿病は心筋梗塞の強いリスク要因であるため、糖尿病治療薬の使用は心筋梗塞の強い予測因子であるかもしれません。しかし、糖尿病治療薬の使用を中止すれば心筋梗塞を予防できるというわけではありません!
7.4 高血圧症における使用例
あなたは、高血圧症の第一選択治療として急性心筋梗塞や血管性浮腫に対するACE阻害薬単独療法とサイアザイド利尿薬単剤療法の効果を研究することに関心のある研究者です。OHDSIの文献に基づいて、集団レベルの効果推定値を求める問いをすることになると理解していますが、まず、この特定の治療に関する特性評価を行うため、準備をする必要があります。
7.4.1 特性評価に関する問い
急性心筋梗塞は高血圧症患者に起こりうる心血管系の合併症であり、高血圧症に対する有効な治療によってリスクを軽減できるはずです。血管性浮腫は稀ですが重篤になる可能性のあるACE阻害薬の既知の副作用です。あなたは、対象とする曝露(ACE阻害薬の新規ユーザーおよびサイアザイド利尿薬の新規ユーザー)のコホートを作成することから始めます(第10章を参照)。曝露集団のベースライン特性(人口統計学的特性、併存症、併用薬など)を要約するため、特性評価(第11章を参照)の解析を実行します。この曝露集団における特定のアウトカムの発生率を推定するために、別の特性評価を実行します。ここでは、「ACE阻害薬およびサイアザイド利尿薬に曝露された期間に1)急性心筋梗塞および2)血管性浮腫がどのくらいの頻度で発生するか?」と問うこととします。これらの特性評価により、集団レベルの効果推定研究を実施できるかどうかの実行可能性を評価し、2つの治療グループが比較可能かどうかを評価し、患者がどちらの治療を選択したかを予測する「リスク因子」を特定することができます。
7.4.2 集団レベルの推定問題
集団レベルの効果推定研究(第12章を参照)は、急性心筋梗塞と血管性浮腫のアウトカムに対するACE阻害薬対サイアザイドの使用の相対リスクを推定します。ここでは、研究診断とネガティブコントロールにより、平均治療効果の信頼性の高い推定値を生成できるかどうかをさらに評価します。
7.4.3 患者レベルの予測問題
曝露の因果効果とは独立して、アウトカムのリスクが最も高い患者を特定しようとすることにも興味があります。これは患者レベルの予測問題です(第13章を参照)。ここでは、ACE阻害薬の新規ユーザーの中で、治療開始後1年以内に急性心筋梗塞を発症するリスクが最も高い患者を評価する予測モデルを開発します。このモデルにより、ACE阻害薬を初めて処方された患者について、その病歴から観察されたイベントに基づき、今後1年間に急性心筋梗塞を発症する確率を予測することができます。
7.5 観察研究の限界
OHDSIデータベースでは答えを出せない重要な医療問題は数多くあります。以下はその例です。:
- プラセボと比較した介入の因果効果。治療と非治療の比較は可能であっても、プラセボ治療との比較による因果効果を考慮することはできない場合があります。
- 市販薬に関するもの。
- 多くのアウトカムやその他の変数は、ほとんど記録されていないか、まばらにしか記録されていません。これには、死亡率、行動アウトカム、ライフスタイル、社会経済的地位が含まれます。
- 患者は体調が悪いときにしか医療システムを利用しない傾向があるため、治療の有益性を測定することが困難です。
7.5.1 誤ったデータ
OHDSIデータベースに記録された臨床データは、臨床の現実と乖離している可能性があります。例えば、患者が心筋梗塞を経験していないにもかかわらず、患者記録に心筋梗塞のコードが含まれている可能性があります。同様に、検査値が誤っていたり、プロシージャー(処置)の誤ったコードがデータベースに表示されている可能性もあります。第15章や第16章では、これらの問題について説明しており、ベストプラクティスでは、このような問題を可能な限り特定し、修正することを目指しています。ただし、誤ったデータは必然的にある程度は残存し、その後の分析の妥当性を損なう可能性はあります。広範な文献が、データエラーを考慮した統計的推論の調整に焦点を当てており、例えば、 Fuller (2009) を参照ください。
7.5.2 欠損データ
OHDSIデータベースにおける欠損は微妙な課題を呈します。データベースに記録されるべき健康イベント(例:処方、検査値など)が記録されていない場合、それは「欠損」となります。統計学の文献では、「完全にランダムに欠損」、「ランダムに欠損」、「非ランダムに欠損」など欠損のタイプを区別し、複雑性を増す手法によってこれらのタイプに対処しようとしています。Perkins et al. (2017) はこのトピックに関する有用な入門書を提供しています。
7.6 まとめ
観察研究では、3つの大きな使用例のカテゴリーを区別します。
特性評価は「彼らに何が起こったか?」という問いに答えようとします。
集団レベルの推定は「因果効果は何か?」という問いに答えようとします。
患者レベルの予測は「私には何が起こるのか?」という問いに答えようとします。
予測モデルは因果モデルではありません。強い予測因子に介入してもアウトカムに影響を与えると考える理由はありません。
観察医療データでは答えられない問いもあります。
7.7 演習
演習 7.1 これらの課題はどの使用例のカテゴリーに属しますか?
最近非ステロイド性抗炎症薬(NSAID)を投与された患者における消化管出血の発生率を計算する。
ベースラインの特性に基づいて、特定の患者が今後1年間に消化管出血を経験する確率を計算する。
セレコキシブと比較してジクロフェナクによる消化管出血のリスク増加を推定する。
演習 7.2 ジクロフェナクによるGI出血のリスクがプラセボに比べてどの程度高まるかを推定したいです。医療観察データを使用して、この推定を行うことは可能でしょうか。
推奨される解答は、付録 E.4 を参照ください。