第 20 章 OHDSI ネットワーク研究
著者: Kristin Kostka, Greg Klebanov & Sara Dempster
OHDSIのミッションは、観察研究を通じて質の高いエビデンスを生み出すことです。このミッションを達成する主な方法は、共同研究です。これまでの章では、OHDSIコミュニティが質の高い再現可能な研究を促進するための標準やツールを作成していることを説明しました。これには、OMOP標準化ボキャブラリ、共通データモデル(CDM)、分析方法パッケージ、ATLAS、レトロスペクティブなデータベース研究を実施するための研究ステップ(第19章)などが含まれます。OHDSIネットワーク研究は、地理的に分散した多数のデータにわたって透明性、一貫性、再現性を備えた研究を実施する方法の集大成です。本章では、OHDSIネットワーク研究の構成要素、ネットワーク研究の実施方法、ARACHNE研究ネットワークなどの実現技術について説明します。
20.1 OHDSI 研究ネットワークとして
OHDSI研究ネットワークは、医療における観測データ研究の進展を目指す研究者たちの国際的な協力体制です。現在、このネットワークはOMOP共通データモデルに標準化された100以上のデータベースで構成されており、総計10億件以上の患者記録を網羅しています。OHDSIはオープンなネットワークであり、患者レベルのデータを有する世界中の医療機関が、データをOMOP CDMに変換し、ネットワークの研究に参加することで、このネットワークに参加することができます。データ変換が完了すると、協力者は、OHDSIプログラムマネージャーが管理するデータネットワークの一斉調査で医療施設情報を報告するよう求められます。OHDSIネットワークの各サイトは自主的に参加しています。強制的な義務はありません。各機関は、それぞれのネットワーク研究に参加するかどうかを選択できます。各研究では、データはファイアウォールの内側にあるサイト内に保管されます。ネットワークのサイト間で患者レベルのデータをプールすることはありません。共有されるのは集計結果のみです。
データ保持者がOHDSIネットワークに参加するメリット
- 無料ツールへのアクセス: OHDSIは、データの特性評価や標準化された分析(臨床コンセプトのブラウジング、コホートの定義および特性評価、集団レベルの推定や患者レベルの予測研究の実行など)のための無料のオープンソースツールを公開しています。
- 一流の研究コミュニティへの参加: ネットワーク研究の作成と公開、さまざまな分野のリーダーやステークホルダーグループとの共同作業。
- 医療のベンチマークの機会: ネットワーク研究により、データパートナー全体で臨床特性評価や品質改善のベンチマークが可能になります。
20.2 OHDSIネットワーク研究
前章(第19章)では、CDMを使用した研究実施に関する一般的な設計上の考慮事項について説明しました。一般に、研究は単一のCDMまたは複数のCDMで実施されます。単一機関のCDMデータ内、または多数の機関にわたって実施することができます。このセクションでは、複数の機関にわたって分析を拡大し、ネットワーク研究を実施する理由について説明します。
20.2.1 OHDSIネットワーク研究を実施する動機
観察研究の典型的な使用例としては、「リアルワールド」の環境における治療の有効性の比較や安全性を調査することが挙げられます。より具体的には、臨床試験の結果の一般化可能性に関する懸念に対処するため、市販後の環境で臨床試験を再現することが目的となる場合があります。別のシナリオでは、ある治療法が適応外使用されているため、臨床試験では比較されたことのない2つの治療法を比較する研究を実施したい場合もあるでしょう。あるいは、臨床試験では観察するだけの力がなかった、市販後の稀な安全性アウトカムを調査する必要があるかもしれません。これらの研究課題に対処するには、施設で1つ、あるいは2つのデータベースで単一の観察研究を実施するだけでは不十分かもしれません。なぜなら、特定の患者グループのみに意味のある回答が得られるからです。 観察研究の結果は、服薬アドヒアランス、遺伝的多様性、環境要因、全体的な健康状態など、データソースの場所によって異なる多くの要因に影響を受ける可能性があります。したがって、ネットワークで観察研究を実施する典型的な動機は、データソースと潜在的な研究対象者の多様性を高め、その結果がどの程度一般化できるかを理解することです。言い換えれば、研究結果は複数の施設で再現できるか、それとも異なるか、異なる場合、その理由について何らかの洞察が得られるか、ということです。 したがって、ネットワーク研究は、幅広い設定とデータソースを調べることで、観察研究の結果に対する「リアルワールド」の要因の影響を調べる機会を提供します。
20.2.2 OHDSIネットワーク研究の定義
どのような研究がネットワーク研究と見なされるのでしょうか? OHDSI研究は、異なる機関の複数のCDMで実施された場合に、OHDSIネットワーク研究となります。
OHDSIのアプローチによるネットワーク研究では、OMOP CDMと標準化されたツールや研究パッケージを使用します。OHDSIの標準化された分析は、アーティファクトを削減し、ネットワーク研究の効率性と拡張性を向上させることを目的として設計されています。
ネットワーク研究は、OHDSI研究コミュニティの重要な一部です。しかし、OHDSI研究をパッケージ化してOHDSIネットワーク全体で共有することは義務付けられていません。単一の機関内でOMOP CDMおよびOHDSI Methods Libraryを使用して研究を実施したり、研究対象を一部の機関に限定したりすることも可能です。 このような研究貢献もコミュニティにとって同様に重要です。 研究を単一のデータベースで実行するように設計するか、限定されたパートナー間で研究を実施するか、OHDSIネットワーク全体に研究への参加を呼びかけるかは、各研究者の裁量に委ねられます。本章では、OHDSI コミュニティが実施するオープンなネットワーク研究について説明します。
オープンなOHDSI ネットワーク研究の要素:OHDSI ネットワーク研究をオープンに実施する場合、完全に透明性の高い研究を行うことを約束することになります。OHDSI 研究を特徴づける要素はいくつかあります。これには以下が含まれます。
すべての文書、研究コード、その後の結果は、OHDSI GitHub で一般公開されます。
研究者は、実施する分析の範囲と意図を詳細に記した公開研究プロトコルを作成し、公開しなければなりません。
研究者は、CDMに準拠したコードを含む研究パッケージ(通常はRまたはSQL)を作成しなければなりません。
研究者は、OHDSIネットワーク研究の共同研究者を募るために、OHDSIコミュニティコールに参加することが推奨されます。
分析終了後、集計された研究結果はOHDSI GitHubで公開されます。
可能な場合は、研究者は研究 R Shiny アプリケーションを data.ohdsi.org に公開することが推奨されます。
次のセクションでは、独自のネットワーク研究を作成する方法と、ネットワーク研究を実施するための独自の設計や実務的な考慮事項について説明します。
20.2.3 OHDSIネットワーク研究の設計上の考慮事項
OHDSIネットワーク全体で実行する研究を設計するには、研究コードの設計や作成方法のパラダイムシフトが必要です。通常、研究では対象となるデータセットを念頭に置いて設計します。その際、分析に使用するデータについて真実であるとわかっている内容に関するコードを記述することがあります。例えば、血管性浮腫コホートを構築する場合、CDMに表示されている血管性浮腫のコンセプトコードのみを選択することができます。 ただし、データが特定のケア環境(例:プライマリケア、外来診療)や特定の地域(例:米国中心)のものである場合、これは問題となる可能性があります。 コードの選択によって、コホートの定義が偏ってしまう可能性があるからです。
OHDSIネットワーク研究では、もはや自分のデータのみを対象とした研究パッケージを設計・構築するわけではありません。世界中の複数の施設で実施する研究パッケージを構築することになります。自分の施設以外の参加施設の基礎データを見ることは決してありません。OHDSIネットワーク研究では結果ファイルのみを共有します。研究パッケージで収集できるデータは、CDMのドメインで利用可能なもののみです。観察医療データが収集される医療環境の多様性を反映させるためには、コンセプトセットの作成に包括的なアプローチが必要となります。OHDSI研究パッケージでは、全施設で同じコホート定義が使用されることがよくあります。つまり、ネットワーク内の適格なデータ(例えば、保険請求データ中心のデータや電子的健康記録(EHR)固有のデータ)のサブセットのみを表すようなバイアスのかかったコホート定義にならないよう、全体的な視点で考える必要があります。複数の CDM に移植可能な包括的なコホート定義を作成することが推奨されます。OHDSI 研究パッケージでは、すべての機関で同じパラメータ化されたコードセットを使用しています。データベース層への接続とローカルでの結果の保存のためのわずかなカスタマイズのみです。後ほど、多様なデータセットから臨床所見を解釈する際の影響について説明します。
臨床コーディングのばらつきに加えて、各地域の技術インフラのばらつきも想定して設計する必要があります。 研究コードはもはや単一の技術環境で実行されるものではありません。 各OHDSIネットワークサイトは、独自のデータベース層を選択します。 つまり、特定のデータベース方言に研究パッケージをハードコードすることはできないということです。 研究コードは、その方言の演算子に簡単に修正できるSQLの種類にパラメータ化する必要があります。幸い、OHDSIコミュニティには、ATLAS、DatabaseConnector、SqlRenderなどのソリューションがあり、異なるデータベース方言にわたってCDM準拠のスタディパッケージを一般化するのに役立ちます。OHDSIの研究者は、他のネットワーク研究機関に協力を求め、異なる環境でスタディパッケージを実行できるかどうかをテストし、検証することが推奨されています。コーディングエラーが発生した場合は、OHDSIの研究者はOHDSIフォーラムを利用してパッケージの議論やデバッグを行うことができます。
20.2.4 OHDSIネットワーク研究のためのロジスティクスに関する考察
OHDSIはオープンサイエンスのコミュニティであり、OHDSI中央調整センターは、共同研究者がコミュニティ研究を主導し、参加することを可能にするコミュニティインフラストラクチャを提供しています。OHDSIネットワーク研究には、必ず主任研究者を必要とし、OHDSIコミュニティ内の共同研究者であれば誰でもその任に就くことができます。OHDSIネットワーク研究では、主任研究員、共同研究者、参加ネットワークデータパートナー間の調整が必要となります。各機関は、必要に応じて、研究プロトコルが承認され、ローカルCDMで実行することが許可されていることを確認するためのデューデリジェンスを独自に実施しなければなりません。データ分析者は、研究を実行するための適切な権限を付与するために、ローカルITチームの支援を要請する必要があるかもしれません。各機関における研究チームの規模と範囲は、提案されたネットワーク研究の規模と複雑さ、OMOP CDMとOHDSIツールスタックの当該サイトでの導入の成熟度によって決まります。OHDSIネットワーク研究の実施経験の度合いも、必要な人員に影響します。
各研究において、機関での初期活動には以下が含まれます。
必要に応じて、研究をInstitutional Review Board(IRB)(または同等の委員会)に登録する
必要に応じて、研究実施の承認をIRBから受ける
承認済みのCDMにスキーマを読み書きするためのデータベースレベルの権限を取得する
研究パッケージを実行するための機能的なRStudio環境の構成を確認する
研究コードに技術的な異常がないか確認する
技術的な制約内でパッケージを実行するために必要な依存関係のあるRパッケージを許可し、インストールするために、現地のITチームと協力する
データ品質とネットワーク研究: 第6章で説明したように、品質管理はETL(抽出-変換-読込)プロセスの基本かつ反復的な要素です。これはネットワーク研究プロセスとは別に定期的に行う必要があります。ネットワーク研究の場合、研究責任者は参加サイトのデータ品質レポートの確認を依頼したり、カスタムSQLクエリを設計して、データソースに潜在する変動要因を把握することがあります。OHDSIで実施されているデータ品質の取り組みの詳細については、第15章を参照ください。
各機関には、研究パッケージを実行するローカルのデータアナリストが配置されます。この担当者は、研究パッケージのアウトプットをレビューし、機密情報が送信されていないことを確認する必要があります。CDM内のデータはすべて匿名化されていますが、念のため確認します。集団レベルの効果推定や患者レベルの予測などの構築済みのOHDSIメソッドを使用する場合、特定の分析に必要な最小セル数の設定が可能です。データアナリストは、これらの閾値を確認し、それが現地のガバナンス方針に従っていることを確認する必要があります。
データアナリストは、研究結果を共有する際には、結果の送信方法や結果の外部公開に関する承認プロセスの順守など、現地のガバナンス方針のすべてに従う必要があります。OHDSIネットワーク研究では、患者レベルのデータは共有されません。言い換えれば、異なる施設から得られた患者レベルのデータが中央環境に集約されることはありません。研究パッケージは、集約結果(例:要約統計、点推定値、診断プロットなど)として設計された結果ファイルを作成しますが、患者レベルの情報を共有することはありません。多くの組織では、参加する研究チームのメンバー間でデータ共有契約を締結する必要はありません。しかし、関係する機関やデータソースによっては、特定の研究チームメンバー間でより正式なデータ共有契約を締結する必要がある場合もあります。ネットワーク研究への参加に関心のあるデータ所有者の方は、OHDSIコミュニティ研究に参加するために満たすべき要件について、現地の管理チームに相談することをお勧めします。
20.3 OHDSIネットワーク研究の実行
OHDSIネットワーク研究を実行するには、以下の三つの一般的な段階があります:
- 研究デザインと実行可能性
- 研究実行
- 結果の公表と発表
20.3.1 研究デザインと実現可能性
研究の実行可能性の段階(または事前研究段階)では、研究の問いを定義し、研究プロトコルを通じてこの問いに答えるためのプロセスを記述します。この段階では、参加施設全体で研究プロトコルを実行する実行可能性の評価に重点が置かれます。
実行可能性の評価段階の結果として、ネットワークでの実施に備えて公表された最終的なプロトコルと研究パッケージが作成されます。正式なプロトコルには、指定された研究責任者(多くの場合、論文発表の目的で連絡先著者となる)を含む研究チームの詳細と、研究のタイムラインに関する情報が記載されます。プロトコルは、追加のネットワーク機関がCDMデータに関する研究パッケージ全体を検討、承認、実施するための重要な要素です。プロトコルには、研究対象集団、使用される方法、結果の保存および分析方法、さらに研究完了後の結果の公表方法(論文発表、学術会議での発表など)に関する情報を記載する必要があります。
実行可能性の段階は、明確に定義されたプロセスではありません。これは、提案された研究の種類に大きく依存する一連の活動です。少なくとも、研究責任者は、必要な薬剤曝露、プロシージャー(処置)、コンディション、または人口統計学的情報のある対象患者集団を含む関連ネットワーク機関を特定するために時間を費やします。可能であれば、研究責任者は、対象コホートを設計するため、暫定的に自身のCDMを使用すべきです。ただし、ネットワーク研究を実施するために、研究責任者が実際の患者データを含むOMOP CDMにアクセスできる必要はありません。研究責任者は、合成データ(例えば、CMS Synthetic Public Use Files、Mitre 社のSyntheticMass、Synthea)を使用して対象コホート定義を設計し、OHDSIネットワークサイトの共同研究者に対して、このコホートの実行可能性の検証を依頼することができます。実行可能性の活動には、ATLAS からのコホート定義の JSON ファイルを使用してコホートを作成し特性を明らかにするよう共同研究者に依頼することや、 Rの研究パッケージを検証すること、第19章で説明されている初期の研究診断を実行することが含まれます。同時に、必要に応じて、研究代表者は組織機関で OHDSI 研究を承認するための組織固有のプロセスを開始することもあります。すなわち、IRBの承認などです。実行可能性の段階で、これらの組織固有の活動を完了させることは、研究代表者の責任です。
20.3.2 研究の実行
実行可能性の検討を完了した後、研究は実行段階に進みます。この期間は、OHDSIネットワークの機関が分析への参加を選択できる期間です。この段階では、これまで検討してきた設計やロジスィテクスの考慮事項が最も重要になります。
研究責任者がOHDSIコミュニティに働きかけて、OHDSIネットワーク研究の新規の実施を正式に発表し、参加施設の募集を正式に開始した時点で、研究は実行段階に移行します。研究責任者は、OHDSI GitHubに研究プロトコルを公開します。研究責任者は、OHDSIコミュニティの週例電話会議やOHDSIフォーラムで研究を発表し、参加施設と共同研究者を募ります。参加を希望する施設が現れると、研究責任者は各施設と直接連絡を取り、研究プロトコルとコードが公開されているGitHubリポジトリの情報を提供するとともに、研究パッケージの実行方法に関する指示を行います。理想的には、ネットワーク研究はすべての施設で並行して実施されるため、最終結果は同時に共有され、どの施設のチームメンバーも他のチームの知見によってバイアスを受けることがないようにします。
各施設では、研究チームが研究参加の承認を得るための施設内手続きに従い、研究パッケージを実施し、外部に結果を共有するよう確認します。これには、特定のプロトコルに対するIRBによる免除または承認、または同等の承認を得ることが含まれる可能性が高いです。研究実施が承認されると、施設のデータサイエンティストや統計学者は研究リーダーの指示に従ってOHDSI研究パッケージにアクセスし、OHDSIガイドラインに従って標準化された形式で結果を生成します。各参加施設は、データ共有に関する規則について、内部の機関プロセスに従うことになります。IRBまたはその他の機関承認プロセスから承認または免除が得られない限り、施設は結果を共有してはなりません。
研究責任者は、結果の受け取り方法(SFTPまたは安全なAmazon S3バケット経由など)と結果の提出期限を伝える責任を負います。施設は、送信方法が内部プロトコルに準拠していない場合、その旨を指定することができ、それに応じて回避策が開発される場合があります。
実行段階において、妥当な調整が必要な場合は、統合研究チーム(研究責任者および参加施設チームを含む)が結果を繰り返し検討することがあります。プロトコルの範囲や程度が承認された内容を超える形で発展した場合は、参加施設が自施設にその旨を伝え、研究責任者と協力してプロトコルを更新し、地域のIRBによる審査と再承認のためにプロトコルを再提出することが求められます。
最終的には、研究責任者およびサポートするデータサイエンティスト/統計学者が、必要に応じて、施設間で結果を集約し、メタ分析を実施する責任を負うことになります。OHDSIコミュニティは、複数のネットワーク施設から共有された結果ファイルを単一の回答に集約するための検証済みの方法論を有しています。EvidenceSynthesisパッケージは、分散研究における複数のデータ施設など、複数のソースにわたるエビデンスと研究診断を結合するためのルーチンを含む、無料で利用可能なRパッケージです。これには、メタ分析とフォレストプロットを実行する機能も含まれています。
研究責任医師は、参加施設の状況を監視し、参加施設と定期的に連絡を取り合うことで、パッケージの実行の際の障害を排除する必要があります。研究の実施方法は、各施設で一律ではありません。データベース層(アクセス権/スキーマ権限など)や、その環境における分析ツール(必要なパッケージのインストール不可、R によるデータベースへのアクセス不可など)に関連する課題が生じる可能性があります。参加施設が主導権を握り、研究実施の障害となる問題を伝達します。現地の CDM で発生した問題の解決に役立つ適切なリソースを確保するかどうかは、最終的には参加施設の判断に委ねられます。
OHDSI研究は迅速に実施できますが、すべての参加施設が研究を実施し、結果を公表するための適切な承認を得るために、妥当な期間を確保することが推奨されます。OHDSIネットワークの新しい施設では、データベースの権限や分析ライブラリの更新などの環境設定の問題に対処する必要があるため、参加する最初のネットワーク研究が通常よりも長くなる可能性があります。OHDSIコミュニティからサポートを受けることができます。問題が発生した場合は、OHDSIフォーラムに投稿できます。
研究責任者はプロトコルに研究マイルストーンを設定し、事前に終了予定日を伝えて、研究全体のスケジュール管理を支援すべきです。スケジュールが遵守されない場合、研究責任者は参加施設に研究スケジュールの最新情報を伝え、研究実施の全体的な進捗を管理する責任があります。
20.3.3 結果の普及と公開
結果の公表と公開段階では、研究責任者は他の参加者と協力して、原稿の作成やデータ可視化の最適化など、さまざまな管理業務を行います。研究が実施され、結果が研究責任者によりさらに分析できるよう一元的に保存されたら、研究責任者は参加センターによるレビュー用に研究結果全体(例えば、Shiny Application)の作成と公表を行います。研究責任者がOHDSI研究骨格(ATLASによって生成されたもの、またはGitHubのコードを手動で修正したもの)を使用している場合、Shinyアプリケーションは自動的に作成されます。研究責任者がカスタムコードを作成している場合、研究責任者はOHDSIフォーラムを利用して、研究パッケージ用のShinyアプリケーション作成の支援を求めることができます。
原稿が作成されると、参加している各共同研究者は、その成果物が外部での出版プロセスに従っていることを確認するため、その内容を審査することが推奨されます。少なくとも、参加している施設は出版を誰がリードするか指名すべきです。指名された人は、原稿の準備と提出の間に内部プロセスが遵守されていることを確認します。研究をどのジャーナルに投稿するかは研究リーダーの裁量に委ねられるますが、研究開始時の共同協議の結果であるべきです。OHDSI研究の共著者は、ICMJEの著者の資格に関するガイドライン64 を満たすことが期待されています。 結果の発表は、研究者が選択する任意のフォーラム(OHDSIシンポジウム、他の学術会議、学術誌など)で行うことができます。また、研究者は、毎週開催されるOHDSIコミュニティの電話会議や世界各地で開催されるOHDSIシンポジウムでOHDSIネットワーク研究を発表することも推奨されています。
20.4 展望: ネットワーク研究の自動化を利用する
現在のネットワーク研究プロセスはマニュアルで行われており、研究チームのメンバーは、研究設計、コードや結果の共有において、さまざまなメカニズム(Wiki、GitHub、電子メールなど)を使用して共同作業を行っています。このプロセスは一貫性や拡張性に欠けるため、OHDSIコミュニティは研究プロセスのシステム化に積極的に取り組んでいます。

図 20.1: ARACHNEネットワーク研究プロセス
ARACHNEは、ネットワーク研究の実施プロセスを合理化し自動化するプラットフォームです。ARACHNEはOHDSI標準を使用し、複数の組織にわたって一貫性があり、透明性が高く、安全で、コンプライアンスに準拠した観察研究プロセスを確立します。ARACHNEは、データのアクセスや解析結果の交換のための通信プロトコルを標準化すると同時に、制限付きコンテンツの認証と承認を可能にします。 データ提供者、研究員、スポンサー、データサイエンティストといった参加組織を単一の共同研究チームにまとめ、エンドツーエンドの観察研究の調整を促進します。 このツールは、データ管理者によって管理される承認ワークフローを含む、完全な標準ベースのR、Python、SQL実行環境の構築を可能にします。 ARACHNEは、ACHILLESレポートやATLAS設計アーティファクトのインポート機能、自己完結型パッケージの作成、それらの複数医療施設にわたる自動実行機能など、他のOHDSIツールとのシームレスな統合を提供するように構築されています。将来的なビジョンは、最終的には複数のネットワークを相互にリンクし、単一ネットワーク内の組織間だけでなく、複数のネットワークにわたる組織間でも研究を実施できるようにすることです。

図 20.2: ARACHNEのネットワークのネットワークス
20.5 OHDSIネットワーク研究のベストプラクティス
ネットワーク研究を実施する際には、OHDSIコミュニティがOHDSIネットワーク研究のベストプラクティスを遵守できるよう支援いたします。
研究デザインと実現可能性:ネットワーク研究を実施する際には、研究デザインが単一のデータタイプに偏っていないことを確認ください。全施設で一貫した母集団を代表するコホート定義を調和させる作業は、データのタイプがどの程度異質であるか、また、各研究施設がOMOP CDMへのデータ変換に関する標準化された規定をどの程度厳密に遵守しているかによって、その難易度が異なります。この点が非常に重要である理由は、ネットワークの各施設間におけるデータ収集、表現、変換の相違を、臨床的に意味のある相違と区別する必要があるためです。特に、比較効果研究では、施設間で曝露コホートとアウトカムコホートの定義を一致させることが課題となります。例えば、薬剤曝露情報はさまざまなデータソースから得られますが、誤分類の可能性はそれぞれ異なります。医療保険プランの薬局調剤請求は裁定される可能性があり、つまり、薬の請求がある場合、その人が処方箋を調剤された可能性が非常に高いことを意味します。しかし、EHRに入力された処方箋は、その処方箋が調剤されたか使用されたかを判断する他のデータとのリンクがない場合、その情報しか利用できない可能性があります。 医師が処方箋を書いた記録と、薬剤師が処方箋を調剤した時間、患者が薬局で薬を受け取った時間、患者が実際に最初の薬を飲んだ時間との間に時間差がある可能性があります。 この測定誤差は、あらゆる分析ユースケースの結果に潜在的にバイアスを生じさせる可能性があります。したがって、研究プロトコルの策定時には、データベース参加の妥当性を評価するための実行可能性を調査することが重要です。
研究の実行: 可能な場合、研究責任者は、ATLAS、OHDSI Methods Library、OHDSI Study Skeletonsを活用し、標準化された分析パッケージをできるだけ多く使用した研究コードを作成することが推奨されます。研究コードは、常にOHDSIパッケージを使用したCDM準拠のデータベース層に依存しない方法で作成すべきです。すべての関数と変数をパラメータ化すること(例:データベース接続、ローカルハードドライブパスを固定しない、特定のオペレーティングシステムを想定する)。参加施設を募集する際には、研究責任者は各ネットワーク施設がCDMに準拠しており、OMOP標準ボキャブラリを定期的に更新していることを確認すべきです。研究責任者は、各ネットワーク施設がCDMのデータ品質チェックを実施し、文書化していることを確認するためのデューデリジェンスを行うべきです(例えば、ETLがTHEMISのビジネスルールと規約に従っていること、正しいデータが正しいCDMテーブルとフィールドに配置されていることなどを確認する)。各データアナリストは、研究パッケージを実行する前に、ローカルのRパッケージをOHDSIの最新パッケージバージョンに更新することが推奨されます。
結果と普及:研究責任者は、結果を共有する前に、各医療施設がローカルのガバナンスルールに従っていることを確認すべきです。オープンで再現可能な科学とは、設計や実行されたすべてが利用可能になることを意味します。OHDSI ネットワーク研究は、すべての文書とその後の結果を OHDSI GitHub リポジトリまたは data.ohdsi.org R Shiny サーバーに公開し、完全に透明性のあるものとなっています。論文を作成する際には、研究責任者は OMOP CDM の原則と標準化されたボキャブラリを再確認し、OHDSI ネットワークの各医療施設間でデータがどのように異なりうるかをジャーナルが理解できるようにする必要があります。例えば、保険請求データベースとEHRを使用するネットワーク研究を実施している場合、ジャーナルの査読者から、複数のデータタイプにわたってコホート定義の完全性をどのように維持したかを説明するように求められることがあります。査読者は、第 4 章で説明されているOMOPの観察期間が、適格性ファイル(保険請求データベースに存在し、ある人が保険事業者によって保険の対象となっている期間と対象外となっている期間を特定するファイル)と比較してどのようになっているかを理解したいと思うかもしれません。これは、データベース自体のアーティファクト要素に焦点を当てることを本質的に求めているものであり、CDMがレコードをどのように観察に変換するかのETLに焦点を当てています。この場合、ネットワーク研究のリーダーは、OMOP CDMの観察期間がどのように作成されるかを参照し、ソースシステム内のエンカウンターを使用して観察がどのように作成されるかを説明することが役立つかもしれません。原稿の考察では、EHRデータには、対象期間中のすべての支払い済み受診を反映する保険請求データとは異なり、別のEHRを使用する医療従事者に受診した場合は記録されないという限界があることを認める必要があるかもしれません。これは、データがシステムに存在する方法に起因するものです。臨床的に意味のある差異ではありませんが、OMOPが観察期間表を導出する方法に不慣れな人にとっては混乱を招く可能性があります。この慣例を明確にするために、考察のセクションで説明することが望ましいでしょう。同様に、研究責任者は、OMOP標準のボキャブラリが提供するボキャブラリサービスについて説明することが有用であると考えるかもしれません。このサービスにより、臨床コンセプトがどこで捕捉されたとしても同一に保たれるようになります。ソースコードを標準コンセプトにマッピングする際には常に何らかの決定が下されますが、THEMISの規約やCDMの品質チェックは、情報がどこに送られるべきか、またデータベースがどの程度その原則に従っているかに関する情報を提供するのに役立ちます。
20.6 まとめ
- OHDSI研究は、異なる機関の複数のCDMで実施されると、OHDSIネットワーク研究となります。
- OHDSIネットワーク研究は、すべての人に公開されています。ネットワーク研究のリーダーは誰でも構いません。OMOP準拠のデータベースを保有している人は、参加して結果を寄与することができます。
- ネットワーク研究の実施でお困りですか?OHDSI研究育成委員会に相談し、研究の設計と実施にお役立てください。
- 共有は思いやりです。すべての研究文書、コード、結果は、OHDSI GitHub または R Shiny アプリケーションで公開されています。研究責任者は、OHDSI イベントで研究発表を行うよう推奨されています。