Le Livre d'OHDSI
序章
この本の目標
本書の構成
貢献者
ソフトウェアのバージョン
ライセンス
本書の開発方法
I OHDSI コミュニティ
1
OHDSI コミュニティ
1.1
データからエビデンスへの旅
1.2
観察医療アウトカムパートナーシップ
1.2.1
我々の使命
1.2.2
我々のビジョン
1.2.3
我々の目標
1.3
OHDSIの進展
1.4
OHDSIにおける協力
1.5
まとめ
2
どこから始めるか
2.0.1
OHDSIフォーラム
2.0.2
OHDSIイベント
2.0.3
OHDSIコミュニティコール
2.0.4
OHDSI作業グループ
2.1
どこにフィットするか
2.2
まとめ
3
オープンサイエンス
3.1
オープンサイエンス
3.2
オープンサイエンスの実践: スタディアソン
3.3
オープンスタンダード
3.4
オープンソース
3.5
オープンデータ
3.6
オープンディスコース
3.7
OHDSIとFAIRガイディングプリンシプルズ
3.7.1
序論
3.7.2
検索可能性
3.7.3
アクセシビリティ
3.7.4
相互運用性
統一データ表現
4
共通データモデル
4.1
設計原則
4.1.1
モデルの一般的な規約
4.1.2
スキーマの一般的な規約
4.1.3
データテーブルの一般的な規約
4.1.4
ドメインの一般的な規約
4.1.5
コンテンツのコンセプトによる表現
4.1.6
フィールドの一般的な命名規約
4.1.7
コンセプトとソース値の違い
4.1.8
Running Example: 子宮内膜症
4.1.9
PERSONテーブル
4.1.10
OBSERVATION_PERIODテーブル
4.1.11
VISIT_OCCURRENCE
4.1.12
CONDITION_OCCURRENCE
4.2
まとめ
4.3
練習問題
5
標準化語彙
5.1
なぜ語彙が必要で、なぜ標準化が必要か
5.1.1
標準化語彙の構築
5.1.2
標準化語彙へのアクセス
5.1.3
語彙の元: 採用するか構築するか
5.1.4
概念ID
5.1.5
概念名
5.1.6
ドメイン
5.1.7
語彙
5.1.8
概念クラス
5.1.9
標準概念
5.1.10
非標準概念
5.1.11
分類概念
5.1.12
概念コード
5.1.13
ライフサイクル
5.1.14
マッピング関係
5.1.15
階層関係
5.1.16
異なるボキャブラリーのコンセプト間の関係
5.1.17
同一ボキャブラリーのコンセプト間の関係
5.2
内部参照テーブル
5.3
特別な状況
5.3.1
性別
5.3.2
人種と民族
5.3.3
診断コーディングシステムとOMOPの状態
5.3.4
手技コードシステム
5.3.5
デバイス
5.3.6
訪問とサービス
5.3.7
プロバイダーと専門分野
5.3.8
特別な要件を持つ治療領域
5.3.9
薬物ドメインにおける標準概念
5.3.10
NULLのフレーバー
5.4
まとめ
5.5
演習
6
抽出、変換、ロード
6.1
はじめに
6.1.1
White Rabbit
6.1.2
Rabbit-In-a-Hat
6.2
ステップ2: コードマッピングの作成
6.2.1
Usagi
6.3
ステップ 4: 品質管理
6.4
ETLの慣行とTHEMIS
6.5
CDMおよびETLのメンテナンス
6.6
ETLに関する最終的な考え
6.7
まとめ
6.8
演習
データ解析
7
データ解析の使用例
7.1
特徴分析
7.2
集団レベルの推定
7.3
患者レベルの予測
7.4
高血圧における使用例
7.4.1
特徴分析の質問
7.4.2
集団レベルの推定質問
7.4.3
患者レベルの予測質問
7.4.4
誤ったデータ
7.4.5
欠損データ
7.5
まとめ
7.6
演習
8
OHDSI 分析ツール
8.1
分析の実装
8.2
分析戦略
8.2.1
セキュリティ
8.2.2
ドキュメント
8.2.3
インストール方法
8.3
メソッドライブラリ
8.3.1
大規模分析サポート
8.3.2
ビッグデータ対応
8.3.3
ドキュメント
8.3.4
システム要件
8.3.5
インストール方法
8.4
展開戦略
8.4.1
Broadsea
8.4.2
Amazon AWS
8.5
まとめ
9
SQLとR
9.0.1
SQLのパラメータ設定
9.0.2
他のSQL方言への翻訳
9.0.3
接続の作成
9.0.4
クエリの実行
9.0.5
ffdfオブジェクトを使用したクエリの実行
9.0.6
同じSQLを使用して異なるプラットフォームにクエリを実行する
9.0.7
テーブルの挿入
9.1
クエリ時に語彙を使用する
9.2
QueryLibrary
9.3
簡単な研究のデザイン
9.3.1
問題の定義
9.3.2
暴露
9.3.3
結果
9.3.4
リスク期間
9.3.5
暴露コホート
9.3.6
結果コホート
9.3.7
発症率の計算
9.3.8
クリーンアップ
9.3.9
互換性
9.4
まとめ
9.5
練習問題
10
コホートの定義
10.1
コホートとは?
10.2
概念セット
10.3
確率的コホート定義
10.3.1
OHDSI ゴールドスタンダード表現型ライブラリ
10.4
高血圧のコホート定義
10.4.1
初期イベント基準
10.4.2
コンセプトセットの定義
10.4.3
追加の初期イベント基準
10.4.4
包括基準
10.4.5
データベースへの接続
10.4.6
コンセプトの指定
10.4.7
初回使用の発見
10.4.8
365日の前観察が必要
10.4.9
高血圧の前診断が必要
10.4.10
治療の無前使用が必要
10.4.11
単薬療法
10.4.12
コホートの終了
10.4.13
クリーンアップ
10.5
サマリー
10.6
演習
11
特徴分析
11.1
データベースレベルの特徴分析
11.2
コホート特徴分析
11.3
治療経路
11.4
発生率
11.5
ATLASにおけるデータベースの特性評価
11.5.1
デザイン
11.5.2
実行
11.5.3
結果
11.5.4
カスタム特性の定義
11.6
Rでのコホートの特徴抽出
11.6.1
コホートの生成
11.6.2
データ抽出
11.6.3
事前に指定された分析の使用
11.6.4
集計された共変量の作成
11.6.5
出力形式
11.6.6
カスタム共変量
11.6.7
設計
11.6.8
実行
11.6.9
結果の表示
11.6.10
設計
11.6.11
実行
11.6.12
結果の表示
11.7
まとめ
11.8
演習
12
集団レベルの推定
12.0.1
傾向スコア
12.0.2
変数選択
12.0.3
カリパー
12.0.4
オーバーラップ:偏好スコア
12.0.5
バランス
12.1
症例対照デザイン
12.2
症例交叉デザイン
12.3
高血圧研究のデザイン
12.3.1
問題の定義
12.3.2
ターゲットおよび比較対象
12.3.3
アウトカム
12.3.4
リスク期間
12.3.5
モデル
12.3.6
研究要約
12.3.7
コントロール質問
12.3.8
比較コホート設定
12.3.9
効果推定の分析設定
12.3.10
コホートのインスタンス化
12.3.11
データ抽出
12.3.12
研究集団の定義
12.3.13
プロペンシティスコア
12.3.14
アウトカムモデル
12.3.15
複数の分析の実行
12.3.16
共変量のバランス
12.3.17
フォローアップとパワー
12.3.18
カプランマイヤー
12.3.19
効果サイズ推定
12.4
まとめ
12.5
演習
13
患者レベル予測
13.1
予測課題
13.1.1
データ抽出の例
13.1.2
否定 vs 欠損
13.1.3
正則化ロジスティック回帰
13.1.4
勾配ブースティングマシン
13.1.5
ランダムフォレスト
13.1.6
K-近傍法
13.1.7
ナイーブベイズ
13.1.8
AdaBoost
13.1.9
決定木
13.1.10
多層パーセプトロン
13.1.11
ディープラーニング
13.1.12
その他のアルゴリズム
13.1.13
評価の種類
13.1.14
パフォーマンス指標
13.1.15
問題の定義
13.1.16
研究集団の定義
13.1.17
モデル開発設定
13.1.18
モデル評価
13.1.19
研究概要
13.2
ATLASでの研究の実装
13.2.1
予測の問題設定
13.2.2
分析設定
13.2.3
コホートのインスタンス化
13.2.4
データ抽出
13.2.5
追加選択基準
13.2.6
モデル開発
13.2.7
内部バリデーション
13.2.8
外部バリデーション
13.2.9
モデルの比較
13.3
追加の患者レベル予測機能
13.3.1
ジャーナルペーパーの生成
13.4
まとめ
13.5
演習
証拠の質
14
証拠の質
14.1
信頼できる証拠の属性
14.2
証拠の質の理解
14.3
証拠品質の伝達
15
データ品質
15.1
データ品質問題の原因
15.1.1
データ品質チェック
15.1.2
ETL 単体テスト
15.2
研究特有のチェック
15.2.1
マッピングのチェック
15.3
実践におけるACHILLES
15.4
特定の研究チェックの実践
15.5
まとめ
15.6
実習
16
臨床的妥当性
16.1
医療データベースの特性
16.1.1
コホート評価指標
16.1.2
ソースレコード検証の例
16.1.3
PheValuatorによる検証例
16.2
要約
17
ソフトウェアの妥当性
17.1
研究コードの妥当性
17.1.1
再現性のための自動化の必要性
17.1.2
プログラミングのベストプラクティス
17.1.3
コードの検証
17.1.4
Methods Libraryの使用
17.1.5
ソースコード管理
17.1.6
ドキュメンテーション
17.1.7
現行および過去のアーカイブバージョンの利用可能性
17.1.8
メンテナンス、サポート、およびリタイアメント
17.1.9
有資格者
17.1.10
物理的および論理的セキュリティ
17.1.11
災害復旧
17.2
メソッドライブラリのテスト
17.2.1
ユニットテスト
17.2.2
シミュレーション
17.3
まとめ
18
方法の妥当性
18.1
デザイン特有の診断
18.2
推定のための診断
18.2.1
ネガティブコントロール
18.2.2
ポジティブコントロール
18.2.3
実証的評価
18.2.4
P値のキャリブレーション
18.2.5
ネガティブコントロールの選択
18.2.6
コントロールの仲間
18.2.7
実証されたパフォーマンス
18.3
まとめ
II OHDSI研究
19
研究の段階
19.0.1
観察研究の定義
19.0.2
研究デザインの事前仕様
19.0.3
プロトコル
19.0.4
標準化された分析
19.0.5
研究パッケージ
19.0.6
CDMに基づくデータ
19.0.7
質問を定義する
19.0.8
データの可用性と質を確認する
19.0.9
研究対象集団
20
OHDSI ネットワーク研究
20.1
OHDSI 研究ネットワークとして
20.2
OHDSIネットワーク研究
20.2.1
OHDSIネットワーク研究を実施する動機
20.2.2
OHDSIネットワーク研究の定義
20.2.3
OHDSIネットワーク研究の設計上の考慮事項
20.2.4
OHDSIネットワーク研究の物流面の考慮事項
20.2.5
研究デザインと実現可能性
20.2.6
研究実行
20.2.7
結果の普及と公開
20.3
OHDSIネットワーク研究のベストプラクティス
20.4
まとめ
21
用語集
22
コホート定義
22.1
ACE阻害薬
22.2
ACE阻害薬単独療法新規使用者
22.3
急性心筋梗塞(AMI)
22.4
血管性浮腫
22.5
サイアザイド系利尿薬単剤療法の新規使用者
22.6
初回高血圧治療を開始する患者
22.7
3年以上のフォローアップがある初回高血圧治療患者
22.8
ACE阻害薬の使用
22.9
アンジオテンシン受容体拮抗薬(ARB)の使用
22.10
サイアザイド系およびサイアザイド様利尿薬の使用
22.11
ジヒドロピリジン系カルシウム拮抗薬(dCCB)の使用
22.12
非ジヒドロピリジン系カルシウム拮抗薬(ndCCB)の使用
22.13
ベータブロッカー使用
22.14
ループ利尿薬使用
22.15
カリウム保持利尿薬使用
22.16
アルファ1ブロッカー使用
22.17
ネガティブコントロール
22.18
ACEiとTHZ
22.19
プロトコルテンプレート
22.20
NA
23
推奨解答
23.1
共通データモデル
23.2
標準化された用語集
23.3
抽出変換ロード
23.4
データ分析のユースケース
23.5
コホートの定義
23.6
特徴記述
23.7
集団レベル推定
23.8
患者レベル予測
23.9
データ品質
23.10
参考文献
23.11
NA
Publié avec bookdown
OHDSIの書
データ解析