Rose and Rizopoulos (2019) 生物統計における因果推論のための機械学習

Sherri Rose, Dimitris Rizopoulos, Machine learning for causal inference in Biostatistics, Biostatistics, Volume 21, Issue 2, April 2020, Pages 336–338.

 DeepLで翻訳してみた。

一般的な推論問題と不確実性の定量化は、長い間統計科学の礎となってきました。機械学習の進歩は多くの分野に浸透していますが、これらの手続きのための推論、特に因果推論は普及していませんでした。しかし、これは急速に変化しています。様々な科学分野が機械学習による因果推論に集中し始めている今こそ、公開討論を行う絶好の機会ではないかと考えています。我々は『Biostatistics』の編集者としての役割として、統計学コンピュータサイエンス、疫学、健康経済学、政策、法律の専門家によるこのトピックに関する一連の解説を企画することにしました。意図的に初期または中期の研究者のリーダーを招聘し、多様性の多面的な側面を考慮して、プラットフォームに与えられた声の幅を広げることにした。因果関係推論に特化した機械学習の分野は小さいため、学会プログラム、arXiv論文、学科のウェブサイトを読み、波状に招待状を送ることで、視点のバランスをとるようにしました。全員が「はい」と答えたわけではありませんでしたが、専門家のネットワークの外や分野を超えて意図的に手を伸ばしていたことを考えれば、予想外のことではありません。私たちは、他の主催者の潜在的な利益のためにこれらの経験を共有し、この時間の投資が必要であることを主張しています。私たちがキュレーションしたコレクションには5つの作品が含まれており、ここで簡単に紹介する。
最初の解説では、機械学習を実装する際に構造的人種差別を理解することの中心性について論じている(Robinsonほか、2020年)。構造的人種差別は健康への応用で蔓延しており、著者は因果グラフの使用を通して専門的に自分のテーゼを提示しています。因果モデル化は、研究者にデータがどのように生成されたかを批判的に考えることを強制し、また、統計的なターゲットパラメータの充実した因果解釈を可能にします。アルゴリズミック・バイアスを評価し、排除することは、研究の成長分野ですが、ほとんどの研究は、健康と生物医学に焦点を当てていません。私たちは、学者がこれらの問題に取り組み、各プロジェクトで検討することを奨励しています。これは、配備を目的としたツールを作成したり、政策提言を行ったりする際に必要とされるべきである。
Subbaswamy and Saria (2020)では、著者は一般化可能性という重要なトピックに取り組んでいる。与えられたアルゴリズムの一般化可能性の欠如は、訓練シナリオとそれが適用されたシステムとの間の条件の変化を含む多くの要因に起因する可能性がある。因果推論(特に予測など)の問題では、一般化可能性を本格的に扱う必要がある。著者らは因果グラフを活用して、基礎となるデータ生成プロセスを理解し、シフトの影響を受けやすいかどうかを評価し、いくつかのアルゴリズム的アプローチをまとめている。特に、機械学習が臨床や公衆衛生の文献で増殖し始めるのを見ていると、それが広く実用に供される準備ができていると主張するすべての作業において、一般化可能性の懸念に対処するための基準を設定することが重要である。
Diaz (2020)の解説は、主に推定を扱ったこのシリーズの最初のものである。推定に先立つ因果モデル化ステップが明確に強調されているが、機械学習と推論の統合が主な主題である。著者は、追加の因果仮定と組み合わせることで、因果推定値を生成できる機械学習ベースの効果推定器を構築するために、セミパラメトリック理論に依存した手順に焦点を当てている。具体的には、標的最小損失ベース推定(TMLE)と二重/偏重機械学習DML)の特性を列挙する。TMLEとDMLは、有効な統計的推論を得ながらも、データ適応的な手順を用いて関連する厄介なパラメータを推定することができる文献からの成功例を示すものである。
精密医療と個別化された治療法の特定の約束は、臨床現場での関心が高まっている。Shalit(2020)は、個別レベルの治療ルールの推定を探求している。これらの効果を推定する能力と、どのようなデータを用いて推定するかについては、多くの議論がなされている。著者はこの議論に飛び込み、統計的および因果関係の課題を提示するとともに、p-ハッキングの懸念を取り巻く誤解を明らかにしている。無作為化比較試験のサンプルサイズは大きな制限であるが、交絡因子やその他の事項を適切に管理すれば、観察データから洞察が得られる可能性がある。無作為化データと観察データの融合はもう一つの可能性を秘めている。

我々は、規制と政策の問題についての解説(Stern and Price, 2020)でこのシリーズを締めくくる。医療における機械学習の導入は、意思決定支援やテストなど様々な形で行われており、現在では機械学習をベースにしたソフトウェアを搭載したデバイスが登場しています。FDAは、いわゆる「医療機器としてのソフトウェア」を規制しているが、その安全性と有効性を理解する上で、明確な合併症が発生する。特にデジタルバイオマーカーの収集が増加しているため、アルゴリズムを規制するという課題は膨大であり、進行中である。著者らはまた、前の4つのコメントのテーマ(一般化可能性、アルゴリズムのバイアス、機械学習に基づく効果推定、個別化された治療)をうまく結びつけて、機械学習空間における規制と政策を検討する際に、それらすべてがどのように現れるかを示しています。
我々は、因果関係推論のための機械学習の重要な側面や視点をすべて網羅したとは決して主張しない。他にもたくさんありますが、この一連の解説が、分野を超えた議論に拍車をかける一助になればと願っています。私たちが強調している重要なテーマは、この分野を追求する際に必要とされる思慮深い考察である。健康と生物医学における因果関係推論のための機械学習は、関係するステークスを考えると、参加するための流行として扱われるべきではありませんし、新しいアルゴリズムのための単なる証明の場として扱われるべきではありません。ニック・ジュエルの言葉を引用すると、「すべてのデータポイントの背後には人間の物語があり、家族がいて、苦しみがある」(Jewell, 2003)ということを覚えておく必要があります。応用される現実世界の問題、理論的裏付け、潜在的な社会的影響、特に疎外されたグループに対する複雑な問題に真摯に取り組むことが重要である。

www.DeepL.com/Translator(無料版)で翻訳しました。