Causal Effect Estimation: Recent advances, Challenges, and Opportunities ==> 読後メモ
論文
2023年にPublishされたCausal effect estimationにおけるサーベイ論文を、以下要約。主に、今現在、研究課題となっている部分を中心にPick-up。
用語の整理
- Confounder (交絡因子):
- TreatmentとOutcomeの両方に影響を与える変数
- Counterfactual Outcomes:
- Treatmentに対する効果で、観測されていないほうの効果。
- Aさんに薬を投与した場合、Counterfactual Outcomeは、Aさんに薬を投与していない場合の効果
- Selection Bias:
- Treatmentがランダムに実施されていない場合
- Treatment optionに対して、Covariatesが偏る。
- 例えば、「メールする」というTreatmentを受けた集団には男性が8割含まれ、「メールしない」というTreatmentを受けた集団には女性が8割含まれるなど。
Treatmentに関する研究課題
- Binary treatments
- 例: 薬あり、なし
- Multiple treatments
- 例: 点滴、経口薬、薬なし
- Binaryを拡張する形で、対応可能
- Continous scalar treatments
- 例: 薬の投与量の多寡
- Binaryの拡張での対応は困難。特にSelection Biasの調整では、要工夫。
- Sequential treatments
- Treatmentが木構造。各葉がOutcome。
- オンライン需要で、ライブVideoを選んでカメラONの場合のテスト結果
- オンライン授業で、ライブVideoを選んでカメラOFFの場合のテスト結果
- オンライン授業で、Recorded videoを選んだ場合のテスト結果
- 対面授業の場合のテスト結果
- このような場合、Selection Biasがより発生しやすい。
- DAGなど、グラフベースの学習が有効。
- Treatmentが木構造。各葉がOutcome。
- Structured treatments
- グラフ、画像、テキストなどが入力の場合
Covariateに関する研究課題
- Selection Biasを解決する方法は、Covariate-adjustmentとも呼ばれる。Covariatesに関する最大のチャレンジは、このSelection Biasの解消。
- Covariate-adjustmentの際、最も有効な方法は、Propensity Scoreを計算すること。
- ある個体に、特定のTreatmentが実施される確率。
- Covariatesは、以下の種類の変数に分けられる。
- Confounder: TreatmentとOutcomeの両方に関係する変数
- Instrumental Variables: Treamentには関係するが、Outcomeには関係せず
- Adjustment Variables: Treatmentには関係しないが、Outcomeには関係
- Spurious Variables: TreatmentにもOutcomeにも関係しない
- Causal effectの推定では、Covariatesを使えるだけ沢山使えば精度が高いモデルができるわけではない。
- Adjustment Variablesは、モデルに入れることで、精度改善に寄与。
- Instrumental Variablesは、モデルの精度改善に寄与せず。
- Covariatesを、Confounder, Instrumental, Adjustment,..と切り分ける方法が、提案されている。
- 例: D2VD (Data-Driven Variable Decomposition) ==> AdjustmentとConfounderを自動で切り分け。
- Confoundersが観測されていなかったり、Hiddenとなっている場合が、多々ある。
- その場合、各変数間の関係をみることで、ConfoundersのProxyとなるような要素を見つける。
- 具体的な方法として、VAEを用いた方法、グラフNNを用いた方法が提案されている。
Outcomeに関する研究課題
- Selection biasに対する解決策として、以下のような方法が提案されている。
- Treatmentありグループ (Domain-A) と、Treatmentなしグループ (Domain-B)で、Covariatesの分布が異なっている。
- Domain-AとDomain-Bの分布を近づけたいので、Domain Adaptation関連の方法が模索されている。
- 例えば、両グループのCovariatesを、分布が同じになるようなRepresentation空間に移す。
Impression
- Continuous treatmentsは、現実にもありそうなケースで、どのようにモデル構築をするのか、具体的な方法が気になる。
- Selection biasへの対応について、Propensity Score, IPW,...といったあたりは想像がつくが、この論文では、Domain adaptationを用いた方法が紹介されている。どれぐらい、その方法が現実的か分からないが、もう少し調査したいところ。