appricot’s diary

日々の勉強のメモ

Causal Effect Estimation: Recent advances, Challenges, and Opportunities ==> 読後メモ

論文

2023年にPublishされたCausal effect estimationにおけるサーベイ論文を、以下要約。主に、今現在、研究課題となっている部分を中心にPick-up。

arxiv.org

 

用語の整理

  • Confounder (交絡因子):
    • TreatmentとOutcomeの両方に影響を与える変数
  • Counterfactual Outcomes:
    • Treatmentに対する効果で、観測されていないほうの効果。
    • Aさんに薬を投与した場合、Counterfactual Outcomeは、Aさんに薬を投与していない場合の効果
  • Selection Bias:
    • Treatmentがランダムに実施されていない場合
    • Treatment optionに対して、Covariatesが偏る。
    • 例えば、「メールする」というTreatmentを受けた集団には男性が8割含まれ、「メールしない」というTreatmentを受けた集団には女性が8割含まれるなど。

 

Treatmentに関する研究課題

  • Binary treatments
    • 例: 薬あり、なし
  • Multiple treatments
    • 例: 点滴、経口薬、薬なし
    • Binaryを拡張する形で、対応可能
  • Continous scalar treatments
    • 例: 薬の投与量の多寡
    • Binaryの拡張での対応は困難。特にSelection Biasの調整では、要工夫。
  • Sequential treatments
    • Treatmentが木構造。各葉がOutcome。
      • オンライン需要で、ライブVideoを選んでカメラONの場合のテスト結果
      • オンライン授業で、ライブVideoを選んでカメラOFFの場合のテスト結果
      • オンライン授業で、Recorded videoを選んだ場合のテスト結果
      • 対面授業の場合のテスト結果
    • このような場合、Selection Biasがより発生しやすい。
    • DAGなど、グラフベースの学習が有効。
  • Structured treatments
    • グラフ、画像、テキストなどが入力の場合

 

Covariateに関する研究課題

  • Selection Biasを解決する方法は、Covariate-adjustmentとも呼ばれる。Covariatesに関する最大のチャレンジは、このSelection Biasの解消。
  • Covariate-adjustmentの際、最も有効な方法は、Propensity Scoreを計算すること。
    • ある個体に、特定のTreatmentが実施される確率。
  • Covariatesは、以下の種類の変数に分けられる。
    • Confounder: TreatmentとOutcomeの両方に関係する変数
    • Instrumental Variables: Treamentには関係するが、Outcomeには関係せず
    • Adjustment Variables: Treatmentには関係しないが、Outcomeには関係
    • Spurious Variables: TreatmentにもOutcomeにも関係しない
  • Causal effectの推定では、Covariatesを使えるだけ沢山使えば精度が高いモデルができるわけではない。
    • Adjustment Variablesは、モデルに入れることで、精度改善に寄与。
    • Instrumental Variablesは、モデルの精度改善に寄与せず。
  • Covariatesを、Confounder, Instrumental, Adjustment,..と切り分ける方法が、提案されている。
    • 例: D2VD (Data-Driven Variable Decomposition) ==> AdjustmentとConfounderを自動で切り分け。
  • Confoundersが観測されていなかったり、Hiddenとなっている場合が、多々ある。
    • その場合、各変数間の関係をみることで、ConfoundersのProxyとなるような要素を見つける。
    • 具体的な方法として、VAEを用いた方法、グラフNNを用いた方法が提案されている。

 

Outcomeに関する研究課題

  • Selection biasに対する解決策として、以下のような方法が提案されている。
    • Treatmentありグループ (Domain-A) と、Treatmentなしグループ (Domain-B)で、Covariatesの分布が異なっている。
    • Domain-AとDomain-Bの分布を近づけたいので、Domain Adaptation関連の方法が模索されている。
    • 例えば、両グループのCovariatesを、分布が同じになるようなRepresentation空間に移す。

 

Impression

  • Continuous treatmentsは、現実にもありそうなケースで、どのようにモデル構築をするのか、具体的な方法が気になる。
  • Selection biasへの対応について、Propensity Score, IPW,...といったあたりは想像がつくが、この論文では、Domain adaptationを用いた方法が紹介されている。どれぐらい、その方法が現実的か分からないが、もう少し調査したいところ。