汗牛足B vol.1 『データ分析の力 因果関係に迫る思考法』伊藤公一朗

読書

汗牛足Bは本の紹介を行う「汗牛足(かんぎゅうそく)」のBusiness版である。純粋なビジネス書に限らず、”社会人として読んでよかった本”くらいの緩い範囲で選書して紹介していきたい。

始まりました!汗牛足Bのコーナーです。気付けば社会人3年目になったものの、ここしばらく読書がおろそかになりがちで危機感を持っています。原則月に一回は投稿するとここに宣言しますので、読者の皆さんにとってもボク自身にとっても成長の糧になるようなコンテンツになればいいなと思っています。よろしくお願いいたします。


汗牛足B vol.1 (2024.4.15発行)
伊藤公一朗 (2017)『データ分析の力 因果関係に迫る思考法』光文社新書


★本書を読んでわかること

  • データ分析によって因果関係を示す代表的な方法とそのメリット・デメリットが整理できる
  • 実際のデータ分析の事例を通じ、どのようにデータから因果関係を示すのかが分かる
  • データ分析の課題や限界についても理解できる

★サマリー

なぜデータから因果関係を導くのは難しいのか

無駄なリソースを費やさないためにも因果関係を正確に見極めることがビジネスや政策決定の場で大切だが、ある要素(X)が結果(Y)に影響を与えた、というX→Yの因果関係を示すことは簡単ではない。なぜなら、XとYの動きに関連性(相関関係)があったとしても、次の2つの可能性が排除できないからだ。

1.Yが変化した原因としてX以外の要因がある可能性
2.X→Yではなく、Y→Xという関係がある可能性

X以外の要因Vを排除するため用いられるのが、考えられるだけのVのデータを集め、その影響を統計分析によって除くという手法だ。しかし、どれだけVの要素を考慮しても、さらに別の要因がないと言い切れるわけではなく、限界がある。

また、近年の情報通信技術の発達により得られるビッグデータは必ずしも問題の解決にはならない。なぜなら、どれだけデータ量が集まったとしても、因果関係を分析する際のバイアスについては解消することができないからだ。

データ分析によって因果関係を示す最良の方法:ランダム化比較実験(RCT)

XがYに及ぼす影響は、Xという介入を行ったときのY=Y1と、介入を行わなかったときのY=Y0の差(Y1-Y0)である介入効果によって定義することができる。

サンプルが1つしかない場合、介入するかしないかの2択しかないので、Y1-Y0を計測することが根本的に不可能である(因果的推論の根本問題)。

一方、ある程度多くのサンプルがある場合、それらをランダムに2つのグループに分け、一方に介入Xを施し、もう一方には施さないことによって、介入効果Y1-Y0を測定することが可能である。なぜなら、ランダムなグループ分けをすることで、2つのグループが統計的には同質の集団になるからである。この手法をランダム化比較実験(RCT)と呼ぶ。

RCTの強みは因果関係を科学的に示せること、分析手法や結果に透明性があり、専門家でない人にも比較的わかりやすい説明ができることである。一方、その実施に当たっては、費用・労力・各機関の協力が必要であることから、必要なデータを取得するのは容易ではないという欠点もある。

RCTが実施できない場合の代替策①:RDデザイン

RCTが実施できない場合に、まるで実験が起こったかのような状況をうまく利用する「自然実験(Natural Experiment)」という手法が用いられる。

自然実験を用いた手法のうち、RDデザイン(Regression Discontinuity Design)では、ある境界線で1つの要因Xのみが非連続的に変化する状況を見つけ、それがYの非連続的な変化の原因であることを示す。

例えば、日本では70歳の誕生日を境に医療費の自己負担額が3割から1割に減少する。そこで、月年齢別の外来患者数を示したデータを見ると、70歳を境に非連続的に外来患者数が増加している。ここで、次の仮定を置けば、自己負担額の減少が医療サービス利用の増加の原因であると推論できる。

  • もしも自己負担額が70歳で変化しないなら、医療サービスの利用も非連続的には変化しない

ただし、この仮定をデータによって立証することはできず、そのもっともらしさについては議論を重ねるしかない。その際の議論の観点としては、次の2つの観点が挙げられる。

  • 自己負担額以外の要因が70歳を境に非連続的に変化していないこと
  • データの対象となっている主体がデータの横軸の変数を操作できないこと(医療サービスの受給者が自己負担額を減らすために年齢を詐称できないようになっていること)

RDデザインは境界付近で自然に作られたRCTであるとも言え、既存のデータで分析できる点が強みである。一方、RCTとは異なりその境界を自由に変更することはできないため、境界が他の点にあった場合の因果関係については追加的な仮定が必要となる点が弱みである。

RCTが実施できない場合の代替策②:集積分析

世の中のインセンティブ(商品の価格や税金、補助金など)は階段状に変化することが多いが、このような階段状の変化を利用して因果関係を推定するのが集積分析(Bunching Analysis)である。

集積分析では、ある横軸に対して階段状に変化するインセンティブなどの要因Xに対して、対象Yが横軸の変数を操作する反応を示すかどうかを分析する。

例えば、重量に応じて燃費規制が階段状に緩やかになる日本の規制では、少し重量を増やすことでより緩い規制が適用される場合、自動車会社が車を重くするインセンティブが働く。実際、階段状のインセンティブの段差の右側にサンプルが集中する非連続なデータが得られる。

集積分析で用いている仮定は、もしも横軸に応じて要因Xが階段状に変化しない場合、対象Yも連続的に変化するということである。この点についてはデータを用いて示すことができないため、その妥当性について議論が必要となる。

RCTが実施できない場合の代替策③:パネル・データ分析

パネル・データとは、複数のグループに対し、複数期間のデータが手に入る場合のデータである。ある時点を境に、特定のグループのみに介入がなされた場合、その前後の変動から介入効果を推定する手法がパネル・データ分析である。

パネル・データ分析で用いられる仮定は、介入が起こらなかった場合の介入グループと比較グループの平均的結果は時系列に対して平行に推移する、というものである(平行トレンドの仮定)。

平行トレンドの仮定が成り立っているかについて注目すべきは次の2点である。

  • 介入が起こる前の期間について、介入グループと比較グループで平行に推移しているかデータを確認する
  • 介入開始以降の時期に介入グループのみに影響を与えた別の要因がなかったかチェックする

介入グループの平均値YTと比較グループの平均YCについて平行トレンドの仮定が成り立っている場合、「介入開始後のYTとYCの差」から、「介入開始前のYTとYCの差」を引くことで介入効果を求めることができる。

パネル・データ分析の強みとして、次の3点が挙げられる。

  • 平行トレンドの仮定が成り立つ限り、様々な状況に適用可能である
  • 介入グループと比較グループに介入前から差異があっても問題でない
  • RDデザインや集積分析のような特定の境界についてのみの介入効果ではなく、介入グループ全体に対する介入効果を測定できる

一方、弱みとしては次の2点が挙げられる。

  • 平行トレンドの仮定は、多くの場合残念ながら成り立たない
  • 介入グループと比較グループの両方について複数期間のデータを得る必要があるが、介入グループのみや、介入開始後のみのデータしか得られない場合が多い

データ分析をビジネスや政策形成に生かすためには?

アメリカを始め、諸外国ではデータ分析の結果をビジネス戦略や政策形成に生かす作業が日常的に行われている。そのために必要な取り組みとして次の2点がある。

  • 問題の把握、問うべき問いの検証、その問いに答えるために必要なデータの検証、RCTや自然実験のデザイン、分析とプレゼンテーションに長けたデータ分析専門家との協力関係を築くこと
  • データへのアクセスを可能な限り開かれた状態にし、政府・企業と専門家との協力関係の土台を築くこと

データ分析の不完全性や限界について

①次の3点のような根本的な問題がデータ自体にある場合は信頼性のある分析結果を得ることは難しい。

  • データ測定に問題があり、数値が正しくない
  • 観測値に大量の欠損値がある
  • 非常に偏ったサンプルしか得られていない

②分析により検証された因果関係がそのサンプル自体について妥当であるかを「内的妥当性(internal validity)」の問題、サンプル以外にも妥当であるかを「外的妥当性(external validity)」の問題という。各種分析手法について内的妥当性と外的妥当性を整理すると次の表のとおりであり、分析結果の応用に際しては外的妥当性の問題について検討が必要である。

分析手法外的妥当性の広さ:
介入効果を分析できる対象
内的妥当性の強さ
RCT(強制参加型)実験対象者非常に強い
RCT(自由参加型)実験対象者のうちの
自発的参加者
非常に強い
RDデザイン境界線付近の主体強い
集積分析集積をした主体強い
パネル・データ分析介入グループ全体若干劣る

③出版バイアスとパートナーシップ・バイアスという問題が存在する。
前者は研究者が学術論文を発表する際、因果関係が見られなかったという結果は評価を受けにくいというバイアスを持っている場合、より因果関係が見られそうな特定のケースで分析をするインセンティブが働き、結果として外的妥当性が脆弱なデータ分析が誘発されるという問題である。
後者はデータ分析をする際の企業・政府機関・専門家のパートナーシップの形成において、より協力してくれそうなパートナーを選ぼうとすると、外的妥当性が限定的なデータ分析が誘発されるという問題である。

④介入の効果が間接的に比較グループにも及ぶような波及効果が存在する場合、介入効果を正しく推定できなくなるという問題がある。

⑤小規模なRCTで得られた因果関係を元に大規模な介入を行う場合、小規模な介入では生じなかった他の要素に影響を及ぼす(一般均衡的な効果が存在する)ことがあり、結果としてRCTの結果と同じ結果を生じないこともある。

★ボクのコメント

本書はデータ分析により因果関係を推定する手法について数式を使わずに書かれた秀逸な入門書だ。強力なツールであるRCTのほか、自然実験の代表的な手法であるRDデザイン、集積分析、パネル・データ分析について明快に解説されており、それらを使って実際にどのような分析ができるかが例示されている。

例示についてサマリーでは割愛したが、これらも大変興味深い。特に面白かったのはオバマ元大統領の選挙活動におけるウェブデザインの事例だ。オバマ候補のウェブサイトを訪れた人にメーリングリストに登録してもらうためにはどのようなウェブサイトのデザインにすればよいか、という問題について選挙チームはRCTを用いて実際に検証したという。結果、選挙チームが予想した支援者に囲まれている写真よりも家族写真の方が効果的であることが判明した。日本ならとりあえず多数決にするか、本人の鶴の一声で決まってしまいそうな事例である。

また、同じくアメリカ関連でいえば2016年にオバマ政権下で民主党と共和党の共同法案として超党派的に成立した「エビデンスに基づく政策のための評議会設置法」も紹介されている。この評議会の使命は2つあり、

  1. RCTなどの厳密な科学的手法により政策が評価され、政策効果の因果関係がデータ分析により解明される仕組みを作ること
  2. 政府が持つ詳細な行政データを研究者に利用させ分析させる体制を整えること

であるという。「単に数字やデータを示すこと=エビデンス」ではないという考え方を非常に大切にしているというから、単にデータを示す段階でつまずいている日本の現状(例えば、国土交通省の統計データの書き換え問題(2022))からすると羨望の念を禁じ得ない。

私が今すぐに本書で紹介されている手法を実践できるようになったわけではないが、本書ではさらに学びたい人向けに参考図書も紹介されているので、これを機にもう少し勉強してみたいと思う。

コメント