現在のビジネスパーソン(PRパーソン)はとても大変です。これまで書評でも取り上げたように、メディアリテラシー、テクノロジーリテラシー、マーケティングリテラシー、さらには今回のようなデータリサーチリテラシーまでもが必要な時代なのだと感じます。たとえ、おのおのがかかわる業務は、そうしたスペシャリストに任せるとしても。
しかし、上記のようなさまざまなリテラシーは、ビジネスパーソンだけに限らず一般の人たちにも必要でしょう。それらを身につけておけば、メディアが発信する膨大な情報(データ)洪水の中で溺れることなく、誤った情報(フェイクニュースなど)からも身を守る術を身につけることができるからです。
メディアなどで、「○○の調査によれば、△△が高いということ(結果)がわかった(判明)した」という場合、前半部分は調査に基づく事実なのですが、後半の結論は必ずしもその因果関係を立証しているとはかぎりません。こうした情報では、相関関係あるいは因果関係がはっきりしたとメディアには明記されていません。
また、その記事についてメディアが検証した事実を掲載しているわけでもありません。各種組織(企業、研究機関、団体など)が発表した情報を、たんにニュースとして“報道”しているにすぎないからです。
ちなみに、私がよく利用しているこうした各種データやレポートをアグリゲーションしているサイト「経済レポート」には、なにがしかのデータやレポートが毎日数百本もアップされています。
著者は、こうしたある調査によるたんなる分析(相関関係の情報)が、あたかも直接的な因果関係があると読んだ人たちに誤解を与えるようなニュースや情報があまりにも多すぎると語ります。
本書の著者は、カリフォルニア大学バークレー校で博士号を取得後、スタンフォード大学経済研究員、ボストン大学ビジネススクール助教授を経て、現在はシカゴ大学で公共経済政策大学院ハリススクール助教授です。データ分析理論と応用について教鞭をとる一方、全米経済研究所(NBER)ならびに経済産業研究所(RIETI)の研究員も兼務しています。
「サントリー学芸賞」、「日経・経済図書文化賞」をダブル受賞
本書は、平積みしてあったので新刊かと思ったのですが、この書が発売されたのは実は2年前(2017年4月)で、奥付は2018年3月15日時点で11版を重ねています。本書のタイトルもさることながら、「サントリー学芸賞」と「日経・経済図書文化賞」という帯のダブル受賞の惹句が、大いに私の関心を引いたことが手にする動機となりました。
前者は、1979年に創設され広く社会ならびに文化を考える独創的で優れた研究、評論活動を、著作を通じて行った個人に対して「政治・経済」、「芸術・文学」、「社会・風俗」、「思想・歴史」の4部門から選定するもので、すでに40年近い歴史を誇る賞でご存じの方も多いでしょう。本書は、その「政治・経済」部門で受賞となりました。
後者は、1958年設立とさらに歴史が古く、日本経済新聞社と日本経済研究センターが、経済および経営・会計分野の学問、知識の向上に貢献とその一般普及・応用に寄与することを目的とし、著書ならびに出版社を表彰するもので60年もの歴史がありますが、それほどとは恥ずかしながら知りませんでした。
数式を使わないデータ分析の入門書
最近、書店でも統計学や調査手法に関する著書は増えていますし、ビジネス誌の特集などでも頻繁に統計学などのビジネススキルアップに関する記事を目にしている人も多いでしょう。ビッグデータの到来で、データサイエンティストのニーズも高まってもいます。
データ分析の能力やそれへの理解は専門職だけではなく、文系・理系にかかわらずあらゆる職種に求められています。
しかしながら、ビッグデータが膨大なデータだけですべてが解決とならず、データの扱い方、分析・解析などには最終的には人間による判断力が重要で、「データをどのような角度で切るのかという思考方法やセンス」ーーとくに「因果関係の見極め方」ーーを身につける必要性があると著者は語ります。
因果関係の重要さ、難しさについてどのような解決方法があるかなどの啓発や理解促進が目的のために本書は著されました。そうしたスキルを身につけることで、他者(社)のデータ分析や説明に惑わされないようになるメリットがあります。
もちろん、最終的には統計学や高度な分析ソフトなどを駆使するスペシャリストの力が必要なのですが、その前にデータ分析するにはどのような手法とどういうことに留意すべきか、そうした初歩(入門)的なことについては数式的な理解ではなく、むしろ「直感的な考え方」が大切だと、実務と教育に携わってきた経験から得た結論だと著者は述べています。
本書のベースとなっているのは、著者がボストン日本人研究者交流会での講演に加え、シカゴ大学での授業内容や研究成果を加筆して書籍化されたものです。
本書の概要
本書は入門書、それも文系の人間でも理解できることを目的に、数式などは使わずにすべてのページで説明や解説がなされ、データ分析の専門家からみれば当たり前のことかもしれませんが、ビジネスパーソン向けに入門書として著されたものです。
第1章では、データから因果関係を導くことの難しさについて説明し、第2章でそれを解決する最良の方法と著者が現時点では考えているRCT(ランダム化比較試験)について説明されます。
それでもRCTで分析ができなかったとき、3つの方法論を第3章(RDデザイン)、第4章(集積分析)、第5章(パネルデータ分析)でそれぞれ解説しています。
第6章では、上記で紹介してきた各種方法論が、ビジネスや政策策定の実務の現場でどのように活用され、ビジネス戦略や政策形成に導入されているのか、実践編として米国のいくつかのケーススタディが紹介されています。
第7章では、上記で紹介した最新の分析手法といえども完璧ではなく、その限界や有用性の範囲など留意点を指摘しています。
第8章では、本書で紹介されている手法がすべてではなく、ほかにも様々な手法があるがそれらは数式を使った数理統計による手法なので本書では紹介されていません。しかし、より専門的な知識を身につけたいという人たちのために専門書の手引きが付されています。
因果関係を導くことの難しさ、基本となるRCT(ランダム比較化試験)
第1章(データから因果関係を導くことの難しさ)、第2章(RCT=ランダム化比較試験)で、本書全体の半分を占めています。第3章からのそれぞれの手法を理解するために、まずはこの2つの章を理解することが前提となる重要な章です。
因果関係を立証する難しい理由について、複数の要因が関与しているので、つねに他の要因も考えられるのではという点を排除できないことだ、と著者は述べています。
どれだけ多くの要素(データ)を考慮しても、ひょっとしてもっと別の要素が関係や影響を与えているかもしれないという無限の可能性は繰り返し出てきてしまうので、データをできるだけ集めることは有用ではあっても、限界があることが経済学や社会科学などでは指摘されていると。
近年では、ビッグデータがすべてを解決してくれるような論調がありますが、こと因果関係分析する際のバイアスという点に関しては必ずしも正確ではないと、著者は述べています。
上記で因果関係を導くことの難しさを受け、第2章ではその因果関係を測定する最良の方法としてRCT(ランダム比較化試験)を紹介しています。本書の鍵となるRCT(ランダム比較化試験)は、主に医療分野で活用されています。聞いただけでなにやら難しそうな印象をうけますが、ビジネス社会では「A/Bテスト」と一般的には呼ばれているものです。これは、ウェブサイトのデザイン(UX/UIを含む)や製品(アプリなど)やサービスなどを販売するとき、そのいずれかの良否や仮説検証などに活用されています。
とくにウェブサイト制作やウェブマーケティングに携わっている人たちであれば、日常的に業務に取り入れている人も多いでしょう。
RCTによるデータ分析の最大のメリットは、ランダムなグループ分けから因果関係を科学的に提示し、分析手法やその結果に透明性があるので、専門家でない人たちにも比較的わかりやすく伝えられること。
一方、最大のデメリットもあります。実施するにあたってはコスト・労力(人)・各機関の協力が必要とされることです。
ビジネスパーソンに求められるデータ分析への理解
相関関係とは、因果関係の必要十分条件あるいは前提条件とはなりえても、それだけでは確実なことはなにも言えません。
書評でも取り上げたマーケティングコンサルタントのラメラス著『もうモノは売らない』で、相関関係があるからといって、かならずしも因果関係があるとは限らないことを強調しています。彼などは、もし高い相関関係は因果関係があると主張するリサーチャーがいたら、すぐに別の人を雇うべきだとまで断言するほどです。
本書の読み方として、相関関係と因果関係の違い、とくに後者の難しさを理解している人、またRCT(A/Bテスト)についてもわかっている人などは、いきなり第3章から読みはじめてもよいでしょう。あるいは、第1章と第2章のあと、第6章のケーススタディへとんで読むと、米国の個別の事例ーーカリフォルニア大学・スタンフォード大学と大手スーパーマーケットの協力、シカゴ大学とウーバーの協力などーーの具体例が語られているので、それぞれの手法について理解が進むでしょう。
それでも著者は、どのようなデータ分析手法にも不完全性(欠点)や限界(弱点)があることもあらかじめ理解しておくべきことに注意を促しています。
今日のビジネスパーソンにとって、マーケティング力はもはや必要不可欠ともいわれながら、実際に学ぶ機会や学んでいる人はそれほど多いとはいえません。データ分析についても、これと同様のことがいえるでしょう。
現在では、データ分析に関する入門書はほかにもたくさんあるでしょうが、本書は特に文系の人には得ることが多いですし、新書版なので手軽に読める著書です。
もちろん、本書を読んだからといって、明日からデータ分析がいきなりできるようになるわけではありません。また、そうした分析はやはりスペシャリストに任せるほうが賢明なのだということも理解できます。しかも因果関係を把握するには、それなりに時間も人もコストもかかります。
そういう観点からは、この書で紹介されている各種の分析手法を駆使できるのは、テクノロジーの進展で時間やコストが改善されたとはいいながら、やはり大企業や研究機関を別にすれば、予算も人も少ない企業ではやさしいことではないような印象も受けました。
それでも、さまざまなデータ分析業務とかかわりのある各部門(とくにマーケティング)などの人には、調査やデータ分析における視点や考え方を知るうえで必要な基本的な知識を提供してくれますし、それらについての基本的な考え方や知識を身につけておいたほうがよいことに、きっとだれも否定はしないでしょう。
なにより、調査データやデータ分析に騙されないよう、基本的なデータ分析マインドを養うためには、とても適切な著書のように感じます。