數據分析的力量:Google、Uber都在用的因果關係思考法

數據分析的力量:Google、Uber都在用的因果關係思考法
國際書號(ISBN): 9789864756094
作者: 伊藤公一朗
釘裝: 平裝
出版日期: 20180221
頁數: 256
庫存狀態︰ 沒有庫存,可訂貨
銷售價︰ HK$100.0 HK$90.0(9折)

如需訂貨,送貨時間為7-21天,如有庫存則3-5 天內可送達。

購買數量︰  
   - 或 -   
作者簡介:

伊藤公一朗(Koichiro Ito)
芝加哥大學哈里斯公共政策研究學院副教授。一九八二年出生於宮城縣。京都大學經濟學院畢業,加州大學柏克萊分校博士課程修畢(Ph.D.)。曾任史丹佛大學經濟政策研究院研究員、波士頓大學商學院副教授,二○一五年起從事現職。專攻環境能源經濟學、產業組織理論、應用計量經濟學。目前在芝加哥大學進行環境政策、能源政策的實證研究,同時也向研究生講授資料分析的理論與應用。授課內容與研究論文刊登於個人網站上


目錄:

前言

第1章 從資料導出因果關係為什麼並不容易?
例1:廣告使冰淇淋的業績增加了?
例2:調漲電價能促進節電嗎?
例3:出國留學比較容易找到工作?
難以證明因果關係的原因1:有可能是其他因素造成影響
難以證明因果關係的原因2:有可能為反向因果關係
因果關係不同於相關關係
社會上充斥著啟人疑竇的資料分析結果
為什麼誤判因果關係會出問題?
讓小孩開著燈睡覺就會近視?
只要蒐集資料,就能排除所有的其他因素嗎?
即使增加資料觀察數也無法解決偏誤問題

第2章 在現實世界「實際進行實驗」――隨機對照試驗(RCT)
因果關係可用「介入效果」定義
難以導出因果關係是因為「如果」的資料並不存在
解決辦法就是介入組與比較組之概念
分組方式的壞例子:應要求予以介入(自行選擇)
最好的解決辦法就是「隨機對照試驗(RCT)」
為什麼隨機分組是關鍵?
RCT的具體事例1:北九州市的電價實地實驗
若採隨機分組,兩者的各項因素實際上是相等的
實驗結果:調漲電價真能促進節電嗎?
RCT的優點之一就是分析與結果具透明性
RCT的具體事例2:前美國總統歐巴馬競選活動的行銷策略
RCT的鐵則1:妥善建立群組
RCT的鐵則2:一定要隨機分組
RCT的鐵則3:各組的樣本數必須充足
歐巴馬陣營的實驗結果如何?
RCT的具體事例3:電力不足能靠道德解決嗎?價格政策有效嗎?
短期來看,道德政策與價格政策皆有效果
效果的持續性如何?
實際上該如何進行「隨機分組」?
RCT的優點與弱點

第3章 善加利用「界線」的RD設計
如果無法使用RCT該怎麼辦?介紹「自然實驗」手法
RD設計入門:以日本的醫療支出問題為例
著眼於醫療費用自負額變動之「界線」的分析手法
為什麼患者人數在70歲之「界線」上不連續地增加?
自負額從3成減少為1成後,門診患者人數增加10%左右
RD設計需要的假設
從醫療費用自負額的分析來看,RD設計的假設有可能成立嗎?
運用RD設計時分析者該做的事:檢驗其他因素是否在界線上發生不連續的跳躍
什麼情況會使RD設計的假設不成立?
RD設計是在界線附近製造近似RCT的狀況
RD設計有什麼弱點?
RD設計有什麼優點?
只因隔著1條界線,南北電價就大不相同?利用地理界線的RD設計
在「地理界線上」RD設計的假設成立嗎?
運用RD設計時,檢驗能否主張「針對某對象的因果關係」十分重要

第4章 善加利用「階梯狀變化」的堆集分析
汽車越大臺,油耗規定越寬鬆?
著眼於誘因呈階梯狀變化的日本油耗政策
只要繪製直方圖就能釐清企業行為
堆集分析與RD設計的差異
堆集分析的基本概念
堆集分析的假設
堆集分析的結果:油耗規定導致重量平均增加了110kg
堆集分析的優點和弱點是什麼?
堆集分析的事例:所得稅的稅率會影響工作方式嗎?

第5章 運用「數個期間的資料」的縱橫資料分析
要不要移居到所得稅較低的國家?所得稅與移民行動的因果關係分析
運用丹麥個人納稅資料的研究
縱橫資料分析的概念
縱橫資料分析需要的「平行趨勢假設」
關於平行趨勢假設,資料分析者可提供的2種資訊
何種情況會推翻平行趨勢假設?
縱橫資料分析的優點和弱點
縱橫資料分析的事例:撒錢實施景氣刺激政策只會增加搶購需求嗎?

第6章 實踐篇:如何將資料分析應用在經商或政策制定上?
矽谷平常都會運用RCT進行商業策略分析
美國聯邦政府內部推動的「循證政策制定」
評議會的使命
若要將資料分析應用在商業策略或政策制定上,關鍵是什麼?
成功關鍵1:與資料分析專家建立合作關係
成功關鍵2:開放資料
企業與資料分析者的夥伴關係事例1:加州大學、史丹佛大學與大型超市的合作
企業與資料分析者的夥伴關係事例2:加州大學與電力公司的合作
企業與資料分析者的夥伴關係事例3:芝加哥大學與Uber的合作
政府與資料分析者的夥伴關係事例1:芝加哥大學與芝加哥市的合作
政府與資料分析者的夥伴關係事例2:由經濟產業省資源能源廳主導的社會系統實證實驗

第7章 進階篇:了解資料分析的不完全性與極限
1 假如資料本身有問題,分析手法再出色也難以解決問題
2 分析結果的「外在效度」問題
3 「出版偏誤」與「夥伴關係偏誤」問題
4 介入存在「外溢效果」時的注意要點
5 存在一般均衡效果時的注意要點

第8章 給想進一步學習的人:參考書籍介紹
聚焦於計量經濟學實踐層面的日文入門書
讀完入門書後的中階書(經濟學院大學生程度)與高階書(研究所程度)

後記
引用文獻
數學附錄
 


內容試閱:

第1章 從資料導出因果關係為什麼並不容易?

從資料導出因果關係為什麼那麼困難呢?
本章將使用3個具體例子說明這一點。
第1個例子,是以在企業任職者的觀點來看行銷策略。第2個例子,是以在公家機關任職者的觀點來看政策制定。第3個具體例子,則是從在教育機構任職者的觀點來思考。

例1:廣告使冰淇淋的業績增加了?

假設你在販售冰淇淋的企業任職,隸屬行銷部。目前公司正在研究,在網站上打廣告能否提升今年夏季的業績。上司想知道打廣告能增加多少業績,於是請你分析資料。
看了過去的資料後,你得知以下資訊:
你的公司曾在2010年,針對某項冰淇淋商品推出網路廣告。跟沒打廣告的2009年相比,2010年的業績增加40%。圖表1-1為資料走勢。從這張圖來看,業績似乎因廣告的影響而增加。於是,你向上司報告:
「如這張圖所示,分析之後可知,受到廣告的影響,2010年的業績比2009年多了40%。」
現在請想一想,為什麼你的結論有可能是錯的?原因可能是什麼呢?
這裡的問題是,能否從你的資料分析結果導出:

「推出廣告↓業績因廣告的影響而增加40%」

也就是廣告與業績的因果關係(英文稱為Causal Relationship或Causality)。
那麼,假如2010年的夏季比2009年的夏季還熱呢?
實際上,2009年日本的夏季較為涼爽,2010年的夏季則十分炎熱。如果業績在這種情況下增加了4成,就有可能不是受到廣告的影響,單純是因為氣溫變高,促使消費者想吃冰吧?
除此之外還有其他可能的原因。
舉例來說,自從2008年爆發全球金融危機以後,日本就面臨消費低迷的情況,但從2010年起消費便逐漸回溫。如果業績在這種情況下增加了4成,就有可能不是廣告的成效,單純是因為整體經濟好轉,消費者終於願意打開荷包吧?

如果您對本書本有什麼問題或經驗,請在此留下您的意見和建議!

您的姓名︰


您的評價︰ 注意︰ 評論內容不支持HTML代碼!

會員評分︰ 劣評            好評

請在下框輸入驗證碼︰