羅輯思維107 數據的壞話

        第一百零七集的主題是數據的壞話,前面有單元強調數據化的重要性,本集節目介紹數據化的缺點「數據有可能不準確」,羅胖探討造成數據不準確的原因。

影片網址

罗辑思维 107 数字的坏话

數據的來源

民意調查是一種數據化的工作,西元1936年羅斯福與藍登競選美國總統,文學文摘雜誌發 一千萬問卷進行民意調查,文學文摘從問卷結果預測藍登會當選總統,結果選完羅斯福當選總統。

後人探討原因發現樣本問題,文學文摘從有車的人、俱樂部、 電話簿找人,當時電話普及率不高,文學文摘都接觸到有錢人,當時的有錢人都痛恨羅斯福加稅。

還有一個原因是不滿意的人才會主動發表意見,餐廳留言本寫意見的人大都是對服務或餐點有意見的人,文學文摘回收得到的樣本大都是對羅斯福不滿意的人。

捏造數據

有一種情況是數據造假,麥卡錫要搞政治鬥爭直接就胡扯有多少百分比的人是共產黨員。

假精確

有一種歷史資料宋朝GDP佔全世界多少百分比,清朝GDP佔全世界多少百分比,這些都是假精確的資料,很明顯在中國古代沒有準確的經濟統計數據,根本無法得知古代中國GDP佔世界多少百分比。

假對比

有政客宣稱學生成績逐年提高,真相可能是考試題目越來越簡單。

個體概率牽扯到總體概率

每一個單一事件都是特殊狀況,與總體概率無關。例如嬰兒會猝死有可能是嬰兒本身基因問題。

向前行

儘管數據化有許多缺點,解決的方法是向前行,找出數據不準確的原因然後改進,而不是回到過去不採用數據化資料。

留言

這個網誌中的熱門文章

異世界NTR web版第三章 觀後感 喧賓奪主 ,反派實力過強

泛而不精的我被逐出了勇者隊伍 web第三章 觀後感 菲莉真能打; 露娜超爽der

持有縮小技能的D級冒險者,與聖女結婚並加入勇者團隊 漫畫 01-04 觀後感 大我與小我