數據思維:數據思維背後的基本信念(結語)
為什麽要討論這個問題呢﹖宣老師覺得, 數據思維就像語文素養壹樣,是壹個現代人的基本素養之壹 。發刊詞裏我就說過, 數據思維是數據時代的通行證 。所有人應該都認同語文素養是現代人基本素養之壹,妳可以沒有上過大學,但是妳必須要識字寫字,作為壹個人,我們必須要理解他人,表達自己。
1.認為數據素養應該是現代人的基本素養之壹的 第壹個理由 是: 這個世界是量的,而不是質的 。(這句話聽起來很絕對,但是宣老師想表達的是個人觀點,只要對妳有所啟發就好。)
我們從大哲學家柏拉圖講起。柏拉圖有—個重要的理論,就是把世界分成 本質的世界 和 形成的世界 。比如圓,數學上的圓就是本質的。但是在現實中,妳見不到本質的圓,妳見的者都是形成的圓,比如有月亮、車輪這樣的圓,也有窯洞、梅花、鵝卵石這樣包管圓的元素的東西。
這就要求我們有觀察能力,通過形成的世界去猜測本質的世界。但是怎麽猜呢?只能通過量的方式去猜。這也好理解,怎麽從本質到達本質呢?只能通過量這個途徑來逼近本質。反過來,當妳聲稱找到了壹個事物的本質,要驗證它,也要回到形成的世界,從量來證實這個本質在運作。還有,量與質之間也是互相糾纏的。
因此,本質的世界只能存在於我們的頭腦中,我們能觸摸到的只有形成的世界,而觸摸這個形成的世界的方式就是通過量。所以在這個意義上說,這個世界是量的,不是質的。
2.認為數據素養應該是現代人的基本素養之壹的 第二個理由 是: 只有通過量的競爭才能讓我們暫時達成***識 。
世界是復雜的,對於壹件事物,每個人都有自己的觀點、看法和結論。如果只在這些地方討論,結果只能是自說自話、互相不服。但量是確定的,自然能讓大家心服口服。只有量的競爭才能讓我們暫時達成***識,而觀念的爭論只會讓我們自說自話,相互無法認同。
3.認為數據素養應該是現代人的基本素養之壹的 第三個理由 是: 具體的定量方法是不完美的,但卻是我們唯—可以信賴的方法 。
用量來理解本質,是壹個抽象的說法。實際生活中,妳要理解壹個事物,總要使用壹個具體的定量方法。而具體的定量方法,是很容易犯錯誤的。這裏的坑太多了,只說壹個最主要的,也是很多人最容易忽略的,就是 任何量的結論都是有時空限定的 。
“比如自殺率,大部分社會都是男性自殺率比女性高,但是這個結論不適用1995年到1999年的中國農村地區。有學者推算,那個時候,農村年輕女性的自殺率比農村年輕男性高66%。這個現象吸引了很多社會學者研究,也被很多人指出來討論,所以這個結論被很多人知曉。但是近年的研究發現,我國農村女性的自殺率已經連續20年下降,女性自殺率回到了低於男性自殺率的壹般規律。但是,由於農村女性比男性自殺率高的研究被廣為宣傳,所以到現在仍然有很多人保留了這個印象。不過,雖然具體的方法不完美,但是我們沒有可以選擇的其他道路,我們能做的就是不斷改進具體的方法。
比如,有些人攻擊雙盲實驗,認為這個方法被神化了。妳看,昨天還說這個藥有效,今天馬上就被新實驗打臉了。這樣的事情太多了。但是,妳是覺得研究人員不知道雙盲實驗的局限嗎?其實,現在最高的證據並不是壹次單壹的雙盲實驗,而是薈萃分析,是整合了所有的證據之後的結果。而且,即使是對雙盲實驗本身,學界認為最好的方式也是 多中心 、 大樣本 、 雙盲隨機對照實驗 。多中心,是指不同的國家,不同的種族,不同的文化等,這就是在探測結論的適用範圍到底有多大。大樣本,就是在緩解使用小樣本推及總體時會產生的代表性不充分的問題。此外,大數據、人工智能、深度學習等新技術的廣泛應用,對很多以前難以解決的問題都有了很好的解決方案。我們要做的是與時俱進,不斷提高認知,升級數據思維。
總結:
宣老師認為數據思維是現代人的基本素養之壹,地位與語文素養壹樣。理由有三個:
第壹,這個世界是量的,只有通過量才可能接近質;
第二,只有通過量的競爭,才能達成質的暫時***識;
第三,雖然定量的方法不完美,但我們只能依賴它。