一部關於數據及其技術、政治和倫理影響的恢弘歷史
追溯從理性時代到當今演算法時代的數據及其分析應用的發展
理解數據發展的起源,並思考數據在歷史中的地位
探討數據造成的影響,思考演算法與人工智慧帶來的隱憂
分析大企業與政府如何形塑大規模監控,並反思科技造成的困境
透過歷史視角,全面展現數據科學的發展歷程,深入探討社會影響
從可以為旅客辦理登機或識別無證居民的人臉識別技術,到決定誰能獲得貸款、誰能獲得保釋的自動化決策系統,我們每個人都生活在一個由數據賦能的演算法所主導的世界中。然而,這些技術並非憑空出現,而是一段延續了數世紀的歷史之一部分,從美國憲法中確立的人口普查,到維多利亞時代英國優生學的誕生,再到谷歌搜索的發展。
基於他們在哥倫比亞大學開設的熱門課程,兩位作者克里斯.威金斯(Chris Wiggins)和馬修.瓊斯(Matthew L. Jones)深入闡述了數據資料長期以來如何被用作論證真理的工具和武器,以及重組或捍衛權力的手段。他們探討了數據是如何被創造和整理的,以及為應對這些數據而發展出的新數學和計算技術如何進一步塑造了人類、思想、社會、情報、軍事行動和經濟。
儘管技術和數學是其核心,但數據的故事最終關乎國家、企業和個人之間的不穩定博弈。作者在追溯資料的歷史軌跡並展望未來時,特別關注以下問題:新的技術和科學能力是如何發展的?誰支持、推動或資助了這些新能力或轉變?這些發展又是如何改變了參與者、資源運用和影響的對象?
透過兩位作者追溯數據資料的發展軌跡──它來自何處,可能去向何方──我們就能明白,如何以目標導向和明確目的、有意識地將數據資料的發展,引導向我們共同選擇的方向。
【為何要讀這本書?】
關鍵問題探討:
*新的技術和科學能力是如何發展的?
*誰支持、推進或資助了這些能力或轉變?
*這些變化如何改變了人們能做什麼,基於什麼,對誰做什麼?
【你會讀到】
*數據收集和分析如何從國家工具演變為企業權力的核心
*數據收集、分析和決策使用的關鍵轉變
*資料隱私、企業利益和國家權力之間的持續緊張關係
*統計方法、機器學習和人工智能的發展
【本書內容】
1. 數據科學的歷史演變
從十八世紀末開始,統計學和數據分析逐漸成為理解和管理社會的重要工具
早期主要用於國家治理、人口普查等政府用途
隨著技術發展,數據分析逐漸擴展到商業、科研等領域
2. 關鍵歷史階段
2-1 早期階段(十八─十九世紀)
比利時天文學家凱特爾首次將統計方法應用於社會研究
高爾頓和皮爾森發展了相關性分析等統計工具
數據開始被用於種族主義和優生學論證
2-2二戰時期
布萊切利園密碼破譯工作推動了大規模數據處理
發展了新的計算方法和機器
奠定了現代數據科學的基礎
2-3 現代發展
從單純的統計分析發展為機器學習和人工智能
數據科學在商業和社會中的應用日益廣泛
引發了隱私、倫理等爭議
3. 主要爭議與挑戰
數據隱私和個人權利保護
算法偏見和歧視問題
數據科學的倫理規範
大型科技公司對數據的壟斷
4. 未來展望
需要平衡技術發展和倫理約束
加強數據治理和監管
促進數據科學的負責任發展
5. 核心觀點
數據科學的發展與社會權力結構密切相關
科技技術進步需要考慮倫理和社會影響
數據分析方法的選擇反映了特定的價值觀和目標