找回密碼
 註冊
查看: 1054|回覆: 18

我們必須對 BigData 將顛覆人類思維與生活方式有這些感知!

[複製鏈接]
發表於 2013-7-14 01:52:56 | 顯示全部樓層 |閱讀模式

登入後,內容更豐富

您需要 登錄 才可以下載或查看,沒有賬號?註冊

×


                               
登錄/註冊後可看大圖


當科學家開始建立一個假說時,他們經常會從一個假設或直覺下手。而假設或直覺,又通常是在他們制訂出一個可能證明或推翻他們論點的實驗之前,從其個人經驗汲取而來。

可是,這是驗證事實或解決問題的最好方法嗎?

在新書《 Big Data:一個會改變我們生活、工作與思考方式的革命 》(暫譯)中,作者 Viktor Mayer-Schonberger 和 Kenneth Cukier 寫到了,創新者是如何開始分析大量的資訊,以發現固定的模式來解答重要的問題如:疾病如何在某一大洲蔓延、如何預測在戰火紛飛的地區旅行時的安全路線,或不同地區的貿易起落可以如何避免當地經濟的消亡。

他們同時也指出了 Big Data 的黑暗面:現今,追蹤每一筆 Google 搜尋資料與每一通電話都變得那麼的容易,這些都不斷地誘惑政府成為一個「老大哥」,記錄國民的一舉一動,這些資訊,還造成了美國國家安全局(NSA)承包商前雇員史諾登的爆料。

Big Data,如同其他促進發展的工具,是為了要改變我們生活中的每一個面向,「更巧妙的是,這會影響人們如何思考這個世界,以及他們自己的定位。」在最近一次的意見交流中,我與作者們討論了這些改變將會如何落地生根。

    問:Big Data 的科學家們似乎能夠避免在收集足夠的數據之前就做出假設,只在所有的資訊都收集完成之後,才開始尋找蛛絲馬跡。
    我們其他人要如何跟隨這種「客觀」作法,才不會在試著解決問題的同時,被小道消息所矇騙?

答:我們從大量的訊息匯流中學習與訓練我們個人的觀察力的那天,很快就會到來。

是的,也許會有少部分的人抗拒這個現象,就如同有人只因為個人的觀察,就相信地球是平的,畢竟它看起來就是嘛!但,社會可是會進步的。

    問:所以,在未來的某一天起,單純依靠個人的觀察,將會變得過時且不堪用嗎?屆時我們的理性將可以凌駕在小道消息與直覺之上,不再被它們左右?

答:如果我們只將世界以數據來詮釋,那就是在冒著盲目迷戀數據的風險,賦予其實不存在的道理與意義。我們必須要警惕自己不被數據欺瞞,或被「量化每一個問題」的虛假魅力所誘惑。

在書中,我們講述了 Robert McNamara—越戰時的美國國防部長的一個悲慘故事,以及他使用「屍體數量」(Body Count, 已死亡越共的數量) 來理解當時戰爭進展的行為,但當時的情況卻遠比這個數據更加的複雜太多、太多。

如同忽略數據這個愚蠢的行為,背棄常識並將盲目的信任置於數據之中--而且只因為它是數字所以堅信不移,這也十分愚蠢。

從每個人都在從資料中學習的這點來看,動見觀瞻的膽識與冒險的品味,正凌駕於資料所表現出來的事實。

    問:在眾多 Big Data 現今的用途之中,哪一個是你所發現最驚人的?

答:加拿大的健康研究員正在搞一些了不得的事情。他們收集與處理早產兒的心跳、呼吸與血氧水平等重要信號的即時數據,每秒超過 1000 個數據點。透過分析這些數據,他們正在建立一種能在症狀全面爆發的 24 小時前就揪出感染的方法。這讓他們能更早介入治療,並且效率更佳。

迷人的是,他們的其中一個早期發現是:嬰兒受到感染的前兆並非生命跡象失控,反而是生命跡象變得穩定。這絕不是過去的醫療專業人士所會認同的,但 Big Data 是這樣告訴我們。

在過去,像這樣的資訊一下就被扔到一旁去了,因為收集這些資訊的成本太過高昂,但這情況早已不復存在。

    問:Big Data 有被拿來尋找波士頓炸彈客嗎?如果有的話,又是如何進行的?

答:可以說是,也可以說不是。大眾大概是第一次將這麼大量的資料交給執法部門使用,尤其是數位照片與影片。這些數據量可說是史無前例,這使得警方有非常豐富的資源可以利用。

然而,這些數據最後並沒有派上用場,那兩位炸彈客因為偷車與開槍襲警,將自己白白送給警方。

    問:在你的書中,你提到了 33 歲的 Luis von Ahn,他在 22 歲時就創造了驗證碼 (一個產生歪曲字母,對你進行打字測試,證明你是人類的系統) 的男人,後來還創造了 reCAPTCHA,它能幫助將舊書數位化。多虧了 reCAPTCHA,每天超過四千萬字的實體字母被轉錄成數位字母。
    你認為是什麼促使了 Luis 改善了他的傑作,達成了這巧妙且完美的成就?

答:Luis 是個搞笑、有魅力又低調的傢伙。大約在 2006 年,他做了個粗略的估計並意識到,每天有超過兩億個驗證碼被發送出去。他假設每發送一個驗證碼平均需要十秒,那每天就「流失」了 5000 個小時的生產力。絕大多數的人才不會那樣看事情,但他卻是如此,畢竟電腦工程師們不只醉心於任何可能提升生產力的方法,也很愛從少量的累積中達成這個目的。他們可是以「每秒百萬條指令」的速度在思考呢!(編按:MIPS:一種描述電腦能多快地處理訊息的計量單位)

Luis 被這個計算結果嚇得目瞪口呆。身為一位工程師,他開始思考這些打字所多出來的時間該花到哪些有用的地方。他很快地就想到,可以把電腦在數位化文字時辨認不出來的字母交給 reCAPTCHA 來辨認。

幸運的是,那時 Google 正好需要這項服務,來幫助完成他們的掃描計畫。Kuis 一直在尋找這種「雙邊利益運輸」—能讓他將某地方創造的資源在別的地方再度利用的方法,這麼說吧,達成雙贏的境界。

    問:史諾登的爆料,顯示出了 Big Data 的什麼特性?

答:史諾登的行為反映出了 Big Data 強大的力量對年輕的網路知識分子所造成的不安,尤其是當這力量握在政府的手上的時候。公眾對於政府在收集資料與 Big Data 的使用上頗有爭議—不只美國政府,也包括其他政府。

史諾登的行為所帶動出來的討論是必要的,這樣國民們才能決定政府能做什麼、我們需要什麼樣的人民褓姆,以及我們該避免 Big Data 的哪一些黑暗面。

(資料來源:Medium.com  圖片來源:infocux Technologies, CC Licensed)
 樓主| 發表於 2013-7-14 01:53:28 | 顯示全部樓層
Big Data would be definitely the next trend. what's your review?
回覆 讚好 不讚 使用道具

舉報

發表於 2013-7-14 20:57:55 | 顯示全部樓層
人自己要有獨立思考
回覆 讚好 不讚 使用道具

舉報

發表於 2013-7-14 23:51:13 | 顯示全部樓層
IT Next - No.5 - Big Data Big Expectations (June 2012)
PC Today - Big Data & Security - What Your Company Needs to Know (July 2013)
Ethics of Big Data Balancing Risk and Innovation 2012
Big Data For Dummies
Big Data Analytics - Turning Big Data into Big Money
OReilly Ethics of Big Data 2012
回覆 讚好 不讚 使用道具

舉報

發表於 2013-7-15 10:12:32 | 顯示全部樓層
littlepants9394 發表於 2013-7-14 01:53
Big Data would be definitely the next trend. what's your review?

Big Data 和武器一樣, 是好事還是壞事, 只視乎使用者而定; 不過我們的私隱則危危乎了......
回覆 讚好 不讚 使用道具

舉報

發表於 2013-7-18 11:13:33 | 顯示全部樓層
It has already happened. Like other invention, the big data itself is neutral. "Users" dictate its nature.
回覆 讚好 不讚 使用道具

舉報

發表於 2013-7-18 16:22:09 | 顯示全部樓層
我地呢個年代, 不是缺乏DATA, 而系DATA太多.

當政府收集得太多DATA既時侯, 根本就用不完,
ANALYSE 唔切, 你睇幾鑊恐佈活動, 明明有DATA, 但都變成
事後孔明, 呢的就系DATA太多擺系度變左冇用
回覆 讚好 不讚 使用道具

舉報

發表於 2013-7-30 08:42:29 | 顯示全部樓層
也许我们不该再上网了。
回覆 讚好 不讚 使用道具

舉報

發表於 2013-7-30 11:13:44 | 顯示全部樓層
gfq11 發表於 2013-7-30 08:42
也许我们不该再上网了。

咁樣少左好多人生樂趣
回覆 讚好 不讚 使用道具

舉報

發表於 2013-7-30 15:47:04 | 顯示全部樓層
馬後砲 发表于 2013-7-30 11:13
咁樣少左好多人生樂趣

还有一个办法。
制造很多很多假Data。
那么爱记录,就给你记录够够
回覆 讚好 不讚 使用道具

舉報

發表於 2013-7-31 14:42:40 | 顯示全部樓層
gfq11 發表於 2013-7-30 15:47
还有一个办法。
制造很多很多假Data。
那么爱记录,就给你记录够够

去多的吹水區吹水, 又可以多分升呢, 又可以製造冇用DATA
回覆 讚好 不讚 使用道具

舉報

發表於 2013-7-31 14:43:56 | 顯示全部樓層
本帖最後由 假波男 於 2013-7-31 14:44 編輯
gfq11 發表於 2013-7-30 15:47
还有一个办法。
制造很多很多假Data。
那么爱记录,就给你记录够够


PS  我覺得"冇用DATA"比較合適的
回覆 讚好 不讚 使用道具

舉報

發表於 2013-8-6 10:43:42 | 顯示全部樓層
Does it include duplicate data? Or all new ones? heehee.
回覆 讚好 不讚 使用道具

舉報

發表於 2013-8-15 12:09:17 | 顯示全部樓層
Big data is another chance of IT, learn more on it for future. It should be useful in your career path.
回覆 讚好 不讚 使用道具

舉報

發表於 2013-8-16 07:46:25 | 顯示全部樓層
twinkerz 發表於 2013-8-6 10:43
Does it include duplicate data? Or all new ones? heehee.

重複發同一言論,會被視為洗版行
回覆 讚好 不讚 使用道具

舉報

發表於 2013-8-16 07:50:41 | 顯示全部樓層
Ericcc18 發表於 2013-8-15 12:09
Big data is another chance of IT, learn more on it for future. It should be useful in your career pa ...

絕對贊同,data越來越多,cpu要更快,
software做sorting, compiling data 要更有效率
回覆 讚好 不讚 使用道具

舉報

發表於 2013-8-16 22:39:37 | 顯示全部樓層
回復 假波男 #15 的帖子

我下次一定注意。呵呵。 不过。。老大,我在哪里还发了重复的意见吗?
回覆 讚好 不讚 使用道具

舉報

發表於 2013-8-17 21:13:56 | 顯示全部樓層
twinkerz 發表於 2013-8-16 22:39
回復 假波男 #15 的帖子

我下次一定注意。呵呵。 不过。。老大,我在哪里还发了重复的意见吗?

沒有, 我只是戲言, 不要介意!
回覆 讚好 不讚 使用道具

舉報

發表於 2013-8-18 08:50:24 | 顯示全部樓層
回復 假波男 #18 的帖子

没关系没关系。呵呵
回覆 讚好 不讚 使用道具

舉報

您需要登錄後才可以回帖 登錄 | 註冊

本版積分規則

Archiver|聯絡我們|141華人社區

GMT+8, 2024-4-26 12:46

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回覆 返回頂部 返回列表