Big data(大數據)就如同很多被過度炒作的趨勢,當很多公司真的把「Big data」應用到公司運作時,就會發現真實情況與媒體(中槍)說的完全不一樣。也許我們很了解如何收集數據,可是將數據分析出有用的資訊,協助你作出正確的決定又是另一回事。Big data 跟 Big knowledge 中間隔了一道河,難以跨越,一大堆看不懂的數據中只有少少的洞見。應用 Big data,絕對不是「收集數據、執行程式分析數據、匯出結果」這三句話說得那麼輕鬆。
Kholsa Ventures 的投資伙伴 Keith Rabois(曾經投資多家 Big data 公司例如 Parstream)直言,要把這些數據轉化成有用的資訊,需要專業的數據分析師來進行複雜的分析,但額外聘請一位分析師並非新創企業可以負擔。
對於那些有財力的公司,有些則希望分析師可以建構程式或演算法來協助處理數據,可是這又是另一個額外的全職工作了,本來已經在分析數據的分析師根本沒時間再做這件事。最終即使真的建構了這套工具,也不一定能對複雜的問題提出直接的答案。想要完全依靠 Big data 來決定公司決策,目前來說並不實際。
大數據分析是先知嗎?
在許多方面,大數據當然也能準確預測結果,例如飛機與水源系統,透過數據分析可以了解零件何時會損壞,作出提早更換。不過一旦牽涉到「人」,就會產生許多不確定的因子。棒球界其實早就在使用 Big data 來計算球員的表現,該演算法名為 Sabermetrics,用來協助分析每一位球員最適合的位置是那一個。他們還製作出一套名為 WAR 的統計方法,計算球員受傷時,球隊換上後備隊員後會損失多少。儘管這些計算方式非常精密,能夠了解每位球員的投球準確率,但它無法計算出球員的抗壓性、對棒球的熱情,以及隊長跟隊員之間的關係等等。
同樣的例子,假如公司的人力資源部門使用 Big data 來計算員工學歷得分,但一些無形的技能例如人際溝通技巧等等難以被計算,這些誤差足以讓一間公司在招聘員工時找錯了人。人為因素,依然是影響統計的最大變數。
將判斷留給人
IBM 推出了一款醫療用途的智慧診斷平台 IBM Watson,可以根據病人的身體情況提供醫生治療上的建議與用藥。這個平台並非要取代醫生,也不會代替醫生診斷疾病為何,而僅僅是作為醫生的助手,協助忙碌的醫生專注在他的專業上,而不用花時間在每天重覆的雜務。最終也最重要的判斷,依然是留給醫生決定。把 Big data 運用在直接給出答案的事情上,複雜的判斷則留給人類,這才是應用 Big data 的最佳辦法。
Data Divination: Big Data Strategies 的作者 Pam Baker 認為未來的資訊將爆炸性成長,也許很快我們的腦袋便無法跟上資訊產生的速度,而不得不依靠機器來替我們做決定。不過在目前的世界,Pam Baker 承認,數據僅能針對部分問題提供直接的答案,大部分時候(特別是當人為因素牽涉其中時),統計結果依然充滿了不確定性。其實早就有句老話「盡信書不如無書」,這些名言的智慧依然適用在現今世界。
留言
張貼留言