大數據與醫療、教育

原文連結

美國白宮發布了大數據白皮書《大數據：抓住機遇、保存價值》，在全球引起了廣泛關注。這份調查報告旨在鼓勵使用數據以推動社會進步，特別是在市場與現有的機構並未以其他方式來支持這樣的進步的領域，與此同時，美國也需要相應的框架、結構與研究，來幫助保護他們的核心價值觀念。互聯網產業研究主要從報告中關於醫療、教育與個人隱私保護三個方面進行解讀。報告指出預測醫學的興起將是大數據在健康領域的終極運用；同時探討在線教育如何確保學生的隱私不受侵犯等問題；在保護個人信息方面，美國技術軌跡正在轉向采集、使用和儲存對消費者和個人並沒有直接聯系的數據。

大數據與醫療保健服務

數據一直是醫療保健服務中的一部分。在過去的幾年中，議會出台了相關法案來鼓勵醫療保健服務供應商使用電子病歷，這極大地提高了可供臨床醫生、研究者與病人使用的數據量。隨著《患者保護與平價醫療法案》(“Affordable Care Act”, ACA)的制定，醫療保險的償付機制正開始從相互分隔、具有潛在不協調性的“按服務收費”(“fee-for-service”)模式轉變至基於更佳健康狀況的付費模式。總而言之，這些趨勢正在幫助形成一個“學習型”醫療保健系統，在此系統內，臨床數據將迅速反饋給患者並指導治療有效進行。

大數據可以確定飲食、運動、預防護理和其他生活方式因素對健康的影響，使得人們不必向醫生尋求醫療保健意見。大數據分析能夠幫助確定臨床治療、處方藥劑以及公共衛生干預對於特定或廣泛群體的效果，並對傳統研究方式提供參考。從支付角度來看，大數據能夠保證給患者提供治療的醫生有優秀的臨床記錄，同時，治療的費用根據患者的康復效果而非治療本身的次數確定。

預測醫學的興起是大數據在健康領域的終極運用。這項強大的技術可以同時深入解析一個人的健康狀況與遺傳信息，使醫生更好地預測特定疾病在特定個體上是否可能發生，並預測患者對於特定治療方式的反應。與此同時，預測醫學提出了許多復雜的問題。傳統意義上，健康數據的隱私政策都力求在臨床信息被分享與分析的同時保護相關患者的個人身份信息。而逐漸地，基於特定群體或人群的數據將在臨床症狀出現前或出現後不久被用於確定疾病的類型。

但是，預測醫學挖掘出的信息所帶來的風險將超出單一個體，一旦出現差錯，不僅遺傳信息提供者本人，他的孩子以及未來的後代等擁有與他相似遺傳信息的人都將會受到牽連。因此，將基因組數據與醫療保健數據相連接的生物數據庫便成為了個人隱私在醫學研究與治療領域中的無法回避的前沿話話題。

目前的隱私框架在不久前才包括了正在使用的健康信息，這一框架或許不能很好地解決上述發展帶來的問題並推動相關研究的進行。運用大數據來改善健康狀況需要先進的分析模型來攝取包括生活方式、基因組、醫療與財務數據在內的多種信息。生活方式與健康狀況之間的緊密關系意味著個人數據與醫療保健數據之間的界限已經開始模糊。而這些類型的數據卻收到不同的、有時甚至是相互衝突的聯邦和各州政府的監管，其中包括《健康保險便利和責任法案》(“Health Insurance Portability andAccountability Act”, HIPAA)、《金融服務法現代化法案》 (“Gramm-Leach-Bliley Act”, GLBA)、《公平信貸報告法案》(“FairCredit Reporting Act”, FCRA)與《聯邦貿易委員會法案》(“Federal Trade Commission Act”, FTCA)。當數據的來源多種多樣時，同時遵守多個法律帶來的復雜性隨之增加，與此同時，醫療機構還會與不受上述法律約束的許多組織相互勾結，形成一整套利益鏈條，各種個人健康信息被一系列企業共享，甚至於州政府會違背消費者對個人醫療數據隱私保護的意願而出售其相關數據。在此情況下，針對醫療保健領域的大數據部門的設立也就成為了迫切之需，此舉同時有望進一步降低行業成本並激發發展潛力。

盡管醫學技術不斷變化，但健康數據仍然是我們生活中非常私密的部分。在大數據使得較之以往任何時候都更為強大的發現成為可能的同時，重新審視相關信息被所有醫療保健機構共享後的隱私保密方式也顯得相當重要。醫療保健行業的領導者已經呼吁構建一個更為廣泛的信用框架，使得不同來源、不同隱私保密程度的健康數據得以彙聚。這一框架需要附加《健康保險便利和責任法案》與《反基因歧視法》 (“Genetic Information Non-DiscriminationAct”, GINDA)中的隱私保護條款，並同時設計標准化數據結構以提高其跨平台適應性。在研究了健康信息技術後，總統科技顧問委員會得出以下結論：國家需要建立統一的數據標准與結構使不同類型的數據記錄可以在受到控制的條件下方便訪問。

在醫療數據保密框架逐步跟進技術發展的過程中，需要全美醫療保健與保險的供應商之間細致協商，而這份努力，將為未來的國民經濟與公民健康的福祉奠定基礎。

對學習的研究：大數據與教育

如今，上到大學，下至幼兒園，眾多科技幫助並提升了學生在課內外的學習過程。獲取學習資料、觀看授課視頻、評價教學活動、進行團隊合作、完成家庭作業、參加課程考試，這一切都可以在互聯網上完成。

這些基於科技進步的工具與平台給予了學生與教師更多的可能性。僅需數代的革新，這些工具就能提供實時的評估來使學習資料能夠按照學生的接受速度來進行演示。不僅如此，教育技術還能擴大受教育人數、增進學生間的互動並使教學內容的持續性反饋成為可能。

除了個性化的教育，新的數據類型的運用使得研究者對於學習行為的研究能力有了質的飛躍。從大規模開放在線課堂等基於科技的學習平台上獲取的數據可以被精確跟蹤，借助這些數據，我們能夠進行對遠超傳統教育方式的探索，對學生學習軌跡的移動進行更為准確與廣泛的研究。具體包括：深入了解學生在學習活動中的接收效果，根據不同的學習目標，選擇合適的學習資料，並進一步地運用這些數據幫助那些處於相似狀況的學生。目前，教育部正在研究如何運用這些科技，並已開始整合國家教育技術計劃下在線教學平台所產生的數據，並計劃成立虛擬學習實驗室，為進一步的研究提供方法論上的指導。

教育領域的大數據革命同時也帶來了一些亟待解決的問題：隨著科技日益深入課堂教學，我們如何最好地確保學生的隱私不受侵犯。一方面，各州與本地社區歷來都是教育的主要提供者；另一方面，大量的在線學習工具與課程都是由盈利性企業提供。這就導致了在誰有權獲得線上教育平台產生的數據及這些數據應當如何被使用的問題上備受爭議。對於這類教育記錄，《家庭教育權和隱私法案》(“Family EducationalRights and Privacy Act”, FERPA)、《保護學生權利修正案》(“Protection of Pupil Rights Amendment”, PPRA)和《兒童在線隱私保護法》(“Children’s OnlinePrivacy Protection Act”, COPPA)中的相關條文在使用過程中都會遇到相應的挑戰。

在大數據時代保護兒童的隱私

今天的孩子們是從識字前就接觸數字設備的第一代人。在美國，青少年是移動應用與社交平台上的活躍用戶。當他們使用這些科技時，關於他們的精確數據，其中一些甚至包含敏感信息，就在網絡上被存儲與處理。這類數據既包含能夠大幅度提升孩子的學習效果並為其開啟全新機遇的可能性，但同時，也可能在他們成人時形成一份入侵型的消費者個人信息，或通過其他方式對他們之後的生活產生影響。

雖然年輕人一般與成年人一樣乃至更加清醒地意識到數據會被商業機構與政府部門使用，但他們的數據還是會經常地受到父母、老師、大學招生人員、軍隊征兵人員與社會工作者的審查。他們中的弱勢群體，包括寄養兒童與無家可歸的年輕人，他們通常沒有得到成年人的指導因而特別容易遭受數據濫用與身份盜竊。在強有力的監視之下,年輕人苦苦尋找保護他們隱私的方法，即使他們無法限制別人對於分享內容本身的獲取，許多年輕人仍然嘗試著用多種方式將所分享內容的含義變得模糊、晦澀，使得只有特定的對像才能理解其中的意思。

因為年輕人是那麼的年輕，他們需要適當的自由來探索與嘗試而不至於因一時的疏忽在日後受到揮之不去的侵擾。兒童在線隱私保密法要求網站運營商與移動應用開發者在收集低於13周歲的兒童的個人信息時必須征得其父母或監護人的同意。而現在，我們對於兒童正在遭受什麼“傷害”以及怎樣的政策框架才能確保他們伴隨技術成長是一種促成而不是阻礙都還沒能得出一個確定的結論。

與醫療保健一樣，青少年在與數字教育平台的交互中表現出的部分數據是極其私密的個人信息，這些數據包括對於特定學習方式的偏好和他本人相對於其他學生的表現。它甚至能夠分辨出有學習障礙或注意力無法長時間集中的學生。根據學生在一天內的上線與在線時間，他個人的生活習慣甚至都可以被獲知。教育機構應當如何使用這類數據來改善學生的學習機會？對於使用這些平台的，特別是處於基礎教育階段的學生，他們如何能夠保證自己的數據是安全的？

為了回答關於這些數據的所有權與恰當使用方式的復雜問題，教育部於2014年2月公布了針對在線教育服務指南。指南明確指出，只有滿足《家庭教育權和隱私權法案》與《保護學生權利修正案》中規定的具體要求，學校或學區才可以才能夠與第三方機構簽訂涉及學生數據的協議。隨著越來越多的線上學習工具和服務可以為孩子們所使用，州與地區政府也正密切地關注著這些問題。學校與學區以未來合法的教育效益為目的共享受到保護的學生信息，並且在分享的過程中必須對這些信息保持“直接控制”。即使在這新的指導之下，如何在大數據世界中最好地保護學生隱私仍必須是一個持續的議題。

當局正致力於解決這些問題，並通過教育部加以實施，來使得所有的學生在享受大數據在教育與學習上帶來的創新效益的同時免於受到其潛在威脅所帶來的傷害。正如教育部長阿恩�鄧肯(Arne Duncan)所說：“學生數據必須是安全且珍貴的，無論它存儲在何處，它都不是一種商品。”這意味著必須確保學生的個人信息與在線活動不受到不恰當的使用，尤其當這些信息是在教育環境下被收集的。

大數據與隱私

以物聯網為工具的大數據打破了許多私人空間。家中的無線網絡信號（WiFi）中可以顯示出屋中的人數及其位置，也可通過采集功耗數據來顯示出你在屋中的移動。當你走出房間時，在線面部識別技術也可以將你從圖像中識別出來。始終開啟的有音頻和視頻接口的可穿戴設備以及整個物聯網設備的出現只會產生越來越多的信息采集量。在合法使用的傳感器的海洋中，限制信息采集是一個巨大的挑戰，幾乎是不可能的。

這種無處不在的信息采集是由大數據技術本身性質所決定的。無論是產生模擬信號還是數字信號，數據都被重復使用著，並且以前所未有方式結合，這便激勵著更多的數據采集。數據的潛在價值推動著“土地戰”，機構的重點也轉向盡可能多的采集和利用數據。公司不斷地發掘他們已有的數據，同時尋找他們需要的數據來提高其市場地位。當今世界，數據存儲的成本已經大幅下降，同時仍具有尚無法預測的未來創新潛力，所以采集盡可能多的數據是至關重要的。

大數據的另一個現實就是，數據一旦被采集，就很難保持提供者的匿名性和隱私性。雖然有研究希望在大數據的采集中模糊個人識別信息，或重新標識“無名氏”的信息。融合數據技術集資要比隱私保護技術方便許多。

總之，這些趨勢要求我們關注四十年中，告知與同意框架是如何為隱私保護提供支持的。在結構性過度采集的技術中，重新鑒定要比識別功能更強大，並將重點放在了信息的采集和保存上，個人的隱私就沒有那麼受關注了。總統委員會科學技術的顧問說：“告知與同意框架已經被大數據所帶來的正面效益打敗了，大數據所帶來的是新的、並非顯而易見但十分強大的使用價值。

預測大數據變革的下一篇章

對於現在絕大多數的普通交互來說，告知與同意框架充分保護了隱私。但是總統委員會的科技顧問表示，技術軌跡正在轉向采集、使用和儲存對消費者和個人並沒有直接聯系的數據122。假若該框架被違背，比如由我們的家庭設備采集的數據，我們則需要重新關注數據的使用，這一政策轉向正在被專家、學者廣泛討論 123。數據的使用情況是極為重要的，它對社會有利有弊，如“雙刃劍”一般。

負責任地使用政策框架會帶來許多潛在優勢。將責任從個人轉移到采集、保存和使用數據的實體，由於個人在目前市場中的位置，他們並不能很好地理解和抗爭告知和同意框架。關注於使用責任制，也可以使數據的采集者和使用者對數據的管理及其可能產生的危害負責，而不是狹隘地將其責任定義為是否通過正常途徑采集數據。

更多地關注責任並不意味著忽視收集的環境。對數據負責，一方面就是要尊重原始數據的采集。實際上，如同在消費者隱私權法案所闡述的尊重環境原則，這一規則並不令人驚訝。雖然數據的收集不能立即用在就業上，但技術的發展正在向這個方向轉變。先進的數據標記技術可以已采集和用戶授權使用的信息細節進行編碼，從而使許可使用的信息可以一直跟隨著數據。若是該技術得到良好發展和廣泛使用，即使不能解決大數據中所有的問題，也可以用於應對一些關鍵挑戰。

或許最為重要的是，為了更負責地使用大數據，我們應該將關注的重點放到如何平衡大數據所帶來的效益和對隱私以及其它由於大數據采集信息的不可避免性而受到危害的價值。我們是否應該制定規則，不能在任何環境下使用沒有得到使用授權的數據，即只使用得到使用授權的數據？對於醫學研究中為了治愈癌症而使用的數據，和商業營銷中對消費者的廣告定位而使用的數據，我們應該如何區分和界定它們？

正如奧巴馬總統在人權消費者隱私條例草案的發布會上所說，“盡管我們生活在一個能夠比過去更自由地共享個人信息的世界，但我們必須堅決否認隱私價值已經過時。”隱私“從一開始就一直是我們的民主制度的心髒，而現在，我們比以往的任何時候更需要它。”這在利用大數據的時代更是如此。

結論與建議

大數據變革正處於其最初階段。我們需要數年才能理解其完整的技術內涵、其對健康、教育、經濟的強化作用，及更為關鍵的是，它對美國核心價值觀的影響，包括隱私權、非歧視、自我決定權。

即使是在當下大數據變革的早期，本評估報告的作者仍認為重要的結論已然出現，即大數據可以從多個領域的層面告知當局者該如何邁出下一步。特別是以下五個方面，它們將引發美國關於在大數據世界如何最大化利益和最小化危害的全民討論。

保護個人隱私的價值：在美國以及全球協作的隱私保護體系中，通過在市場上對個人信息的保護來維護個人隱私的價值

穩定/持續負責的教育：要認識到學校（尤其是 K-12）是使用大數據以提升學習機會的重要領域，同時也要對個人數據的使用進行保護，強化數位素養和技術

大數據與歧視：防止大數據使用過程中可能帶來的新的歧視方式

執法和安全保障：在執法過程、公共安全、國家安全中，確保大數據的合理負責使用

數據公共資源化：將數據作為公共資源，用於提升公共服務，投資於能夠推動大數據革命的科學研究

政策建議：

本評估報告還指出了六條值得政府及時關注並制定相應政策的建議，分別為：

1 改進消費者隱私權力法案：

商務部應當采取咨詢手段，來征求利益相關者與公眾對大數據發展及其是如何影響消費者隱私權法案的意見，然後制定立法文本草案供利益相關者審議，並向國會提交

2 通過關於國家數據外泄的立法：

國會應當通過立法，沿襲當局 2011 年 5月的網絡安全立法建議，制定一套國家統一數據外泄標准

3 將隱私保護擴展至非美籍人士：

管理和預算辦公室應與各部門和機構協作，在可行領域將1974 年隱私法應用於非美籍人士，或制定可替代的隱私政策，應用於各種國籍的人士，以對其個人信息進行合適、有意義的保護

4 確保對在校學生的數據采集只被用於教育目的：

聯邦政府必須通過法規確保學生的數據恰當共享或使用，尤其針對幾種在同一個教育環境下的數據

5 發展技術以阻止歧視：

聯邦政府首席公民權利和消費者保護機構應當發展技術專長，識別通過大數據分析而對受保護階層產生歧視性影響的做法和結果，並制定調查和解決方案

6 修正電子通信隱私法：

國會應當修正電子通信隱私法，以確保對在線數字內容的保護標准與現實所提供的相一致，包括去除未讀的或留存一定年限以上的郵件中因超時而產生的差別

保護個人隱私的價值

大數據技術正在推動巨大的創新，同時也產生了新的隱私問題，其影響遠遠超出了當下備受關注的線上廣告問題。這些影響使我們在未來的隱私保護中急需一個更具廣泛性的國家審核模式，包括 2012 年發布的政府的消費者隱私權利法案。相對於傳統的告知與同意模式，即專注於采集數據之前獲得的用戶許可，對其進行重新審核是尤為重要的。雖然在許多情況下，告知與同意仍作為一種基本模式存在，但如今，我們需要做出判斷，在大數據環境下，更側重於數據的使用和重復使用的研究方式是否會成為使隱私權管理更為高效的基礎。或許，建立一種使個體參與到其個人數據采集後的使用和分配問題的機制，將會是更好的授權方法，以使人們能夠從其個人信息中獲利。隱私保護的方式也必須不斷發展，以適應大數據所帶來的社會效益。

推進消費者隱私權利法案

正如 2012 年 2 月奧巴馬總統所明確的那樣，消費者權利法案和與消費者隱私相關的藍圖代表了“一種動態模型，使得在新的信息技術條件下，提供強大隱私保障、推動創新”消費者隱私權利法案為基於公平信息實物准則。一些隱私專家相信，這些原則在一些細微處有足夠的靈活性以解決和支持數據的新興用途，包括大數據。但其他人對此並不太確信，尤其是技術人員，因為不可否認的是，大數據確實挑戰了當下一些支撐隱私框架的關鍵假設，尤其是在采集和使用上。值得考慮的是，在告知和同意模式的背景下，大數據的發展該如何可行地保護隱私，以及存在哪些實際限制。

建議：商務部應當立即征求公眾意見，針對消費者隱私權利法案如何在支持大數據創新的同時，又對其風險作出反應，以及如何負責地使用框架，就像第五章所闡述的那樣，包含在消費者隱私權利法案確立的框架之內。根據評價過程，商務部應當制定立法文本草案供利益相關者審議，並向國會提交。

來源：網易財經

Orca HCM 人才發展 ‧ 移動支持 ‧ 雲端服務｜一宇數位

搜尋此網誌

大數據與醫療、教育

標籤

留言

張貼留言

這個網誌中的熱門文章

培訓如何落地? ——培訓工具篇

讓企業員工在賺錢時，也能時時學習的雲端服務方案

2019十大趨勢值得關注