導航:首頁 > 網路數據 > 大數據在出版社中的應用研究

大數據在出版社中的應用研究

發布時間:2022-09-18 07:56:55

大數據給專業圖書館帶來的啟示

隨著大數據時代的到來,科學數據的產生和積累呈指數級增長,專業圖書館作為社會中儲存信息知識、提供信息服務的信息中心,必須主動利用這些變化來進行戰略性創新,滿足需求,創造未來。

1.建立融數據和文獻於一體的新型數字圖書館

科學向數據密集型科學研究範式轉換的成功,標志著一種新的常規科學的形成,必將引發科學研究觀念和方法的新突破與新發展,並將對專業圖書館產生新的需求。因此,必須建立融數據和文獻於一體的新型數字圖書館,形成數據與信息融合的互操作架構,讓科學研究的整個過程在數字圖書館的電子環境中進行,並對所有人開放,使科學研究的素材、思路、過程和結論得到傳播和共享。培養數據密集型科研環境下的數據管理人才「數據是信息化時代的石油」,數據管理人才是數據密集型科研環境下的稀缺人才。全世界的各類海量數據正在源源不斷地匯集到美國(或美國公司),這個趨勢短期內還看不到轉變的跡象。未來國家的核心競爭力將很大程度上依賴將數據轉化為信息和知識的速度與能力,而這種轉化速度和能力,實際上則取決於大數據方面的技術能力。要保持科學研究的領先地位,國家決策者和科學研究者必須高度關注大數據的趨勢。美國國家科學理事會N SB在其發表的《長期保存的數字數據集合:支持21世紀的研究與教育》報告中,提出如何培育和支持被稱為數據科學家的新興科學家群體的問題:「數據科學家包括信息學家、計算機科學家、資料庫和軟體工程師或程序員、學科專家、數據管理者、數據標引專家、圖書館學家、檔案學家等對科學數據資源的成功管理起著關鍵作用的人們,他們希望自己的創造性和智力貢獻得到充分認可」。目前美國需要14萬到19萬以上具備「深度分析」專長的研究人員,而對具備數據知識的經理人員的需求超過150萬。大數據的應用是技術難度極高的集成應用,如需要集成人工智慧、商業智能、數學演算法、自然語言理解、信息技術等跨學科領域的技術成果。數據科學家是未來10年最具吸引力的職位,數據圖書館員、數據服務館員等數據管理人才將是數據密集型科研環境下的稀缺人才。

2.建立數據驅動的E-Science服務模式

在E-Science環境下,能否從傳統信息服務向知識服務的突破,將是圖書館能否繼續生存並保持活力的關鍵。因此,必須加強對科學數據的重視,認識到開展科學數據服務、提升對科學數據組織和挖掘能力,對科學研究及圖書館競爭力的重要意義。專業圖書館應針對海量數據需要長期存儲的需求,為科研人員提供最佳信息和技術服務,融入用戶工作流的數據生命周期。數據驅動的E-Science服務模式將是現代科學圖書館發展的新的生長點。

㈡ 大數據在產品設計中的應用

通過問卷獲得數據 通常來說,數據採集有兩種方式,第一種是利用網路問卷調研的方式,獲得用戶心理和行為習慣層面的定量數據;第二種是在產品頁面設置模塊、圖片、文字等埋點的方式,收集頁面數據.

2.
調研前工作準備 首先要明確產品定位、產品規劃及架構,對產品有全面的了解;然後,再明確調研目的,研究目的是問卷調研的核心,決定了調研的方向、研究結果如何應用等.接著,需要根據研究目的,確定調研的內容和目標人群,調研內容越細化越好,目標人群越清晰越好.

3.
如何設計問卷? 在問卷設計中,題目的措辭、邏輯關系等,會影響用戶對問題的理解和做答,從而直接決定了研究

在這個快速發展的智能硬體時代,困擾應用開發者的一個重要問題就是如何在功率、覆蓋范圍、傳輸速率和成本之間找到那個微妙的平衡點。企業組織利用相關數據和分析可以幫助它們降低成本、提高效率、開發新產品、做出更明智的業務決策等等。

大數據的價值體現在以下幾個方面:

① 對大量消費者提供產品或服務的企業可以利用大數據進行精準營銷。

② 做小而美模式的中小微企業可以利用大數據做服務轉型。

③ 面臨互聯網壓力之下必須轉型的傳統企業需要與時俱進充分利用大數據的價值。

設計目標決定衡量的數據指標,從設計目標出發,推導相關可量化指標。

還是以IM 「購房意願單」為例,結合該項目,我們來看一下運用gsm模型為此功能搭建數據指標框架。

Goal 設計目標
前面提到說設計目標決定衡量的數據指標,所以第一步要明確我們設計的目標是什麼,或者說是為了解決什麼問題。那麼,購房意願單的提出,有兩個主要目標:提高C端用戶發起會話的意願度;提高 B端經紀人回復意願度。

Sign 現象信號
確定了目標,我們再假設,如果能夠達到這些設計目標,用戶會產生怎樣的態度和行為。假設購房意願單真是切中了用戶的需求,他們會有怎樣的反應呢?

㈢ 大數據的應用領域有哪些

1.了解和定位客戶

這是大數據目前最廣為人知的應用領域。很多企業熱衷於社交媒體數據、瀏覽器日誌、文本挖掘等各類數據集,通過大數據技術創建預測模型,從而更全面地了解客戶以及他們的行為、喜好。

利用大數據,美國零售商Target公司甚至能推測出客戶何時會有Baby;電信公司可以更好地預測客戶流失;沃爾瑪可以更准確的預測產品銷售情況;汽車保險公司能更真實的了解客戶實際駕駛情況。

滑雪場利用大數據來追蹤和鎖定客戶。如果你是一名狂熱的滑雪者,想像一下,你會收到最喜歡的度假勝地的邀請;或者收到定製化服務的簡訊提醒;或者告知你最合適的滑行線路。。。。。。同時提供互動平台(網站、手機APP)記錄每天的數據——多少次滑坡,多少次翻越等等,在社交媒體上分享這些信息,與家人和朋友相互評比和競爭。

除此之外,政府競選活動也引入了大數據分析技術。一些人認為,奧巴馬在2012年總統大選中獲勝,歸功於他們團隊的大數據分析能力更加出眾。

2.

改善醫療保健和公共衛生

大數據分析的能力可以在幾分鍾內解碼整個DNA序列,有助於我們找到新的治療方法,更好地理解和預測疾病模式。試想一下,當來自所有智能手錶等可穿戴設備的數據,都可以應用於數百萬人及其各種疾病時,未來的臨床試驗將不再局限於小樣本,而是包括所有人!

蘋果公司的一款健康APP ResearchKit有效將手機變成醫學研究設備。通過收集用戶的相關數據,可以追蹤你一天走了多少步,或者提示你化療後感覺如何,帕金森病進展如何等問題。研究人員希望這一過程變得更容易、更自動化,吸引更多的參與者,並提高數據的准確度。

大數據技術也開始用於監測早產兒和患病嬰兒的身體狀況。通過記錄和分析每個嬰兒的每一次心跳和呼吸模式,提前24小時預測出身體感染的症狀,從而及早干預,拯救那些脆弱的隨時可能生命危險的嬰兒。

更重要的是,大數據分析有助於我們監測和預測流行性或傳染性疾病的暴發時期,可以將醫療記錄的數據與有些社交媒體的數據結合起來分析。比如,谷歌基於搜索流量預測流感爆發,盡管該預測模型在2014年並未奏效——因為你搜索「流感症狀」並不意味著真正生病了,但是這種大數據分析的影響力越來越為人所知。

3.提供個性化服務

大數據不僅適用於公司和政府,也適用於我們每個人,比如從智能手錶或智能手環等可穿戴設備採集的數據中獲益。Jawbone的智能手環可以分析人們的卡路里消耗、活動量和睡眠質量等。Jawbone公司已經能夠收集長達60年的睡眠數據,從中分析出一些獨到的見解反饋給每個用戶。從中受益的還有網路平台「尋找真愛」,大多數婚戀網站都使用大數據分析工具和演算法為用戶匹配最合適的對象。

4.

了解和優化業務流程

大數據也越來越多地應用於優化業務流程,比如供應鏈或配送路徑優化。通過定位和識別系統來跟蹤貨物或運輸車輛,並根據實時交通路況數據優化運輸路線。

人力資源業務流程也在使用大數據進行優化。Sociometric Solutions公司通過在員工工牌里植入感測器,檢測其工作場所及社交活動——員工在哪些工作場所走動,與誰交談,甚至交流時的語氣如何。美國銀行在使用中發現呼叫中心表現最好的員工——他們制定了小組輪流休息制度,平均業績提高了23%。

如果在手機、鑰匙、眼鏡等隨身物品上粘貼RFID標簽,萬一不小心丟失就能迅速定位它們。假想一下未來可能創造出貼在任何東西上的智能標簽。它們能告訴你的不僅是物體在哪裡,還可以反饋溫度,濕度,運動狀態等等。這將打開一個全新的大數據時代,「大數據」領域尋求共性的信息和模式,那麼孕育其中的「小數據」著重關注單個產品。


5.

改善城市和國家建設

大數據被用於改善我們城市和國家的方方面面。目前很多大城市致力於構建智慧交通。車輛、行人、道路基礎設施、公共服務場所都被整合在智慧交通網路中,以提升資源運用的效率,優化城市管理和服務。

加州長灘市正在使用智能水表實時檢測非法用水,幫助一些房主減少80%的用水量。洛杉磯利用磁性道路感測器和交通攝像頭的數據來控制交通燈信號,從而優化城市的交通流量。據統計目前已經控制了全市4500個交通燈,將交通擁堵狀況減少了約16%。


6.提升科學研究

大數據帶來的無限可能性正在改變科學研究。歐洲核子研究中心(CERN)在全球遍布了150個數據中心,有65,000個處理器,能同時分析30pb的數據量,這樣的計算能力影響著很多領域的科學研究。比如政府需要的人口普查數據、自然災害數據等,變的更容易獲取和分析,從而為我們的健康和社會發展創造更多的價值。

7.提升機械設備性能

大數據使機械設備更加智能化、自動化。例如,豐田普銳斯配備了攝像頭、全球定位系統以及強大的計算機和感測器,在無人干預的條件下實現自動駕駛。Xcel Energy在科羅拉多州啟動了「智能電網」的首批測試,在用戶家中安裝智能電表,然後登錄網站就可實時查看用電情況。「智能電網」還能夠預測使用情況,以便電力公司為未來的基礎設施需求進行規劃,並防止出現電力耗盡的情況。在愛爾蘭,雜貨連鎖店Tescos的倉庫員工佩戴專用臂帶,追蹤貨架上的商品分配,甚至預測一項任務的完成時間。

8.強化安全和執法能力

大數據在改善安全和執法方面得到了廣泛應用。美國國家安全局(NSA)利用大數據技術,檢測和防止網路攻擊(挫敗恐怖分子的陰謀)。警察運用大數據來抓捕罪犯,預測犯罪活動。信用卡公司使用大數據來檢測欺詐交易等等。

2014年2月,芝加哥警察局對大數據生成的「名單」——有可能犯罪的人員,進行通告和探訪,目的是提前預防犯罪。

9.

提高體育運動技能

如今大多數頂尖的體育賽事都採用了大數據分析技術。用於網球比賽的IBM SlamTracker工具,通過視頻分析跟蹤足球落點或者棒球比賽中每個球員的表現。許多優秀的運動隊也在訓練之外跟蹤運動員的營養和睡眠情況。NFL開發了專門的應用平台,幫助所有球隊根據球場上的草地狀況、天氣狀況、以及學習期間球員的個人表現做出最佳決策,以減少球員不必要的受傷。

還有一件非常酷的事情是智能瑜伽墊:嵌入在瑜伽墊中的感測器能對你的姿勢進行反饋,為你的練習打分,甚至指導你在家如何練習。

10.金融交易

大數據在金融交易領域應用也比較廣泛。大多數股票交易都是通過一定的演算法模型進行決策的,如今這些演算法的輸入會考慮來自社交媒體、新聞網路的數據,以便更全面的做出買賣決策。同時根據客戶的需求和願望,這些演算法模型也會隨著市場的變化而變化。

更多精彩:14_spark體系之分布式計算課程Spark 集群搭建+S

㈣ 《智慧社會大數據與社會物理學》pdf下載在線閱讀全文,求百度網盤雲資源

《智慧社會大數據與社會物理學》阿萊克斯·彭特蘭 電子書網盤下載免費在線閱讀

鏈接:https://pan..com/s/1As7ERatNrtl_G4rUirs08Q 提取碼:XJYE

豆瓣評分:7.6

書名:《智慧社會大數據與社會物理學》

作者:阿萊克斯·彭特蘭 (Alex Pentland)
出版社:浙江人民出版社
副標題:大數據與社會物理學
原作名:Social Physics How Good Ideas Spread - The Lessons from a New Science
譯者:汪小帆/汪容
出版年:2015-4
頁數:240
定價:CNY 56.90
裝幀:平裝

內容簡介······


●如果要在大數據領域推舉出一個代表性的科學家,阿萊克斯·彭特蘭是一個無法令人忽略的名字。經過數年極具開創性的研究,社會物理學這個全新科學領域的根基已足夠深厚。社會物理學是關於想法流的科學,正是在想法流的幫助下,我們才得以提高集體智能,促進智慧社會的形成。

● 通過研究數以百萬計的人在智能手機、GPS設備、互聯網等地方留下的「數字麵包屑」,大數據的應用已成為一股無法被忽視的力量。在大數據的應用中,重要的是目睹人們實際做了什麼,而不是聽他們說自己做了什麼。如果運用恰當的社會網路激勵,我們將能夠切實提高生產率,實現更高效的溝通。

●彭特蘭的研究發現,我們可以在不知道任何信息的具體內容的情況下,只通過研究社會網路中的信息交換模式獲得驚人的生產力提升和預測准確率提高。不管是家庭、公司這樣的小團體,還是城市、國家這樣的大團體,都可以通過對社會網路的調整,大大提高思想流,讓我們用一種全新的方式看待生活本身。

作者簡介······

●全球大數據權威、可穿戴設備之父、MIT人類動力學實驗室主任。

●在近30年執教生涯中,彭特蘭培養出了50餘位博士,其中一半成長為該研究領域的領軍人物,1/4成為創業公司的創始人,1/4成為業界相關領域的中堅力量。彭特蘭的實驗室孵化出了30家以上的高科技企業。

●在全球計算科學領域,彭特蘭是被引述次數最多的科學家之一。2011年,《福布斯》評選他為全球大數據權威,《新聞周刊》稱他是「改變20世紀的100位美國人」之一。2012年,他關於大數據應用的文章獲得《哈佛商業評論》的麥肯錫獎。2008年和2013年,他的研究成果更是兩度摘得《麻省理工科技評論》「年度十大突破性科學技術」桂冠。

㈤ 大數據技術在電子政務領域的應用

大數據技術在電子政務領域的應用
隨著科學技術在社會各領域的不斷滲透, 為人們的生活帶來了巨大改變, 其中, 以大數據技術為代表的現代電子信息技術的廣泛使用, 將人們帶入了「大數據時代」。本文以大數據技術在電子政務領域的應用為研究內容, 在分析大數據技術特徵的基礎上, 這一技術在電子政務領域的實際應用加以介紹, 從而使人們更加深入的了解大數據技術。
近年來, 我國在計算機網路技術研究領域取得了顯著成績, 大數據技術、雲計算技術、物聯網技術等在社會各領域得到了較為廣泛的應用。在此過程中, 為提高政府部門辦事效率, 以大數據技術為核心的電子政務系統應運而生, 並且, 融入了大數據技術的電子政務系統在數據的獲取、處理、分析等方面的效率顯著提高, 為政府相關工作的高效開展奠定了基礎。
1、大數據技術的特徵概述
相比較傳統數據處理技術來說, 大數據技術的主要特徵包括以下四個方面:
(1) 大數據技術涉及到的數據量極為龐大, 在計算機網路快速發展的今天, 網路上的數字信息呈現出幾何指數增長的趨勢, 經過一定時期的積累, 這一數據量將達到驚人的數量, 為此, 只有大數據技術才能夠對此類規模的數據進行有效的處理。
(2) 大數據技術所涉及數據類型眾多, 除常見的文本、聲音、圖像、音頻等數據外, 還包括一些特殊的文件形式, 並且, 不同類型的文件形式其作用自然也就存在著明顯的差異。
(3) 大數據技術有著較快的數據處理數度, 憑借分布式計算機技術的使用, 能夠在最短的時間內完成一定規模數據的處理任務, 並且, 最終得到的結果是有效的。
(4) 大數據技術所處理的數據雖然數據密度較低, 但是, 當密度較低的數據被收攏在一起後, 通過科學的數據處理分析方法, 從零星的數據中尋找有用的信息, 並對該信息的價值進行深入挖掘。
2 、大數據技術的關鍵
所謂大數據, 是指在短時間通過網路嗅探的方式, 快速搜集各種類型的網路數據, 並在相關數據中獲取有價值的信息。大數據技術的實現需要通過大規模並行處理資料庫技術、數據挖掘技術、分布式資料庫技術、雲計算基礎構架平台等技術, 為更好的研究大數據技術, 應對其關鍵技術進行深入分析。
2.1 大規模並行處理資料庫技術
為保證大數據技術中龐大數據的存儲與處理, 則需要利用大規模並行處理資料庫技術對相關數據進行集群管理。這一技術能夠以最快的速度對數據處理命令進行相應, 並具有較低的延遲讀寫速度, 並且, 在雲計算平台的配合下, 大規模並行處理資料庫的成本也相對較低, 在正常工作過程中, 能夠實現多個副本故障檢測與轉移機制, 在長時間工作的狀態下, 出現故障的幾率較低。
2.2 分布式資料庫技術
所謂分布式資料庫技術, 則區別於雲存儲資料庫的形式, 他是利用互聯網的空間特性, 將物理空間相對獨立的存儲單元進行連接, 通過一定的演算法進行邏輯上的統一, 形成具有超大規模的資料庫, 並具有較高的數據處理能力和數據存儲能力。
從信息安全的角度分析, 這種分布式的資料庫技術能夠實現對數據資源的有效保護, 即便出現大規模的計算機病毒事件, 基於分布式數據的存儲優勢, 相關病毒對部分計算機的影響, 並不能對全部計算機中的數據造成毀滅性的破壞。
2.3 分布式存儲技術
在大數據技術的實際應用中, 為滿足用戶一定規模數據存儲的需求, 則充分利用了分布式存儲技術所具有的縱向、橫向擴展的優勢, 將數據進行分割後存儲與多台伺服器、存儲設備上, 從而有效降低了單一存儲器的數據存儲壓力, 並且, 這種分布式存儲技術, 還實現了系統可用性、可靠性的提高, 以及保證數據存取的高速進行。
2.4 雲計算技術
對於大數據技術來說, 為了實現對一定規模數據的收集、分析和處理的能力, 則充分利用了雲計算技術所搭建的平台, 從而為大數據技術的應用奠定了堅實的硬體基礎。基於傳統存儲技術在速度、空間上的有限性, 無法為大數據技術提供足夠的支持, 雲計算技術則將傳統計算機的存儲、運算功能轉移至雲端, 以一種更加高效的方式, 為大數據技術在眾多領域的拓展提供可靠的技術平台。
3、大數據技術在電子政務領域的應用
基於大數據技術的諸多優勢, 在電子商務領域, 大數據技術主要用於網站數據進行分析, 社會誠信系統的構建, 信息共享平台與電子政務系統等。
3.1 大數據技術支持下的政府網站大數據分析
為准確掌握網站的瀏覽情況, 大多數網站都會對用戶的日常瀏覽情況進行數據分析, 相關分析要素包括用戶訪問的路徑、不同網頁的停留時間、瀏覽網頁的具體時間等, 通過對以上要素的研究, 能夠對用戶需求、習慣進行准確分析, 並能夠對後期網站缺陷的具體調整提供指導性意見。
以某政府網站為例, 由於網頁設計不合理, 以至於在用戶打開某一頁面時, 長期處於等待狀態, 如此一來, 用戶對這一網頁的實際瀏覽次數將為0。針對這一情況, 網站管理人員通過對某一周期內的網站瀏覽情況進行分析, 由於一定周期內瀏覽網站用戶的數量較大, 且相關要素成倍增加, 所以, 在處理以上信息的過程中就用到了大數據技術。對於網頁訪問次數出入較大的數據, 則需要進行深入分析, 在排除網頁的可鏈接性之後, 檢查網頁內的相關信息, 卻保網頁內信息的可靠、安全。
通過用戶瀏覽網站後留下的大量信息, 網站一方可以將用戶信息存入資料庫中, 並利用大數據技術對相關信息進行分類, 以實現網站信息向用戶的精準推送。並且, 經過大數據處理後的數據信息, 逐漸成為政府行政決策的重要依據, 並能夠在一定程度上保證行政決策的有效性和科學性。
3.2 大數據技術支持下的信用平台建設
為更好的掌握居民信用信息, 建立以個人為單位的信用資料庫, 則需要以大數據技術為依託, 收集相關部門所掌握的居民信用資料, 並通過大數據技術進行對比、整合, 進而得出准確的個人信用情況。例如, 在購房貸款過程中, 商業銀行往往需要用戶提供《個人徵信檔案》, 在《個人徵信檔案》中, 不僅包括用戶的基本身份信息, 還包括用戶在所有金融機構辦理的各種信用卡情況, 以及是否存在不良信用記錄等, 這些信息的存在, 就意味著政府機構與金融機構之間實現了以大數據技術為核心的信息共享, 通過對比用戶身份信息, 將屬於同一用戶的信用信息進行整合, 並重新存儲與資料庫之中。
政府行為的信用平台建設, 旨在掌握用戶的個人誠信資料, 並為基於個人行為的政府服務工作提供數據支撐, 打擊社會范圍內長期存在的老賴等現象。大數據技術支持下的信用平台建設, 能夠實現社會范圍內道德誠信體系的不斷加強, 促進社會道德水平的提升。
3.3 大數據交換共享平台與電子政務
隨著政府部門事務性工作的不斷增加, 僅依靠人工對相關數據進行收集、分類、整合、處理等工作不僅效率低, 速度慢, 且容易出現人為性差錯, 數據結果的人為性因素較大。在此情況下, 依託大數據技術在多元數據收集、處理方面的優勢, 以及計算機網路技術下的信息共享平台建設, 能夠幫助政府通過網路獲取社會各領域的相關數據, 並對數據資源進行有效整合, 形成龐大的資料庫資源。
然而, 對於資料庫來說, 只有得到利用才能體現其價值, 在情況下, 政府部門就充分利用了大數據交換共享平台的優勢, 建立以政府事物為中心的社會基礎資料庫, 為政府相關工作的開展提供橫向、縱向信息的全方位共享。在區域間政府工作交流方面, 大數據共享交換平台能夠突破傳統政務工作的空間限制, 進而促進跨地區政府部門信息資源整合與交流下的業務開展。
為更好的發揮電子政務的優勢, 在大數據交換共享平台的建設方面, 需要對這一平台的信息資源目錄體系進行完善, 制定政府間統一的大數據交換共享平台使用標准, 規范政府在使用大數據交換共享平台的各種行為, 以實現對數據資源的合理、高效利用。所以, 大數據交換共享平台的使用, 不僅便於政府工作的開展, 也促進了社會管理工作有條不紊的展開, 社會環境的穩定得以實現。
3.4 電子政務決策系統中的大數據技術
在實際使用過程中, 大數據技術並不僅僅是簡單的對多元數據的收集、整合、分析、處理, 對於大數據技術的使用方來說, 龐大的數據價值還在於能夠輔助政府決策。
利用計算機軟體技術, 通過對龐大數據中有關數據的篩選、分析, 經過計算機軟體的處理之後, 能夠得到更加准確的計算結果, 政府部門依據這一結果, 就可以完成一系列的政府決策, 從而實現了政府辦事效率的快速提高。
例如, 在市政建設方面, 對於城市內部交通擁堵問題, 可以藉助交通系統長期提供的大數據信息, 了解城市內交通擁堵的主要路段、時間, 以及在龐大數據信息的支持下, 通過建模的方式, 採取多種治堵方式, 並利用大數據技術對每一種方式的實際效果進行綜合評估, 最終選擇效果最好的治堵方式。
對於政府決策的客觀性、准確性等, 使用大數據技術輔助決策有著極大的優勢, 但是, 基於大數據技術缺乏人類情感因素的介入, 以至於相關決策並不能夠完全突出「以人為本」的政府工作理念, 所以, 政府部門應慎重對待大數據技術下的電子政務決策, 根據相關內容的實際情況, 做出最佳的決策選擇。
4、大數據技術在電子政務中應用的不足之處分析
通過對地方政府電子政務系統的實際使用情況調查研究後發現, 即便在我國電子信息技術得到快速發展的情況下, 大多數地區政府在電子政務系統建設方面依然存在不足, 即便是已經施行電子政務管理的地區, 政府部門對於大數據技術的實際應用卻有著較為明顯的不足, 以至於大數據技術的優勢無法得到有效發揮。
4.1「數據孤島」現象的存在
大數據技術的核心在於對數據信息的共享, 然而, 有地方政府對大數據技術的認識不足, 以至於在數據共享方面存在政策性的理解偏差, 使得以政府為核心的相關數據無法被其它行業所利用, 大數據技術的優勢也就失去。例如, A省與B省協商開通省際公交專線, 然而, 為了更好的安排公交車的運行時間表, 則需要A、B兩省之間的人員往來數據進行分析, 並能夠預估公交線路的實際載客風險, 從而適當的調整公交車的運營次數和時間, 但是, 在實際操作過程中, A、B兩省間的客流數據無法實現共享, 以至於在公交車的實際安排下依然無法解決道路擁堵的實際問題。
地方政府所體現出來的在大數據技術應用方面的這一問題, 是傳統政務管理工作中各自為政思想的延續, 一旦數據無法實現共享, 也就造成了所謂的「數據孤島。大數據共享的問題在於兩個方面, 首先, 政府部門之間有著嚴格的管理秩序, 優勢存在上下級關系的政府部門, 下級向上級申請差異資料庫中的內容, 多無法得到上機政府部門的許可, 以至於大數據技術在電子政務領域的使用存在著明顯的「數據孤島」現象。
導致「數據孤島」現象的原因還包括大數據技術的本身, 由於我國大數據技術的應用並未得到普及, 在電子政務領域也只是部分地區完成了大數據技術的初步使用。數據作為政府管理的稀缺資源, 以及從保密的角度分析, 相關數據並不能進行過度披露, 否則, 將造成社會性的事件。所以, 這也就不難解釋除政府部門間數據信息的相對獨立以外, 廣大市民同樣無法通過大數據技術支持下的電子政務平台獲得真實的數據信息。在這一「數據孤島」現象的影響下, 地方電子政務平台的實際效果也就有著明顯的降低。
4.2 電子政務領域常見的數據資源「過剩」與「閑置」問題
單從地區政府發展的角度來看, 地區政府在大數據技術方面投入的多少, 能夠直接反映出該地區經濟發展的實際情況, 兩者之間存在著顯著的正相關關系。然而, 當地區政府在大數據技術方面的投入與實際數據需求偏低時, 也就出現了所謂的數據資源「過剩」的問題。不僅如此, 在大數據技術投入不足的情況下, 政府部門無法對社會中存在的大量數據加以利用時, 也就形成了另一種形式的數據資源「閑置」。
(1) 以南京地區為例, 作為我國南方較為重要的經濟主體, 南京市政府在大數據技術與電子政務方面投入了大量人力、物力和財力, 經過近幾年的發展, 已經形成了較為完備的電子政務平台, 在實際使用中也到了廣大市民的歡迎。然而, 相對於南京的區域地位來說, 受上海的影響, 作為上海市的經濟輻射范圍, 南京市的發展受到了一定的影響, 經濟中心明顯向上海地區便宜, 為此, 基於大數據技術的電子政務平台所整合的數據, 也就無法在更大的空間中發揮其作用, 這就是數據資源「過剩」。
(2) 在我國西北、西南部分地區, 由於經濟發展較為落後, 以至於在全國范圍內進行大數據技術支持下的電子政務系統建設過程中, 無法進行大范圍的電子政務系統建設。以貴州省為例, 大數據技術下電子政務系統依然停留在商業層面的應用, 對於其它領域的電子政務系統建設並未涉及, 因此造成了貴州省內相關數據信息無法全面獲取, 這也就是資源「閑置」的直接表現。
5、關於大數據技術在電子政務領域應用的建議
針對當前大數據技術發展的實際情況, 以及電子政務作為信息化時代下政府事務性工作改革的重要內容, 有著較為積極的意義。因此, 為推動大數據技術在電子政務領域的中的應用, 則需要做到以下三個方面。
(1) 地方政府應結合大數據技術與電子政務的結合, 推動地區大數據技術產業的發展, 通過各種優惠政策, 吸引高新技術企業入駐, 建立以大數據技術為核心的產業發展模式, 從而帶動地區經濟發展。
(2) 提高政府方面對大數據技術的認識, 在社會發展過程中, 大數據技術的優勢越發明顯, 尤其是在傳統事務性工作的處理方面, 藉助專業的數據分析軟體, 能夠完成從數據的收集、整理、分類, 直至得出數據分析結果, 實現了政府辦事效率的顯著提高。如此一來, 大數據技術的優勢得以體現, 政府方面對於大數據的認識進一步提高, 進而促進了大數據技術在電子政務領域的普及。
(3) 加快大數據技術相關硬體、軟體的研發。目前, 大數據技術涉及到的硬體、軟體成本較高, 導致了部分經濟欠發達地區無法實現大數據技術支持下的電子政務系統的全面推廣。以大數據技術使用較為廣泛的數據中心機房來說, 由於要使用到高速計算機和伺服器到等昂貴的信息設備, 對於缺乏條件的地方政府來說, 可以利用雲計算技術, 通過網路伺服器的模式, 解決這一問題。
總的來說, 大數據技術在電子政務領域的應用實現了我國政務處理的信息化改革, 對於我國現代化社會管理制度體系的建立打下了堅實的基礎。並且, 通過大數據思維在政務領域的滲透, 有助於大數據技術的應用效率提高。
6、總結
盡管, 我國電子政務系統的建設時間並不長, 相關領域依然有待完善。隨著大數據技術在電子政務領域的不斷滲透, 基於多元數據收集、整合、分類、處理的大數據信息交換共享平台建設, 為政府各項事務的有效開展奠定了堅實的基礎。然而, 由於技術與認識上的不足, 電子政務系統中的大數據技術應用仍然集中於縱向政務業務領域, 這並不符合當前社會發展的趨勢。因此, 為推廣以大數據技術的應用個, 則需要加快大數據技術支持下的電子政務系統的設計, 推動電子政務系統中大數據技術的應用, 打造「數字化政府」。

㈥ 如何做好大數據應用

去年出版的《大數據》(塗子沛著)是從數據治國的角度,深入淺出的敘述了美國政府的管理之道,細密入微的闡釋了黃仁宇先生」資本主義數目式管理「的精髓。最近人民郵電出版社又組織翻譯出版了美國Bill Franks的《駕馭大數據》一書。該書的整體思路,簡單來說,就是敘述了一個」數據收集-知識形成-智慧行動「的過程,不僅回答了」what「,也指明了」how「,提供了具體的技術、流程、方法,甚至團隊建設,文化創新。作者首先在第一章分析了大數據的興起,介紹了大數據的概念、內容,價值,並分析了大數據的來源,也探討了在汽車保險、電力、零售行業的應用場景;在第二章介紹了駕馭大數據的技術、流程、方法,第三部分則介紹了駕馭大數據的能力框架,包括了如何進行優質分析,如何成為優秀的分析師,如何打造高績效團隊,最後則提出了企業創新文化的重要意義。整本書高屋建瓴、內容恣意汪洋、酣暢淋漓,結構上百川歸海,一氣呵成,總的來說,體系完備、內容繁豐、見識獨具、實用性強,非常值得推薦,是不可多得的好書!大數據重要以及不重要的一面與大多數人的想當然的看法不同,作者認為「大數據」中的」大」和「數據」都不重要,重要的是數據能帶來的價值以及如何駕馭這些大數據,甚至與傳統的結構化數據和教科書上的認知不同,「大數據可能是凌亂而醜陋的」並且大數據也會帶來「被大數據壓得不看重負,從而停止不前」和大數據處理「成本增長速度會讓企業措手不及」的風險,所以,作者才認為駕馭大數據,做到游刃有餘、從容自若、實現「被管理的創新」最為重要。在處理數據時,作者指出「很多大數據其實並不重要」,企業要做好大數據工作,關鍵是能做到如何沙裡淘金,並與各種數據進行結合或混搭,進而發現其中的價值。這也是作者一再強調的「新數據每一次都會勝過新的工具和方法」的原因所在。網路數據與電子商務對顧客行為的挖掘早已不是什麼熱門概念,然而作者認為從更深層次的角度看,下一步客戶意圖和決策過程的分析才是具有價值的金礦,即「關於購買商品的想法以及影響他們購買決策的關鍵因素是什麼」。針對電子商務這一顧客行為的數據挖掘,作者不是泛泛而談,而是獨具慧眼的從購買路徑、偏好、行為、反饋、流失模型、響應模型、顧客分類、評估廣告效果等方面提供了非常有吸引力的建議。我認為,《駕馭大數據》的作者提出的網路數據作為大數據的「原始數據」其實也蘊含著另外一重意蘊,即只有電子商務才具備與顧客進行深入的互動,也才具有了收集這些數據的條件,從這點看,直接面向終端的企業如果不電子商務化,談論大數據不是一件很可笑的事?當然這種用戶購買路徑的行為分析,也不是新鮮的事,在昂德希爾《顧客為什麼購買:新時代的零售業聖經》一書中披露了商場僱傭大量顧問,暗中尾隨顧客,用攝影機或充滿密語的卡片,完整真實的記錄顧客從進入到離開商場的每一個動作,並進行深入的總結和分析,進而改進貨物的陳列位置、廣告的用詞和放置場所等,都與電子商務時代的客戶行為挖掘具有異曲同工之妙,當然電子商務時代,數據分析的成本更加低廉,也更加容易獲取那些非直接觀察可以收集的數據(如信用記錄)。一些有價值的應用場景大數據的價值需要藉助於一些具體的應用模式和場景才能得到集中體現,電子商務是一個案例,同時,作者也提到了車載信息「最初作為一種工具出現的,它可以幫助車主和公司獲得更好的、更有效的車輛保險」,然而它所能夠提供的時速、路段、開始和結束時間等信息,對改善城市交通擁堵具有意料之外的價值。基於GPS技術和手機應用所提供的時間和位置的數據也會提供主動的、及時的推送客戶關懷信息,有利於改善客戶關系和創造商業機會,也可以利用它進行共同目的和興趣的社交,這些都會帶來一種令人驚奇的業務創新。在視頻游戲、電信話費清單上,作者也提出了十分有價值的洞見。技術、流程、方法、組織、人、文化作者是Teradata的首席分析師,絕非是文獻學專家和徒有虛名之輩,他在書中也介紹了如何利用海量並行架構(MPP),雲計算、網格計算、MapRece等時下炙手可熱的技術從大數據中披沙瀝金,駕馭大數據。同時,作者一直在提醒我們,數據只是源,「思想才是分析之父」,「有價值和影響力的分析才是優質分析」,優質分析要符合G(Guided指導性)R(Relevant相關性)A(Explainable可行性)T(Timely及時向)原則,並且優質的分析要能提供答案、提供用戶需要的東西,要能提供新的解決方案,對實際行動有指導意義,從這個角度看,它區別於報表那種標准和固定的數據呈現模式,藉助於大數據分析,用戶能夠把握現狀、預測趨勢,這樣才能駕馭未來。作為一個大數據的行動者和實幹家,作者也結合自己的工作經驗,對於如何成為優秀的分析師,給出了他的答案,那就是學歷、數學和編程等技能「它們僅僅是起點而已」,優秀分析專家身上更重要的才能是「承諾、創造力、商業頭腦、演講能力和溝通技巧、直覺」,這種人一將難求,它需要分析師長期的工作經驗積累,從這點看,數據分析「不能只把自己當成科學家,業內最好的分析專家毫無疑問也是藝術家」。企業的大數據探索之旅,並非一片坦途,也會充滿了各種艱險,這就需要企業具有創新性的文化氛圍,容忍冒險和犯錯,並鼓勵嘗試,作者也切中肯綮的提出「關注人,而不是工具」,「打破思維定勢,形成連鎖反應,統一行動目標」的創新之路,供讀者思考和借鑒。時異而世移,我認為,在當今社會,企業直面社會的劇烈變化,在管理工作中依賴小規模的「點子」「好主意」的傳統做法已經難以應對市場的激烈競爭,企業需要從那些來自於現場、來源於客戶、來源於多個時空的全方位的立體信息中找到利潤的寶藏,才能獲得持續增長的動力,從這個意義上看,駕馭大數據是企業駕馭未來的必經之路。

㈦ 大數據之父舍恩伯格:互聯網比你更了解你

大數據之父舍恩伯格:互聯網比你更了解你

牛津大學網路研究院網路監督及管理學教授,研究領域為網路經濟。曾任哈佛大學肯尼迪學院信息監管科研項目負責人,哈佛國家電子商務研究中心網路監管項目負責人;曾任新加坡國立大學李光耀學院信息與創新策略研究中心主任。並擔任耶魯大學、芝加哥大學、弗吉尼亞大學、聖地亞哥大學、維也納大學的客座教授。

有100多篇論文公開發表在《科學》、《自然》等著名學術期刊上,同時也是哈佛大學出版社、麻省理工出版社、通信政策期刊、美國社會學期刊等多家出版機構的特約評論員。

信息權威與顧問,咨詢客戶包括微軟、惠普和IBM等全球頂級企業。早在1986年與1995年就擔任兩家軟體公司的總裁兼CEO,1991年躋身奧地利軟體企業家前5名之列,2000年被評為奧地利薩爾斯堡州的年度人物。

機構和國家政府高層的信息政策智囊,專注於信息安全與信息政策與戰略的研究,是歐盟專家之一,也是世界經濟論壇、馬歇爾計劃基金會等機構的咨詢顧問,先後擔任新加坡商務部高層、汶萊國防部高層、科威特商務部高層、迪拜及中東政府高層的咨詢顧問。

超過兩年沒穿的衣服會送人,拍得不好看的照片要當即刪除

大數據之父舍恩伯格:互聯網比你更了解你

時代周報記者 韓瑋 發自上海

舍恩伯格又要戴著他標志性的約翰·列儂式的圓眼鏡來中國了。

9月25日,時代周報舉辦2015「影響力·中國」秋季峰會,舍恩伯格將受邀出席,講他最擅長的大數據。

最近兩年,這位數據科學領域的權威學者每隔幾個月就會出現在中國,而他所到之處,無不受到媒體、讀者的簇擁。

舍恩伯格之所以在國內名聲大噪,主要是因為他的兩本暢銷書、關於大數據的先河之作—《大數據:一場將改變我們生活、工作和思考方式的革命》(Big Data :A Revolution That Will Transform How We Live, Work, and Think,中文版又名《大數據時代》)以及《刪除:大數據取捨之道》(Delete: The Virtue of Forgetting in the Digital Age)。前者揭示了大數據給人類帶來的巨大改變,後者則嘗試探索大數據時代人類應該如何構建積極而安全的未來。

作為最早洞悉大數據發展趨勢的數據科學家,舍恩伯格在國內受追捧並不奇怪。畢竟,此刻的中國—國務院剛剛印發《促進大數據發展行動綱要》,提出推動大數據發展和應用在未來5-10年逐步實現的目標及主要任務。國內的大數據產業正迎來大發展時期。

而由於大數據太火,在這個新淘金時代,人們對舍恩伯格的興趣不再停留於他的研究,還延伸至他本人以及他獲得一系列學術成就的過程。

恰好,舍恩伯格是個性格有趣而經歷豐富的人。比如,他曾因不想繼承家業而與父親爭執數十年,最終走上學術之路。

代碼少年

「我母親以前經營一家電影院,我每年都會問她,過去一年最好的電影是什麼?她總是說,我知道,是×××。但她總是錯的。」

舍恩伯格常常在演講中提起這個例子,盡管只是為了佐證大多數人都需要數據分析工具這個觀點,但無意間卻把很多人的興趣引向了他的過去。

這位如今在全球數據科學領域極具名望的科學家其實算得上是「富二代」。他出生在距離莫扎特故鄉奧地利薩爾茨堡兩小時車程的一個小鎮上,父親是當地的稅務律師,有自己的事務所;母親則打理著小型電影院、花店等生意。

1966年,舍恩伯格出生那年,他的父親買來了小鎮上的第一台電腦,價格不菲。當時,鎮上所有人都覺得他瘋了,肯定會破產。而這台巨大的個人電腦運轉時發出的嗡嗡聲陪伴了舍恩伯格的整個童年。

小時候,舍恩伯格喜歡看阿斯特麗德·林德格倫的童話書。這位已故瑞典作家最著名的作品是那本充滿想像力的《長襪子皮皮》。而那時的舍恩伯格夢想成為發明家,因為,讓想法變成現實是一件特別誘人的事。

「如果還可以和林德格倫共進午餐,我想問她,她如何激發自身的想像力?愛因斯坦說過,想像力比知識更重要。」舍恩伯格說。

讀書時,舍恩伯格最喜歡的科目是物理和數學,進而又對計算機著迷。十一二歲時,他就想用那台嗡嗡作響的電腦編程。

「當時,只有大學才有計算機,我就去當地大學報了一門編程課。但老師覺得我不可能學會,就讓我自己玩。於是,我便在角落裡自學。」到了高中時期,這位天賦異稟的少年先後在國際物理奧林匹克競賽和奧地利青年程序員競賽中獲了獎。

17歲時,舍恩伯格第一次觸網。當時,他無意間得到一個聲音耦合器,其實不過是簡陋的數據機—使用者得把電話聽筒與之連接,從而激活以聲音傳送方式進行的數據傳輸。

在此之前,舍恩伯格聽說過互聯網,但從沒體驗過。於是,他搗鼓了好幾個月,試掉了一大筆電話費,最終連上了一個提供初級的郵件、論壇等商業在線服務的無線電通訊網站「The Source」。此後,舍恩伯格便一發不可收拾,對網路著了迷。

1986年,年僅20歲、沒讀完大學的舍恩伯格「創業」了—成立殺毒軟體公司Ikarus,並開發了一款當時奧地利最暢銷的軟體Virus Utilities。至今,網路對Virus Utilities的介紹上寫著,這是一款剽悍的殺毒軟體。1991年,年輕的舍恩伯格還被評選為奧地利最頂尖的5位軟體企業家之一。

這段程序員的經歷為舍恩伯格的未來打下了基礎。許多年後,在《大數據時代》這本書中,舍恩伯格寫道,真正的數據科學家是統計學家、軟體程序員、圖形設計師與作家的結合體。

父與子

在舍恩伯格的學術之路上,很難繞開的一個人物,就是買來了小鎮上第一台電腦的父親。

舍恩伯格與父親的關系並不差。至今,他記憶最深的關於父母的細節是,每天晚餐後,父親都會耐心聽他講述那天發生的事以及他的一些想法。舍恩伯格覺得,這是父親的「超能力」。

不過,父親始終不希望舍恩伯格滿腦子想著如何成為計算機學家,盡管他遷就兒子喜歡計算機。這位在小鎮上有頭有臉的稅務律師總在勸說自己的孩子盡早學完法律,繼承家業。在子承父業和投身計算科學之間,舍恩伯格與父親爭執了數十年,直到後者去世。

而在20歲左右的年齡,舍恩伯格還是順從父親,先在奧地利薩爾茨堡大學讀了法學本科。據說,因為法律太無趣,這位學霸硬是在3年半里讀完了7年的書。

接著,父親要求舍恩伯格繼續在法律上深造,但這個年輕人心不甘情不願,於是便賭氣地只申請了一所學校—哈佛。他覺得,自己肯定不會被錄取。

收到錄取通知書那天,舍恩伯格以為是朋友開玩笑,於是按照上面的電話號碼打過去斥責,「這是愚蠢的玩笑!」而電話另一頭卻有聲音說,「不,這里是哈佛。有什麼能幫你嗎?」

這不是舍恩伯格唯一一次「厚積薄發」。其實,在學生時代的大部分時期,舍恩伯格雖然出色,但不是最出色的那個。但到了最後一個學年,他就像突然間開了竅,過去學過的東西頓時「融會貫通」了。於是,出乎所有人包括他自己的意料,他在畢業前的最後一次考試中獲得了學生生涯唯一一次的全A。

而在美國最古老的法學院哈佛法學院,舍恩伯格開始覺得自己學的法律不再像本科時那麼了無生趣。盡管如此,他依然不想學成後接手父親的公司。

有記者采訪舍恩伯格時曾問,「你後來為什麼當上了大學教授?」他說,「我一直想成為發明家,直到我那個一直『逼』我接手家業的父親有天問我,如果不想做稅務律師,你想做什麼時,我才下定決心當大學教授。至少,對於我父母來說,這會是一個比發明家更容易接受、更受人尊敬的工作。」

從哈佛畢業後,舍恩伯格又拿到了薩爾茨堡大學的法學博士以及倫敦政經學院的理學碩士學位,並依照對父親的承諾,在倫敦一所大學謀得了教職。

當時,舍恩伯格的父親面對這樣的局面依然感到有些失落,最後竟然猝然辭世。父親去世的第二天,舍恩伯格選擇離開倫敦,放棄自己的事業和學術,回到自家的鎮子上,做起了以前無數次拒絕的稅務律師。

「我的人生,和大多數人一樣,既是連貫的,同時又屢受波折。我最初喜歡物理、數學,轉而對計算機產生興趣,進而關注數據安全和數據編碼,並喜歡上了研究隱私法、知識產權法以及網路法。依照這個路徑,數據逐漸成為我關注的重點。但我的生活又被一次次打亂。比如,父親的離世讓我放棄了原來的事業規劃,回到了老家;但一年後,我又賣掉父親的公司,艱難地重回學術圈;後來,偶然的機會讓我得以到哈佛大學肯尼迪學院任教。某種意義上說,這些波折給我製造了意想不到的困難,但也帶來了意想不到的機會。」舍恩伯格告訴時代周報記者。

大數據之父

自1998年始,舍恩伯格的學術研究步入正軌。他進入哈佛大學肯尼迪學院任教,並在那裡度過了10年。此後,他曾在新加坡國立大學李光耀公共政策學院做過3年副教授,借機觀察亞洲的信息政策,而今則在牛津大學互聯網研究院擔任治理與監管專業的教授。

這10餘年間,互聯網飛速發展,人們開始使用手機上網、聊天、購物,完成很多過去必須線下操作的事。而這些變化都被舍恩伯格陸續記錄在論著里。

2010年,在舍恩伯格組織的一次研討會上,幾乎所有參會者發言時都開始提及社會運轉模式正在發生某種改變,但誰也說不出這種變化的實質是什麼。當時,《經濟學人》的數據編輯肯尼思·庫克耶(Kenn Cukier)也在會場,他不久前剛做過一期《大數據的沖擊》的特刊報道。

那場研討會後,舍恩伯格與庫克耶進行了很多次深入交談,「然後,我們決定合寫一本書,探討大數據對於當下的意義以及大數據時代的本質」。

2012年12月,舍恩伯格與庫克耶合寫的《大數據時代》出版。這本大數據研究的先河之作不僅廣受媒體好評,還讓舍恩伯格知名度大漲。

在書里,舍恩伯格通過各種例子展現大數據帶來的改變。比如,一家叫Farecast的公司通過近十萬億條價格記錄來預測美國國內航班的票價。到2012年為止,票價預測的准確率達到75%,使用Farecast票價預測工具購買機票的旅客,平均每張機票可節省50美元。

「大數據的核心是預測。它通常被視為人工智慧的一部分,或者說是一種機器學習。但其實,這種定義具有誤導性。大數據不是要教機器像人一樣思考,相反,它是把數學演算法運用到海量數據上來預測事情發生的可能性。」舍恩伯格寫道。

在這本書里,舍恩伯格還提出了一個廣為引用的觀點—大數據關注的不是隨機樣本,而是全體數據;不是精確性,而是混雜性;不是因果關系,而是相關關系。

「具體來說,大數據的目的是全面的數據收集和分析;同時,我們要明白,在數據質量和數據數量之間要有一個平衡,所以,『不是精確性,而是混雜性』,而『不是因果關系,而是相關關系』,這是讓我們意識到,因果關系不再是解釋這個世界的唯一邏輯。」舍恩伯格告訴時代周報記者。

此外,舍恩伯格還是倡導大數據商業應用的第一人。在《大數據時代》中,他指出,如今的數據已經成為一種商業資本、一項重要的經濟投入,可以創造新的經濟利益。而這也是他屢屢被正在大力推動大數據產業發展的中國人當作座上賓的原因之一。

在關注數據的價值之餘,舍恩伯格感興趣的另一重要領域是如何避免數據被濫用。在早於《大數據時代》出版的《刪除:大數據取捨之道》一書中,舍恩伯格提出了數字時代最大的問題:互聯網記住了人們希望自己忘記的東西。當遺忘成為例外,記住變成常態,人類理性決策的能力就會受到威脅。所以,在大數據時代,所有人都應該享受「被遺忘的權利」。

事實上,舍恩伯格本人早早地為自己確立了一套關於刪除的生活准則。比如,那些超過兩年沒穿的衣服會被他送人或處理;那些拍得不好看的照片,他會當即刪除。因為,「如果不刪除,在數字時代,互聯網可能會比你自己更加了解你」。

舍恩伯格這些新穎的想法曾一度讓讀者直呼開了眼界。而目前,他告訴時代周報記者,自己的興趣點轉到了小型無人機上。其實,一直以來,舍恩伯格對飛機駕駛以及基於大數據分析的無人駕駛都頗感興趣。只是不知道,這位數據科學家未來又會在這個問題上帶來怎樣「讓人感覺腦洞大開」的思考。

對話舍恩伯格:

「只要他們不濫用權力,不必對數據寡頭反壟斷」

時代周報記者 韓瑋 發自上海

9月13日,在接受時代周報記者獨家專訪時,舍恩伯格講述了自己對大數據的一些理解,以及收獲這些理解的過程。

影響最深的人是高中物理老師

時代周報:今年暑假,以艾倫·圖靈為原型的傳記電影《模仿游戲》在中國上映,感動了很多人。你看過這部影片嗎?艾倫·圖靈是計算機科學之父,他對你從事數據科學研究是否有影響?

舍恩伯格:我看過這部電影。事實上,很多年前,我就讀過一些圖靈的論著。你可能記得,我以前做軟體公司時就需要編碼,所以,圖靈的書肯定要看。

不過,影響我最深的人不是圖靈,而是我的高中物理老師。他讓我開始接觸到熵的概念、相對論、量子理論等。對於我來說,他就像是為我打開了通往新世界的大門。

時代周報:大家都認為你是當今最重要的數據科學家之一。我特別好奇,大數據給你本人的日常生活帶來改變了嗎?

舍恩伯格:我是大數據服務的「大用戶」。平常,我會戴蘋果手錶,一直以來,它為我的身體健康提供了很多幫助;我也喜歡諸如亞馬遜一類的電子商務公司,同時,還經常使用谷歌地圖。此外,維基網路對我來說是個難得的好幫手,它讓我比過去更加容易獲得有用的信息,對我的幫助很大。

時代周報:我今年曾采訪過暢銷書《大停滯》(The Great Stagnation)的作者、美國經濟學家泰勒·考恩。在談到對大數據的看法時,他告訴我,「大數據被高估了,因為,大多數人都不知道他們手握的這些數據要用來干什麼,企業也一樣。大數據能幫助我們在某些邊緣地帶提高效率,比如針對性的廣告,但它無法改變全局。這其中,最困難的是問對問題,並且找到問題背後特定的模式,再用數據去加以匹配。這非常難以實現。」你認同他的觀點嗎?

舍恩伯格:我非常欣賞泰勒·考恩,《大停滯》是一本很棒的著作。我還曾引用過這本書里的一些觀點。但在大數據的問題上,我覺得他的觀點是錯誤的,或許,這是因為這方面不是他所研究的核心專業領域。

大數據可減少資源不公平的危害

時代周報:現在,大多數行業提起大數據就言必稱「這是一場行業革命,要顛覆過去」。你認為,大數據真的會顛覆那些傳統行業嗎?

舍恩伯格:會的,這種顛覆已經發生,並在快速進行。施樂帕羅奧爾托研究中心前主管約翰·西里·布朗(John Seely Brown)就發現,過去幾十年,超大型企業的壽命正在縮短。與此同時,我們看到,就在最近幾年,大數據驅動、估值達到數百億美元以上的互聯網企業不斷涌現。在人類歷史上,沒有哪個時期在比今天更多的領域,發生比今天更快的變化。

時代周報:目前,中國存在網路、阿里巴巴、騰訊三大互聯網巨頭,分別統治著搜索、電商、社交三個領域,他們不斷吸納著用戶的網上行為數據,幾乎肯定會成為中國的數據寡頭。你認為,在數據層面是否需要反壟斷?

舍恩伯格:我認為必要的一點是,互聯網要對新的創新主體保持開放的狀態。只要大企業不濫用自己的權力,將那些更小但更好的初創企業趕出市場,那麼,他們就不會製造太多的威脅。所以,我更關注的是這些企業的實際行為,而非他們的規模。

時代周報:除了數據,我知道,你還對教育問題有著深入研究。今年1月,你出版了一本名為《與大數據同行:學習和教育的未來》的新書,專門探討大數據研究在教育領域的應用,以求真正實現因材施教。而中國教育的主要問題是教育資源分配不公平,大數據能解決這個問題嗎?

舍恩伯格:大數據不能從根本上消除這種不公平,但是,通過大數據的手段,我們能以相對較低的成本提供高度個性化的教育,從而減少這種不公平帶來的危害。換言之,大數據能讓學生以很低的成本,獲得至少像「私人家教」那樣的訂制教育。所以,大數據可以成為改變整個游戲的因子。

以上是小編為大家分享的關於大數據之父舍恩伯格:互聯網比你更了解你的相關內容,更多信息可以關注環球青藤分享更多干貨

㈧ 大數據是什麼

大數據是什麼意思呢?
如果從字面意思來看,大數據指的是巨量數據。那麼可能有人會問,多大量級的數據才叫大數據?不同的機構或學者有不同的理解,難以有一個非常定量的定義,只能說,大數據的計量單位已經越過TB級別發展到PB、EB、ZB、YB甚至BB級別。
最早提出「大數據」這一概念的 是全球知名咨詢公司麥肯錫,它是這樣定義大數據的:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統資料庫軟體工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型以及價值密度低四大特徵。
研究機構Gartner是這樣定義大數據的:「大數據」是需要新處理模式才能具有更強的決策力、洞察發現力和流轉優化能力來適應海量、高增長率和多樣化的信息資產。若從技術角度來看,大數據的戰略意義不在於掌握龐大的數據,而在於對這些含有意義的數據進行專業化處理,換言之,如果把大數據比作一種產業,那麼這種產業盈利的關鍵在於提高對數據的「加工能力」,通過「加工」實現數據的「增值」。

㈨ 大數據的主要應用領域是什麼

隨著5G時代的到來,大數據應用得到迅速的發展,並且得到很多人的關注。在大數據發展的時代中,大數據人才稀缺是非常大的,所以現在大數據成為了市場和行業中的熱點。由於市場和行業中的稀缺,大數據人才在崗位中得到的薪資是非常高的,掌握大數據的技術對提高薪資有很大的幫助。那麼在大數據時代中,你了解大數據嗎?下面電腦培訓為大家介紹大數據的主要應用領域。


一、電商行業

電商行業是最早將大數據用於精準營銷的行業,它可以根據消費者的習慣提前生產物料和物流管理,這樣有利於美好社會的精細化生產。隨著電子商務的越來越集中,IT培訓發現大數據在行業中的數據量變得越大,並且種類非常多。在未來的發展中,大數據在電子商務中有大多的想像,其中主要包括預測趨勢,消費趨勢,區域消費特徵,顧客消費習慣,消費者行為,消費熱點和影響消費的重要因素。

二、金融行業

大數據在金融行業的使用是非常廣泛的,主要使用在交易過程中。現在許多股權交易都是使用大數據演算法進行的。這些演算法能夠越來越多地考慮社交媒體和網站新聞,並且決定接下來的幾秒內是選擇購買還是出售。

三、生物技術

基因技術是人類未來挑戰疾病的重要武器。科學家可以利用大數據技術的應用,這樣能夠加速他們自己的基因和其他動物基因的研究過程,並且昆明北大青鳥發現還能成為人類未來克服疾病的重要武器之一。技術不僅可以改良作物,還可以利用遺傳技術培育人體器官,消滅細菌等。

現在移動互聯網和物聯網的發展是非常迅速的,大數據知識得到更多人的認可。大量的數據能夠和大數據技術完美結合進行解決問題,改善收集、存儲、計算和分析等問題,並且北大青鳥昆明計算機學院認為還能促進社會對大數據的重新認識。


㈩ 什麼是大數據,大數據為什麼重要,如何應用大數據

「大數據」簡單理解為:

"大數據"是一個體量特別大,數據類別特別大的數據集,並且這樣的數據集無法用傳統資料庫工具對其內容進行抓取、管理和處理。大數據是一個抽象的概念,對當前無論是企業還是政府、高校等單位面臨的數據無法存儲、無法計算的狀態。大數據,在於海量,單機無法快速處理,需要通過垂直擴展,即大內存高效能,水平擴展,即大磁碟大集群等來進行處理。

大數據為什麼重要:

獲取大數據後,用這些數據做:數據採集、數據存儲、數據清洗、數據分析、數據可視化

大數據技術對這些含有意義的數據進行專業化處理,對企業而言,大數據可提高工作效率,降低企業成本,精準營銷帶來更多客戶。對政府而言,可以利用大數進行統籌分析、提高管理效率、管理抓獲犯罪分子等。對個人而言,可以利用大數據更了解自己等。

如何應用大數據:

大數據的應用對象可以簡單的分為給人類提供輔助服務,以及為智能體提供決策服務

大數據不僅包括企業內部應用系統的數據分析,還包括與行業、產業的深度融合。具體場景包括:互聯網行業、政府行業、金融行業、傳統企業中的地產、醫療、能源、製造、電信行業等等。通俗地講「大數據就像互聯網+,可以應用在各行各業",如電信、金融、教育、醫療、軍事、電子商務甚至政府決策等。



閱讀全文

與大數據在出版社中的應用研究相關的資料

熱點內容
u盤外殼3d源文件 瀏覽:298
中小學如何有效開展編程教育 瀏覽:6
如何快速拷貝大文件 瀏覽:406
正柏網路是什麼 瀏覽:834
快手裡下載的文件在哪裡找 瀏覽:742
word跨頁單元格重復 瀏覽:616
電視上如何打開壓縮文件 瀏覽:328
電腦管家桌面文件整理 瀏覽:770
樓宇編程是什麼 瀏覽:802
紅警二文件夾 瀏覽:541
大的mht文件打不開 瀏覽:467
會計怎麼把數據匯總成一本書 瀏覽:516
哪裡有100g的大文件 瀏覽:837
linux不支持usb文件系統怎麼辦 瀏覽:844
如何給公司抬頭文件加紅線 瀏覽:818
企業門戶網站模板html 瀏覽:208
為什麼找不到備份的文件 瀏覽:918
touchjs委託 瀏覽:450
鴻蒙系統桌面增加文件夾 瀏覽:351
windows2003密碼策略 瀏覽:862

友情鏈接