行為與大數據實驗室_高校大數據實訓室解決方案有么急求

1. 社會心理學選修課論文2000字(2)

社會心理學論文2000字篇三
《中國當代社會心理學發展的新方向》

1 國內外社會心理學研究現狀對比

1.1 國外社會心理學研究現狀

近幾年，國外社會心理學領域正迅速擴展。2010年至今，發表在國外學術理論期刊上的有關社會心理學的文章有9000多篇。研究主題按頻次排列包括刻板印象、社會互動、歸因、態度、社會群體、情感、動機、個性、群體認同、偏見、歸屬、自尊、社會地位、道德等。需要注意的是，國際社會心理學的研究越來越注重文化和性別因素的影響，對社會認知、社會知覺、自我認識、態度改變、從眾行為、團體過程、人際吸引、社會支持、親社會行為、攻擊行為以及偏見等方面的性別和文化差異進行了大量的研究。例如不同文化中的整體性和分析性思維、使用社會神經科學的方法研究歸因中的文化差異、自利歸因的文化差異等。

此外，近5年國外社會心理學研究的應用性更強、內容更細，主要涉及5個模塊，健康管理、組織管理、環境研究、法律和市場營銷等方面。健康管理模塊主要包括心理社會因素對健康的影響，如負性生活事件、知覺壓力、刻板印象威脅、社會支持等，其涉及的病症包括癌症和心血管疾病等。組織管理模塊主要涉及激勵與員工心理、領導勝任力、組織文化。性別與領導力方面，提出了一些新的理論，如「玻璃懸崖」(glass cliffs)理論。關於環境研究，阿倫森(2014)在其《社會心理學》(第八版)中將這一模塊稱為「人類的可持續未來」，涉及內容包括噪音、污染、擁擠對個體心理的影響，以及環境保護等。法律模塊主要涉及目擊者證詞、陪審團的集體決策過程。

例如邦德(Bond)和德保羅(DePaulo)在2008年做的關於判別謊言的個體差異研究，以及格拉爾茨(Geraerts)等人2007年做的關於恢復性記憶的研究。此外，市場營銷在近幾年成為了社會心理學研究的熱點，Ivanic等人(2014)通過實驗的方法探究了廣播員的口音所形成的刻板印象對聽眾評估電台廣告的可信度、聽眾對廣播員的態度和聽眾購買廣告產品或服務的可能性的影響作用，Malhotra等人(2007)則通過在英國四個呼叫中心大規模的問卷調查內在或外在獎勵與員工情感性、規范性和持久性承諾之間的聯系，Osman等人(2015)同樣通過問卷調查的方式研究態度、情感評價和習慣養成對模式選擇行為的影響。

研究方法方面，除了傳統的觀察法、相關法、實驗法和元分析等研究方法，國外社會心理學領域興起了一些新的研究方法，如跨文化研究、進化心理學和社會神經科學，例如哈蒙?瓊斯(Harmon-Jones)關於失調和減少失調時腦活動差異的實驗。

縱覽近5年的社會心理學研究，可以發現，實驗研究成為了國外社會心理學的主要研究方法，在國外社會心理學領域中愈發受到重視與推崇。但大量採用實驗的方法進行社會心理學研究存在諸多的缺陷。早在20世紀末，Aroldo Rodrigues和Robert V.Levine(1999)就發表了「反思實驗社會心理學發展的100年」的文章，並對實驗社會心理學進行了批判和反思。

1.2 國內社會心理學研究現狀

以中國知網為例，2010年至今，國內有關社會心理學的研究有260多篇，2014年出現明顯激增，從2013年的48篇到2014年的89篇，以樂國安、張世富和俞國良、葉浩生等學者為主要代表。國內並沒有專門的社會心理學刊物，就近5年中國健康心理學雜志在社會心理學方面的文章看，國內社會心理學研究的內容主要包括社會支持、情緒情感、性別角色、主觀幸福感、從眾行為、學習或職業倦怠、網路成癮和壓力等，7成以上研究的對象均為大學生。國內社會心理研究多使用相關法和實驗法，其中，相關法使用更為頻繁。

盡管已經歷30多年的發展，但對比國外社會心理學的成熟與迅速擴展，國內社會心理學的研究雖有部分理論和測量工具方面的創新，但無論是從量上還是質上都遠遠不足，研究對象局限，研究方法落後，研究內容多照搬國外研究，研究結果信效度存在質疑(例如研究結果無法重復)。此外，我國社會心理學的發展還面臨著諸多其它的問題，例如評價標准模糊、欠缺有效研究工具，以及教學科研體系不完善等。可以說，整體而言，我國社會心理學的發展仍處於「摸索階段」。

2 當代社會心理學研究中的問題

2.1 研究對象

無論是國內還是國外，研究人員在對象的選擇上都傾向於採取方便取樣的方式，其中，大學生最受青睞。為了取樣的便利性，研究人員通常會通過相熟的老師或同學將某一班級的學生作為研究被試，類似這樣的情況屢見不鮮，在心理學本科大學生中最為普遍。這種做法不僅會降低研究的外部效度，還會面臨倫理問題，如被試參與實驗可能是迫於壓力而非自願、保密性和匿名性受到威脅、被試面對某些特殊問題時隱瞞實情或服從研究者目的等(高華， 2009)。從長遠的角度看，這種做法會對社會心理學研究的廣度和應用價值造成不良影響，也不利於中國社會心理學學科體系的整體發展。

2.2 研究方法

國外社會心理學的研究過度強調實證主義，實驗研究泛濫。主流的社會心理學為了量化社會行為的研究，把社會行為孤立在實驗室中，觀察環境變數和行為之間的關系。然而，社會心理現象實則難以數量化和操作化，例如幽默、攻擊和順從等。這些社會行為的定義隨文化情境的不同而不同，根本無法精確的測量(葉浩生，2004)。其二，社會心理學的研究對象是人，不是自然科學研究的物。人是特定社會歷史時期社會協商和建構的產物，受文化歷史因素的塑造和影響。因此，社會心理學實驗的研究結論只適用於某一特定的文化歷史背景，是相對的。其三，用單一因素來解釋社會心理學現象是很困難的，而且一些因素往往成為其他因素或行為的調節變數或中介變數(劉長江，2007)。面臨著方法上的窘境，國外社會心理學界自20世紀末就已經開始了反思，並嘗試探索新的研究之路。而國內遠遠沒有跟上這一步伐，大多是根據國外已有的研究成果和數據進行理論上的探索與批判。

2.3 研究內容

對比國外社會心理學的研究，中國當代社會心理學的研究缺乏穩固的本土化理論根基和理論框架。許波認為，在中國悠久的歷史長河中，儒、道、佛三家思想相拒而相和，儒家又久居我國國家意識形態的主流學派之位，擁有著濃厚倫理色彩的儒家心理學也就成為中國本土傳統心理學主要的思想和理論根基(許波，2005)。而彭艷琴則認為，有著上千年發展歷史的佛教專門研究的就是如何解決人的精神問題(彭彥琴，2011)。還有一些學者認為，道家文化對於緩解人們心理壓力有著不可忽視的作用(周慧和陳萍，2005)。在關於本土社會心理學的研究中，心理學家們試圖找出各家思想中一切與心理學相關之處，而這種做法實則非常盲目，且很可能陷入重復做工的境地。

從古至今，中國思想學術流派何其多，每個派別又有各自繁雜的理論觀點。但這些觀點並非完全獨立，以儒、佛、道三教為例，自佛教傳入中國後，三教在新的社會環境中出於生存、發展的共同需要而相互融攝、相互滲透、相互補充，在思想層面上開始了深層的、廣泛的、有機的融合，逐漸形成了以儒學為主體，佛、道為輔翼的「三教合一」的思想文化格局(張玉璞，2011)。因此，在進行社會心理學研究之前，若先對中國百家的思想理論進行歸納、整合和提煉，推進中國社會心理學理論框架的構建，研究則會事半功倍，研究的系統性和效率也會大大提高。

2.4 研究工具及評價體系

發展至今，仍有不在少數的心理學家們將西方心理學的研究量表直接移植到我國社會心理學研究之中，或是只對西方量表進行本土化的修訂或製作。而中國的社會心理學區別於西方心理學，其人文性質更為濃厚，其中許多觀點都帶有極強的價值規范性和理想主義色彩。這種急於用問卷和量表來證明研究假設的做法表明，我國社會心理學的研究從原理、策略、工具到評價標准都仍未擺脫西方的定量思維的桎梏。因此，推進西方量表的本土化、開發具有中國特色的測量工具和建立有效的評價體系是我國社會心理學發展的當務之急。

2.5 學科建設

在當前的教學科研體系中，我國社會心理學與西方相比，處於明顯的弱勢地位。從教材、課程設置、師資配備、科研基金項目設置到人才培養目標，整個中國心理學體系仍是以西方心理學為主導(汪新建和柴民權，2014)。這樣直接導致學生對我國本土的社會心理學研究缺乏了解和興趣，從而間接阻礙了本土社會心理學的研究和發展。因此，要推動我國社會心理學的發展，就必須改變教學科研體系的現狀，推進教材的編制、改變原有的課程和科研基金項目設置，並培養和引進中國社會心理學人才。

3 中國當代社會心理學研究的新方向

3.1 回歸現實問題，構建穩固的理論基礎和理論框架

在美國，社會心理學的學科地位比較高，這主要源自於其應用價值為美國社會做出的實際貢獻。美國的社會心理學研究問題意識非常強烈，其研究成果的應用性也非常高，因此受到了美國政府和民眾的高度擁護。而國內的社會心理學研究則一直未擺脫西方思想的限制，也未形成基於我國本土特色的、穩固的理論基礎，而多是將國外已有的研究和結果生搬硬套到國內。因此，從中國人的社會心理和文化出發，對中國百家的思想理論進行歸納、整合和提煉，推進中國社會心理學理論框架的構建是必然而緊迫的。而就近5年的文獻發表情況看，我國社會心理學的研究也更多地從現實問題入手，為提高研究的應用價值而努力。

3.2 研究方法的變革及大數據的使用

以往的社會心理學通常基於問卷、數據統計、抽樣調查和實驗室研究分析心理數據，而在大數據時代，真實、准確、及時的大數據樣本將為社會心理學研究方法的變革帶來嶄新機遇。藉助大數據，社會心理學能夠在很大程度上擺脫對實體實驗室的依賴，最大限度、最為高效地擴充潛在的研究對象，使社會心理學的研究不再只局限於實驗室小樣本或問卷調查採集的隨機樣本，從而面向盡可能全面的數據、趨近於總體的樣本，這就使社會心理學的研究基礎發生了翻天覆地的變化。與此同時，大數據還能夠為社會心理學的研究提供更為多樣化、異質化的樣本，並使研究者擺脫時間、空間的限制，盡可能避免社會期許效應，最大程度規避研究對象在測試過程中受到的各種復雜、無關干擾。

在我國，已有不少學者投身大數據的洪流，利用新的研究方法開展社會心理學研究。例如，清華大學彭凱平教授建立了「行為與大數據研究實驗室」、中國科學院心理學研究所蔡華儉教授創建了「雲端心理實驗室」、朱廷劭教授基於大數據開發了「國人心理地圖」，這些有價值的嘗試都將帶動中國社會心理學朝向大數據時代邁進。

3.3 社會心理學理論的整合及文化視角

為了構建多維度、多視角的社會心理學理論，近年來，社會心理學愈發趨向於吸納其他學科的觀點，例如社會認同理論中對群體沖突的研究借鑒了經濟學中的博弈理論，社會類化理論中對群體偏見等研究則運用了政治學和法學理論，以及創新性地將社會心理學理論建立在神經機制的解釋上而形成的社會認知神經科學。不同的理論之間相互碰撞、交織、融合，逐漸形成了社會心理學理論的整合趨勢，並推進了社會心理學的縱深發展，包括現代社會心理學與傳統社會心理學的整合，以及社會心理學與其他科學理論的整合(黃雪娜，金盛華，& 盛瑞鑫，2010)。

傳統的社會心理學試圖靠攏自然科學，建立具有普世性的理論模型，超越時間、歷史、文化，而適用於一切人類。但多年的實踐證明，社會心理學的理論必須植根於特定的社會文化背景之中，不同的社會文化背景會影響人類深層的心理學結構。未來的社會心理研究會更為關注社會心理行為的文化差異，文化視角將愈發頻繁地出現在社會心理學的理論構建和具體的研究中。

猜你喜歡：

1. 社會心理學論文3000字

2. 大學生心理學論文1500字

3. 淺談社會心理學的相關論文

4. 大學社會心理學論文範本

2. 安博教育的大數據實驗室是做什麼的

「安博大數據實驗室」是集教學、實驗和培訓於一體的大數據教學實驗及科研平台，包括專數據挖屬掘、大數據分析和大數據可視化平台。立足於當前大數據行業背景，集業界最前沿的大數據應用，「安博大數據實驗室」旨在將各企業大數據應用項目引入到學校課堂，通過將大數據平台和智能化運營管理有效結合，全面落實「產、學、研、用」一體化的思想和模式，從教學、實踐、科研和使用多方面注重專業人才和特色人才的培養，實現課程學習與企業人才需求無縫銜接的目標。

3. 高校大數據實訓室解決方案有么急求

四、人才培養目標
本專業主要面向大數據應用開發、大數據分析挖掘、大數據系統運維等崗位方向培養合格人才，重點培養具有大數據應用、大數據分析以及大數據系統管理與運維方向的，應用型高技能人才。
本專業方向重點培養能夠為企事業單位提供大數據系統搭建、管理、和運維技術和能力的人才。通過計算機基礎課程、演算法語言、系統管理等專業基礎知識學習，接受大數據系統和應用知識的培養，進行各種計算機系統，大數據平台系統，大數據應用系統搭建、配置、管理、及運維實訓。通過大量的案例與實踐操作，熟練掌握大數據系統管理所需的各種專業知識和能力，具備一定的職業素養，為從事大數據行業系統管理工作奠定堅實基礎。
五、實踐教學環境
新開普完美校園大數據實驗室的軟硬體系統配置主次分明，考慮到學生從基礎理論到工程實踐的各個環節，符合學生遞進式的認知規律，有利於學生由淺入深的全面掌握大數據相關知識和應用。大數據實驗實訓室將搭建理論與實踐的橋梁，為學生提供大數據技術的實驗及實訓平台，深化學生對大數據技術理論的理解，提高學生的操作能力，同時，利用所學知識對大數據技術進行創新性研究。具體建設內容包括：
1）物理層---硬體資源：
基於高性能計算與海量存儲節點構建的運算資源池，作為雲計算各項實驗學習環境的主要承載平台，採用雲伺服器集群+虛擬主機+物理機的解決方案
2）資源池：
包含計算資源池、存儲資源池、網路資源池。提供教學活動中必不可少學習資源、實驗資源、項目案例。
3）業務平台層：
面向教學活動中的實驗課程與項目實訓業務提供流程化支撐。完美校園大數據實驗室的業務平台層包含大數據教學管理平台和大數據科研平台。
4）統一管理層：
基於完美校園大數據實驗室統一資源調度引擎，為用戶使用業務平台層與資源平台提供便捷入口。

六、實驗室功能系統模塊
大數據實驗室各個功能模塊介紹如下：
1）雲計算管理系統
完美校園大數據實驗室採用雲服務提供的虛機系統，雲計算管理系統通過對硬體設施進行虛擬化處理，形成虛擬層面的資源池系統，該資源池系統可按需為每一套應用系統提供基礎硬體資源——計算能力、存儲能力和網路功能，快速適應不斷變化的業務需求，實現「彈性」資源分配能力。
①   計算模塊
計算模塊主要提供雲主機功能。而雲主機提供了整個雲平台中最基礎的功能，即虛擬伺服器從創建到銷毀的全生命周期維護。此模塊通過利用虛擬化技術，可將大批伺服器硬體資源池化，用戶僅需點擊滑鼠，選擇期望的硬體配置、操作系統類型和網路配置等信息，即可在短時間內按需獲得任意數量的雲主機，模塊支持雲主機硬體配置在線升級、雲主機熱遷移、重啟、暫停、創建快照等多種功能。
②   鏡像模塊
鏡像功能模塊是一套虛擬機鏡像查找及檢索系統，支持多種虛擬機鏡像格式（AKI、AMI、ARI、ISO、QCOW2、Raw、VDI、VHD、VMDK），有創建上傳鏡像、刪除鏡像、編輯鏡像基本信息的功能。
③塊存儲模塊
塊存儲模塊為運行實例提供穩定的數據塊存儲服務，即雲硬碟服務。它的插件驅動架構有利於塊設備的創建和管理，如創建卷、刪除卷，在實例上掛載和卸載卷。它們獨立於雲主機的生命周期而存在，可掛載到任意運行中的雲主機上，確保單台雲主機故障時，數據不丟失，並具備基於雲硬碟的快照創建、備份和快照回滾等功能。
④網路模塊
網路模塊提供雲計算的網路虛擬化技術，為雲平台其他服務提供網路連接服務。為用戶提供介面，可以定義 Network、Subnet、Router，配置 DHCP、DNS、負載均衡、L3 服務，網路支持，GRE、VLAN。插件架構支持許多主流的網路廠家和技術，如 OpenvSwitch。
⑤安全模塊
安全模塊通過在計算模塊中添加擴展實現，基於傳統的包過濾型防火牆技術，可為用戶的雲主機提供細顆粒度的安全防護策略，支持 TCP/UDP/ICMP 等多種協議，支持自定義來源IP和埠范圍等規則，支持用戶針對不同類型雲主機載入不同級別安全策略的功能。
2）大數據教學管理系統
大數據教學管理系統旨在提供統一的平台管理所有的課程教學資料、視頻、講義、實驗指導手冊、實驗數據集、實驗練習、實驗報告書、實驗成績管理、用戶管理（學生花名冊管理、教師信息管理）。
大數據教學系統提供了5大功能模塊，分別是：在線基礎課程包、在線學習平台、在線練習平台、在線測試平台、在線討論平台、數據分析平台。
①   在線基礎課程包
根據崗位人才發展路徑圖，提供相應的學習課程資源部內容，客戶根據實際情況選擇適合自己的課程內容，完美校園大數據中心存儲了大量教學資源。包含以下資源：
1.存儲輔助性的講解+PPT配套的視頻課程，准確全面的給學生講解相應的知識點或項目案例；
2.存儲了通過CMMI4規范的真實的項目文檔和案例，可以讓學生在學校就能夠接觸到大規模科技公司的真實項目和研發流程；
3.針對不同的小練習，配合PPT視頻教材，提供了詳細的描述文檔共學員選擇不同的方式對知識點進行接納和

4. 大數據能為社會心理學帶來什麼

大數據能為社會心理學帶來什麼

社會心理學是以科學的方法研究人們的思想、情感和行為如何受到他人影響的一門學科，它以社會現象為研究導向，旨在探尋個體和群體社會心理現象的發生、發展及其規律，深刻了解社會群體行為背後的動機與目的。自20世紀40年代信息科技革命以來，社會心理學在研究方法上經歷了多次變革。第一次變革發軔於20世紀70年代前後，從那時起，心理學家開始運用計算機實施具體的心理實驗。第二次變革發生於網路技術突飛猛進的20世紀90年代，其代表性事件是基於網路的心理學問卷誕生、虛擬的網路心理學實驗室成立、關於網路的心理學實驗研究成果在《科學》上發表。大數據時代的到來則使社會心理學迎來了第三次變革，以瞬時生產並存貯的海量網路數據為支撐的大數據樣本，正逐漸成為研究者觀察和預測人類個體和群體心理行為特徵與規律的寶貴資源。可以預見，大數據將為社會心理學的發展帶來變革與挑戰。

大數據給社會心理學帶來研究方法上的變革。以往的社會心理學通常基於問卷、數據統計、抽樣調查和實驗室研究分析心理數據，而在大數據時代，真實、准確、及時的大數據樣本將為社會心理學研究方法的變革帶來嶄新機遇。隨著研究的日益深入，也許我們能夠發現，以往所從事的研究可能只是冰山一角，其潛在的內容需要通過大數據逐一揭示。藉助大數據，社會心理學能夠在很大程度上擺脫對實體實驗室的依賴，最大限度、最為高效地擴充潛在的研究對象，使社會心理學的研究不再只局限於實驗室小樣本或問卷調查採集的隨機樣本，從而面向盡可能全面的數據、趨近於總體的樣本，這就使社會心理學的研究基礎發生了翻天覆地的變化。與此同時，大數據還能夠為社會心理學的研究提供更為多樣化、異質化的樣本，並使研究者擺脫時間、空間的限制，盡可能避免社會期許效應，最大程度規避研究對象在測試過程中受到的各種復雜、無關干擾。在我國，已有不少學者投身大數據的洪流，利用新的研究方法開展社會心理學研究。例如，清華大學彭凱平教授建立了「行為與大數據研究實驗室」、中國科學院心理學研究所蔡華儉教授創建了「雲端心理實驗室」、朱廷劭教授基於大數據開發了「國人心理地圖」，這些有價值的嘗試都將帶動中國社會心理學朝向大數據時代邁進。

大數據拓寬和加深了社會心理學研究的廣度和深度。大數據時代，一切事物都被數據化：情緒變成了數據、思維變成了數據、行為模式變成了數據、認知變成了數據、溝通變成了數據、關系變成了數據……受此影響，社會心理學的研究視角和研究領域不斷更新和擴展，很多傳統的社會心理學問題，如社會心態、個體行為偏好、集群行為、社會態度與公眾情緒、動態人際互動與人際關系、社會認知、主觀幸福感等，都可能藉助大數據得到更為准確的、可視化的測量和呈現。例如，大數據網路實驗室可以通過記錄用戶的網路使用情況提取用戶的網路行為特徵，分析用戶的心理屬性和網路行為的關聯模式；大數據心理健康系統可以為犯罪矯正人員、精神病患者、特殊心理兒童等建立心理健康檔案；藉助大數據檢測和評估社會心態，能夠獲取大眾的社會心理態勢，及時發現社會不穩定因素和風險，為社會治理提供科學、客觀的研究報告和應對方案等。

大數據宣告社會心理學預測時代的到來。社會心理學有四項基本功能，即描述、闡釋、預測和控制，傳統社會心理學多關注描述和闡釋兩項功能，對於預測和控制則顯得有些捉襟見肘。大數據時代，這種狀況將獲得很大改觀。由於大數據時代的社會心理學研究不再過多依賴隨機采樣，而是通過處理和分析相關數據獲取結論，這有助於預測能力的提升。例如，有關心理健康的預測，可以利用被試的網路痕跡代替通過問卷收集的答案，並且用機器學習的方法建立基於網路行為的心理健康預測模型，通過模型計算得出被試的心理健康狀態評分；關於幸福感的預測可以對社會公眾進行幸福感知的預測；關於社會心態、社會風險判斷、群體情緒和集群行為、經濟發展信心和政府信任的預測，可以預知和評估國民的社會態度，並根據某類群體社會態度的時間性變化研判社會輿情、引導社會輿論等。2010年美國印第安納大學的約翰博倫教授發現，Twitter網站上的平靜類情緒能顯著預測未來2至6天美國道瓊斯工業平均指數的結果。我國南開大學樂國安教授團隊基於微博與股票的大數據研究發現，微博網民情緒的起伏不僅與中國社會發生的重要事件存在明顯對應關系，還在一定程度上能夠預測我國證券綜合指數及其每天交易量的變化。這表明，大數據的背後是人的心理表現，大數據帶來的巨大變革必將使社會心理學在預測與控制方面大展身手。

大數據可能給社會心理學研究帶來的風險。隨著計算科學、數據挖掘等信息分析技術的迅速發展，高效處理和分析海量數據正在成為可能，在此背景下，社會心理學研究者在研究過程中利用大數據、樹立大數據思維顯得極為重要。但也要認識到，大數據也有可能會給社會心理學研究帶來風險。風險之一在於網路用戶隱私權和安全感風險。以Facebook為例，其瞬時可以生成詳盡的用戶心理數據，如包括種族、性格、智商、幸福感、政治觀點、宗教信仰等在內的人口特徵資料，一旦掌握了這些數據，便可以自動建立起模型。這提示我們，網路數據的使用應注意透明度是否合理，以及合理界定網路控制權的外延和邊界。風險之二是研究方法問題。社會心理學面向的是個人、群體和社會，但大數據所帶來的研究方法的改變卻使得社會心理學研究者可能更多地關注數據，這或許會使某些研究者誤入「數據萬能論」的誤區。事實上，大數據背後所分析的是每個鮮活的個體，是每個個體的心理與行為，他們是龐大數據神經元的突觸。大數據的研究方法並不能完全取代以往的研究方法，大數據的網路實驗室也不能完全取代實體實驗室，只有關注「人」，只有堅持研究方法上的兼容並包，社會心理學才能在大數據時代獲得長足發展。

以上是小編為大家分享的關於大數據能為社會心理學帶來什麼的相關內容，更多信息可以關注環球青藤分享更多干貨

5. 社會心理學發展的現狀和趨勢

為了避免單因素解釋社會現象的局限，社會心理學與其他學科及社會各方面的聯系和整合更加緊密(Kruglanski, Chernikova, & Jasko, 2017)。研究方法的綜合化也日益顯著，金盛華(2010)指出，實證主義研究方法與人文主義研究方法並用是現代社會心理學重要的發展趨勢。大數據的使用也提升了社會心理學的預測功能，如清華大學彭凱平教授建立了「行為與大數據研究實驗室」、朱廷劭教授開發了「國人心理地圖」(吳甜甜，2016)，這些有價值的嘗試都將推動中國社會心理學向大數據時代邁進。

自歐洲社會心理學解構了美國主流社會心理學的地位以來，亞洲心理學發展也取得了長足進步。根據Kruglanski與Chernikova等人(2017)對JPSP文章數據的分析顯示，近年來，來自美國以外的作者數量穩步增長；跨文化心理學在最近幾十年裡越來越流行也是社會心理學日益全球化的標志。
另一方面，社會心理學研究的本土化也是包括我國在內的許多國家向西方主流社會心理學突圍的重要途徑。余國良(2014)主張中國的社會心理學研究需要充分發掘和培養自己的文化自覺，以本土化推動國際化，在理論建構、學科與學術共同體建設、國際合作等方面進行實質性突破。

6. 漫談大數據的思想形成與價值維度

漫談大數據的思想形成與價值維度

清華基於微博分析獲得的大數據幸福指數發現人們周六最幸福，相信大家心情不錯，因此今天不談枯燥的技術。關於大數據的思維、理念、方法論已經被反復消費了，本來我想直接進入交互環節，繼挺兄還是要求先有一部分規定動作，我就先自彈自唱幾十分鍾，既然是漫談，也不見得扣題，說到哪裡是哪裡。各位有問題，我可以擇時擇機插入討論。
先說大數據思想的形成吧。自從人類開始文字和數字，數據就開始產生。就數據增長曲線而言，極小的初值確實要經歷漫長的過程達到人類能感知的曲線拐點。谷歌前CEO埃里克·施密特曾給出了一個有趣的數據：從人類文明曙光初現到2003年一共產生的數據，只相當於2010年兩天產生的數據量。而一旦越過拐點，「大數據摩爾定律」的滾滾鐵輪下，指數效應爆發：最近兩年產生的數據量相當於之前產生的全部數據量。
在漫長的數據蓄水過程中，數學和統計學逐漸發展，人們開始注意對數據的量化分析，在人類進入信息時代以前這樣的例子就不勝枚舉。比如經濟上，黃仁宇先生對宋朝經濟的分析中發現了「數目字管理」(即定量分析)的廣泛應用(可惜王安石變法有始無終)。又如軍事，「向林彪學習數據挖掘」的橋段不論真假，其背後量化分析的思想無疑有其現實基礎，而這一基礎甚至可以回推到2000多年前，孫臏正是通過編造「十萬灶減到五萬灶再減到三萬灶」的數據、利用龐涓的量化分析習慣對其進行誘殺。
到上世紀50-60年代，磁帶取代穿孔卡片機，啟動了數據存儲的革命。磁碟驅動器隨即發明，它帶來的最大想像空間並不是容量，而是隨機讀寫的能力，這一下子解放了數據工作者的思維模式，開始數據的非線性表達和管理。資料庫應運而生，從層次型資料庫(IBM為阿波羅登月設計的層次型資料庫迄今仍在建行使用)，到網狀資料庫，再到現在通用的關系資料庫。與數據管理同時發源的是決策支持系統(DSS)，80年代演變到商業智能(BI)和數據倉庫，開辟了數據分析——也就是為數據賦予意義——的道路。
那個時代運用數據管理和分析最厲害的是商業。第一個數據倉庫是為寶潔做的，第一個太位元組的數據倉庫是在沃爾瑪。沃爾瑪的典型應用是兩個：一是基於retaillink的供應鏈優化，把數據與供應商共享，指導它們的產品設計、生產、定價、配送、營銷等整個流程，同時供應商可以優化庫存、及時補貨;二是購物籃分析，也就是常說的啤酒加尿布。關於啤酒加尿布，幾乎所有的營銷書都言之鑿鑿，我告訴大家，是Teradata的一個經理編的，人類歷史上從沒有發生過，但是，先教育市場，再收獲市場，它是有功的。
僅次於沃爾瑪的樂購(Tesco)，強在客戶關系管理(CRM)，細分客戶群，分析其行為和意圖，做精準營銷。
這些都發生在90年代。00年代時，科研產生了大量的數據，如天文觀測、粒子碰撞，資料庫大拿吉姆·格雷等提出了第四範式，是數據方法論的一次提升。前三個範式是實驗(伽利略從斜塔往下扔)，理論(牛頓被蘋果砸出靈感，形成經典物理學定律)，模擬(粒子加速太貴，核試驗太臟，於是乎用計算代替)。第四範式是數據探索。這其實也不是新鮮的，開普勒根據前人對行星位置的觀測數據擬合出橢圓軌道，就是數據方法。但是到90年代的時候，科研數據實在太多了，數據探索成為顯學。在現今的學科里，有一對孿生兄弟，計算XX學和XX信息學，前者是模擬/計算範式，後者是數據範式，如計算生物學和生物信息學。有時候計算XX學包含了數據範式，如計算社會學、計算廣告學。
2008年克里斯·安德森(長尾理論的作者)在《連線》雜志寫了一篇《理論的終結》，引起軒然大波。他主要的觀點是有了數據，就不要模型了，或者很難獲得具有可解釋性的模型，那麼模型所代表的理論也沒有意義了。跟大家說一下數據、模型和理論。大家先看個粗糙的圖。
首先，我們在觀察客觀世界中採集了三個點的數據，根據這些數據，可以對客觀世界有個理論假設，用一個簡化的模型來表示，比如說三角形。可以有更多的模型，如四邊形，五邊形。隨著觀察的深入，又採集了兩個點，這時發現三角形、四邊形的模型都是錯的，於是確定模型為五邊形，這個模型反映的世界就在那個五邊形里，殊不知真正的時間是圓形。
大數據時代的問題是數據是如此的多、雜，已經無法用簡單、可解釋的模型來表達，這樣，數據本身成了模型，嚴格地說，數據及應用數學(尤其是統計學)取代了理論。安德森用谷歌翻譯的例子，統一的統計學模型取代了各種語言的理論/模型(如語法)，能從英文翻譯到法文，就能從瑞典文翻譯到中文，只要有語料數據。谷歌甚至能翻譯克萊貢語(StarTrek里編出來的語言)。安德森提出了要相關性不要因果性的問題，以後舍恩伯格(下面稱之為老舍)只是拾人牙慧了。
當然，科學界不認同《理論的終結》，認為科學家的直覺、因果性、可解釋性仍是人類獲得突破的重要因素。有了數據，機器可以發現當前知識疆域裡面隱藏的未知部分。而沒有模型，知識疆域的上限就是機器線性增長的計算力，它不能擴展到新的空間。在人類歷史上，每一次知識疆域的跨越式拓展都是由天才和他們的理論率先吹起的號角。
2010年左右，大數據的浪潮捲起，這些爭論迅速被淹沒了。看谷歌趨勢，」bigdata」這個詞就是那個時間一下子躥升了起來。吹鼓手有幾家，一家是IDC，每年給EMC做digitaluniverse的報告，上升到澤位元組范疇(給大家個概念，現在硬碟是太位元組，1000太=1拍，阿里、Facebook的數據是幾百拍位元組，1000拍=1艾，網路是個位數艾位元組，谷歌是兩位數艾位元組，1000艾=1澤);一家是麥肯錫，發布《大數據：創新、競爭和生產力的下一個前沿》;一家是《經濟學人》，其中的重要寫手是跟老舍同著《大數據時代》的肯尼思?庫克耶;還有一家是Gartner，杜撰了3V(大、雜、快)，其實這3V在2001年就已經被編出來了，只不過在大數據語境里有了全新的詮釋。
咱們國內，歡總、國棟總也是在2011年左右開始呼籲對大數據的重視。
2012年子沛的書《大數據》教育政府官員有功。老舍和庫克耶的《大數據時代》提出了三大思維，現在已經被奉為圭臬，但千萬別當作放之四海而皆準的真理了。
比如要數據全集不要采樣。現實地講，1.沒有全集數據，數據都在孤島里;2.全集太貴，鑒於大數據信息密度低，是貧礦，投入產出比不見得好;3.宏觀分析中采樣還是有用的，蓋洛普用5000個樣本勝過幾百萬調查的做法還是有實踐意義;4.采樣要有隨機性、代表性，采訪火車上的民工得出都買到票的結論不是好采樣，現在只做固定電話采樣調查也不行了(行動電話是大頭)，在國外基於Twitter采樣也發現不完全具有代表性(老年人沒被包括);5.采樣的缺點是有百分之幾的偏差，更會丟失黑天鵝的信號，因此在全集數據存在且可分析的前提下，全量是首選。全量>好的采樣>不均勻的大量。
再說混雜性由於精確性。擁抱混雜性(這樣一種客觀現象)的態度是不錯的，但不等於喜歡混雜性。數據清洗比以前更重要，數據失去辨識度、失去有效性，就該扔了。老舍引用谷歌PeterNovig的結論，少數高質量數據+復雜演算法被大量低質量數據+簡單演算法打敗，來證明這一思維。Peter的研究是Web文本分析，確實成立。但谷歌的深度學習已經證明這個不完全對，對於信息維度豐富的語音、圖片數據，需要大量數據+復雜模型。
最後是要相關性不要因果性。對於大批量的小決策，相關性是有用的，如亞馬遜的個性化推薦;而對於小批量的大決策，因果性依然重要。就如中葯，只到達了相關性這一步，但它沒有可解釋性，無法得出是有些樹皮和蟲殼的因導致治癒的果。西葯在發現相關性後，要做隨機對照試驗，把所有可能導致「治癒的果」的干擾因素排除，獲得因果性和可解釋性。在商業決策上也是一樣，相關性只是開始，它取代了拍腦袋、直覺獲得的假設，而後面驗證因果性的過程仍然重要。
把大數據的一些分析結果落實在相關性上也是倫理的需要，動機不代錶行為。預測性分析也一樣，不然警察會預測人犯罪，保險公司會預測人生病，社會很麻煩。大數據演算法極大影響了我們的生活，有時候會覺得挺悲哀的，是演算法覺得了你貸不貸得到款，谷歌每調整一次演算法，很多在線商業就會受到影響，因為被排到後面去了。
下面時間不多了，關於價值維度，我貼一些以前講過的東西。大數據思想中很重要的一點是決策智能化之外，還有數據本身的價值化。這一點不贅述了，引用馬雲的話吧，「信息的出發點是我認為我比別人聰明，數據的出發點是認為別人比我聰明;信息是你拿到數據編輯以後給別人，而數據是你搜集數據以後交給比你更聰明的人去處理。」大數據能做什麼?價值這個V怎麼映射到其他3V和時空象限中?
再貼上解釋。「見微」與「知著」在Volume的空間維度。小數據見微，作個人刻畫，我曾用《一代宗師》中「見自己」形容之;大數據知著，反映自然和群體的特徵和趨勢，我以「見天地、見眾生」比喻之。「著」推動「微」(如把人群細分為buckets)，又拉動「微」(如推薦相似人群的偏好給個人)。「微」與「著」又反映了時間維度，數據剛產生時個人價值最大，隨著時間decay最後退化為以集合價值為主。
「當下」和「皆明」在Velocity的時間維度。當下在時間原點，是閃念之間的實時智慧，結合過往(負軸)、預測未來(正軸)，可以皆明，即獲得perpetual智慧。《西遊記》里形容真假孫悟空，一個是「知天時、通變化」，一個是「知前後、萬物皆明」，正好對應。為達到皆明，需要全量分析、預測分析和處方式分析(prescriptiveanalytics，為讓設定的未來發生，需要採取什麼樣的行動)。
「辨訛」和「曉意」在Variety的空間維度。基於大體量、多源異質的數據，辨訛過濾雜訊、查漏補缺、去偽存真。曉意達到更高境界，從非結構數據中提取語義、使機器能夠窺探人的思想境界、達到過去結構化數據分析不能達到之高度。
先看知著，對宏觀現象規律的研究早已有之，大數據的知著有兩個新特點，一是從采樣到全量，比如央視去年「你幸福嗎」的調查，是街頭的采樣，前不久《中國經濟生活大調查》關於幸福城市排名的結論，是基於10萬份問卷(17個問題)的采樣，而清華行為與大數據實驗室做的幸福指數(繼挺兄、我、還有多位本群群友參與)，是基於新浪微博數據的全集(托老王的福)，這些數據是人們的自然表達(而不是面對問卷時的被動應對)，同時又有上下文語境，因此更真實、也更有解釋性。北上廣不幸福，是因為空氣還是房價或教育，在微博上更容易傳播的積極情緒還是消極情緒，數據告訴你答案。《中國經濟生活大調查》說「再小的聲音我們都聽得見」，是過頭話，采樣和傳統的統計分析方法對數據分布採用一些簡化的模型，這些模型把異常和長尾忽略了，全量的分析可以看到黑天鵝的身影，聽到長尾的聲音。
另一個特點是從定性到定量。計算社會學就是把定量分析應用到社會學，已經有一批數學家、物理學家成了經濟學家、寬客，現在他們也可以選擇成為社會學家。國泰君安3I指數也是一個例子，它通過幾十萬用戶的數據，主要是反映投資活躍程度和投資收益水平的指標，建立一個量化模型來推知整體投資景氣度。
再看見微，我認為大數據的真正差異化優勢在微觀。自然科學是先宏觀、具體，進入到微觀和抽象，這時大數據就很重要了。我們更關注社會科學，那是先微觀、具體，再宏觀、抽象，許小年索性認為宏觀經濟學是偽科學。如果市場是個體行為的總和，我們原來看到是一張抽象派的畫，看不懂，通過客戶細分慢慢可以形成一張大致看得懂的現實圖景，不過是馬賽克的，再通過微分、甚至定位個人，形成高清圖。我們每一個人現在都生活在零售商的bucket中(前面說的樂購創造了這個概念)，最簡單的是高收入、低收入這類反映背景的，再有就是反映行為和生活方式的，如「精打細算」、「右鍵點擊一族」(使用右鍵的比較techsavvy)。反過來我們消費者也希望能夠獲得個性化的尊崇，Nobodywantstobenobodytoday。
了解並掌握客戶比以往任何時候都更重要。奧巴馬贏在大數據上，就是因為他知道西岸40-49歲女性的男神是喬治·克魯尼，東岸同樣年齡段女性的偶像則是莎拉·傑西卡·帕克(《慾望都市》的主角)，他還要更細分，搖擺州每一個郡每一個年齡段每一個時間段在看什麼電視，搖擺州(俄亥俄)1%選民隨時間變化的投票傾向，搖擺選民在Reddit上還是Facebook上，都在其掌握之中。
對於企業來說，要從以產品為中心，轉到以客戶(買單者)甚至用戶(使用者)為中心，從關注用戶背景到關注其行為、意圖和意向，從關注交易形成轉到關注每一個交互點/觸點，用戶是從什麼路徑發現我的產品的，決定之前又做了什麼，買了以後又有什麼反饋，是通過網頁、還是QQ、微博或是微信。
再講第三個，當下。時間是金錢，股票交易就是快魚吃慢魚，用免費股票交易軟體有幾秒的延遲，而佔美國交易量60-70%的高頻程序化交易則要發現毫秒級、低至1美分的交易機會。時間又是生命，美國國家大氣與海洋管理局的超級計算機在日本311地震後9分鍾發出海嘯預警，已經太晚。時間還是機會。現在所謂的購物籃分析用的其實並不是真正的購物籃，而是結帳完的小票，真正有價值的是當顧客還拎著購物籃，在瀏覽、試用、選擇商品的時候，在每一個觸點影響他/她的選擇。數據價值具有半衰期，最新鮮的時候個性化價值最大，漸漸退化到只有集合價值。當下的智慧是從刻舟求劍到見時知幾，原來10年一次的人口普查就是刻舟求劍，而現在東莞一出事網路遷徙圖就反映出來了。當然，當下並不一定是完全准確的，其實如果沒有更多、更久的數據，匆忙對網路遷徙圖解讀是可能陷入誤區的。
第四個，皆明。時間有限，就簡單說了。就是從放馬後炮到料事如神(predictiveanalytics)，從料事如神到運籌帷幄(prescriptiveanalytics)，只知道有東風是預測分析，確定要借箭的目標、並給出處方利用草船來借，就是處方性分析。我們現在要提高響應度、降低流失率、吸引新客戶，需要處方性分析。
辨訛就是利用多源數據過濾雜訊、查漏補缺和去偽存真。20多個省市的GDP之和超過全國的GDP就是一個例子，我們的GPS有幾十米的誤差，但與地圖數據結合就能做到精確，GPS在城市的高樓中沒有信號，可以與慣性導航結合。
曉意涉及到大數據下的機器智能，是個大問題，也不展開了。貼一段我的文章：有人說在涉及「曉意」的領域人是無法替代的。這在前大數據時代是事實。《點球成金(Moneyball)》講的是數量化分析和預測對棒球運動的貢獻，它在大數據背景下出現了傳播的誤區：一、它其實不是大數據，而是早已存在的數據思維和方法;二、它刻意或無意忽略了球探的作用。從讀者看來，奧克蘭競技隊的總經理比利·比恩用數量化分析取代了球探。而事實是，在運用數量化工具的同時，比恩也增加了球探的費用，軍功章里有機器的一半，也有人的一半，因為球探對運動員定性指標(如競爭性、抗壓力、意志力等)的衡量是少數結構化量化指標無法刻畫的。大數據改變了這一切。人的數字足跡的無意識記錄，以及機器學習(尤其是深度學習)曉意能力的增強，可能逐漸改變機器的劣勢。今年我們看到基於大數據的情感分析、價值觀分析和個人刻畫，當這些應用於人力資源，已經或多或少體現了球探承擔的作用。

以上是小編為大家分享的關於漫談大數據的思想形成與價值維度的相關內容，更多信息可以關注環球青藤分享更多干貨

7. 詳解大數據的思想如何形成與其價值維度

詳解大數據的思想如何形成與其價值維度
比如經濟上，黃仁宇先生對宋朝經濟的分析中發現了「數目字管理」(即定量分析)的廣泛應用(可惜王安石變法有始無終)。又如軍事，「向林彪學習數據挖掘」的橋段不論真假，其背後量化分析的思想無疑有其現實基礎，而這一基礎甚至可以回推到2000多年前，孫臏正是通過編造「十萬灶減到五萬灶再減到三萬灶」的數據、利用龐涓的量化分析習慣對其進行誘殺。
到上世紀50-60年代，磁帶取代穿孔卡片機，啟動了數據存儲的革命。磁碟驅動器隨即發明，它帶來的最大想像空間並不是容量，而是隨機讀寫的能力，這一下子解放了數據工作者的思維模式，開始數據的非線性表達和管理。資料庫應運而生，從層次型資料庫(IBM為阿波羅登月設計的層次型資料庫迄今仍在建行使用)，到網狀資料庫，再到現在通用的關系資料庫。與數據管理同時發源的是決策支持系統(DSS)，80年代演變到商業智能(BI)和數據倉庫，開辟了數據分析——也就是為數據賦予意義——的道路。

那個時代運用數據管理和分析最厲害的是商業。第一個數據倉庫是為寶潔做的，第一個太位元組的數據倉庫是在沃爾瑪。沃爾瑪的典型應用是兩個：一是基於retaillink的供應鏈優化，把數據與供應商共享，指導它們的產品設計、生產、定價、配送、營銷等整個流程，同時供應商可以優化庫存、及時補貨;二是購物籃分析，也就是常說的啤酒加尿布。關於啤酒加尿布，幾乎所有的營銷書都言之鑿鑿，我告訴大家，是Teradata的一個經理編的，人類歷史上從沒有發生過，但是，先教育市場，再收獲市場，它是有功的。
僅次於沃爾瑪的樂購(Tesco)，強在客戶關系管理(CRM)，細分客戶群，分析其行為和意圖，做精準營銷。
這些都發生在90年代。00年代時，科研產生了大量的數據，如天文觀測、粒子碰撞，資料庫大拿吉姆·格雷等提出了第四範式，是數據方法論的一次提升。前三個範式是實驗(伽利略從斜塔往下扔)，理論(牛頓被蘋果砸出靈感，形成經典物理學定律)，模擬(粒子加速太貴，核試驗太臟，於是乎用計算代替)。第四範式是數據探索。這其實也不是新鮮的，開普勒根據前人對行星位置的觀測數據擬合出橢圓軌道，就是數據方法。但是到90年代的時候，科研數據實在太多了，數據探索成為顯學。在現今的學科里，有一對孿生兄弟，計算XX學和XX信息學，前者是模擬/計算範式，後者是數據範式，如計算生物學和生物信息學。有時候計算XX學包含了數據範式，如計算社會學、計算廣告學。
2008年克里斯·安德森(長尾理論的作者)在《連線》雜志寫了一篇《理論的終結》，引起軒然大波。他主要的觀點是有了數據，就不要模型了，或者很難獲得具有可解釋性的模型，那麼模型所代表的理論也沒有意義了。跟大家說一下數據、模型和理論。大家先看個粗糙的圖。
首先，我們在觀察客觀世界中採集了三個點的數據，根據這些數據，可以對客觀世界有個理論假設，用一個簡化的模型來表示，比如說三角形。可以有更多的模型，如四邊形，五邊形。隨著觀察的深入，又採集了兩個點，這時發現三角形、四邊形的模型都是錯的，於是確定模型為五邊形，這個模型反映的世界就在那個五邊形里，殊不知真正的時間是圓形。
大數據時代的問題是數據是如此的多、雜，已經無法用簡單、可解釋的模型來表達，這樣，數據本身成了模型，嚴格地說，數據及應用數學(尤其是統計學)取代了理論。安德森用谷歌翻譯的例子，統一的統計學模型取代了各種語言的理論/模型(如語法)，能從英文翻譯到法文，就能從瑞典文翻譯到中文，只要有語料數據。谷歌甚至能翻譯克萊貢語(StarTrek里編出來的語言)。安德森提出了要相關性不要因果性的問題，以後舍恩伯格(下面稱之為老舍)只是拾人牙慧了。
當然，科學界不認同《理論的終結》，認為科學家的直覺、因果性、可解釋性仍是人類獲得突破的重要因素。有了數據，機器可以發現當前知識疆域裡面隱藏的未知部分。而沒有模型，知識疆域的上限就是機器線性增長的計算力，它不能擴展到新的空間。在人類歷史上，每一次知識疆域的跨越式拓展都是由天才和他們的理論率先吹起的號角。
2010年左右，大數據的浪潮捲起，這些爭論迅速被淹沒了。看谷歌趨勢，」bigdata」這個詞就是那個時間一下子躥升了起來。吹鼓手有幾家，一家是IDC，每年給EMC做digitaluniverse的報告，上升到澤位元組范疇(給大家個概念，現在硬碟是太位元組，1000太=1拍，阿里、Facebook的數據是幾百拍位元組，1000拍=1艾，網路是個位數艾位元組，谷歌是兩位數艾位元組，1000艾=1澤);一家是麥肯錫，發布《大數據：創新、競爭和生產力的下一個前沿》;一家是《經濟學人》，其中的重要寫手是跟老舍同著《大數據時代》的肯尼思？庫克耶;還有一家是Gartner，杜撰了3V(大、雜、快)，其實這3V在2001年就已經被編出來了，只不過在大數據語境里有了全新的詮釋。
咱們國內，歡總、國棟總也是在2011年左右開始呼籲對大數據的重視。
2012年子沛的書《大數據》教育政府官員有功。老舍和庫克耶的《大數據時代》提出了三大思維，現在已經被奉為圭臬，但千萬別當作放之四海而皆準的真理了。
比如要數據全集不要采樣。現實地講，1.沒有全集數據，數據都在孤島里;2.全集太貴，鑒於大數據信息密度低，是貧礦，投入產出比不見得好;3.宏觀分析中采樣還是有用的，蓋洛普用5000個樣本勝過幾百萬調查的做法還是有實踐意義;4.采樣要有隨機性、代表性，采訪火車上的民工得出都買到票的結論不是好采樣，現在只做固定電話采樣調查也不行了(行動電話是大頭)，在國外基於Twitter采樣也發現不完全具有代表性(老年人沒被包括);5.采樣的缺點是有百分之幾的偏差，更會丟失黑天鵝的信號，因此在全集數據存在且可分析的前提下，全量是首選。全量>好的采樣>不均勻的大量。
再說混雜性由於精確性。擁抱混雜性(這樣一種客觀現象)的態度是不錯的，但不等於喜歡混雜性。數據清洗比以前更重要，數據失去辨識度、失去有效性，就該扔了。老舍引用谷歌PeterNovig的結論，少數高質量數據+復雜演算法被大量低質量數據+簡單演算法打敗，來證明這一思維。Peter的研究是Web文本分析，確實成立。但谷歌的深度學習已經證明這個不完全對，對於信息維度豐富的語音、圖片數據，需要大量數據+復雜模型。
最後是要相關性不要因果性。對於大批量的小決策，相關性是有用的，如亞馬遜的個性化推薦;而對於小批量的大決策，因果性依然重要。就如中葯，只到達了相關性這一步，但它沒有可解釋性，無法得出是有些樹皮和蟲殼的因導致治癒的果。西葯在發現相關性後，要做隨機對照試驗，把所有可能導致「治癒的果」的干擾因素排除，獲得因果性和可解釋性。在商業決策上也是一樣，相關性只是開始，它取代了拍腦袋、直覺獲得的假設，而後面驗證因果性的過程仍然重要。
把大數據的一些分析結果落實在相關性上也是倫理的需要，動機不代錶行為。預測性分析也一樣，不然警察會預測人犯罪，保險公司會預測人生病，社會很麻煩。大數據演算法極大影響了我們的生活，有時候會覺得挺悲哀的，是演算法覺得了你貸不貸得到款，谷歌每調整一次演算法，很多在線商業就會受到影響，因為被排到後面去了。
下面時間不多了，關於價值維度，我貼一些以前講過的東西。大數據思想中很重要的一點是決策智能化之外，還有數據本身的價值化。這一點不贅述了，引用馬雲的話吧，「信息的出發點是我認為我比別人聰明，數據的出發點是認為別人比我聰明;信息是你拿到數據編輯以後給別人，而數據是你搜集數據以後交給比你更聰明的人去處理。」大數據能做什麼？價值這個V怎麼映射到其他3V和時空象限中？我畫了個圖：
再貼上解釋。「見微」與「知著」在Volume的空間維度。小數據見微，作個人刻畫，我曾用《一代宗師》中「見自己」形容之;大數據知著，反映自然和群體的特徵和趨勢，我以「見天地、見眾生」比喻之。「著」推動「微」(如把人群細分為buckets)，又拉動「微」(如推薦相似人群的偏好給個人)。「微」與「著」又反映了時間維度，數據剛產生時個人價值最大，隨著時間decay最後退化為以集合價值為主。
「當下」和「皆明」在Velocity的時間維度。當下在時間原點，是閃念之間的實時智慧，結合過往(負軸)、預測未來(正軸)，可以皆明，即獲得perpetual智慧。《西遊記》里形容真假孫悟空，一個是「知天時、通變化」，一個是「知前後、萬物皆明」，正好對應。為達到皆明，需要全量分析、預測分析和處方式分析(prescriptiveanalytics，為讓設定的未來發生，需要採取什麼樣的行動)。
「辨訛」和「曉意」在Variety的空間維度。基於大體量、多源異質的數據，辨訛過濾雜訊、查漏補缺、去偽存真。曉意達到更高境界，從非結構數據中提取語義、使機器能夠窺探人的思想境界、達到過去結構化數據分析不能達到之高度。
先看知著，對宏觀現象規律的研究早已有之，大數據的知著有兩個新特點，一是從采樣到全量，比如央視去年「你幸福嗎」的調查，是街頭的采樣，前不久《中國經濟生活大調查》關於幸福城市排名的結論，是基於10萬份問卷(17個問題)的采樣，而清華行為與大數據實驗室做的幸福指數(繼挺兄、我、還有多位本群群友參與)，是基於新浪微博數據的全集(托老王的福)，這些數據是人們的自然表達(而不是面對問卷時的被動應對)，同時又有上下文語境，因此更真實、也更有解釋性。北上廣不幸福，是因為空氣還是房價或教育，在微博上更容易傳播的積極情緒還是消極情緒，數據告訴你答案。《中國經濟生活大調查》說「再小的聲音我們都聽得見」，是過頭話，采樣和傳統的統計分析方法對數據分布採用一些簡化的模型，這些模型把異常和長尾忽略了，全量的分析可以看到黑天鵝的身影，聽到長尾的聲音。
另一個特點是從定性到定量。計算社會學就是把定量分析應用到社會學，已經有一批數學家、物理學家成了經濟學家、寬客，現在他們也可以選擇成為社會學家。國泰君安3I指數也是一個例子，它通過幾十萬用戶的數據，主要是反映投資活躍程度和投資收益水平的指標，建立一個量化模型來推知整體投資景氣度。
再看見微，我認為大數據的真正差異化優勢在微觀。自然科學是先宏觀、具體，進入到微觀和抽象，這時大數據就很重要了。我們更關注社會科學，那是先微觀、具體，再宏觀、抽象，許小年索性認為宏觀經濟學是偽科學。如果市場是個體行為的總和，我們原來看到是一張抽象派的畫，看不懂，通過客戶細分慢慢可以形成一張大致看得懂的現實圖景，不過是馬賽克的，再通過微分、甚至定位個人，形成高清圖。我們每一個人現在都生活在零售商的bucket中(前面說的樂購創造了這個概念)，最簡單的是高收入、低收入這類反映背景的，再有就是反映行為和生活方式的，如「精打細算」、「右鍵點擊一族」(使用右鍵的比較techsavvy)。反過來我們消費者也希望能夠獲得個性化的尊崇，Nobody wants to be nobody today。
了解並掌握客戶比以往任何時候都更重要。奧巴馬贏在大數據上，就是因為他知道西岸40-49歲女性的男神是喬治·克魯尼，東岸同樣年齡段女性的偶像則是莎拉·傑西卡·帕克(《慾望都市》的主角)，他還要更細分，搖擺州每一個郡每一個年齡段每一個時間段在看什麼電視，搖擺州(俄亥俄)1%選民隨時間變化的投票傾向，搖擺選民在Reddit上還是Facebook上，都在其掌握之中。
對於企業來說，要從以產品為中心，轉到以客戶(買單者)甚至用戶(使用者)為中心，從關注用戶背景到關注其行為、意圖和意向，從關注交易形成轉到關注每一個交互點/觸點，用戶是從什麼路徑發現我的產品的，決定之前又做了什麼，買了以後又有什麼反饋，是通過網頁、還是QQ、微博或是微信。
再講第三個，當下。時間是金錢，股票交易就是快魚吃慢魚，用免費股票交易軟體有幾秒的延遲，而佔美國交易量60-70%的高頻程序化交易則要發現毫秒級、低至1美分的交易機會。時間又是生命，美國國家大氣與海洋管理局的超級計算機在日本311地震後9分鍾發出海嘯預警，已經太晚。時間還是機會。現在所謂的購物籃分析用的其實並不是真正的購物籃，而是結帳完的小票，真正有價值的是當顧客還拎著購物籃，在瀏覽、試用、選擇商品的時候，在每一個觸點影響他/她的選擇。數據價值具有半衰期，最新鮮的時候個性化價值最大，漸漸退化到只有集合價值。當下的智慧是從刻舟求劍到見時知幾，原來10年一次的人口普查就是刻舟求劍，而現在東莞一出事網路遷徙圖就反映出來了。當然，當下並不一定是完全准確的，其實如果沒有更多、更久的數據，匆忙對網路遷徙圖解讀是可能陷入誤區的。
第四個，皆明。時間有限，就簡單說了。就是從放馬後炮到料事如神(predictiveanalytics)，從料事如神到運籌帷幄(prescriptiveanalytics)，只知道有東風是預測分析，確定要借箭的目標、並給出處方利用草船來借，就是處方性分析。我們現在要提高響應度、降低流失率、吸引新客戶，需要處方性分析。
辨訛就是利用多源數據過濾雜訊、查漏補缺和去偽存真。20多個省市的GDP之和超過全國的GDP就是一個例子，我們的GPS有幾十米的誤差，但與地圖數據結合就能做到精確，GPS在城市的高樓中沒有信號，可以與慣性導航結合。
曉意涉及到大數據下的機器智能，是個大問題，也不展開了。貼一段我的文章：有人說在涉及「曉意」的領域人是無法替代的。這在前大數據時代是事實。《點球成金(Moneyball)》講的是數量化分析和預測對棒球運動的貢獻，它在大數據背景下出現了傳播的誤區：一、它其實不是大數據，而是早已存在的數據思維和方法;二、它刻意或無意忽略了球探的作用。從讀者看來，奧克蘭競技隊的總經理比利·比恩用數量化分析取代了球探。而事實是，在運用數量化工具的同時，比恩也增加了球探的費用，軍功章里有機器的一半，也有人的一半，因為球探對運動員定性指標(如競爭性、抗壓力、意志力等)的衡量是少數結構化量化指標無法刻畫的。大數據改變了這一切。人的數字足跡的無意識記錄，以及機器學習(尤其是深度學習)曉意能力的增強，可能逐漸改變機器的劣勢。今年我們看到基於大數據的情感分析、價值觀分析和個人刻畫，當這些應用於人力資源，已經或多或少體現了球探承擔的。

8. 高校實驗室大數據開發平台建設方案

大數據人才應用能力成長平台——Tempo Talents，從產業人才需求的視角，通過模式創新、技術創新，為高校大數據人才培養提供從平台、課程內容到教學管理的系統解決方案。平台核心圍繞「人才應用能力培養」，以實踐為基礎，將大數據人才培養所需的知識、技能和方法論三個層面互相融合，核心是通過學生動手實踐，培養數據思維及解決問題的能力。

5、激發學生學習熱情，打造「自驅型」能力成長平台

闖關、競賽、自主探索的數據游樂場，打破傳統的學習模式，打造專業與趣味性融合的學習體驗，充分激發學生自主學習熱情，打造「自驅型」能力成長平台。

9. 行為分析系統實驗室誰給介紹下,或者哪家有

津發集團為大家提供各種心理學實驗室設備,想要了解更多資訊，請來http://www.kingfar.net獲取更多資料.
【方案背景】

越來越多的科學家，在觀察行為的同時，也希望了解受測者的心跳、腦波、體溫等多重生理信號、甚至眼球的軌跡及面部的表情等，而這些表徵與現象，並不能通過傳統的行為觀察來獲取這方面的訊息。通過同步行為數據、生理心理、認知神經、眼動軌跡等精確的實驗數據支撐，對人的行為以及心理做到真正意義的多重科學分析。

津發科儀顛覆了中國大陸多年來傳統的行為分析實驗室解決方案（音、視頻採集及監控），提出了在行為信號採集的同時，同步觀察受測者的心跳、腦波、體溫等多重生理信號、甚至腦事件相關電位EEG/ERP、臉部表情及眼球軌跡、腦磁圖等認知神經信號；而這些表徵與現象，並不能通過傳統的行為觀察來獲取。

津發科儀結合了這種劃時代的概念，可以在行為觀察採集的同時，同步觸動其他相關的影象（災難情景再現）、腦事件相關電位（EEG/ ERP）、眼動軌跡與面部表情、多參數生理信號等系統，並且與往常行為分析實驗室最大的不同就是通過行為分析系統及腦、眼部面部表情、生理參數等多重參數進行數據的統計分析，與分析時整合所有信息與同一熒幕畫面中，達到行為觀察的同時，也了解其他相關的信息與同一時間點的反應，達到真正科學的進行多重分析的目的。

【系統構成】

運動行為觀察分析實驗室系統構成：考慮將來的遠程行為數據採集以及生理信號採集系統的擴展性

【實驗用途】

測量不同情緒刺激（應激）條件下被試應激的行為以及心理、生理變化。該系統主要用於行為科學與生理心理學、認知神經科學等實驗研究。

行為採集記錄系統：

觀察室中人員的活動、面部表情可以被清晰的記錄在計算機里

觀察室中人員聲音可以被清晰的記錄在計算機里

監控室人員能夠和觀察室人員對話

生理信號採集系統：

觀察室中人員腦認知神經、眼動軌跡、生理指標、情況可以被准確的記錄在計算機里

1、觀察室有腦事件相關電位感測器、生理信號採集感測器及眼動軌跡、臉部表情追蹤系統。

2、控制室有生理信號分析系統、眼動軌跡追蹤、腦事件相關電位等的分析系統。

【行為實驗室主要用途】
1) 應用心理學、發展心理學、社會心理學等心理學專業，開展行為教學實驗與研究。
2) 模擬情境中的決策行為、從眾行為、合作行為等社會、經濟行為教學實驗與研究。
3) 人員的評估、培訓與選拔等人力資源管理行為的教學實驗與研究
4) 心理訓練；行為矯正。

【實驗室功能】

1) 能夠通過實時記錄被觀察人員的行為動作語言、面部表情結合同步採集的腦認知神經、眼動軌跡、生理信號等數據，利用計算機對採集的數據進行數字化處理，以達到對行為進行客觀的分析和研究。
2) 可以通過圖像、語音、或者虛擬現實VR設計營造特定的情境，實時分析在當前刺激條件下被試人員的數據，以達到對行為進行客觀的分析和研究。
3)兼顧互動教學與培訓

【實驗原理】

腦事件相關電位實驗原理：

科學家通常把從事心理活動的腦比喻為一個黑匣子，EEG/ERP（事件相關電位，event-related potentials）的研究在探索這個黑匣子的奧秘中起著不可或卻的重要作用。近年來，隨著認知神經科學和心理科學研究的突飛猛進，EEG/ERP研究更是受到心理與腦科學界更為廣泛的關注。認知神經科學是側重於研究認知過程神經機制的交叉學科，而ERP的優勢正是具有很高的時間解析度（微秒-毫秒），此外，ERP便於與傳統的心理測量指標－反應時有機地配合，進行認知過程研究，且具有無創性，可以精確地評價發生在腦內的認知加工活動。同時，Neuroscan256 導EEG/ERP設備的應用，也很好地解決了其空間解析度的局限，是科學工作者進行認知神經科學的教學和研究的最得力、最有效的方法和手段

眼動軌跡追蹤系統實驗原理：

通過考察人的眼球運動來研究人的心理活動，通過分析記錄到的眼動數據來探討眼動與人的心理活動的關系。眼動儀的問世為心理學家利用眼動技術（eye movement technique）探索人在各種不同條件下的視覺信息加工機制，觀察其與心理活動直接或間接奇妙而有趣的關系，提供了新的有效工具。利用眼動儀進行心理學研究常用的資料或參數主要包括：注視點軌跡圖、眼動時間、眼跳方向（DIRECTION）的平均速度(AVERAGE VELOCITY)時間和距離（或稱幅度AMPLITUDE）、瞳孔（PUPIL）大小（面積或直徑，單位象素pixel）和眨眼（Blink）。
眼動的時空特徵是視覺信息提取過程中的生理和行為表現，它與人的心理活動有著直接或間接的關系，這也是許多心理學家致力於眼動研究的原因所在。

生理信號採集分析系統實驗原理：

除生物電信號外，其它生理信號均需經換能器轉換成電信號後，才能輸入計算機進行處理。通過生理信號採集分析系統的感測器把各種類型的生理信號換成電信號，經放大器、濾波器處理。A/D轉換器將連續變化的電信號轉換成計算機可以接受的離散數字信號，由計算機對所收集的數據進行復雜的數字運算，並且協調系統各部分的工作。最後，處理後的信息在記錄設備上作長期記錄，對人的心情狀況進行分析。

行為分析系統實驗室原理：

研究人類行為的標准工具，可用來記錄分析被研究對象的動作，姿勢，運動，位置，表情，情緒，社會交往，人機交互等各種活動；記錄被研究對象各種行為發生的時刻、發生的次數和持續的時間，然後進行統計處理，得到分析報告。

【實驗過程】

首先給被試帶上所有的心理測試設備（認知神經研究的腦事件相關電位系統及眼部臉部追蹤系統、多參數的生理記錄採集設備、生物反饋儀、心理測試儀等），在災難應激行為模擬實驗室中，將提前製作好刺激材料（或者模擬場景）通過顯示設備呈現給被試，同時記錄計算機對採集來的多重信息進行記錄，並通過軟體呈現在監視設備上。如果峰值變化比大，表示被試看到某張圖象或經歷某種場景時情緒比較緊張。。。。等等，可以由學校老師自己根據實際情況編寫。

【物理空間】

實驗室根據功能不同分為行為觀察實驗室（觀察區）、行為分析實驗室（控制區），控制區和觀察區通過單向玻璃完全隔離。

【參加人數】

可以滿足多人的行為觀察與分析。

【環境要求】
推薦地面鋪設地板磚，避免採用引起較大走動聲音的架空地板。能對溫度、濕度和光線進行控制調節，如環境噪音不是特別影響試驗，牆體以普通白牆為宜，避免過於突出分散被試注意力

10. 大數據室如何應用的有什麼大數據平台的推薦呢

大數據如何應用到各個行業，需要根據企業需求進行定製化互聯網解決方案。應用的行業也非常的廣泛的，有工程機械行業、紡織行業等等。工業大數據平台可以選徐工信息漢雲這類有硬實力和方案定製軟實力的品牌。隨著5G快速普及，徐工信息漢雲也將幫助更多企業釋放物聯網大數據的潛能，帶領行業一起跨入5G時代。

導航:首頁 > 網路數據 > 行為與大數據實驗室

行為與大數據實驗室

與行為與大數據實驗室相關的資料

友情鏈接