导航:首页 > 网络数据 > 行为与大数据实验室

行为与大数据实验室

发布时间:2022-09-17 06:56:23

1. 社会心理学选修课论文2000字(2)

社会心理学论文2000字篇三
《中国当代社会心理学发展的新方向》

1 国内外社会心理学研究现状对比

1.1 国外社会心理学研究现状

近几年,国外社会心理学领域正迅速扩展。2010年至今,发表在国外学术理论期刊上的有关社会心理学的文章有9000多篇。研究主题按频次排列包括刻板印象、社会互动、归因、态度、社会群体、情感、动机、个性、群体认同、偏见、归属、自尊、社会地位、道德等。需要注意的是,国际社会心理学的研究越来越注重文化和性别因素的影响,对社会认知、社会知觉、自我认识、态度改变、从众行为、团体过程、人际吸引、社会支持、亲社会行为、攻击行为以及偏见等方面的性别和文化差异进行了大量的研究。例如不同文化中的整体性和分析性思维、使用社会神经科学的方法研究归因中的文化差异、自利归因的文化差异等。

此外,近5年国外社会心理学研究的应用性更强、内容更细,主要涉及5个模块,健康管理、组织管理、环境研究、法律和 市场营销 等方面。健康管理模块主要包括心理社会因素对健康的影响,如负性生活事件、知觉压力、刻板印象威胁、社会支持等,其涉及的病症包括癌症和心血管疾病等。组织管理模块主要涉及激励与员工心理、领导胜任力、组织文化。性别与 领导力 方面,提出了一些新的理论,如“玻璃悬崖”(glass cliffs)理论。关于环境研究,阿伦森(2014)在其《社会心理学》(第八版)中将这一模块称为“人类的可持续未来”,涉及内容包括噪音、污染、拥挤对个体心理的影响,以及环境保护等。法律模块主要涉及目击者证词、陪审团的集体决策过程。

例如邦德(Bond)和德保罗(DePaulo)在2008年做的关于判别谎言的个体差异研究,以及格拉尔茨(Geraerts)等人2007年做的关于恢复性记忆的研究。此外,市场营销在近几年成为了社会心理学研究的 热点 ,Ivanic等人(2014)通过实验的方法探究了广播员的口音所形成的刻板印象对听众评估电台 广告 的可信度、听众对广播员的态度和听众购买广告产品或服务的可能性的影响作用,Malhotra等人(2007)则通过在英国四个呼叫中心大规模的问卷调查内在或外在奖励与员工情感性、规范性和持久性承诺之间的联系,Osman等人(2015)同样通过问卷调查的方式研究态度、情感评价和习惯养成对模式选择行为的影响。

研究方法方面,除了传统的观察法、相关法、实验法和元分析等研究方法,国外社会心理学领域兴起了一些新的研究方法,如跨文化研究、进化心理学和社会神经科学,例如哈蒙?琼斯(Harmon-Jones)关于失调和减少失调时脑活动差异的实验。

纵览近5年的社会心理学研究,可以发现,实验研究成为了国外社会心理学的主要研究方法,在国外社会心理学领域中愈发受到重视与推崇。但大量采用实验的方法进行社会心理学研究存在诸多的缺陷。早在20世纪末,Aroldo Rodrigues和Robert V.Levine(1999)就发表了“反思实验社会心理学发展的100年”的文章,并对实验社会心理学进行了批判和反思。

1.2 国内社会心理学研究现状

以中国知网为例,2010年至今,国内有关社会心理学的研究有260多篇,2014年出现明显激增,从2013年的48篇到2014年的89篇,以乐国安、张世富和俞国良、叶浩生等学者为主要代表。国内并没有专门的社会心理学刊物,就近5年中国健康心理学杂志在社会心理学方面的文章看,国内社会心理学研究的内容主要包括社会支持、情绪情感、性别角色、主观幸福感、从众行为、学习或职业倦怠、网络成瘾和压力等,7成以上研究的对象均为大学生。国内社会心理研究多使用相关法和实验法,其中,相关法使用更为频繁。

尽管已经历30多年的发展,但对比国外社会心理学的成熟与迅速扩展,国内社会心理学的研究虽有部分理论和测量工具方面的创新,但无论是从量上还是质上都远远不足,研究对象局限,研究方法落后,研究内容多照搬国外研究,研究结果信效度存在质疑(例如研究结果无法重复)。此外,我国社会心理学的发展还面临着诸多 其它 的问题,例如评价标准模糊、欠缺有效研究工具,以及教学科研体系不完善等。可以说,整体而言,我国社会心理学的发展仍处于“摸索阶段”。

2 当代社会心理学研究中的问题

2.1 研究对象

无论是国内还是国外,研究人员在对象的选择上都倾向于采取方便取样的方式,其中,大学生最受青睐。为了取样的便利性,研究人员通常会通过相熟的老师或同学将某一班级的学生作为研究被试,类似这样的情况屡见不鲜,在心理学本科大学生中最为普遍。这种做法不仅会降低研究的外部效度,还会面临伦理问题,如被试参与实验可能是迫于压力而非自愿、保密性和匿名性受到威胁、被试面对某些特殊问题时隐瞒实情或服从研究者目的等(高华, 2009)。从长远的角度看,这种做法会对社会心理学研究的广度和应用价值造成不良影响,也不利于中国社会心理学学科体系的整体发展。

2.2 研究方法

国外社会心理学的研究过度强调实证主义,实验研究泛滥。主流的社会心理学为了量化社会行为的研究,把社会行为孤立在实验室中,观察环境变量和行为之间的关系。然而,社会心理现象实则难以数量化和操作化,例如幽默、攻击和顺从等。这些社会行为的定义随文化情境的不同而不同,根本无法精确的测量(叶浩生,2004)。其二,社会心理学的研究对象是人,不是自然科学研究的物。人是特定社会历史时期社会协商和建构的产物,受文化历史因素的塑造和影响。因此,社会心理学实验的研究结论只适用于某一特定的文化历史背景,是相对的。其三,用单一因素来解释社会心理学现象是很困难的,而且一些因素往往成为其他因素或行为的调节变量或中介变量(刘长江,2007)。面临着方法上的窘境,国外社会心理学界自20世纪末就已经开始了反思,并尝试探索新的研究之路。而国内远远没有跟上这一步伐,大多是根据国外已有的研究成果和数据进行理论上的探索与批判。

2.3 研究内容

对比国外社会心理学的研究,中国当代社会心理学的研究缺乏稳固的本土化理论根基和理论框架。许波认为,在中国悠久的历史长河中,儒、道、佛三家思想相拒而相和,儒家又久居我国国家意识形态的主流学派之位,拥有着浓厚伦理色彩的儒家心理学也就成为中国本土传统心理学主要的思想和理论根基(许波,2005)。而彭艳琴则认为,有着上千年发展历史的佛教专门研究的就是如何解决人的精神问题(彭彦琴,2011)。还有一些学者认为,道家文化对于缓解人们心理压力有着不可忽视的作用(周慧和陈萍,2005)。在关于本土社会心理学的研究中,心理学家们试图找出各家思想中一切与心理学相关之处,而这种做法实则非常盲目,且很可能陷入重复做工的境地。

从古至今,中国思想学术流派何其多,每个派别又有各自繁杂的理论观点。但这些观点并非完全独立,以儒、佛、道三教为例,自佛教传入中国后,三教在新的社会环境中出于生存、发展的共同需要而相互融摄、相互渗透、相互补充,在思想层面上开始了深层的、广泛的、有机的融合,逐渐形成了以儒学为主体,佛、道为辅翼的“三教合一”的思想文化格局(张玉璞,2011)。因此,在进行社会心理学研究之前,若先对中国百家的思想理论进行归纳、整合和提炼,推进中国社会心理学理论框架的构建,研究则会事半功倍,研究的系统性和效率也会大大提高。

2.4 研究工具及评价体系

发展至今,仍有不在少数的心理学家们将西方心理学的研究量表直接移植到我国社会心理学研究之中,或是只对西方量表进行本土化的修订或制作。而中国的社会心理学区别于西方心理学,其人文性质更为浓厚,其中许多观点都带有极强的价值规范性和理想主义色彩。这种急于用问卷和量表来证明研究假设的做法表明,我国社会心理学的研究从原理、策略、工具到评价标准都仍未摆脱西方的定量思维的桎梏。因此,推进西方量表的本土化、开发具有中国特色的测量工具和建立有效的评价体系是我国社会心理学发展的当务之急。

2.5 学科建设

在当前的教学科研体系中,我国社会心理学与西方相比,处于明显的弱势地位。从教材、课程设置、师资配备、科研基金项目设置到人才培养目标,整个中国心理学体系仍是以西方心理学为主导(汪新建和柴民权,2014)。这样直接导致学生对我国本土的社会心理学研究缺乏了解和兴趣,从而间接阻碍了本土社会心理学的研究和发展。因此,要推动我国社会心理学的发展,就必须改变教学科研体系的现状,推进教材的编制、改变原有的课程和科研基金项目设置,并培养和引进中国社会心理学人才。

3 中国当代社会心理学研究的新方向

3.1 回归现实问题,构建稳固的理论基础和理论框架

在美国,社会心理学的学科地位比较高,这主要源自于其应用价值为美国社会做出的实际贡献。美国的社会心理学研究问题意识非常强烈,其研究成果的应用性也非常高,因此受到了美国政府和民众的高度拥护。而国内的社会心理学研究则一直未摆脱西方思想的限制,也未形成基于我国本土特色的、稳固的理论基础,而多是将国外已有的研究和结果生搬硬套到国内。因此,从中国人的社会心理和文化出发,对中国百家的思想理论进行归纳、整合和提炼,推进中国社会心理学理论框架的构建是必然而紧迫的。而就近5年的文献发表情况看,我国社会心理学的研究也更多地从现实问题入手,为提高研究的应用价值而努力。

3.2 研究方法的变革及大数据的使用

以往的社会心理学通常基于问卷、数据统计、抽样调查和实验室研究分析心理数据,而在大数据时代,真实、准确、及时的大数据样本将为社会心理学研究方法的变革带来崭新机遇。借助大数据,社会心理学能够在很大程度上摆脱对实体实验室的依赖,最大限度、最为高效地扩充潜在的研究对象,使社会心理学的研究不再只局限于实验室小样本或问卷调查采集的随机样本,从而面向尽可能全面的数据、趋近于总体的样本,这就使社会心理学的研究基础发生了翻天覆地的变化。与此同时,大数据还能够为社会心理学的研究提供更为多样化、异质化的样本,并使研究者摆脱时间、空间的限制,尽可能避免社会期许效应,最大程度规避研究对象在测试过程中受到的各种复杂、无关干扰。

在我国,已有不少学者投身大数据的洪流,利用新的研究方法开展社会心理学研究。例如,清华大学彭凯平教授建立了“行为与大数据研究实验室”、中国科学院心理学研究所蔡华俭教授创建了“云端心理实验室”、朱廷劭教授基于大数据开发了“国人心理地图”,这些有价值的尝试都将带动中国社会心理学朝向大数据时代迈进。

3.3 社会心理学理论的整合及文化视角

为了构建多维度、多视角的社会心理学理论,近年来,社会心理学愈发趋向于吸纳其他学科的观点,例如社会认同理论中对群体冲突的研究借鉴了经济学中的博弈理论,社会类化理论中对群体偏见等研究则运用了政治学和法学理论,以及创新性地将社会心理学理论建立在神经机制的解释上而形成的社会认知神经科学。不同的理论之间相互碰撞、交织、融合,逐渐形成了社会心理学理论的整合趋势,并推进了社会心理学的纵深发展,包括现代社会心理学与传统社会心理学的整合,以及社会心理学与其他科学理论的整合(黄雪娜,金盛华,& 盛瑞鑫,2010)。

传统的社会心理学试图靠拢自然科学,建立具有普世性的理论模型,超越时间、历史、文化,而适用于一切人类。但多年的实践证明,社会心理学的理论必须植根于特定的社会文化背景之中,不同的社会文化背景会影响人类深层的心理学结构。未来的社会心理研究会更为关注社会心理行为的文化差异,文化视角将愈发频繁地出现在社会心理学的理论构建和具体的研究中。

猜你喜欢:

1. 社会心理学论文3000字

2. 大学生心理学论文1500字

3. 浅谈社会心理学的相关论文

4. 大学社会心理学论文范本

2. 安博教育的大数据实验室是做什么的

“安博大数据实验室”是集教学、实验和培训于一体的大数据教学实验及科研平台,包括专数据挖属掘、大数据分析和大数据可视化平台。立足于当前大数据行业背景,集业界最前沿的大数据应用,“安博大数据实验室”旨在将各企业大数据应用项目引入到学校课堂,通过将大数据平台和智能化运营管理有效结合,全面落实“产、学、研、用”一体化的思想和模式,从教学、实践、科研和使用多方面注重专业人才和特色人才的培养,实现课程学习与企业人才需求无缝衔接的目标。

3. 高校大数据实训室解决方案有么急求

四、人才培养目标
本专业主要面向大数据应用开发、大数据分析挖掘、大数据系统运维等岗位方向培养合格人才,重点培养具有大数据应用、大数据分析以及大数据系统管理与运维方向的,应用型高技能人才。
本专业方向重点培养能够为企事业单位提供大数据系统搭建、管理、和运维技术和能力的人才。通过计算机基础课程、算法语言、系统管理等专业基础知识学习,接受大数据系统和应用知识的培养,进行各种计算机系统,大数据平台系统,大数据应用系统搭建、配置、管理、及运维实训。通过大量的案例与实践操作,熟练掌握大数据系统管理所需的各种专业知识和能力,具备一定的职业素养,为从事大数据行业系统管理工作奠定坚实基础。
五、实践教学环境
新开普完美校园大数据实验室的软硬件系统配置主次分明,考虑到学生从基础理论到工程实践的各个环节,符合学生递进式的认知规律,有利于学生由浅入深的全面掌握大数据相关知识和应用。大数据实验实训室将搭建理论与实践的桥梁,为学生提供大数据技术的实验及实训平台,深化学生对大数据技术理论的理解,提高学生的操作能力,同时,利用所学知识对大数据技术进行创新性研究。具体建设内容包括:
1)物理层---硬件资源:
基于高性能计算与海量存储节点构建的运算资源池,作为云计算各项实验学习环境的主要承载平台,采用云服务器集群+虚拟主机+物理机的解决方案
2)资源池:
包含计算资源池、存储资源池、网络资源池。提供教学活动中必不可少学习资源、实验资源、项目案例。
3)业务平台层:
面向教学活动中的实验课程与项目实训业务提供流程化支撑。完美校园大数据实验室的业务平台层包含大数据教学管理平台和大数据科研平台。
4)统一管理层:
基于完美校园大数据实验室统一资源调度引擎,为用户使用业务平台层与资源平台提供便捷入口。
 
六、实验室功能系统模块
大数据实验室各个功能模块介绍如下:
1)云计算管理系统
完美校园大数据实验室采用云服务提供的虚机系统,云计算管理系统通过对硬件设施进行虚拟化处理,形成虚拟层面的资源池系统,该资源池系统可按需为每一套应用系统提供基础硬件资源——计算能力、存储能力和网络功能,快速适应不断变化的业务需求,实现“弹性”资源分配能力。
①   计算模块
计算模块主要提供云主机功能。而云主机提供了整个云平台中最基础的功能,即虚拟服务器从创建到销毁的全生命周期维护。此模块通过利用虚拟化技术,可将大批服务器硬件资源池化,用户仅需点击鼠标,选择期望的硬件配置、操作系统类型和网络配置等信息,即可在短时间内按需获得任意数量的云主机,模块支持云主机硬件配置在线升级、云主机热迁移、重启、暂停、创建快照等多种功能。
②   镜像模块
镜像功能模块是一套虚拟机镜像查找及检索系统,支持多种虚拟机镜像格式(AKI、AMI、ARI、ISO、QCOW2、Raw、VDI、VHD、VMDK),有创建上传镜像、删除镜像、编辑镜像基本信息的功能。
③块存储模块
块存储模块为运行实例提供稳定的数据块存储服务,即云硬盘服务。它的插件驱动架构有利于块设备的创建和管理,如创建卷、删除卷,在实例上挂载和卸载卷。它们独立于云主机的生命周期而存在,可挂载到任意运行中的云主机上,确保单台云主机故障时,数据不丢失,并具备基于云硬盘的快照创建、备份和快照回滚等功能。
④网络模块
网络模块提供云计算的网络虚拟化技术,为云平台其他服务提供网络连接服务。为用户提供接口,可以定义 Network、Subnet、Router,配置 DHCP、DNS、负载均衡、L3 服务,网络支持,GRE、VLAN。插件架构支持许多主流的网络厂家和技术,如 OpenvSwitch。
⑤安全模块
安全模块通过在计算模块中添加扩展实现,基于传统的包过滤型防火墙技术,可为用户的云主机提供细颗粒度的安全防护策略,支持 TCP/UDP/ICMP 等多种协议,支持自定义来源IP和端口范围等规则,支持用户针对不同类型云主机加载不同级别安全策略的功能。
2)大数据教学管理系统
大数据教学管理系统旨在提供统一的平台管理所有的课程教学资料、视频、讲义、实验指导手册、实验数据集、实验练习、实验报告书、实验成绩管理、用户管理(学生花名册管理、教师信息管理)。
大数据教学系统提供了5大功能模块,分别是:在线基础课程包、在线学习平台、在线练习平台、在线测试平台、在线讨论平台、数据分析平台。
①   在线基础课程包
根据岗位人才发展路径图,提供相应的学习课程资源部内容,客户根据实际情况选择适合自己的课程内容,完美校园大数据中心存储了大量教学资源。包含以下资源:
1.存储辅助性的讲解+PPT配套的视频课程,准确全面的给学生讲解相应的知识点或项目案例;
2.存储了通过CMMI4规范的真实的项目文档和案例,可以让学生在学校就能够接触到大规模科技公司的真实项目和研发流程;
3.针对不同的小练习,配合PPT视频教材,提供了详细的描述文档共学员选择不同的方式对知识点进行接纳和

4. 大数据能为社会心理学带来什么

大数据能为社会心理学带来什么

社会心理学是以科学的方法研究人们的思想、情感和行为如何受到他人影响的一门学科,它以社会现象为研究导向,旨在探寻个体和群体社会心理现象的发生、发展及其规律,深刻了解社会群体行为背后的动机与目的。自20世纪40年代信息科技革命以来,社会心理学在研究方法上经历了多次变革。第一次变革发轫于20世纪70年代前后,从那时起,心理学家开始运用计算机实施具体的心理实验。第二次变革发生于网络技术突飞猛进的20世纪90年代,其代表性事件是基于网络的心理学问卷诞生、虚拟的网络心理学实验室成立、关于网络的心理学实验研究成果在《科学》上发表。大数据时代的到来则使社会心理学迎来了第三次变革,以瞬时生产并存贮的海量网络数据为支撑的大数据样本,正逐渐成为研究者观察和预测人类个体和群体心理行为特征与规律的宝贵资源。可以预见,大数据将为社会心理学的发展带来变革与挑战。

大数据给社会心理学带来研究方法上的变革。以往的社会心理学通常基于问卷、数据统计、抽样调查和实验室研究分析心理数据,而在大数据时代,真实、准确、及时的大数据样本将为社会心理学研究方法的变革带来崭新机遇。随着研究的日益深入,也许我们能够发现,以往所从事的研究可能只是冰山一角,其潜在的内容需要通过大数据逐一揭示。借助大数据,社会心理学能够在很大程度上摆脱对实体实验室的依赖,最大限度、最为高效地扩充潜在的研究对象,使社会心理学的研究不再只局限于实验室小样本或问卷调查采集的随机样本,从而面向尽可能全面的数据、趋近于总体的样本,这就使社会心理学的研究基础发生了翻天覆地的变化。与此同时,大数据还能够为社会心理学的研究提供更为多样化、异质化的样本,并使研究者摆脱时间、空间的限制,尽可能避免社会期许效应,最大程度规避研究对象在测试过程中受到的各种复杂、无关干扰。在我国,已有不少学者投身大数据的洪流,利用新的研究方法开展社会心理学研究。例如,清华大学彭凯平教授建立了“行为与大数据研究实验室”、中国科学院心理学研究所蔡华俭教授创建了“云端心理实验室”、朱廷劭教授基于大数据开发了“国人心理地图”,这些有价值的尝试都将带动中国社会心理学朝向大数据时代迈进。

大数据拓宽和加深了社会心理学研究的广度和深度。大数据时代,一切事物都被数据化:情绪变成了数据、思维变成了数据、行为模式变成了数据、认知变成了数据、沟通变成了数据、关系变成了数据……受此影响,社会心理学的研究视角和研究领域不断更新和扩展,很多传统的社会心理学问题,如社会心态、个体行为偏好、集群行为、社会态度与公众情绪、动态人际互动与人际关系、社会认知、主观幸福感等,都可能借助大数据得到更为准确的、可视化的测量和呈现。例如,大数据网络实验室可以通过记录用户的网络使用情况提取用户的网络行为特征,分析用户的心理属性和网络行为的关联模式;大数据心理健康系统可以为犯罪矫正人员、精神病患者、特殊心理儿童等建立心理健康档案;借助大数据检测和评估社会心态,能够获取大众的社会心理态势,及时发现社会不稳定因素和风险,为社会治理提供科学、客观的研究报告和应对方案等。

大数据宣告社会心理学预测时代的到来。社会心理学有四项基本功能,即描述、阐释、预测和控制,传统社会心理学多关注描述和阐释两项功能,对于预测和控制则显得有些捉襟见肘。大数据时代,这种状况将获得很大改观。由于大数据时代的社会心理学研究不再过多依赖随机采样,而是通过处理和分析相关数据获取结论,这有助于预测能力的提升。例如,有关心理健康的预测,可以利用被试的网络痕迹代替通过问卷收集的答案,并且用机器学习的方法建立基于网络行为的心理健康预测模型,通过模型计算得出被试的心理健康状态评分;关于幸福感的预测可以对社会公众进行幸福感知的预测;关于社会心态、社会风险判断、群体情绪和集群行为、经济发展信心和政府信任的预测,可以预知和评估国民的社会态度,并根据某类群体社会态度的时间性变化研判社会舆情、引导社会舆论等。2010年美国印第安纳大学的约翰博伦教授发现,Twitter网站上的平静类情绪能显著预测未来2至6天美国道琼斯工业平均指数的结果。我国南开大学乐国安教授团队基于微博与股票的大数据研究发现,微博网民情绪的起伏不仅与中国社会发生的重要事件存在明显对应关系,还在一定程度上能够预测我国证券综合指数及其每天交易量的变化。这表明,大数据的背后是人的心理表现,大数据带来的巨大变革必将使社会心理学在预测与控制方面大展身手。

大数据可能给社会心理学研究带来的风险。随着计算科学、数据挖掘等信息分析技术的迅速发展,高效处理和分析海量数据正在成为可能,在此背景下,社会心理学研究者在研究过程中利用大数据、树立大数据思维显得极为重要。但也要认识到,大数据也有可能会给社会心理学研究带来风险。风险之一在于网络用户隐私权和安全感风险。以Facebook为例,其瞬时可以生成详尽的用户心理数据,如包括种族、性格、智商、幸福感、政治观点、宗教信仰等在内的人口特征资料,一旦掌握了这些数据,便可以自动建立起模型。这提示我们,网络数据的使用应注意透明度是否合理,以及合理界定网络控制权的外延和边界。风险之二是研究方法问题。社会心理学面向的是个人、群体和社会,但大数据所带来的研究方法的改变却使得社会心理学研究者可能更多地关注数据,这或许会使某些研究者误入“数据万能论”的误区。事实上,大数据背后所分析的是每个鲜活的个体,是每个个体的心理与行为,他们是庞大数据神经元的突触。大数据的研究方法并不能完全取代以往的研究方法,大数据的网络实验室也不能完全取代实体实验室,只有关注“人”,只有坚持研究方法上的兼容并包,社会心理学才能在大数据时代获得长足发展。

以上是小编为大家分享的关于大数据能为社会心理学带来什么的相关内容,更多信息可以关注环球青藤分享更多干货

5. 社会心理学发展的现状和趋势

为了避免单因素解释社会现象的局限,社会心理学与其他学科及社会各方面的联系和整合更加紧密(Kruglanski, Chernikova, & Jasko, 2017)。研究方法的综合化也日益显著,金盛华(2010)指出,实证主义研究方法与人文主义研究方法并用是现代社会心理学重要的发展趋势。大数据的使用也提升了社会心理学的预测功能,如清华大学彭凯平教授建立了“行为与大数据研究实验室”、朱廷劭教授开发了“国人心理地图”(吴甜甜,2016),这些有价值的尝试都将推动中国社会心理学向大数据时代迈进。

自欧洲社会心理学解构了美国主流社会心理学的地位以来,亚洲心理学发展也取得了长足进步。根据Kruglanski与Chernikova等人(2017)对JPSP文章数据的分析显示,近年来,来自美国以外的作者数量稳步增长;跨文化心理学在最近几十年里越来越流行也是社会心理学日益全球化的标志。
另一方面,社会心理学研究的本土化也是包括我国在内的许多国家向西方主流社会心理学突围的重要途径。余国良(2014)主张中国的社会心理学研究需要充分发掘和培养自己的文化自觉,以本土化推动国际化,在理论建构、学科与学术共同体建设、国际合作等方面进行实质性突破。

6. 漫谈大数据的思想形成与价值维度

漫谈大数据的思想形成与价值维度

清华基于微博分析获得的大数据幸福指数发现人们周六最幸福,相信大家心情不错,因此今天不谈枯燥的技术。关于大数据的思维、理念、方法论已经被反复消费了,本来我想直接进入交互环节,继挺兄还是要求先有一部分规定动作,我就先自弹自唱几十分钟,既然是漫谈,也不见得扣题,说到哪里是哪里。各位有问题,我可以择时择机插入讨论。
先说大数据思想的形成吧。自从人类开始文字和数字,数据就开始产生。就数据增长曲线而言,极小的初值确实要经历漫长的过程达到人类能感知的曲线拐点。谷歌前CEO埃里克·施密特曾给出了一个有趣的数据:从人类文明曙光初现到2003年一共产生的数据,只相当于2010年两天产生的数据量。而一旦越过拐点,“大数据摩尔定律”的滚滚铁轮下,指数效应爆发:最近两年产生的数据量相当于之前产生的全部数据量。
在漫长的数据蓄水过程中,数学和统计学逐渐发展,人们开始注意对数据的量化分析,在人类进入信息时代以前这样的例子就不胜枚举。比如经济上,黄仁宇先生对宋朝经济的分析中发现了“数目字管理”(即定量分析)的广泛应用(可惜王安石变法有始无终)。又如军事,“向林彪学习数据挖掘”的桥段不论真假,其背后量化分析的思想无疑有其现实基础,而这一基础甚至可以回推到2000多年前,孙膑正是通过编造“十万灶减到五万灶再减到三万灶”的数据、利用庞涓的量化分析习惯对其进行诱杀。
到上世纪50-60年代,磁带取代穿孔卡片机,启动了数据存储的革命。磁盘驱动器随即发明,它带来的最大想象空间并不是容量,而是随机读写的能力,这一下子解放了数据工作者的思维模式,开始数据的非线性表达和管理。数据库应运而生,从层次型数据库(IBM为阿波罗登月设计的层次型数据库迄今仍在建行使用),到网状数据库,再到现在通用的关系数据库。与数据管理同时发源的是决策支持系统(DSS),80年代演变到商业智能(BI)和数据仓库,开辟了数据分析——也就是为数据赋予意义——的道路。
那个时代运用数据管理和分析最厉害的是商业。第一个数据仓库是为宝洁做的,第一个太字节的数据仓库是在沃尔玛。沃尔玛的典型应用是两个:一是基于retaillink的供应链优化,把数据与供应商共享,指导它们的产品设计、生产、定价、配送、营销等整个流程,同时供应商可以优化库存、及时补货;二是购物篮分析,也就是常说的啤酒加尿布。关于啤酒加尿布,几乎所有的营销书都言之凿凿,我告诉大家,是Teradata的一个经理编的,人类历史上从没有发生过,但是,先教育市场,再收获市场,它是有功的。
仅次于沃尔玛的乐购(Tesco),强在客户关系管理(CRM),细分客户群,分析其行为和意图,做精准营销。
这些都发生在90年代。00年代时,科研产生了大量的数据,如天文观测、粒子碰撞,数据库大拿吉姆·格雷等提出了第四范式,是数据方法论的一次提升。前三个范式是实验(伽利略从斜塔往下扔),理论(牛顿被苹果砸出灵感,形成经典物理学定律),模拟(粒子加速太贵,核试验太脏,于是乎用计算代替)。第四范式是数据探索。这其实也不是新鲜的,开普勒根据前人对行星位置的观测数据拟合出椭圆轨道,就是数据方法。但是到90年代的时候,科研数据实在太多了,数据探索成为显学。在现今的学科里,有一对孪生兄弟,计算XX学和XX信息学,前者是模拟/计算范式,后者是数据范式,如计算生物学和生物信息学。有时候计算XX学包含了数据范式,如计算社会学、计算广告学。
2008年克里斯·安德森(长尾理论的作者)在《连线》杂志写了一篇《理论的终结》,引起轩然大波。他主要的观点是有了数据,就不要模型了,或者很难获得具有可解释性的模型,那么模型所代表的理论也没有意义了。跟大家说一下数据、模型和理论。大家先看个粗糙的图。
首先,我们在观察客观世界中采集了三个点的数据,根据这些数据,可以对客观世界有个理论假设,用一个简化的模型来表示,比如说三角形。可以有更多的模型,如四边形,五边形。随着观察的深入,又采集了两个点,这时发现三角形、四边形的模型都是错的,于是确定模型为五边形,这个模型反映的世界就在那个五边形里,殊不知真正的时间是圆形。
大数据时代的问题是数据是如此的多、杂,已经无法用简单、可解释的模型来表达,这样,数据本身成了模型,严格地说,数据及应用数学(尤其是统计学)取代了理论。安德森用谷歌翻译的例子,统一的统计学模型取代了各种语言的理论/模型(如语法),能从英文翻译到法文,就能从瑞典文翻译到中文,只要有语料数据。谷歌甚至能翻译克莱贡语(StarTrek里编出来的语言)。安德森提出了要相关性不要因果性的问题,以后舍恩伯格(下面称之为老舍)只是拾人牙慧了。
当然,科学界不认同《理论的终结》,认为科学家的直觉、因果性、可解释性仍是人类获得突破的重要因素。有了数据,机器可以发现当前知识疆域里面隐藏的未知部分。而没有模型,知识疆域的上限就是机器线性增长的计算力,它不能扩展到新的空间。在人类历史上,每一次知识疆域的跨越式拓展都是由天才和他们的理论率先吹起的号角。
2010年左右,大数据的浪潮卷起,这些争论迅速被淹没了。看谷歌趋势,”bigdata”这个词就是那个时间一下子蹿升了起来。吹鼓手有几家,一家是IDC,每年给EMC做digitaluniverse的报告,上升到泽字节范畴(给大家个概念,现在硬盘是太字节,1000太=1拍,阿里、Facebook的数据是几百拍字节,1000拍=1艾,网络是个位数艾字节,谷歌是两位数艾字节,1000艾=1泽);一家是麦肯锡,发布《大数据:创新、竞争和生产力的下一个前沿》;一家是《经济学人》,其中的重要写手是跟老舍同著《大数据时代》的肯尼思?库克耶;还有一家是Gartner,杜撰了3V(大、杂、快),其实这3V在2001年就已经被编出来了,只不过在大数据语境里有了全新的诠释。
咱们国内,欢总、国栋总也是在2011年左右开始呼吁对大数据的重视。
2012年子沛的书《大数据》教育政府官员有功。老舍和库克耶的《大数据时代》提出了三大思维,现在已经被奉为圭臬,但千万别当作放之四海而皆准的真理了。
比如要数据全集不要采样。现实地讲,1.没有全集数据,数据都在孤岛里;2.全集太贵,鉴于大数据信息密度低,是贫矿,投入产出比不见得好;3.宏观分析中采样还是有用的,盖洛普用5000个样本胜过几百万调查的做法还是有实践意义;4.采样要有随机性、代表性,采访火车上的民工得出都买到票的结论不是好采样,现在只做固定电话采样调查也不行了(移动电话是大头),在国外基于Twitter采样也发现不完全具有代表性(老年人没被包括);5.采样的缺点是有百分之几的偏差,更会丢失黑天鹅的信号,因此在全集数据存在且可分析的前提下,全量是首选。全量>好的采样>不均匀的大量。
再说混杂性由于精确性。拥抱混杂性(这样一种客观现象)的态度是不错的,但不等于喜欢混杂性。数据清洗比以前更重要,数据失去辨识度、失去有效性,就该扔了。老舍引用谷歌PeterNovig的结论,少数高质量数据+复杂算法被大量低质量数据+简单算法打败,来证明这一思维。Peter的研究是Web文本分析,确实成立。但谷歌的深度学习已经证明这个不完全对,对于信息维度丰富的语音、图片数据,需要大量数据+复杂模型。
最后是要相关性不要因果性。对于大批量的小决策,相关性是有用的,如亚马逊的个性化推荐;而对于小批量的大决策,因果性依然重要。就如中药,只到达了相关性这一步,但它没有可解释性,无法得出是有些树皮和虫壳的因导致治愈的果。西药在发现相关性后,要做随机对照试验,把所有可能导致“治愈的果”的干扰因素排除,获得因果性和可解释性。在商业决策上也是一样,相关性只是开始,它取代了拍脑袋、直觉获得的假设,而后面验证因果性的过程仍然重要。
把大数据的一些分析结果落实在相关性上也是伦理的需要,动机不代表行为。预测性分析也一样,不然警察会预测人犯罪,保险公司会预测人生病,社会很麻烦。大数据算法极大影响了我们的生活,有时候会觉得挺悲哀的,是算法觉得了你贷不贷得到款,谷歌每调整一次算法,很多在线商业就会受到影响,因为被排到后面去了。
下面时间不多了,关于价值维度,我贴一些以前讲过的东西。大数据思想中很重要的一点是决策智能化之外,还有数据本身的价值化。这一点不赘述了,引用马云的话吧,“信息的出发点是我认为我比别人聪明,数据的出发点是认为别人比我聪明;信息是你拿到数据编辑以后给别人,而数据是你搜集数据以后交给比你更聪明的人去处理。”大数据能做什么?价值这个V怎么映射到其他3V和时空象限中?
再贴上解释。“见微”与“知著”在Volume的空间维度。小数据见微,作个人刻画,我曾用《一代宗师》中“见自己”形容之;大数据知著,反映自然和群体的特征和趋势,我以“见天地、见众生”比喻之。“著”推动“微”(如把人群细分为buckets),又拉动“微”(如推荐相似人群的偏好给个人)。“微”与“著”又反映了时间维度,数据刚产生时个人价值最大,随着时间decay最后退化为以集合价值为主。
“当下”和“皆明”在Velocity的时间维度。当下在时间原点,是闪念之间的实时智慧,结合过往(负轴)、预测未来(正轴),可以皆明,即获得perpetual智慧。《西游记》里形容真假孙悟空,一个是“知天时、通变化”,一个是“知前后、万物皆明”,正好对应。为达到皆明,需要全量分析、预测分析和处方式分析(prescriptiveanalytics,为让设定的未来发生,需要采取什么样的行动)。
“辨讹”和“晓意”在Variety的空间维度。基于大体量、多源异质的数据,辨讹过滤噪声、查漏补缺、去伪存真。晓意达到更高境界,从非结构数据中提取语义、使机器能够窥探人的思想境界、达到过去结构化数据分析不能达到之高度。
先看知著,对宏观现象规律的研究早已有之,大数据的知著有两个新特点,一是从采样到全量,比如央视去年“你幸福吗”的调查,是街头的采样,前不久《中国经济生活大调查》关于幸福城市排名的结论,是基于10万份问卷(17个问题)的采样,而清华行为与大数据实验室做的幸福指数(继挺兄、我、还有多位本群群友参与),是基于新浪微博数据的全集(托老王的福),这些数据是人们的自然表达(而不是面对问卷时的被动应对),同时又有上下文语境,因此更真实、也更有解释性。北上广不幸福,是因为空气还是房价或教育,在微博上更容易传播的积极情绪还是消极情绪,数据告诉你答案。《中国经济生活大调查》说“再小的声音我们都听得见”,是过头话,采样和传统的统计分析方法对数据分布采用一些简化的模型,这些模型把异常和长尾忽略了,全量的分析可以看到黑天鹅的身影,听到长尾的声音。
另一个特点是从定性到定量。计算社会学就是把定量分析应用到社会学,已经有一批数学家、物理学家成了经济学家、宽客,现在他们也可以选择成为社会学家。国泰君安3I指数也是一个例子,它通过几十万用户的数据,主要是反映投资活跃程度和投资收益水平的指标,建立一个量化模型来推知整体投资景气度。
再看见微,我认为大数据的真正差异化优势在微观。自然科学是先宏观、具体,进入到微观和抽象,这时大数据就很重要了。我们更关注社会科学,那是先微观、具体,再宏观、抽象,许小年索性认为宏观经济学是伪科学。如果市场是个体行为的总和,我们原来看到是一张抽象派的画,看不懂,通过客户细分慢慢可以形成一张大致看得懂的现实图景,不过是马赛克的,再通过微分、甚至定位个人,形成高清图。我们每一个人现在都生活在零售商的bucket中(前面说的乐购创造了这个概念),最简单的是高收入、低收入这类反映背景的,再有就是反映行为和生活方式的,如“精打细算”、“右键点击一族”(使用右键的比较techsavvy)。反过来我们消费者也希望能够获得个性化的尊崇,Nobodywantstobenobodytoday。
了解并掌握客户比以往任何时候都更重要。奥巴马赢在大数据上,就是因为他知道西岸40-49岁女性的男神是乔治·克鲁尼,东岸同样年龄段女性的偶像则是莎拉·杰西卡·帕克(《欲望都市》的主角),他还要更细分,摇摆州每一个郡每一个年龄段每一个时间段在看什么电视,摇摆州(俄亥俄)1%选民随时间变化的投票倾向,摇摆选民在Reddit上还是Facebook上,都在其掌握之中。
对于企业来说,要从以产品为中心,转到以客户(买单者)甚至用户(使用者)为中心,从关注用户背景到关注其行为、意图和意向,从关注交易形成转到关注每一个交互点/触点,用户是从什么路径发现我的产品的,决定之前又做了什么,买了以后又有什么反馈,是通过网页、还是QQ、微博或是微信
再讲第三个,当下。时间是金钱,股票交易就是快鱼吃慢鱼,用免费股票交易软件有几秒的延迟,而占美国交易量60-70%的高频程序化交易则要发现毫秒级、低至1美分的交易机会。时间又是生命,美国国家大气与海洋管理局的超级计算机在日本311地震后9分钟发出海啸预警,已经太晚。时间还是机会。现在所谓的购物篮分析用的其实并不是真正的购物篮,而是结帐完的小票,真正有价值的是当顾客还拎着购物篮,在浏览、试用、选择商品的时候,在每一个触点影响他/她的选择。数据价值具有半衰期,最新鲜的时候个性化价值最大,渐渐退化到只有集合价值。当下的智慧是从刻舟求剑到见时知几,原来10年一次的人口普查就是刻舟求剑,而现在东莞一出事网络迁徙图就反映出来了。当然,当下并不一定是完全准确的,其实如果没有更多、更久的数据,匆忙对网络迁徙图解读是可能陷入误区的。
第四个,皆明。时间有限,就简单说了。就是从放马后炮到料事如神(predictiveanalytics),从料事如神到运筹帷幄(prescriptiveanalytics),只知道有东风是预测分析,确定要借箭的目标、并给出处方利用草船来借,就是处方性分析。我们现在要提高响应度、降低流失率、吸引新客户,需要处方性分析。
辨讹就是利用多源数据过滤噪声、查漏补缺和去伪存真。20多个省市的GDP之和超过全国的GDP就是一个例子,我们的GPS有几十米的误差,但与地图数据结合就能做到精确,GPS在城市的高楼中没有信号,可以与惯性导航结合。
晓意涉及到大数据下的机器智能,是个大问题,也不展开了。贴一段我的文章:有人说在涉及“晓意”的领域人是无法替代的。这在前大数据时代是事实。《点球成金(Moneyball)》讲的是数量化分析和预测对棒球运动的贡献,它在大数据背景下出现了传播的误区:一、它其实不是大数据,而是早已存在的数据思维和方法;二、它刻意或无意忽略了球探的作用。从读者看来,奥克兰竞技队的总经理比利·比恩用数量化分析取代了球探。而事实是,在运用数量化工具的同时,比恩也增加了球探的费用,军功章里有机器的一半,也有人的一半,因为球探对运动员定性指标(如竞争性、抗压力、意志力等)的衡量是少数结构化量化指标无法刻画的。大数据改变了这一切。人的数字足迹的无意识记录,以及机器学习(尤其是深度学习)晓意能力的增强,可能逐渐改变机器的劣势。今年我们看到基于大数据的情感分析、价值观分析和个人刻画,当这些应用于人力资源,已经或多或少体现了球探承担的作用。

以上是小编为大家分享的关于漫谈大数据的思想形成与价值维度的相关内容,更多信息可以关注环球青藤分享更多干货

7. 详解大数据的思想如何形成与其价值维度

详解大数据的思想如何形成与其价值维度
比如经济上,黄仁宇先生对宋朝经济的分析中发现了“数目字管理”(即定量分析)的广泛应用(可惜王安石变法有始无终)。又如军事,“向林彪学习数据挖掘”的桥段不论真假,其背后量化分析的思想无疑有其现实基础,而这一基础甚至可以回推到2000多年前,孙膑正是通过编造“十万灶减到五万灶再减到三万灶”的数据、利用庞涓的量化分析习惯对其进行诱杀。
到上世纪50-60年代,磁带取代穿孔卡片机,启动了数据存储的革命。磁盘驱动器随即发明,它带来的最大想象空间并不是容量,而是随机读写的能力,这一下子解放了数据工作者的思维模式,开始数据的非线性表达和管理。数据库应运而生,从层次型数据库(IBM为阿波罗登月设计的层次型数据库迄今仍在建行使用),到网状数据库,再到现在通用的关系数据库。与数据管理同时发源的是决策支持系统(DSS),80年代演变到商业智能(BI)和数据仓库,开辟了数据分析——也就是为数据赋予意义——的道路。

那个时代运用数据管理和分析最厉害的是商业。第一个数据仓库是为宝洁做的,第一个太字节的数据仓库是在沃尔玛。沃尔玛的典型应用是两个:一是基于retaillink的供应链优化,把数据与供应商共享,指导它们的产品设计、生产、定价、配送、营销等整个流程,同时供应商可以优化库存、及时补货;二是购物篮分析,也就是常说的啤酒加尿布。关于啤酒加尿布,几乎所有的营销书都言之凿凿,我告诉大家,是Teradata的一个经理编的,人类历史上从没有发生过,但是,先教育市场,再收获市场,它是有功的。
仅次于沃尔玛的乐购(Tesco),强在客户关系管理(CRM),细分客户群,分析其行为和意图,做精准营销。
这些都发生在90年代。00年代时,科研产生了大量的数据,如天文观测、粒子碰撞,数据库大拿吉姆·格雷等提出了第四范式,是数据方法论的一次提升。前三个范式是实验(伽利略从斜塔往下扔),理论(牛顿被苹果砸出灵感,形成经典物理学定律),模拟(粒子加速太贵,核试验太脏,于是乎用计算代替)。第四范式是数据探索。这其实也不是新鲜的,开普勒根据前人对行星位置的观测数据拟合出椭圆轨道,就是数据方法。但是到90年代的时候,科研数据实在太多了,数据探索成为显学。在现今的学科里,有一对孪生兄弟,计算XX学和XX信息学,前者是模拟/计算范式,后者是数据范式,如计算生物学和生物信息学。有时候计算XX学包含了数据范式,如计算社会学、计算广告学。
2008年克里斯·安德森(长尾理论的作者)在《连线》杂志写了一篇《理论的终结》,引起轩然大波。他主要的观点是有了数据,就不要模型了,或者很难获得具有可解释性的模型,那么模型所代表的理论也没有意义了。跟大家说一下数据、模型和理论。大家先看个粗糙的图。
首先,我们在观察客观世界中采集了三个点的数据,根据这些数据,可以对客观世界有个理论假设,用一个简化的模型来表示,比如说三角形。可以有更多的模型,如四边形,五边形。随着观察的深入,又采集了两个点,这时发现三角形、四边形的模型都是错的,于是确定模型为五边形,这个模型反映的世界就在那个五边形里,殊不知真正的时间是圆形。
大数据时代的问题是数据是如此的多、杂,已经无法用简单、可解释的模型来表达,这样,数据本身成了模型,严格地说,数据及应用数学(尤其是统计学)取代了理论。安德森用谷歌翻译的例子,统一的统计学模型取代了各种语言的理论/模型(如语法),能从英文翻译到法文,就能从瑞典文翻译到中文,只要有语料数据。谷歌甚至能翻译克莱贡语(StarTrek里编出来的语言)。安德森提出了要相关性不要因果性的问题,以后舍恩伯格(下面称之为老舍)只是拾人牙慧了。
当然,科学界不认同《理论的终结》,认为科学家的直觉、因果性、可解释性仍是人类获得突破的重要因素。有了数据,机器可以发现当前知识疆域里面隐藏的未知部分。而没有模型,知识疆域的上限就是机器线性增长的计算力,它不能扩展到新的空间。在人类历史上,每一次知识疆域的跨越式拓展都是由天才和他们的理论率先吹起的号角。
2010年左右,大数据的浪潮卷起,这些争论迅速被淹没了。看谷歌趋势,”bigdata”这个词就是那个时间一下子蹿升了起来。吹鼓手有几家,一家是IDC,每年给EMC做digitaluniverse的报告,上升到泽字节范畴(给大家个概念,现在硬盘是太字节,1000太=1拍,阿里、Facebook的数据是几百拍字节,1000拍=1艾,网络是个位数艾字节,谷歌是两位数艾字节,1000艾=1泽);一家是麦肯锡,发布《大数据:创新、竞争和生产力的下一个前沿》;一家是《经济学人》,其中的重要写手是跟老舍同着《大数据时代》的肯尼思?库克耶;还有一家是Gartner,杜撰了3V(大、杂、快),其实这3V在2001年就已经被编出来了,只不过在大数据语境里有了全新的诠释。
咱们国内,欢总、国栋总也是在2011年左右开始呼吁对大数据的重视。
2012年子沛的书《大数据》教育政府官员有功。老舍和库克耶的《大数据时代》提出了三大思维,现在已经被奉为圭臬,但千万别当作放之四海而皆准的真理了。
比如要数据全集不要采样。现实地讲,1.没有全集数据,数据都在孤岛里;2.全集太贵,鉴于大数据信息密度低,是贫矿,投入产出比不见得好;3.宏观分析中采样还是有用的,盖洛普用5000个样本胜过几百万调查的做法还是有实践意义;4.采样要有随机性、代表性,采访火车上的民工得出都买到票的结论不是好采样,现在只做固定电话采样调查也不行了(移动电话是大头),在国外基于Twitter采样也发现不完全具有代表性(老年人没被包括);5.采样的缺点是有百分之几的偏差,更会丢失黑天鹅的信号,因此在全集数据存在且可分析的前提下,全量是首选。全量>好的采样>不均匀的大量。
再说混杂性由于精确性。拥抱混杂性(这样一种客观现象)的态度是不错的,但不等于喜欢混杂性。数据清洗比以前更重要,数据失去辨识度、失去有效性,就该扔了。老舍引用谷歌PeterNovig的结论,少数高质量数据+复杂算法被大量低质量数据+简单算法打败,来证明这一思维。Peter的研究是Web文本分析,确实成立。但谷歌的深度学习已经证明这个不完全对,对于信息维度丰富的语音、图片数据,需要大量数据+复杂模型。
最后是要相关性不要因果性。对于大批量的小决策,相关性是有用的,如亚马逊的个性化推荐;而对于小批量的大决策,因果性依然重要。就如中药,只到达了相关性这一步,但它没有可解释性,无法得出是有些树皮和虫壳的因导致治愈的果。西药在发现相关性后,要做随机对照试验,把所有可能导致“治愈的果”的干扰因素排除,获得因果性和可解释性。在商业决策上也是一样,相关性只是开始,它取代了拍脑袋、直觉获得的假设,而后面验证因果性的过程仍然重要。
把大数据的一些分析结果落实在相关性上也是伦理的需要,动机不代表行为。预测性分析也一样,不然警察会预测人犯罪,保险公司会预测人生病,社会很麻烦。大数据算法极大影响了我们的生活,有时候会觉得挺悲哀的,是算法觉得了你贷不贷得到款,谷歌每调整一次算法,很多在线商业就会受到影响,因为被排到后面去了。
下面时间不多了,关于价值维度,我贴一些以前讲过的东西。大数据思想中很重要的一点是决策智能化之外,还有数据本身的价值化。这一点不赘述了,引用马云的话吧,“信息的出发点是我认为我比别人聪明,数据的出发点是认为别人比我聪明;信息是你拿到数据编辑以后给别人,而数据是你搜集数据以后交给比你更聪明的人去处理。”大数据能做什么?价值这个V怎么映射到其他3V和时空象限中?我画了个图:
再贴上解释。“见微”与“知着”在Volume的空间维度。小数据见微,作个人刻画,我曾用《一代宗师》中“见自己”形容之;大数据知着,反映自然和群体的特征和趋势,我以“见天地、见众生”比喻之。“着”推动“微”(如把人群细分为buckets),又拉动“微”(如推荐相似人群的偏好给个人)。“微”与“着”又反映了时间维度,数据刚产生时个人价值最大,随着时间decay最后退化为以集合价值为主。
“当下”和“皆明”在Velocity的时间维度。当下在时间原点,是闪念之间的实时智慧,结合过往(负轴)、预测未来(正轴),可以皆明,即获得perpetual智慧。《西游记》里形容真假孙悟空,一个是“知天时、通变化”,一个是“知前后、万物皆明”,正好对应。为达到皆明,需要全量分析、预测分析和处方式分析(prescriptiveanalytics,为让设定的未来发生,需要采取什么样的行动)。
“辨讹”和“晓意”在Variety的空间维度。基于大体量、多源异质的数据,辨讹过滤噪声、查漏补缺、去伪存真。晓意达到更高境界,从非结构数据中提取语义、使机器能够窥探人的思想境界、达到过去结构化数据分析不能达到之高度。
先看知着,对宏观现象规律的研究早已有之,大数据的知着有两个新特点,一是从采样到全量,比如央视去年“你幸福吗”的调查,是街头的采样,前不久《中国经济生活大调查》关于幸福城市排名的结论,是基于10万份问卷(17个问题)的采样,而清华行为与大数据实验室做的幸福指数(继挺兄、我、还有多位本群群友参与),是基于新浪微博数据的全集(托老王的福),这些数据是人们的自然表达(而不是面对问卷时的被动应对),同时又有上下文语境,因此更真实、也更有解释性。北上广不幸福,是因为空气还是房价或教育,在微博上更容易传播的积极情绪还是消极情绪,数据告诉你答案。《中国经济生活大调查》说“再小的声音我们都听得见”,是过头话,采样和传统的统计分析方法对数据分布采用一些简化的模型,这些模型把异常和长尾忽略了,全量的分析可以看到黑天鹅的身影,听到长尾的声音。
另一个特点是从定性到定量。计算社会学就是把定量分析应用到社会学,已经有一批数学家、物理学家成了经济学家、宽客,现在他们也可以选择成为社会学家。国泰君安3I指数也是一个例子,它通过几十万用户的数据,主要是反映投资活跃程度和投资收益水平的指标,建立一个量化模型来推知整体投资景气度。
再看见微,我认为大数据的真正差异化优势在微观。自然科学是先宏观、具体,进入到微观和抽象,这时大数据就很重要了。我们更关注社会科学,那是先微观、具体,再宏观、抽象,许小年索性认为宏观经济学是伪科学。如果市场是个体行为的总和,我们原来看到是一张抽象派的画,看不懂,通过客户细分慢慢可以形成一张大致看得懂的现实图景,不过是马赛克的,再通过微分、甚至定位个人,形成高清图。我们每一个人现在都生活在零售商的bucket中(前面说的乐购创造了这个概念),最简单的是高收入、低收入这类反映背景的,再有就是反映行为和生活方式的,如“精打细算”、“右键点击一族”(使用右键的比较techsavvy)。反过来我们消费者也希望能够获得个性化的尊崇,Nobody wants to be nobody today。
了解并掌握客户比以往任何时候都更重要。奥巴马赢在大数据上,就是因为他知道西岸40-49岁女性的男神是乔治·克鲁尼,东岸同样年龄段女性的偶像则是莎拉·杰西卡·帕克(《欲望都市》的主角),他还要更细分,摇摆州每一个郡每一个年龄段每一个时间段在看什么电视,摇摆州(俄亥俄)1%选民随时间变化的投票倾向,摇摆选民在Reddit上还是Facebook上,都在其掌握之中。
对于企业来说,要从以产品为中心,转到以客户(买单者)甚至用户(使用者)为中心,从关注用户背景到关注其行为、意图和意向,从关注交易形成转到关注每一个交互点/触点,用户是从什么路径发现我的产品的,决定之前又做了什么,买了以后又有什么反馈,是通过网页、还是QQ、微博或是微信。
再讲第三个,当下。时间是金钱,股票交易就是快鱼吃慢鱼,用免费股票交易软件有几秒的延迟,而占美国交易量60-70%的高频程序化交易则要发现毫秒级、低至1美分的交易机会。时间又是生命,美国国家大气与海洋管理局的超级计算机在日本311地震后9分钟发出海啸预警,已经太晚。时间还是机会。现在所谓的购物篮分析用的其实并不是真正的购物篮,而是结帐完的小票,真正有价值的是当顾客还拎着购物篮,在浏览、试用、选择商品的时候,在每一个触点影响他/她的选择。数据价值具有半衰期,最新鲜的时候个性化价值最大,渐渐退化到只有集合价值。当下的智慧是从刻舟求剑到见时知几,原来10年一次的人口普查就是刻舟求剑,而现在东莞一出事网络迁徙图就反映出来了。当然,当下并不一定是完全准确的,其实如果没有更多、更久的数据,匆忙对网络迁徙图解读是可能陷入误区的。
第四个,皆明。时间有限,就简单说了。就是从放马后炮到料事如神(predictiveanalytics),从料事如神到运筹帷幄(prescriptiveanalytics),只知道有东风是预测分析,确定要借箭的目标、并给出处方利用草船来借,就是处方性分析。我们现在要提高响应度、降低流失率、吸引新客户,需要处方性分析。
辨讹就是利用多源数据过滤噪声、查漏补缺和去伪存真。20多个省市的GDP之和超过全国的GDP就是一个例子,我们的GPS有几十米的误差,但与地图数据结合就能做到精确,GPS在城市的高楼中没有信号,可以与惯性导航结合。
晓意涉及到大数据下的机器智能,是个大问题,也不展开了。贴一段我的文章:有人说在涉及“晓意”的领域人是无法替代的。这在前大数据时代是事实。《点球成金(Moneyball)》讲的是数量化分析和预测对棒球运动的贡献,它在大数据背景下出现了传播的误区:一、它其实不是大数据,而是早已存在的数据思维和方法;二、它刻意或无意忽略了球探的作用。从读者看来,奥克兰竞技队的总经理比利·比恩用数量化分析取代了球探。而事实是,在运用数量化工具的同时,比恩也增加了球探的费用,军功章里有机器的一半,也有人的一半,因为球探对运动员定性指标(如竞争性、抗压力、意志力等)的衡量是少数结构化量化指标无法刻画的。大数据改变了这一切。人的数字足迹的无意识记录,以及机器学习(尤其是深度学习)晓意能力的增强,可能逐渐改变机器的劣势。今年我们看到基于大数据的情感分析、价值观分析和个人刻画,当这些应用于人力资源,已经或多或少体现了球探承担的。

8. 高校实验室大数据开发平台建设方案

大数据人才应用能力成长平台——Tempo Talents,从产业人才需求的视角,通过模式创新、技术创新,为高校大数据人才培养提供从平台、课程内容到教学管理的系统解决方案。平台核心围绕“人才应用能力培养”,以实践为基础,将大数据人才培养所需的知识、技能和方法论三个层面互相融合,核心是通过学生动手实践,培养数据思维及解决问题的能力。



5、激发学生学习热情,打造“自驱型”能力成长平台

闯关、竞赛、自主探索的数据游乐场,打破传统的学习模式,打造专业与趣味性融合的学习体验,充分激发学生自主学习热情,打造“自驱型”能力成长平台。

9. 行为分析系统实验室谁给介绍下,或者哪家有

津发集团为大家提供各种心理学实验室设备,想要了解更多资讯,请来http://www.kingfar.net获取更多资料.
【方案背景】

越来越多的科学家,在观察行为的同时,也希望了解受测者的心跳、脑波、体温等多重生理信号、甚至眼球的轨迹及面部的表情等,而这些表征与现象,并不能通过传统的行为观察来获取这方面的讯息。通过同步行为数据、生理心理、认知神经、眼动轨迹等精确的实验数据支撑,对人的行为以及心理做到真正意义的多重科学分析。

津发科仪颠覆了中国大陆多年来传统的行为分析实验室解决方案(音、视频采集及监控),提出了在行为信号采集的同时,同步观察受测者的心跳、脑波、体温等多重生理信号、甚至脑事件相关电位EEG/ERP、脸部表情及眼球轨迹、脑磁图等认知神经信号;而这些表征与现象,并不能通过传统的行为观察来获取。

津发科仪结合了这种划时代的概念,可以在行为观察采集的同时,同步触动其他相关的影象(灾难情景再现)、脑事件相关电位(EEG/ ERP)、眼动轨迹与面部表情、多参数生理信号等系统,并且与往常行为分析实验室最大的不同就是通过行为分析系统及脑、眼部面部表情、生理参数等多重参数进行数据的统计分析,与分析时整合所有信息与同一荧幕画面中,达到行为观察的同时,也了解其他相关的信息与同一时间点的反应,达到真正科学的进行多重分析的目的。

【系统构成】

运动行为观察分析实验室系统构成:考虑将来的远程行为数据采集以及生理信号采集系统的扩展性

【实验用途】

测量不同情绪刺激(应激)条件下被试应激的行为以及心理、生理变化。该系统主要用于行为科学与生理心理学、认知神经科学等实验研究。

行为采集记录系统:

观察室中人员的活动、面部表情可以被清晰的记录在计算机里

观察室中人员声音可以被清晰的记录在计算机里

监控室人员能够和观察室人员对话

生理信号采集系统:

观察室中人员脑认知神经、眼动轨迹、生理指标、情况可以被准确的记录在计算机里

1、观察室有脑事件相关电位传感器、生理信号采集传感器及眼动轨迹、脸部表情追踪系统。

2、控制室有生理信号分析系统、眼动轨迹追踪、脑事件相关电位等的分析系统。

【行为实验室主要用途】
1) 应用心理学、发展心理学、社会心理学等心理学专业,开展行为教学实验与研究。
2) 模拟情境中的决策行为、从众行为、合作行为等社会、经济行为教学实验与研究。
3) 人员的评估、培训与选拔等人力资源管理行为的教学实验与研究
4) 心理训练;行为矫正。

【实验室功能】

1) 能够通过实时记录被观察人员的行为动作语言、面部表情结合同步采集的脑认知神经、眼动轨迹、生理信号等数据,利用计算机对采集的数据进行数字化处理,以达到对行为进行客观的分析和研究。
2) 可以通过图像、语音、或者虚拟现实VR设计营造特定的情境,实时分析在当前刺激条件下被试人员的数据,以达到对行为进行客观的分析和研究。
3)兼顾互动教学与培训

【实验原理】

脑事件相关电位实验原理:

科学家通常把从事心理活动的脑比喻为一个黑匣子,EEG/ERP(事件相关电位,event-related potentials)的研究在探索这个黑匣子的奥秘中起着不可或却的重要作用。近年来,随着认知神经科学和心理科学研究的突飞猛进,EEG/ERP研究更是受到心理与脑科学界更为广泛的关注。认知神经科学是侧重于研究认知过程神经机制的交叉学科,而ERP的优势正是具有很高的时间分辨率(微秒-毫秒),此外,ERP便于与传统的心理测量指标-反应时有机地配合,进行认知过程研究,且具有无创性,可以精确地评价发生在脑内的认知加工活动。同时,Neuroscan256 导EEG/ERP设备的应用,也很好地解决了其空间分辨率的局限,是科学工作者进行认知神经科学的教学和研究的最得力、最有效的方法和手段

眼动轨迹追踪系统实验原理:

通过考察人的眼球运动来研究人的心理活动,通过分析记录到的眼动数据来探讨眼动与人的心理活动的关系。眼动仪的问世为心理学家利用眼动技术(eye movement technique)探索人在各种不同条件下的视觉信息加工机制,观察其与心理活动直接或间接奇妙而有趣的关系,提供了新的有效工具。利用眼动仪进行心理学研究常用的资料或参数主要包括:注视点轨迹图、眼动时间、眼跳方向(DIRECTION)的平均速度(AVERAGE VELOCITY)时间和距离(或称幅度AMPLITUDE)、瞳孔(PUPIL)大小(面积或直径,单位象素pixel)和眨眼(Blink)。
眼动的时空特征是视觉信息提取过程中的生理和行为表现,它与人的心理活动有着直接或间接的关系,这也是许多心理学家致力于眼动研究的原因所在。

生理信号采集分析系统实验原理:

除生物电信号外,其它生理信号均需经换能器转换成电信号后,才能输入计算机进行处理。通过生理信号采集分析系统的传感器把各种类型的生理信号换成电信号,经放大器、滤波器处理。A/D转换器将连续变化的电信号转换成计算机可以接受的离散数字信号,由计算机对所收集的数据进行复杂的数字运算,并且协调系统各部分的工作。最后,处理后的信息在记录设备上作长期记录,对人的心情状况进行分析。

行为分析系统实验室原理:

研究人类行为的标准工具,可用来记录分析被研究对象的动作,姿势,运动,位置,表情,情绪,社会交往,人机交互等各种活动;记录被研究对象各种行为发生的时刻、发生的次数和持续的时间,然后进行统计处理,得到分析报告。

【实验过程】

首先给被试带上所有的心理测试设备(认知神经研究的脑事件相关电位系统及眼部脸部追踪系统、多参数的生理记录采集设备、生物反馈仪、心理测试仪等),在灾难应激行为模拟实验室中,将提前制作好刺激材料(或者模拟场景)通过显示设备呈现给被试,同时记录计算机对采集来的多重信息进行记录 ,并通过软件呈现在监视设备上。如果峰值变化比大,表示被试看到某张图象或经历某种场景时情绪比较紧张。。。。等等,可以由学校老师自己根据实际情况编写。

【物理空间】

实验室根据功能不同分为行为观察实验室(观察区)、行为分析实验室(控制区),控制区和观察区通过单向玻璃完全隔离。

【参加人数】

可以满足多人的行为观察与分析。

【环境要求】
推荐地面铺设地板砖,避免采用引起较大走动声音的架空地板。能对温度、湿度和光线进行控制调节,如环境噪音不是特别影响试验,墙体以普通白墙为宜,避免过于突出分散被试注意力

10. 大数据室如何应用的有什么大数据平台的推荐呢

大数据如何应用到各个行业,需要根据企业需求进行定制化互联网解决方案。应用的行业也非常的广泛的,有工程机械行业、纺织行业等等。工业大数据平台可以选徐工信息汉云这类有硬实力和方案定制软实力的品牌。随着5G快速普及,徐工信息汉云也将帮助更多企业释放物联网大数据的潜能,带领行业一起跨入5G时代。

阅读全文

与行为与大数据实验室相关的资料

热点内容
带着现代武器打鬼子小说 浏览:566
大尺度男同裸露电影 浏览:513
双女主同性恋电影泰剧 浏览:594
影院后排选不了 浏览:428
凤梨苹果笔游戏 浏览:826
下载一部电影大概多少GB 浏览:714
看yellow有哪些网址 浏览:523
李采潭和池恩瑞演的电影 浏览:900
php企业网站 浏览:429
360不是原版文件 浏览:527
旧版安卓酷狗音乐下载 浏览:391
数控用g75下料怎么编程 浏览:948
张雪峰客串电影完整版 浏览:439
ps怎么把另外一个文件图层复制 浏览:735
B影视网址 浏览:729
林奕是哪部小说的人物 浏览:285
近一两年的台湾电影 浏览:318
电影院的椅子怎么关闭 浏览:520
玄幻小说十大肉身功法 浏览:140

友情链接