A. 1.()实际上是一个分类器。 A.深度神经网络 B.大数据 C.超算能力 D.移动通讯
一、 单选题(题数:40,共40.0分)
1
美国2014年进行的无人艇蜂群演练利用的是()。(1.0分)
0.0分
A、
先进智能
B、
群体智能
C、
先进技术
D、
机械智能
正确答案: B我的答案:A
2
珠算盘起源于()年代。(1.0分)
1.0分
A、
秦朝
B、
汉朝
C、
唐朝
D、
北宋
正确答案: D我的答案:D
3
2012年量子力学领域获得诺贝尔物理学奖的是关于()的研究。(1.0分)
1.0分
A、
激光冷却
B、
单个量子系统的操控和测量
C、
玻色爱因斯坦冷凝态
D、
光频率流
正确答案: B我的答案:B
4
探索自然智能需要从()自然生物开始。(1.0分)
1.0分
A、
开发
B、
创造
C、
模仿
D、
超越
正确答案: C我的答案:C
5
下面关于机器人目前发展进化说法错误的是()。(1.0分)
0.0分
A、
无法做到“顿悟”
B、
无法实现从“量变”到“质变”
C、
仍旧标准化程序的学习
D、
具有自我意识
正确答案: D我的答案:C
6
一定程度上来说下列()工作被机器人取代的可能性更大。(1.0分)
0.0分
A、
体力劳动
B、
脑力劳动
C、
复杂劳动
D、
简单劳动
正确答案: B我的答案:A
7
ABC时代生产工具的是()。(1.0分)
1.0分
A、
人工智能
B、
大数据
C、
云计算
D、
物联网
正确答案: A我的答案:A
8
机器动作是(),智能是本质。(1.0分)
1.0分
A、
核心
B、
关键
C、
抽象
D、
表象
正确答案: D我的答案:D
9
在政府报告中,()的报告使用“机器智能”这个词汇。(1.0分)
1.0分
A、
中国
B、
英国
C、
德国
D、
美国
正确答案: D我的答案:D
10
“机器人”这一词最早出现在()作家的小说中。(1.0分)
1.0分
A、
德国
B、
美国
C、
瑞士
D、
捷克
正确答案: D我的答案:D
11
下面选项中()是战胜柯洁的机器人。(1.0分)
1.0分
A、
CaseCruncher Alpha
B、
Sophia
C、
AlphaGo Master
D、
Robo Master
正确答案: C我的答案:C
12
计算机()编程语言常常会应用于人工智能的开发库。(1.0分)
1.0分
A、
C++
B、
Python
C、
JAVA
D、
Delphy
正确答案: B我的答案:B
13
人类智能和人工智能是一种()智能。(1.0分)
1.0分
A、
不对等
B、
平行
C、
对等
D、
相反
正确答案: B我的答案:B
14
伦理关系具有相对个人而言的()性。(1.0分)
1.0分
A、
不可改变
B、
稳定
C、
权利义务
D、
不可选择
正确答案: D我的答案:D
15
()不属于图灵测试中包含的三个未曾言明的预设前提。(1.0分)
1.0分
A、
机器智能是对人类智能的模拟
B、
人类智能是世界上最高智能形态
C、
世界上只有一种形态,就是人类智能
D、
人工智能不止一条发展路径
正确答案: D我的答案:D
16
在人工智能的()阶段开始有解决大规模问题的能力。(1.0分)
1.0分
A、
形成时期
B、
知识应用时期
C、
新神经网络时期
D、
算法解决复杂问题时期
正确答案: C我的答案:C
17
奇点是指人工智能超越()的极限点。(1.0分)
1.0分
A、
高级智能
B、
机械智能
C、
人类智能
D、
自然智能
正确答案: C我的答案:C
18
在最初的图灵测试中,如果有超过()的测试者不能确定出被测试者是人还是机器,则这台机器就通过了测试,并认为具有人类智能。(1.0分)
0.0分
A、
0.2
B、
0.3
C、
0.4
D、
0.5
正确答案: B我的答案:C
19
被称为“机器学习之父”的是()。(1.0分)
0.0分
A、
奥斯卡·兰格
B、
怀尔斯
C、
迈克尔·乔丹
D、
希尔伯特
正确答案: C我的答案:D
20
()提出了三段论证。(1.0分)
1.0分
A、
亚里士多德
B、
柏拉图
C、
苏格拉底
D、
欧几里得
正确答案: A我的答案:A
21
人工智能算法是建立在()基础上。(1.0分)
1.0分
A、
四进位制
B、
二进位制
C、
六进位制
D、
十二进位制
正确答案: B我的答案:B
22
影像科医师诊断的决定要素是()。(1.0分)
1.0分
A、
知识储备
B、
经验积累
C、
分析判读
D、
以上都是
正确答案: D我的答案:D
23
人工智能深度学习方法技术是先寻找()。(1.0分)
1.0分
A、
概率
B、
数据
C、
梯度
D、
函数
正确答案: D我的答案:D
24
波士顿动力学公司制造的机器人是通过()达到平衡的。(1.0分)
1.0分
A、
高级程序
B、
规则的编码
C、
复杂传感器
D、
先进模型
正确答案: C我的答案:C
25
机器人的三定律中第一条是()。(1.0分)
1.0分
A、
机器人不得伤害人类个体,或者目睹人类个体将遭受危险而袖手不管
B、
机器人必须服从人给予它的命令
C、
机器人要尽可能保护自己的生存。
D、
机器人必须保护人类的整体利益不受伤害
正确答案: A我的答案:A
26
围棋的确定性系统含义不包括()。(1.0分)
1.0分
A、
逻辑性
B、
按照既定规则演化
C、
封闭性
D、
有限性
正确答案: A我的答案:A
27
农业社会人类靠()进步。(1.0分)
1.0分
A、
知识
B、
经验
C、
实践
D、
技术
正确答案: B我的答案:B
28
群体机器人在设计上的关键是()。(1.0分)
1.0分
A、
法律与道德的约束
B、
伦理意识如何设计
C、
服从意识如何设计
D、
给定任务如何进行机制设计
正确答案: D我的答案:D
29
下面关于动物群居说法正确的是()。(1.0分)
0.0分
A、
个体在集体中获得生存机会与个体为集体存在而放弃生存机会之间需要达成平衡
B、
只有集体得利,个体没有增加生存机会,群居没有意义
C、
群居效率来自于相互配合
D、
以上都是
正确答案: D我的答案:C
30
下面选项中关于毕加索描述错误的是()。(1.0分)
0.0分
A、
现代艺术创始人
B、
西方现代派绘画主要代表
C、
19世纪最伟大艺术天才
D、
当代西方最有创造性的艺术家
正确答案: C我的答案:A
31
自助无人系统是一种()智能。(1.0分)
1.0分
A、
思维
B、
思维和动作并重
C、
动作
D、
机械
正确答案: B我的答案:B
32
()的不确定性以及思维的类型决定机器动作的不确定性。(1.0分)
1.0分
A、
内部环境
B、
程序代码
C、
外部环境
D、
自动化水平
正确答案: C我的答案:C
33
阿尔法狗系列机器人曾与()出战过围棋比赛。(1.0分)
1.0分
A、
李世石
B、
柯洁
C、
樊麾
D、
以上都是
正确答案: D我的答案:D
34
人机融合的关键点不包括()。(1.0分)
1.0分
A、
个体智能融合
B、
群体智能融合
C、
群智感知计算
D、
智能个体发展
正确答案: D我的答案:D
35
()被堪称是网络全书式的“全才”。(1.0分)
1.0分
A、
爱因斯坦
B、
霍金
C、
牛顿
D、
图灵
正确答案: C我的答案:C
36
下面关于“囚徒博弈”说法正确的是()。(1.0分)
1.0分
A、
若两人互相合作,则二人都同判监1年
B、
若两人互相背叛,则两人都判监8年
C、
若其中一人背叛对方,对方保持沉默,沉默者将判监10年
D、
以上都对
正确答案: D我的答案:D
37
下面属于常用的点角破空手段是()。(1.0分)
1.0分
A、
点四四
B、
点二三
C、
定天元
D、
点三三
正确答案: D我的答案:D
38
1956年达特茅斯机器人研讨会持续了()时间。(1.0分)
0.0分
A、
15天
B、
6个月
C、
2个月
D、
3个月
正确答案: C我的答案:B
39
机器通过人类发现的问题空间的数据,进行机器学习,具有在人类发现的问题空间中求解的能力,并且求解的过程与结果可以被人类智能(),此为机器智能的产生。(1.0分)
1.0分
A、
采纳
B、
参考
C、
理解
D、
相同
正确答案: C我的答案:C
40
人通过算法赋给机器的智能属于()。(1.0分)
1.0分
A、
自然智能空间
B、
认识智能空间
C、
物物智能空间
D、
人工智能空间
正确答案: D我的答案:D
二、 多选题(题数:15,共30.0分)
1
下面选项中()是人类所特有,而机器所不具备的。(2.0分)
2.0分
A、
定量计算
B、
规律总结
C、
推理与直觉
D、
广泛外延
正确答案: BCD我的答案:BCD
2
机器智能的种类包括()。(2.0分)
2.0分
A、
机器动作智能
B、
机器行为智能
C、
左右大脑+小脑功能
D、
机器言语智能
正确答案: BC我的答案:BC
3
自然智能包括()。(2.0分)
2.0分
A、
高级智能
B、
超级智能
C、
人类智能
D、
机器智能
正确答案: CD我的答案:CD
4
设计一个自己的股票交易机器人需要做到()。(2.0分)
2.0分
A、
提出假设
B、
建立模型
C、
回测验证
D、
执行交易
正确答案: ABCD我的答案:ABCD
5
下面选项中()诗词是人工智能所作。(2.0分)
2.0分
A、
《春雪》
B、
《悲秋》
C、
《落花》
D、
《雪峰》
正确答案: AC我的答案:AC
6
下面选项中曾发生过股市乌龙指事件的包括()。(2.0分)
1.0分
A、
新三板
B、
上海证券
C、
8·16光大证券
D、
创道指第二大单日波幅
正确答案: ACD我的答案:C
7
中国机器人达到机器中国人大概需要()。(2.0分)
2.0分
A、
天人合一
B、
顺势而创
C、
极致匠心
D、
极强模仿
正确答案: ABC我的答案:ABC
8
亚当·史密斯的代表作品不包括()。(2.0分)
2.0分
A、
《道德情操论》
B、
《国富论》
C、
《政治经济学的自然体系》
D、
《政治经济学的自然体系》
正确答案: CD我的答案:CD
9
下面选项中()方面目前存在群体智能。(2.0分)
2.0分
A、
低智生物
B、
高级生物
C、
人类社会
D、
多智能体
正确答案: ACD我的答案:ACD
10
下面选项中()方面是机器人目前能够做到的。(2.0分)
2.0分
A、
医疗
B、
围棋
C、
写诗
D、
灾害后救灾行为
正确答案: ABC我的答案:ABC
11
机器人操作股票的方法是()。(2.0分)
2.0分
A、
认知推理
B、
量化选股
C、
量化交易
D、
信息处理
正确答案: BC我的答案:BC
12
影像诊断误诊的常见原因包括()。(2.0分)
0.0分
A、
病变的复杂性
B、
机器伪影
C、
诊断思维与习惯
D、
检查不规范致漏
正确答案: BCD我的答案:ACD
13
下面关于影像学诊断的价值说法正确的是()。(2.0分)
1.0分
A、
明确病变性质和类型
B、
明确病变范围
C、
对于高危人群定期检查
D、
意外发现其他疾病
正确答案: ABCD我的答案:BCD
14
机器学习的两个任务是()。(2.0分)
2.0分
A、
分析
B、
判别
C、
编码
D、
生成
正确答案: BD我的答案:BD
15
机器智能可以有自己的“人格”体现主要表现在()。(2.0分)
2.0分
A、
模型间的对抗—智能进化的方式
B、
机器智能的协作—机器智能的社会组织
C、
机器智能是社会的实际生产者
D、
机器智能可以有人类智能的创造力
正确答案: ABC我的答案:ABC
三、 判断题(题数:30,共30.0分)
1
群体是能表现出远超个体能力之和的智能行为。()(1.0分)
1.0分
正确答案:√我的答案:√
2
股民在股票交易时往往交易频率比较低。()(1.0分)
1.0分
正确答案:√我的答案:√
3
人工智能的发展,将会导致新兴行业的产生。()(1.0分)
1.0分
正确答案:√我的答案:√
4
机器人相比较股民优势体现为可以通过指标分析来操作股市。()(1.0分)
0.0分
正确答案:×我的答案:√
5
算盘可以算作机器智能的理由是不思维也能运算和由小脑代替大脑计算。(1.0分)
1.0分
正确答案:√我的答案:√
6
在计算机方面,更多的是在生理层面进行模拟。(1.0分)
1.0分
正确答案:×我的答案:×
7
目前机器人无法解决情感连贯的问题。()(1.0分)
1.0分
正确答案:√我的答案:√
8
电影《模仿游戏》是纪念图灵诞生90周年而拍摄的电影。(1.0分)
1.0分
正确答案:×我的答案:×
9
在量子计算机上,大型矩阵的操作速度堪称呈指数级增长。()(1.0分)
1.0分
正确答案:√我的答案:√
10
人工智能识别图像是从输入到输出的神经网络过程。()(1.0分)
1.0分
正确答案:√我的答案:√
11
BP网解决了旅行商问题。(1.0分)
0.0分
正确答案:×我的答案:√
12
2018年5月西安空中上演千架无人机时,左侧图案突发乱码是因为其中一个无人机站位出现错误导致其他随之偏移。(1.0分)
1.0分
正确答案:√我的答案:√
13
最初的擒纵机构诞生于17世纪,是现代机械钟表的核心。()(1.0分)
1.0分
正确答案:×我的答案:×
14
屠哟哟是第一位获得诺贝尔生理医学奖的华人科学家。()(1.0分)
1.0分
正确答案:√我的答案:√
15
《虬髯客传》是宋代传奇小说。()(1.0分)
0.0分
正确答案:×我的答案:√
16
机器智能在21世纪初具备实时感知处理能力。
(1.0分)
1.0分
正确答案:√我的答案:√
17
只有个体得利,没有集体维护,动物群居是不可能的。()(1.0分)
0.0分
正确答案:√我的答案:×
18
高效率、低公平是市场经济的根本特征。()(1.0分)
1.0分
正确答案:√我的答案:√
19
国际象棋的解空间远远大于围棋,它是世界上最复杂的棋类。()(1.0分)
1.0分
正确答案:×我的答案:×
20
图灵测试存在的潜台词是机器智能的极限可以超越人的智能,机器智能可以不与人的智能可比拟。(1.0分)
1.0分
正确答案:×我的答案:×
21
发明家必须要有好奇心、无穷精神和果敢精神等品格。()(1.0分)
1.0分
正确答案:√我的答案:√
22
人工智能读片的方法之一是利用目标检测。()(1.0分)
1.0分
正确答案:√我的答案:√
23
机器的优势在于善于处理复杂的确定性问题。()(1.0分)
1.0分
正确答案:√我的答案:√
24
目前人工智能还不能理解人类智能。()(1.0分)
1.0分
正确答案:√我的答案:√
25
新中国第一家证券交易所创立于北京东城。()(1.0分)
1.0分
正确答案:×我的答案:×
26
图灵测试的价值不在于讨论人类智能与人工智能的性质差异,而在于判别机器是否已经具有智能。(1.0分)
1.0分
正确答案:√我的答案:√
27
1947年第一代机器人主要是用于医疗领域。()(1.0分)
1.0分
正确答案:×我的答案:×
28
中医一般关注实体变化,而西医关注的是系统协同。()(1.0分)
1.0分
正确答案:×我的答案:×
29
人类智能可以和机器智能相互融合。(1.0分)
1.0分
正确答案:√我的答案:√
30
目前人工智能在创作文艺作品时已慢慢具有情感了。()(1.0分)
1.0分
正确答案:×我的答案:×
B. 大数据中所说的数据量大是指到达甚么级别
早在2001年,行业分析师Doug Laney已经将大数据定义为3个“V”,也就是规模(Volume),快速(Velocity)和多样(专Variety)。属
规模(Volume)
通过许多年来基于交易的存储,越来越多的传感器和机器的数据被收集,诸多因素导致数据量增加。在过去,过多的数据量存储是一个问题,但是随着存储成本的降
低,大数据存储得以成功解决。然而现在,其他问题又逐渐出现了,包括怎样从大量的数据中确定其相关性,怎样从相关数据中分析并创造价值等。
快速(Velocity)
大数据以前所未有的速度传输,必须及时处理。射频识别标签、传感器和智能计量正在推动着瞬间处理海量数据的需求。而对于大多数公司组织来说,实现对数据的快速处理,还是一个挑战。
多样(Variety)
今天,所有这些格式类型的数据,包括文本文档、电子邮件、视频、音频、股票数据和金融交易等,其管理、合并以及不同类型数据资源间的整合,对许多公司组织来说也是一个需要应对的问题。
C. 怎么看待清华附小的学生用大数据分析苏轼的诗词
苏轼的好友张先,年逾80,娶一18岁美貌少女为妾。苏轼遂作诗曰“十八新娘八十郎,苍苍白发回对红妆。鸳鸯答被里成双夜,一树梨花压海棠。”梨花是白色的,而海棠鲜红娇嫩,暗指一个白发老者娶一少女为妻。其中“压”字用得巧妙暧昧。
北宋著名词人张先,在80岁时娶了18岁的一个美女为妾。当时和他在论坛上常有诗词唱
和的著名词人苏轼和众多词友去拜访他,问老前辈得此美眷有什么感想,张先于是随口
念道:“我年八十卿十八,卿是红颜我白发。与卿颠倒本同庚,只隔中间一花甲。”
风趣幽默的苏东坡当即和了一首打油诗:
“十八新娘八十郎,苍苍白发对红妆。
鸳鸯被里成双夜,一树梨花压海棠。”
D. 大数据只是互联网吗其它行业用不着吗l
首先,我认为大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。
其次,想要系统的认知大数据,必须要全面而细致的分解它,我着手从三个层面来展开:
第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。我会从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;从对大数据的现在和未来去洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。
第二层面是技术,技术是大数据价值体现的手段和前进的基石。我将分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。
第三层面是实践,实践是大数据的最终价值体现。我将分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。
和大数据相关的理论
? 特征定义
最早提出大数据时代到来的是麦肯锡:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
业界(IBM 最早定义)将大数据的特征归纳为4个“V”(量Volume,多样Variety,价值Value,速Velocity),或者说特点有四个层面:第一,数据体量巨大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T);第二,数据类型繁多。比如,网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。第四,处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。
其实这些V并不能真正说清楚大数据的所有特征,下面这张图对大数据的一些相关特性做出了有效的说明。
36大数据
古语云:三分技术,七分数据,得数据者得天下。先不论谁说的,但是这句话的正确性已经不用去论证了。维克托·迈尔-舍恩伯格在《大数据时代》一书中举了百般例证,都是为了说明一个道理:在大数据时代已经到来的时候要用大数据思维去发掘大数据的潜在价值。书中,作者提及最多的是Google如何利用人们的搜索记录挖掘数据二次利用价值,比如预测某地流感爆发的趋势;Amazon如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐,以此有效提升销售量;Farecast如何利用过去十年所有的航线机票价格打折数据,来预测用户购买机票的时机是否合适。
那么,什么是大数据思维?维克托·迈尔-舍恩伯格认为,1-需要全部数据样本而不是抽样;2-关注效率而不是精确度;3-关注相关性而不是因果关系。
阿里巴巴的王坚对于大数据也有一些独特的见解,比如,
“今天的数据不是大,真正有意思的是数据变得在线了,这个恰恰是互联网的特点。”
“非互联网时期的产品,功能一定是它的价值,今天互联网的产品,数据一定是它的价值。”
“你千万不要想着拿数据去改进一个业务,这不是大数据。你一定是去做了一件以前做不了的事情。”
特别是最后一点,我是非常认同的,大数据的真正价值在于创造,在于填补无数个还未实现过的空白。
有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。
? 价值探讨
大数据是什么?投资者眼里是金光闪闪的两个字:资产。比如,Facebook上市时,评估机构评定的有效资产中大部分都是其社交网站上的数据。
如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
Target 超市以20多种怀孕期间孕妇可能会购买的商品为基础,将所有用户的购买记录作为数据来源,通过构建模型分析购买者的行为相关性,能准确的推断出孕妇的具体临盆时间,这样Target的销售部门就可以有针对的在每个怀孕顾客的不同阶段寄送相应的产品优惠卷。
Target的例子是一个很典型的案例,这样印证了维克托·迈尔-舍恩伯格提过的一个很有指导意义的观点:通过找出一个关联物并监控它,就可以预测未来。Target通过监测购买者购买商品的时间和品种来准确预测顾客的孕期,这就是对数据的二次利用的典型案例。如果,我们通过采集驾驶员手机的GPS数据,就可以分析出当前哪些道路正在堵车,并可以及时发布道路交通提醒;通过采集汽车的GPS位置数据,就可以分析城市的哪些区域停车较多,这也代表该区域有着较为活跃的人群,这些分析数据适合卖给广告投放商。
不管大数据的核心价值是不是预测,但是基于大数据形成决策的模式已经为不少的企业带来了盈利和声誉。
从大数据的价值链条来分析,存在三种模式:
1- 手握大数据,但是没有利用好;比较典型的是金融机构,电信行业,政府机构等。
2- 没有数据,但是知道如何帮助有数据的人利用它;比较典型的是IT咨询和服务企业,比如,埃森哲,IBM,Oracle等。
3- 既有数据,又有大数据思维;比较典型的是Google,Amazon,Mastercard等。
未来在大数据领域最具有价值的是两种事物:1-拥有大数据思维的人,这种人可以将大数据的潜在价值转化为实际利益;2-还未有被大数据触及过的业务领域。这些是还未被挖掘的油井,金矿,是所谓的蓝海。
Wal-Mart作为零售行业的巨头,他们的分析人员会对每个阶段的销售记录进行了全面的分析,有一次他们无意中发现虽不相关但很有价值的数据,在美国的飓风来临季节,超市的蛋挞和抵御飓风物品竟然销量都有大幅增加,于是他们做了一个明智决策,就是将蛋挞的销售位置移到了飓风物品销售区域旁边,看起来是为了方便用户挑选,但是没有想到蛋挞的销量因此又提高了很多。
还有一个有趣的例子,1948年辽沈战役期间,司令员林彪要求每天要进行例常的“每日军情汇报”,由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获情况。那几乎是重复着千篇一律枯燥无味的数据:每支部队歼敌多少、俘虏多少;缴获的火炮、车辆多少,枪支、物资多少……有一天,参谋照例汇报当日的战况,林彪突然打断他:“刚才念的在胡家窝棚那个战斗的缴获,你们听到了吗?”大家都很茫然,因为如此战斗每天都有几十起,不都是差不多一模一样的枯燥数字吗?林彪扫视一周,见无人回答,便接连问了三句:“为什么那里缴获的短枪与长枪的比例比其它战斗略高?”“为什么那里缴获和击毁的小车与大车的比例比其它战斗略高?”“为什么在那里俘虏和击毙的军官与士兵的比例比其它战斗略高?”林彪司令员大步走向挂满军用地图的墙壁,指着地图上的那个点说:“我猜想,不,我断定!敌人的指挥所就在这里!”果然,部队很快就抓住了敌方的指挥官廖耀湘,并取得这场重要战役的胜利。
这些例子真实的反映在各行各业,探求数据价值取决于把握数据的人,关键是人的数据思维;与其说是大数据创造了价值,不如说是大数据思维触发了新的价值增长。
? 现在和未来
我们先看看大数据在当下有怎样的杰出表现:
大数据帮助政府实现市场经济调控、公共卫生安全防范、灾难预警、社会舆论监督;
大数据帮助城市预防犯罪,实现智慧交通,提升紧急应急能力;
大数据帮助医疗机构建立患者的疾病风险跟踪机制,帮助医药企业提升药品的临床使用效果,帮助艾滋病研究机构为患者提供定制的药物;
大数据帮助航空公司节省运营成本,帮助电信企业实现售后服务质量提升,帮助保险企业识别欺诈骗保行为,帮助快递公司监测分析运输车辆的故障险情以提前预警维修,帮助电力公司有效识别预警即将发生故障的设备;
大数据帮助电商公司向用户推荐商品和服务,帮助旅游网站为旅游者提供心仪的旅游路线,帮助二手市场的买卖双方找到最合适的交易目标,帮助用户找到最合适的商品购买时期、商家和最优惠价格;
大数据帮助企业提升营销的针对性,降低物流和库存的成本,减少投资的风险,以及帮助企业提升广告投放精准度;
大数据帮助娱乐行业预测歌手,歌曲,电影,电视剧的受欢迎程度,并为投资者分析评估拍一部电影需要投入多少钱才最合适,否则就有可能收不回成本;
大数据帮助社交网站提供更准确的好友推荐,为用户提供更精准的企业招聘信息,向用户推荐可能喜欢的游戏以及适合购买的商品。
其实,这些还远远不够,未来大数据的身影应该无处不在,就算无法准确预测大数据终会将人类社会带往到哪种最终形态,但我相信只要发展脚步在继续,因大数据而产生的变革浪潮将很快淹没地球的每一个角落。
比如,Amazon的最终期望是:“最成功的书籍推荐应该只有一本书,就是用户要买的下一本书。”
Google也希望当用户在搜索时,最好的体验是搜索结果只包含用户所需要的内容,而这并不需要用户给予Google太多的提示。
而当物联网发展到达一定规模时,借助条形码、二维码、RFID等能够唯一标识产品,传感器、可穿戴设备、智能感知、视频采集、增强现实等技术可实现实时的信息采集和分析,这些数据能够支撑智慧城市,智慧交通,智慧能源,智慧医疗,智慧环保的理念需要,这些都所谓的智慧将是大数据的采集数据来源和服务范围。
未来的大数据除了将更好的解决社会问题,商业营销问题,科学技术问题,还有一个可预见的趋势是以人为本的大数据方针。人才是地球的主宰,大部分的数据都与人类有关,要通过大数据解决人的问题。
比如,建立个人的数据中心,将每个人的日常生活习惯,身体体征,社会网络,知识能力,爱好性情,疾病嗜好,情绪波动……换言之就是记录人从出生那一刻起的每一分每一秒,将除了思维外的一切都储存下来,这些数据可以被充分的利用:
医疗机构将实时的监测用户的身体健康状况;
教育机构更有针对的制定用户喜欢的教育培训计划;
服务行业为用户提供即时健康的符合用户生活习惯的食物和其它服务;
社交网络能为你提供合适的交友对象,并为志同道合的人群组织各种聚会活动;
政府能在用户的心理健康出现问题时有效的干预,防范自杀,刑事案件的发生;
金融机构能帮助用户进行有效的理财管理,为用户的资金提供更有效的使用建议和规划;
道路交通、汽车租赁及运输行业可以为用户提供更合适的出行线路和路途服务安排;
……
当然,上面的一切看起来都很美好,但是否是以牺牲了用户的自由为前提呢?只能说当新鲜事物带来了革新的同时也同样带来了“病菌”。比如,在手机未普及前,大家喜欢聚在一起聊天,自从手机普及后特别是有了互联网,大家不用聚在一起也可以随时随地的聊天,只是“病菌”滋生了另外一种情形,大家慢慢习惯了和手机共渡时光,人与人之间情感交流仿佛永远隔着一张“网”。
? 大数据隐私
你或许并不敏感,当你在不同的网站上注册了个人信息后,可能这些信息已经被扩散出去了,当你莫名其妙的接到各种邮件,电话,短信的滋扰时,你不会想到自己的电话号码,邮箱,生日,购买记录,收入水平,家庭住址,亲朋好友等私人信息早就被各种商业机构非法存储或贱卖给其它任何有需要的企业或个人了。
更可怕的是,这些信息你永远无法删除,它们永远存在于互联网的某些你不知道的角落。除非你更换掉自己的所有信息,但是这代价太大了。
用户隐私问题一直是大数据应用难以绕开的一个问题,如被央视曝光过的分众无线、罗维邓白氏以及网易邮箱都涉及侵犯用户隐私。目前,中国并没有专门的法律法规来界定用户隐私,处理相关问题时多采用其他相关法规条例来解释。但随着民众隐私意识的日益增强,合法合规地获取数据、分析数据和应用数据,是进行大数据分析时必须遵循的原则。
说到隐私被侵犯,爱德华?斯诺登应该占据一席之地,这位前美国中央情报局(CIA)雇员一手引爆了美国“棱镜计划”(PRISM)的内幕消息。“棱镜”项目是一项由美国国家安全局(NSA)自2007年起开始实施的绝密电子监听计划,年耗资近2000亿美元,用于监听全美电话通话记录,据称还可以使情报人员通过“后门”进入9家主要科技公司的服务器,包括微软、雅虎、谷歌、Facebook、PalTalk、美国在线、Skype、YouTube、苹果。这个事件引发了人们对政府使用大数据时对公民隐私侵犯的担心。
再看看我们身边,当微博,微信,QQ空间这些社交平台肆意的吞噬着数亿用户的各种信息时,你就不要指望你还有隐私权了,就算你在某个地方删除了,但也许这些信息已经被其他人转载或保存了,更有可能已经被网络或Google存为快照,早就提供给任意用户搜索了。
因此在大数据的背景下,很多人都在积极的抵制无底线的数字化,这种大数据和个体之间的博弈还会一直继续下去……
专家给予了我们一些如何有效保护大数据背景下隐私权的建议:1-减少信息的数字化;2-隐私权立法;3-数字隐私权基础设施(类似DRM数字版权管理);4-人类改变认知(接受忽略过去);5-创造良性的信息生态;6-语境化。
但是这些都很难立即见效或者有实质性的改善。
比如,现在有一种职业叫删帖人,专门负责帮人到各大网站删帖,删除评论。其实这些人就是通过黑客技术侵入各大网站,破获管理员的密码然后进行手工定向删除。只不过他们保护的不是客户的隐私,而大多是丑闻。还有一种职业叫人肉专家,他们负责从互联网上找到一个与他们根本就无关系用户的任意信息。这是很可怕的事情,也就是说,如果有人想找到你,只需要两个条件:1-你上过网,留下过痕迹;2-你的亲朋好友或仅仅是认识你的人上过网,留下过你的痕迹。这两个条件满足其一,人肉专家就可以很轻松的找到你,可能还知道你现在正在某个餐厅和谁一起共进晚餐。
当很多互联网企业意识到隐私对于用户的重要性时,为了继续得到用户的信任,他们采取了很多办法,比如google承诺仅保留用户的搜索记录9个月,浏览器厂商提供了无痕冲浪模式,社交网站拒绝公共搜索引擎的爬虫进入,并将提供出去的数据全部采取匿名方式处理等。
在这种复杂的环境里面,很多人依然没有建立对于信息隐私的保护意识,让自己一直处于被滋扰,被精心设计,被利用,被监视的处境中。可是,我们能做的几乎微乎其微,因为个人隐私数据已经无法由我们自己掌控了,就像一首诗里说到的:“如果你现在继续麻木,那就别指望这麻木能抵挡得住被”扒光”那一刻的惊恐和绝望……”
和大数据相关的技术
? 云技术
大数据常和云计算联系到一起,因为实时的大型数据集分析需要分布式处理框架来向数十、数百或甚至数万的电脑分配工作。可以说,云计算充当了工业革命时期的发动机的角色,而大数据则是电。
云计算思想的起源是麦卡锡在上世纪60年代提出的:把计算能力作为一种像水和电一样的公用事业提供给用户。
如今,在Google、Amazon、Facebook等一批互联网企业引领下,一种行之有效的模式出现了:云计算提供基础架构平台,大数据应用运行在这个平台上。
业内是这么形容两者的关系:没有大数据的信息积淀,则云计算的计算能力再强大,也难以找到用武之地;没有云计算的处理能力,则大数据的信息积淀再丰富,也终究只是镜花水月。
那么大数据到底需要哪些云计算技术呢?
这里暂且列举一些,比如虚拟化技术,分布式处理技术,海量数据的存储和管理技术,NoSQL、实时流数据处理、智能分析技术(类似模式识别以及自然语言理解)等。
云计算和大数据之间的关系可以用下面的一张图来说明,两者之间结合后会产生如下效应:可以提供更多基于海量业务数据的创新型服务;通过云计算技术的不断发展降低大数据业务的创新成本。
36大数据
如果将云计算与大数据进行一些比较,最明显的区分在两个方面:
第一,在概念上两者有所不同,云计算改变了IT,而大数据则改变了业务。然而大数据必须有云作为基础架构,才能得以顺畅运营。
第二,大数据和云计算的目标受众不同,云计算是CIO等关心的技术层,是一个进阶的IT解决方案。而大数据是CEO关注的、是业务层的产品,而大数据的决策者是业务层。
详情:http://ke..com/view/9424571.htm
E. 互联网大数据现关心的是什么
楼主您好:
首先,我认为大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。
其次,想要系统的认知大数据,必须要全面而细致的分解它,我着手从三个层面来展开:
第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。我会从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;从对大数据的现在和未来去洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。
第二层面是技术,技术是大数据价值体现的手段和前进的基石。我将分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。
第三层面是实践,实践是大数据的最终价值体现。我将分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。
和大数据相关的理论
? 特征定义
最早提出大数据时代到来的是麦肯锡:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
业界(IBM 最早定义)将大数据的特征归纳为4个“V”(量Volume,多样Variety,价值Value,速Velocity),或者说特点有四个层面:第一,数据体量巨大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T);第二,数据类型繁多。比如,网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。第四,处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。
其实这些V并不能真正说清楚大数据的所有特征,下面这张图对大数据的一些相关特性做出了有效的说明。
36大数据
古语云:三分技术,七分数据,得数据者得天下。先不论谁说的,但是这句话的正确性已经不用去论证了。维克托·迈尔-舍恩伯格在《大数据时代》一书中举了百般例证,都是为了说明一个道理:在大数据时代已经到来的时候要用大数据思维去发掘大数据的潜在价值。书中,作者提及最多的是Google如何利用人们的搜索记录挖掘数据二次利用价值,比如预测某地流感爆发的趋势;Amazon如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐,以此有效提升销售量;Farecast如何利用过去十年所有的航线机票价格打折数据,来预测用户购买机票的时机是否合适。
那么,什么是大数据思维?维克托·迈尔-舍恩伯格认为,1-需要全部数据样本而不是抽样;2-关注效率而不是精确度;3-关注相关性而不是因果关系。
阿里巴巴的王坚对于大数据也有一些独特的见解,比如,
“今天的数据不是大,真正有意思的是数据变得在线了,这个恰恰是互联网的特点。”
“非互联网时期的产品,功能一定是它的价值,今天互联网的产品,数据一定是它的价值。”
“你千万不要想着拿数据去改进一个业务,这不是大数据。你一定是去做了一件以前做不了的事情。”
特别是最后一点,我是非常认同的,大数据的真正价值在于创造,在于填补无数个还未实现过的空白。
有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。
? 价值探讨
大数据是什么?投资者眼里是金光闪闪的两个字:资产。比如,Facebook上市时,评估机构评定的有效资产中大部分都是其社交网站上的数据。
如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
Target 超市以20多种怀孕期间孕妇可能会购买的商品为基础,将所有用户的购买记录作为数据来源,通过构建模型分析购买者的行为相关性,能准确的推断出孕妇的具体临盆时间,这样Target的销售部门就可以有针对的在每个怀孕顾客的不同阶段寄送相应的产品优惠卷。
Target的例子是一个很典型的案例,这样印证了维克托·迈尔-舍恩伯格提过的一个很有指导意义的观点:通过找出一个关联物并监控它,就可以预测未来。Target通过监测购买者购买商品的时间和品种来准确预测顾客的孕期,这就是对数据的二次利用的典型案例。如果,我们通过采集驾驶员手机的GPS数据,就可以分析出当前哪些道路正在堵车,并可以及时发布道路交通提醒;通过采集汽车的GPS位置数据,就可以分析城市的哪些区域停车较多,这也代表该区域有着较为活跃的人群,这些分析数据适合卖给广告投放商。
不管大数据的核心价值是不是预测,但是基于大数据形成决策的模式已经为不少的企业带来了盈利和声誉。
从大数据的价值链条来分析,存在三种模式:
1- 手握大数据,但是没有利用好;比较典型的是金融机构,电信行业,政府机构等。
2- 没有数据,但是知道如何帮助有数据的人利用它;比较典型的是IT咨询和服务企业,比如,埃森哲,IBM,Oracle等。
3- 既有数据,又有大数据思维;比较典型的是Google,Amazon,Mastercard等。
未来在大数据领域最具有价值的是两种事物:1-拥有大数据思维的人,这种人可以将大数据的潜在价值转化为实际利益;2-还未有被大数据触及过的业务领域。这些是还未被挖掘的油井,金矿,是所谓的蓝海。
Wal-Mart作为零售行业的巨头,他们的分析人员会对每个阶段的销售记录进行了全面的分析,有一次他们无意中发现虽不相关但很有价值的数据,在美国的飓风来临季节,超市的蛋挞和抵御飓风物品竟然销量都有大幅增加,于是他们做了一个明智决策,就是将蛋挞的销售位置移到了飓风物品销售区域旁边,看起来是为了方便用户挑选,但是没有想到蛋挞的销量因此又提高了很多。
还有一个有趣的例子,1948年辽沈战役期间,司令员林彪要求每天要进行例常的“每日军情汇报”,由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获情况。那几乎是重复着千篇一律枯燥无味的数据:每支部队歼敌多少、俘虏多少;缴获的火炮、车辆多少,枪支、物资多少……有一天,参谋照例汇报当日的战况,林彪突然打断他:“刚才念的在胡家窝棚那个战斗的缴获,你们听到了吗?”大家都很茫然,因为如此战斗每天都有几十起,不都是差不多一模一样的枯燥数字吗?林彪扫视一周,见无人回答,便接连问了三句:“为什么那里缴获的短枪与长枪的比例比其它战斗略高?”“为什么那里缴获和击毁的小车与大车的比例比其它战斗略高?”“为什么在那里俘虏和击毙的军官与士兵的比例比其它战斗略高?”林彪司令员大步走向挂满军用地图的墙壁,指着地图上的那个点说:“我猜想,不,我断定!敌人的指挥所就在这里!”果然,部队很快就抓住了敌方的指挥官廖耀湘,并取得这场重要战役的胜利。
这些例子真实的反映在各行各业,探求数据价值取决于把握数据的人,关键是人的数据思维;与其说是大数据创造了价值,不如说是大数据思维触发了新的价值增长。
? 现在和未来
我们先看看大数据在当下有怎样的杰出表现:
大数据帮助政府实现市场经济调控、公共卫生安全防范、灾难预警、社会舆论监督;
大数据帮助城市预防犯罪,实现智慧交通,提升紧急应急能力;
大数据帮助医疗机构建立患者的疾病风险跟踪机制,帮助医药企业提升药品的临床使用效果,帮助艾滋病研究机构为患者提供定制的药物;
大数据帮助航空公司节省运营成本,帮助电信企业实现售后服务质量提升,帮助保险企业识别欺诈骗保行为,帮助快递公司监测分析运输车辆的故障险情以提前预警维修,帮助电力公司有效识别预警即将发生故障的设备;
大数据帮助电商公司向用户推荐商品和服务,帮助旅游网站为旅游者提供心仪的旅游路线,帮助二手市场的买卖双方找到最合适的交易目标,帮助用户找到最合适的商品购买时期、商家和最优惠价格;
大数据帮助企业提升营销的针对性,降低物流和库存的成本,减少投资的风险,以及帮助企业提升广告投放精准度;
大数据帮助娱乐行业预测歌手,歌曲,电影,电视剧的受欢迎程度,并为投资者分析评估拍一部电影需要投入多少钱才最合适,否则就有可能收不回成本;
大数据帮助社交网站提供更准确的好友推荐,为用户提供更精准的企业招聘信息,向用户推荐可能喜欢的游戏以及适合购买的商品。
其实,这些还远远不够,未来大数据的身影应该无处不在,就算无法准确预测大数据终会将人类社会带往到哪种最终形态,但我相信只要发展脚步在继续,因大数据而产生的变革浪潮将很快淹没地球的每一个角落。
比如,Amazon的最终期望是:“最成功的书籍推荐应该只有一本书,就是用户要买的下一本书。”
Google也希望当用户在搜索时,最好的体验是搜索结果只包含用户所需要的内容,而这并不需要用户给予Google太多的提示。
而当物联网发展到达一定规模时,借助条形码、二维码、RFID等能够唯一标识产品,传感器、可穿戴设备、智能感知、视频采集、增强现实等技术可实现实时的信息采集和分析,这些数据能够支撑智慧城市,智慧交通,智慧能源,智慧医疗,智慧环保的理念需要,这些都所谓的智慧将是大数据的采集数据来源和服务范围。
未来的大数据除了将更好的解决社会问题,商业营销问题,科学技术问题,还有一个可预见的趋势是以人为本的大数据方针。人才是地球的主宰,大部分的数据都与人类有关,要通过大数据解决人的问题。
比如,建立个人的数据中心,将每个人的日常生活习惯,身体体征,社会网络,知识能力,爱好性情,疾病嗜好,情绪波动……换言之就是记录人从出生那一刻起的每一分每一秒,将除了思维外的一切都储存下来,这些数据可以被充分的利用:
医疗机构将实时的监测用户的身体健康状况;
教育机构更有针对的制定用户喜欢的教育培训计划;
服务行业为用户提供即时健康的符合用户生活习惯的食物和其它服务;
社交网络能为你提供合适的交友对象,并为志同道合的人群组织各种聚会活动;
政府能在用户的心理健康出现问题时有效的干预,防范自杀,刑事案件的发生;
金融机构能帮助用户进行有效的理财管理,为用户的资金提供更有效的使用建议和规划;
道路交通、汽车租赁及运输行业可以为用户提供更合适的出行线路和路途服务安排;
……
当然,上面的一切看起来都很美好,但是否是以牺牲了用户的自由为前提呢?只能说当新鲜事物带来了革新的同时也同样带来了“病菌”。比如,在手机未普及前,大家喜欢聚在一起聊天,自从手机普及后特别是有了互联网,大家不用聚在一起也可以随时随地的聊天,只是“病菌”滋生了另外一种情形,大家慢慢习惯了和手机共渡时光,人与人之间情感交流仿佛永远隔着一张“网”。
? 大数据隐私
你或许并不敏感,当你在不同的网站上注册了个人信息后,可能这些信息已经被扩散出去了,当你莫名其妙的接到各种邮件,电话,短信的滋扰时,你不会想到自己的电话号码,邮箱,生日,购买记录,收入水平,家庭住址,亲朋好友等私人信息早就被各种商业机构非法存储或贱卖给其它任何有需要的企业或个人了。
更可怕的是,这些信息你永远无法删除,它们永远存在于互联网的某些你不知道的角落。除非你更换掉自己的所有信息,但是这代价太大了。
用户隐私问题一直是大数据应用难以绕开的一个问题,如被央视曝光过的分众无线、罗维邓白氏以及网易邮箱都涉及侵犯用户隐私。目前,中国并没有专门的法律法规来界定用户隐私,处理相关问题时多采用其他相关法规条例来解释。但随着民众隐私意识的日益增强,合法合规地获取数据、分析数据和应用数据,是进行大数据分析时必须遵循的原则。
说到隐私被侵犯,爱德华?斯诺登应该占据一席之地,这位前美国中央情报局(CIA)雇员一手引爆了美国“棱镜计划”(PRISM)的内幕消息。“棱镜”项目是一项由美国国家安全局(NSA)自2007年起开始实施的绝密电子监听计划,年耗资近2000亿美元,用于监听全美电话通话记录,据称还可以使情报人员通过“后门”进入9家主要科技公司的服务器,包括微软、雅虎、谷歌、Facebook、PalTalk、美国在线、Skype、YouTube、苹果。这个事件引发了人们对政府使用大数据时对公民隐私侵犯的担心。
再看看我们身边,当微博,微信,QQ空间这些社交平台肆意的吞噬着数亿用户的各种信息时,你就不要指望你还有隐私权了,就算你在某个地方删除了,但也许这些信息已经被其他人转载或保存了,更有可能已经被网络或Google存为快照,早就提供给任意用户搜索了。
因此在大数据的背景下,很多人都在积极的抵制无底线的数字化,这种大数据和个体之间的博弈还会一直继续下去……
专家给予了我们一些如何有效保护大数据背景下隐私权的建议:1-减少信息的数字化;2-隐私权立法;3-数字隐私权基础设施(类似DRM数字版权管理);4-人类改变认知(接受忽略过去);5-创造良性的信息生态;6-语境化。
但是这些都很难立即见效或者有实质性的改善。
比如,现在有一种职业叫删帖人,专门负责帮人到各大网站删帖,删除评论。其实这些人就是通过黑客技术侵入各大网站,破获管理员的密码然后进行手工定向删除。只不过他们保护的不是客户的隐私,而大多是丑闻。还有一种职业叫人肉专家,他们负责从互联网上找到一个与他们根本就无关系用户的任意信息。这是很可怕的事情,也就是说,如果有人想找到你,只需要两个条件:1-你上过网,留下过痕迹;2-你的亲朋好友或仅仅是认识你的人上过网,留下过你的痕迹。这两个条件满足其一,人肉专家就可以很轻松的找到你,可能还知道你现在正在某个餐厅和谁一起共进晚餐。
当很多互联网企业意识到隐私对于用户的重要性时,为了继续得到用户的信任,他们采取了很多办法,比如google承诺仅保留用户的搜索记录9个月,浏览器厂商提供了无痕冲浪模式,社交网站拒绝公共搜索引擎的爬虫进入,并将提供出去的数据全部采取匿名方式处理等。
在这种复杂的环境里面,很多人依然没有建立对于信息隐私的保护意识,让自己一直处于被滋扰,被精心设计,被利用,被监视的处境中。可是,我们能做的几乎微乎其微,因为个人隐私数据已经无法由我们自己掌控了,就像一首诗里说到的:“如果你现在继续麻木,那就别指望这麻木能抵挡得住被”扒光”那一刻的惊恐和绝望……”
和大数据相关的技术
? 云技术
大数据常和云计算联系到一起,因为实时的大型数据集分析需要分布式处理框架来向数十、数百或甚至数万的电脑分配工作。可以说,云计算充当了工业革命时期的发动机的角色,而大数据则是电。
云计算思想的起源是麦卡锡在上世纪60年代提出的:把计算能力作为一种像水和电一样的公用事业提供给用户。
如今,在Google、Amazon、Facebook等一批互联网企业引领下,一种行之有效的模式出现了:云计算提供基础架构平台,大数据应用运行在这个平台上。
业内是这么形容两者的关系:没有大数据的信息积淀,则云计算的计算能力再强大,也难以找到用武之地;没有云计算的处理能力,则大数据的信息积淀再丰富,也终究只是镜花水月。
那么大数据到底需要哪些云计算技术呢?
这里暂且列举一些,比如虚拟化技术,分布式处理技术,海量数据的存储和管理技术,NoSQL、实时流数据处理、智能分析技术(类似模式识别以及自然语言理解)等。
云计算和大数据之间的关系可以用下面的一张图来说明,两者之间结合后会产生如下效应:可以提供更多基于海量业务数据的创新型服务;通过云计算技术的不断发展降低大数据业务的创新成本。
36大数据
如果将云计算与大数据进行一些比较,最明显的区分在两个方面:
第一,在概念上两者有所不同,云计算改变了IT,而大数据则改变了业务。然而大数据必须有云作为基础架构,才能得以顺畅运营。
第二,大数据和云计算的目标受众不同,云计算是CIO等关心的技术层,是一个进阶的IT解决方案。而大数据是CEO关注的、是业务层的产品,而大数据的决策者是业务层。
详情:http://ke..com/view/9424571.htm
F. 从古典诗词的角度如何解读刘慈欣的短篇小说《诗云》
描述了一个超级生命体想要利用大数据去征服古诗词,当然了这个想法是非常不错的,可是却是一个非常难以行得通的事。
现在科技大数据和古代诗歌的一种碰撞,其实科技它是违反诗意的,诗歌更主要的是连接一个人的心灵,把一个人的内在情感给他传递出来,是一种抽象化的艺术,而这种艺术是科学技术永远无法抵达的核心。