1. 现在是个互联网时代是个大数据时代,做什么最适合IT人呢
现在IT很多方面的工作都很吃香啊,但是你也清楚互联网是个是个大数据的时代,只要把一门技术钻研做好就可以了,在一个领域上有所发展就挺好的。
2. DOA的DOA意义
李国杰院士在关于大数据应用与研究所面临的问题与挑战中指出,大数据时代,“需要考虑对整个 IT 架构进行革命性的重构”。广义上讲,革命指推动事物发生根本性变革,引起事物从旧制到新制的飞跃。我们认为 IT 架构的革命性重构应该从硬件和软件两个方面来考虑。云计算已经较好地解决了硬件方面的问题,并且为软件方面的革命性重构奠定了重要基础。但软件方面,在软件的体系结构上,目前还没有很好的解决方案。受软件体系结构的局限,信息技术领域长期存在的问题在大数据时代愈发突出:
(1)信息共享。经过数十年来信息技术发展和信息化应用的积累,政府部门和企业中建立的各种业务信息系统越来越多。但这些系统间很难实现信息共享,甚至新建的信息系统也难以和其他系统共享信息。信息“孤岛”和信息“烟囱” 现象普遍存在,而且问题越来越严重。采用“接口”和“信息交换平台”或“数据交换平台”等方案,不能从根本上解决问题。
(2)系统扩展。信息系统建设完成后,应用需求发生变化就要重新修改代码才能实现功能更改,造成应用信息系统对软件开发者的依赖。一旦需求变化成为常态,系统的功能扩展问题就变得非常突出。
(3)数据管理。过去的信息系统涉及的多是结构化数据,通过关系型数据库管理系统(RDBMS, Relational Data Base Management System)就能很好地对数据进行管理。现在面临的大数据具有海量、异构、多源、动态、实时变化和爆发式增长的特点,数据来源多样,种类繁多,动态变化,包括来自物联网的物理空间数据,社交网络的网络空间数据等,至今没有统一的数据定义和管理办法。
(4)大数据分析和挖掘支持。大数据需要通过处理、分析和挖掘才能产生价值,才能为决策提供支持。但目前对具有上述特点的大数据缺乏符合数据密集 型模式的数据管理机制和平台,因而对大数据的处理、分析和挖掘难以获得具有持续、全面、科学和客观的大数据分析和挖掘结果。
(5)软件工程。传统的面向业务的软件开发过程复杂,开发和维护成本高,无法应对处于常态的业务应用需求变更,软件生命周期短,更新、淘汰和重新开发带来的投入大。在互联网和移动互联网时代,强调一切业务数据化,就意味着要采集、记录、存储和管理一切业务过程中产生的数据,这对于需求分析、数据模型和业务应用等,都充满了不确定性,也和传统的软件开发中要尽量有一个稳定、明确的需求正好相反,这给传统的面向业务的软件工程带来了严峻的挑战。
(6)信息安全。信息安全涉及国家安全、社会稳定、企业利益和个人隐私。传统的信息安全多是封闭环境下的信息安全,强调的是网络安全、系统安全和应用安全。在信息安全上,我国采用的是分级保护和等级保护的信息安全制度。传统的数据安全,多强调的是数据中心的安全,虽然有备份、灾备等技术保障数据的安全,但还存在着越权访问等数据泄露隐患。在云计算、互联网和移动互联网应用以及大数据时代下,环境更为开放,对数据安全的要求更高,给信息安全带来了更为严峻的挑战。所以,信息安全除了网络安全和系统安全保障之外,在安全的软件体系结构和安全的数据保护机制等方面还要有更深入的研究。
(7)数据提供者利益保障。在大数据时代,以数据建设和提供信息(数据)服务的企业和部门越来越多,对这类数据提供者的利益保护愈发重要。但由于信息具有易复制、易传输、难保护的特点,现有的技术体系缺乏对数据保护和授权使用的机制,不足以保障数据提供者的利益,不利于这类企业或部门的发展。
3. 北大收理科生吗
北大收理科生。
据2018年12月北大官网信息显示,北大共有11个学科门类,专涵盖了48个本科专属业门类,开办了125个本科专业。其中理科类有物理学、大气与海洋科学、数学、概率统计、科学与工程计算、信息科学、金融数学、数据科学与大数据技术、化学、应用化学、材料化学、化学生物学等。
(3)李国杰院士大数据先锋扩展阅读:
北大的师资力量:
截至2017年12月,北大拥有教职工(不包含博士后)21183人;专任教师数7317人,其中,按职称划分:正高级2217人,副高级2231人;其中:中国科学院院士76人,中国工程院院士19人,发展中国家科学院院士25人,哲学社会科学资深教授13人,“千人计划”入选者72人。
“青年千人计划”入选者153人,“万人计划”入选者28人,“青年拔尖人才计划”入选者35人,“长江学者奖励计划”特聘教授、讲座教授、青年学者231人,国家杰出青年基金获得者237人,国家基金委创新群体40个,国家基金委优秀青年基金获得者130人。
参考资料来源:网络—北大
4. 大数据的权威定义
大数据是IT行业的术语,指的是无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据起源 2008年9月,美国《自然》杂志,正式提出“大数据”概念
2011年2月1日,美国《科学》杂志,通过社会调查的方式,第一次分析了大数据对人们生活的影响
2011年5月,麦肯锡研究院分布报告。大数据是指其大小超出了常规数据库工具获取,存储,管理和分析能力的数据集。
具有4V特征(value,volume,velocity,variety)
Value:价值高。
Volume:体量大。(数据每个18月翻一番,而每年产生的数据量增长到44万亿GB)
Velocity:速度快。(数据生成,存储,分析,处理远远超过人们的想象力)
Variety:种类多。
大数据的来源
按产生主体
(1)企业(关系型数据库,数据仓库)
(2)人(浏览信息,聊天,电子商务......)
(3)机器(服务器产生日志,视频监控数据)
数据来源的行业划分
(1)BAT三大公司为代表
(2)电信、金融、保险、电力、石化系统
(3)公共安全、医疗、交通领域
(4)气象、地理、政务等领域
(5)制造业和其他产业
3.按数据存储的形式划分
(1)结构化
(2)非结构化
二.大数据技术支撑
大数据运用场景
环境,教育,医疗,农业,智慧城市,零售业,金融业。
大数据的处理方法
数据采集
数据抓取,数据导入,物联网设备自动抓取
数据预处理
数据清理,数据集成,数据转换,数据规约。
转换:过平滑聚集、数据概化、规范化等方式将数据转换成适用于数据挖掘的形式。
规约:寻找依赖于发现目标的数据的有用特征,缩减数据规模,最大限度地精简数据量。
统计与分析
统计与分析主要是利用分布式数据库,或分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总,以满足大多数常见的分析需求,在这些方面需要使用不同的框架和方法。
Hadoop:大数据的核心,主要组成部分包括:maprece(处理)和HDFS(存储)和yarn(集群资源管理和调度);
Hbase:常用数据库;spark:实时数据处理框架;sqoop:数据导入导出;flume:日志采集工具
Hive:数据仓库,必须有SQL基础,可以做离线的数据分析,把复杂的maprece代码转化为简单的sql语句,
而且可以处理的数据类型更加丰富,对接的工具也更多,是整个大数据学习中非常主要的一部分。
5. 数据科学与数据技术有哪几个大学
中国科学院大来学(简称国科大自)首次“大数据技术与应用”方向人才培养研讨会在京召开。中国工程院院士李国杰表示,该专业应发挥中科院相关研究所在大数据领域的优势,把人才培养与科研优势结合起来,让有条件的学生参与到研究所大数据技术及应用的科研实践中来。
该专业方向具体实施单位、国科大工程管理与信息技术学院院长于华介绍说,他们将逐步开展与金融、电信、气象、电子商务、科学计算、物流、遥感、航天等领域的合作,把人才培养落到实处,切实为相关行业的发展提供优质教育服务。
据了解,国科大将面向科研发展及产业实践,培养复合型大数据人才。不同于普通本科生和研究生培养,该方向首先瞄准具有一定行业背景的在职人员,通过整合中科院及合作伙伴在大数据技术及应用领域的优质资源,力争打造具有中科院特色和优势的专业方向。
望采纳