導航:首頁 > 數據分析 > 大數據開發書籍很多怎麼選

大數據開發書籍很多怎麼選

發布時間:2025-10-10 22:02:26

A. 對即將學習大數據專業的學生有什麼建議和推薦的書籍

‍‍對於即將學習大數據專業的學生,個人認為主要取決於,自己對大數據的理解,其實很多人對大數據僅限於知道,而並非真正了解大數據,個人的主要建議就是,一定要明白什麼是數據,大數據的入門基礎,如果大數據的基本概念,都不明白,那怎麼來學習。‍‍

B. 大家推薦一本寫得好的關於大數據的書

兩本:
《大數據:正在到來的數據革命》 塗子沛
《大數據時代:生活、工作與思維的大變革》回 維克托答•邁爾-舍恩伯格 (Viktor Mayer-Schönberger) (作者), 肯尼思•庫克耶 (Kenneth Cukier) (作者), 盛楊燕 (譯者), 周濤 (譯者)
嫌少再加兩本:
《刪除:大數據取捨之道》 維克托•邁爾-舍恩伯格 (Viktor Mayer-Schönberger) (作者), 袁傑 (譯者)
《爆發:大數據時代預見未來的新思維》 艾伯特•拉斯洛•巴拉巴西(Albert László Barabási) (作者), 馬慧 (譯者)

C. 大數據入門書籍有哪些

當年互聯網瘋狂發展的時候,很多人在觀望和猶豫中錯過了這班順風車(沒有盡早開個淘寶店,腸子都悔青了好幾遍呢)。如今,同樣的橋段上演,大數據時代,堅決不能再無動於衷!
於是,你著急,你迷茫,你很方……除了平時要加班加點的搬磚,牙縫里擠出來的的閑碎時間都貢獻給度娘了,「小白如何學習大數據」,「大數據入門書籍有哪些」……
1:<大數據時代>
這是學習大數據必讀的一本書,也是最系統的關於大數據概念的一本書,由維克托·邁爾-舍恩伯格和肯尼斯·庫克耶編寫,主要介紹了大數據理念和生活工作及思維變革的關系。
它被包括寬頻資本董事長田朔寧、知名IT評論人謝文等專業讀者鑒定為「大數據領域最好的著作沒有之一,一本頂一萬本」。有這么好嗎?看完自己評價吧。這本書對這個大規模產生、分享和應用數據的新的大時代進行了闡述和釐清,作者圍繞「要全體不要抽樣、要效率不要絕對精確、要相關不要因果」三大理念,通過數十個商業和學術案例,剖析了萬事萬物數據化和數據復用挖掘的巨大價值。
2:<爆發>
由巴拉巴西編寫,主要講了在一個歷史故事的連續講述中,了解大數據的概念實質。從大數據的歷史開始,能更深入的了解大數據的發展歷程。
巴拉巴西整本書講述的大數據根本目的,是預測。他甚至有零有整地判斷,人類行為93%是可以預測的。打個比方,千百年前人類無法如今天般准確預測天氣,以致某些大致預測的行為都被認為是「通神」,其實核心在於對天氣數據的海量佔有和分析能力。但假如全人類的所有基礎及行為數據全部被佔有全部能分析呢?比如通過智能終端LBS功能採集全部運動軌跡、通過金融系統採集所有支付記錄、通過SNS採集所有社會關系和通過郵件、文檔、社會視頻監控和自我視頻監測採集所有言行記錄,24小時,每分每秒,一生,全地球70億人,那會如何?
3:<大數據>
由徐子沛編寫,看美國政府在大數據開放上的進程與反復,算是個案。如果能夠基本了解這三本的觀點,出門有底氣,見人腰桿直,不再被忽悠。
全書講述的,是大數據在美國政府管理中的應用,以及美國政府運行方式大數據變革的歷史與斗爭,其實也是故事性的。從奧巴馬上台就頒布《信息公開法案》,到設立第一個美國政府首席信息官開始,講述美國政府與民間在社會數據公開的斗爭史,以及美國社會管理向大數據思維轉變的過程。首先,這算是一個最詳實的案例;其次,這代表的不是某種管理方式變革,深處是對民主運行機制的變革與進步。說好了,這本書用心良苦,遠遠超越科普技術領域;說壞了,其心可誅。有一段,民間斗爭,逼迫奧巴馬公布所有每日白宮全部日程,包括接見了誰、談話的全部內容,這不就是個人大數據全公開在公眾人物上的應用嗎?這可比現在所謂官員公開財產的要求高了幾十倍——這要求政府全部行為、全部數據、全部公開,全體公眾隨時可查——技術和成本上其實已經可以做到或至少努力接近——如果不這么做,不止是落後問題而是真正的其心可誅了。
4:<大數據基礎與應用>
由陳明編寫。看名字就知道,入門級別拯救小白的書。這本書共17章,第1章是對大數據的簡單概述,第2章介紹大數據研究的方法論,第3、8、9、14章介紹大數據的生態環境,第17章介紹數據科學的內容,剩下的章節是本書重點,介紹大數據技術及應用方法。
身處大數據大環境下,身邊的人經常討論資料庫、數據可視化、大數據預處理等等。這些詞聽得多了會讓人產生錯覺——自己已經知道裡面的門道了。但事實上還是個「門外漢」。
舉個例子,沒有人肯在上千人規模的講座上專門花半個小時教你怎樣進行數據清洗。本書專門列了一章,詳細介紹大數據預處理技術,包括數據清洗的實現方式,從步驟到檢驗,都做了用心的闡述。諸如此類,數據挖掘、大數據流式計算、Hadoop、NoSQL等等都從最基礎的點做了詳細介紹。耐心看完這些,再往深處進階就不會那麼吃力了。
5:<一本書讀懂大數據>
進入大數據時代,讓數據開口說話將成為司空見慣的事情,本書將從大數據時代的前因後果講起,全面分析大數據時代的特徵、企業實踐的案例、大數據的發展方向、未來的機遇和挑戰等內容,展現一個客觀立體、自由開放的大數據時代。
5:<集體智慧編程>
入門,淺顯易懂,裡面每一章都是一個案例,但是很方便,有具體的代碼,用來入門最好。
6:<社交網路的數據挖掘>
專門做社交網路的數據挖掘,案例很豐富,有代碼。
7:<數據可視化之美>
致力於介紹各種可視化方案。
8:<鮮活的數據>
比較簡單的可視化,不過內容豐富,有代碼。
9:<數據挖掘導論完整版>
看完上述的書,對大數據產生很大的興趣,已經初步入門了,現在開始理論方面的學習,數據挖掘入門教程,個人覺得寫的很好,目前正在研究這本書,努力。。。
10:<統計學習方法>
這本書比較深,剛開始看的就是這一本,不過太深,看到一半,准備在導論看完之後,在看這本書提升一下自己。
11:<鳥哥私房菜—基礎篇>
作為一個計算機專業linux那是必學的,而且Hadoop是建立在Linux基礎上的,不求多麼的精通,但是基礎的操作要學會。
如果是沒有任何編程語言基礎的想入行大數據的話,是必須要學習java基礎的,雖然大數據支持很多開發語言,但是企業用的最多的還是java,接下來學習數據結構,關系型資料庫,linux系統操作,有了基礎之後,在進入大數據學習,可以給小白學習的體系。
第一階段
COREJAVA(加**的需重點熟練掌握,其他掌握)
Java基礎**
數據類型
運算符、循環
演算法
順序結構程序設計
程序結構
數組及多維數組
面向對象**
構造方法、控制符、封裝
繼承**
多態**
抽象類、介面**
常用類
集合Collection、list**
HashSet、TreeSet、Collection
集合類Map**
異常
File
文件/流**
數據流和對象流**
線程(理解即可)
網路通信(理解即可)
第二階段
數據結構
關系型資料庫
Linux系統操作
Linux操作系統概述
安裝Linux操作系統
圖形界面操作基礎
Linux字元界面基礎
字元界面操作進階
用戶、組群和許可權管理
文件系統管理
軟體包管理與系統備份
Linux網路配置
(主要掌握Linux操作系統的理論基礎和伺服器配置實踐知識,同時通過大量實驗,著重培養學生的動手能力。使學生了解Linux操作系統在行業中的重要地位和廣泛的使用范圍。在學習Linux的基礎上,加深對伺服器操作系統的認識和實踐配置能力。加深對計算機網路基礎知識的理解,並在實踐中加以應用。掌握Linux操作系統的安裝、命令行操作、用戶管理、磁碟管理、文件系統管理、軟體包管理、進程管理、系統監測和系統故障排除。掌握Linux操作系統的網路配置、DNS、DHCP、HTTP、FTP、SMTP和POP3服務的配置與管理。為更深一步學習其它網路操作系統和軟體系統開發奠定堅實的基礎。與此同時,如果大家有時間把javaweb及框架學習一番,會讓你的大數據學習更自由一些)
重點掌握:
常見演算法
資料庫表設計
SQL語句
Linux常見命令
第三階段
Hadoop階段
離線分析階段
實時計算階段
重點掌握:
Hadoop基礎
HDFS
MapRece
分布式集群
Hive
Hbase
Sqoop
Pig
Storm實時數據處理平台
Spark平台
若之前沒有項目經驗或JAVA基礎,掌握了第一階段進入企業,不足以立即上手做項目,企業需再花時間與成本培養;
第二階段掌握扎實以後,進入企業就可以跟著做項目了,跟著一大幫人做項目倒也不用太擔心自己能不能應付的來,當然薪資不能有太高的要求;
前兩個階段都服務於第三階段的學習,除了熟練掌握這些知識以外,重點需要找些相應的項目去做,不管項目大小做過與沒有相差很多的哦!掌握扎實後可直接面對企業就業,薪資待遇較高!

D. 自學數據分析需要看哪些書的

一、整體了解數據分析——5小時
新人們被」大數據「、」人工智慧「、」21世紀是數據分析師的時代「等等信息吸引過來,立志成為一名數據分析師,於是問題來了,數據分析到底是干什麼的?數據分析都包含什麼內容?
市面上有很多講數據分析內容的書籍,在此我推薦《深入淺出數據分析》,此書對有基礎人士可稱消遣讀物, 但對新人們還是有一定的作用。閱讀時可不求甚解,重點了解數據分析的流程、應用場景、以及書中提到的若干數據分析工具,無需糾結分析模型的實現。5個小時,足夠你對數據分析工作建立初步的印象,消除陌生感。
二、了解統計學知識——10小時
15個小時只夠你了解一下統計學知識,作為入門足夠,但你要知道,今後隨著工作內容的深入,需要學習更多的統計知識。
本階段推薦書籍有二:《深入淺出統計學》《統計學:從數據到結論》,要了解常用數理統計模型(描述統計指標、聚類、決策樹、貝葉斯分類、回歸等),重點放在學習模型的工作原理、輸入內容和輸出內容,至於具體的數學推導,學不會可暫放一邊,需要用的時候再回來看。
三、學習初級工具——20小時
對於非技術類數據分析人員,初級工具只推薦一個:EXCEL。推薦書籍為《誰說菜鳥不會數據分析》,基礎篇必須學習,提高篇不一定學(可用其他EXCEL進階書籍),也可以學習網上的各種公開課。
本階段重點要學習的是EXCEL中級功能使用(數據透視表,函數,各類圖表適用場景及如何製作),如有餘力可學習VBA。
四、提升PPT能力——10小時
作為數據分析人員,PPT製作能力是極其重要的一項能力,因此需要花一點時間來了解如何做重點突出,信息明確的PPT,以及如何把各類圖表插入到PPT中而又便於更新數據。10個小時並不算多,但已經足夠(你從來沒做過PPT的話,需要再增加一些時間)。具體書籍和課程就不推薦了,網上一抓一大把,請自行搜索。
五、了解資料庫和編程語言——10小時
這個階段有兩個目標:學習基礎的資料庫和編程知識以提升你將來的工作效率,以及測試一下你適合學習哪一種高級數據分析工具。對於前者,資料庫建議學MySQL(雖然Hadoop很有用但你不是技術職位,初期用不到),編程語言建議學Python(繼續安利《深入淺出Python》,我真沒收他們錢……)。資料庫學到聯合查詢就好,性能優化、備份那些內容用不到;Python則是能學多少學多少。
六、學習高級工具——10小時
雖然EXCEL可以解決70%以上的問題,但剩下30%還是需要高級工具來做(不信用EXCEL做個聚類)。高級分析工具有兩個選擇:SPSS和R。雖然R有各種各樣的好處,但我給的建議是根據你在上一步中的學習感覺來定學哪一個工具,要是學編程語言學的很痛苦,就學SPSS,要是學的很快樂,就學R。不管用哪一種工具,都要把你學統計學時候學會的重點模型跑一遍,學會建立模型和小幅優化模型即可。
七、了解你想去的行業和職位——10+小時
這里我在時間上寫了個」+「號,因為這一步並不一定要用整塊時間來學習,它是貫穿在你整個學習過程中的。數據分析師最需要不斷提升的能力就是行業和業務知識,沒有之一。你將來想投入哪個行業和哪個職位的方向,就要去學習相關的知識(比如你想做網站運營,那就要了解互聯網背景知識、網站運營指標體系、用戶運營知識等內容)。
八、做個報告——25小時
你學習了那麼多內容,但現在出去的話你還是找不到好工作。所有的招聘人員都會問你一句話:你做過哪些實際項目?(即使你是應屆生也一樣) 如果你有相關的項目經驗或者實習經驗,當然可以拿出來,但是如果沒有,怎麼辦?答案很簡單,做個報告給他們看,告訴招聘者:我已經有了數據分析入門級(甚至進階級)職位的能力。同時,做報告也會是你將來工作的主要內容,因此也有可能出現另外一種情況:你費盡心血做了一個報告,然後發現這不是你想要的生活,決定去干別的工作了……這也是件好事,有數據分析能力的人做其他工作也算有一項優勢。

閱讀全文

與大數據開發書籍很多怎麼選相關的資料

熱點內容
amd文件夾佔用多少g 瀏覽:310
鏈接怎麼在微信里查看密碼 瀏覽:827
蘋果5描述文件找不到 瀏覽:927
qq發送文件不可以超過多少g 瀏覽:491
配置文件讀寫的案例 瀏覽:538
中指符號表情代碼emoji 瀏覽:170
i5用什麼軟體編程 瀏覽:496
編程看不懂英文哪些翻譯軟體 瀏覽:282
plc編程什麼時候取脈沖上升沿 瀏覽:388
在哪裡製作網路圖片大小 瀏覽:50
劍來小說哪個app好用 瀏覽:183
大數據開發書籍很多怎麼選 瀏覽:291
手機百度雲文件怎麼加密 瀏覽:955
vm找不到共享文件 瀏覽:123
win10如何展示文件夾目錄樹 瀏覽:192
資料庫db文件生成 瀏覽:875
java枚舉enum 瀏覽:778
如何獲得艦船演習數據 瀏覽:656
小米4c刷cm13教程 瀏覽:833
無線感測器網路的發展前景 瀏覽:559

友情鏈接