導航:首頁 > 網路數據 > 大數據應用的誤區

大數據應用的誤區

發布時間:2022-01-21 01:20:37

『壹』 大數據存在哪些誤區

1.大數據是新時代的新玩意


事實上,數據分析一點也不新。早從數百年前的啟蒙時代,學者們便已開始遵循科學方法,一步步拆解事物形成背後的原因。科學家先觀察,取得並分析數據,歸納出假說,然後再經過不斷實證,逐漸形成定律。因此我們說的大數據,充其量只是科學方法的應用。


2.100TB以上才叫大數據


數據的大小,事實上沒有明確的界線。更重要的,數據的大小,不一定有意義。數據大,也不代表一定能做出准確的預測─假設你擁有地球70億人口的姓名、性別、生日、身高、體重、膚色、視力,以及他們的上網行為等種種數據,如果題目是要預測他們明年的收入分布,這個龐大的資料庫,恐怕還是無法幫上你什麼。所以數據在精不在多,重點是要達成的任務,不是儲存的數量。


3.數據非常客觀


採集數據的軟硬體,是人為設計的,因此不可能做到絕對的客觀。手機停留在某個畫面,就代表你在欣賞這個內容嗎?很難說,或許你只是在跟旁邊的朋友聊天。對某個發文點贊,就代表你真心喜歡這則資訊嗎?也很難說,說不定只是喜歡發文的人,或是手滑不小心按到。

『貳』 大數據有哪些誤區

誤區1、大數據學習技術驅動論:大數據的核心目標是數據驅動的智能化,要內解決具體的問題,學習之容前要明確問題,理解問題,所謂問題導向、目標導向,這個明確之後再研究和選擇合適的技術加以應用,這樣才有針對性。大數據學習應該是業務驅動

誤區2、大數據學習重復造輪子:IT前沿領域的開源化已成不可逆轉的趨勢,Android開源讓智能手機平民化,讓我們跨入了移動互聯網時代,智能硬體開源將帶領跨入物聯網時代,以Hadoop和Spark為代表的大數據開源生態加速了去IOE(IBM、ORACLE、EMC)進程,倒逼傳統IT巨頭擁抱開源,谷歌和OpenAI聯盟的深度學習開源(以Tensorflow,Torch,Caffe等為代表)正在加速人工智慧技術的發展。所以大數據學習要善用開源

誤區3、大數據學習求大求全:大數據技術龐大復雜,我們的精力很有限,短時間內很難掌握多個領域的大數據理論和技術,學習過程中應要把握好碎片化和系統性的關系。大數據學習要以點帶面

『叄』 大數據技術的理解誤區有哪些

1、大數據≠具有數據


許多人覺得具有數據,特別是具有許多的數據,這就是大數據了,這個是必定不對的,數據量大不是大數據,比方氣象數據很大,如果僅僅用於氣象預測,只需核算才能跟上就行,還遠遠沒有發揮它的價值。可是保險公司根據氣象大數據,來預測自然災害以及調整與自然災害相關的保險費率,它就演化出其它的商業價值,構成了大數據的商業環境。所以,大數據要運用,甚至相關,交換才能產生真實價值,構成DT時代特有的大數據商業。


2、大數據≠報表渠道


有許多企業,建立了自己業務的報表中心,或者是大屏展示中心,就馬上宣告他們已經完成了大數據,這是遠遠不夠的。報表盡管也是大數據的一種體現,可是真實的大數據業務,不是生成報表靠人來指揮,那是披著大數據外表的報表體系罷了。在大數據閉環體系中,萬物都是數據產生者,也是數據運用者,他們經過自動化,智能化的閉環體系,自動學習,智能調整,從而提升全體的出產功率。


3、大數據≠核算渠道


之前看過一個報道,說某某金融機構建立了自己的大數據體系,後來細心一看,就是搭建了一個幾百台機器的Hadoop集群罷了。大數據核算渠道,是大數據應用的技能基礎,是大數據閉環中非常重要的一環,也是不可缺少的一環,可是,不能說有了核算渠道就有了大數據。比方我買了鍋,不能說我已經有了菜,從鍋到菜還缺原料(數據),刀具(加工工具),廚師(數據加工)才能終做出菜來。


4、大數據≠精準營銷


見過許多創業公司在做大數據創業,細心一看,人家做的是根據大數據的推薦引擎、廣告定投等等。這是大數據嗎?他們做的是大數據的一種應用,可以說已經是大數據的一種了。只是大數據整個生態,不能經過這一種就來表達罷了。正如大象的耳朵是大象的一部分,可是,它不能代表大象。


關於大數據技術的理解誤區有哪些,青藤小編就和您分享到這里了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。

『肆』 大數據有哪些分析誤區

1.數據樣本量不夠


我們在分析某些特定的業務或用戶行為時,可能存在相對關注度較小,用戶使用很少的情況,或者是在提取數據的過程中,增加了很多的限制條件或者多種用戶行為或屬性進行交叉後,得到很少的用戶樣本。


對於這種數量小的數據樣本得出的結果很有可能會出錯,但是樣本量多少才算夠多呢?這個沒有一個特定的數值,通常只能結合具體的場景進行分析。


建議:可以把時間線拉長,或者把不重要的限定條件去掉,來獲得足量的樣本。


2.存在選擇性偏見或者倖存者偏見


統計學的另一大理論基石,便是中心極限定理。


簡單描述下就是,總體樣本中,任意一個群體樣本的平均值,都會圍繞在這個群體的整體平均值周圍。


通常我們會按照這個原理,用隨機抽樣的方式,通過對樣本的分析來估計整體。當然得出的結論會比較接近真實情況的。可是有一個問題是,我們在採集數據的過程中是否是真的隨機。


舉個實際業務場景的例子,在軟體應用升級期間,通過衡量用戶的日活、人均播放量、人均播放時長等指標,來判斷新版本的歡迎度是否優於老版本。聽起來好像沒有什麼問題,其實這里就隱藏了選擇性偏見,因為新版本發布時,第一批升級上來的用戶往往就是最活躍的用戶。這批用戶在這些指標上,本來表現就是優於一般用戶的,因此指標數據更高並不能說明更好。


3.混入臟數據


臟數據是指嚴重不合理或對於實際業務毫無意義的數據,通常是由程序bug、第三方攻擊、網路傳輸異常等原因造成的。


這種數據的破壞性比較大,可能引發程序報錯,對指標的准確度影響也較大。


關於大數據有哪些分析誤區,青藤小編就和您分享到這里了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。

『伍』 再談大數據行業里的兩大誤區

再談大數據行業里的兩大誤區

大數據這個詞,恐怕是近兩年IT界炒的最熱的詞彙之一了,各種論壇、會議,言必談大數據,「大數據」這個詞,在IT界已經成了某果一樣的「街機」或者叫「街詞」,不跟風說兩句「大數據長,大數據短」都不好意思跟人說自己是搞IT的。從某種程度來講,大數據這個「圈」太亂了,一點不比「貴圈」好。
先從概念上來說,大數據是什麼?其實數據處理從人類誕生時期就有了,古人結繩記事就是基本的統計,統計自己吃了幾頓飯打了幾次獵等等;再往近說,皇帝每晚翻嬪妃的牌子也是數據處理,在翻牌子之前,要從一大堆牌子里分析「方便」、「熱度高」、「新鮮度」等指標;更近的說,數據倉庫早在大數據這個詞出現前就已經成熟發展了好幾十年了。所以說,大數據並不新鮮,只是某些技術如Hadoop、MR、Storm、Spark發展到一定階段,順應這些技術炒出來的概念,但是這些概念都基於一個基本的理念「開源」,這個理念是之前任何階段都沒有過,可以節省費用提高效率,所以大家才都往這個行業里扔火柴(話說現在很多人跟風亂吵,個人認為也不是壞事)。誤區一:只有搞大數據技術開發的,才是真正「圈內人」。筆者曾經參加過若干會議,70%是偏技術的,在場的都是國內各個數據相關項目經理和技術帶頭人,大家討論的話題都是在升級CDH版本的時候有什麼問題,在處理Hive作業的時候哪種方式更好,在Storm、Kafka匹配時如何效率更高,在Spark應用時內存如何釋放這些問題。參會者都一個態度:不懂大數據技術的人沒資格評論大數據,您要不懂Hadoop 2.0中的資源配置,不懂Spark在內存的駐留時間調優,不懂Kafka採集就別參加這個會!對了,最近Google完全拋棄MR只用Dataflow了,您懂嗎?不懂滾粗!在這里我想說,技術的進步都是由業務驅動的,某寶去了IOE才能叫大數據嗎,我作為一個聾啞人按摩師用結繩記事完成了對於不同體型的人,用什麼按摩手法進行全流程治療,就不叫大數據分析了嗎?技術發展到什麼程度,只有一小部分是由科學家追求極致的精神驅動,大部分原因是因為業務發展到一定程度,要求技術必須做出進步才能達成目標的。所以,真正的大數據「圈內人」至少要包含以下幾種人:一、業務運營人員。比如互聯網的產品經理要求技術人員,必須在用戶到達網站的時候就算出他今天的心情指數,而且要實現動態監測,這時候只能用Storm或者Spark來處理了;比如電信運營商要求做到實時營銷,用戶進入營業廳的時候,必須馬上推送簡訊給用戶,提示他本營業廳有一個特別適合他的相親對象(呈現身高、三圍、體重等指標),但是見面前要先購買4G手機;再比如病人來到銀行開戶,銀行了解到用戶最近1周曾經去醫院門診過兩次,出國旅遊過3次,帶孩子游泳兩次,馬上客戶經理就給客戶推薦相關的銀行保險+理財產品。這些業務人員,往往是驅動技術進步的核心原因。二、架構師。架構師有多麼重要,當一個業務人員和一個工程師,一個說著業務語言,一個說著技術術語在那裡討論問題的時候,工程師往往想著用什麼樣的代碼能馬上讓他閉嘴,而架構師往往會跳出來說「不,不能那樣,你這樣寫只能解決一個問題並且會製造後續的若干問題,按照我這個方案來,可以解決後續的若干問題!」一個非技術企業的IT系統水平,往往有70%以上的標准掌握在架構設計人員手裡,盡快很多優秀的架構師都是從工程師慢慢發展學習而來的,IT架構的重要性,很多企業都意識到了,這就是很多企業有CTO和CIO兩個職位,同樣重要!架構之美,當IT系統平穩運行的時候沒人能感受到,但是在一個煙囪林立、架構混亂的環境中走過的人眼中,IT開發一定要架構現行,開發在後!三、投資人。老闆,不用說了,老闆給你吃穿,你給老闆賣命,天生的基礎資料提供者,老闆說要有山便有了山,老闆說要做實時數據處理分析,便有了Storm,老闆說要做開源,便有了Hadoop,老闆還說要做迭代挖掘,便有了Spark……四、科學家。他們是別人眼中的Geek,他們是別人眼中的高大上,他們是類似於霍金一樣的神秘的早出晚歸晝伏夜出的眼睛男女,他們是驅動世界技術進步的核心力量。除了世界頂級的IT公司(往往世界技術方向掌握在他們手中),其他公司一般需要1-2個科學家足以,他們是真正投身於科學的人,不要讓他們去考慮業務場景,不要讓他們去考慮業務流程,不要讓他們去計算成本,不要讓他們去考慮項目進度,他們唯一需要考慮的就是如何在某個指標上擊敗對手,在某個指標上提高0.1%已經讓他們可以連續奮戰,不眠不休,讓我們都為這些科學家喝彩和歡呼吧。在中國,我認為真正的大數據科學家不超過百人……五、工程師。工程師是這樣一群可愛的人,他們年輕,沖動,有理想,又被人尊稱為「屌絲」「鍵盤黨」,他們孜孜不倦的為自己的理想而拼搏,每次自己取得一點點進步的時候,都在考慮是不是地鐵口的雞蛋灌餅又漲了五毛錢。他們敏感,自負,從來不屑於和業務人員去爭論。工程師和科學家的不同點在於,工程師需要頻繁改動代碼,頻繁測試程序,頻繁上線,但是最後的系統是由若干工程師的代碼組合起來的。每個自負的工程師看到系統的歷史代碼都會鄙視的發出一聲「哼,這垃圾代碼」,之後便投入到被後人繼續鄙視的代碼編寫工作中去。六、跟風者。他們中有些是培訓師,有些是殺馬特洗剪吹,有些是煤老闆有些是失足少女。他們的特點就是炒,和炒房者唯一不同的就是,他們不用付出金錢,他們認為只要和數據沾邊就叫大數據,他們有些人甚至從來沒碰過IT系統,他們是渾水摸魚、濫竽充數的高手,他們是被前幾種人鄙視的隱形人。不過我想說,歡迎來炒,一個行業炒的越凶,真正有價值的人就更能發揮自己的作用。誤區二:只有大數據才能拯救世界大數據目前的技術和應用都是在數據分析、數據倉庫等方面,主要針對OLAP(Online Analytical System),從技術角度來說,包含我總結的兩條腿:一條腿是批量數據處理(包括MR、MPP等),另一條腿實時數據流處理(Storm、內存資料庫等)。在此基礎上,部分場景又發現MR框架或實時框架不能很好的滿足近線、迭代的挖掘需要,故又產生了目前非常火的基於內存數據處理Spark框架。很多企業目前的大數據框架是,一方面以Hadoop 2.0之上的Hive、Pig框架處理底層的數據加工和處理,把按照業務邏輯處理完的數據直接送入到應用資料庫中;另一方面以Storm流處理引擎處理實時的數據,根據業務營銷的規則觸發相應的營銷場景。同時,用基於Spark處理技術集群滿足對於實時數據加工、挖掘的需求。以上描述可以看出,大數據說白了就是還沒有進入真正的交易系統,沒有在OLTP(Online Transaction system)方面做出太大的貢獻。至於很多文章把大數據和物聯網、泛在網、智慧城市都聯系在一起,我認為大數據不過是條件之一,其餘的OLTP系統是否具備,物理網路甚至組織架構都是重要因素。最後還想說,大數據處理技術,再炫如Google的Dataflow或成熟如Hadoop 2.0、數據倉庫、Storm等,本質上都是數據加工工具,對於很多工程師來說,只需要把數據處理流程搞清楚就可以了,在這個平台上可以用固定的模版和腳本進行數據加工已經足夠。畢竟數據的價值70%以上是對業務應用而言的,一個炫詞對於業務如果沒有幫助,終將只是屠龍之術。任何技術、IT架構都要符合業務規劃、符合業務發展的要求,否則技術只會妨礙業務和生產力的發展。
隨著時代變遷,大浪淘沙,作為數據行業的一員,我們每個人都在不同的角色之間轉換,今天你可能是科學家,明天就會變成架構師,今天的工程師也會變成幾年後的科學家,部分人還終將步入跟風者的行列。誤區三:數據量特別大才叫大數據在「數據界」存在這樣有一波人,他們認為「只有Peta級以上的才叫大數據,甚至到了Zeta以上才叫大數據,目前還沒有到真正的大數據時代!」,每次聽到這樣的話,我就知道這些人受IOE某巨頭的4V理論中的「容量」影響太巨大了。對此,我想說的第一句話是「盡信書不如無書,盡信巨頭不如去IOE」,去IOE不只是要從硬體做起,還要從思想上敢於挑戰巨頭做起,盡管很多IT界的經典理論都是傳統巨頭提出的,但是隨著挑戰者的出現,萌發了新的思想和技術後,傳統巨頭會被慢慢顛覆,這也是我們人類前進向前的一個重要因素。如果我們還停留在迷信巨頭的時代,如此刻板教條的去追求一個概念,那麼就不會有現在的Hadoop,不會有現在的Spark,不會有現在的特斯拉,不會有機器學習人工智慧,更不會有未來的第N次工業革命。首先我想強調,大數據技術真的不是一個新鮮詞,在之前的文章中我已經說過,大數據的本質還是數據,數據這個行業已經發展了若干年,而數據量的規模永遠是超出該時代的想像的,比如十幾年前,一張軟盤的數據量也就1.44M,當時的數據如果達到1T都讓旁人咂舌。那麼按數據量的標准,當時如果有人收集了1T數據就已經進入大數據時代了嗎?顯然不是!所以我想說,數據量的大小並不是衡量大數據的標准,如果按數據量去判斷是否大數據的話,那麼「大數據」這個詞真的是一個偽命題,就如同「老虎比如是老的,小伙必須是小的,巨頭必須是腦袋大的,飛人必須是長翅膀的」這種純粹字面意思去定義的話題一樣。那麼再回過來說,大數據的概念是什麼?首先,大數據是一個完整的生態體系,從數據的產生、採集、加工、匯總、展現、挖掘、推送等方面形成了一個閉環的價值鏈,並且通過每個環節的多種技術處理後,為所在業務場景提供有價值的應用和服務。其次,大數據的核心是什麼?一方面是開源,一方面是節流,目前大數據技術的核心目標都是通過低成本的技術更好的滿足對數據的需求(尤其是處理近年來更多的非結構化數據),並在在滿足需求的基礎上盡可能多的為企業節省投資。說一千道一萬,大數據的核心理念還是滿足應用需求,有明確目標的技術叫生產力,沒有業務目標的技術叫「浪費生命力」。誤區四:為了大數據而大數據這個誤區我認為是目前最嚴重的。在部分企業中,追求技術一定要最新、最好、最炫,一定要拿到國際先進、世界一流才行。所有的企業,不分行業不分性質不分地域不分年代,一律高喊「趕超BAT,大數據助力**企業達到**目標」,接下來就是先去IOE,然後投資買集群,把之前的各種高性能小型機大型機都不用了,之前買的O記授權全部停了,之前的幾十年投資一夜之間作廢,又投入了更多的資源去追趕「大數據」。同學們,這種勞民傷財的事情相信大家每天都會聽到或者親眼看到,很多企業不計成本就是為了博領導一笑,這得是多麼大的誤區啊。對此我想說:第一,從技術上來說,比如BAT或者很多互聯網企業去追求大數據,是因為業務發展的需要。任何一個互聯網企業一出生就是為了流量和點擊而活著,這就意味這大量的非結構化數據需要進行快速處理,這時候就決定了互聯網企業只能通過一些並發手段去分解底層的數據,然後進行快速加工,並滿足其服務用戶和市場的需要。互聯網企業的業務流程和業務模型就決定了必須得採用大數據技術。反之,很多企業根本用不著這些技術,有些企業簡單的一兩個Excel文件裡面做幾個公式就可以滿足它的發展,而且數據的周期還是按月處理的,根本不需要運用這些技術。第二,從投資上來說,互聯網企業出生都是平民,根本買不起大型設備,就算一夜暴富後,也沒有一個傳統的小型機大型機可以更好的滿足它們的發展,故只能另闢蹊徑創造價值鏈和標准了,在之前的低投資、輕量級架構上,不斷進行小量的線性硬體投資滿足業務的發展。反倒是一些傳統企業,甚至是巨無霸,其投資計劃已經在一年前明確,而且在原來的基礎上投資會更有ROI(投資回報率),現在反倒為了追求大數據的口號,犧牲了之前的大量投資,除了「得不償失」,剩下的只能是滿地的節操了。大數據技術甚至任何一種技術都是為了滿足特定的業務目標而生的,在具備了明確的業務目的後,順勢設計符合自身業務架構的技術架構,才是一種科學的健康的發展觀。如果您是一位老闆、CEO或者投資人,千萬要明白,大數據技術對於企業來說,有時候像水,而企業的業務目標就是那艘船,「水能載舟,亦能覆舟」。隨著生產關系的不斷調整,又會出現若干輪生產力的不斷進步,大數據之後的技術也會日新月異的進步著,比如現在開始潮流涌現的「機器學習、深度學習」等諸多的人工智慧方面的技術,也出現了比如「小數據」、「微數據」等更細方向技術的細分,在技術的洪流到來時,只要保持清晰的以滿足業務為導向的頭腦,根據自身的業務需要設計自身的技術架構,就不會被各種流派,各種概念淹沒。

『陸』 企業應用大數據技術存在誤區介紹

目前大數據很火,但是實際情況並不像大數據供應商說的那樣,企業採用了大數據就會產生商機。目前企業對於大數據有三個認識誤區,分別是大數據技術會自行識別出商機、就是掌握的數據越多,自動創造出的價值也越多、好的數據科學家會為你發現價值,下面就來進行一下企業應用大數據技術存在誤區介紹。

『柒』 大數據中存在哪些誤區

1.大數據是新時代的新玩意



事實上,數據分析一點也不新。早從數百年前的啟蒙時代,學者們便已開始遵循科學方法,一步步拆解事物形成背後的原因。科學家先觀察,取得並分析數據,歸納出假說,然後再經過不斷實證,逐漸形成定律。因此我們說的大數據,充其量只是科學方法的應用。



2.100TB以上才叫大數據



數據的大小,事實上沒有明確的界線。更重要的,數據的大小,不一定有意義。數據大,也不代表一定能做出准確的預測─假設你擁有地球70億人口的姓名、性別、生日、身高、體重、膚色、視力,以及他們的上網行為等種種數據,如果題目是要預測他們明年的收入分布,這個龐大的資料庫,恐怕還是無法幫上你什麼。所以數據在精不在多,重點是要達成的任務,不是儲存的數量。



3.數據非常客觀



採集數據的軟硬體,是人為設計的,因此不可能做到絕對的客觀。手機停留在某個畫面,就代表你在欣賞這個內容嗎?很難說,或許你只是在跟旁邊的朋友聊天。對某個發文點贊,就代表你真心喜歡這則資訊嗎?也很難說,說不定只是喜歡發文的人,或是手滑不小心按到。



4.數據可以告訴你不知道的內幕



就像字面顯現的,數據只能告訴你不知道的數據。但它究竟代表什麼樣的內幕,必須要靠歸納者自行去解讀。舉例來說,分析你的App使用者資料後,發現21-30歲女性族群佔比最大,這可能代表著你的App對這種人最有吸引力,但也可能代表當初推廣團隊在發廣告時,比較針對這樣的族群。究竟事實是什麼?往往需要更進一步的綜合比較、實驗分析,才能逼近。



5.大數據是資訊部門的問題



大數據的收集與儲存,的確可以歸類為資訊部門的業務。但定義該收集什麼,如何收集,收集後該如何應用,絕對是業務主導部門該負責的。要求IT部門把大數據做好,就好像要求財務部門提升公司獲利一樣,是本末倒置的。



關於大數據中存在哪些誤區,青藤小編就和您分享到這里了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。

『捌』 關於大數據的誤區,你中了幾個

誤區1:大數據無處不在


目前,大數據技術和服務確實是使用率創歷史新高的行業的關注焦點。但是,Gartner的大數據事實和數據顯示,在所有組織中,只有73%的組織正在計劃和投資大數據。但是,它們仍處於大數據採用的萌芽階段。


誤區2:大數據都與大小有關


大數據的特點是5V——Volume(體積)、Velocity(速度),Variety(品種),Veracity(准確性)和Value(值)。雖然處理大量數據是大數據的主要特徵之一, 然而數量僅僅是大數據的主要定義特徵。此外,數據的其他功能同樣重要。


誤區3:大數據可以預測業務未來的一切


分析可以使用大數據預測趨勢,但不是推動業務發展的數據。企業有許多因素,如經濟,人力資源,技術等等。因此,當涉及到預測業務的未來時,您無法通過數據預測某些事情。


誤區4:大數據意味著大預算,而且適用於大公司


我們已經看到像跨國公司和政府機構這樣的組織投入巨資建立大規模數據中心和高端技術來實施大數據。不僅如此,聘用熟練的大數據專業人員和數據科學家也是一件非常昂貴的事情,因為他們的需求因市場資源緊張而很高。


誤區5:機器學習概念與大數據有關


機器學習經常處理大數據。但是,機器學習的基本概念是使用這些數據來建模底層流程以便更好地利用。此外,機器學習完全基於機器學習演算法,該演算法可以解析數據集,然後應用通過它學習的內容來做出有意義的決策。


關於大數據的誤區,該如何下手的內容,青藤小編就和您分享到這里了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。

『玖』 大數據誤區有哪些

1、大數據誤區——大數據≠擁有數據


很多人認為擁有數據,尤其是擁有大量數據,就是大數據。這絕對不是真的。大量的數據並不是大數據。但是,保險公司可以利用氣象大數據預測自然災害,調整自然災害相關的保險費率,從而發展其他商業價值,形成大數據的商業環境。因此,利用大數據,甚至關聯、交流,都能產生真正的價值,形成DT時代獨特的大數據業務。


2、大數據誤區——大數據≠報告平台


有很多公司建立了自己的報告中心,或者大屏幕演示中心,然後馬上宣布他們已經實現了大數據,但這還不夠。雖然報告也是大數據的一種形式,但真正的大數據業務並不是生成報告供人們指導,而是隱藏在大數據表象下的一套報告系統。在大數據的閉環系統中,一切都是數據的生產者和用戶。通過自動智能閉環系統、自動學習和智能調節,提高了整體生產效率。


3、大數據誤區——大數據≠計算平台


我看過一篇報道,是關於一家金融機構建立了自己的大數據系統。稍後進一步觀察會發現,它已經設置了一個擁有數百台機器的Hadoop集群。大數據計算平台作為大數據應用的技術基礎,是大數據閉環中非常重要和不可缺少的一部分。但是,不能說有了計算平台就有了大數據。例如,如果我買了一個鍋,我不能說我有一個盤子。從鍋到菜,我還需要原材料(數據),工具(加工工具)和廚師(數據處理)來完成最後的製作。


4、大數據誤區——大數據≠精準營銷


我見過很多創業公司在做大數據。如果你仔細觀察,你會發現他們所做的是一個基於大數據、廣告投資等的推薦引擎。這是大數據嗎?他們所做的就是大數據的應用,可以說是大數據的一種。只是大數據的整個生態系統不能這樣表達。就像大象的耳朵是大象的一部分一樣,它們並不代表大象。


有哪些大數據誤區?想做好大數據工程師就要注意這些,當一個新的數據洞察或者大數據應用出現的時候,很多人認為擁有數據,尤其是擁有大量數據,就是大數據。這絕對不是真的,你能處理好嗎?如果您還擔心自己入門不順利,可以點擊本站其他文章進行學習。

『拾』 揭露大數據五大誤區

揭露大數據五大誤區
在如此多關於大數據的炒作下,IT管理者很難知道該如何挖掘大數據的潛力。Gartner指出關於大數據的五大誤區,以幫助IT管理者制定他們的信息基礎設施戰略。
Gartner研究總監Alexander Linden表示:「大數據提供了巨大的機會,但也帶來了更大的挑戰。海量的數據並沒有解決數據固有的問題。IT管理者需要破除各種炒作,根據已知的事實和業務驅動的結果指導行動。」
誤區1:在採用大數據方面其他人都比我超前
人們對於大數據技術和服務的興趣達到了前所未有的高度,有73%的受訪企業已經投資或者計劃投資大數據。但是大多數企業機構仍然在採用大數據的初期階段,只有13%的受訪者已經部署了大數據解決方案(見圖1)。
圖1、2013年和2014年大數據採用的階段
注釋:Gartner向每位受訪者提問,「以下哪5個階段可以最好地描述你企業機構採用大數據的階段?」
2014年n = 302,2013年n = 720。來源:Gartner(2014年9月)
企業結構面臨最大的挑戰是確定如何從大數據中獲取價值,以及確定應該從哪裡開始。許多企業機構卡在試點階段,因為他們沒有將技術與業務流程或者具體的使用實例聯系起來。
誤區2:我們有這么多的數據,我們並不需要擔心一個小小的數據缺陷
IT管理者認為,目前企業管理如此多的數據使得單個的數據質量問題變得微不足道,因為「大數據法則」。這個觀點認為,單個數據質量缺陷並不影響整個數據分析的結果,因為每個缺陷只是企業機構內海量數據非常小的一部分。
Gartner副總裁Ted Friedman認為:「事實上,盡管單個缺陷對於整個數據集的影響要比數據量少的時候小一些,但是因為數據更多了所有缺陷也就更多了。因此,糟糕的數據質量對於整個數據集的影響還是一樣的。除此之外企業機構在大數據背景下使用的大多數數據都是來自於外部的,或者是未知結構和未知來源的。這意味著出現數據質量問題的可能性要比以前更高,因此數據質量實際上在大數據背景下變得更為重要了。」
誤區3:大數據繼續將消除對大數據整合的需求
一般觀點認為,大數據技術——尤其是通過在用模式方法處理信息的潛力——將使得企業機構要使用多種數據模型來讀取相同的數據源。很多人相信這種靈活性將讓終端用戶確定如何按需地將各種數據集進行轉譯。他們認為,這也將提供滿足單個用戶需求的數據訪問。
在現實中,大多數信息用戶重度依賴於「在寫模式」,在這種場景下數據被描述、內容被預先描述,因此關於數據完整性以及與場景的相關性已經達成了統一。
誤區4:為高級分析使用數據倉庫是沒有意義的
很多信息管理的領導者認為,構建一個數據倉庫是消耗時間且沒有意義的,因為高級分析使用新型的數據而不僅僅是數據倉庫。
現實是,很多高級分析項目在分析過程中使用的正是數據倉庫。在其他一些情況下,信息管理人必須提煉作為大數據一部分的新數據類型,使其適合於分析。他們需要確定哪些數據是相關的,如何聚合這些數據,以及數據質量的等級,而且這種數據提煉可能是發生在很多地方的,不僅僅是資料庫。
誤區5:數據湖將取代數據倉庫
很多廠商將數據湖定義為用於分析各種來源的原始格式數據的企業數據管理平台。
現實是,廠商將數據湖定位為數據倉庫的替代品或者作為客戶分析技術設施關鍵要素是容易引發誤導的。數據湖的基礎技術缺乏已有數據倉庫技術功能特性的成熟型和廣度。Gartner研究總監Nick Heudecker表示:「數據倉庫已經具有支持整個組織上下各種用戶的能力。信息管理者沒必要等著數據湖迎頭趕上。」

閱讀全文

與大數據應用的誤區相關的資料

熱點內容
西班牙言情電影 瀏覽:85
a標簽如何直接下載一個文件 瀏覽:777
多女主多鼎爐的小說 瀏覽:531
洪金寶元華元彪越南電影 瀏覽:340
win10ghost好么 瀏覽:207
java怎麼添加滾動條 瀏覽:946
qt生成excel文件 瀏覽:374
如何徹底清除用戶數據 瀏覽:590
假期去看了一場電影英文翻譯 瀏覽:171
香水在哪個網站買 瀏覽:481
學習編程需要掌握哪些英語 瀏覽:510
win10投射到安卓平板 瀏覽:973
qq密碼手機怎麼解除 瀏覽:548
ie8非同步上傳文件 瀏覽:91
如何組建企業網路 瀏覽:563
xp系統新建文件夾的快捷鍵 瀏覽:222
美國戰斗機電影大全 瀏覽:783
主角穿越電影世界,第一個世界是超能失控 瀏覽:477
大胸的日本電影 瀏覽:965
桌面的網路圖標不見了怎麼辦 瀏覽:86

友情鏈接