導航:首頁 > 網路數據 > 大數據審計都研究什麼問題

大數據審計都研究什麼問題

發布時間:2021-03-04 04:14:35

Ⅰ 轉:大數據到底要研究什麼

外行人一看就知道是要讓所有東西都聯上網際網路。後來,又是雲計算,說是要把計算放到雲里去。雲在哪裡呢?反正在遠處,也還可以理解。最近,在計算機軟體領域,到處都在喊大數據。這有點不好理解。數據(data)是個不可數名詞,怎麼來大小了?我自己也一樣,最近大致學習了一下,看大數據究竟要研究什麼?提出來拋磚引玉吧!
何謂「大」數據?70年代若干兆位元組(MB)就算大量數據了,以後是千兆位元組(GB)、兆兆位元組(TB),而現在已經到了PB級(1PB=1024TB),而高端數據倉庫已達EB級(1EB=1024PB)。反正是千倍千倍的往上翻。想想,光是全世界各地裝的攝像頭有多少,每時每刻都在產生數據。唱歌、通話、錄音產生多少數據。多少億人上網、發微博,多少數據!有了網際網路,這些數據就都在網上流通,而不是死在那裡。票子不流通就沒有價值,數據也一樣。數據不利用也毫無價值。所以,的確每天都產生大量的數據,需要處理。所以有大數據,而且需要處理。這一點,沒有疑義。 在計算機領域,早就有資料庫分支,後來發展到數據倉庫,也有人叫海量數據處理。現在又提出所謂「大數據」。有了網際網路以後,數據的一個重要特徵是互動性和動態性,就是說任何用戶既可以下載,也可以上傳,也可以實時對話。例如在線商務,政府的群眾情緒分析,衛生部門的流行病疫情分析,社會科學家研究社會網路如何擴散社會呼聲及如何有效處理。但是,這些都屬於大數據技術的應用,雖然每一個都需要一個應用程序,但不屬於大數據技術本身。可這些都要求支持大量數據的計算、搜索和存儲。因此,大數據分析和管理成為當今計算領域最關鍵性的挑戰。 有人認為,大數據主要是數理統計,對大量同類型數據進行統計分析。這屬於數理統計學科,不屬於計算學科。也有人認為,大數據主要是數據挖掘、機器學習。這倒有點靠譜。但是,數據挖掘、機器學習是另外兩個學科領域。不能把數據挖掘、機器學習包括在大數據的研究范圍之內。大數據是資料庫發展而來的。資料庫要做的是數據的組織、存儲和管理。關系資料庫比較容易創建和存取,而且容易擴充。在資料庫創建之後,一個新的數據種類能被添加而不需要修改所有的現有應用軟體。並行資料庫的SQL語言應運而生。但是,大數據來了以後,沒有一個設備能存儲這么大量的數據,它必須存儲在許多的存儲設備中。一個硬碟即使能存1TB,對於EB的數據也無濟於事。而且,讀寫都很費時。串列地組織、管理、搜索這么大量的數據,用多麼快的計算機都無能為力。因為超級計算機可以計算得很快,但與存儲設備的輸入輸出快不了。所以,串列根本是不可取的,必須並行化。當前的大數據基本都運行於網路化的計算機群(Cluster of computers)上,每一個都有自己的處理器、存儲器和硬碟。數據分布在多個計算機機群上,通常採用哈希分塊,或者按范圍、隨機分塊,或者隊列,其處理一般用並行基於哈希的分而治之的演算法。這里,「分布」和「並行」成了兩個關鍵詞。不可想像,能有一個計算機來管理整個計算機機群。更新、搜索數據都必須是分布式的,而且不能串列,一個一個地來做。Google開發了一個谷歌文件系統(GFS),可以在成百上千的機群里進行基於字元串的文件搜索。用戶可以並行地加入數據,也可以實時地把數據加入到某一類中(MapRece)。Yahoo和其他Web公司,譬如Facebook,搞了一個谷歌大數據棧的開源軟體,從而產生了現在很時髦的Hadoop平台及HDFS存儲層。為了要實現在線事務處理(OLTP),容錯不可少。由於上億用戶的同時使用,OLTP系統必須很快查找、更新用戶資料,任務很多,要快、不能錯、防攻擊,而且還不能太貴。Google和Amazon都開發了他們自己的系統。今天,Hadoop和HDFS已經成為大數據分析佔有統治地位的平台了。數據分析不能停留在MapRece水平,而是要更高層次的說明性語言,更容易表達、書寫、找錯。這樣的語言大家都在搞。這樣,問題就來了:我們是跟著這些大公司,跟蹤和改進Hadoop,還是另闢蹊徑。我們搞跟蹤搞了幾十年了,基本都用人家的,然後搞漢化。人家搞漢化甚至比我們還快。我們搞出來的東西常常沒人家好用,市場就先入為主,被人家佔領了。另外搞一個類似的東西,既搶不到市場,學術價值也不大。這時候,科學研究就見功力了。抓不住基礎性問題,沒有全新的想法,就很難出原始創新的成果。 歸根結底,基礎性問題是大數據的分布存儲,並行處理。就像一個人有一個任務,需要許多人參與才能完成,而且他們互不相識,任何個人都完不成。應該怎麼做?大家想想,也許能把這個問題說得更加確切一些。

Ⅱ 當前審計研究的熱點問題有什麼

1、論審計全覆蓋的可行性(審計長比較重視)
2、審計系統垂直管理後,如何整合審計力量
3、如何有效利用大數據系統開展審計工作。
4、影響計算機輔助審計發展的因素分析

Ⅲ 如何利用大數據開展審計工作

數據可以反映問題,大數據管理是審計的一個非常有效的工具
首先明確你版們企業需要審計的方向權:比如量、價格等等,有了方向之後,再有針對性的收集數據、分析數據,你就會看到很多問題。再結合發現的問題,到項目現場實地踏勘,找尋原因。

Ⅳ 什麼是大數據審計

就是說找到這些數據之後,然後根據一些軟體自動對這些數據進行判斷收集。

閱讀全文

與大數據審計都研究什麼問題相關的資料

熱點內容
李采潭老師勾引學生哪一部 瀏覽:44
全免費vip影視 瀏覽:150
主角是無恥採花賊的小說 瀏覽:287
百度雲小說txt下載 瀏覽:947
iphone手機訪問電腦共享文件 瀏覽:673
北京送快遞的那個電影叫啥 瀏覽:652
國有銀行哪些銀行app值得用 瀏覽:940
主角很能生孩子的小說 瀏覽:452
常識修改器系統類型小說 瀏覽:288
加微信少婦號碼是多少 瀏覽:728
plc入門編程軟體有哪些 瀏覽:79
python怎麼讀取資料庫 瀏覽:762
邵氏武俠10000部 瀏覽:644
網站如何寫原創內容 瀏覽:275
尋夢環游記原片是什麼語 瀏覽:584
supportapplecom官網 瀏覽:323
日韓電影愛情片 瀏覽:703
最新新人母乳電影 瀏覽:646
網頁能直接看的那種 瀏覽:22
最火編程軟體有哪些 瀏覽:952

友情鏈接