導航:首頁 > 數據分析 > 數據開發怎麼設計介面模型

數據開發怎麼設計介面模型

發布時間:2024-04-10 15:28:46

⑴ 數據倉庫數據建模的幾種思路

數據倉庫接典型的兩種數據倉庫建模的理論是維度建模和基於主題域的實體關系建模,這兩種方式分別以Kimball和Immon兩位大師為代表。維度建模以數據分析需求為驅動,倡導匯流排架構:一致的事實和一致的維度,這種數據模型易於用戶理解和數據分析操作。基於主題域的實體關系建模以源系統數據為驅動,整合企業的所有數據,站在企業級的高度對數據進行抽象,整合,採用3NF的實體關系理論建模,這種數據建模方式以更為抽象的方式嘗試建立一個相對穩定的數據模型,並能描述企業級的數據關系。在工業界往往把兩種方式結合起來運用數據倉庫的不同數據層次結構中。
我們上周主要是針對採用基於主題域的實體關系建模中數據整合的方式進行較為深入的討論,討論了以下三種思路:
以屬性聚集的方式同一主題域中不同實體的屬性。比如對於會員、公司、客戶等等實體對象我們都有地址屬性信息、名稱標識屬性信息等等,這種思路就是把屬性內聚性高的欄位整合在一起,並把不同的屬性打上類型標識以樹表的形式存放。它的優點是:第一,模型穩定性好,外圍系統變化了欄位,只需要添加不同的類型,不需要進行表結構的變更;第二,減少大量冗餘記歷史數據。它的缺點是:第一,丟失了很多實體的屬性標識信息,我們從模型上將看不到一個會員究竟有哪些地址屬性,只能通過查詢類型代碼才能獲取這些信息;第二,它極度的膨脹數據表的記錄數,因為它採用豎表的形式存放;第三,應用起來很難,效率是一個大問題,因為我們往往要使用一個實體的多個欄位,就會有很多join操作和豎轉橫的操作。第四:屬性聚集也是一件比較難操作的過程,應為這是一個抽象的過程,對建模人員的業務背景知識和抽象能力都提出了很高的要求;第五:雖然減少了冗餘的記歷史數據,但是記歷史的操作也較為復雜。
採用面向對象建模的方式,抽象不同實體的共同屬性,然後再一步步採用繼承、組合等面向對象的思想具體化實體。他的優點是模型模型概念比較清晰,缺點也是模型相對不是很穩定,整合後的數據的後續應該也面臨重新組合的問題。
貼源的建模方式:
採用基本保持源系統的方式進行建模,重點放在數據的標准化,一致化,和數據業務意義的梳理。這種做法和我們目前數據倉庫的做法比較類似。它具有實施比較容易,快速實現,前台可以直接使用數據;缺點是整合度不高,模型不穩定。
模型終究是為數據分析應用服務的,具體採用什麼方式建模需要根據實際業務特點和源系統的特點決定。阿里巴巴的源系統具有變化快,數據分析應該變化快的特點,響應速度也要快的特點,而且我們要求不同系統之間整合的需求並不是很大,往往深度的數據整合帶來的是應用上的不方便。因此,我個人覺得採用貼源的方式是當前更優的方案。

閱讀全文

與數據開發怎麼設計介面模型相關的資料

熱點內容
做編程為什麼不用去公司上班 瀏覽:646
ps中復位工具 瀏覽:332
在電腦上是如何編程 瀏覽:695
vs2005mfc教程 瀏覽:915
把手機里的文件刪除會如何 瀏覽:195
蘋果手機電腦版文件手機怎麼打開 瀏覽:878
八位數字組合的密碼 瀏覽:18
紅米note怎麼分享wifi密碼 瀏覽:798
ps文件里怎麼載入pat文件 瀏覽:114
會計要准備哪些文件標簽 瀏覽:651
電腦盤找不到文件 瀏覽:147
文件存放路徑英文翻譯 瀏覽:229
msu後綴是什麼文件 瀏覽:886
施樂圖片保存位置或文件名無效 瀏覽:165
老黃島哪裡有學習編程的 瀏覽:892
大數據策劃公司 瀏覽:879
寫文app或者網站哪些靠譜 瀏覽:761
ad18能打開brd格式文件嗎 瀏覽:291
抖音短視頻如何看後台數據 瀏覽:757
如何取數據前幾位 瀏覽:415

友情鏈接