什麽叫數據倉庫?
數據倉庫組織的最根本目的就是能夠更加便利,有序的進行倉庫管理,讓倉庫數據化,可以讓管理更加的便利的同時,更加的科學,安全。
數據倉庫中的數據是在對原有分散的數據庫數據抽取、清理的基礎上經過系統加工、匯總和整理得到的,必須消除源數據中的不壹致性,以保證數據倉庫內的信息是關於整個企業的壹致的全局信息。
數據倉庫的數據主要供企業決策分析之用,所涉及的數據操作主要是數據查詢,壹旦某個數據進入數據倉庫以後,壹般情況下將被長期保留,也就是數據倉庫中壹般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。
數據倉庫中的數據通常包含歷史信息,系統記錄了企業從過去某壹時點(如開始應用數據倉庫的時點)到當前的各個階段的信息,通過這些信息,可以對企業的發展歷程和未來趨勢做出定量分析和預測。
擴展資料:
數據倉庫所提供的各種信息,肯定要準確的數據,但由於數據倉庫流程通常分為多個步驟,包括數據清洗,裝載,查詢,展現等等,復雜的架構會更多層次,那麽由於數據源有臟數據或者代碼不嚴謹,都可以導致數據失真,客戶看到錯誤的信息就可能導致分析出錯誤的決策,造成損失,而不是效益。
之所以有的大型數據倉庫系統架構設計復雜,是因為考慮到了未來3-5年的擴展性,這樣的話,未來不用太快花錢去重建數據倉庫系統,就能很穩定運行。主要體現在數據建模的合理性,數據倉庫方案中多出壹些中間層,使海量數據流有足夠的緩沖,不至於數據量大很多,就運行不起來了。