數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)中ERP的應(yīng)用
文:鼎捷ERP
作者:鼎捷數(shù)智 | 發(fā)布時間:2012-11-30 14:50:34
摘要:體系化環(huán)境的層次反映了數(shù)據(jù)與應(yīng)用邏輯的抽象程度,可很好地與企業(yè)實際的部門組織結(jié)構(gòu)對應(yīng)起來,提高企業(yè)應(yīng)用數(shù)據(jù)倉庫的效率。由于數(shù)據(jù)倉庫的數(shù)據(jù)量大,直接在數(shù)據(jù)倉庫上進行挖掘,會影響挖掘的效率,因此數(shù)據(jù)的挖掘一般不在數(shù)據(jù)倉庫上直接進行,而是要單獨的建立數(shù)據(jù)挖掘庫。
ERP是Enterprise Resources Planning的簡稱,即為企業(yè)資源計劃,是20世紀(jì)90年代發(fā)展起來的企業(yè)信息管理系統(tǒng)。ERP的內(nèi)在含義是指利用計算機技術(shù),將企業(yè)內(nèi)部和外部資源信息按照成本管理原則分類整理所形成的信息管理系統(tǒng)。它的主要宗旨就是籽企業(yè)各方面的資源(包括人,財,物、產(chǎn)、供、銷等方面)充分調(diào)配和平衡,使企業(yè)在激烈的市場競爭中能夠合理地配置企業(yè)內(nèi)部與外部的資源,全方位地發(fā)揮各方面的能量,從而使企業(yè)取得更好的經(jīng)濟效益。ERP在我國的應(yīng)用起步比較晚,取得成功的企業(yè)更是少之又少。為了加強ERP在我國企業(yè)應(yīng)用的成功率,必須結(jié)合我國的實際情況,并輔之以其它先進技術(shù)。把數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)應(yīng)用到ERP中,增強傳統(tǒng)ERP的決策功能,就是一種新的嘗試。
1、數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是支持管理過程的、面向主題的、集成的、穩(wěn)定的、不同時間的數(shù)據(jù)集合,以支持經(jīng)營管理中的決策制定過程。它的四個基本特征是:1、數(shù)據(jù)倉庫中的數(shù)據(jù)是面向主題進行組織的;2、數(shù)據(jù)倉庫的數(shù)據(jù)是集成的;3、數(shù)據(jù)倉庫的數(shù)據(jù)是穩(wěn)定的;4、數(shù)據(jù)倉庫的數(shù)據(jù)是隨著時間不斷變化的。
數(shù)據(jù)倉庫系統(tǒng)的基本體系結(jié)構(gòu)。作為一個系統(tǒng),數(shù)據(jù)倉庫至少應(yīng)包括三個基本的功能部分:數(shù)據(jù)獲取、數(shù)據(jù)存儲管理和信息訪問。
數(shù)據(jù)倉庫的體系化環(huán)境是一種四層體系化環(huán)境,它是在一個企業(yè)或組織內(nèi),由各面向應(yīng)用的OLTP數(shù)據(jù)庫及各級面向主題的數(shù)據(jù)倉庫所組成的完整的數(shù)據(jù)環(huán)境,在這個數(shù)據(jù)環(huán)境上建立和進行一個企業(yè)或部門的從聯(lián)機事務(wù)處理到企業(yè)管理決策的所有應(yīng)用。
對數(shù)據(jù)庫體系環(huán)境的一個簡單描述,它分四個層次:操作型環(huán)境、全局級數(shù)據(jù)倉庫、部門級的局部倉庫和個人級的數(shù)據(jù)倉庫。
體系化環(huán)境的層次反映了數(shù)據(jù)與應(yīng)用邏輯的抽象程度,可很好地與企業(yè)實際的部門組織結(jié)構(gòu)對應(yīng)起來,提高企業(yè)應(yīng)用數(shù)據(jù)倉庫的效率。企業(yè)采用這種四層體系化結(jié)構(gòu),即可在全局統(tǒng)一的數(shù)據(jù)倉庫的基礎(chǔ)上,各部門再發(fā)展自己的數(shù)據(jù)集成,是解決企業(yè)信息系統(tǒng)問題的有效途徑。
2、數(shù)據(jù)倉庫與ERP的關(guān)系
(1)數(shù)據(jù)倉庫之外的EPP應(yīng)用系統(tǒng)
數(shù)據(jù)倉庫的經(jīng)典結(jié)構(gòu)包括為轉(zhuǎn)換處理提供數(shù)據(jù)的操作型應(yīng)用程序、數(shù)據(jù)倉庫、DSS處理,如數(shù)據(jù)集市、DSS應(yīng)用程序以及數(shù)據(jù)挖掘和探索型數(shù)據(jù)倉庫。對于ERP,數(shù)據(jù)倉庫的基本結(jié)構(gòu)并沒有變化。
ERP環(huán)境將數(shù)據(jù)提供給數(shù)據(jù)倉庫的接口與非ERP環(huán)境的接口是很相象的,但也有以下不同之處:①ERP接口只需要處理ERP所支持的DBMS技術(shù),而非ERP接口必須處理所有的接口技術(shù);②由于ERP供應(yīng)商擁有和控制著該接口,用戶能更好地把握構(gòu)成應(yīng)用程序環(huán)境的數(shù)據(jù)和結(jié)構(gòu);③該接口經(jīng)常需要進入到ERP環(huán)境,找到正確的數(shù)據(jù)并把它們”粘“到—起以使得這些數(shù)據(jù)在數(shù)據(jù)倉庫中是有用的。
?。?)建造在ERP內(nèi)部的數(shù)據(jù)倉庫
數(shù)據(jù)倉庫可以建造在ERP環(huán)境之中,SAP的BW和PeopleSoft的EPM就是如此。在這種情況下,ERP產(chǎn)品供應(yīng)商同時提供了應(yīng)用程序和數(shù)據(jù)倉庫。其主要的優(yōu)點是ERP供應(yīng)商提供了邀個體系結(jié)構(gòu),這就節(jié)省了大量的設(shè)計工作,并且降低了設(shè)計和開發(fā)的復(fù)雜程度。簡而言之,將數(shù)據(jù)倉庫包含在ERP應(yīng)用中極大地簡化了數(shù)據(jù)倉庫的設(shè)計工作。此外,這種方式還降低了長期維護的難度。
(3)通過ERP和非ERP系統(tǒng)為數(shù)據(jù)倉庫提供數(shù)據(jù)
因為將數(shù)據(jù)倉庫納入ERP應(yīng)用之后,客戶就有了完整的解決方案,因此這是一種常見的選擇。然而,也存在別的選擇,一個數(shù)據(jù)倉庫可以建在ERP環(huán)境之外。同時非ERP系統(tǒng)也向該數(shù)據(jù)倉庫提供數(shù)據(jù)。
由于存在非ERP數(shù)據(jù)和ERP數(shù)據(jù)的集成問題,大多數(shù)企業(yè)并沒有一個完整的ERP環(huán)境。非ERP應(yīng)用系統(tǒng)總是存在的,在這種情況下,兩種類型的數(shù)據(jù)必須要集成在一起。企業(yè)經(jīng)常在構(gòu)建ERP環(huán)境的同時為他們的非ERP數(shù)據(jù)建立數(shù)據(jù)倉庫。當(dāng)ERP環(huán)境完成時(或至少在功能上完成時)。非ERP數(shù)據(jù)的數(shù)據(jù)倉庫也己經(jīng)建立。在需要將ERP數(shù)據(jù)放入數(shù)據(jù)倉庫的時候,將ERP數(shù)據(jù)從ERP環(huán)境中取出移入數(shù)據(jù)倉庫是一件簡單的事情。
3、ERP數(shù)據(jù)倉庫設(shè)計中的關(guān)鍵技術(shù)
?。?)數(shù)據(jù)的裝載
在數(shù)據(jù)裝載到數(shù)據(jù)倉庫中時首先要定義良好的數(shù)據(jù)清洗規(guī)則,保證數(shù)據(jù)的質(zhì)量;其次對不同的功能要盡量做到模塊化,以提高模塊的重用性;再次,因為裝載需要經(jīng)常進行,數(shù)據(jù)可能會定期進行抽取,所有要優(yōu)化裝載程序,提高裝載效率;較后不同的裝載程序要在不同的時間運行,因此要確定一個合理的數(shù)據(jù)抽取計劃。
(2)聚合
數(shù)據(jù)從ERP系統(tǒng)抽取到目標(biāo)數(shù)據(jù)倉庫后,為了進一步提高查詢系統(tǒng)性能,較大限度地減少查詢響應(yīng)時間,以便更好地服務(wù)與決策支持,在設(shè)計數(shù)據(jù)倉庫時,針對不同的用戶,不同的查詢要求。采用聚合設(shè)計導(dǎo)出了大量與聚合相對應(yīng)的實體化視圖,存儲匯總數(shù)據(jù),大大提高了易用性。但用戶的需求往往是不斷變化的,不可能預(yù)先定義所有的聚合,可以采用聚合導(dǎo)航器建立新的聚合。一旦新的聚合建立起來,將會通知聚合管理器,并在數(shù)據(jù)庫管理系統(tǒng)范圍內(nèi)的匯總或全局表中注冊,使可提供給用戶查詢使用。
?。?)數(shù)據(jù)模型
數(shù)據(jù)倉庫的實現(xiàn)是從邏輯模型到物理模型的轉(zhuǎn)換過程,數(shù)據(jù)倉庫的邏輯模型主要有:星形模型和雪花模型兩種。一個簡單的星形模式由一個事實表和多個維表組成。設(shè)計的方法簡單,容易實現(xiàn),但不能表示數(shù)據(jù)的多維層次結(jié)構(gòu);而雪花形模式卻彌補了星形模式的不足,對維表進行了擴展,用添加子維表的方式來表示數(shù)據(jù)的維層次,使結(jié)構(gòu)清晰。在ERP系統(tǒng)中,很多數(shù)據(jù)集合的維具有復(fù)雜的層次結(jié)構(gòu),如時間維由屬性集合(年、季、月、星期、日)構(gòu)成。ERP數(shù)據(jù)倉庫的第一層可以考慮采用星型模型,第二層可以考慮選擇雪花模型。這樣能更好地滿足不同層次的用戶的需要,表達數(shù)據(jù)的維層次結(jié)構(gòu)。
(4)聯(lián)機分析處理的數(shù)據(jù)清理和數(shù)據(jù)挖掘
由于訪問ERP數(shù)據(jù)倉庫的用戶分布于不同的部門和組織,主要通過Internet/Intranet訪問信息,因此OLAP采用三層結(jié)構(gòu)模式。OLAP服務(wù)器用來對數(shù)據(jù)倉庫中的數(shù)據(jù)進行多維化或預(yù)綜合處理,形成多維視圖,使用戶能從多角度、多側(cè)面、多層次地分析數(shù)據(jù),為具有明確查詢分析需求的用戶提供高性能的決策支持。
針對OLAP和ROLAP的特點,設(shè)計ERP數(shù)據(jù)倉庫時,數(shù)據(jù)倉庫的第一層數(shù)據(jù)采用ROLAP技術(shù)管理,數(shù)據(jù)倉庫的第二層數(shù)據(jù)采用MOLAP技術(shù)管理,這樣既可以滿足用戶對系統(tǒng)性能的要求,同時也能滿足企業(yè)存儲大量細(xì)節(jié)數(shù)據(jù)的要求。
?。?)數(shù)據(jù)挖掘
數(shù)據(jù)挖掘一般都是在數(shù)據(jù)倉庫的基礎(chǔ)上進行的,從數(shù)據(jù)倉庫中直接得到進行數(shù)據(jù)挖掘的數(shù)據(jù)有許多好處。數(shù)據(jù)倉庫的數(shù)據(jù)清理和數(shù)據(jù)挖掘的數(shù)據(jù)清理差不多,如果數(shù)據(jù)在導(dǎo)入數(shù)據(jù)倉庫時已經(jīng)清理過,在做數(shù)據(jù)挖掘的時候就沒有必要再清理了,而且所有的數(shù)據(jù)不一致的問題都已經(jīng)被解決。這樣可以提高效率,節(jié)省挖掘數(shù)據(jù)所需要的時間。由于數(shù)據(jù)倉庫的數(shù)據(jù)量大,直接在數(shù)據(jù)倉庫上進行挖掘,會影響挖掘的效率,因此數(shù)據(jù)的挖掘一般不在數(shù)據(jù)倉庫上直接進行,而是要單獨的建立數(shù)據(jù)挖掘庫。
>上一頁:第二屆中國軟件渠道大會召開
相關(guān)新聞
-
如何控制企業(yè)信息化中的風(fēng)險
摘要:信息化要順利走向成功,必須進行有效的管理風(fēng)險,而認(rèn)識并理解企業(yè)信息化的每一個階段的主要目標(biāo)與工作內(nèi)容,掌握信息化風(fēng)險管理的方法,準(zhǔn)確進行風(fēng)險分析是有效風(fēng)險控制的關(guān)鍵


數(shù)字化管理類
生產(chǎn)控制類
研發(fā)設(shè)計類
AIoT類
鼎捷雅典娜
話題與應(yīng)用






制造業(yè)
流通業(yè)
資源中心
服務(wù)
直播活動
地區(qū)活動
會議活動
了解鼎捷
新聞中心
企業(yè)榮譽
加入鼎捷 
聯(lián)系我們
產(chǎn)品方案
預(yù)約演示
價格咨詢
官方公眾號
1v1專屬客服

掃碼添加專屬客服