24周年

財稅實務(wù) 高薪就業(yè) 學(xué)歷教育
APP下載
APP下載新用戶掃碼下載
立享專屬優(yōu)惠
安卓版本:8.7.11 蘋果版本:8.7.11
開發(fā)者:北京正保會計科技有限公司
應(yīng)用涉及權(quán)限:查看權(quán)限>
APP隱私政策:查看政策>

會計數(shù)據(jù)倉庫建立探討

來源: 毛華揚 張曉娟 編輯: 2010/12/07 09:25:48  字體:

  【摘要】 會計核算軟件數(shù)據(jù)接口國家標準的頒布,給不同會計軟件之間的數(shù)據(jù)交換提供了一個統(tǒng)一和規(guī)范的格式。隨著數(shù)據(jù)接口標準的推廣實施,利用基于會計核算軟件數(shù)據(jù)接口標準建立的數(shù)據(jù)倉庫,對企業(yè)的財務(wù)進行分析就成為必然。文章從數(shù)據(jù)倉庫的模型設(shè)計,數(shù)據(jù)的采集、轉(zhuǎn)換等方面,對基于國家會計數(shù)據(jù)接口標準建立數(shù)據(jù)倉庫進行了相關(guān)的技術(shù)探討。

  【關(guān)鍵詞】 會計軟件;數(shù)據(jù)接口標準;數(shù)據(jù)倉庫;數(shù)據(jù)模型

  著會計信息化的發(fā)展,我國的會計軟件種類也越來越多,但是往往都自成體系,采用的數(shù)據(jù)庫平臺和數(shù)據(jù)結(jié)構(gòu)也就大不相同。由此使得不同的會計軟件之間,以及會計軟件與會計數(shù)據(jù)相關(guān)的業(yè)務(wù)軟件之間的數(shù)據(jù)交換,形成了一定的障礙。2004年9月20日,GB/T19581—2004《信息技術(shù)會計核算軟件數(shù)據(jù)接口》國家標準的頒布,在很大程度上解決了會計軟件之間數(shù)據(jù)交換的障礙。只要符合會計數(shù)據(jù)接口標準要求,實現(xiàn)會計信息化的單位就很容易將歷年的會計數(shù)據(jù)導(dǎo)出,通過建立數(shù)據(jù)倉庫,并利用會計核算軟件對數(shù)據(jù)倉庫的數(shù)據(jù)進行相關(guān)的財務(wù)分析和決策。同時利用數(shù)據(jù)倉庫對繁多的會計數(shù)據(jù)進行管理,不僅將提高會計數(shù)據(jù)利用率,通過利用數(shù)據(jù)倉庫進行財務(wù)分析,還可以提高管理決策的質(zhì)量。

  一、會計核算軟件標準數(shù)據(jù)接口基本內(nèi)容

  由于目前財務(wù)軟件的平臺復(fù)雜多樣,而這些軟件之間的數(shù)據(jù)沒有一個統(tǒng)一的數(shù)據(jù)規(guī)范,造成不同財務(wù)軟件之間數(shù)據(jù)交流相當困難。GB/T19581—2004《信息技術(shù)會計核算軟件數(shù)據(jù)接口》的頒布主要是對國內(nèi)所有正在使用的會計核算軟件(包括含會計核算功能的會計信息系統(tǒng)、管理信息系統(tǒng)等)規(guī)定統(tǒng)一的數(shù)據(jù)輸出的內(nèi)容和格式。會計核算軟件數(shù)據(jù)接口分兩個部分,一部分是規(guī)定其內(nèi)容,包括電子賬簿、會計科目、科目余額、記賬憑證、報表等;另一部分規(guī)定其輸出的格式要求,包括文本文件的輸出方式和XML 文件的輸出方式,并要求以一定期間為單位導(dǎo)出會計核算數(shù)據(jù)。

  二、數(shù)據(jù)倉庫與接口標準之間的關(guān)系

  William H. Inmon 在1993年寫的《Building the Data Warehouse》論著中,將數(shù)據(jù)倉庫定義為:“一個面向主題的、集成的、隨時間變化的、非易失性數(shù)據(jù)的集合,用于支持管理層的決策過程”。由定義可知,數(shù)據(jù)倉庫的主要特征為:面向主題性、數(shù)據(jù)的集成性、穩(wěn)定性、時變性。通過數(shù)據(jù)倉庫,不同層次的管理人員可以進行各種管理決策的分析。數(shù)據(jù)倉庫中存放的是數(shù)據(jù)的歷史值,并且是靜態(tài)的歷史數(shù)據(jù),可以定期添加,具有低訪問率,高訪問量的特點。而這些數(shù)據(jù)都來源于其他不同的數(shù)據(jù)庫。

  目前的多數(shù)財務(wù)軟件在數(shù)據(jù)庫的選用、數(shù)據(jù)庫的格式上大不相同,導(dǎo)致各財務(wù)軟件之間不能互相交換數(shù)據(jù),也給審計軟件導(dǎo)入財務(wù)軟件的數(shù)據(jù)帶來了一定的困難。而以往數(shù)據(jù)倉庫在財務(wù)上的應(yīng)用,基本上都是面向單個企業(yè)的單獨開發(fā)。GB/T19581—2004《信息技術(shù)會計核算軟件數(shù)據(jù)接口》的頒布,在很大程度上解決了這種障礙。按照會計核算軟件數(shù)據(jù)接口標準的數(shù)據(jù)結(jié)構(gòu)和內(nèi)容,建立一個標準數(shù)據(jù)庫即數(shù)據(jù)倉庫,從而企業(yè)可以根據(jù)會計數(shù)據(jù)接口標準要求,將原數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換為標準規(guī)定的格式,并可以通過數(shù)據(jù)倉庫將符合要求的會計數(shù)據(jù)從會計核算軟件導(dǎo)入或?qū)С?從而實現(xiàn)對數(shù)據(jù)倉庫進行相關(guān)的財務(wù)分析及決策。

  三、數(shù)據(jù)倉庫的模型設(shè)計

  數(shù)據(jù)倉庫創(chuàng)建之前首先要根據(jù)需求明確所構(gòu)建內(nèi)容的主題域。在根據(jù)需求分析確定主題域后,就可以通過建立數(shù)據(jù)模型對數(shù)據(jù)倉庫進行描述。模型是對現(xiàn)實世界進行的抽象描述,在信息管理中要實現(xiàn)對信息的管理與分析,就要依靠數(shù)據(jù)模型將現(xiàn)實世界的事物轉(zhuǎn)換為信息世界的數(shù)據(jù)。創(chuàng)建數(shù)據(jù)倉庫所采用的模型主要有概念模型、邏輯模型、物理模型。

  (一)主題域的確定

  數(shù)據(jù)倉庫設(shè)計的關(guān)鍵是主題域的確定,整個數(shù)據(jù)倉庫的數(shù)據(jù)都是圍繞主題和軟件標準數(shù)據(jù)接口而組織的,主要用于對企業(yè)的財務(wù)進行分析。根據(jù)數(shù)據(jù)接口標準規(guī)定的數(shù)據(jù)文件,主題可以分為以下幾類:

  資產(chǎn)負債表主題:主要分析企業(yè)某一特定日期內(nèi)的財務(wù)狀況,還可以進一步細化分為資產(chǎn)主題,負債主題,所有者權(quán)益主題;

  現(xiàn)金流量表主題:分析企業(yè)在一定會計期間現(xiàn)金及現(xiàn)金等價物的流入和流出情況;

  利潤表主題:用于分析企業(yè)在一定會計期間的經(jīng)營成果;

  所有者權(quán)益變動表主題:分析企業(yè)一定時期所有者權(quán)益變動的情況;

  財務(wù)分析指標主題:通過以上主題來分析企業(yè)一定時期的營運能力、償債能力、獲利能力及發(fā)展能力等。

  (二)概念模型設(shè)計

  星型模型和雪花型模型是概念模型設(shè)計常使用的兩種模型。雪花型模型是對星型模型的擴展,適用于具有復(fù)雜結(jié)構(gòu)數(shù)據(jù)倉庫的應(yīng)用,星型模型是最常使用的模型。模型設(shè)計主要用于設(shè)置事實表與維表之間的連接,使每個維表通過主鍵與外鍵連接,進而實現(xiàn)與事實表的連接。概念模型的設(shè)計就是要根據(jù)需求,確定業(yè)務(wù)中的指標實體和維實體,以及在實體間建立聯(lián)系,概念模型設(shè)計后可以在一些開發(fā)工具中,利用一些技術(shù)功能直接轉(zhuǎn)換為物理模型,再生成數(shù)據(jù)庫,從而節(jié)約了時間并提高了效率。

  (三)邏輯模型設(shè)計

  通常在概念模型設(shè)計好后,還要依靠邏輯模型來實現(xiàn)概念模型到物理模型的轉(zhuǎn)換。由于目前數(shù)據(jù)庫都建立在關(guān)系數(shù)據(jù)庫基礎(chǔ)上,所以所采用的邏輯模型主要是關(guān)系模型。會計核算軟件數(shù)據(jù)接口標準對所涉及的數(shù)據(jù)元素規(guī)定了統(tǒng)一的格式,在建立的邏輯模型中,要根據(jù)數(shù)據(jù)接口的規(guī)定對數(shù)據(jù)的字段進行格式描述。邏輯模型設(shè)計主要包括事實表,維表設(shè)計以及粒度的劃分。

  (1)事實表。直接反映了數(shù)據(jù)倉庫中應(yīng)用的主題,是星型結(jié)構(gòu)中最主要的表,包含了數(shù)據(jù)倉庫中最主要的信息,如資產(chǎn)負債表、現(xiàn)金流量表、利潤表、所有者權(quán)益變動表、財務(wù)分析表。而數(shù)據(jù)倉庫的數(shù)據(jù)都是來自于不同數(shù)據(jù)接口的數(shù)據(jù)庫,在進行數(shù)據(jù)倉庫的邏輯模型設(shè)計時,還要確定各表中的數(shù)據(jù)元素即字段與數(shù)據(jù)源的邏輯關(guān)系,以便核算軟件按照接口標準要求輸出文件。其中的對應(yīng)關(guān)系可以歸納為:第一種是數(shù)據(jù)元素和數(shù)據(jù)源的一一對應(yīng),即可以在核算軟件中找到與數(shù)據(jù)元素直接對應(yīng)的表與字段;第二種是數(shù)據(jù)元素需數(shù)據(jù)源通過計算得到,即必須對數(shù)據(jù)源進行計算處理才能滿足標準規(guī)定的數(shù)據(jù)元素的需要;最后一種對應(yīng)關(guān)系是依據(jù)邏輯判斷非源于特定數(shù)據(jù)源的數(shù)據(jù)。數(shù)據(jù)源的確定和對應(yīng)關(guān)系是會計軟件輸出符合標準數(shù)據(jù)的邏輯基礎(chǔ)。因為過于龐大的事實表在表的處理、備份和恢復(fù)、用戶的查詢等方面需要較長的時間,在設(shè)計時要注意使事實表盡可能地小。

  (2)維表。主要用來描述事實表,與事實表有著非常重要的關(guān)系,在事實表中大多數(shù)屬性都要依賴于維表,維表的主鍵組成了事實表的外鍵,每個維表都通過主鍵與事實表的外鍵連接,實現(xiàn)數(shù)據(jù)庫快速查詢。維表的屬性也要根據(jù)接口標準規(guī)定進行規(guī)范定義。維表也會影響企業(yè)決策的因素,如不同企業(yè)、日期、指標類別都是影響企業(yè)決策的因素,通過這些因素決策者可以按照不同企業(yè)不同日期不同指標類別進行決策分析。根據(jù)事實表設(shè)計的維表有會計期間維表、報表編碼維表、日期維表、企業(yè)維表等。

  (3)粒度的劃分。粒度是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細化或綜合程度的級別。通過粒度的劃分,決定了數(shù)據(jù)倉庫是采用單一粒度還是多重粒度,以及粒度的劃分層次。粒度級越低,細化程度越高;相反,粒度級越高,細化程度越低。粒度的劃分直接影響到數(shù)據(jù)倉庫中的數(shù)據(jù)量和信息查詢,以及進一步進行OLAP(聯(lián)機分析處理)和數(shù)據(jù)挖掘的效果。如果主題的數(shù)據(jù)量、信息量較多,對主題數(shù)據(jù)分析細化程度要求較高,就要根據(jù)用戶對數(shù)據(jù)倉庫應(yīng)用的需求,采用多重粒度進行數(shù)據(jù)劃分。用低粒度即細化到月的數(shù)據(jù),保存近期的會計報表及財務(wù)分析指標數(shù)據(jù),對時間較遠的會計報表及財務(wù)分析指標數(shù)據(jù)的保存用粒度較大即細化到年的數(shù)據(jù)。這樣既可以對財務(wù)近況進行細節(jié)分析,又可以利用粒度較大的數(shù)據(jù)對財務(wù)趨勢進行分析;否則采用單一粒度進行劃分。

  (四)物理模型設(shè)計

  邏輯模型在物理系統(tǒng)中的體現(xiàn)模式,需要通過數(shù)據(jù)倉庫的物理模型設(shè)計來實現(xiàn)。包括邏輯模型中的各種實體表的具體化,包括表的數(shù)據(jù)結(jié)構(gòu)類型、索引策略、數(shù)據(jù)存放位置及數(shù)據(jù)存儲分配等。會計軟件數(shù)據(jù)接口標準中所要求的數(shù)據(jù)接口輸出數(shù)據(jù),包含接口標準要求的16個數(shù)據(jù)文件和1個格式說明文件,每個文件的文件名都進行了嚴格的規(guī)定。同時在標準中對16個數(shù)據(jù)文件的81個數(shù)據(jù)元素也進行了嚴格定義,首先,在物理模型設(shè)計中表的數(shù)據(jù)結(jié)構(gòu)應(yīng)根據(jù)接口標準要求,對數(shù)據(jù)的格式及內(nèi)容進行統(tǒng)一的定義規(guī)范,如表的字段標識符要采用三位數(shù)字進行標記,字段的類型長度最多為5位可變長字符。只要會計軟件的數(shù)據(jù)倉庫的數(shù)據(jù)接口符合接口標準,就可以實現(xiàn)輸出符合標準的數(shù)據(jù)。其次,由于數(shù)據(jù)倉庫的數(shù)據(jù)量很大,通過索引的創(chuàng)建可以提高數(shù)據(jù)存取的效率,通常按事實表的主鍵和外鍵來建立索引。在數(shù)據(jù)倉庫中首先需要為事實表設(shè)置索引,在為事實表的主鍵聲明約束時,應(yīng)該按照這些列的聲明次序創(chuàng)建一個惟一的索引。而對于使用頻率較高的外鍵,應(yīng)置于主鍵索引的前面,以提高查詢效率。

  數(shù)據(jù)倉庫中的數(shù)據(jù)可以通過數(shù)據(jù)庫訪問接口,將源數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換為標準格式的數(shù)據(jù)導(dǎo)入。其中數(shù)據(jù)的存儲通常按數(shù)據(jù)的重要性、使用頻率以及對響應(yīng)時間的要求進行分類,并將不同類型的數(shù)據(jù)分別存儲在不同的存儲設(shè)備中,其中重要性高、經(jīng)常存取并對響應(yīng)時間要求高的數(shù)據(jù)存放在高速存儲設(shè)備上,而存取頻率低或?qū)Υ嫒№憫?yīng)時間要求低的數(shù)據(jù)則可以存放在低速存儲設(shè)備上。

  四、數(shù)據(jù)倉庫的創(chuàng)建

  通過對數(shù)據(jù)倉庫中的事實表、維表的邏輯模型設(shè)計,同時根據(jù)在物理模型中對各種表的存儲區(qū)間、方式的處理,在數(shù)據(jù)倉庫的實施過程,采用適當?shù)臄?shù)據(jù)倉庫創(chuàng)建工具,就可以創(chuàng)建數(shù)據(jù)倉庫。目前用于創(chuàng)建數(shù)據(jù)庫的工具主要有SQL Server、Oracle10i、Sybase等。數(shù)據(jù)倉庫的創(chuàng)建可以根據(jù)具體情況選擇適合的開發(fā)工具。

  五、數(shù)據(jù)的采集及轉(zhuǎn)換

  數(shù)據(jù)倉庫的物理模型設(shè)計完成后,就要根據(jù)會計核算軟件數(shù)據(jù)接口標準,來完成數(shù)據(jù)倉庫結(jié)構(gòu)的建立,實現(xiàn)數(shù)據(jù)倉庫和元數(shù)據(jù)庫的創(chuàng)建,然后就可以對數(shù)據(jù)倉庫進行數(shù)據(jù)的加載。元數(shù)據(jù)庫是數(shù)據(jù)倉庫的靈魂,沒有元數(shù)據(jù)庫,用戶就無法對數(shù)據(jù)倉庫的數(shù)據(jù)進行良好的定義、組織和管理。數(shù)據(jù)的采集及轉(zhuǎn)換是建立數(shù)據(jù)倉庫中最重要的處理過程之一,這一過程實際上是要把來自不同的操作性數(shù)據(jù)源、不同的數(shù)據(jù)進行集成,將非標準的數(shù)據(jù)轉(zhuǎn)化為在一定程度上的標準化的數(shù)據(jù)。采集之前首先需要對數(shù)據(jù)進行預(yù)處理,即進行準備工作包括清空工作區(qū)、準備區(qū)。由于數(shù)據(jù)倉庫中的數(shù)據(jù)來源十分復(fù)雜,這些數(shù)據(jù)在進入數(shù)據(jù)倉庫之前常常需要在準備區(qū)對數(shù)據(jù)進行標準化處理,即將不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)進行統(tǒng)一處理,如源數(shù)據(jù)庫中的數(shù)據(jù)類型與長度和標準規(guī)定的有所差別,就需要進行數(shù)據(jù)的類型轉(zhuǎn)換、長度的截取等工作。數(shù)據(jù)的采集可以通過數(shù)據(jù)庫接口訪問源數(shù)據(jù)庫,將數(shù)據(jù)轉(zhuǎn)換為標準格式數(shù)據(jù)存入數(shù)據(jù)倉庫,同時為了確保數(shù)據(jù)倉庫中數(shù)據(jù)質(zhì)量,還要對數(shù)據(jù)進行必要的清理即篩選工作。數(shù)據(jù)的清理工作必須嚴格依據(jù)元數(shù)據(jù)的定義進行,數(shù)據(jù)清理結(jié)束就可以將經(jīng)過凈化和轉(zhuǎn)換的數(shù)據(jù)加載到數(shù)據(jù)倉庫事實表中。實現(xiàn)的工具主要有SQL Sever、Oracle等。對數(shù)據(jù)提取以后,同樣也可以利用SQL語言實現(xiàn)對數(shù)據(jù)的加載。

  六、數(shù)據(jù)倉庫的使用

  在會計數(shù)據(jù)標準接口中,已經(jīng)將會計科目、會計憑證、會計賬簿、會計報表等中的數(shù)據(jù)納入,并進行了統(tǒng)一規(guī)范。因此可以通過標準數(shù)據(jù)接口將每年的會計數(shù)據(jù)保存到數(shù)據(jù)倉庫。按照會計數(shù)據(jù)接口標準要求,將會計數(shù)據(jù)倉庫中的歷年數(shù)據(jù)輸入到會計核算軟件中,并利用會計核算軟件對其進行相關(guān)的財務(wù)分析、經(jīng)濟前景預(yù)測,以幫助管理者為企業(yè)的將來做出正確的決策。隨著數(shù)據(jù)接口標準的推廣實施,基于會計核算軟件數(shù)據(jù)接口的數(shù)據(jù)分析技術(shù)和方法會越來越多,并且應(yīng)用范圍也會越來越廣泛。

  【參考文獻】

  [1] 會計核算軟件數(shù)據(jù)標準接口國家標準實施指南編委會.GB/T 19581—2004《信息技術(shù)會計核算軟件數(shù)據(jù)標準接口》實施指南[S].北京:中國標準出版社,2005.

  [2] 陳京民.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:電子工業(yè)出版社,2007.

  [3] 池太崴.數(shù)據(jù)倉庫結(jié)構(gòu)設(shè)計與實施[M].北京:電子工業(yè)出版社,2005.

我要糾錯】 責任編輯:老A

實務(wù)學(xué)習(xí)指南

回到頂部
折疊
網(wǎng)站地圖

Copyright © 2000 - odtgfuq.cn All Rights Reserved. 北京正保會計科技有限公司 版權(quán)所有

京B2-20200959 京ICP備20012371號-7 出版物經(jīng)營許可證 京公網(wǎng)安備 11010802044457號