複雜報表設計

【IT168 專稿】

大道至簡 三招設計複雜ERP報表

報表無疑是ERP系統中用到的最頻繁的單據之一。比如每天採購要打印採購明細帳;倉庫每天要導出收貨或者出貨明細;銷售每天要打印訂單明細等。故報表的設計在ERP系統開發中佔據大半江山。不過筆者在實際工作中也發現,有些開發人員在設計ERP報表時,太過於複雜。

    有一次,一家企業向我提出瞭如下需求:他們希望能夠出一份報表,報表的內容包括四個部分。一是成品零件的用量、零件的最小採購量等信息;二是當月零件的採購量信息(詳細的採購訂單等資料);三是當月零件的出庫信息(詳細的出貨記錄);四是零件的安全庫存信息。然後,根據這些信息計算出當月需要補下的滿足安全庫存的數量。從這個需求中可以看出,其主要設計到產品基本資料、採購、倉庫等三個模塊的內容。這麼複雜的報表,從技術上來說,實現的難度並不是很大。但是從實用性角度考慮,或者從準確性來看,又會有什麼結果呢?

一、報表越複雜,準確性越難以把握

    一般來說,報表越複雜,其準確性餘越難以把握。其實拋開ERP系統,從統計學的角度,我們也可以得出這個結論。如下圖所示,現在有三個抽屜。每個抽屜中都有0-9十個數字。如果現在從每個抽屜中隨意抽出兩個數字,最後組成一個三位數。那麼最後有幾種結構呢?這是一個排列組合的問題。

抽屜1 抽屜2 抽屜3

     再回過頭來看一下這個表單的內容。現在這個表單有三個模塊的數據構成。就好像這三個抽屜。當然其抽屜中的數據遠比10個數字要負載的多。我們設想一下,從單個模塊來看。可能企業允許的誤差率是5%。即100條記錄中,允許有5條記錄與實際有偏差。現在三部分信息共同組成的一張報表,而且最後需要根據三部分信息的內容計算出一個值,那麼這個出現錯誤的記錄會有多少呢?這又是一個排列組合的問題。如假設每部分信息中,都有5條件有偏差,那麼最後理論上的錯誤記錄是125條。顯然這個錯誤率比較大。同時也可以看出,當涉及到的基礎表數量越多,涉及到的模塊越多,其最後結果的準確性就越難以保障。而當數據的準確性不高時,其實用性也就相應的降低。

二、報表關聯越多,其性能也會直線下降

    報表越複雜,其涉及到的後臺數據庫基礎表也就越多。雖然多表之間的關聯查詢是允許的,但是關聯的關鍵字越多,其查詢的效率也就越低。特別是在關聯條件中,有時候採用的並不是關鍵字之間的關聯。如有可能日期(字符數據類型的關聯)之間的關聯,此時查詢的效率會更低。再加上比較複雜的Where邏輯判斷語句,複雜報表的查詢時間會很長。如筆者測試過,按照上面這個用戶的需求,設計出的報表其查詢的時間需要近三分鐘,而且是已經優化過的查詢。另外,這個報表的查詢由於涉及到衆多的基礎表,數據庫基本上需要訪問硬盤上的數據文件,而不能夠使用緩存。這就有可能會導致比較嚴重的硬盤I/O衝突。從而影響到其它數據的查詢效率。

    故從數據庫與應用軟件的整體性能考慮,也不建議採用比較複雜的報表視圖。畢竟性能降低、查詢的時間比較長時,報表的實用性也在降低。

三、設計複雜報表的注意事項

    爲此,從原則上是禁止設計超過兩個模塊的數據報表,最好是將報表的範圍限制在單個模塊下。如此的話,無論從性能還是從數據的準確性上都會有所保障。但是,如果用戶確實有需要實現比較複雜的報表,在這種情況下,該如何處理呢?爲此筆者根據自己的項目經驗,提出了以下幾個建議。

    一,是可以使用固化視圖來改善數據庫的性能。複雜報表所導致的不利影響,其首當其衝的是報表查詢時速度會很慢,性能很低。爲此在涉及到複雜報表時,開發人員可以考慮採用固化視圖來改善數據庫的性能。如在Oracle數據庫中,固化視圖又叫做物化視圖。通固化視圖,可以用於預先計算並保存表連接或者聚集等耗時比較多的操作結果。簡單的說,就將某個報表的查詢結果存儲在一張單獨的表中。如此的話,在執行查詢時,就可以避免使用這些耗時的操作,同時減少磁盤的I/O衝突,從而以最短的時間得到用戶想要的結果。一般來說,固化視圖對於複雜的報表來說,能夠提供三方面的作用。如可以提高查詢的性能。如固化視圖對於應用來說是透明的,增加和刪除物化視圖不會影響應用程序中SQL語句的正確性和有效性。如當基表發生變化時,物化視圖也會同時更新。不過需要注意的是,物化視圖也會帶來一些負面影響。如物化視圖的數據會保存在硬盤中,爲此就會佔用額外的存儲空間等。總之,在設計比較複雜的報表時,開發人員可以與數據庫工程師商量,能夠採用固化視圖。如果可以的話,需要儘量採用固化視圖。

    二,是複雜的報表當設計到多表時,最好採用模塊化的設計。如上面這個視圖,其涉及到的基表有近20張。那麼在設計視圖時,要避免將其放在一個SQL語句中。而應該借鑑應用程序的模塊化設計,將其設計成不同層次的視圖,然後再進行連接查詢。如上面這個案例,至少可以將其分爲四層。最基層是基本數據表,第二層是零件出庫信息、當月採購信息等數據,第三層是根據第二層的數據進行計算分析;第三層視圖再將這些視圖進行連接。這麼操作的話,方便後續的維護與查詢。同時也可以提高查詢的速度。爲什麼這麼說呢?如在第二層視圖設計中,可以對基礎表的數據進行過濾。此時由於基礎數據少,那麼後續的報表查詢速度也會加快。爲此對於比較複雜報表的設計,要考慮分層設計的思路。以提高報表的查詢性能與靈活性。

    三,是要考慮數據覈對的需要。比較複雜的報表,其可能會涉及到多個不同的部門。如上面個報表,其涉及到倉庫、採購、銷售、開發等多個部門。而且最後的計算結果需要根據這些部門的信息得出。爲此爲了提高數據的準確性,就需要多個部分進行積極的配合。那麼該如何來做到這一點呢?筆者認爲,可以將這些視圖分模塊化設計。如將涉及到不同的部門的信息先設計成不同的報表。在某個特定的時刻,如月末,先讓各個部門的人員覈對相關的數據。覈對完成沒有錯誤之後,再對相關的數據進行運算。而不是一開始就將所有數據在一張報表上顯示。這會導致各個部門數據覈對的麻煩,即各個部門不利於覈對與自己相關的數據。其實這一點跟上面提到的視圖分層化設計類似。在ERP上,報表的內容也要分不同的模塊進行體現。這有利於用戶對數據進行覈對與確認。然後再將它們整合起來。這種各個擊破的方式,就有利於提高數據的準確性。

    可見,對於比較複雜的報表視圖,原則上還是少見爲妙。因爲其在性能或者數據的準確性上都很難控制。如果真的要建立複雜視圖的時候,那麼在設計與開發時,顧問需要聽取數據庫工程師的意見,考慮如何提高數據的查詢性能,並採取措施提高數據的準確性。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章