斯特拉斯堡天气预报一周:“多維數據倉庫”是企業業務管理的未來

發布時間:2019-07-22 17:44:51 來源:中國軟件網 作者:趙晨希
[摘要]第一次見到本期嘉賓智達方通CEO蔡志宏,是在一次關于大數據、數據智能管理為主題的講座上
專業性強、技術范兒是智達方通CEO蔡志宏給人的第一印象。

斯特拉斯堡景点 www.banpva.com.cn 第一次見到本期嘉賓智達方通CEO蔡志宏,是在一次關于大數據、數據智能管理為主題的講座上。蔡志宏從多維數據倉庫切入,講述了傳統企業管理軟件設計思路的滯后,以及企業降本增效的考量下,怎樣通過EPM系統底層技術多維數據倉庫,建立企業的“數字孿生”。進而,實現企業業務的動態計劃、測算、控制、分析等在內的數字化管理。

智達方通作為一家專業從事全面預算管理、財務分析、企業績效管理、數據倉庫等領域軟件產品研發和咨詢服務的軟件公司。目前,服務的客戶已逾百家,遍布國內主要地區,覆蓋醫療健康、能源、港口、機械設備、地產、制造業、教育等行業。

事實上,智達方通選擇企業管理軟件中數據分析、決策支持方向,即企業績效管理EPM軟件方向,而沒有選擇其它方向建設、研發數據倉庫,這背后與智達方通CEO蔡志宏個人興趣、從業經歷有密切的關系。

蔡志宏對中國軟件網透露,平時自己更喜歡技術類、行業專業類的文章,平時自己也會在相關平臺專欄寫寫文章,發表自己對行業的看法。2001年至2010年期間,蔡志宏曾經在美國Hyperion和Oracle公司從事EPM軟件研發的相關工作。在這段時間里,蔡志宏認識到數據分析對企業管理的重要性,以及ERP等傳統業務前端系統的局限性。

如今,數據已經成為信息化社會建設的新能源,企業數據演變歷經財務報表、非財務信息,進入了第三個階段即大數據階段。伴隨5G的正式商用,AI人工智能第三次浪潮的到來,商業智能公司開始出現。

傳統的企業管理方式,顯然早已不能適應環境新的巨變。另一方面,過去企業管理中的信息不確定性在今天依然存在,未曾消弭。拋開能力差異,企業管理者認知方面的偏差成為企業發展最大的掣肘。

根據Wealth-X統計顯示,從2014年7月至2015年7月,美國有45%的富豪遭遇財富損失,這其中11%的人損失達一半以上。這些問題出現的根本原因在于,企業管理者對于事物的認識、認知不夠充分。

蔡志宏告訴中國軟件網,以往企業的信息化建設,通常是針對某個部門或某一實體業務,通過軟件系統模擬其線下的單據、表單格式,以及審批流程。這類系統中靈活一些的,可以開放其業務單據、流程、字段等自定義配置功能,更容易配置出企業用戶的個性化業務。但由于其數據缺乏結構性,無法實現智能管理所需的分析能力。

(智達方通CEO 蔡志宏)

以下為中國軟件網對話智達方通CEO蔡志宏詳細實錄:

企業數據管理:“多維數據倉庫”的優勢

中國軟件網:智達方通網絡資料顯示,貴司以企業績效管理軟件研發和方案咨詢為核心業務,致力于幫助企業加強全面預算管理體系,提升財務分析水平,有效支撐經營決策,從而改善管理提升績效。所以,智達方通很大一部分數據來源于企業管理中產生的數據,智達方通建設、研發數據倉庫,當初是怎樣選擇企業管理這個方向?為什么沒有選擇其他方向?

蔡志宏:我們選擇企業管理軟件中的數據分析、決策支持方向,也就是企業績效管理EPM軟件方向,主要是源自2001-2010年在美國Hyperion和Oracle公司從事EPM軟件研發的工作經歷。

在這段時間里,我認識到數據分析對企業管理的重要性以及ERP等傳統前端業務系統的局限性。舉例來說,機場的民航系統中,有全世界每一個航線、航班、座位的所有信息,但對于某一位旅客來說,他并不需要這些海量數據,而是想知道這個周末從北京到三亞,哪個航班價格最優時間最合適。

也就是說,用戶更需要的是分析后的數據,而不是原始數據本身。對于企業管理者來說,他可能并不關心某一筆會計憑證、訂單、費用單據等,而是關注某一個型號的產品近3個月以來利潤率的變化趨勢,以便快速決策是否再繼續向這個型號的產品投入研發生產銷售成本。

這并不意味著ERP等前端業務系統不再重要,而是說前端業務軟件更適合對業務數據的采集。相當于物聯網中的傳感器,負責生成數據,但傳感器并不能分析數據。而對企業業務數據的實時多維分析,就是多維數據倉庫擅長的領域,也是EPM軟件的基礎技術。

多維數據倉庫與關系型數據庫的差別在于,數據結構化程度更高,數據分析能力更強,更適合管理者自助式分析測算業務數據。

基于多維數據倉庫可搭建很多數據分析應用,典型的應用場景就是企業績效管理EPM,或稱為管理會計信息化,這類應用包括:企業的計劃預算編報、基于業務動因的計劃和測算、基于預算的資金、費用、成本、項目、合同等執行控制、經營分析商業智能分析等等。

同時,也可做企業各類業務數據的多維建模和分析自動化平臺。如政府的各類監管數據月報快報平臺等。一套系統可以實現所有業務分析、報表報告的自動化平臺要求,避免針對不同的管理指標要求,建設各種報表、報告、經營分析等等多個軟件系統。

中國軟件網:企業數據管理產生的數據和其他部門產生的數據,有何不同?

蔡志宏:以往的企業信息化建設,通常是針對某個部門或某個實體業務,通過軟件系統模擬其線下的單據、表單格式、以及審批流程。這類系統中靈活一些的,可以開放其業務單據、流程、字段等自定義配置功能,更容易配置出企業用戶的個性化業務。但由于其數據缺乏結構性,無法實現智能管理所需的分析能力。

企業數據管理或智能管理是指通過對實體業務的多維建模,并在多維數據模型中建立起業務間的因果關系,實現企業實體業務的數字孿生。這樣建立的企業管理信息化系統,就不再是業務數據的靜態呈現,而是可基于業務動因隨時模擬測算經營結果的動態系統。

各業務部門的業務前端信息化系統產生的數據,是企業實體業務的原始數據,需要經過分析計算才能形成決策支持所需知識,進而產生洞察力。相當于人工智能領域,從感知到認知的變遷。

中國軟件網:智達方通在數據歸類、數據清理、數據模型方面有什么經驗,有何具體技術?

蔡志宏:數據建模是多維數據倉庫的基本功能。EPM項目交付的質量跟數據倉庫模型設計是否優化有很大關系。缺乏經驗的顧問,在梳理模型時會遷就企業線下的表樣,而不是基于業務抽象優化,甚至會設計出很多綜合維度、預留維度等。

雖然數據建模是多維數據倉庫的基本功能,模型是否優化仍然依賴業務顧問的業務梳理能力同樣,數據歸類和數據清理不完全是技術手段,更多是業務設計和管理咨詢能力。管理指標梳理、主題域設計通常比技術實現更關鍵。

中國軟件網:智達方通在企業管理中,有沒有用到包括遷移學習、GAN或者其它的人工智能技術?

蔡志宏:大數據分析方法一般分為兩類,一類是人工智能這一類探索性數據分析,EDA-Exploratory Data Analysis,解決的是數據間的相關性問題,提供的是概率性“參考答案”。比如,啤酒尿布、貓狗識別等。GAN這種深度學習方法就是這一類的分析方法。

第二類是驗證性數據分析,CDA-Confirmatory Data Analysis。比如管理者感覺上半年經營利潤下滑,但不知下滑到什么程度。收入成本費用數據完整,利潤率指標計算方式明確,需要通過分析計算確認實際利潤率,這就屬于典型的驗證性數據分析,分析結果是唯一正確答案而不是參考答案。無法想象經過經營分析后,得到的產品利潤率是1-10%的參考答案。

EPM這一類財務分析應用,是典型驗證性數據分析,其基礎技術就是多維數據倉庫。對于智達方通的一些企業應用案例中,粗顆粒度的經營分析采用基于多維數據倉庫的EPM產品方案,全量數據的分析,根據不同的業務方案采用了不同的統計模型和算法。如基于時間序列進行的銷售預測分析。

中國軟件網:BAT互聯網公司,均有人工智能實驗室。其中,有數據智能方向的研究,在安全、云計算各個業務中有實地、具體的應用。那么,互聯網廠商有沒有可能自己建設管理數據庫?智達方通獨特的優勢在哪里?

蔡志宏:互聯網公司的數據智能,主要服務于其用戶。通?;嶧誑詞菘庾鏨疃扔嘔?,否則采用商用數據庫,很難承載平臺流量的海量數據。

互聯網公司自身的數據化管理,仍然屬于企業績效管理范疇,也就是基于多維數據倉庫搭建的決策支持應用。因服務的對象是企業自身,用戶量比互聯網企業的客戶數量少的多,并不值得自己研發這樣一種需要長期研發投入的多維數據倉庫系統。但是由于互聯網企業的技術研發背景,完全可以自行運維這類EPM系統。

智達方通作為多維數據倉庫及應用廠商,優勢在于為企業提供自助式的實體業務建模、分析、計劃和測算平臺。解決現有業務系統無法實現經營分析和決策支持的問題。是企業內部使用的分析決策類軟件系統。

中國軟件網:有沒有企業案例,比如,某企業采用了貴司的解決方案,相關管理效率有一個很大的提升?

蔡志宏:國內一家大型的港口物流集團,采用了智達方通的全面預算和執行控制系統后,實現了業務驅動型的計劃預算,資金費用等從無預算控制到實現基于多維預算和標準精細化控制。

某造幣行業企業,實施了智達方通的全面預算管理、執行控制管理和商業智能分析系統后,實現了預算編報、執行控制和經營分析一體化聯動。在一個平臺上實現管理會計全業務閉環,并獲得了集團降本增效獎。

某央企物資公司,集中采購的物資數量巨大,通過智達方通多維數據倉庫和分析平臺,實現10多年多批次、網省、表款、標包的大量的物資及成本明細的大數據多維分析,總計算量100億條。實現了異常報價、典型成本、屬地物料成本、供應商屬地、典型表款價格、優質投標人和網省招標數據的多維分析,提升招投標決策效率,并獲得了集團科技進步一等獎。

“數據中臺”風暴下:未來行業的發展趨勢

中國軟件網:今年包括阿里巴巴、騰訊等都在談“數據中臺”,您怎么看待這個趨勢?另外,阿里等云計算廠商建設數據中臺后,對數據庫企業,如Oracle等會有什么影響?數據庫企業在這其中的角色是怎樣的?有何變化?

蔡志宏:我們了解的企業“數據中臺”項目,目的都是解決前端業務系統數據孤島,無法貫通分析決策的問題。這跟幾年前流行的廣義的“數據倉庫”項目沒有本質的區別,都是打通數據孤島,提升經營分析和決策效率。

只是隨著大數據技術的成熟,有些數據中臺項目采用了Hadoop/Spark分布式存儲技術,實現原子顆粒度的全量數據分析。我們的方案是:如果企業的數據量達到大數據級別,則類似銷售轉化率等全量數據分析,采用Hadoop/Spark方案,而到月級的粗顆粒度數據,可用多維數據倉庫方案,為管理者提供自助、即席分析能力。這種混合式數據倉庫解決方案,是國內國外應用較多的成熟方案。

我理解的阿里和騰訊等談到的“數據中臺”,并不是一種新的數據庫產品,而是企業業務數據分析平臺的一種解決方案,目的是為企業提供數據資產管理和數據賦能。由于涉及的數據量可能較大,通?;岵捎肏adoop、HBase、HDFS等分布式計算平臺和存儲平臺,也可能整合多維數據倉庫提供多維分析能力。對于Oracle等數據庫廠商而言,是數據庫應用場景的擴展,而不是同類產品的競爭。

中國軟件網:前不久,不少評論討論為何國內發展不起來SaaS?您怎么看待中國、美國或者其它地區,軟件行業的差異?

蔡志宏:對EPM軟件這種數據集中型應用,非常適合SaaS和云模式,可降低企業的建設成本以及服務商的咨詢實施交付成本。但考慮到EPM涵蓋的實際業務、計劃預算、執行控制數據的敏感性,國內企業通常不愿意將EPM系統部署到公有云上,而是采用私有化部署或部署在企業私有云上。

美國和其他國家的監管環境相對規范,SaaS模式CPM、EPM軟件市場發展較為健康。這方面差距的拉近,是中國發展SaaS企業軟件的基礎。在非敏感領域的企業應用,如考勤、CRM、OA、報賬等,SaaS應用在國內市場發展的還是挺好的。

中國軟件網:國外數據庫巨頭的發展路徑是怎樣的?不同巨頭方案有何差異?您看好哪一種?

蔡志宏:數據庫種類很多,如關系型數據庫、NoSQL、多維數據倉庫、列存儲數據庫、分布式數據庫、圖數據庫、對象數據庫等等,適用于不同的應用場景。企業應用領域,ERP通常采用關系型數據庫,EPM通常采用多維數據倉庫。

Oracle、IBM、SAP三巨頭也是關系型數據庫和多維數據倉庫的廠商。各巨頭為提升數據庫性能采用了各種方案,包括定制化硬件一體機,實時內存壓縮等技術。在數據倉庫領域,我們更為看好計算引擎算法優化以及基于通用設備的硬件加速方向上。

中國軟件網:您認為企業管理數據,未來的發展趨勢是怎樣的?

蔡志宏:更多的企業將認識到數據資產的重要性。企業信息化建設的重點也將從線下業務轉移線上的電子化過程,逐步演變成利用數據分析平臺建立實體業務模型,并基于實體業務數字孿生進行經營分析、計劃預測,以便動態數字化智能化管理企業。

中國軟件網:您認同云計算服務SaaS化趨勢嗎?您認為國內軟件廠商在云計算浪潮下,未來可能有怎樣的發展路徑?軟件廠商在產業鏈條中,處于怎樣的位置?

蔡志宏:從技術角度而言,企業軟件的SaaS化是發展趨勢。而從企業實務角度,國內企業核心業務數據的SaaS化仍為時過早。但軟件廠商應提早做好技術準備,以應對未來大量的私有云部署需求。

中國軟件網:今年5月底,國內也出臺了類似于歐洲GDPR數據?;さ南喙毓娑?,這對于國內數據公司將會有怎樣的影響?

蔡志宏:國內的一些2C軟件對用戶隱私數據的侵犯已經到了很嚴重的程度。其原因跟之前沒有類似GDPR數據?;さ姆ü?,以及沒有得到應有懲罰有關。隨著大數據、人工智能應用越來越廣泛,流量平臺作為數據來源更易變現。如沒有相關的數據?;す娣?,用戶的個人數據風險極高。

EPM作為企業數據的分析決策系統,通常不涉及個人數據,也不會向外部提供,不太可能涉及GDPR的數據?;し段?。

中國軟件網:創業中,您認為最大的難點在哪里?有沒有覺得是非常棘手的事情?國內數據環境您有何看法?

蔡志宏:最大的難點在于不完全競爭的市場。但隨著企業對智能管理的逐漸重視,有研發技術實力的軟件廠商競爭力會凸顯。另外,隨著企業管理水平的提升,將逐漸擺脫由外部咨詢團隊梳理自身業務的依賴,更多關注軟件平臺技術功能是否適應智能管理的要求。

從企業的數據環境來看,正從非結構化或弱結構化,向高度結構化演進。這是智能管理、決策支持自動化的要求,也為后續基于AI進行數據價值的深度挖掘,奠定了基礎。

斯特拉斯堡景点