2019年12月5-7日,由中國計算機學會主辦,CCF 大數據專家委員會承辦,CSDN、中科天璣數據科技股份有限公司協辦的中國大數據技術大會(BDTC 2019)于北京長城飯店隆重舉行。

天云數據在本次大會上覆蓋了四個論壇議題:HTAP混布數據庫、AI中臺、AutoML、AI賦能金融科技。四位嘉賓受邀發表主題演講。

一、天云數據CEO雷濤受邀在新一代數據庫轉型論壇發表主題演講“大數據體系下HTAP數據庫Hubble”。

雷濤提到,數據資源、數據消費者以及數據架構的變化不斷催生了HTAP技術,HTAP可以解決很多痛點,重點體現在兩個生態問題,一方面解決了傳統舊世界的性能和擴展問題,另一方面則是打破了事務處理和分析之間的“墻”,大大提升了大數據體系下數據實時處理和分析計算能力。

運維多個組件、交互性差、穩定性差、使用不夠方便……用戶存在多重使用痛點,為解決這些問題,天云數據自研HTAP數據庫Hubble,只需運維一個組件,標準化SQL語法,客戶端工具更加靈活,降低了使用人員的技術門檻。最大的技術創新在于其不僅是一款支持標準SQL的大數據分布式數據庫,而且其可以進行多源異構,并且同時支撐AP和TP兩種業務。Hubble可以對多個不同來源的數據庫進行查詢。目前支持的數據源包含但不限于Oracle、hive、mysql、DB2等。

 

二、天云數據副總裁李從武受邀在大數據與AI中臺論壇發表“數據中臺三部曲”主題演講。

李從武提出,現代企業的業務模式正在經歷從流程驅動到數據驅動轉變的商業重構,從BI向AI升級,數據不再是業務系統的副產品,而成為業務系統的核心資產,成為企業運營決策和業務發展的驅動力。數據中臺從誕生至今,經歷了數據資產化、數據融合與流動、數據價值化的三部曲。

第一階段:數據資產化

目前數據治理方式的變遷,已過渡到自動化數據管理系統(ADG),可以利用人工智能技術自動地發現企業各業務系統數據的架構和數據主體,并直接發現跨數據庫的表和人財物各類數據間的關系。

天云在某能源公司分局已經成功實施了該應用,共將十幾個業務系統(數據采集、核心應用、信息中心、開發月報、開發應用、協同平臺等)的數據庫、8000多張表、 十幾萬個字段的元數據和主數據提取出來,并建立了統?的關系視圖,而整個工程從復雜網絡Hilbert安裝部署開始只需要2周就可以完成;與數據倉庫和主數據系統的建設相比明顯快了很多,而且可以根據業務和數據的變化,天云所產生的Schema可以跟著一起變化,非常靈活。

第二階段:數據融合與流動

幾十年來,信息化系統從架構、計算、信息已經發生了本質變化,move data還是move code,從程序為核心,到數據為核心的轉型,計算的本質發生變化以后,從IOE轉向了分布式計算,從資源的封裝,走到了對服務的封裝,從虛擬化轉向了容器化。從流程驅動走向數據驅動,在數據的不同的使用方式上,從作為應用的副產品被沉淀下來,邁向了以數據加算法的數據科學的能力,BI向AI遷移,實現了數據倉庫向人工智能的轉型。兩大技術陣營的轉換中,新世界的科創技術在新的技術生態中開始發揮重要作用,對傳統數據庫的替代也是順理成章的。比如天云大數據自主研發HTAP國產分布式數據庫,上線了某大型股份制銀行的全量數據在線實時交易系統,面向柜面系統提供7*8小時A類實時核心交易,面向手機網銀系統提供7*24小時A類實時核心交易。

第三階段:數據價值化

所有復雜、難以抽象的商業規則和場景,將它們數字化以后,復雜問題反而可以被清晰的界定和量化,算法可以對商業實踐做替代,這個過程,即AI PaaS(AI平臺即服務),可以成為產業升級、數字化轉型的基石。天云大數據在數據價值化的第三階段,提供各行業通用的人工智能 AI PaaS平臺,服務AI的AI,天云積極推動AI跨行業賦能,已成功落地在金融、能源、政府、醫藥等領域。

三、天云數據首席數據科學家呂慧博士受邀在AutoML 大數據自動化機器學習技術與系統論壇發表主題演講:自動化機器學習工程化的落地實踐。

天云在利用產品化的服務賦能企業的同時,如何保證讓業務人員能夠利用建模產品平臺通過自動化建模流程真正實現模型從數據輸入端到模型業務目標輸出端的掌握,這是天云實踐的最終目標,通過AutoML的工程化落地實踐,能夠實現數據端業務輸入的便捷化處理,模型的后續維護、優化,更新,及限制場景下的模型快速外延。

天云自動化特征工程平臺,底層是基于分布式框架,免代碼的拖拽操作來實現,除了預定義的數據預處理、數據過濾、統計分析、特征工程、擬合評估變換、文本分析等模塊,對于具有一定開發能力的人員,還可以實現可擴展的編程組件,包括SQL和pyspark的支持。在平臺特性上,可視化保證了用戶對于輸入端能夠進行方便的操作,流程化保證了特征數據構造的邏輯理解能力,抽象化模塊的封裝保證了自動化能力的體現。

天云AI平臺和特征工程平臺都支持容器化的部署方式。容器化的部署方式保證了特征工程模塊可用戶批量處理數據并供給到生產系統;并且可以保證快速的部署和復制特征工程環境,大大降低了環境部署的成本,還可以實現動態擴容,保證特征工程服務的不間斷。通過特征工程平臺+工作流+模型配合使用的方式,形成閉環,方便進行自動化建模流程的實踐。

 

四、天云數據售前技術總監謝文華受邀在人工智能賦能金融科技論壇發表“AI賦能證券業異常交易智查系統”主題演講。

長期以來,異常交易監測一直是證券公司加強賬戶實名制管理的重點和難點問題。傳統方式以手工為主,存在成本高、效率低、更新慢等缺點。而通過信息化手段歸集原本零散的知識經驗,系統化形成證券公司篩查、統計、溝通、審核、處置、轉化等工作流程,可以確保處理效率,并做到處理情況可審計、可檢驗。

智查系統建設的主要內容是基于天云的特征工程平臺和AI建模平臺,實現證券異常交易識別模型的商業重構,包括特征計算、算法選擇、參數調整、一站式建模、模型評估、模型調優等功能。

異常交易風控建模平臺的核心技術主要在于賬戶交易特征的設計和模型選擇兩方面。

首先,異常交易賬戶和普通賬戶鑒于其使用方式的不同,存在著交易行為模式上的差異,但這種差異難以直觀的從原始交易記錄上看出,因此通過設計交易特征,挖掘深層次隱含交易模式是整個系統成功的關鍵。而好的交易行為特征必須可以充分突出體現異常交易賬戶特有的交易特點。如何發現設計出好的交易特征是整個系統開發過程中的重點和難點。天云通過對大量的異常交易賬戶進行觀察研究,概括總結了異常交易賬戶的兩個特點:交易規模偏大和交易模式復雜,從這兩個維度出發設計出了30個左右的能夠充分區別異常交易賬戶和普通賬戶的行為特征,是智查異常交易賬戶監測系統取得滿意效果的保證。

異常交易風控建模平臺的另一核心技術在于人工智能模型的選擇。人工智能領域今年來高速發展,涌現出越來越來的優秀模型和技術。但基于人工智能理論,并不存在最好的模型,每個模型都有自己的設計理念和應用場景,因此,選擇最合適的模型也是整個系統構建的重點。天云一方面嘗試使用了大量的分類監督模型,另外也從理論和設計原理的角度出發分析評價各個模型的優劣。經過大量的嘗試分析后選擇人工智能里面隨機森林模型作為智查異常交易賬戶監測系統的最終模型。經過后續的驗證結果也顯示:隨機森林模型可以取得令人滿意的預測結果。

上線結果顯示,異常交易風控建模平臺在與傳統異常交易賬戶查處方式相結合,提升異常交易賬戶查處效率;提升監管人員的查處效率;有效評估市場異常交易賬戶的狀態等方面對異常交易賬戶監管起到了輔助作用。

河南快3和值9点奖金多少