12月18日,在2024冬季火山引擎FORCE原動力大會上,火山引擎數(shù)智平臺(VeDI)正式升級發(fā)布數(shù)據(jù)飛輪2.0模式。

延續(xù)去年4月發(fā)布的數(shù)據(jù)飛輪“以數(shù)據(jù)消費(fèi)促資產(chǎn)建設(shè),以數(shù)據(jù)消費(fèi)助業(yè)務(wù)發(fā)展”的核心內(nèi)涵,此次升級后,數(shù)據(jù)飛輪2.0將AI視作數(shù)智化的核心競爭力,借助AI技術(shù)推動企業(yè)更普惠的數(shù)據(jù)消費(fèi)。

 

 

火山引擎數(shù)據(jù)飛輪2.0模式圖

本次模式升級包括了:智能數(shù)據(jù)洞察DataWind ChatBI智能體、增長分析DataFinder智能分析助手、A/B測試DataTester智能實(shí)驗(yàn)助手、客戶數(shù)據(jù)平臺VeCDP智能營銷助手、增長營銷平臺GMP創(chuàng)意助手、大數(shù)據(jù)研發(fā)治理套件DataLeap運(yùn)維助手和E-MapReduce全模態(tài)數(shù)據(jù)處理引擎等,全系列火山引擎數(shù)智平臺產(chǎn)品AI能力的發(fā)布。

與此同時,兩大數(shù)據(jù)飛輪2.0核心解決方案首次公開亮相。

其一為“DataFabric 驅(qū)動下的 ChatBI 智能體解決方案”,亮點(diǎn)在于賦予業(yè)務(wù)自定義的數(shù)據(jù)智能體能力,有效降低業(yè)務(wù)調(diào)用與理解數(shù)據(jù)的難度;

其二是“多模態(tài)數(shù)據(jù)湖解決方案”,該方案專注于處理全模態(tài)數(shù)據(jù),擴(kuò)容企業(yè)潛在數(shù)字資產(chǎn)規(guī)模。

至此,數(shù)據(jù)飛輪2.0實(shí)現(xiàn)數(shù)據(jù)生產(chǎn)、管理與應(yīng)用各環(huán)節(jié)全方位AI能力深度融合,推動企業(yè)數(shù)據(jù)消費(fèi)便捷化、資產(chǎn)建設(shè)低門檻化,加速企業(yè)數(shù)據(jù)價值實(shí)現(xiàn)進(jìn)程。

   數(shù)據(jù)消費(fèi)的新體驗(yàn):ChatBI智能體

在2.0升級前,火山引擎數(shù)據(jù)飛輪已在近兩年的時間里,幫助眾多企業(yè)通過數(shù)據(jù)消費(fèi)挖掘數(shù)據(jù)價值,助力業(yè)務(wù)增長:

領(lǐng)克汽車通過數(shù)據(jù)飛輪構(gòu)建用戶數(shù)據(jù)平臺,精準(zhǔn)洞察消費(fèi)者需求,實(shí)現(xiàn)差異化營銷,運(yùn)營成本降低70%;德邦快遞通過數(shù)據(jù)飛輪解決數(shù)據(jù)“黑盒”問題,用戶識別和營銷效率顯著提升,月營銷活動峰值可達(dá)100場,效率提高5倍;瑪麗黛佳兩年內(nèi)完成數(shù)智化轉(zhuǎn)型,搭建的“數(shù)據(jù)找人”模式,讓數(shù)據(jù)自動生成并流向業(yè)務(wù)負(fù)責(zé)人,實(shí)現(xiàn)實(shí)時決策……

數(shù)據(jù)飛輪模式并非靜態(tài)技術(shù)框架,而是有生命力的生態(tài)系統(tǒng),其生命力源于數(shù)據(jù)消費(fèi)。而,企業(yè)數(shù)據(jù)消費(fèi)的廣度與深度,則直接決定企業(yè)數(shù)智化的程度。

上述企業(yè)在數(shù)據(jù)飛輪模式助力下,內(nèi)部數(shù)據(jù)消費(fèi)水平顯著提升。

然而,在與更廣泛的客戶合作中,火山引擎數(shù)智平臺察覺到一個關(guān)鍵難點(diǎn):企業(yè)內(nèi)部各崗位角色間的的數(shù)字化水平存在較大差異,數(shù)據(jù)分析與應(yīng)用產(chǎn)品的使用往往局限在少部分專業(yè)角色中,這在一定程度上制約了企業(yè)級數(shù)據(jù)消費(fèi)活力的釋放。

這也引發(fā)了火山引擎數(shù)智平臺的思考:如何確保企業(yè)各業(yè)務(wù)角色以及每一層級組織,都能便捷、高效地獲取和使用數(shù)據(jù)?

在AI涌現(xiàn)的趨勢下,他們摸索著找到了新解法——構(gòu)建業(yè)務(wù)自己的數(shù)據(jù)智能體,在經(jīng)由內(nèi)部多個產(chǎn)品實(shí)踐后,最終發(fā)布了“Data Fabric驅(qū)動下的ChatBI智能體”解決方案。

火山引擎Data Fabric驅(qū)動下的ChatBI智能體解決方案

事實(shí)上,在去年,圍繞大模型能力,火山引擎數(shù)智平臺已經(jīng)推出了智能數(shù)據(jù)洞察DataWind分析助手等功能。企業(yè)員工可以通過自然語言輸入,查收到對應(yīng)的可視化圖表并實(shí)現(xiàn)下鉆分析,實(shí)現(xiàn)數(shù)據(jù)分析效率的提升。

但在企業(yè)具體的實(shí)踐中,重新學(xué)習(xí)輸入prompt(提示),并不能為專業(yè)的分析師“減負(fù)”;而對BI工具不精通的員工,在使用這類能力時,又會遇到如何選擇數(shù)據(jù)集等“專業(yè)”難題。

同時,籠統(tǒng)的分析助手無法理解不同行業(yè)與業(yè)務(wù)中的“黑話”,不理解使用者的真實(shí)意圖,從而大幅降低分析準(zhǔn)確性。

“Data Fabric驅(qū)動下的ChatBI智能體”解決方案,正在試圖解決上述這些問題:通過構(gòu)建完整的智能數(shù)據(jù)服務(wù)體系,打破數(shù)據(jù)“專業(yè)”壁壘,幫助企業(yè)內(nèi)每個業(yè)務(wù)都能定制專屬智能體,持續(xù)降低數(shù)據(jù)使用門檻,提升大模型能力下的數(shù)據(jù)反饋效率和準(zhǔn)確率。

在這套解決方案中, Data Fabric通過語義層和數(shù)據(jù)模型的整合,重構(gòu)了數(shù)據(jù)生產(chǎn)關(guān)系,在顯著降低數(shù)據(jù)存儲和計算成本的基礎(chǔ)上,讓數(shù)據(jù)服務(wù)變得更加敏捷;而ChatBI智能體則能更貼合業(yè)務(wù)個性化需求,通過交互理解、數(shù)據(jù)訪問、分析推理和結(jié)果生成四大模塊,極大提升業(yè)務(wù)員工的數(shù)據(jù)生產(chǎn)力,讓數(shù)據(jù)消費(fèi)變得更加簡單直接。

數(shù)據(jù)顯示,在字節(jié)跳動內(nèi)部,這套方案已覆蓋超200個分析場景,每天處理10萬余次分析請求,平均分析時間降低了 80%,數(shù)據(jù)開發(fā)和運(yùn)維成本也大幅下降。

   數(shù)據(jù)資產(chǎn)的新生力:多模態(tài)數(shù)據(jù)湖

如果說“Data Fabric驅(qū)動下的ChatBI智能體”解決方案,是火山引擎數(shù)智平臺持續(xù)在服務(wù)企業(yè)過程中,不斷洞察新的業(yè)務(wù)需求,實(shí)現(xiàn)的“數(shù)據(jù)+AI”能力沉淀和升級。那么“多模態(tài)數(shù)據(jù)湖”解決方案的誕生,則更像他們洞見當(dāng)下企業(yè)即將遇到的問題時,所作出的敏捷反應(yīng)。

LLM的大熱,讓企業(yè)對于AI賦能的數(shù)字化滿懷憧憬,眾多企業(yè)投身大模型于業(yè)務(wù)場景的落地實(shí)踐。然而技術(shù)魅力與現(xiàn)實(shí)困境共生,大模型催生的圖像、視頻、音頻等海量多模態(tài)數(shù)據(jù)正在挑戰(zhàn)傳統(tǒng)湖倉技術(shù)。

傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)處理,無法滿足當(dāng)下對多模態(tài)數(shù)據(jù)的存儲、計算,也無法挖掘出這部分?jǐn)?shù)據(jù)背后的資產(chǎn)價值。

在深度參與大模型產(chǎn)業(yè)的同時,火山引擎數(shù)智平臺亦敏銳感知到了非結(jié)構(gòu)數(shù)據(jù)變現(xiàn)成企業(yè)核心數(shù)據(jù)資產(chǎn)的意義。

多模態(tài)數(shù)據(jù)湖解決方案,應(yīng)運(yùn)而生。

火山引擎多模態(tài)數(shù)據(jù)湖解決方案:

火山引擎數(shù)據(jù)飛輪2.0所推出的多模態(tài)數(shù)據(jù)湖解決方案,可實(shí)現(xiàn)海量結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一精細(xì)化管理,全方位兼容各類數(shù)據(jù)格式,為LLM預(yù)訓(xùn)練、持續(xù)訓(xùn)練和微調(diào)全程各個環(huán)節(jié)提供更好的數(shù)據(jù)支持。

從數(shù)據(jù)源來看,火山引擎多模態(tài)數(shù)據(jù)湖方案可實(shí)現(xiàn)各類數(shù)據(jù)的統(tǒng)一管理;在算子處理方面,該方案提供了100多種開箱即用的非結(jié)構(gòu)數(shù)據(jù)處理算子;在多元異構(gòu)計算上,方案提供了CPU+GPU異構(gòu)計算,能讓數(shù)據(jù)計算提效3倍以上。

目前,該解決方案已廣泛應(yīng)用在泛互聯(lián)網(wǎng)、汽車等行業(yè),并取得實(shí)效。

以聚焦于智能網(wǎng)聯(lián)汽車的某科創(chuàng)公司為例,最初該公司使用自建開源大數(shù)據(jù)平臺支撐車聯(lián)網(wǎng)數(shù)據(jù)采集、加工及分析,但存在實(shí)時離線數(shù)據(jù)割裂、數(shù)據(jù)膨脹、系統(tǒng)穩(wěn)定性低等問題。

通過引入火山引擎多模態(tài)數(shù)據(jù)湖解決方案,該公司將火山引擎E-MapReduce作為數(shù)據(jù)湖 OLAP 引擎,構(gòu)建兼具離線、實(shí)時的湖倉一體架構(gòu),并運(yùn)用其存算分離架構(gòu)應(yīng)對高膨脹增量數(shù)據(jù),在確保計算性能 SLA 穩(wěn)定的同時,成功將維護(hù)成本降為零;還進(jìn)一步借助全域數(shù)據(jù)集成DataSail 實(shí)現(xiàn)OLAP、OLTP 兩種不同負(fù)載要求的任務(wù)分離,保障了服務(wù)的可用性。最終在數(shù)據(jù)處理實(shí)效性提升為秒級的基礎(chǔ)上,資源成本還降低了30%。

   技術(shù)之外,能力的培養(yǎng)至關(guān)重要

數(shù)據(jù)飛輪2.0模式的誕生,不僅僅是火山引擎在當(dāng)下技術(shù)變革的頂層設(shè)計進(jìn)化。它更是來自字節(jié)跳動內(nèi)部的數(shù)據(jù)驅(qū)動、AI實(shí)踐經(jīng)驗(yàn)的再次總結(jié)。

事實(shí)上,目前火山引擎數(shù)據(jù)飛輪2.0模式提供給企業(yè)客戶的能力,均已在字節(jié)跳動內(nèi)部進(jìn)行了長期的沉淀與優(yōu)化。

比如,多個業(yè)務(wù)線搭建了專屬ChatBI智能體,數(shù)據(jù)顯示,基于ChatBI智能體,業(yè)務(wù)用戶可自閉環(huán)完成“從業(yè)務(wù)問題到數(shù)據(jù)問題”的診斷和分析,數(shù)據(jù)自助分析率達(dá)90%。

再比如,另一款數(shù)智產(chǎn)品增長營銷平臺GMP所提供的創(chuàng)意助手能力,生成營銷內(nèi)容80%可以無需人工干預(yù)直接投放。

經(jīng)由內(nèi)部的充分實(shí)踐,火山引擎數(shù)據(jù)飛輪2.0模式已經(jīng)積累豐富的場景經(jīng)驗(yàn)。這些技術(shù)之外的經(jīng)驗(yàn)?zāi)芰,亦是飛輪2.0模式能運(yùn)行良好的重要保障。

因此,除了能力與方案的發(fā)布外,火山引擎在本次大會上也發(fā)布了“數(shù)據(jù)飛輪2.0加速計劃”,不僅為想要嘗試新能力的企業(yè)提供為期3個月的免費(fèi)試用,更為需要深度挖掘數(shù)據(jù)飛輪2.0場景的企業(yè),提供了最多3個月周期的免費(fèi)項(xiàng)目制陪跑服務(wù)。

在為企業(yè)提供工具能力的同時,更要向企業(yè)傳遞方法與經(jīng)驗(yàn)。

據(jù)了解,該陪跑服務(wù)涵蓋了企業(yè)大模型數(shù)據(jù)應(yīng)用方案規(guī)劃、企業(yè)Data+AI能力培育、業(yè)務(wù)陪跑等多個方面,目的是幫助企業(yè)用更短時間,更快構(gòu)建并高效運(yùn)行數(shù)據(jù)飛輪2.0,實(shí)現(xiàn)業(yè)務(wù)價值提升。