火山引擎總裁譚待 12月18日,2024火山引擎FORCE原動力大會·冬在上海舉辦,火山引擎帶來豆包大模型家族全新升級。豆包大模型12月日均tokens使用量超過4萬億,較5月發布時期增長超過33倍。 okens調用規模化增長的同時,豆包大模型在不同場景中都在快速增長、全面開花。比如信息處理場景,最近3個月豆包大模型調用量增長了39倍,幫助企業更好的分析和處理內外部數據;在客服與銷售場景,調用量增長16倍,幫助企業更好的服務客戶,擴大銷售;在硬件終端場景,增長13倍,AI工具增長9倍。 不斷增加的調用量和多場景覆蓋,讓豆包大模型越來越全面,迎來重磅升級。 豆包·視覺理解模型發布,拓寬大模型場景邊界視覺,是人類理解這個世界最重要的手段。對于大模型來說也是如此,只有做好視覺理解,才能讓模型有能力處理好真實世界的信息,輔助人類完成一系列復雜工作。本次大會正式發布了豆包·視覺理解模型,用戶可以同時輸入文本和圖像相關的問題。模型能夠綜合理解并給出準確的回答。這將極大地簡化應用的開發流程,解鎖更多的大模型價值場景。 更強的內容識別能力:不僅可以識別出圖像中的物體類別、形狀等基本要素,還能理解物體之間的關系、空間布局以及場景的整體含義。 更強的理解和推理能力:不僅能更好地識別內容,還能根據所識別的文字和圖像信息進行復雜的邏輯計算。 更細膩的視覺描述能力:可以基于圖像信息,更細膩地描述圖像呈現的內容,還能進行多種文體的創作。 基于以上能力,豆包·視覺理解模型在教育、旅游、電商等場景有著非常廣泛的應用。在教育場景中,為學生優化作文、科普知識;在旅游場景中,幫助游客看外文菜單、講解照片中建筑的背景知識;在電商營銷場景中,幫助商家充分描述商品細節,高效發布種草廣告等等。視覺理解能力將極大拓展大模型的場景邊界,為大模型的場景使用打開天花板,在金融、醫療、建筑、地理、體育、物流等諸多行業還有非常廣闊的應用前景。 豆包·視覺理解的輸入價格為每千tokens 0.003元,比行業平均價格降低85%,相當于一塊錢可以處理284張720P的圖片,視覺理解模型正式走進厘時代。同時火山引擎還將提供更高的初始流量,RPM達到了15,000次,TPM達到120萬,讓企業和開發者用好視覺理解模型,找到更多創新場景。 豆包大模型家族再進化,豆包通用模型pro迭代新版本在本次大會中,火山引擎除了推出視覺理解模型之外,還發布、升級了多個其他模型。大模型家族成員更豐富,大模型能力再提升。 豆包通用模型pro完成新版本迭代:綜合任務處理能力較5月份提升32%,在推理上提升13%,在指令遵循上提升9%,在代碼上提升58%,在數學上提升43%,在專業知識領域能力提升54%。
豆包·音樂模型4.0發布:從 “高光片段” 走向 “完整歌曲”,支持包括前奏、主歌、副歌、間奏、過渡段的3分鐘全曲創作;歌詞局部修改,仍能適配原有旋律;全曲風格、情感和音樂邏輯保持一致,曲風連貫。 豆包·文生圖模型2.1發布:支持“一鍵P圖”,可以高精度指令理解,對中英文、專有名詞“來者不拒”;高質量編輯效果,聚焦目標,不“誤傷”原圖;高效率創新模型,可實現多元風格,美觀自然。支持“一鍵海報”,中文精準生成,高質量精準生成中文;圖文精妙融合,字體與圖片內容巧妙融合;極速海報生成,模型最快做到6秒出圖。 veOmniverse+豆包·3D生成模型發布:veOmniverse支持高保真視覺渲染、大規模渲染算力池、物理&傳感精確模擬、即開即用的3D編輯器。豆包·3D生成模型,支持文生3D、圖生3D及多模態生成,1min生成高保真、高質量3D資產,復雜物品、物品組合大規模場景生成,支持多模態3D資產編輯。 此外,豆包·視頻生成模型將在2025年1月正式對外開放服務,用戶可在火山引擎官網預約正式服務。 全域搜索、高效記憶為模型落地加速為了幫助企業輕松應對信息獲取和搜索推薦的挑戰,火山引擎推出全域AI搜索,通過場景化搜索推薦一體化服務、企業私域信息整合服務、聯網問答服務,將企業的信息、業務和用戶需求緊密結合,幫助企業實現“發現更多,推薦更準,搜索無限可能”。 火山引擎AI搜推引擎基于基于豆包大模型家族的融合增強技術驅動;搜索推薦一體,有強大的推薦能力、結果精準、深度個性化;支持多模態,文本、圖像、音頻、視頻全能理解;電商、信息檢索、娛樂場景通通適用;性能強,支持百億內容規模、超大規模吞吐、亳秒級檢索。聯網問答Agent基于抖音集團海量優質實時內容更豐富;秒級呈現,依據問題提供時效性熱點答案更高效;圖片、語音、文字等多模態可視化創新交互更創新,幫助企業實現全域信息一觸即達。 記憶對大模型是非常重要的,記憶未來會是大模型必備的能力。火山引擎融合了更好的上下文緩存技術和RAG技術,發布大模型記憶方案,將通過更快的響應速度、更低的使用成本、更精準的效果、以及億級別的記憶片段,幫助客戶構建更有效的記憶方案。 扣子升級1.5版本,讓AI離應用更近一步: 開發者生態逐漸完善:超過100萬活躍開發者,發布超過200萬個智能體。 全新的AI應用開發環境:支持GUI搭建界面,并且可以一鍵發布為小程序 、H5、API等多種應用形態。 更強的多模態能力:提供音視頻對話能力,端到端延遲響應低至1秒,低成本SDK快速接入各類硬件。 海量的精品模板:涵蓋多業務場景,一鍵復制使用。 HiAgent升級1.5版本,幫助企業敏捷構建企業級AI原生應用的能力中心: 更懂AI轉型:提供觀測&評測體系,保障效果生產可用;提供100+行業應用模板,企業可開箱即用;提供配套AI咨詢,幫助企業找到AI落地路徑。 更深業務適配:提供豐富的企業級插件、靈活的應用集成機制;GraphRAG構建知識圖譜,提供細粒度的知識資產管理;生成式畫布融合CUI和GUI,打造智能交互引擎。 更強安全保障:支持 RAG 知識庫和大模型全棧私有化部署。 模型落地加速將為企業帶來更多機遇,助力多行業加速智能化轉型。在汽車領域,過去7個月,豆包大模型汽車行業日均tokens消耗增長了50倍,目前已服務國內市場近八成汽車品牌,穩坐汽車行業大模型服務商第一梯隊。在智能終端領域,豆包大模型服務了終端行業客戶50+AI應用場景,覆蓋超過了3億個終端設備,為消費者帶來更加智能的生活與工作體驗,來自智能終端的豆包大模型日均tokens調用量從5月到12月增長了100倍。 技術架構面向AI全面轉型AI云與基礎設施持續創新火山引擎在基礎架構、數據分析等層面帶來新服務,為企業打造更便捷、更高效、更安全的AI體驗。 火山引擎認為下一個十年,計算范式應該從云原生,進入到AI云原生的新時代。AI云原生,將以GPU為核心重新來優化計算、存儲與網絡架構,GPU可以直接訪問存儲和數據庫,來顯著的降低IO延遲。同時,全系統提供更高規模的高速互聯,和端到端的安全保護。基于AI云原生的理念,火山引擎推出新一代計算、網絡、存儲和和安全產品。在計算層面,新一代的火山引擎GPU實例,通過vRDMA網絡,支持大規模并行計算和P/D分離推理架構,顯著提升訓練和推理效率,降低成本。存儲上,新推出的EIC彈性極速緩存,能夠實現GPU直連,使大模型推理時延降低1/50;成本降低20%。在安全層面,火山將推出PCC私密云服務,構建大模型的可信應用體系。 此外,火山引擎還升級了數據飛輪2.0,全鏈路AI開啟數智生產力新時代。所有的數據分析產品,包括cdp、BI、用戶行為分析、AB測試等,都推出了基于大模型的智能化新功能。同時,推出全模態數據湖解決方案,讓企業可以統一的管理好結構化數據和非結構化數據,并結合傳統ETL和大模型進行綜合分析。 未來,火山引擎將持續提升模型能力,優化模型服務,推動AI在各行業的深度融合與創新應用。更強能力、更低價格、更易落地的豆包大模型將助力開啟更智能、高效、便捷的AI未來。未來,火山引擎將持續提升模型能力,優化模型服務,推動AI在各行業的深度融合與創新應用。“更強模型、更低價格、更易落地”的豆包大模型將助力開啟更智能、高效、便捷的AI未來。 |