科大訊飛董事長劉慶峰在訊飛星火大模型V4.0發布會上發表演講。
科大訊飛研究院院長劉聰在發布會上進行技術演示。
全新一代星火智能座艙提供個性化的駕駛陪伴。
薛歌 本報記者 | 杜壯
6月27日,科大訊飛在北京發布訊飛星火大模型V4.0及其在醫療、教育、商業等多個領域的落地應用。該模型基于全國首個國產萬卡算力集群“飛星一號”訓練,模型能力全面對標GPT-4Turbo,并在文本生成、語言理解、知識問答、邏輯推理、數學能力等方面實現超越。 科大訊飛董事長劉慶峰在發布會上表示,人工智能技術的發展絕不是一家公司可以把所有事情都做完的,只有生態才能生生不息;必須是自主可控的繁榮生態,才有中國通用人工智能的未來。
加速大模型落地應用
隨著新一輪科技革命和產業變革深入發展,技術創新進入前所未有的密集活躍期。在2024大連夏季達沃斯論壇發布的年度十大新興技術中,“驅動科學發現的人工智能”位列榜首。該報告指出,人工智能用于科學研究已有多年,深度學習、生成式人工智能和基礎模型等領域的進步正在徹底改變科學發現的過程。 目前,國內科技企業和初創公司紛紛入局基礎大模型訓練和研發,但是對于大模型如何賦能行業、形成有價值可落地的產品,行業仍然都在探索中。 一直堅持“技術頂天、應用立地”戰略的科大訊飛,圍繞多語種智能語音技術構建了自主可控的產業生態,持續加速大模型的落地應用。劉慶峰表示,自去年9月全面開放以來,訊飛星火App在安卓公開市場累計下載量達1.31億次。 “通用人工智能從通用助手變成更懂你的AI助手,這中間的底層技術是需要能夠有基于用戶畫像的個性化表達。”在發布會上,劉慶峰提到了大模型個性化能力的重要性。據悉,升級改版后的訊飛星火App和電腦桌面版應用,推出了個人空間,用戶可以在里面上傳自己的工作、學習、生活、健康等各類資料,形成個人專屬知識庫,再結合人設,讓大模型生成更個性化的內容。 訊飛曉醫App上線的“個人數字健康空間”,能夠根據電子病歷、檢查報告、體檢報告等用戶個性化資料,構建個人數字健康空間;首款星火智能批閱機,集智能批改、學情分析、個性作業于一體…… 在教育、衛生、醫療等細分行業,大模型的滲透帶來了“幾何量級”的應用創新,正在以前所未有的速度推動人工智能進入“工業大生產階段”。 此次科大訊飛發布了74個語種、方言免切換對話,破解強干擾場景下語音識別難題,并通過云邊端及軟硬一體化解決方案,賦能汽車、家電、機器人等領域人機交互變革。 實際上,大模型技術可以在復雜語義理解、長文本建模能力上進一步提升語音識別、合成和翻譯的效果,同時基于其強大的語義理解、知識問答、多輪對話、多模態建模能力,也能進一步大幅提升智能語音技術的使用場景和應用價值,支撐實現語音同傳、自動客服、輔學答疑、家庭醫生、虛擬員工、陪伴機器人、服務機器人等未來智能產品創新,帶來巨大產業機會,加速通用人工智能時代的到來。
完全自主可控大模型進入新階段
如今,國產大模型正在從“出生潮”走向“應用潮”。《中國新一代人工智能科技產業發展報告2024》指出,2023年,我國人工智能核心產業規模達5784億元,增速13.9%。我國生成式人工智能的企業采用率已達15%,市場規模約為14.4萬億元。另據相關數據顯示,截至今年4月底,國內共推出305個大模型;10億參數規模以上的大模型數量已超100個。 有專家指出,模型與算法、數據與知識、芯片與算力、場景與真實的產業應用需求,是數字生態發展的核心力量,也是大模型競爭的關鍵因素。對于人工智能技術而言,推出產品時間早晚并不是最重要的,關鍵是扎實做好底層的算法、算力和數據。 在發布會上,劉慶峰多次提到“自主可控”,而這也是科大訊飛尋求大模型突破的關鍵。 此次發布的星火大模型V4.0基于全國首個國產萬卡算力集群“飛星一號”訓練。劉慶峰在發布會上表示,這標志著完全自主可控的大模型進入了新階段,有著重要意義。特別是在中美科技人工智能最激烈的博弈之下,國產大模型底座的能力和支撐,決定了能在這條路上走多遠,決定了能否在這一波人工智能浪潮中享受更多紅利。 人工智能具有跳躍式技術演進的發展特點,是新質生產力重要的驅動力。在算法、算力、數據的集成創新下,生成式人工智能日臻成熟,為生產力要素提質增效提供了源源不斷的動力與活力。 日前,科大訊飛作為第一完成單位的《多語種智能語音關鍵技術及產業化》項目獲得國家科學技術進步獎一等獎。這是深度學習引發全球人工智能浪潮以來,過去十年人工智能領域獲得的首個國家科學技術進步獎一等獎。 在攻克上述項目技術難題時,科大訊飛提出了4個方面的技術創新:復雜語音信號解耦建模關鍵技術突破,多語種共享建模關鍵技術突破,語音語義聯合建模關鍵技術突破,國產異構硬件平臺訓練及推理加速關鍵技術突破。這些技術也應用在了不斷升級后的星火大模型中。 “在自主可控的底座下進化國產大模型非常有必要,我們未來仍舊會繼續追趕,保證不出現代差。”劉慶峰說。
打造企業專屬大模型
今年上半年,大模型相關的項目正在迎來大爆發。據相關機構統計,僅2024年前5個半月,國內大模型項目中標公告已發布超230個,遠超2023年全年水平。 自去年5月發布以來,訊飛星火大模型已成為國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、奇瑞汽車、中國一汽、大眾汽車、江汽集團、海爾集團、美的集團等多領域頭部企業的首選。 支撐科大訊飛高質量發展的底氣來自其在國產化全棧能力的布局。去年10月,科大訊飛和華為共同推出了中國首個萬卡的國產算力平臺——“飛星一號”。3個月后,今年1月訊飛星火V3.5發布,星火開發者生態加速增長,開發者數從598萬人增長到702萬人,海外開發者數超40萬人,大模型開發者達57萬人。如今,越來越多的開發者正加入星火生態,釋放更多剛需場景的應用價值。 目前,訊飛星火已經在代碼、合規審查、客服、評標、智能交互等多個典型場景產生應用成效。以交通銀行為例,基于星火大模型能力的產品iFlyCode覆蓋6000多位研發人員,代碼采納率達38%。 如何更好地解決企業大模型應用的“最后一公里”?劉慶峰認為,企業首先要科學地認識大模型能力的邊界,根據任務難度選擇合適方案,并且用更少的算力、更高的效率,打造企業專屬大模型。隨著訊飛星火V4.0的發布,他認為用智能體平臺打造每個崗位專屬助手的時間已經到來。 “智能體”和“智能”是密不可分的,它具備一些類似人的智能能力和行為,比如學習、推理、決策和執行能力。此次科大訊飛發布了星火企業智能體平臺,通過這一平臺,企業可以結合業務場景,構建可落地的智能體應用。圍繞生產域、科創域、辦公域、管理域,該平臺上線了代碼智能體、商機助手等32個企業智能體,供企業即插即用。 日前,國家發展改革委等部門出臺的《關于打造消費新場景培育消費新增長點的措施》,談及“利用新技術拓展購物消費體驗”時提到了利用人工智能大模型等技術,拓展電商直播場景;在“打造電子產品消費新場景”中明確,探索開發基于人工智能大模型的人形機器人。 傳統的技術體系、組織架構、商業模式、產業形態被加速重構,數實融合邁向更加深入和廣泛的新階段。國際市場研究機構Gartner預測,到2026年,超過80%的企業將使用生成式AI的API(應用程序編程接口)或模型,或在生產環境中部署支持生成式AI的應用,這也將為產業發展帶來巨大的機遇與挑戰。 面向未來的人工智能新生態,劉慶峰認為要關注源頭技術生態、智能體生態、應用生態和行業生態,通過自主可控和軟硬一體,才能實現大模型的深度落地;既要科學理性地認識中美在大模型上的綜合差距,也要有信心快速追趕,給出從源頭技術、到產業生態、再到應用落地的一整套打法,以長期主義來打造真正自主可控的AI產業生態。 (本稿圖片由科大訊飛提供)
|