文 / 七公
出品 / 節點商業組
2023年夏末初秋,這場由ChatGPT催生的大模型熱,依然在全球火輪高吐。
但隨著越來越多的玩家入場,“百模大戰”全面打響,于極度喧囂和熱鬧的氣氛中,行業也逐漸陷入“冷思考”:過往不乏新技術曇花一現,大模型能否可持續發展?能否走出拼參數、拼數量的“短視主義”,邁向長期的價值成長?
9月5日,2023年百度云智大會上,百度智能云宣布推出千帆大模型平臺2.0,為企業提供更加高效、低成本的大模型開發解決方案。
此前8月16日,于2023 WAVE SUMMIT深度學習開發者大會上,百度亦向外界展示了科技創新和產業升級浪潮下,大語言模型文心一言與深度學習平臺飛漿如何重塑生產方式、商業鏈路、業務模式、社會關系和生態底色。
在復盤了百度的所思所悟、所行所向后,關于大模型的價值成長之路,或許可以參透一二。
價值成長——技術力?
對大模型而言,第一關自然就是技術實力。
上個月的WAVE SUMMIT,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰首次對外表示,AI具有多種典型能力,理解、生成、邏輯、記憶是其中的核心基礎能力,這四項能力越強,越接近通用人工智能。
為什么這么說,就像在考試時,我們從審題、破題、答題,到最后復核的過程,其實是理解、記憶、邏輯及生成等能力的整體封裝和綜合運用。
事實是,這條放之四海皆準的道理,也幾乎是考核所有大模型的標準。
就拿文心一言和千帆來說,它首先從海量數據和內容的融合學習中,得到預訓練的大模型,并采用有監督精調、人類反饋的強化學習和提示等技術,鍛造知識增強、檢索增強和對話增強等底層力量。
接下來,再通過有深度、有廣度、有指向的創新,繼續在知識增強、檢索增強和對話增強等根柢刨挖、耕作,實現基礎模型、精調技術、知識點增強、邏輯推理、原生插件等功能的改進。
比如,推理方面,憑借大規模邏輯數據構建、邏輯知識建模、多粒度語義知識組合以及符號神經網絡技術,文心一言顯著精進了邏輯推理、數學計算及代碼生成等任務的表現。
在最新版本的3.5中,文心一言提出“知識點增強技術”,旨在讓大模型能夠更好地利用精細的知識點來拔高理解能力,加強對世界知識的調度和掌握,解決用戶更具象、更確切、更多元的需求,
為此,文心一言新增插件機制,包括百度搜索、覽卷文檔、一鏡流影、說圖解畫、E 言易圖五個官方外掛,對應實時抓取準確信息、長文本摘要和潤色、文生視頻、看圖說話和隨拍配文、數據洞察和圖表制作。
比如,一鏡流影依托文心跨模態大模型,集合視覺、語音、文字、影像技術于一體,突破了不同模態之間語義對齊的難題,用戶僅需簡單輸入文字,即可在1分鐘內獲得完整、高品質的AIGC視頻。
再如,E言易圖,只需扼要輸入數據圖表要求或相關數據內容,即可生成可交互圖表,協助用戶完成數據讀取、分析及圖表信息的交互演示,從而使大模型與辦公、財務、數據統計等領域更為緊密、有針對性的結合。
9月1日,文心一言率先向全社會開放。截至目前,文心一言已經能熟練駕馭200多個創作體裁,內容豐富度是發布初期的1.6倍,思維鏈長度是發布初期的2.1倍,知識點覆蓋也達到了發布初期的8.3倍。
價值成長——共創力?
當下,我們常常聽到幾個詞,構筑生態、正和博弈、打開格局……說的其實都是互利共贏的思維、開放包容的心態,實質是利他利己、普惠眾生。
2023 WAVE SUMMIT,百度正式推出星河大模型社區,并現場宣布文心大模型“星河”共創計劃,王海峰稱,飛槳開發者社區AI Studio中文名“星河社區”,含義是“文心加飛槳,翩然赴星河”,“希望和所有的開發者一起,在飛槳和文心的加持下,共建星河社區,共赴通用人工智能的星辰大海。”
經節點財經了解,飛槳深度學習框架早于2016便對外開源,并伴隨技術進步和產業發展,不斷擴充資源庫,延展能力邊界和服務深度,為開發者提供日新月異的溝通、成長環境。
2023 WAVE SUMMIT,飛漿又拿出了諸多“拆掉藩籬、共同灌溉”的實效安排。
首先,飛槳開源框架2.5 版再度進化,聯合文心一言,驅馳大模型訓練、推理、多硬件適配等能力大幅提升。
比如,在飛漿端到端自適應混合并行訓練技術的加持下,疊加壓縮、推理、服務部署的協同優化,文心一言的訓練速度和推理速度分別達到原來的3倍、30多倍,模型效果提升50%,也使開發者的體驗更方便、更敏捷、更易用。
其次,飛漿自身,也完成了重要迭代。
一方面,通過建設基礎算子體系和組合算子體系,飛槳將神經網絡編譯器CINN與主框架耦合打通,借助其優異的編譯能力和領先的訓推速度,實現了更加通用的性能優化,降低開發門檻。
另一方面,基于高階自動微分、復數微分、高階優化器等計算能力,特別是可持續擴展的高階自動微分,飛槳開源平臺自研了一系列用于科學研究的工具組件,包括賽槳PaddleScience、螺旋槳PaddleHelix、量槳Paddle Quantum等,支持復雜外形障礙物繞流、結構應力應變分析、材料分子模擬等豐富算例,廣泛支持AI加計算流體力學、生物計算、量子計算等前沿方向的科研探索和產業應用。
由此,飛槳全新的訓練架構初步成型,不僅保持了動靜統一、一行代碼轉靜態圖訓練部署的優勢,而且通過編譯器技術進一步降低了模型性能優化的邊際成本。
除此之外,飛槳還與英偉達、寒武紀、華為、Arm等多家公司開展了適配,覆蓋云和端側多種硬件類型,為AI Studio大模型社區引入多元生態算力,共同開發課堂與培訓內容,助力開發者向AI縱深處探索。
得益于上述科技平權和分我杯羹的舉動,以及飛槳+文心的互相促進,迄今,星河大模型社區已凝聚了609萬開發項目,積累超300個大模型創意應用,飛漿生態的開發者數量超過800萬,服務22萬家企事業單位。
某種程度上,該種舉動,也為百度激活生態創新,孕育AI時代現象級產品與應用打下堅實的地基。
價值成長——生產力?
2023年,面對空前興奮和繁盛的AI,有人高呼這是“iPhone時刻”,有人振臂這是第四次工業革命,也有人驚嘆這是新一代的“火”和“電”,但歸根結底,它是一項技術。
而技術只有實實在在地轉化為生產力才是有意義的,才能行穩致遠。
換言之,無論大模型多么先進,它只有走出實驗室,走向現實的場景,在千行百業的生產線里發揮作用,才能體現價值,也是其良性循環、長線跑贏的開端。
關于這一點,百度一直在身體力行。作為業內較早推動大模型在產業里落地的廠商,百度攜手國家電網、浦發銀行、泰康、吉利、深圳燃氣、TCL等企業單位,合作發布了11款垂直大模型。
最新升級的千帆大模型平臺2.0,更瞄準產業發力,據百度智能云沈抖負責人介紹,千帆大模型數量增至42個,預置了41個高質量有行業特色的數據集,月活企業近萬家,覆蓋金融、制造、能源、政務、交通等行業的400多個業務場景。
就拿長期受“雙十魔咒”平均成本超過10億美元、研發周期大于10年)醫療行業來說,由于大模型的接入,可能斬獲彎道超車的機會,提速商業化進程。
杭州立德百克生物醫藥采用飛漿文心大模型進行藥物發現,僅僅幾個小時內,就在780萬個化合物的虛擬篩選庫中篩選出了110個打分較高的潛在候選分子,不僅大幅縮短工作時長,且有效控制成本費用,降低路徑難度,而在過去,新藥研發人員想要找到對應的目標分子,其進展的快慢,往往取決于運氣。
接著以復雜、龐大的黑巨人——鋼鐵工業生產為例。
鋼鐵廠生產鋼筋過程中會采用計算機控制技術實現鋼筋自動定尺并對鋼筋進行切斷,這道工序看似簡單卻極具殺傷力——一旦部分鋼筋長度超限,且沒有及時處理,就會給后續工序的機械臂造成嚴重損傷。
針對這一問題,寶武中南鋼鐵在該智能化項目的負責人引入AI技術手段,根據飛槳圖像分割開發套件PaddleSeg打造的“鋼筋長度超限監控方案”,于2023年2月上線并在多條產線穩定運行至今。
后續反饋顯示,該方案替換了傳統的工人師傅人工核查的方式,啟動后各項指標效果優異,語義分割評價指標(mIoU)> 99%,異常/正常二分類準確率(Accuracy)大于99.5%,顯著提高了生產安全性和生產效率,單條產線成本節省超過50萬。
誠然,上面兩個例子只是百度大模型不勝枚舉事跡中的個別擇錄,但管中窺豹,我們仍然能感受得到,它是理性和真實的,致力于生產力變革,為產業提“智”增效、活水凈水。
亦如沈抖所言,大模型將改變所有行業,三大“智能新基建”將提速。
節點財經聲明:文章內容僅供參考,文章中的信息或所表述的意見不構成任何投資建議,節點財經不對因使用本文章所采取的任何行動承擔任何責任。