騰訊混元大模型正式亮相:一手抓更強中文創(chuàng)作能力 一手抓大模型安全管控
摘要:①騰訊混元大模型,一是從中文領(lǐng)域做攻克,讓大模型具備更強的中文創(chuàng)作能力,完善服務(wù)中國企業(yè)時的本土化能力;第二是在復雜推理過程中,增強對大模型安全的管控能力; ②湯道生表示,騰訊將邁入“全面擁抱大模型”時代。
《科創(chuàng)板日報》9月7日訊(記者 張洋洋)?今日,在2023騰訊全球數(shù)字生態(tài)大會上,騰訊混元大模型正式亮相,并宣布通過騰訊云對外開放。在現(xiàn)場,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示,騰訊將邁入“全面擁抱大模型”時代。
騰訊集團副總裁蔣杰,也即混元大模型的負責人,則對本次大模型的技術(shù)和應(yīng)用布局進行了解讀,并對該模型進行了現(xiàn)場演示。
官方信息顯示,騰訊混元大模型擁有超千億參數(shù)規(guī)模,預訓練語料超2萬億tokens。目前,混元大模型已經(jīng)接入騰訊50多個業(yè)務(wù)和產(chǎn)品,包括騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等。
面向產(chǎn)業(yè),混元大模型將作為騰訊云MaaS服務(wù)的底座,客戶不僅可以直接通過API調(diào)用混元,也可以將混元作為基底模型,為不同產(chǎn)業(yè)場景構(gòu)建專屬應(yīng)用。
從市場環(huán)境來看,大模型的密集發(fā)布期已過,在接受《科創(chuàng)板日報》等媒體采訪時,騰訊公關(guān)總監(jiān)張軍表示,騰訊選擇此刻亮相混元大模型,并非受到外部環(huán)境的影響,更多是借助生態(tài)大會,向外界展示混元大模型的應(yīng)用和嘗試。
面對“百模大戰(zhàn)”的市場環(huán)境,混元通用大模型要如何取勝?騰訊集團副總裁蔣杰告訴《科創(chuàng)板日報》等記者,騰訊的策略第一是從中文領(lǐng)域做攻克,讓大模型具備更強的中文創(chuàng)作能力,完善服務(wù)中國企業(yè)時的本土化能力;第二是在復雜推理過程中,增強對大模型安全的管控能力。
需要指出的是,騰訊已經(jīng)于今年6月先發(fā)布了行業(yè)大模型。對此,蔣杰表示,此前的行業(yè)大模型覆蓋領(lǐng)域有限,今日發(fā)布的混元通用大模型,將會支持更多行業(yè)。
但蔣杰也坦言,目前大模型的成熟度和對復雜任務(wù)的處理能力還不夠,因此應(yīng)用場景也有限,大模型企業(yè),可以基于自身實際場景出發(fā),去跟模型本身有更深度結(jié)合的應(yīng)用,也以此來抵消研發(fā)訓練推理產(chǎn)生的高昂成本。
《科創(chuàng)板日報》記者注意到,就在今日,微信的騰訊混元助手小程序已經(jīng)開放內(nèi)測申請,目前正在排隊審核期。
在采訪中,蔣杰透露,混元大語言模型已經(jīng)向相關(guān)部門備案,且已獲批,但目前還沒獲得面向C端開放的批復。目前混元大模型的C端基本還是以內(nèi)部應(yīng)用和結(jié)合一定場景做嘗試為主。