摘要:隨著人工智能技術的快速發展,多模態AI作為一種能夠同時理解和處理文本、圖像、語音等多種類型數據的技術,正逐漸成為AI領域的前沿方向。
7月25日,多模態AI概念漲幅居前。截至發稿,因賽集團、競業達等多只個股漲停。
消息面上,7月26日,2025世界人工智能大會將在上海舉行。在本屆大會上,工信部將總結國家人工智能產業發展和賦能應用的趨勢和成果,推動國際交流合作。
政策助力產業騰飛
近年來,我國陸續出臺多項政策,支持人工智能產業的發展。
2023年,廣東、北京、上海接連出臺政策,從算力的角度切入,鼓勵大模型技術體系的發展,以及應用場景的創新。2024年,其他地區也出臺有關大模型政策,主要是圍繞“高效辦成一件事”,以提高政務效率為主要目的。
2025年,政府工作報告提出,持續推進“人工智能+”行動,并將“支持大模型廣泛應用”首次寫入報告。強調發揮科技領軍企業龍頭作用,加快推進基于國產算力底座的大模型研發創新、場景應用、生態開放全鏈發展。
通過“人工智能+”行動,促進數字技術與制造、市場優勢結合,支持智能網聯汽車、人工智能終端、智能機器人等新一代智能終端及智能制造裝備發展。
在政策助力下,我國多模態AI市場實現快速增長。根據中研普華產業研究院的數據,2024年中國多模態AI市場規模達到150億元人民幣,同比增長30%。到2025年市場規模有望突破200億元人民幣。展望未來,到2030年,中國多模態AI市場規模預計將達到800億元人民幣。
技術創新不斷涌現
隨著人工智能技術的快速發展,多模態AI作為一種能夠同時理解和處理文本、圖像、語音等多種類型數據的技術,正逐漸成為AI領域的前沿方向。
目前,多模態AI行業的技術創新不斷涌現,主要圍繞多模態融合、生成式AI和算力優化等方面展開。
在多模態融合領域,谷歌的Gemini模型和百度的文心大模型通過整合多模態數據,實現了協同分析,顯著提升了模型的泛化能力和應用場景的多樣性。
在生成式AI方面,OpenAI的GPT-5和DeepSeek的R1模型支持多模態交互與內容生成,能夠生成更加自然、多樣的文本、圖像和語音內容。
此外,算力優化也是技術創新的重要方向,模型輕量化(如文心一言4.0)與邊緣計算技術的應用,有效降低了多模態AI模型的部署成本。
與此同時,國內巨頭加快技術創新步伐。阿里巴巴開源QwQ-32B推理模型,性能比肩國際頂級產品,并推出視頻生成模型Wan2.1,在文生視頻領域實現技術反超。捷成股份(300182.SZ)、萬興科技(300624.SZ)等垂直賽道龍頭,憑借版權資源與全球化產品矩陣,將多模態技術深度嵌入影視創作、數字營銷等場景,商業化路徑清晰。
應用范圍擴展,市場規模可觀
在相關技術不斷突破的背景下,多模態AI的應用場景也得到進一步拓展,在醫療、教育、工業等領域展現出廣闊的應用前景,推動各行業的數字化轉型。
在醫療領域,多模態AI通過整合病歷、影像、基因數據等多源信息,提升了診斷的準確性和效率。例如,某些多模態診斷系統能夠將醫療影像分析效率提升30%,為醫生提供更全面的決策支持。
在教育娛樂領域,多模態AI技術被應用于虛擬教師和沉浸式游戲的開發中,虛擬教師的普及率不斷增長,沉浸式游戲的用戶滲透率也有望突破50%。在智能制造領域,多模態AI在設備運維和工業質檢中替代了部分人工決策,顯著提高了生產效率和產品質量。
隨著多模態AI在零售與娛樂、工業等領域的應用,相關領域的市場規模也在持續增長。根據中研普華產業研究院的預測,到2032年零售與娛樂領域的多模態AI市場規模預計將達到730億美元,而工業AI市場規模則有望達到895億美元。
市場表現方面,今年以來,多模態AI概念板塊震蕩上行,累計上漲25.52%。7月25日,該概念板塊再度走強,因賽集團(300781.SZ)收獲20CM漲停,云從科技(688327.SH)漲11.13%、競業達漲10%。拓爾思(300229.SZ)漲7.56%、易點天下(301171.SZ)漲6.38%。