Sora帶動視頻生成概念股集體漲停 A股產(chǎn)業(yè)鏈“含金量”如何?
摘要:①各家公司都在研發(fā)或階段性地上限多模態(tài)模型及其應(yīng)用。業(yè)內(nèi)人士也表示,多模態(tài)將AI大模型的新一輪革命,同時也是未來人工智能應(yīng)用的主要形式; ②視頻生成大模型及應(yīng)用由于數(shù)據(jù)、算力等多方面原因,導(dǎo)致效果并沒有大家期待的那么完美,對公司業(yè)務(wù)會產(chǎn)生多大影響目前也無法量化。
《科創(chuàng)板日報(bào)》2月19日訊(記者 黃修眉)?OpenAI再次以大模型Sora引爆全球。A股龍年開市第一天,包括當(dāng)虹科技、博匯科技、萬興科技、因賽集團(tuán)在內(nèi)涉及文生視頻的上市公司股價(jià)也受此提振,均強(qiáng)勢漲停。
針對上述公司在多模態(tài)模型與AIGC方面的布局與現(xiàn)狀,《科創(chuàng)板日報(bào)》記者以投資者身份致電上述公司董秘辦。
整體來看,各家公司都在緊鑼密鼓地研發(fā)或階段性地發(fā)布多模態(tài)大模型及其落地應(yīng)用。業(yè)內(nèi)人士也表示,多模態(tài)將AI大模型的新一輪革命,同時也是未來人工智能應(yīng)用的主要形式。
集合式系統(tǒng)賦能多領(lǐng)域
當(dāng)虹科技此前在互動平臺表示,該公司擁有自研的AIGC工具集,于2023年上半年發(fā)布了以靜態(tài)照片生成三維體積視頻的方案,支持6DOF(六自由度)視角自由移動,并且通過點(diǎn)云模型轉(zhuǎn)換及壓縮算法實(shí)現(xiàn)高達(dá)800倍的視覺無損壓縮,實(shí)現(xiàn)不同模態(tài)之間相互切換。
當(dāng)虹科技董秘辦人士向記者表示,“上述提到的工具集擁有文生圖、圖生視頻、文生視頻等多種技術(shù)與功能,集合在公司研發(fā)的AIGC視頻內(nèi)容智能生成系統(tǒng)上,該系統(tǒng)融合了大模型技術(shù),能夠?qū)⒍喾N媒介內(nèi)容,如文本、圖片、音頻、視頻等,高效智能地轉(zhuǎn)化為高品質(zhì)的視頻內(nèi)容,但并不是可以下載的APP形式?!?/p>
“公司也正在研發(fā)與AI相關(guān)的其他多模態(tài)系統(tǒng),目前正在進(jìn)行優(yōu)化與調(diào)試?!鄙鲜龆剞k人士稱,“從技術(shù)底座來看沒有太大問題,都在進(jìn)行之中,但具體到產(chǎn)品的形式甚至發(fā)布時間等,目前無法確定。”
對于“公司多模態(tài)AI領(lǐng)域是否有自己核心技術(shù)活產(chǎn)品布局”的問題,博匯科技證代辦人士向《科創(chuàng)板日報(bào)》記者表示,該公司的多模態(tài)處理技術(shù)主要應(yīng)用于傳媒安全領(lǐng)域,以AI多模態(tài)識別引擎為支撐,通過運(yùn)用人工智能、大數(shù)據(jù)等技術(shù),提升對文本、圖片、音頻、視頻等多類型數(shù)據(jù)的處理分析能力。
《科創(chuàng)板日報(bào)》記者注意到,博匯科技擁有以視聽大數(shù)據(jù)采集技術(shù)、分析技術(shù)、可視化技術(shù)三大核心技術(shù)為軸心的視聽數(shù)據(jù)處理技術(shù)群,在公司所涉及的領(lǐng)域,特別是在對視聽數(shù)據(jù)處理要求極高的廣播電視領(lǐng)域得到了廣泛應(yīng)用。
對于“公司是否有研發(fā)C端客戶應(yīng)用”的問題,當(dāng)虹科技則表示該公司存在相關(guān)研發(fā)和應(yīng)用,但其主業(yè)以賦能政務(wù)和企業(yè)為主。博匯科技則表示,該公司目前暫未針對C端客戶進(jìn)行應(yīng)用研發(fā)。
“從科創(chuàng)板的定位和對上市公司的要求來看,科創(chuàng)板聚焦AIGC業(yè)務(wù)的公司不太可能只涉及或者以C端業(yè)務(wù)為主。有長期關(guān)注人工智能及其應(yīng)用的業(yè)內(nèi)分析師向《科創(chuàng)板日報(bào)》記者表示,“他們更多是以大模型、大數(shù)據(jù)為基礎(chǔ),研發(fā)國產(chǎn)化的文、圖、音頻、視頻集成系統(tǒng)賦能各個行業(yè),特別是涉及到信息數(shù)據(jù)安全的領(lǐng)域。”
值得一提的是,博匯科技2023年11月在互動平臺表示,已完成全國產(chǎn)化雙引擎分布式系統(tǒng)及桌面型國產(chǎn)化視頻處理平臺的研發(fā)。
AI內(nèi)容生成應(yīng)用受關(guān)注
除上述科創(chuàng)板公司業(yè)務(wù)涉及多模態(tài)模型外,萬興科技與因賽集團(tuán)也因旗下消費(fèi)級應(yīng)用產(chǎn)品受到投資者關(guān)注。
需要一提的是,當(dāng)虹科技、博匯科技聚焦視頻/視聽相關(guān)技術(shù),集合多種技術(shù)與產(chǎn)品,賦能傳媒、教育、安防、汽車等行業(yè),客戶以政務(wù)與企業(yè)為主;萬興科技與因賽集團(tuán)除提供上述兩端解決方案外,同時也開發(fā)了多款針對C端用戶的APP/小程序。
2024年1月30日,萬興科技正式發(fā)布國內(nèi)首個音視頻大模型萬興“天幕”。這是一個以音視頻生成式AI技術(shù)為基礎(chǔ)的多媒體創(chuàng)作垂類大模型,由視頻大模型、音頻大模型、圖片大模型、語言大模型組成,聚焦數(shù)字創(chuàng)意垂類創(chuàng)作場景。
萬興天幕多媒體大模型AI創(chuàng)作《江湖恩仇錄》 圖源:公司官方公眾號
萬興科技董秘辦人士向記者表示,該公司旗下視頻創(chuàng)意產(chǎn)品萬興喵影/Filmora可用于各類視頻的創(chuàng)作和剪輯,萬興錄演/Demo Creator可用于演示視頻的錄制與編輯等。
根據(jù)天幕大模型發(fā)布會數(shù)據(jù),2023年8月至12月,萬興喵影使用AI功能的用戶數(shù)上漲243%;2022年1月至2023年1月,萬興播爆活躍用戶數(shù)提升700%。
對于視頻生成大模型,萬興科技董事長吳太兵此前公開表示,大模型正在從圖文1.0時代進(jìn)入到以音視頻多媒體為載體的2.0時代。
而對于因賽集團(tuán)是否有類似Sora的產(chǎn)品,萬興科技董秘辦人士向《科創(chuàng)板日報(bào)》記者表示,該公司AIGC項(xiàng)目團(tuán)隊(duì)將在三月進(jìn)行文生視頻功能的開發(fā),等待時機(jī)成熟后投入公測。
關(guān)于InsightGPT的進(jìn)展,因賽集團(tuán)2024年1月接受投資者調(diào)研時披露,InsightGPT內(nèi)測版已于近期開放視頻智能剪輯功能供合作伙伴、投資機(jī)構(gòu)、券商分析師等進(jìn)行試用體驗(yàn)。
預(yù)計(jì)2024年2月底前,開放體驗(yàn)圖生視頻相關(guān)營銷應(yīng)用產(chǎn)品;預(yù)計(jì)2024年3月底前,開發(fā)實(shí)現(xiàn)文生視頻功能,之后推出公測版正式啟動商業(yè)化。
AI大模型的新一輪革命
《科創(chuàng)板日報(bào)》記者注意到,從最終呈現(xiàn)的形式看,相比單模態(tài),多模態(tài)大模型同時處理文本、圖片、音頻以及視頻等多類信息,更符合人類接收、處理和表達(dá)信息的方式,也更能夠成為人類智能助手。
目前谷歌已推出多模態(tài)大模型Gemini 1.5 Pro;Meta已陸續(xù)開源ImageBind、AnyMAL等多模態(tài)大模型;OpenAI近期密集劇透GPT-5,重點(diǎn)突破語音輸入和輸入、圖像輸出以及最終的視頻輸入方向,或?qū)?shí)現(xiàn)真正多模態(tài)。
華福證券研究所計(jì)算機(jī)團(tuán)隊(duì)分析師施曉俊2月18日發(fā)文認(rèn)為,多模態(tài)是AI大模型的新一輪革命。多模態(tài)提升大模型泛化能力,多元信息環(huán)境下實(shí)現(xiàn)“多專多能”,在垂直領(lǐng)域具有廣闊的應(yīng)用場景和市場價(jià)值,施曉俊稱。
圖源:華福證券研報(bào)
《科創(chuàng)板日報(bào)》記者注意到,相比較文本生成,視頻生成大模型以及應(yīng)用由于數(shù)據(jù)、算力等多方面原因,導(dǎo)致目前產(chǎn)品數(shù)量較少。
網(wǎng)絡(luò)上,谷歌Gemini與Sora進(jìn)行對抗訓(xùn)練的視頻,也能讓人發(fā)現(xiàn)Sora生成的部分場景存在疑似不符基本常識的情況,效果似乎并不完美。
整體來看,多模態(tài)模型對行業(yè)會帶來怎樣變化暫未可知。對上述上市公司業(yè)務(wù)的后續(xù)發(fā)展,《科創(chuàng)板日報(bào)》記者將持續(xù)關(guān)注報(bào)道。