近日,OpenAI發(fā)布了新一代旗艦生成模型GPT-4o(“o”代表omni,即全能的意思)。據(jù)悉,GPT-4o為面向未來人機交互范式的全新大模型,具有文本、語音、圖像三種模態(tài)的理解力,反應(yīng)極快還帶有感情,也“很通人性”。
開源證券研究報告介紹,GPT-4o有四大特點:一是多模態(tài)能力大幅提升,可以跨文本、音頻和視頻進行實時推理;二是更加“像人”;三是毫秒級響應(yīng),API(應(yīng)用程序接口)成本更低;四是擁有3D視覺內(nèi)容生產(chǎn)能力。
全球大模型競爭加劇
據(jù)悉,GPT-4o將免費提供給所有用戶,OpenAI還將推出桌面版ChatGPT,輕量化的使用體驗可以融入任何工作流程中。
“GPT-4o作為一個具有多模態(tài)能力的生成型模型,將在客戶服務(wù)、醫(yī)療保健、教育、娛樂、無障礙技術(shù)等諸多領(lǐng)域發(fā)揮重要作用,助力相關(guān)領(lǐng)域的AI應(yīng)用‘更加好用,性價比更高’,更好地打開應(yīng)用商業(yè)化空間,也會加劇全球各大模型廠商的競爭?!敝袊娮由虅?wù)專家服務(wù)中心副主任郭濤在接受《證券日報》記者采訪時表示。
近段時間,不少海內(nèi)外行業(yè)巨頭頻頻發(fā)布大模型最新成果。例如谷歌發(fā)布升級版的最強大AI模型Gemini迎戰(zhàn)GPT-4o,谷歌CEO桑達爾·皮查伊表示:“谷歌所有的工作都圍繞生成式AI模型Gemini來做,希望每個人都能從Gemini所做的事中受益。”
國內(nèi)的知名私募巨頭幻方量化旗下的AI公司DeepSeek(深度求索)發(fā)布全新第二代MoE(混合專家)大模型DeepSeek-V2,該模型擁有2360億個參數(shù),其中有210億個活躍參數(shù)。
昆侖萬維正式將天工大模型迭代至3.0版本,據(jù)悉“天工3.0”采用4000億參數(shù)MoE架構(gòu),是目前全球模型參數(shù)最大、性能最強的開源MoE模型之一?!疤旃?.0”在語義理解、邏輯推理等方面能力實現(xiàn)質(zhì)的飛躍,其技術(shù)知識能力較上一代模型提升20%,數(shù)學、代碼等能力提升超30%。此外,百度、商湯科技等也發(fā)布了最新多模態(tài)模型成果。
“OpenAI推出GPT-4o及近期海內(nèi)外廠商頻頻發(fā)布大模型迭代升級成果,競爭焦點或集中在多模態(tài)能力、Agent(指能自主活動的軟件或者硬件的智能體)能力和API調(diào)用成本優(yōu)化等,均為大模型應(yīng)用落地并商業(yè)化的關(guān)鍵因素。”開源證券分析師方光照認為。
多家公司跟進AI應(yīng)用布局
多模態(tài)模型可以應(yīng)用于各種終端設(shè)備,如智能手機、平板電腦、車載多媒體端口、智能音箱、機器人等。此外,還可以應(yīng)用于企業(yè)級產(chǎn)品,如影視、教育、營銷、搜索、辦公等各個領(lǐng)域。
在此背景下,不少上市公司通過大模型加速推動在AI領(lǐng)域的業(yè)務(wù)布局與應(yīng)用。5月15日,金蝶集團發(fā)布基于企業(yè)管理、AI、大模型三者疊加結(jié)合的金蝶Cosmic,這款應(yīng)用具備感知、記憶、思考、行動能力,助力管理者及員工輕松應(yīng)對多項管理工作。
主營為營銷傳播智慧服務(wù)的因賽集團日前對外表示,公司自研的營銷行業(yè)AIGC應(yīng)用級模型InsightGPT,不斷取得技術(shù)突破,“圖生視頻”“文生視頻”等各項功能和產(chǎn)品發(fā)布始終走在行業(yè)前列。同時,公司會密切關(guān)注世界前沿的最新技術(shù),持續(xù)對InsightGPT各項產(chǎn)品和功能進行優(yōu)化與迭代,適時拓展新的產(chǎn)品方向,目前論證可行的產(chǎn)品方向包括但不限于3D視頻與數(shù)字人。
奧飛娛樂在互動易平臺上表示,目前其持有光年無限5%股權(quán),光年無限有自己的AI對話機器人產(chǎn)品——圖靈機器人開放平臺,并上線AI對話小程序“喜羊羊與灰太狼+”,定位兒童用戶,提供親子陪伴體驗。
字節(jié)跳動也最新發(fā)布了豆包大模型,據(jù)字節(jié)跳動旗下云服務(wù)平臺火山引擎總裁譚待介紹:“經(jīng)過一年時間的迭代和市場驗證,豆包大模型正成為國內(nèi)使用量最大、應(yīng)用場景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成3000萬張圖片。大模型從以分計價到以厘計價,將助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新?!?/p>
“擁有多模態(tài)能力的大模型將為上市公司在客服服務(wù)、教育培訓和終端應(yīng)用等領(lǐng)域提供了廣闊的應(yīng)用前景。這種全新的交互模式將為企業(yè)帶來更高的效率和更低的成本,同時為用戶帶來更便捷與愉悅的體驗?!敝袊畔f(xié)會常務(wù)理事朱克力向記者表示。
(責任編輯:畢安吉)