科技 > 人工智能 > 正文

OpenAI和谷歌再度燃起爭霸烽火

2024年05月17日09:38 科技日報 作者：張佳欣

新聞爆料: alltech@china.org.cn 電話:(010)82081166-6059

谷歌Project Astra亮相發(fā)布會。圖片來源：美國Gizmodo網(wǎng)站

　　OpenAI與谷歌的又一次技術(shù)交鋒剛剛落下帷幕。

　　北京時間5月14日凌晨，OpenAI發(fā)布了新一代多模態(tài)人工智能(AI)大模型GPT-4o，其先進(jìn)的AI語音交互技術(shù)迅速吸引了人們的目光。

　　一天之后，谷歌在北京時間15日凌晨的I/O 2024開發(fā)者大會上，攜新版Gemini AI大模型等尖端產(chǎn)品重裝上陣，正面對決OpenAI，燃起新一輪AI領(lǐng)域爭霸的烽火。

　　GPT-4o語音對話絲滑如真人

　　一個擁有流暢、迷人嗓音的逼真AI，可以讓人類用戶著迷并留下深刻的印象。調(diào)情、講笑話、滿足人類的欲望，并最終留住他們的心……這是2013年美國上映的電影《她》中的情節(jié)。在這部影片中，一位叫薩曼莎的虛擬姑娘讓孤獨內(nèi)向的男主深陷其中。

　　事實上，這也是OpenAI展示的新模型GPT-4o所能讓人聯(lián)想到的情節(jié)。

　　據(jù)OpenAI介紹，GPT-4o是一個“原生多模態(tài)”模型。它命名中的o來源于“omni”一詞，意為“全能的”，有包羅萬象之意。它可以接受文本、音頻和圖像任意組合的輸入，并生成這些格式的相應(yīng)輸出。新模型使ChatGPT能夠處理50種不同的語言，速度和質(zhì)量同時得到提高。它可以在短短232毫秒內(nèi)處理音頻輸入，平均耗時320毫秒，與人類對話中的反應(yīng)時間相當(dāng)。

　　GPT-4o允許ChatGPT以更加逼真的方式與用戶交流。它不僅能檢測用戶聲音中的情緒，分析面部表情，還能根據(jù)用戶需求改變語調(diào)和節(jié)奏。如果想聽睡前故事，它可以用耳語說話。如果需要來一段帶“酸味兒”的對話，它就能以輕松、諷刺的語氣與人交談。它甚至還可以按要求唱歌，一會兒是高亢的女高音，一會兒又能變成迷人的女低音。

　　有趣的是，就在GPT-4o官宣發(fā)布后，一名OpenAI的員工發(fā)布了一條意味深長的信息：“你們都會愛上它的?！?/p>

　　Astra讓AI與人們生活無縫融合

　　OpenAI發(fā)布了GPT-4o后，壓力就給到了谷歌。谷歌在發(fā)布會上，放出大招向OpenAI“開戰(zhàn)”，勢必要扳回一局。

　　谷歌在整個大會中共提到“AI”121次，并推出了從新的搜索和聊天功能到面向云客戶的AI硬件等十余種新品和升級產(chǎn)品。其中包括由升級后Gemini模型驅(qū)動的AI助手項目Astra、對標(biāo)Sora的文生視頻模型Veo，以及第六代Tensor處理器單元(TPU)Trillium芯片。

　　Astra是一次旨在創(chuàng)建“通用人工智能代理”的新嘗試。與GPT-4o一樣，Astra具有以各種形式或多模式方式快速響應(yīng)用戶的卓越能力，這使得它非常適合成為AI助手。

　　谷歌表示，通過對視頻幀和語音輸入進(jìn)行連續(xù)處理和編碼，Astra可以創(chuàng)建事件時間軸并緩存信息，以便快速調(diào)用。這使AI能看、能聽、能說，甚至能回憶。在一段引人入勝的視頻中，這款模型通過智能手機的攝像頭識別出現(xiàn)實世界中的物體，能直接讀取代碼，甚至能幫用戶回憶起他的眼鏡落在了哪里，還能幾乎零延遲與人實時對話。

　　生成式AI革命遠(yuǎn)未成功

　　自ChatGPT宣告問世，谷歌和OpenAI的競爭就不斷升級?，F(xiàn)在，兩大科技巨頭更是在兩天時間里紛紛亮出引人矚目的產(chǎn)品。

　　然而，生成式AI的飛速發(fā)展也伴隨著眾多質(zhì)疑的聲音。人們對于這些科技公司所塑造的“AI未來”仍持謹(jǐn)慎態(tài)度。

　　《新科學(xué)家》雜志網(wǎng)站稱，人們應(yīng)該認(rèn)識到，生成式AI的成功還遠(yuǎn)未確定。這個領(lǐng)域還很新，公司之間競爭的目的并不是市場份額或客戶忠誠度，而僅僅是為了擁有最新產(chǎn)品。新的GPT-4o盡管更有“人味兒”，但AI胡編亂造的行為未必能得到限制。

　　根據(jù)美國皮尤研究中心的調(diào)查，盡管ChatGPT在過去幾年聲勢浩大，但只有23%的美國成年人使用過它。英國牛津大學(xué)卡麗莎·維利茲副教授稱：“這項技術(shù)到底有多大影響，目前還很不明確。大多數(shù)人尚未體驗過生成式AI工具，有理由認(rèn)為，這項技術(shù)最終可能不如一些人想象的那樣具有革命性?！?

(責(zé)任編輯：畢安吉)

免責(zé)聲明：中國網(wǎng)科技轉(zhuǎn)載此文目的在于傳遞更多信息，不代表本網(wǎng)的觀點和立場。文章內(nèi)容僅供參考，不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險自擔(dān)。