匯集眾多AI硬科技!
9月19日,2024云棲大會(huì)在杭州云棲小鎮(zhèn)開幕,此次大會(huì)以“云啟智躍,產(chǎn)業(yè)蝶變”為主題,吸了眾多前沿技術(shù)企業(yè)展示AI時(shí)代云上創(chuàng)新的潮流科技。喜馬拉雅珠峰AI音頻多模態(tài)大模型亮相云棲大會(huì),在“人工智能+”主題館吸引眾多市民駐足圍觀體驗(yàn)。
AI(人工智能)已經(jīng)在深刻影響著我們的生活,也影響和改變著內(nèi)容創(chuàng)作行業(yè)。作為在線音頻頭部企業(yè),今年成立12年的喜馬拉雅以科技賦能文化,圍繞音頻建立了一個(gè)豐富多元的“聲音宇宙”,截至2023年12月底,喜馬拉雅已經(jīng)累積了包含459個(gè)品類的4.88億條音頻,總內(nèi)容時(shí)長(zhǎng)超過36億分鐘,能滿足用戶從-1歲到100歲不同年齡階段的不同需求。
喜馬拉雅從成立之初就十分重視技術(shù)投入,特別是布局AI,將AI技術(shù)突破作為平臺(tái)發(fā)展和演變的主要驅(qū)動(dòng)力,以便能在不斷變化的數(shù)字環(huán)境中提高自身運(yùn)營(yíng)效率及滿足用戶需求。
在2024云棲大會(huì)上,喜馬拉雅展示了“珠峰AI音頻多模態(tài)大模型”(簡(jiǎn)稱“喜馬拉雅音頻大模型”)的強(qiáng)大功能、應(yīng)用場(chǎng)景及商業(yè)化案例。據(jù)悉,“珠峰AI音頻多模態(tài)大模型”是喜馬拉雅自主研發(fā)的AI音頻生成大模型,依托其超百萬小時(shí)的自有版權(quán)音頻數(shù)據(jù)進(jìn)行深度學(xué)習(xí)與訓(xùn)練,具備情感輸出、自然表達(dá)、語種互譯、極速克隆等技術(shù)能力,并在音頻生成領(lǐng)域?qū)崿F(xiàn)了多維度突破,正廣泛應(yīng)用于有聲書等領(lǐng)域,未來將不斷推動(dòng)音頻大模型行業(yè)的創(chuàng)新與發(fā)展。近日消息,喜馬拉雅音頻大模型已成功通過國(guó)家備案。
基于“珠峰AI音頻多模態(tài)大模型”,喜馬拉雅在云棲大會(huì)展示了“珠峰AI創(chuàng)作服務(wù)平臺(tái)”:珠峰AI音視頻創(chuàng)作平臺(tái),依托通義文本大模型對(duì)文本內(nèi)容語義的深度理解,打造珠峰AI音頻大模型,結(jié)合喜馬拉雅獨(dú)有的全品類音色庫和數(shù)字人大模型,為創(chuàng)作者提供高品質(zhì)的AIGC音頻和數(shù)智人服務(wù)。用戶可以在“珠峰AI數(shù)智人平臺(tái)互動(dòng)體驗(yàn)區(qū)”體驗(yàn)AI為聲音創(chuàng)作帶來的變革,比如極速體驗(yàn)全領(lǐng)域多品類535種AI音色庫生成全品類AIGC音頻內(nèi)容、15秒真人數(shù)智人形象快速定制、10秒聲音極速克隆(不單音色克隆,更包含韻律、腔調(diào)、口吻等“語流”信息)等等,感受AI高效便捷地賦能內(nèi)容創(chuàng)作者。
AI正在深刻賦能和影響著喜馬拉雅的發(fā)展。數(shù)據(jù)顯示,2023年喜馬拉雅全場(chǎng)景平均月活躍用戶達(dá)3.03億。截至2023年12月,喜馬拉雅平臺(tái)AIGC內(nèi)容達(dá)2.4億分鐘,占其音頻內(nèi)容的6.6%。同時(shí),喜馬拉雅移動(dòng)端平均月活躍用戶的AIGC滲透率已達(dá)14.8%。
喜馬拉雅音頻大模型具備“產(chǎn)模一體生態(tài)系統(tǒng)、持續(xù)進(jìn)化的生態(tài)飛輪”的模型優(yōu)勢(shì),已廣泛應(yīng)用于內(nèi)容創(chuàng)作、數(shù)智分身、語音交互等場(chǎng)景,并已實(shí)現(xiàn)商業(yè)化。
喜馬拉雅音頻大模型在廣告領(lǐng)域擁有廣泛的應(yīng)用場(chǎng)景,通過AIGC原生聲音流,實(shí)現(xiàn)“廣告即內(nèi)容”,如喜馬拉雅聯(lián)合貴州茅臺(tái)推出“單田芳AI聲音重現(xiàn)”春運(yùn)公益活動(dòng),聯(lián)合慕思共同打造的“邀李白共啟AI穿越之旅”活動(dòng)等等?;诖竽P?,未來喜馬拉雅的AI能力將在智能化廣告營(yíng)銷中發(fā)揮更突出的作用。
喜馬拉雅布局AI有其天然優(yōu)勢(shì)。眾所周知,高質(zhì)量的數(shù)據(jù)集是將AI塑造成可靠的解釋器的訓(xùn)練燃料,從龐大的數(shù)據(jù)集中探索并獲得有意義的見解以推動(dòng)AI不斷發(fā)展。據(jù)灼識(shí)咨詢資料顯示,喜馬拉雅擁有中國(guó)最全面的音頻內(nèi)容生態(tài),其中包括體量最大的音頻內(nèi)容庫及數(shù)量最多的音頻內(nèi)容創(chuàng)作者。截至2023年12月,喜馬拉雅擁有約4.9億條音頻內(nèi)容,總內(nèi)容時(shí)長(zhǎng)為36億分鐘。這使得喜馬拉雅在AI時(shí)代能夠輕松獲取海量且多樣化的在線音頻內(nèi)容以不斷演進(jìn)其AI能力,這也是喜馬拉雅在AI時(shí)代的競(jìng)爭(zhēng)優(yōu)勢(shì)。
AI不僅代表了一種技術(shù)價(jià)值的想象,其背后更是商業(yè)價(jià)值的全新拐點(diǎn)。隨著下一代技術(shù)、AI及大數(shù)據(jù)能力的持續(xù)提升,喜馬拉雅將進(jìn)一步打開聲音的想象力,持續(xù)用聲音分享人類智慧,用聲音服務(wù)美好生活。
(責(zé)任編輯:譚夢(mèng)桐)