9月25日,百川智能發(fā)布Baichuan2-53B 閉源大模型,全面升級(jí)了Baichuan1-53B的各項(xiàng)能力。Baichuan2-53B不僅數(shù)學(xué)和邏輯推理能力提升顯著,還通過高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)極大降低了模型幻覺。
作為首批通過備案的大模型企業(yè),百川智能此次還開放了Baichuan2-53B API接口,正式進(jìn)軍To B領(lǐng)域,開啟商業(yè)化進(jìn)程。
此次開放API后,百川智能將把行業(yè)領(lǐng)先的大模型能力賦能給各行各業(yè)的合作伙伴,助力萬千企業(yè)智能化發(fā)展。
Baichuan2-53B 是百川智能發(fā)布的第6款大模型,自4月10日成立以來,該公司以平均每28天推出一個(gè)大模型的速度持續(xù)創(chuàng)新。
能力全面升級(jí),數(shù)學(xué)和邏輯推理能力大幅提升
百川智能于2023年8月8日發(fā)布Baichuan-53B搜索增強(qiáng)大模型,模型在知識(shí)問答、文學(xué)創(chuàng)作等方面表現(xiàn)優(yōu)異,展現(xiàn)出商業(yè)文案創(chuàng)作(郵件撰寫、公司命名、營銷文案生成)、文學(xué)創(chuàng)作(故事續(xù)寫、詩詞創(chuàng)作)、中文理解(語義識(shí)別、成語含義、詩詞分析)等多種任務(wù)場景下的強(qiáng)大能力。
大模型的數(shù)學(xué)和邏輯推理能力一直是業(yè)內(nèi)的關(guān)注焦點(diǎn),也是評(píng)價(jià)一款大模型是否領(lǐng)先的重要指標(biāo)。在Baichuan-53B的基礎(chǔ)上,Baichuan2-53B不僅重點(diǎn)強(qiáng)化了以上兩個(gè)維度的能力,并且對(duì)整體能力進(jìn)行了全面升級(jí)。其中,邏輯推理能力提升100%,數(shù)學(xué)能力提升31%,語言理解能力提升29%,文本創(chuàng)作提升18%,知識(shí)問答提升9%。
高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)技術(shù)加持,有效降低模型幻覺
幻覺是大模型落地應(yīng)用必須跨越的鴻溝。通常而言,解決這一問題有兩種方式,一種是不斷增加模型的數(shù)據(jù)規(guī)模、提升數(shù)據(jù)質(zhì)量;另一種是通過調(diào)用搜索等外部工具讓模型能夠獲取實(shí)時(shí)信息。
Baichuan2-53B在兩個(gè)方面均做了大量優(yōu)化。高質(zhì)量數(shù)據(jù)構(gòu)建方面,Baichuan2-53B獨(dú)創(chuàng)了一套數(shù)據(jù)質(zhì)量體系。以低質(zhì)、優(yōu)質(zhì)為標(biāo)準(zhǔn)將數(shù)據(jù)進(jìn)行分類,確保Baichuan-53B始終使用優(yōu)質(zhì)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。
信息獲取方面,Baichuan2-53B對(duì)多個(gè)模塊進(jìn)行了升級(jí),包括指令意圖理解、智能搜索和結(jié)果增強(qiáng)等關(guān)鍵組件。這一綜合體系通過深入理解用戶指令,精確驅(qū)動(dòng)查詢?cè)~的搜索,最終結(jié)合大語言模型技術(shù),優(yōu)化模型結(jié)果生成的可靠性,實(shí)現(xiàn)更精確、更智能的模型回答結(jié)果,減少模型幻覺。
在高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)技術(shù)的加持下,Baichuan2-53B有效降低了模型幻覺。百川智能使用 FacTool 評(píng)測后的結(jié)果顯示,Baichuan2-53B 的綜合得分為140.5,在主流基礎(chǔ)大模型中僅排在GPT-4之后,處于國內(nèi)領(lǐng)先水平。
FacTool是由上海交通大學(xué)、卡內(nèi)基梅隆大學(xué)、香港城市大學(xué)、Meta 等機(jī)構(gòu)學(xué)者共同提出的一款通用框架,能夠查核大模型生成內(nèi)容的事實(shí)準(zhǔn)確性(也能查核一般性內(nèi)容的事實(shí)準(zhǔn)確性)。
開放API, 全面進(jìn)軍To B領(lǐng)域
除了能力全面升級(jí),Baichuan2-53B 還開放了API接口,企業(yè)和開發(fā)者可以通過API將Baichuan2-53B集成至他們的應(yīng)用程序和服務(wù)中。Baichuan2-53B融合了最前沿的大模型技術(shù),可以很好的適配不同企業(yè)的各種業(yè)務(wù)需求,無論是智能客服、智能寫作還是智能推薦等各個(gè)方面。
Baichuan2-53B的API接口便捷易用,客戶只需要簡單的配置和集成即可接入,同時(shí)其對(duì)OpenAI的接口高度兼容,客戶可以快速遷移,極大降低了模型的部署和轉(zhuǎn)換成本。
對(duì)于企業(yè)用戶最關(guān)注的安全合規(guī)問題,作為首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的大模型企業(yè),百川智能為Baichuan2-53B打造了覆蓋大模型預(yù)訓(xùn)練、精調(diào)、推理全周期的安全增強(qiáng),能夠?yàn)榭蛻艉秃献骰锇樘峁┤鞒痰陌踩U稀?/p>
借助Baichuan2-53B豐富且強(qiáng)大的模型能力,企業(yè)用戶不僅可以升級(jí)自身已有業(yè)務(wù),提高效率、減少成本,還能夠探索更多應(yīng)用場景,拓展創(chuàng)新的邊界。
未來,百川智能將持續(xù)探索大模型的能力邊界,不斷探索大模型技術(shù)的前沿創(chuàng)新,更好地賦能千行百業(yè)的智能化進(jìn)程。
(責(zé)任編輯:李春暉)