對于昨日 GPT-4 的意外發布,相信多數人都有如下想法:
1、多模態大模型 GPT-4 真的很強大!
2、恰好趕在了文心一言發布前夕,百度要如何應對壓力?
蓄勢了一個多月,承載著無數人或期盼或好奇的目光,“國產版 ChatGPT”「文心一言」今天終于正式亮相!
“「文心一言」并不完美,大家想要將其對標 ChatGPT,甚至是 GPT-4,但放眼全球大廠,百度是第一個做出來并真正發布出來的”,李彥宏說道。
“十月懷胎,一朝分娩”,那么接下來,就讓我們開始這場萬眾期待的震撼發布,共同揭開「文心一言」的神秘面紗。
百度在大廠中第一個做出來的「文心一言」,實力幾何?
在發布會伊始,對于外界頻頻問及的“為什么現在發布,百度是否真的做好了準備”等疑問,百度 CEO 李彥宏在開場進行了回應:
“過去多年,百度一直在進行 AI 技術的研究與研發。文心大模型首個版本在 2019 年便已發布,文心一言只是過去多年研發成果的延續。之所以現在發布,是因為現在市場有強烈的需求,包括百度從搜索、智能云到自動駕駛,再到客戶、用戶,都需要這樣的技術。同時,大模型只有發布了,才會有用戶反饋,只有通過不斷地反饋,才能加速模型自身的迭代?!?/p>
緊接著,李彥宏就帶著 5 個 Demo “炸場”,讓大眾一飽眼福。
(1)多模態生成
如果說昨日 GPT-4 帶著多模態出現,用一張草圖生成一個網站,讓眾多程序員感到驚艷,那么今天的「文心一言」在覆蓋多種模態方面做得更為全面,可用文字生成圖片、音頻(方言)、視頻等多個維度。
不過目前,由于生成視頻的成本比較高,百度尚未對所有用戶開放,未來會逐步接入。
(2)數理推算
「文心一言」還具備了一定的思維能力,能學會數學推演及邏輯推理等相對復雜任務。面對“雞兔同籠”這類鍛煉人類邏輯思維的經典題,「文心一言」能理解題意,并有正確的解題思路,進而像學生做題一樣,按正確的步驟,一步步算出正確答案。
同樣,現階段「文心一言」在這方面準確率并不是 100%:“我們還需要給它更多的時間來學習和成長?!?nbsp;
(3)文學創作
在回答事實性問題時,生成式 AI 產品時常會出錯,而「文心一言」延續了百度知識增強的大模型理念,大幅度提升了事實性問題的準確率。不論是總結《三體》的核心內容還是續寫《三體》,「文心一言」都展現了其優越的總結分析能力和內容創作生成能力。
(4)中文理解
作為扎根于中國市場的大語言模型,「文心一言」具備中文領域最先進的自然語言處理能力,甚至可以理解“洛陽紙貴”并寫出“藏頭詩”。
「文心一言」能在中文領域領跑,相對應的,它對英文語種、代碼場景的訓練還不夠多,這也是百度接下來加緊訓練和完善的方向。
(5)商業文案創作
在商業文案創作上,「文心一言」也可以幫企業起名字、寫 Slogan、寫新聞稿等。
AI 要寫好一篇稿子,除了要能準確理解用戶意圖,還要有清晰的表達能力——這背后有一個必要基礎,那就是龐大的數據規模?!肝男囊谎浴沟挠柧殧祿ㄈf億級網頁數據,數十億搜索數據和圖片數據,百億級語音日均調用數據,以及 5500 億事實的知識圖譜?;诖?,李彥宏指出:“這讓百度在中文語言的處理上,能夠處于獨一無二的位置?!?/p>
背后的技術
百度 CTO 王海峰表示,「文心一言」是新一代知識增強大語言模型,是在 ERNIE 及 PLATO 系列模型的基礎上研發的。
早在 2019 年 3 月,百度就發布了文心大模型 ERNIE 1.0,當時的文心 ERNIE 已經用上了知識增強的概念。同年 12 月,ERNIE 在自然語言處理領域權威數據集 GLUE 中登頂榜首,以 9 個任務平均得分首次突破 90 大關刷新該榜單歷史。到了 2021 年,ERNIE 迭代至 3.0 版本,并刷新了 54 個中文 NLP 任務基準,其英文模型在國際權威的復雜語言理解任務評測 SuperGLUE 上,以超越人類水平 0.8% 的成績登頂全球榜首。
百度研發的文心 PLATO 更是全球領先的開放域對話大模型,具備多輪流暢的聊天能力,并讓對話具有人格屬性,包括人設穩定性、知識增強、跨模態對話、情感撫慰、主動對話、長期記憶等。
王海峰指出,「文心一言」的關鍵技術包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。前三項是這類大語言模型都會采用的技術,ERNIE 和 PLATO 中也已經有應用和積累,在「文心一言」中又有了進一步強化和打磨;后三項則是百度已有技術優勢的再創新,也是「文心一言」未來越來越強大的基礎。
李彥宏預測大模型時代的三大產業機會
微軟引入 OpenAI 的 ChatGPT API 接口之后,緊接著便推出了新版 Bing,Google 也發布了 Bard 大模型,欲開啟屬于人工智能時代的搜索引擎競爭。那么對于百度而言,「文心一言」的到來,會有什么樣的不同?
在李彥宏看來,「文心一言」能夠影響的不僅僅是搜索或者互聯網公司,而是會影響到每一家公司。他表示,“生成式AI,將催生新產品、新業態,會有很多創業和投資機會。對于大部分創業者和企業來說,真正的機會并不是從頭開始做 ChatGPT 和文心一言這樣的基礎大模型,這很不現實,也不經濟?!?nbsp;
為此,李彥宏也針對大模型時代,做了三大產業機會預測:
第一類是新型云計算公司,其主流商業模式從 IaaS 變為 MaaS?!肝男囊谎浴?,將根本性地改變云計算行業的游戲規則。之前企業選擇云廠商更多看算力、存儲等基礎云服務。未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應用這四層之間的協同。
「文心一言」將通過百度智能云對外提供服務,幫助企業構建自己的模型和應用,農業、工業、金融、教育、醫療、交通、能源等重點領域,都會因此效率大幅提升,并在每一個行業快速形成新的產業空間,助力數字中國的實現。百度智能云將于近期舉辦新聞發布會。主題圍繞文心一言的云服務和應用產品,我們既有公有云服務和也可以做私有化部署,請大家期待。
第二類是進行行業模型精調的公司,這是通用大模型和企業之間的中間層,他們具有行業 Konwhow,調用通用大模型能力,為行業客戶提供解決方案。我們的文心大模型,已經在電力、金融、媒體等領域,發布了 10 多個行業大模型。在各行各業都有機會。非常歡迎大家來跟我們合作。
第三類是基于大模型底座進行應用開發的公司,即應用服務提供商。今天,基于文本生成、圖像生成、音頻生成、視頻生成、數字人、3D 等場景,已經涌現出很多創業明星公司,他們可能就是未來的新巨頭。這里面的機會非常多,可以說每家企業在現在這個階段都有機會。
李彥宏表示,“我們相信,人工智能會徹底改變我們今天的每一個行業。AI 的長期價值,對各行各業的顛覆性改變,才剛剛開始。未來,將會有更多的殺手級應用、現象級產品出現,將會有更多的里程碑事件發生?!?/p>
「文心一言」將陸續開放
當前,百度表示,3 月 16 日起,首批用戶即可通過邀請測試碼,在文心一言官網體驗產品,后續將陸續開放給更多用戶。此外,今日起,百度智能云面向企業客戶開放「文心一言」 API 接口調用服務(https://cloud.baidu.com/survey_summit/wenxin.html?track=C896034 )的預約。
最后,對于「文心一言」的發布,我們也詢問了一下 ChatGPT 的看法,不過在其答案中,有些數據存在一定偏差。
整體而言,正如李彥宏所說,目前的「文心一言」并不完美,這類大語言模型也還遠未到發展完善的階段。但未來這段時間,它一定會飛速發展,日新月異。
那么你對于「文心一言」的發布,又有什么想說的呢?