國(guó)產(chǎn)版 ChatGPT 大盤點(diǎn)
來(lái)源:
奇酷教育 發(fā)表于:
國(guó)產(chǎn)版 ChatGPT 大盤點(diǎn)
? 國(guó)產(chǎn)版 ChatGPT 大盤點(diǎn)
3月16日,百度發(fā)布類ChatGPT產(chǎn)品「文心一言」,并開放測(cè)試。
3月29日,周鴻祎在某大會(huì)上,演示360版的ChatGPT產(chǎn)品。
4月7日,阿里版ChatGPT產(chǎn)品「通義千語(yǔ)」并開啟內(nèi)測(cè)邀請(qǐng)。
預(yù)約地址:https://tongyi.aliyun.com/
4月9日,360的大預(yù)言模型「360智腦」開放預(yù)約,即將在4月16日開放測(cè)試。預(yù)約地址:https://www.so.com/zt/invite.html#/
那在類ChatGPT賽道上,有哪些中國(guó)版的ChatGPT?
1、百度:文心一言
3月16日,百度正式推出國(guó)內(nèi)首款生成式AI產(chǎn)品“文心一言”,可支持文學(xué)創(chuàng)作、文案創(chuàng)作、數(shù)理推算、多模態(tài)生成等功能。
“文心一言”基于全棧自研的AI基礎(chǔ)設(shè)施進(jìn)行學(xué)習(xí)和訓(xùn)練:
?、傥男闹R(shí)增強(qiáng)大模型:“文心一言”的模型層核心能力,該產(chǎn)品主要采用ERNIE系列文心NLP模型,擁有千億參數(shù)級(jí)別的ERNIE 3.0 Zeus為該系列最新模型,進(jìn)一步提升了模型 對(duì)于不同下游任務(wù)的建模能力,大大拓寬了“文心一言”的應(yīng)用場(chǎng)景。
②飛槳深度學(xué)習(xí)平臺(tái):“文心一言”的框架層核心能力,系業(yè)內(nèi)首個(gè)動(dòng)靜統(tǒng)一的框架、首個(gè) 通用異構(gòu)參數(shù)服務(wù)器架構(gòu),支持端邊云多硬件和多操作系統(tǒng),為文心大模型提供有效、快捷、完整的訓(xùn)練框架。
?、劾鲂?代AI芯片:“文心一言”的芯片層核心能力,采用自研XPU-R架構(gòu),通用性和性能顯著提升;256 TOPS@INT8和128 TFLOPS@FP16的算力水平,較一代提升2-3倍, 保障“文心一言”算力需求。
文心一言是國(guó)內(nèi)關(guān)注度極高的首款類ChatGPT產(chǎn)品,一經(jīng)發(fā)布便涌入了大量的用戶。雖然百度創(chuàng)始人李彥宏坦誠(chéng):文心一言并不完美,大開腦洞的文生圖也一度引起了大眾熱議。
此外,百度還推出了企業(yè)級(jí)大模型服務(wù)平臺(tái)“文心千帆”,不僅包括文心一言,還包括百度全套文心大模型、相應(yīng)的開發(fā)工具鏈。未來(lái),文心千帆還會(huì)支持第三方的開源大模型。
2、騰訊:混元
3月30日,騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生向媒體表示,騰訊正在研發(fā)類ChatGPT聊天機(jī)器人。對(duì)于騰訊的聊天機(jī)器人是集成到QQ、微信,還是通過騰訊云向B端用戶服務(wù),湯道生說(shuō):“都會(huì)有。”
騰訊在大模型領(lǐng)域的布局早已有之,其“混元”系列AI大模型覆蓋了NLP、CV、多模態(tài)等基礎(chǔ)大模型以及眾多行業(yè)/領(lǐng)域大模型。這成為了騰訊構(gòu)建類ChatGPT產(chǎn)品的堅(jiān)實(shí)技術(shù)儲(chǔ)備。
2022年5月,騰訊混元AI大模型在CLUE總排行榜、閱讀理解、大規(guī)模知識(shí)圖譜三個(gè)榜單同時(shí)登頂,一舉打破三項(xiàng)紀(jì)錄。
目前,混元AI大模型已經(jīng)廣泛應(yīng)用于騰訊微信搜索、騰訊廣告等業(yè)務(wù)場(chǎng)景,提升了搜索體驗(yàn)和廣告推薦精準(zhǔn)度。
據(jù)報(bào)道,騰訊針對(duì)ChatGPT對(duì)話式產(chǎn)品成立了“混元助手(HunyuanAide)”項(xiàng)目組,由騰訊首席科學(xué)家、騰訊AI Lab及Robotics X實(shí)驗(yàn)室主任張正友博士負(fù)責(zé)。
根據(jù)最新的騰訊內(nèi)部學(xué)習(xí)會(huì)議內(nèi)容:
1、在大模型進(jìn)展方面:騰訊AI大模型六個(gè)BG都有參與,其中TEG(技術(shù)工程事業(yè)群)在算法上更偏整體,其他BG更偏行業(yè)。
2、在水平方面:其萬(wàn)億參數(shù)的水平,相比ChatGPT性能更強(qiáng),但可能比GPT4比有所不足?;煸竽P湍壳捌匀徽Z(yǔ)言,而GPT4支持多模態(tài)。
3、在前景方面:后續(xù)在商業(yè)化推進(jìn)中,大模型可能會(huì)接入微信、游戲、短視頻、廣告、TOB端等業(yè)務(wù)。
在全球范圍內(nèi),騰訊與谷歌、OpenAI等巨頭相比,在大語(yǔ)言模型AI的技術(shù)研究和應(yīng)用上仍存在差距。不過,憑借龐大的用戶基數(shù)、多元化的業(yè)務(wù)布局以及強(qiáng)大的技術(shù)實(shí)力,騰訊在大語(yǔ)言模型AI的發(fā)展中仍具有其獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì)。
不久前騰訊發(fā)布財(cái)報(bào)后,騰訊總裁劉熾平也透露了騰訊聊天機(jī)器人的計(jì)劃,“不急于求成,先打好基礎(chǔ),再追求新進(jìn)展,我們的第一款產(chǎn)品將會(huì)是多次迭代之后的產(chǎn)品,整個(gè)過程將是長(zhǎng)期的”。
3、阿里:通義千言
4月7日,阿里版ChatGPT產(chǎn)品「通義千語(yǔ)」并開啟內(nèi)測(cè)邀請(qǐng)。
早在2月8日,阿里巴巴內(nèi)部一款標(biāo)名“預(yù)發(fā)布”的應(yīng)用被“打碼”曝光,被認(rèn)為是達(dá)摩院版的ChatGPT新品。從曝光截圖來(lái)看,阿里巴巴可能將AI大模型技術(shù)與釘釘生產(chǎn)力工具深度結(jié)合。
圖源:知乎
此外,這款傳說(shuō)中的產(chǎn)品可以實(shí)現(xiàn)的功能不止于知識(shí)回答,還包括AI繪畫、代碼生成、小說(shuō)續(xù)寫、文案撰寫、寫詩(shī)作詞。
媒體向阿里巴巴內(nèi)部人士證實(shí),目前公司確實(shí)在研發(fā)相關(guān)產(chǎn)品,并已經(jīng)處于內(nèi)測(cè)階段。據(jù)透露,目前該款產(chǎn)品的命名還沒有最終確定。
早在2022年9月,達(dá)摩院曾發(fā)布過“通義”大模型系列。據(jù)透露,阿里版ChatGPT,正是基于通義大模型體系進(jìn)行融合升級(jí)。
據(jù)報(bào)道,推出的通義大模型底座基于統(tǒng)一學(xué)習(xí)范式OFA等底層技術(shù)打造,具備了能搞定多種任務(wù)的“大一統(tǒng)”能力:不引入新增結(jié)構(gòu),單一模型即可同時(shí)處理圖像描述、視覺定位、文生圖、視覺蘊(yùn)含、文檔摘要等10余項(xiàng)單模態(tài)和跨模態(tài)任務(wù)。升級(jí)后,更是可以處理超過包括語(yǔ)音和動(dòng)作在內(nèi)的30多種跨模態(tài)任務(wù)。
但據(jù)知情人士透露,打造中文ChatGPT的生態(tài),這個(gè)定義對(duì)于阿里來(lái)說(shuō)可能窄了一點(diǎn)。相比之下,阿里更希望能引領(lǐng)中文大模型的發(fā)展趨勢(shì)。
4、字節(jié):組建大模型團(tuán)隊(duì)
2月23日,從多個(gè)獨(dú)立信源處獲悉,字節(jié)跳動(dòng)在大模型上已有所布局,分別在語(yǔ)言和圖像兩種模態(tài)上發(fā)力。
字節(jié)跳動(dòng)相關(guān)技術(shù)負(fù)責(zé)人對(duì)此回應(yīng):技術(shù)中臺(tái)在這些領(lǐng)域有探索,還很初期,不成熟。
一名知情人士透露,語(yǔ)言大模型團(tuán)隊(duì)由字節(jié)搜索部門牽頭,目前團(tuán)隊(duì)規(guī)模在十?dāng)?shù)人左右。
圖片大模型團(tuán)隊(duì)則由產(chǎn)品研發(fā)與工程架構(gòu)部下屬的智能創(chuàng)作團(tuán)隊(duì)牽頭。
值得注意的是,字節(jié)跳動(dòng)有不少AI產(chǎn)品,比如:剪映,就是一款視頻智能生成工具。
5、京東:ChatJD
2月10日,京東云官微發(fā)布,京東云將推出“產(chǎn)業(yè)版”ChatGPT,產(chǎn)品名字叫:ChatJD。并公布ChatJD的落地應(yīng)用路線圖“125”計(jì)劃。
· 1個(gè)平臺(tái):ChatJD智能人機(jī)對(duì)話平臺(tái)
· 2個(gè)領(lǐng)域:零售、金融
· 5個(gè)應(yīng)用:內(nèi)容生成、人機(jī)對(duì)話、用戶意圖理解、信息抽取、情感分類
圖源:通信產(chǎn)業(yè)網(wǎng)
6、華為:盤古
華為近日宣布,4月8日將推出其最新的盤古大模型4,稱“將是超過任何其他類似應(yīng)用的最先進(jìn)、最強(qiáng)大的自然語(yǔ)言處理應(yīng)用”。
根據(jù)華為云官網(wǎng)顯示,華為即將上線的“盤古系列AI大模型”分別為:NLP大模型、CV大模型、以及科學(xué)計(jì)算大模型。
其中,盤古“NLP大模型”是被認(rèn)為最接近人類中文理解能力的AI大模型,而盤古“CV大模型”首次兼顧了圖像判別與生成能力。
01 大模型規(guī)模
華為盤古大模型的規(guī)模相對(duì)較小,僅擁有1200億個(gè)參數(shù);而GPT-3則有1750億個(gè)參數(shù),是目前最大的自然語(yǔ)言處理模型。因此,在某些任務(wù)上,GPT-3可能在表現(xiàn)上更為突出。
02 訓(xùn)練數(shù)據(jù)
雖然盤古模型擁有的參數(shù)少于GPT-3,但是華為在訓(xùn)練時(shí)使用了大量的中文文本,包括不同類型的文本數(shù)據(jù),如百科、新聞、小說(shuō)、行業(yè)專業(yè)文本等。這種多樣性的數(shù)據(jù)來(lái)源使得盤古模型擁有更廣泛的知識(shí)和語(yǔ)言能力,對(duì)于中文應(yīng)用來(lái)說(shuō)具有很大的優(yōu)勢(shì)。
03 模型用途
華為盤古大模型主要應(yīng)用于中文的文本生成、問答、翻譯等任務(wù)。而GPT-3則可以應(yīng)用于英文和其他語(yǔ)言的文本生成、翻譯、自然語(yǔ)言推理、問題回答等任務(wù)。由于應(yīng)用領(lǐng)域不同,兩者在某些任務(wù)上的效果也有所不同。
7、網(wǎng)易:子曰
早在2月9日,網(wǎng)易有道方面透露,有道AI技術(shù)團(tuán)隊(duì)已投入到ChatGPT同源技術(shù)(AIGC)在教育場(chǎng)景的落地研發(fā)中,目前該團(tuán)隊(duì)已在AI口語(yǔ)老師、中文作文批改等細(xì)分學(xué)習(xí)場(chǎng)景中嘗試應(yīng)用。
同時(shí),公司有望盡快推出相關(guān)的demo版產(chǎn)品,該產(chǎn)品的面世將標(biāo)志著AIGC技術(shù)在國(guó)內(nèi)互聯(lián)網(wǎng)教育場(chǎng)景的首次著陸。
網(wǎng)易有道專為教育類場(chǎng)景自研的類ChatGPT模型“子曰“將于近期開放內(nèi)測(cè)。
①在教育內(nèi)容的數(shù)據(jù)方面,網(wǎng)易有道在語(yǔ)言學(xué)習(xí)方面有著較為深厚的積累,2007年網(wǎng)易便推出了有道詞典,這讓網(wǎng)易積累了較多的語(yǔ)言學(xué)習(xí)數(shù)據(jù),為“子曰”提供了良好的培育土壤。
②在算力方面,針對(duì)教育垂類,成本將有所下降。有道詞典筆P5產(chǎn)品已升級(jí)至NPU方案,相對(duì)CPU版本模型推理速度提高了數(shù)倍,實(shí)現(xiàn)了“一目十行”的識(shí)別效率;在模型大小增加15倍的基礎(chǔ)上,AI引擎的精確度也獲得了大幅提升。且網(wǎng)易有道在AI算法方面也處于國(guó)內(nèi)較為領(lǐng)先的地位,不過有道“子曰”的最終效果能夠達(dá)到何種程度目前尚不得而知。
8、360:360智腦
4月9日,360的大預(yù)言模型「360智腦」開放預(yù)約,即將在4月16日開放測(cè)試。
一經(jīng)上線,涌進(jìn)2萬(wàn)多人預(yù)約。
“搭不上ChatGPT這班車的企業(yè)會(huì)被淘汰。”周鴻祎與張朝陽(yáng)在一檔欄目中如是說(shuō),而日前,360版本的GPT已經(jīng)被紅衣教主“抱出來(lái)讓大家看看”。
早在3月29日,在數(shù)字安全與發(fā)展高峰論壇上,周鴻祎發(fā)布了360版“ChatGPT”。
從現(xiàn)場(chǎng)演示來(lái)看,360版GPT確實(shí)已經(jīng)具備一定的推理能力,但在回答問題時(shí),仍需要多次提問、提醒才能得出讓人比較滿意的答案。
圖源:網(wǎng)絡(luò)
此外,周鴻祎還表示360很快便會(huì)推出智能辦公產(chǎn)品,并加上類 ChatGPT的能力,這一點(diǎn)和微軟office軟件的發(fā)展方向也是類似的。
此前,360稱,目前360搜索是中國(guó)搜索引擎的Top 2,市場(chǎng)份額為35%,但截至目前僅作為內(nèi)部業(yè)務(wù)自用的生產(chǎn)力工具使用,且投資規(guī)模及技術(shù)水平與當(dāng)前的ChatGPT 3相比還有較大差距,各項(xiàng)技術(shù)指標(biāo)只能做到略強(qiáng)于ChatGPT 2。由于訓(xùn)練數(shù)據(jù)源及應(yīng)用方向的原因,在中文環(huán)境下的實(shí)際效果強(qiáng)于ChatGPT 2。
同時(shí),360在數(shù)據(jù)資源端有豐富的多模態(tài)大數(shù)據(jù)積累和相關(guān)語(yǔ)料、尤其是中文語(yǔ)料,相較于國(guó)外同行落后的是預(yù)訓(xùn)練大模型和有效的多模態(tài)數(shù)據(jù)清洗與融合技術(shù)。公司有充足的資金儲(chǔ)備可用于購(gòu)買大規(guī)模算力,在繼續(xù)深入自行研發(fā)的同時(shí),不排除尋找強(qiáng)有力的合作伙伴,以開放的心態(tài)搭建多方共享平臺(tái)、補(bǔ)足短板,快速縮小差距。
周鴻祎曾表示,360的人工智能戰(zhàn)略用四個(gè)字形容就是“兩翼齊飛”,先占據(jù)應(yīng)用場(chǎng)景,同步全力發(fā)展核心算法技術(shù)。
9、光年之外:廣納AI人才
2月13日,原美團(tuán)聯(lián)合創(chuàng)始人王慧文,發(fā)了一條“英雄帖”,稱要出資5000萬(wàn)美元,打造中國(guó)的OpenAI(ChatGPT主體公司),同時(shí)為自己的新事業(yè)招募人才。
第二天,北京智源人工智能研究院副院長(zhǎng)劉江在朋友圈發(fā)文表示,已經(jīng)決定加入王慧文的光年之外團(tuán)隊(duì)。
并稱,將幫助王慧文打造中國(guó)AI大模型夢(mèng)之隊(duì),對(duì)標(biāo)OpenAl,打造中國(guó)自己的ChatGPT和基礎(chǔ)大模型。
圖源:微博
接著,搜狗輸入法之父馬占凱,發(fā)表微博稱加入光年之外。
最近披露的消息是,光年之外與國(guó)產(chǎn)AI框架一流科技(Oneflow)將達(dá)成并購(gòu)意向。目前該消息已被證實(shí),尚在談判中。
可以看出,無(wú)論是框架層面、模型算法層面,還是AI產(chǎn)品層面,人員正在齊備,光年之外的類ChatGPT產(chǎn)品雛形正在慢慢清晰。
10、奇酷教育:QIKU人工智能助手
人工智能應(yīng)用、爬蟲程序、Java代碼,述職報(bào)告、論文、作業(yè)……無(wú)需繁瑣的注冊(cè)手續(xù),只需鏈接奇酷教育Qiku-Chat小程序,2023也能狂飆ChatGPT!