无码中文AV有码中文AV,免费观看的a级毛片的网站,国产无吗一区二区三区在线欢,好男人资源免费播放在线观看

世界快消息!昆侖萬(wàn)維CEO方漢:AI大模型的競(jìng)賽關(guān)鍵在于工程積累

發(fā)布時(shí)間:2023-04-19 12:03:45
來(lái)源:上海證券報(bào)·中國(guó)證券網(wǎng)

上證報(bào)中國(guó)證券網(wǎng)訊(記者羅茂林郭成林)4月17日,昆侖萬(wàn)維宣布正式發(fā)布千億級(jí)大語(yǔ)言模型“天工”,同時(shí)宣布即日起啟動(dòng)邀請(qǐng)測(cè)試。上海證券報(bào)記者第一時(shí)間受邀參與了此次內(nèi)測(cè),從初步體驗(yàn)來(lái)看,這款大模型在日常性回答方面表現(xiàn)出色,值得注意的是,在部分需要揣摩情感的題目上,這款大模型也表現(xiàn)出了不錯(cuò)的推理能力。

據(jù)了解,“天工”由昆侖萬(wàn)維與國(guó)內(nèi)領(lǐng)先的AI團(tuán)隊(duì)奇點(diǎn)智源聯(lián)合研發(fā),是國(guó)內(nèi)對(duì)標(biāo)ChatGPT的雙千億級(jí)大語(yǔ)言模型,也是昆侖萬(wàn)維繼AI繪畫(huà)產(chǎn)品“天工巧繪”后的又一款生成式AI產(chǎn)品。

在大廠密集發(fā)布AI大模型產(chǎn)品的當(dāng)下,昆侖萬(wàn)維此次推出的“天工”令市場(chǎng)頗為關(guān)注。方漢第一時(shí)間接受上海證券報(bào)記者獨(dú)家專(zhuān)訪,分享了公司在AI領(lǐng)域的最新布局。


(資料圖片僅供參考)

眼下,國(guó)內(nèi)外在AI技術(shù)領(lǐng)域上的差距可謂是市場(chǎng)關(guān)注的熱點(diǎn)。對(duì)此,方漢告訴記者,中外的實(shí)際情況(差距)恐怕并非大眾想象的那么大?!爸袊?guó)在過(guò)去二十年,培養(yǎng)了大量的程序員工程師,近十年來(lái)在人工智能領(lǐng)域,中國(guó)的工程師數(shù)量可能僅次于美國(guó)?!睂?duì)于此次OpenAI的崛起,在他看來(lái),更像是“一家公司領(lǐng)先其他公司”,而非“一個(gè)國(guó)家領(lǐng)先其他國(guó)家”。

據(jù)了解,成立于2008年的昆侖萬(wàn)維,從網(wǎng)絡(luò)游戲業(yè)務(wù)起步,2009年成為中國(guó)最早出海的互聯(lián)網(wǎng)企業(yè)之一。基于業(yè)務(wù)場(chǎng)景洞察,以及對(duì)人工智能技術(shù)的前瞻性判斷,昆侖萬(wàn)維從2020年開(kāi)始布局AI音樂(lè)領(lǐng)域。2022年,昆侖萬(wàn)維從音樂(lè)AI往多模態(tài)AI拓展,并和奇點(diǎn)智源就百億級(jí)大語(yǔ)言模型、圖像AIGC、編程AIGC等技術(shù)領(lǐng)域達(dá)成全面技術(shù)戰(zhàn)略合作,在2022年底宣布模型開(kāi)源。

值得一提的是,作為國(guó)內(nèi)程序領(lǐng)域最早發(fā)起開(kāi)源運(yùn)動(dòng)的倡議者,此次方漢帶領(lǐng)的“天工”團(tuán)隊(duì),在項(xiàng)目開(kāi)發(fā)過(guò)程中也得到了開(kāi)源社區(qū)上百位AI科學(xué)家助力。此外,“天工”團(tuán)隊(duì)投入大量資源攻克了中文語(yǔ)料庫(kù)的質(zhì)量瓶頸,從數(shù)十萬(wàn)億的數(shù)據(jù)中清洗、篩選出了3萬(wàn)億單詞數(shù)據(jù)用于訓(xùn)練大模型。

有意思的是,對(duì)于“中文素材有限就一定做不出中文AI”這一論調(diào),方漢告訴記者,這實(shí)際上是一個(gè)普遍存在的誤區(qū)?!爸拔覀円舱J(rèn)為訓(xùn)練語(yǔ)料的語(yǔ)種會(huì)對(duì)模型產(chǎn)生此類(lèi)影響。”然而,隨著業(yè)內(nèi)訓(xùn)練模型參數(shù)規(guī)模不斷擴(kuò)大,一種神奇的“遷移”現(xiàn)象出現(xiàn)了?!拔覀兒髞?lái)發(fā)現(xiàn),當(dāng)模型參數(shù)規(guī)模突破1000億的時(shí)候,模型本身就會(huì)發(fā)生質(zhì)變,其中一大特點(diǎn)就是展現(xiàn)出不同語(yǔ)種直接的‘遷移’能力?!?/p>

據(jù)方漢介紹,在“遷移”現(xiàn)象出現(xiàn)后,即使純英文訓(xùn)練的模型,在用中文回答問(wèn)題時(shí)也能夠表現(xiàn)出不俗的應(yīng)對(duì)能力。方漢笑稱(chēng),這或許就是AI的觸類(lèi)旁通。

值得注意的是,采訪中當(dāng)談及當(dāng)下AI大模型訓(xùn)練的關(guān)鍵點(diǎn)時(shí),不同于大眾認(rèn)知的“缺算力”和“缺數(shù)據(jù)”,方漢坦言最大的差距將會(huì)是不同項(xiàng)目組之間的工程經(jīng)驗(yàn)積累。

數(shù)據(jù)上的問(wèn)題有了AI的“遷移”能力自然不在話下。而從算力上看,“這些年我們的工程師可以通過(guò)優(yōu)化算法,不斷抬高算力天花板?!狈綕h說(shuō)道,相比之下,對(duì)于大模型此類(lèi)大項(xiàng)目的工程調(diào)度,精細(xì)化調(diào)試將成為最大短板。

方漢解釋道:“以訓(xùn)練數(shù)據(jù)為例,其實(shí)業(yè)界最難的不是找數(shù)據(jù),而是如何給AI投喂數(shù)據(jù)。什么樣的數(shù)據(jù)不能使用,篩選數(shù)據(jù)的標(biāo)準(zhǔn)是什么,如何做數(shù)據(jù)的剪枝、清洗等。通過(guò)篩選數(shù)據(jù)調(diào)整參數(shù)、改進(jìn)模型設(shè)計(jì)才是最核心的機(jī)密,這也是OpenAI沒(méi)有在論文中公開(kāi)的核心技術(shù)?!?/p>

對(duì)此,方漢坦言國(guó)內(nèi)的團(tuán)隊(duì)仍然需要不斷地探索,他預(yù)言未來(lái)的大模型生態(tài)主要有兩類(lèi)參與者,一類(lèi)做底層模型,一類(lèi)做上層的應(yīng)用產(chǎn)品?!拔艺J(rèn)為這個(gè)生態(tài)會(huì)相對(duì)均衡,不會(huì)一家獨(dú)大?!辈稍L最后,方漢頗為樂(lè)觀地說(shuō)道。

(文章來(lái)源:上海證券報(bào)·中國(guó)證券網(wǎng))

標(biāo)簽:

AD
更多相關(guān)文章