在6月1日舉辦的2021北京智源大會(huì)上,一位虛擬學(xué)生“華智冰”的亮相引發(fā)了汽車軟板廠的關(guān)注。作為一個(gè)誕生沒多久,甚至未曾參加過高考的學(xué)生,華智冰就已經(jīng)被清華大學(xué)破格“錄取”。這一虛擬學(xué)生究竟有何能耐,對人工智能領(lǐng)域的發(fā)展又意味著什么呢?
琴棋書畫,樣樣精通
在智源大會(huì)上現(xiàn)場播放的視頻中,華智冰展示了自己創(chuàng)作的音樂、詩詞和繪畫作品。華智冰由北京智源人工研究院、智譜AI和小冰公司三方合作開發(fā),以智源人工智能研究院的“悟道2.0”為核心模型,并由小冰公司提供框架,并負(fù)責(zé)聲音和形象的開發(fā)。
“悟道2.0”是北京智源人工智能研究院發(fā)布的超大規(guī)模智能模型,其參數(shù)規(guī)模達(dá)到1.75萬億,這個(gè)數(shù)字是OpenAI打造的GPT-3的三倍,此前的紀(jì)錄保持者為Google Switch Transformer,這是目前全球最大也是中國首個(gè)萬億級的智能模型。
華智冰的聲音與形象歸功于小冰公司,但其展示的詩詞書畫等作品卻是由“悟道2.0”來打造的。國際上主流的大模型基本都基于英文的語料進(jìn)行開發(fā),而“悟道2.0”模型擁有4.9TB的中英訓(xùn)練數(shù)據(jù)庫WuDaoCorpora2.0,包含了中英文本數(shù)據(jù)和中文圖文數(shù)據(jù)。
清華大學(xué)教授、智源研究院學(xué)術(shù)副院長,同時(shí)也是華智冰在清華的導(dǎo)師唐杰表示:“華智冰是數(shù)據(jù)與知識雙輪驅(qū)動(dòng)的人工智能,其學(xué)習(xí)能力主要在于從數(shù)據(jù)中抽取知識,機(jī)器可以處理數(shù)據(jù),從而實(shí)現(xiàn)可持續(xù)學(xué)習(xí)。”
據(jù)汽車軟板廠了解,目前華智冰基于“悟道”的文源和文瀾兩大模型已經(jīng)實(shí)現(xiàn)了上述的詩詞創(chuàng)作,未來會(huì)繼續(xù)往認(rèn)知層面發(fā)展,在清華大學(xué)計(jì)算機(jī)系知識工程實(shí)驗(yàn)室“進(jìn)修”之后,掌握編程等其他技能。
為虛擬AI形象注入生命
目前AI形象已經(jīng)開始在多個(gè)領(lǐng)域浮現(xiàn),比如虛擬歌手和虛擬畫家等。小冰公司是去年微軟小冰業(yè)務(wù)拆分出來的獨(dú)立運(yùn)營公司,“悟道”的存在為華智冰賦予了自然語言處理能力,而小冰框架則為其賦予了交互和語音能力。
就拿小冰旗下的X Studio歌手軟件來說,小冰框架以及為其打造了多名虛擬歌手,每位歌手都具備不同的音色和音域,而近期發(fā)布的X Studio 1.7.0中,華智冰也正式入籍,解鎖了演唱技能。
之所以華智冰能夠“入學(xué)”清華,不單單是因?yàn)槠鋵I(yè)技能,也是因?yàn)槿A智冰會(huì)與清華的師生產(chǎn)生交互,并與其建立更好的師生同學(xué)關(guān)系,加強(qiáng)其情感交互能力。這種情感交互和對話推理能力,和AI少女小冰類似,也是源于小冰框架。
“悟道2.0”這種大模型和訓(xùn)練數(shù)據(jù)是搭建一個(gè)AI平臺(tái)的基石,但訓(xùn)練成本也相當(dāng)高。比如獨(dú)家授權(quán)給微軟的GPT-3就要用上1萬片GPU,而智源人工智能研究院的介紹中也提到了這一點(diǎn),華智冰所需的GPU比任何一個(gè)清華學(xué)生都要多。
華智冰擁有的才藝和創(chuàng)作能力需要龐大的訓(xùn)練數(shù)據(jù)支撐,但僅靠這部分?jǐn)?shù)據(jù)產(chǎn)生的交互能力依然是有所欠缺的,因此華智冰在清華的校園生涯也是一個(gè)必要的學(xué)習(xí)過程。汽車軟板廠認(rèn)為,AI裁判和AI主播等,未來還會(huì)出現(xiàn)更多的AI主體在我們的生活中充當(dāng)不同的形象。