隨著人工智能、虛擬現(xiàn)實(shí)等技術(shù)的發(fā)展,數(shù)字虛擬人頻頻出現(xiàn)在公眾的視野。作為以數(shù)字形式存在于數(shù)字空間中并具有擬人或真人外貌、行為和特點(diǎn)的虛擬人物,數(shù)字人是如何研發(fā)的?有哪些應(yīng)用?
走進(jìn)人們?nèi)粘I?/p>
“大家好,谷小雨有禮了!”近日,在南宋德壽宮遺址博物館開館儀式上,一位身著古裝的虛擬數(shù)字人擔(dān)任主持人,吸引了觀眾的注意。仔細(xì)瞧,這位數(shù)字人柳葉細(xì)眉、衣袂飄飄、氣質(zhì)素雅、靈動(dòng)可愛。它便是浙江廣電集團(tuán)旗下浙江衛(wèi)視推出的宋韻文化推廣人。
“我們推出谷小雨,既是向傳統(tǒng)文化靠近,也是向年輕群體靠攏?!闭憬l(wèi)視谷小雨工作室負(fù)責(zé)人接受本報(bào)采訪時(shí)表示,谷小雨是由浙江衛(wèi)視研發(fā)的首個(gè)數(shù)字國潮產(chǎn)品。這個(gè)產(chǎn)品把宋韻元素與新媒介、新技術(shù)、新應(yīng)用融合,創(chuàng)新性地打造出谷小雨這個(gè)形象?!拔覀兿M每捎H可愛的人物形象、可感可觸的數(shù)字手段,讓廣大受眾尤其是年輕人喜歡上宋韻文化。”
谷小雨已在多種場(chǎng)合亮相——電視節(jié)目中,它吟唱宋詞、介紹宋代蹴鞠文化;世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)期間,它與嘉賓通過H5在線合拍;在南宋德壽宮遺址博物館,它成為導(dǎo)覽員,對(duì)答游客提問應(yīng)答如流……最近,谷小雨參與的“南宋人的一天” 對(duì)外文化交流云展覽,還陸續(xù)在新西蘭、德國、荷蘭、巴基斯坦等國的中國文化中心上線。
與谷小雨類似,越來越多的數(shù)字人在文旅、金融、政務(wù)等服務(wù)領(lǐng)域“上崗”,走進(jìn)人們?nèi)粘I?。例如,以敦煌飛天為藍(lán)本打造的國風(fēng)虛擬數(shù)字人天妤,在全網(wǎng)已擁有500余萬粉絲;在2022世界人工智能大會(huì)上亮相的中信金控新員工——數(shù)字人小信,可以擔(dān)任客戶的專屬財(cái)富規(guī)劃師;打開湖北省仙桃市人民政府門戶網(wǎng)站,紅衣白裙的數(shù)字人“桃桃”笑盈盈地對(duì)視頻新聞、政策解讀進(jìn)行播報(bào)……《數(shù)字人產(chǎn)業(yè)發(fā)展趨勢(shì)報(bào)告(2023)》指出,隨著交互智能技術(shù)的加速發(fā)展,數(shù)字人正在從技術(shù)創(chuàng)新走向產(chǎn)業(yè)應(yīng)用。
有趣的內(nèi)涵不能少
如此逼真的數(shù)字人是如何打造出來的呢?以谷小雨為例,數(shù)字人首先要做到“形似人”。按照人物概念設(shè)計(jì),谷小雨來自南宋臨安,生于谷雨時(shí)節(jié),有“雨生百谷,欣欣向榮”的美好寓意。浙江衛(wèi)視特地與宋韻文化研究傳承中心合作,邀請(qǐng)相關(guān)宋韻專家組成顧問團(tuán),為谷小雨的人物造型、形象設(shè)計(jì)、內(nèi)容呈現(xiàn)等提供全程專業(yè)級(jí)指導(dǎo)把關(guān)。亮相一檔歌唱節(jié)目時(shí),谷小雨的舞臺(tái)造型是一套現(xiàn)代改良的宋制漢服,上身是改良褙子、宋抹疊穿,袖口造型以西湖荷葉為靈感,下身是水墨印花長裙,妝容參考的是南宋仕女珍珠妝。
作為技術(shù)支持方,騰訊團(tuán)隊(duì)打造出一個(gè)超200萬面數(shù)的高精度寫實(shí)虛擬人,滿足大型舞臺(tái)節(jié)目錄制以及智能多模態(tài)交互的多樣化需求。騰訊相關(guān)負(fù)責(zé)人劉明亮告訴記者,谷小雨的麻花辮由30萬根發(fā)絲組成,不同材質(zhì)的衣物有5層,為了達(dá)到形神兼?zhèn)涞男Ч?,團(tuán)隊(duì)基于游戲引擎進(jìn)行實(shí)時(shí)交互模擬,使得人物在不同燈光、不同動(dòng)作下的表現(xiàn)都非常真實(shí)。
除了“好看的皮囊”,數(shù)字人還要具備“有趣的內(nèi)涵”。例如,在出任導(dǎo)覽員之前,谷小雨進(jìn)行了400G開放數(shù)據(jù)和30億參數(shù)量的超大規(guī)模語言模型訓(xùn)練,再加上海量宋韻文獻(xiàn)和百科搜索引擎的助力,谷小雨成功掌握了宋韻百科知識(shí)。為了使谷小雨能夠與游客實(shí)時(shí)語音對(duì)話,技術(shù)團(tuán)隊(duì)運(yùn)用語音識(shí)別、自然語言理解、語音合成等技術(shù),讓這位數(shù)字導(dǎo)覽員聽得懂、答得出、懂得多。
谷小雨還采用了語音驅(qū)動(dòng)口型技術(shù),通過適配各種音色、歌唱、語氣詞等不同類型的音頻輸入,學(xué)習(xí)種類繁多的情感語音數(shù)據(jù),生成韻律自然、情感風(fēng)格豐富和個(gè)性化的高表現(xiàn)力語音,再配合靈動(dòng)準(zhǔn)確的面部表情和口型,讓數(shù)字人的語音達(dá)到可媲美真人的效果。
產(chǎn)業(yè)增長勢(shì)頭強(qiáng)勁
目前,數(shù)字人已在企業(yè)服務(wù)、影視動(dòng)畫、文化傳媒等領(lǐng)域得到廣泛應(yīng)用。艾媒咨詢《2022-2023年中國虛擬人行業(yè)深度研究及投資價(jià)值分析報(bào)告》稱,在娛樂需求增加、人工智能等技術(shù)不斷迭代的背景下,中國虛擬人產(chǎn)業(yè)高速發(fā)展,元宇宙的熱潮加速推動(dòng)虛擬數(shù)字人產(chǎn)業(yè)升級(jí)。數(shù)據(jù)顯示,2021年中國虛擬人帶動(dòng)產(chǎn)業(yè)市場(chǎng)規(guī)模和核心市場(chǎng)規(guī)模分別為1074.9億元和62.2億元,預(yù)計(jì)2025年分別達(dá)到6402.7億元和480.6億元,呈現(xiàn)強(qiáng)勁的增長勢(shì)頭。
記者了解到,虛擬數(shù)字人的制作流程一般包括模型綁定、動(dòng)作捕捉、動(dòng)畫解算、實(shí)時(shí)渲染等步驟,其中要運(yùn)用到大量的現(xiàn)實(shí)增強(qiáng)、深度學(xué)習(xí)、虛擬制片等高科技前沿技術(shù)。比較簡單的動(dòng)漫形象數(shù)字人,一般1個(gè)月就能完成;而制作一個(gè)更寫實(shí)的3D數(shù)字人,從角色設(shè)計(jì)到完成渲染需要3至6個(gè)月甚至更久。數(shù)字人越是“精致”“逼真”,越花費(fèi)時(shí)間、人力成本。
劉明亮表示,算力提升、引擎升級(jí)等技術(shù)迭代,正推動(dòng)數(shù)字人制作效能和智能水平持續(xù)提升。一方面,制作數(shù)字人的成本更低、效率更高;另一方面,數(shù)字人的交互性越來越強(qiáng),提供的服務(wù)和陪伴等“人”的屬性更強(qiáng)。
業(yè)內(nèi)人士認(rèn)為,從關(guān)注動(dòng)畫、渲染的身份型數(shù)字人到融合語言理解能力、表達(dá)能力、學(xué)習(xí)能力、交互能力的服務(wù)型數(shù)智人,從在線服務(wù)到在場(chǎng)體驗(yàn),隨著元宇宙相關(guān)技術(shù)的進(jìn)一步發(fā)展,數(shù)字人將進(jìn)入大規(guī)模應(yīng)用期,加速轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力。(人民日?qǐng)?bào)海外版 記者:葉 子)
網(wǎng)站簡介 / 廣告服務(wù) / 聯(lián)系我們
主辦:華夏經(jīng)緯信息科技有限公司 版權(quán)所有 華夏經(jīng)緯網(wǎng)
Copyright 2001-2024 By m.essencecafe.cn