11月6日,2025世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng)?wù)浇視?,百度“劇本?qū)動(dòng)多模協(xié)同的高擬真數(shù)字人技術(shù)”獲獎(jiǎng),這也是百度大模型繼2023年“知識(shí)增強(qiáng)大語(yǔ)言模型關(guān)鍵技術(shù)”和2024年“文心智能體技術(shù)”之后,連續(xù)三年獲得該獎(jiǎng)項(xiàng),百度也成為唯一連續(xù)三年獲獎(jiǎng)的人工智能公司。
百度首席技術(shù)官王海峰現(xiàn)場(chǎng)發(fā)布
世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng)是面向全球互聯(lián)網(wǎng)領(lǐng)域的國(guó)際性科技獎(jiǎng)項(xiàng),旨在評(píng)選全球互聯(lián)網(wǎng)領(lǐng)域最具前瞻性的科技成果,倡導(dǎo)技術(shù)交流合作。本屆大會(huì)共收到來(lái)自34個(gè)國(guó)家和地區(qū)的424項(xiàng)科技成果申報(bào),最終經(jīng)專家評(píng)審選出17項(xiàng)年度領(lǐng)先科技獎(jiǎng)。
會(huì)上,百度首席技術(shù)官王海峰作為發(fā)布人出席頒獎(jiǎng)典禮。他介紹,百度劇本驅(qū)動(dòng)多模協(xié)同的高擬真數(shù)字人技術(shù),包括融合多模規(guī)劃與深度思考的劇本生成、動(dòng)態(tài)決策的實(shí)時(shí)交互、文本自控的語(yǔ)音合成、高一致性超擬真數(shù)字人長(zhǎng)視頻生成等技術(shù)創(chuàng)新。該技術(shù)突破了多模態(tài)實(shí)時(shí)協(xié)同、復(fù)雜動(dòng)態(tài)交互等技術(shù)難題,實(shí)現(xiàn)了數(shù)字人語(yǔ)言、聲音和形象的協(xié)調(diào)一致,提升了數(shù)字人直播內(nèi)容的質(zhì)量和交互能力,具有“高情商、強(qiáng)互動(dòng)、長(zhǎng)續(xù)航、更專業(yè)”的特色,效果超過(guò)真人。
基于百度數(shù)字人技術(shù)已生產(chǎn)超過(guò)10萬(wàn)個(gè)數(shù)字人,應(yīng)用于電商、教育、法律等各行各業(yè),幫助降低開(kāi)播成本達(dá)80%,提升直播轉(zhuǎn)化率31%。在6月15日百度優(yōu)選羅永浩數(shù)字人首場(chǎng)直播中,運(yùn)用該技術(shù)打造的羅永浩與朱蕭木數(shù)字人,成功完成長(zhǎng)達(dá)6小時(shí)的超擬真直播,觀播人數(shù)達(dá)1300萬(wàn),GMV 突破5500萬(wàn)。
目前,該技術(shù)已在百度電商場(chǎng)景的明星、圖書(shū)和健康直播上落地應(yīng)用,幫助眾多商家拓寬了銷售渠道,降低直播成本,提高運(yùn)營(yíng)效率。數(shù)字人可以24小時(shí)不間斷直播,增加了商品的曝光時(shí)間和銷售機(jī)會(huì),進(jìn)一步提升了經(jīng)濟(jì)效益。
自2016年以來(lái),百度已憑借百度大腦、小度助手(DuerOS)、Apollo、飛槳、知識(shí)增強(qiáng)大語(yǔ)言模型、文心智能體技術(shù)、劇本驅(qū)動(dòng)多模協(xié)同的高擬真數(shù)字人技術(shù)等創(chuàng)新成果七次獲得世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng)。

全部評(píng)論 (0)