央廣網(wǎng)科技7月5日消息(記者 殷雨婷) “多模態(tài)深度語義理解能讓機(jī)器聽清、看清,更能深入理解它背后的含義,深度地理解真實(shí)世界,進(jìn)而更好地支撐各種應(yīng)用?!卑俣雀呒?jí)副總裁、AI技術(shù)平臺(tái)體系(AIG)總負(fù)責(zé)人王海峰表示。

日前,在百度AI開發(fā)者大會(huì)(Baidu Create 2018)上,王海峰發(fā)布百度大腦3.0。百度大腦3.0的核心是“多模態(tài)深度語義理解”,包括數(shù)據(jù)的語義,知識(shí)的語義,以及圖像、視頻、聲音、語音等各方面的理解。
如何實(shí)現(xiàn)從“看清聽清”到“看懂聽懂”?
視覺語義化可以讓機(jī)器從看清到看懂視頻,并提煉出結(jié)構(gòu)化語義知識(shí)。百度視覺技術(shù)部、人臉技術(shù)部、增強(qiáng)現(xiàn)實(shí)技術(shù)部總監(jiān)吳中勤介紹,視覺語義化技術(shù)首先識(shí)別人、物體和場景,同時(shí)捕捉它們之間的行為和關(guān)系,通過時(shí)序化、數(shù)字化、結(jié)構(gòu)化的方式形成語義知識(shí),最終結(jié)合領(lǐng)域和場景進(jìn)行智慧推理,落地行業(yè)應(yīng)用。
未來,視覺語義化技術(shù)還可進(jìn)一步延展,它結(jié)合新型的傳感器和AI芯片,可以在感知層面和計(jì)算層面得到大幅提升;結(jié)合手機(jī)可以帶給用戶更佳地使用體驗(yàn)。
語音技術(shù)的升級(jí)則讓機(jī)器更好地聽懂世界。百度語音技術(shù)部總監(jiān)高亮表示,百度基于遠(yuǎn)場的語音語義一體化技術(shù)已取得突破,可為業(yè)界提供更頂尖的遠(yuǎn)場語音技術(shù)。
語音語義一體化將遠(yuǎn)場交互中高頻Query識(shí)別準(zhǔn)確率提升10個(gè)點(diǎn),并保持普通Query識(shí)別率不降;多語種混合聲學(xué)建模基于Deep Peak2大幅提升中英文混合Query識(shí)別準(zhǔn)確率,相對(duì)錯(cuò)誤率比業(yè)界最好競品降低20%;新升級(jí)的TTS技術(shù)業(yè)界首創(chuàng)傳統(tǒng)拼接技術(shù)與Wavenet技術(shù)融合方案,保證合成質(zhì)量的同時(shí)大大降低成本,讓大規(guī)模應(yīng)用落地成為現(xiàn)實(shí)。
在對(duì)話理解方面,百度理解與交互技術(shù)平臺(tái)UNIT升級(jí)至2.0,進(jìn)一步增強(qiáng)冷啟動(dòng)能力,支持像人類一樣在對(duì)話當(dāng)中學(xué)習(xí),同時(shí)開放了第一個(gè)工業(yè)級(jí)對(duì)話系統(tǒng)開源框架,降低搭建門檻,讓開發(fā)者無縫對(duì)接云端。
將自主研發(fā)的芯片納入技術(shù)體系
數(shù)據(jù)、算法、算力是影響人工智能技術(shù)發(fā)展的重要因素。王海峰表示百度大腦3.0首次將芯片納入技術(shù)體系,帶動(dòng)百度大腦算力爆發(fā)式增長。百度自主研發(fā)的中國第一款云端全功能AI芯片“昆侖”也在會(huì)上首次亮相。未來,AI芯片將與百度自主研發(fā)的PaddlePaddle深度學(xué)習(xí)框架相結(jié)合,推動(dòng)百度AI產(chǎn)業(yè)生態(tài)快速發(fā)展。
百度在2016年正式開源的PaddlePaddle,如今也迎來了PaddlePaddle3.0版本。百度AI技術(shù)生態(tài)部總經(jīng)理喻友平對(duì)此進(jìn)行了詳細(xì)解讀。PaddlePaddle3.0包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以讓開發(fā)者獲取AI能力的平臺(tái)。
PaddlePaddle3.0核心框架對(duì)服務(wù)器版本以及移動(dòng)端版本進(jìn)行了全面優(yōu)化,PaddlePaddle Fluid提供豐富的滿足常見主流模型搭建需求的API,支持廣泛的模型搭建,訓(xùn)練Runtime可以滿足各類型的模型訓(xùn)練需求;PaddlePaddle Serving可靈活適配多種預(yù)測引擎;PaddlePaddle Mobile集成百度移動(dòng)端預(yù)測的實(shí)踐經(jīng)驗(yàn),提供多平臺(tái)支持。
百度大腦升級(jí)至3.0是百度AI技術(shù)的一次跨越式升級(jí),王海峰強(qiáng)調(diào),“百度AI能力的核心是百度大腦,百度大腦3.0是百度AI能力的集大成者?!蔽磥?,百度將逐步把基于百度大腦的技術(shù)突破開放給相關(guān)的開發(fā)者和企業(yè)。
關(guān)鍵詞:
語義
看懂
深度