近日,京東“莎士比亞”AI智能文案系統(tǒng)2.0正式上線。與1.0相比,2.0系統(tǒng)可生成完整的文案段落。在語言表達(dá)上更貼切,描述更為精準(zhǔn)與切題,此外表達(dá)的方式也更加豐富。京東AI研究院常務(wù)副院長、深度學(xué)習(xí)及語音和語言實(shí)驗(yàn)室主任何曉冬博士透露,在保證AI能夠?qū)崿F(xiàn)基礎(chǔ)的文字表達(dá)后,京東正在將人類的情感表達(dá)以及更為高級(jí)的修辭手法例如比喻、排比、擬人等技巧融入其中。

京東AI研究院常務(wù)副院長、深度學(xué)習(xí)及語音和語言實(shí)驗(yàn)室主任何曉冬博士
在2.0的版本中寫作能力有了大幅提升,且表達(dá)豐富性等方面均取得了長足進(jìn)步,能夠幫助商家實(shí)現(xiàn)在服飾、居家、個(gè)護(hù)化妝等品類上的商品詳情描述工作,大幅提高商家的工作效率。而京東也在不斷加大AI智能寫作的投入,目前已經(jīng)匯聚了京東AI研究院以及京東美國硅谷研究院 。

京東莎士比亞2.0上線
從單句到段落文案的一小步AI的一大步眾所周知,相較于單句文案寫作,段落文案的生成難度,無論是底層數(shù)據(jù)庫支撐,還是算法難度上都更具挑戰(zhàn)性,不僅要考慮句子與句子之間的起承轉(zhuǎn)合,還需保證各分句之間圍繞同一主題進(jìn)行描述,否則生成的文案有可能出現(xiàn)不切題,句與句之間自相矛盾的風(fēng)險(xiǎn)。京東“莎士比亞”2.0系統(tǒng)打破了這一瓶頸,在長文案的寫作上邁出了堅(jiān)實(shí)的一步。當(dāng)前莎士比亞能夠根據(jù)商家的需要,僅輸入與商品相關(guān)的幾個(gè)關(guān)鍵詞例如“連衣裙”“雪紡”“高跟鞋”三個(gè)關(guān)鍵詞,點(diǎn)擊生成按鈕,即可生成多個(gè)與之相匹配的文案描述。

根據(jù)關(guān)鍵詞自動(dòng)生成產(chǎn)品文案
可以看到“莎士比亞”2.0系統(tǒng)能夠判定用戶輸入的多個(gè)關(guān)鍵詞之間,何為中心詞、何為搭配詞,避免主次不分、描述混亂的現(xiàn)象。除了關(guān)鍵詞,商家還可以輸入商品的SKU生成文案,且可對生成的文案內(nèi)容做編輯修改,并添加至個(gè)人收藏,而機(jī)器則會(huì)根據(jù)用戶修改情況,判別內(nèi)容優(yōu)劣,下次展示時(shí)做出順序調(diào)整。
該項(xiàng)目負(fù)責(zé)人談到:“即便是一些不太常見的關(guān)鍵詞,“莎士比亞”系統(tǒng)也能生成段落,這源于我們系統(tǒng)上建立的龐大文案數(shù)據(jù)庫,能覆蓋商品詳情頁文案中出現(xiàn)的主流描述用語?!?/p>
大規(guī)模集成機(jī)器學(xué)習(xí)技術(shù)突破AI“語言障礙”
莎士比亞2.0的品類覆蓋擴(kuò)展至服飾、居家到美妝個(gè)護(hù),在短短的3個(gè)月里就完成了迭代,其中離不開京東硅谷研究院前臺(tái)產(chǎn)品算法團(tuán)隊(duì)與京東AI研究院的通力協(xié)作,使其在算法優(yōu)化上提供了強(qiáng)大的技術(shù)保障?!吧勘葋啞毕到y(tǒng)采用的主要算法,是根據(jù)用戶輸入的主題詞自動(dòng)擴(kuò)展主題詞,自動(dòng)篩選出最優(yōu)的候選主題詞序列方案和自適應(yīng)學(xué)習(xí)方案,利用大量的數(shù)據(jù)訓(xùn)練seq2seq模型后,經(jīng)過不斷優(yōu)化和迭代得到最終符合任務(wù)要求的模型。對于此次迭代所實(shí)現(xiàn)的段落描寫,系統(tǒng)則是基于大規(guī)模集成機(jī)器學(xué)習(xí)技術(shù),結(jié)合語義理解、篇章分析、近義詞匹配、情感分析等自然語言處理技術(shù),自動(dòng)生成切題、通順、有感染力的文案。相對于端對端純粹從數(shù)據(jù)生成文案的方式,該方法的優(yōu)勢就在于融合了數(shù)據(jù)和語言學(xué)知識(shí),生成出來的文案可讀,且準(zhǔn)確匹配輸入信息。能夠真正達(dá)到言之有物、打動(dòng)讀者的目的。
通過京東AI研究院與京東硅谷研發(fā)團(tuán)隊(duì)分工協(xié)作,既利于單一品類的做深、做精,又利于多品類的齊頭并進(jìn),雙方技術(shù)交流分享互通有無,避免重復(fù)研發(fā)、提升效率。最終生成的文案結(jié)果會(huì)由專業(yè)的文案同事進(jìn)行打分,研發(fā)人員根據(jù)打分情況做出修正,并根據(jù)業(yè)務(wù)方的實(shí)際需求做出模型調(diào)整。
向高級(jí)寫作進(jìn)發(fā) 讓閱讀者產(chǎn)生共鳴感
硅谷研究院陳力博士表示,AI高級(jí)寫作剛剛開始,莎士比亞將會(huì)向高級(jí)寫作發(fā)力,讓機(jī)器寫出的文案讓閱讀者產(chǎn)生共鳴般的體驗(yàn)。而要實(shí)現(xiàn)這一點(diǎn),京東將會(huì)集中在以下三點(diǎn)來發(fā)力。

京東美國硅谷研究院陳力博士
第一,理解詞語本意并進(jìn)行擴(kuò)展,對于商品描述的寫作,難點(diǎn)就在于對關(guān)鍵詞本身的延展,例如我們輸入裙子,計(jì)算機(jī)能夠理解裙子的意思同時(shí)圍繞它能夠延展出裙子樣式的描寫、材質(zhì)的描寫、搭配的描寫等等,這是十分困難的,尤其是結(jié)合商品本身的功能特色,引申出貼切、抽象的場景與畫面,需要機(jī)器具備類似人類大腦神經(jīng)元般的聯(lián)想機(jī)能,而這絕非輕而易舉,需對數(shù)以萬計(jì)的漢語詞匯建立映射關(guān)系,“喂”給機(jī)器學(xué)習(xí)。第二,文案風(fēng)格的準(zhǔn)確與豐富。文案的寫作風(fēng)格能夠根據(jù)商品本身的性質(zhì)去撰寫出恰當(dāng)?shù)奈陌革L(fēng)格進(jìn)行表達(dá),同時(shí)京東基于BI(商業(yè)智能)已經(jīng)實(shí)現(xiàn)了對用戶推薦商品的豐富多變,如廣告語、發(fā)現(xiàn)好貨文章、商品詳情頁等文案,也能根據(jù)用戶畫像實(shí)現(xiàn)智能推送。第三,押韻美感及平仄韻律的塑造。中國文字博大精深,特別是修辭手法的多元化,漢語寫作中常見的比喻、排比、擬人等修辭手法,一直以來都是人工智能領(lǐng)域的難題。而要做到韻腳的美感和平仄節(jié)奏的變化也是目前人工智能不斷在探索的課題?!吧勘葋啞毕到y(tǒng)要產(chǎn)出高質(zhì)量文案,自然繞不開這一研究課題,計(jì)劃在3.0階段將加入韻律庫并能夠有平仄的韻律感,上下句銜接時(shí),借助豐富同義詞、近義詞庫的替換引用,就會(huì)降低不押韻的概率,使得文案讀起來朗朗上口。
隨著對AI寫作的不斷深入,我們不僅能夠通過AI幫助實(shí)現(xiàn)基礎(chǔ)的文字描述,更能夠在廣告、營銷等行業(yè)上去使用,幫助文字工作者通過AI的創(chuàng)造能力汲取靈感,對合作伙伴來說能夠降低其文案寫作方面的人力成本。在無界零售的推進(jìn)下,京東作為零售基礎(chǔ)設(shè)施服務(wù)商,希望將自身優(yōu)質(zhì)的AI技術(shù)轉(zhuǎn)變成為基礎(chǔ)服務(wù)的能力,而莎士比亞正是這一能力的很好案例,通過莎士比亞京東希望能夠?yàn)槲淖止ぷ髡邘砀颖憬莸奈淖謩?chuàng)作,讓更多人享受AI創(chuàng)造的美好生活。
關(guān)鍵詞:
文案
莎士比亞
瓶頸