微軟發(fā)布了DialogGPT AI對(duì)話模型

【微軟發(fā)布了DialogGPT AI對(duì)話模型】很多文章的報(bào)道都是由微觀而宏觀，今日小編講給大家?guī)淼年P(guān)于微軟公布了DialogGPT AI對(duì)話模型的資訊也不例外，希翼可以在一定的程度上開闊你們的視野！y有對(duì)微軟公布了DialogGPT AI對(duì)話模型這篇文章感興趣的小伙伴可以一起來看看
微軟公布了DialogGPT AI對(duì)話模型
微軟研究院的自然語言處理小組公布了對(duì)話生成預(yù)訓(xùn)練變壓器(DialoGPT) ，這是一種用于自動(dòng)會(huì)話響應(yīng)生成的預(yù)訓(xùn)練深度學(xué)習(xí)自然語言處理(NLP)模型。該模型接受了超過147百萬次對(duì)話的培訓(xùn)，并在若干基準(zhǔn)上取得了最新成果。

該小組在ar Xiv上發(fā)表的一篇論文中介紹了該系統(tǒng)的細(xì)節(jié) 。DialoGPT建立在GPT-2變壓器架構(gòu)上，并使用從Reddit注釋線程中刮來的數(shù)據(jù)集進(jìn)行培訓(xùn) 。該模型使用兩個(gè)測(cè)試數(shù)據(jù)集進(jìn)行評(píng)估，即Dialog系統(tǒng)技術(shù)挑戰(zhàn)(DST C-7)數(shù)據(jù)集和一個(gè)新的6k實(shí)例數(shù)據(jù)集。對(duì)于這兩個(gè)數(shù)據(jù)集，該團(tuán)隊(duì)使用機(jī)器翻譯指標(biāo) ，如BLEU和Meteor，以評(píng)估DialoGPT的性能，與微軟的個(gè)性聊天和“團(tuán)隊(duì)B”，DSTC-7的贏家。在所有指標(biāo)上，DialoGPT優(yōu)于其他模型。該小組還使用人類法官對(duì)DialoGPT的輸出進(jìn)行排名，以對(duì)抗真實(shí)的人類反應(yīng);法官們更喜歡DialoGPT的反應(yīng) ，大約50%的時(shí)間。

變形金剛體系結(jié)構(gòu)已成為NLP任務(wù)的一種流行的深度學(xué)習(xí)模型..這些模型通常是預(yù)先訓(xùn)練的，使用無監(jiān)督學(xué)習(xí)，在大型數(shù)據(jù)集上，如維基百科的內(nèi)容。預(yù)培訓(xùn)同意模型學(xué)習(xí)自然語言結(jié)構(gòu)，然后再對(duì)特定任務(wù)的數(shù)據(jù)集(如DSTC-7數(shù)據(jù)集)進(jìn)行微調(diào) 。即使沒有微調(diào)，大型預(yù)先訓(xùn)練的模型也能在NLP基準(zhǔn)上達(dá)到最先進(jìn)的結(jié)果..然而，DialoGPT團(tuán)隊(duì)指出，這些模型中的許多都是“以生成平淡、不具信息性的樣本而臭名昭著的。”為了解決這一問題，他們實(shí)現(xiàn)了最大限度的相互信息評(píng)分功能，重新對(duì)模型的輸出進(jìn)行排序，懲處“平淡”的輸出。研究小組還使用強(qiáng)化學(xué)習(xí)來改進(jìn)模型的結(jié)果，但發(fā)現(xiàn)這通常會(huì)導(dǎo)致簡單地重復(fù)源句的反應(yīng) 。
預(yù)先訓(xùn)練的模型對(duì)于會(huì)話系統(tǒng)特殊有吸引力，因?yàn)槿狈Ω哔|(zhì)量的對(duì)話任務(wù)培訓(xùn)數(shù)據(jù)集。不過，使用Reddit或Twitter等互聯(lián)網(wǎng)網(wǎng)站提供的自然對(duì)話信息會(huì)帶來風(fēng)險(xiǎn)，這種模式將暴露于攻擊性言論，并且可以從中吸取教訓(xùn) 。微軟早些時(shí)候的實(shí)驗(yàn)聊天機(jī)器人Tay在與Twitter用戶交談后產(chǎn)生了“極其不恰當(dāng)和應(yīng)受責(zé)備”的輸出。微軟的個(gè)性聊天云服務(wù)試圖通過使用一系列機(jī)器學(xué)習(xí)分類器在自動(dòng)生成響應(yīng)之前過濾掉攻擊性輸入來解決這個(gè)問題。作為預(yù)防措施，DialoGPT團(tuán)隊(duì)選擇不釋放將模型輸出轉(zhuǎn)換為實(shí)際文本字符串的解碼器。同樣， OpenA I最初由于擔(dān)心“技術(shù)的惡意應(yīng)用”而抑制了他們經(jīng)過充分訓(xùn)練的模型。

Reddit的一位用戶對(duì)解碼器進(jìn)行了逆向工程，并公布了使用該模型的一些結(jié)果，同時(shí)還公布了評(píng)論：
我想說，考慮到給出的信息很少，所有幾代人在語法上都是可以接受的，而且令人印象深刻，大約五分之一的人看起來非常連貫，有時(shí)甚至非常諷刺(很像紅色) 。那些提出了一個(gè)明確界定的主題的人肯定更好地解決了問題。
NLP研究員Julian Harris在推特上說：
在這些報(bào)告中，人們總是需要記住，“接近人類的表現(xiàn)”只是為了測(cè)試場(chǎng)景。自動(dòng)生成響應(yīng)(NLG)仍然是一個(gè)非常新的領(lǐng)域，并且是高度不可預(yù)測(cè)的.因?yàn)檫@樣的深度學(xué)習(xí)生成的會(huì)話對(duì)話目前充其量是娛樂的，最糟糕的是，一個(gè)可怕的，破壞品牌的用戶體驗(yàn) 。
DialoGPT代碼和經(jīng)過預(yù)先訓(xùn)練的模型可在GitHub上獲得。

青青草免费线看线看|啊在车上停不下来了|国产少女免费观看电视剧|仑乱88MAV|精品老司机在线观看视频|国产一区二区三区高清免费视频|在线观看免费777av

微軟發(fā)布了DialogGPT AI對(duì)話模型

猜你喜歡