與AI對(duì)話：構(gòu)建更好的語言模型

沃卡惠
行業(yè)資訊
2022-09-09 09:59:22
526

借鑒語用學(xué)和哲學(xué)的新研究提出了將會(huì)話代理與人類價(jià)值觀保持一致的方法。

語言是人類的基本特征，也是我們交流思想、意圖和感受等信息的主要方式。人工智能研究的最新突破導(dǎo)致創(chuàng)建了能夠以細(xì)微差別的方式與人類交流的對(duì)話代理。這些代理由大型語言模型提供支持——計(jì)算系統(tǒng)在大量基于文本的材料上進(jìn)行訓(xùn)練，以使用先進(jìn)的統(tǒng)計(jì)技術(shù)預(yù)測(cè)和生成文本。

然而，盡管InstructGPT、Gopher和LaMDA等語言模型在翻譯、問??答和閱讀理解等任務(wù)中取得了創(chuàng)紀(jì)錄的性能水平，但這些模型也顯示出許多潛在的風(fēng)險(xiǎn)和失敗模式。這些包括產(chǎn)生有毒或歧視性語言以及虛假或誤導(dǎo)性信息[1,2,3]。

這些缺點(diǎn)限制了會(huì)話代理在應(yīng)用環(huán)境中的有效使用，并引起人們對(duì)它們未能達(dá)到某些交流理想的方式的關(guān)注。迄今為止，大多數(shù)關(guān)于對(duì)話代理對(duì)齊的方法都集中在預(yù)測(cè)和降低危害風(fēng)險(xiǎn)上[4]。

我們的新論文《與人工智能對(duì)話：將語言模型與人類價(jià)值觀保持一致》采用了不同的方法，探索了人類與人工對(duì)話代理之間的成功溝通可能是什么樣子，以及哪些價(jià)值觀應(yīng)該指導(dǎo)不同對(duì)話領(lǐng)域的這些互動(dòng)。

語用學(xué)的見解

為了解決這些問題，本文借鑒了語用學(xué)這一語言學(xué)和哲學(xué)的傳統(tǒng)，它認(rèn)為對(duì)話的目的、語境和一系列相關(guān)規(guī)范都是良好對(duì)話實(shí)踐的重要組成部分。

語言學(xué)家和哲學(xué)家保羅·格賴斯將對(duì)話建模為兩方或多方之間的合作努力，他認(rèn)為參與者應(yīng)該：

說話有見地
說實(shí)話
提供相關(guān)資料
避免晦澀或模棱兩可的陳述

然而，我們的論文表明，考慮到嵌入在不同會(huì)話域中的目標(biāo)和價(jià)值存在差異，在將這些準(zhǔn)則用于評(píng)估會(huì)話代理之前，需要進(jìn)一步完善它們。

話語理想

舉例來說，科學(xué)研究和交流主要是為了理解或預(yù)測(cè)經(jīng)驗(yàn)現(xiàn)象。鑒于這些目標(biāo)，旨在協(xié)助科學(xué)研究的會(huì)話代理在理想情況下只會(huì)發(fā)表其真實(shí)性得到充分經(jīng)驗(yàn)證據(jù)證實(shí)的陳述，或者根據(jù)相關(guān)置信區(qū)間限定其立場(chǎng)。

例如，代理報(bào)告“在4.246光年的距離上，比鄰星是離地球最近的恒星”，只有在其基礎(chǔ)模型檢查該陳述與事實(shí)相符之后，才應(yīng)該這樣做。

然而，在公共政治話語中扮演主持人角色的對(duì)話代理人可能需要展示完全不同的美德。在這種情況下，目標(biāo)主要是管理差異并在社區(qū)生活中實(shí)現(xiàn)富有成效的合作。因此，代理人需要突出寬容、文明和尊重的民主價(jià)值觀[5]。

此外，這些值解釋了為什么語言模型產(chǎn)生有毒或偏見的言論往往如此成問題：冒犯性語言未能傳達(dá)對(duì)對(duì)話參與者的平等尊重，這是部署模型的上下文的關(guān)鍵值.同時(shí)，科學(xué)美德，例如經(jīng)驗(yàn)數(shù)據(jù)的全面呈現(xiàn)，在公眾審議的背景下可能不那么重要。

最后，在創(chuàng)造性的故事講述領(lǐng)域，交流交流的目標(biāo)是新穎性和獨(dú)創(chuàng)性，這些價(jià)值觀再次與上述價(jià)值觀大不相同。在這種情況下，假裝的更大自由度可能是合適的，盡管保護(hù)社區(qū)免受以“創(chuàng)意用途”為幌子制作的惡意內(nèi)容仍然很重要。

前進(jìn)的道路

這項(xiàng)研究對(duì)開發(fā)一致的對(duì)話式AI代理具有許多實(shí)際意義。首先，它們需要根據(jù)部署的上下文體現(xiàn)不同的特征：語言模型對(duì)齊沒有一刀切的解釋。相反，代理的適當(dāng)模式和評(píng)估標(biāo)準(zhǔn)（包括真實(shí)性標(biāo)準(zhǔn)）將根據(jù)對(duì)話交流的上下文和目的而有所不同。

此外，隨著時(shí)間的推移，對(duì)話代理還可能通過我們稱為上下文構(gòu)建和闡明的過程培養(yǎng)更強(qiáng)大和尊重的對(duì)話。即使一個(gè)人不知道支配給定對(duì)話實(shí)踐的價(jià)值觀，代理仍然可以通過在對(duì)話中預(yù)先設(shè)定這些價(jià)值觀來幫助人類理解這些價(jià)值觀，從而使人類說話者的交流過程更深入、更富有成效。

上一篇：如何在機(jī)器學(xué)習(xí)中使用數(shù)據(jù)集編程

下一篇：柏林引領(lǐng)德國減少私家車乘坐公共交通的夢(mèng)想