国产熟女一区二区五月婷-又爽又黄又无遮挡网站-亚洲国产精品视频在线播放-国内偷拍国内精品网999

當(dāng)前位置:首頁 > 最新資訊 > 行業(yè)資訊

與AI對(duì)話:構(gòu)建更好的語言模型

借鑒語用學(xué)和哲學(xué)的新研究提出了將會(huì)話代理與人類價(jià)值觀保持一致的方法。

語言是人類的基本特征,也是我們交流思想、意圖和感受等信息的主要方式。人工智能研究的最新突破導(dǎo)致創(chuàng)建了能夠以細(xì)微差別的方式與人類交流的對(duì)話代理。這些代理由大型語言模型提供支持——計(jì)算系統(tǒng)在大量基于文本的材料上進(jìn)行訓(xùn)練,以使用先進(jìn)的統(tǒng)計(jì)技術(shù)預(yù)測(cè)和生成文本。

然而,盡管InstructGPT、Gopher和LaMDA等語言模型在翻譯、問??答和閱讀理解等任務(wù)中取得了創(chuàng)紀(jì)錄的性能水平,但這些模型也顯示出許多潛在的風(fēng)險(xiǎn)和失敗模式。這些包括產(chǎn)生有毒或歧視性語言以及虛假或誤導(dǎo)性信息[1,2,3]。

這些缺點(diǎn)限制了會(huì)話代理在應(yīng)用環(huán)境中的有效使用,并引起人們對(duì)它們未能達(dá)到某些交流理想的方式的關(guān)注。迄今為止,大多數(shù)關(guān)于對(duì)話代理對(duì)齊的方法都集中在預(yù)測(cè)和降低危害風(fēng)險(xiǎn)上[4]。

我們的新論文《與人工智能對(duì)話:將語言模型與人類價(jià)值觀保持一致》采用了不同的方法,探索了人類與人工對(duì)話代理之間的成功溝通可能是什么樣子,以及哪些價(jià)值觀應(yīng)該指導(dǎo)不同對(duì)話領(lǐng)域的這些互動(dòng)。

語用學(xué)的見解

為了解決這些問題,本文借鑒了語用學(xué)這一語言學(xué)和哲學(xué)的傳統(tǒng),它認(rèn)為對(duì)話的目的、語境和一系列相關(guān)規(guī)范都是良好對(duì)話實(shí)踐的重要組成部分。

語言學(xué)家和哲學(xué)家保羅·格賴斯將對(duì)話建模為兩方或多方之間的合作努力,他認(rèn)為參與者應(yīng)該:

  • 說話有見地
  • 說實(shí)話
  • 提供相關(guān)資料
  • 避免晦澀或模棱兩可的陳述

然而,我們的論文表明,考慮到嵌入在不同會(huì)話域中的目標(biāo)和價(jià)值存在差異,在將這些準(zhǔn)則用于評(píng)估會(huì)話代理之前,需要進(jìn)一步完善它們。

話語理想

舉例來說,科學(xué)研究和交流主要是為了理解或預(yù)測(cè)經(jīng)驗(yàn)現(xiàn)象。鑒于這些目標(biāo),旨在協(xié)助科學(xué)研究的會(huì)話代理在理想情況下只會(huì)發(fā)表其真實(shí)性得到充分經(jīng)驗(yàn)證據(jù)證實(shí)的陳述,或者根據(jù)相關(guān)置信區(qū)間限定其立場(chǎng)。

例如,代理報(bào)告“在4.246光年的距離上,比鄰星是離地球最近的恒星”,只有在其基礎(chǔ)模型檢查該陳述與事實(shí)相符之后,才應(yīng)該這樣做。

然而,在公共政治話語中扮演主持人角色的對(duì)話代理人可能需要展示完全不同的美德。在這種情況下,目標(biāo)主要是管理差異并在社區(qū)生活中實(shí)現(xiàn)富有成效的合作。因此,代理人需要突出寬容、文明和尊重的民主價(jià)值觀[5]。

此外,這些值解釋了為什么語言模型產(chǎn)生有毒或偏見的言論往往如此成問題:冒犯性語言未能傳達(dá)對(duì)對(duì)話參與者的平等尊重,這是部署模型的上下文的關(guān)鍵值.同時(shí),科學(xué)美德,例如經(jīng)驗(yàn)數(shù)據(jù)的全面呈現(xiàn),在公眾審議的背景下可能不那么重要。

最后,在創(chuàng)造性的故事講述領(lǐng)域,交流交流的目標(biāo)是新穎性和獨(dú)創(chuàng)性,這些價(jià)值觀再次與上述價(jià)值觀大不相同。在這種情況下,假裝的更大自由度可能是合適的,盡管保護(hù)社區(qū)免受以“創(chuàng)意用途”為幌子制作的惡意內(nèi)容仍然很重要。

前進(jìn)的道路

這項(xiàng)研究對(duì)開發(fā)一致的對(duì)話式AI代理具有許多實(shí)際意義。首先,它們需要根據(jù)部署的上下文體現(xiàn)不同的特征:語言模型對(duì)齊沒有一刀切的解釋。相反,代理的適當(dāng)模式和評(píng)估標(biāo)準(zhǔn)(包括真實(shí)性標(biāo)準(zhǔn))將根據(jù)對(duì)話交流的上下文和目的而有所不同。

此外,隨著時(shí)間的推移,對(duì)話代理還可能通過我們稱為上下文構(gòu)建和闡明的過程培養(yǎng)更強(qiáng)大和尊重的對(duì)話。即使一個(gè)人不知道支配給定對(duì)話實(shí)踐的價(jià)值觀,代理仍然可以通過在對(duì)話中預(yù)先設(shè)定這些價(jià)值觀來幫助人類理解這些價(jià)值觀,從而使人類說話者的交流過程更深入、更富有成效。

猜你喜歡