為什么公司故意向AI植入數(shù)據(jù)

沃卡惠
行業(yè)資訊
2024-04-17 09:36:31
197

簡(jiǎn)單地說(shuō)，AI引擎有兩個(gè)組件，第一個(gè)是一個(gè)廣泛的內(nèi)容數(shù)據(jù)庫(kù)，稱為大型語(yǔ)言模型，其中包含了這家AI公司可以找到的所有信息，這包括維基百科、《紐約時(shí)報(bào)》和其他可公開獲取的內(nèi)容。(關(guān)于侵犯版權(quán)的爭(zhēng)議很嚴(yán)重，而且越來(lái)越多，但這是另一個(gè)話題)

AI引擎的第二個(gè)組件是使用LLM數(shù)據(jù)來(lái)編寫對(duì)查詢的響應(yīng)的算法。如果我讓AI引擎完成句子，“The Dog Run Up The…”，算法會(huì)檢查L(zhǎng)LM，看看這個(gè)片段已經(jīng)存在的頻率以及通常完成句子的單詞。然后，它向用戶提供統(tǒng)計(jì)上最有可能的下一個(gè)單詞。在這種情況下，“Hill”是典型的回答，而“casserole”不是。

一家試圖利用AI的公司可以從提問開始。例如，一家服裝公司可能會(huì)問：“男鞋的最新趨勢(shì)是什么?”然而，只要問這個(gè)問題，AI引擎就知道這家服裝公司正在考慮推出一款新產(chǎn)品，這是該公司希望對(duì)競(jìng)爭(zhēng)對(duì)手隱瞞的信息。

對(duì)AI的一種更有效的使用是讓該公司上傳一些數(shù)據(jù)——客戶的反應(yīng)或銷售歷史——然后要求AI引擎找到模式，并將它們與其LLM中的任何其他信息進(jìn)行比較。然而，許多AI引擎會(huì)將上傳的公司數(shù)據(jù)添加到他們的LLM中，這樣來(lái)自另一家公司的人如果提出了完全正確的問題，就可以生成揭示這些數(shù)據(jù)的回應(yīng)。盡管大多數(shù)AI公司都有政策和其他保護(hù)措施來(lái)防范這種數(shù)據(jù)泄露，但在最近的幾項(xiàng)研究中，60%-75%的公司已經(jīng)宣布使用AI為非法，因?yàn)樗麄儞?dān)心這些保護(hù)措施不夠。(還有許多其他原因讓公司猶豫不決，但數(shù)據(jù)隱私始終位居榜首)

然而，并不是所有公司都擔(dān)心數(shù)據(jù)隱私。在咨詢公司NextAccess主持的一場(chǎng)討論中，一位與會(huì)者詢問如何故意將企業(yè)數(shù)據(jù)注入LLM，并提高這些數(shù)據(jù)在公開可用的AI算法中的使用。NextAccess是一家咨詢公司，為客戶提供建議，建議他們?nèi)绾胃倪M(jìn)將產(chǎn)品推向市場(chǎng)并推動(dòng)收入增長(zhǎng)的戰(zhàn)略。

這個(gè)人經(jīng)營(yíng)著一家咨詢公司。如果有人向AI引擎提出問題，她的公司的數(shù)據(jù)將改善響應(yīng)，她希望查詢者將她的公司視為智慧的來(lái)源，希望它能推動(dòng)新的客戶互動(dòng)。

將一家公司的智慧和品牌放在信息尋求者面前并不是一個(gè)新概念。搜索引擎優(yōu)化是指使一家公司的網(wǎng)站更容易被谷歌等搜索引擎使用，從而使該公司的網(wǎng)頁(yè)鏈接出現(xiàn)在更多的谷歌查詢中。這種做法催生了一個(gè)由咨詢和技術(shù)公司組成的整個(gè)行業(yè)，這些公司可以幫助品牌設(shè)計(jì)自己的網(wǎng)站，以最大限度地提高對(duì)谷歌掃描工具的可見度。公司甚至可以付錢給谷歌，讓他們的網(wǎng)頁(yè)鏈接出現(xiàn)在相關(guān)查詢的頁(yè)面頂部。重要的是，這些“贊助商”搜索結(jié)果都有清晰的標(biāo)記，這樣互聯(lián)網(wǎng)用戶就能知道哪些谷歌回復(fù)是基于有機(jī)內(nèi)容，哪些是基于企業(yè)支付。

谷歌訓(xùn)練我們所有人知道，其搜索引擎的結(jié)果不一定會(huì)給出正確的——甚至是最好的——答案。對(duì)于網(wǎng)絡(luò)搜索者來(lái)說(shuō)，點(diǎn)擊多個(gè)鏈接搜索源網(wǎng)站已經(jīng)成為一種正常的、意料之中的例行公事。

AI引擎的用戶目前有不同的期望。他們假設(shè)AI引擎正在提供可能的最佳答案。即使是已知的AI缺陷，如偏見和幻覺，在新的、更強(qiáng)大的AI引擎中也變得不那么頻繁了。用戶對(duì)AI準(zhǔn)確性的信任正在增長(zhǎng)。

額外收入的拉動(dòng)是否會(huì)說(shuō)服AI公司透露一些算法秘密，以創(chuàng)建一個(gè)AI引擎優(yōu)化(AEO)行業(yè)，這樣公司就可以以一種特別容易讓AI公司連接到LLM的方式重新安排數(shù)據(jù)，并增加在對(duì)用戶查詢的AI響應(yīng)中引用該公司的數(shù)據(jù)和品牌的可能性?AI引擎會(huì)向?qū)で蟪霈F(xiàn)在AI回復(fù)中的品牌提供付費(fèi)植入(理想情況下是帶有贊助內(nèi)容的標(biāo)注)嗎?

AI用戶會(huì)有什么反應(yīng)?他們會(huì)喜歡更相關(guān)、更具體的回應(yīng)嗎?或者他們會(huì)質(zhì)疑這家AI公司的客觀性和中立性?這些懸而未決的問題表明，AI既不同于以前的技術(shù)工具，因此還不確定它將走的道路。

到目前為止，我?guī)缀跽也坏疥P(guān)于一家公司如何將其內(nèi)容強(qiáng)制放入LLM，并說(shuō)服AI引擎使用該公司的數(shù)據(jù)(最好是引用來(lái)源)高于其他(同樣有用的)信息來(lái)源的建議。因此，我當(dāng)然會(huì)問這些AI引擎，它們會(huì)受到什么影響來(lái)做到這一點(diǎn)。OpenAI的ChatGPT、谷歌的Gemini和Perplexity.ai都建議公司確保他們的內(nèi)容結(jié)構(gòu)正確、最新并得到可靠來(lái)源的支持，以增加他們的數(shù)據(jù)被包括在AI響應(yīng)中的可能性。這些AI引擎都沒有定義它們?nèi)绾闻袛嘞?lái)源的可靠性。

Pplexity確實(shí)計(jì)劃很快推出一個(gè)基于廣告的AI引擎版本，明確區(qū)分其“客觀”回應(yīng)和支付促銷費(fèi)的公司贊助的回應(yīng)。OpenAI已經(jīng)有一個(gè)由私人實(shí)體使用預(yù)先選擇的數(shù)據(jù)構(gòu)建的聊天機(jī)器人目錄，它計(jì)劃最終通過市場(chǎng)收費(fèi)提供這些數(shù)據(jù)。這將需要用戶主動(dòng)搜索特定的聊天機(jī)器人。谷歌使用Gemini來(lái)提高其在谷歌搜索、谷歌地圖和其他屬性中現(xiàn)有廣告的性能，因此它已經(jīng)間接使用AI來(lái)突出一家公司的內(nèi)容而不是其他公司的內(nèi)容。

然而，這些回應(yīng)都沒有就如何影響公開、開放、廣泛使用的AI引擎版本，以突出單個(gè)公司的數(shù)據(jù)和品牌提供實(shí)質(zhì)性、可操作的指導(dǎo)。

上一篇：AI人工智能如何賦能運(yùn)維ITIL流程

下一篇：虛擬現(xiàn)實(shí)：游戲、人工智能和沉浸式體驗(yàn)的未來(lái)