国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
AIS夢(mèng)想著電羊嗎?
在框外思考太多
粉碎夢(mèng)
首頁(yè) 科技週邊 IT業(yè)界 為什麼AI會(huì)更頻繁地進(jìn)行Hallucin,我們?nèi)绾瓮V顾?/span>

為什麼AI會(huì)更頻繁地進(jìn)行Hallucin,我們?nèi)绾瓮V顾?/h1> Jul 08, 2025 am 01:44 AM


為什麼AI會(huì)更頻繁地進(jìn)行Hallucin,我們?nèi)绾瓮V顾?></p>
<p><u>人工智能</u>(AI)越先進(jìn),它越傾向於“幻覺”並提供錯(cuò)誤或不準(zhǔn)確的信息。</p>
<p>根據(jù)Openai的<u>研究</u>,當(dāng)使用PersonQA基準(zhǔn)測(cè)試時(shí),其最新和強(qiáng)大的推理模型(O3和O4-Mini)分別降低了33%和48%的幻覺率。這是較舊的O1模型中看到的速率的兩倍以上。儘管與早期版本相比,O3提供了更準(zhǔn)確的響應(yīng),但它也顯示出更高的幻覺趨勢(shì)。</p>
<p> IEEE成員兼AI倫理工程師<u>Eleanor Watson</u>表示,這種趨勢(shì)引起了人們對(duì)大語(yǔ)言模型(LLM)(LLM)(例如AI Chatbots)的準(zhǔn)確性和可靠性的擔(dān)憂。</p>
<p>沃森告訴《 Live Science》:“當(dāng)系統(tǒng)產(chǎn)生捏造的信息(例如虛構(gòu)的事實(shí),引用或事件),其與事實(shí)內(nèi)容相同的流利性和連貫性時(shí),它會(huì)以微妙但重要的方式誤導(dǎo)用戶。”</p>
<p><strong>相關(guān):</strong> <u><strong>openai和Deepseek體驗(yàn)的尖端AI模型在面臨過於復(fù)雜的問題時(shí)“完全崩潰”,研究發(fā)現(xiàn)</strong></u></p>
<p>專家強(qiáng)調(diào),這個(gè)幻覺問題強(qiáng)調(diào)了仔細(xì)評(píng)估和監(jiān)視LLM和推理模型產(chǎn)生的輸出的重要性。</p>
<h2 id= AIS夢(mèng)想著電羊嗎?

推理模型的關(guān)鍵特徵是它通過將其分解為較小的部分並製定解決每個(gè)策略來(lái)解決複雜任務(wù)的能力。與僅依靠統(tǒng)計(jì)概率產(chǎn)生答案的模型不同,推理模型創(chuàng)建了與人類思維類似的問題解決策略。

為了註冊(cè)AI生成創(chuàng)意和潛在新穎的解決方案的Live Science Daily新聞通訊訂單,它必須參與某種水平的幻覺 - 否則,它將僅限於反省已經(jīng)學(xué)到的數(shù)據(jù)。

Vectra AI的AI研究員Sohrob Kazerounian在接受Live Science採(cǎi)訪時(shí)說:“了解幻覺不是幻覺,而是AI的特徵,而是AI的特徵?!?“正如同事曾經(jīng)說過的那樣,'LLM產(chǎn)生的一切都是幻覺。這只是其中一些幻覺恰好是真的。'如果AI僅生成了培訓(xùn)期間看到的確切副本,那麼AI將不過是大規(guī)模的搜索引擎。”

“這意味著只編寫以前寫過的代碼,只發(fā)現(xiàn)已經(jīng)知道的屬性的分子,並僅回答以前被問到的家庭作業(yè)問題。您將無(wú)法要求LLM為圍繞AI奇異性的概念專輯寫歌詞,結(jié)合了Snoop Dogg和Bob Dylan的風(fēng)格?!?/p>

有效地,LLMS和他們權(quán)力的AI系統(tǒng)需要幻覺才能產(chǎn)生原始內(nèi)容,而不是簡(jiǎn)單地重複現(xiàn)有知識(shí)。從概念上講,這類似於人類夢(mèng)想或想像場(chǎng)景引發(fā)新想法。

在框外思考太多

但是,當(dāng)目標(biāo)是傳遞精確和正確的信息時(shí), AI幻覺就會(huì)成為問題,尤其是當(dāng)用戶接受無(wú)驗(yàn)證的輸出時(shí)。

沃森解釋說:“這在事實(shí)準(zhǔn)確性至關(guān)重要的領(lǐng)域尤其令人關(guān)注,例如醫(yī)學(xué),法律或金融?!?“儘管更高級(jí)的模型可能會(huì)減少明顯的事實(shí)錯(cuò)誤,但幻覺的微妙形式仍然存在。隨著時(shí)間的流逝,這些捏造會(huì)破壞對(duì)AI系統(tǒng)的信任,並且當(dāng)用戶對(duì)未驗(yàn)證的信息採(cǎi)取行動(dòng)時(shí),可能會(huì)導(dǎo)致現(xiàn)實(shí)世界中的傷害?!?/p>

此外,隨著AI技術(shù)的進(jìn)展,這一挑戰(zhàn)似乎也會(huì)增長(zhǎng)。沃森指出:“隨著模型的改善,錯(cuò)誤通常變得不那麼明顯,但很難檢測(cè)到?!?“現(xiàn)在被捏造的內(nèi)容嵌入了令人信服的敘述和邏輯推理鏈中。這造成了獨(dú)特的危險(xiǎn):用戶可能沒有意識(shí)到存在錯(cuò)誤,並且可以將輸出視為確定性。該問題從濾除明顯的錯(cuò)誤到識(shí)別出僅在仔細(xì)檢查下浮出水面的細(xì)微扭曲而轉(zhuǎn)變?!?/p>

Kazerounian支持這種觀點(diǎn)。他說:“儘管對(duì)AI幻覺會(huì)隨著時(shí)間的流逝而逐漸減少,但有證據(jù)表明,較新的推理模型實(shí)際上可能比簡(jiǎn)單的幻覺更頻繁地幻覺,而且對(duì)為什麼會(huì)發(fā)生這種情況尚無(wú)共識(shí)?!?/p>

由於難以理解LLM如何得出結(jié)論,這種情況與我們?nèi)匀徊煌耆斫馊四X的功能相似,這使情況更加複雜。

AI Company Anthropic的首席執(zhí)行官Dario Amodei在最近的一篇文章中指出,關(guān)於AIS如何產(chǎn)生響應(yīng)缺乏透明度。他寫道:“當(dāng)生成性AI總結(jié)了財(cái)務(wù)文件時(shí),我們對(duì)為什麼要做出特定的單詞選擇或?yàn)槭颤N偶爾會(huì)出錯(cuò),儘管通常是正確的。”

Kazerounian強(qiáng)調(diào),AI產(chǎn)生虛假信息的後果已經(jīng)非常真實(shí)。他說:“沒有可靠的方法可以確保LLM正確回答有關(guān)它可以訪問的任何給定數(shù)據(jù)集的問題?!?“不存在參考,客戶服務(wù)聊天機(jī)器人發(fā)明公司政策和其他不準(zhǔn)確的實(shí)例現(xiàn)在令人震驚?!?/p>

粉碎夢(mèng)

Kazerounian和Watson都告訴Live Science,完全消除AI幻覺可能很困難。但是,可能有一些方法可以減少其影響。

沃森(Watson)提出,將模型的輸出與已驗(yàn)證的外部知識(shí)源聯(lián)繫起來(lái)的“檢索增強(qiáng)的一代”可以幫助實(shí)現(xiàn)事實(shí)數(shù)據(jù)中的AI生成的內(nèi)容。

沃森解釋說:“另一種策略涉及構(gòu)建模型的推理過程。通過提示驗(yàn)證自己的輸出,比較不同的觀點(diǎn)或遵循邏輯步驟,腳手架推理框架最大程度地減少了未檢查的猜測(cè)並提高一致性?!彼a(bǔ)充說,這可以通過旨在鼓勵(lì)模型優(yōu)先級(jí)準(zhǔn)確性的培訓(xùn)方法來(lái)支持,並加強(qiáng)對(duì)人或AI評(píng)估者的學(xué)習(xí),以促進(jìn)更多紀(jì)律和基於事實(shí)的響應(yīng)。

以上是為什麼AI會(huì)更頻繁地進(jìn)行Hallucin,我們?nèi)绾瓮V顾康脑敿?xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁(yè)開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)程式碼編輯軟體(SublimeText3)

開發(fā)人員的快捷方式到您的Udemy樣平臺(tái) 開發(fā)人員的快捷方式到您的Udemy樣平臺(tái) Jun 17, 2025 pm 04:43 PM

在開發(fā)類似於Udemy的學(xué)習(xí)平臺(tái)時(shí),重點(diǎn)不僅僅是內(nèi)容質(zhì)量。同樣重要的是如何交付內(nèi)容。這是因?yàn)楝F(xiàn)代教育平臺(tái)依賴於媒體,快速且易於消化。

用於購(gòu)買SSL證書的經(jīng)濟(jì)有效的轉(zhuǎn)售商平臺(tái) 用於購(gòu)買SSL證書的經(jīng)濟(jì)有效的轉(zhuǎn)售商平臺(tái) Jun 25, 2025 am 08:28 AM

在一個(gè)在線信任不可談判的世界中,SSL證書對(duì)於每個(gè)網(wǎng)站都至關(guān)重要。 SSL認(rèn)證的市場(chǎng)規(guī)模在2024年價(jià)值56億美元,並且由於電子商務(wù)業(yè)務(wù)的激增而推動(dòng)了強(qiáng)勁的增長(zhǎng)

SaaS的5個(gè)最佳支付門戶:您的最終指南 SaaS的5個(gè)最佳支付門戶:您的最終指南 Jun 29, 2025 am 08:28 AM

付款網(wǎng)關(guān)是付款過程的關(guān)鍵組成部分,使企業(yè)能夠在線接受付款。它充當(dāng)客戶與商人之間的橋樑,安全地傳輸付款信息並促進(jìn)交易。 為了

由於新的Microsoft AI型號(hào) 由於新的Microsoft AI型號(hào) Jul 05, 2025 am 12:44 AM

一種新的人工智能(AI)模型已經(jīng)證明了比幾個(gè)使用最廣泛使用的全球預(yù)測(cè)系統(tǒng)更快,更精確地預(yù)測(cè)重大天氣事件的能力。該名為Aurora的模型已接受過培訓(xùn)。

新研究聲稱AI比我們更好地'理解”情緒。特別是在情感上充滿電的情況下 新研究聲稱AI比我們更好地'理解”情緒。特別是在情感上充滿電的情況下 Jul 03, 2025 pm 05:48 PM

在我們認(rèn)為人類始終超越機(jī)器的領(lǐng)域的另一個(gè)挫折中,研究人員現(xiàn)在建議AI比我們更好地理解情感。研究人員發(fā)現(xiàn)人工智能證明了一個(gè)

您的設(shè)備餵養(yǎng)AI助手並收集個(gè)人數(shù)據(jù),即使他們睡著了。這是如何知道您分享的內(nèi)容。 您的設(shè)備餵養(yǎng)AI助手並收集個(gè)人數(shù)據(jù),即使他們睡著了。這是如何知道您分享的內(nèi)容。 Jul 05, 2025 am 01:12 AM

不管喜歡與否,人工智能已成為日常生活的一部分。許多設(shè)備(包括電動(dòng)剃須刀和牙刷)已成為AI驅(qū)動(dòng)的“使用機(jī)器學(xué)習(xí)算法來(lái)跟蹤一個(gè)人的使用方式,Devi的方式

高級(jí)AI型號(hào)的CO&#8322;回答相同問題時(shí)的排放量比更常見的LLM 高級(jí)AI型號(hào)的CO&#8322;回答相同問題時(shí)的排放量比更常見的LLM Jul 06, 2025 am 12:37 AM

根據(jù)最近的一項(xiàng)研究,我們?cè)噲D使AI模型的功能越精確,其碳排放量就越大 - 某些提示產(chǎn)生的二氧化碳比其他提示高達(dá)50倍。

See all articles