国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
AIS夢想著電羊嗎?
在框外思考太多
粉碎夢
首頁 科技周邊 IT業(yè)界 為什么AI會更頻繁地進行Hallucin,我們?nèi)绾瓮V顾?/span>

為什么AI會更頻繁地進行Hallucin,我們?nèi)绾瓮V顾?/h1> Jul 08, 2025 am 01:44 AM


為什么AI會更頻繁地進行Hallucin,我們?nèi)绾瓮V顾?></p>
<p><u>人工智能</u>(AI)越先進,它越傾向于“幻覺”并提供錯誤或不準確的信息。</p>
<p>根據(jù)Openai的<u>研究</u>,當使用PersonQA基準測試時,其最新和強大的推理模型(O3和O4-Mini)分別降低了33%和48%的幻覺率。這是較舊的O1模型中看到的速率的兩倍以上。盡管與早期版本相比,O3提供了更準確的響應,但它也顯示出更高的幻覺趨勢。</p>
<p> IEEE成員兼AI倫理工程師<u>Eleanor Watson</u>表示,這種趨勢引起了人們對大語言模型(LLM)(LLM)(例如AI Chatbots)的準確性和可靠性的擔憂。</p>
<p>沃森告訴《 Live Science》:“當系統(tǒng)產(chǎn)生捏造的信息(例如虛構(gòu)的事實,引用或事件),其與事實內(nèi)容相同的流利性和連貫性時,它會以微妙但重要的方式誤導用戶?!?/p>
<p><strong>相關:</strong> <u><strong>openai和Deepseek體驗的尖端AI模型在面臨過于復雜的問題時“完全崩潰”,研究發(fā)現(xiàn)</strong></u></p>
<p>專家強調(diào),這個幻覺問題強調(diào)了仔細評估和監(jiān)視LLM和推理模型產(chǎn)生的輸出的重要性。</p>
<h2 id= AIS夢想著電羊嗎?

推理模型的關鍵特征是它通過將其分解為較小的部分并制定解決每個策略來解決復雜任務的能力。與僅依靠統(tǒng)計概率產(chǎn)生答案的模型不同,推理模型創(chuàng)建了與人類思維類似的問題解決策略。

為了注冊AI生成創(chuàng)意和潛在新穎的解決方案的Live Science Daily新聞通訊訂單,它必須參與某種水平的幻覺 - 否則,它將僅限于反省已經(jīng)學到的數(shù)據(jù)。

Vectra AI的AI研究員Sohrob Kazerounian在接受Live Science采訪時說:“了解幻覺不是幻覺,而是AI的特征,而是AI的特征?!?“正如同事曾經(jīng)說過的那樣,'LLM產(chǎn)生的一切都是幻覺。這只是其中一些幻覺恰好是真的。'如果AI僅生成了培訓期間看到的確切副本,那么AI將不過是大規(guī)模的搜索引擎?!?/p>

“這意味著只編寫以前寫過的代碼,只發(fā)現(xiàn)已經(jīng)知道的屬性的分子,并僅回答以前被問到的家庭作業(yè)問題。您將無法要求LLM為圍繞AI奇異性的概念專輯寫歌詞,結(jié)合了Snoop Dogg和Bob Dylan的風格?!?/p>

有效地,LLMS和他們權(quán)力的AI系統(tǒng)需要幻覺才能產(chǎn)生原始內(nèi)容,而不是簡單地重復現(xiàn)有知識。從概念上講,這類似于人類夢想或想象場景引發(fā)新想法。

在框外思考太多

但是,當目標是傳遞精確和正確的信息時, AI幻覺就會成為問題,尤其是當用戶接受無驗證的輸出時。

沃森解釋說:“這在事實準確性至關重要的領域尤其令人關注,例如醫(yī)學,法律或金融?!?“盡管更高級的模型可能會減少明顯的事實錯誤,但幻覺的微妙形式仍然存在。隨著時間的流逝,這些捏造會破壞對AI系統(tǒng)的信任,并且當用戶對未驗證的信息采取行動時,可能會導致現(xiàn)實世界中的傷害?!?/p>

此外,隨著AI技術的進展,這一挑戰(zhàn)似乎也會增長。沃森指出:“隨著模型的改善,錯誤通常變得不那么明顯,但很難檢測到?!?“現(xiàn)在被捏造的內(nèi)容嵌入了令人信服的敘述和邏輯推理鏈中。這造成了獨特的危險:用戶可能沒有意識到存在錯誤,并且可以將輸出視為確定性。該問題從濾除明顯的錯誤到識別出僅在仔細檢查下浮出水面的細微扭曲而轉(zhuǎn)變?!?/p>

Kazerounian支持這種觀點。他說:“盡管對AI幻覺會隨著時間的流逝而逐漸減少,但有證據(jù)表明,較新的推理模型實際上可能比簡單的幻覺更頻繁地幻覺,而且對為什么會發(fā)生這種情況尚無共識。”

由于難以理解LLM如何得出結(jié)論,這種情況與我們?nèi)匀徊煌耆斫馊四X的功能相似,這使情況更加復雜。

AI Company Anthropic的首席執(zhí)行官Dario Amodei在最近的一篇文章中指出,關于AIS如何產(chǎn)生響應缺乏透明度。他寫道:“當生成性AI總結(jié)了財務文件時,我們對為什么要做出特定的單詞選擇或為什么偶爾會出錯,盡管通常是正確的?!?/p>

Kazerounian強調(diào),AI產(chǎn)生虛假信息的后果已經(jīng)非常真實。他說:“沒有可靠的方法可以確保LLM正確回答有關它可以訪問的任何給定數(shù)據(jù)集的問題?!?“不存在參考,客戶服務聊天機器人發(fā)明公司政策和其他不準確的實例現(xiàn)在令人震驚。”

粉碎夢

Kazerounian和Watson都告訴Live Science,完全消除AI幻覺可能很困難。但是,可能有一些方法可以減少其影響。

沃森(Watson)提出,將模型的輸出與已驗證的外部知識源聯(lián)系起來的“檢索增強的一代”可以幫助實現(xiàn)事實數(shù)據(jù)中的AI生成的內(nèi)容。

沃森解釋說:“另一種策略涉及構(gòu)建模型的推理過程。通過提示驗證自己的輸出,比較不同的觀點或遵循邏輯步驟,腳手架推理框架最大程度地減少了未檢查的猜測并提高一致性?!彼a充說,這可以通過旨在鼓勵模型優(yōu)先級準確性的培訓方法來支持,并加強對人或AI評估者的學習,以促進更多紀律和基于事實的響應。

以上是為什么AI會更頻繁地進行Hallucin,我們?nèi)绾瓮V顾??的詳細?nèi)容。更多信息請關注PHP中文網(wǎng)其他相關文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻,版權(quán)歸原作者所有,本站不承擔相應法律責任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動的應用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機

Video Face Swap

Video Face Swap

使用我們完全免費的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級代碼編輯軟件(SublimeText3)

熱門話題

Laravel 教程
1600
29
PHP教程
1502
276
ai不斷地'幻覺”,但是有一個解決方案 ai不斷地'幻覺”,但是有一個解決方案 Jul 07, 2025 am 01:26 AM

大型技術實驗人工智能(AI)的主要關注點并不是它可能主導人類。真正的問題在于大語言模型(LLMS)的持續(xù)不準確性,例如Open AI的Chatgpt,Google的Gemini和

在網(wǎng)絡攻擊M&S和合作社的網(wǎng)絡攻擊背后捕獲了狩獵者的逮捕 在網(wǎng)絡攻擊M&S和合作社的網(wǎng)絡攻擊背后捕獲了狩獵者的逮捕 Jul 11, 2025 pm 01:36 PM

英國國家犯罪局(NCA)逮捕了四名涉嫌參與針對Marks和Spencer(M&S),合作社和Harrods的網(wǎng)絡攻擊的人

研究表明,當問題變得太困難時 研究表明,當問題變得太困難時 Jul 07, 2025 am 01:02 AM

人工智能(AI)推理模型并不像看起來那樣能力。實際上,根據(jù)Apple的研究人員的說法,當任務變得過于復雜時,它們的表現(xiàn)會完全崩潰。

Quantum Pryptography現(xiàn)在是網(wǎng)絡安全領導者的首要思想 Quantum Pryptography現(xiàn)在是網(wǎng)絡安全領導者的首要思想 Jul 11, 2025 pm 01:38 PM

Quantum加密術已成為網(wǎng)絡安全領導者的重中之重,但最近的研究表明,某些組織并沒有以其要求對待威脅。QuantumComputers最終能夠解決T

勒索軟件攻擊具有巨大的財務影響&ndash;但是Ciso擔心仍然阻止公司付款 勒索軟件攻擊具有巨大的財務影響&ndash;但是Ciso擔心仍然阻止公司付款 Jul 12, 2025 am 12:59 AM

根據(jù)最近的一項調(diào)查,勒索軟件攻擊帶來了450萬美元的平均恢復成本,該調(diào)查還發(fā)現(xiàn),過去一年中,許多企業(yè)受到了惡意軟件的影響。

Red Hat可以讓開發(fā)人員自由訪問Rhel&ndash;您需要知道的 Red Hat可以讓開發(fā)人員自由訪問Rhel&ndash;您需要知道的 Jul 13, 2025 am 12:49 AM

Red Hat推出了一個新的自助服務平臺,旨在更容易訪問其開發(fā)人員計劃。紅帽企業(yè)Linux for Business Developers Initiative旨在幫助開發(fā)團隊建立,測試和部署

不要選擇錯誤的網(wǎng)絡團隊 不要選擇錯誤的網(wǎng)絡團隊 Jul 08, 2025 am 01:39 AM

投資新網(wǎng)站或數(shù)字平臺對于任何企業(yè)來說都是關鍵的。無論您是在開設一家初創(chuàng)公司,重建舊網(wǎng)站還是通過新的電子商務商店擴大覆蓋范圍,您選擇使您的愿景栩栩如生的團隊可以做到或

See all articles