国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目次
ブラックボックスの中を覗く
ホームページ テクノロジー周辺機(jī)器 IT業(yè)界 OpenaiとDeepseekの最先端のAIモデルは、問題が困難になったときに「完全な崩壊」を受けると、研究が明らかにしています

OpenaiとDeepseekの最先端のAIモデルは、問題が困難になったときに「完全な崩壊」を受けると、研究が明らかにしています

Jul 07, 2025 am 01:02 AM

OpenaiとDeepseekの最先端のAIモデルは、問題が困難になったときに「完全な崩壊」を受けると、研究が明らかにしています

人工知能(AI)推論モデルは、表示ほど能力がありません。 Appleの研究者によると、実際には、タスクが複雑になりすぎると、パフォーマンスが完全に崩壊します。

AnthropicのClaude、OpenaiのO3、DeepseekのR1などの推論モデルは、より多くの時(shí)間と計(jì)算リソースを費(fèi)やして標(biāo)準(zhǔn)モデルと比較してより正確な応答を提供するように設(shè)計(jì)された高度な大規(guī)模な言語モデル(LLM)です。

これらのモデルの出現(xiàn)により、一部の主要なハイテク企業(yè)は、ほとんどの認(rèn)知タスクで人間を上回ることができるシステムを指す人工的な一般情報(bào)(AGI)の達(dá)成に近づいている可能性があるという新たな主張を行うようになりました。

ただし、 AppleのMachine Learning Research Webサイトで6月7日に発行された最近の論文は、これらの主張に挑戦し、競合する企業(yè)に強(qiáng)い反論を提供します。この調(diào)査によると、推論モデルは一般的な推論能力を?qū)g証できないだけでなく、タスクが一定レベルの複雑さに達(dá)すると、推論能力が大幅に低下します。

「さまざまなパズルにわたる広範(fàn)なテストを通じて、主要なLRMSが特定の複雑さのしきい値を超えて完全な精度崩壊を経験することを示しています」と研究者は述べています。 「さらに、予期しないスケーリングの制限を表示します。問題の難易度とともに、推論の努力が増加し、十分なトークン容量が利用可能であっても減少します?!?/p>

LLMは、膨大な量の人間生成データから學(xué)習(xí)することで改善します。これにより、プロンプトが表示されたときに、ニューラルネットワークを通じて確率的パターンを生成できます。

関連: AIは頻繁に「幻覚」しますが、修正があります

ライブサイエンスデイリーニュースレターに今すぐサインアップしてください。推論モデルは、「考え方」として知られる方法を使用してAI精度を強(qiáng)化することを目指しています。これには、人間が論理を適用して問題を解決する方法をシミュレートするマルチステップ応答を生成することが含まれます。

このプロセスにより、チャットボットは推論を確認(rèn)および改良することができ、より正確なより挑戦的なタスクを処理できるようにします。考え方の処理中に、モデルは自然言語でロジックを段階的に明確にし、意思決定プロセスを簡単に追跡できるようにします。

それにもかかわらず、このアプローチは本物の理解ではなく統(tǒng)計(jì)的推論に依存しているため、チャットボットはしばしば誤った答えを生み出し、情報(bào)が不足しているときに物事を補(bǔ)い、時(shí)には奇妙または危険なアドバイスを提供します。

Openaiのテクニカルレポートは、推論モデルが通常のモデルよりも幻覚の影響を特に受けやすく、モデルが進(jìn)化するにつれて問題が悪化することを明らかにしました。

たとえば、個(gè)人に関する事実情報(bào)を要約するように求められた場合、同社のO3およびO4-MINIモデルは、それぞれ以前のO1モデルのわずか16%と比較して、それぞれ33%と48%の誤ったコンテンツを生成しました。 Openaiの當(dāng)局者は、これがなぜ発生するのか確信が持てないことを認(rèn)め、「これらの結(jié)果の原因を理解するには、より多くの研究が必要だ」と述べた。

「これらの問題に関する徹底的な調(diào)査がないことは、現(xiàn)在の評価方法の欠點(diǎn)に起因すると考えています」とAppleの新しい研究の著者は書いています。 「ほとんどの既存の評価は、よく知られている數(shù)學(xué)とコーディングベンチマークを中心にしていますが、これは有用ですが、多くの場合、さまざまな複雑さにわたってデータの汚染に直面し、制御された実験條件を欠いています。さらに、生成された推論パスの構(gòu)造と品質(zhì)に関する洞察を提供しません?!?/p>

ブラックボックスの中を覗く

これらの制限をよりよく理解するために、研究者は、OpenaiのO1とO3、Anthropic's Claude 3.7 Sonnet、およびGoogleのGeminiを含むジェネリックモデルと推論モデルの両方をテストしました。関係する要素の數(shù)を増やすことにより、パズルの複雑さを変える可能性があります。

OpenaiとDeepseekの最先端のAIモデルは、問題が困難になったときに「完全な崩壊」を受けると、研究が明らかにしています

低複合シナリオでは、ジェネリックモデルは、推論チェーンの計(jì)算負(fù)擔(dān)が追加されずに問題を解決することにより、推論モデルよりも優(yōu)れていました。パズルがより複雑になるにつれて、推論モデルが最初に優(yōu)位性を獲得しましたが、この利點(diǎn)は高複雑條件下で完全に消滅しました。

重要なしきい値が交差すると、推論モデルはより少ないトークン(基本単位モデルがデータを分解するために使用する)をより複雑なタスクに割り當(dāng)てることを割り當(dāng)て、より少ない推論に従事し、長い思考チェーンを維持する際に基本的な限界に直面したことを示しています。これらの制限は、正しいソリューションが提供された場合でも持続しました。

「ハノイ塔のソリューションアルゴリズムをモデルに與えたとき、このパズルでのパフォーマンスは改善されませんでした」と著者は述べました。 「さらに、モデルによって行われた最初の誤った動(dòng)きを調(diào)べると、驚くべき行動(dòng)が明らかになりました。たとえば、ハノイの塔で最大100の正しい動(dòng)きを正常に完了することができましたが、川を橫斷するパズルで5つ以上の正しい動(dòng)きを完了するのに苦労しました?!?/p>

以上がOpenaiとDeepseekの最先端のAIモデルは、問題が困難になったときに「完全な崩壊」を受けると、研究が明らかにしていますの詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國語 Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明
この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡(luò)ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脫衣畫像を無料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

寫真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中國語版

SublimeText3 中國語版

中國語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強(qiáng)力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

AIは絶えず「幻覚」しますが、解決策があります AIは絶えず「幻覚」しますが、解決策があります Jul 07, 2025 am 01:26 AM

人工知能(AI)を?qū)g験する大きな技術(shù)に関する主な懸念は、それが人類を支配するかもしれないということではありません。実際の問題は、Open AIのChatGpt、Google's Gemini、その他の大規(guī)模な言語モデル(LLM)の持続的な不正確さにあります。

なぜAIはより頻繁にallucatingしているのですか?どうすればそれを止めることができますか? なぜAIはより頻繁にallucatingしているのですか?どうすればそれを止めることができますか? Jul 08, 2025 am 01:44 AM

より高度な人工知能(AI)が大きくなるほど、「幻覚」し、誤ったまたは不正確な情報(bào)を提供する傾向があります。openaiによる研究に基づいて、その最新かつ強(qiáng)力な推論モデルであるO3とO4-miniが存在するh

M&Sと協(xié)同組合に対するサイバー攻撃の背後にあるハッカーを探して逮捕された逮捕 M&Sと協(xié)同組合に対するサイバー攻撃の背後にあるハッカーを探して逮捕された逮捕 Jul 11, 2025 pm 01:36 PM

英國の國家犯罪庁(NCA)は、マークスとスペンサー(M&S)、協(xié)同組合、およびharrodsを?qū)澫螭趣筏骏单ぅ些`攻撃への関與の疑いがある4人の個(gè)人を逮捕しました。

OpenaiとDeepseekの最先端のAIモデルは、問題が困難になったときに「完全な崩壊」を受けると、研究が明らかにしています OpenaiとDeepseekの最先端のAIモデルは、問題が困難になったときに「完全な崩壊」を受けると、研究が明らかにしています Jul 07, 2025 am 01:02 AM

人工知能(AI)推論モデルは、表示ほど能力がありません。 Anthropic's Claude、Openのような環(huán)境モデルの研究者によると、実際には、タスクが複雑になりすぎると、彼らのパフォーマンスは完全に崩壊します。

ポストカントゥムの暗號化は、サイバーセキュリティリーダーにとって今では最高の心になります ポストカントゥムの暗號化は、サイバーセキュリティリーダーにとって今では最高の心になります Jul 11, 2025 pm 01:38 PM

第四半期の暗號化はサイバーセキュリティのリーダーにとって最優(yōu)先事項(xiàng)となっていますが、最近の研究では、一部の組織が脅威を需要に伴う脅威を扱っていないことが示されています。

ランサムウェア攻撃には大きな財(cái)政的影響があります–しかし、CISOの心配はまだ會(huì)社の支払いを止めるのを止めていません ランサムウェア攻撃には大きな財(cái)政的影響があります–しかし、CISOの心配はまだ會(huì)社の支払いを止めるのを止めていません Jul 12, 2025 am 12:59 AM

ランサムウェア攻撃は、最近の調(diào)査によると、平均回収コストは450萬ドルをもたらします。これは、過去1年間にかなりの數(shù)の企業(yè)がマルウェアの影響を受けていることを発見しました。

Red Hatは開発者にRhel&ndashへの無料アクセスを提供しています。ここに’あなたが知る必要があること Red Hatは開発者にRhel&ndashへの無料アクセスを提供しています。ここに’あなたが知る必要があること Jul 13, 2025 am 12:49 AM

Red Hatは、開発者プログラムに簡単にアクセスできるように設(shè)計(jì)された新しいセルフサービスプラットフォームを?qū)毪筏蓼筏?。RedHatEnterprise Linux for Business Developers Initiativeは、開発チームの構(gòu)築、テスト、展開を支援することを目的としています。

間違ったWebチームを選択しないでください 間違ったWebチームを選択しないでください Jul 08, 2025 am 01:39 AM

新しいWebサイトまたはデジタルプラットフォームへの投資は、あらゆるビジネスにとって極めて重要です。スタートアップを立ち上げたり、レガシーサイトを再構(gòu)築したり、新しいeコマースストアでリーチを拡張したりする場合でも、ビジョンを?qū)g現(xiàn)することができます。

See all articles