国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

ホームページ テクノロジー周辺機(jī)器 AI DeepGemmはDeepseekオープンソースウィークの3日目にリリースされました

DeepGemmはDeepseekオープンソースウィークの3日目にリリースされました

Mar 03, 2025 pm 06:58 PM

deepseekリリースdeepgemm:ai

の高性能FP8GEMMライブラリ ? #opensourceweekの3日目:deepgemm

deepgemmの導(dǎo)入 - 密集したgemmsとmoe gemmsをサポートするFP8 GEMMライブラリ、V3/R1のトレーニングと推論を強(qiáng)化します。

hopper gpus上の最大1350 fp8 tflops

oly使いやすいように設(shè)計(jì)された最小限の依存関係

compilent完全にコンパイルされています…

- deepseek(@deepseek_ai)2025年2月26日

このリリースは、Deepseek FlashML(1日目)とDeepseek Deepep(2日目)の発売の成功に続きます。

目次

gemmとは?

fp8?
    とは何ですか
  • deepgemm
  • の必要性 DeepGemmの重要な機(jī)能
  • パフォーマンスベンチマーク
  • インストール手順
  • 結(jié)論
  • gemmとは?

一般的なマトリックス乗算(GEMM)は、2つのマトリックスを増やして3分の1を生成する基本的な線形代數(shù)操作です。 多數(shù)のアプリケーションで広く使用されており、その式は次のとおりです

GEMMは、特にニューラルネットワークトレーニングと推論のための深い學(xué)習(xí)において、モデルのパフォーマンスの最適化に重要です。

DeepGEMM Released on Day 3 of DeepSeek Open Source Week

このイラストは、最適化されたキャッシュ利用のために、タイル(マトリックスを小さなブロック、ntile、ktile)に強(qiáng)調(diào)するGEMMを示しています。 これにより、データの局所性と並列性が強(qiáng)化されたパフォーマンスが向上します

fp8?

DeepGEMM Released on Day 3 of DeepSeek Open Source Weekとは何ですか

FP8(8ビットフローティングポイント)は、高性能コンピューティング形式であり、精度と効率的な數(shù)値データ表現(xiàn)を削減します。 機(jī)械學(xué)習(xí)における大規(guī)模なデータセットの計(jì)算需要を処理するのに特に有益です。

典型的なFP8形式には次のものが含まれます

1サインビット 5指數(shù)ビット

2分?jǐn)?shù)ビット

このコンパクトな構(gòu)造により、大規(guī)模なモデルのトレーニングに最適な、より速い計(jì)算とメモリの使用量が減少する可能性があります。 精度はわずかに損なわれる可能性がありますが、これはしばしば受け入れられ、計(jì)算オーバーヘッドの減少によりパフォーマンスの向上につながります。

  • この畫像は、FP8(E4M3およびE5M2形式)とFP16およびBF16を比較し、異なる浮動(dòng)小數(shù)點(diǎn)形式の精度と範(fàn)囲のトレードオフを示しています。

    deepgemm

    の必要性 DeepGEMMは、多様なGEMM操作のために軽量で高性能でユーザーフレンドリーなライブラリを提供することにより、マトリックスの乗算の課題に対処します。

    AIコミュニティで最適化されたFP8 GEMMの重要な必要性を満たします。 小さなメモリフットプリントを備えた高性能

    • 密度とMOEの両方のレイアウトをサポートしています。
    • 大規(guī)模なAIモデルのトレーニングと実行には
    • 重要です。
    • 専用のGEMMタイプを使用してMoEアーキテクチャを最適化します
    • DeepSeekのAIモデルを直接強(qiáng)化します
    • より広範(fàn)なAI開発エコシステムに利益をもたらします。
    • deepgemm
    • の重要な機(jī)能
    • deepgemmの強(qiáng)みには以下が含まれます

    ハイパフォーマンス:nvidiaホッパーgpusで最大1350 fp8 tflopsを達(dá)成します。

    軽量設(shè)計(jì):
      単純化された使用のための最小依存関係。
    • ジャストインタイムコンピレーション:
    • 合理化されたユーザーエクスペリエンスのために、実行時(shí)にカーネルをコンパイルします。
    • 簡(jiǎn)潔なコアロジック:コアコードの約300行、多くのエキスパートチューニングされたカーネルを上回る。
    • 多様なレイアウトのサポート:
    • サポート:密集したMOEレイアウトと2つのMOEレイアウト。
    • パフォーマンスベンチマーク さまざまなマトリックス構(gòu)成にわたるDeepGEMMの効率を以下に示します:

    カスタムスタイル

    / .custom-table { 幅:100%; 國(guó)境崩壊:崩壊; /

    境界線が2倍にならないようにします

    / マージン:20px 0; } .custom-tableth、.custom-table td { 國(guó)境:1pxソリッド#000; /可視境界 パディング:12px; /快適なパディング/ テキストアライグ:センター; /中央のテキスト

    / } .custom-tableth { バックグラウンドカラー:#f8f9fa; /ヘッダーの明るい灰色/ font-weight:bold; } /レスポンシブ調(diào)整/ @media(max-width:768px){ .custom-tableth、.custom-table td { フォントサイズ:14px; /小さな畫面上の小さなテキスト/ パディング:8px; } }

    表1:deepgemmパフォーマンスベンチマーク

    インストール手順

    deepgemmのインストールは簡(jiǎn)単です:

    ステップ1:前提條件

    • ホッパーアーキテクチャgpus(SM_90A)
    • python 3.8
    • cuda 12.3(推奨:12.8)
    • pytorch 2.1
    • cutlass 3.6(gitサブモジュールにすることができます)

    ステップ2:リポジトリをクローン

    git clone --recursive [email?protected]:deepseek-ai/DeepGEMM.git

    ステップ3:ライブラリをインストールします

    python setup.py install

    ステップ4:deepgemmをインポート

    import deep_gemm

    詳細(xì)な手順については、DeepGEMM GitHubリポジトリを參照してください

    結(jié)論

    DeepGEMMは、高度な機(jī)械學(xué)習(xí)タスクに最適な高性能で使いやすいFP8 GEMMライブラリです。 その軽量設(shè)計(jì)、速度、柔軟性により、AI開発者にとって貴重なツールになります。 Deepseekの4日目のリリースに関する最新情報(bào)については、Analytics Vidhyaブログを確認(rèn)してください!

以上がDeepGemmはDeepseekオープンソースウィークの3日目にリリースされましたの詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國(guó)語 Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明
この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見つけた場(chǎng)合は、admin@php.cn までご連絡(luò)ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脫衣畫像を無料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

寫真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡(jiǎn)単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中國(guó)語版

SublimeText3 中國(guó)語版

中國(guó)語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強(qiáng)力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

トップ7ノートブックルムの代替 トップ7ノートブックルムの代替 Jun 17, 2025 pm 04:32 PM

GoogleのNoteBookLMは、Gemini 2.5を搭載したスマートAIノートテイキングツールであり、ドキュメントの要約に優(yōu)れています。ただし、ソースキャップ、クラウド依存、最近の「発見」機(jī)能など、ツールの使用にはまだ制限があります。

採(cǎi)用から利點(diǎn)まで:2025年にエンタープライズLLMを形作る10のトレンド 採(cǎi)用から利點(diǎn)まで:2025年にエンタープライズLLMを形作る10のトレンド Jun 20, 2025 am 11:13 AM

エンタープライズAIランドスケープを再構(gòu)築する10の説得力のある傾向があります。LLMSORGANIZATIONSへの財(cái)政的コミットメントは、LLMSへの投資を大幅に増加させており、72%が今年の支出が増加することを期待しています?,F(xiàn)在、ほぼ40%a

AI投資家は停滯していますか? AIベンダーと購(gòu)入、構(gòu)築、またはパートナーになる3つの戦略的なパス AI投資家は停滯していますか? AIベンダーと購(gòu)入、構(gòu)築、またはパートナーになる3つの戦略的なパス Jul 02, 2025 am 11:13 AM

投資は活況を呈していますが、資本だけでは十分ではありません。評(píng)価が上昇し、獨(dú)特の衰退があるため、AIに焦點(diǎn)を當(dāng)てたベンチャーファンドの投資家は、優(yōu)位性を獲得するために購(gòu)入、構(gòu)築、またはパートナーの重要な決定を下す必要がありますか?各オプションを評(píng)価する方法とpr

生成AIの止められない成長(zhǎng)(AI Outlookパート1) 生成AIの止められない成長(zhǎng)(AI Outlookパート1) Jun 21, 2025 am 11:11 AM

開示:私の會(huì)社であるTirias Researchは、IBM、Nvidia、およびこの記事で述べた他の企業(yè)に相談しました。成長(zhǎng)ドライバー生成AI採(cǎi)用の急増は、最も楽観的な予測(cè)でさえ予測(cè)できるよりも劇的でした。次に、a

新しいギャラップレポート:AI文化の準(zhǔn)備が新しいマインドセットを要求します 新しいギャラップレポート:AI文化の準(zhǔn)備が新しいマインドセットを要求します Jun 19, 2025 am 11:16 AM

広範(fàn)囲にわたる採(cǎi)用と感情的な準(zhǔn)備のギャップは、人間が成長(zhǎng)しているデジタルコンパニオンの配列にどのように関與しているかについて不可欠な何かを明らかにしています。アルゴリズムが毎日のライブに織り込む共存の段階に入っています

これらのスタートアップは、企業(yè)がAI検索の概要に登場(chǎng)するのを支援しています これらのスタートアップは、企業(yè)がAI検索の概要に登場(chǎng)するのを支援しています Jun 20, 2025 am 11:16 AM

AIのおかげで、それらの日は番號(hào)が付けられています。 1つのスタッドによると、Googleのようなサイトでの検索の60%がユーザーがリンクをクリックしていないため、旅行サイトKayakやEdtech Company Cheggなどの企業(yè)の検索トラフィックが減少しています。

AGIとAIのスーパーインテリジェンスは、人間の天井の仮定の障壁に急激に衝突するでしょう AGIとAIのスーパーインテリジェンスは、人間の天井の仮定の障壁に急激に衝突するでしょう Jul 04, 2025 am 11:10 AM

それについて話しましょう。 革新的なAIブレークスルーのこの分析は、さまざまなインパクトのあるAIの複雑さの特定と説明など、最新のAIで進(jìn)行中のForbes列のカバレッジの一部です(こちらのリンクを參照)。 アギに向かっています

Ciscoは、Cisco Live U.S. 2025でそのエージェントAIジャーニーをチャートします Ciscoは、Cisco Live U.S. 2025でそのエージェントAIジャーニーをチャートします Jun 19, 2025 am 11:10 AM

私が最も重要だと思ったものと、Ciscoがその野心をさらに実現(xiàn)するための現(xiàn)在の取り組みにどのように構(gòu)築されるかを詳しく見てみましょう。

See all articles