国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目次
トレーニング レシピの調(diào)整
ブロック設(shè)計(jì)の最適化
マクロ アーキテクチャ要素の最適化
より深いダウンサンプリング レイヤー
マイクロ設(shè)計(jì)の調(diào)整
ネットワーク アーキテクチャ
ホームページ テクノロジー周辺機(jī)器 AI 1.3ミリ秒には1.3ミリ秒かかります。清華社の最新オープンソース モバイル ニューラル ネットワーク アーキテクチャ RepViT

1.3ミリ秒には1.3ミリ秒かかります。清華社の最新オープンソース モバイル ニューラル ネットワーク アーキテクチャ RepViT

Mar 11, 2024 pm 12:07 PM
iphone 建築 ニューラルネットワーク オープンソース overflow

1.3ms耗時(shí)!清華最新開源移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu) RepViT

ペーパーアドレス: https://arxiv.org/abs/2307.09283

コードアドレス: https:/ /github.com/THU-MIG/RepViT

1.3ms耗時(shí)!清華最新開源移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu) RepViT

RepViT はモバイル ViT アーキテクチャで優(yōu)れたパフォーマンスを発揮し、大きな利點(diǎn)を示します。次に、この研究の貢獻(xiàn)を検討します。

  1. 記事の中で、軽量 ViT は一般的に、視覚タスクにおいて軽量 CNN よりも優(yōu)れたパフォーマンスを発揮します。これは、主にマルチヘッド セルフ アテンション モジュール (MSHA) により、 グローバル表現(xiàn)を?qū)W習(xí)するためのモデル。ただし、軽量 ViT と軽量 CNN のアーキテクチャの違いは十分に研究されていません。
  2. この研究では、著者らは、軽量 ViT の効果的なアーキテクチャの選択を統(tǒng)合することにより、標(biāo)準(zhǔn)的な軽量 CNN (特に MobileNetV3) のモバイル フレンドリー性を徐々に改善しています。 RepViT という軽量 CNN ファミリーです。RepViT は MetaFormer 構(gòu)造を持っていますが、完全に畳み込みで構(gòu)成されていることは注目に値します。
  3. 実験結(jié)果 RepViT## であることが示されています。 # 既存の最先端の軽量 ViT を上回り、ImageNet 分類、COCO-2017 でのオブジェクト検出とインスタンスのセグメンテーション、セマンティックなどのさまざまな視覚タスクにおいて、既存の最先端の軽量 ViT よりも優(yōu)れたパフォーマンスと効率を示します。 ADE20k でのセグメンテーション。特に ImageNet では、RepViTiPhone 12 で最高のパフォーマンスを達(dá)成し、遅延は 1ms 近く、トップ 1 精度以上を達(dá)成しました。 80%、これは軽量モデルにとって最初のブレークスルーです。
わかりました。次に誰もが懸念すべきことは、「

どのようにモデル をこのような低レイテンシで設(shè)計(jì)できるのか、しかし、高い精度が出るのでしょうか?

メソッド

1.3ms耗時(shí)!清華最新開源移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu) RepViT

##ConvNeXt

、作者は厳密な ResNet50 アーキテクチャに基づいています。理論的および実験的な分析を経て、最終的に Swin-Transformer に匹敵する非常に優(yōu)れた純粋な畳み込みニューラル ネットワーク アーキテクチャを設(shè)計(jì)しました。同様に、RepViT も、軽量 ViT のアーキテクチャ設(shè)計(jì)を段階的に統(tǒng)合することにより、主にターゲットを絞った変換を?qū)g行します。標(biāo)準(zhǔn)軽量 CNN、すなわち MobileNetV3-L (マジック修正) このプロセスでは、作成者はさまざまな粒度レベルで設(shè)計(jì)要素を検討し、一連のステップを通じて最適化目標(biāo)を達(dá)成しました。

1.3ms耗時(shí)!清華最新開源移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu) RepViT

トレーニング レシピの調(diào)整

この論文では、モバイル デバイスのレイテンシーを測定するための新しい指標(biāo)が導(dǎo)入されており、トレーニング戦略が現(xiàn)在一般的な軽量のトレーニング戦略と一致していることを確認(rèn)します。レベル ViT は一貫したままです。この取り組みの目的は、モデル トレーニングの一貫性を確保することであり、これには遅延測定とトレーニング戦略の調(diào)整という 2 つの重要な概念が含まれます。

遅延測定インデックス

実際のモバイル デバイスでのモデルのパフォーマンスをより正確に測定するために、著者は、実際のモバイル デバイスでのモデルの実際の遅延を直接測定することを選択しました。デバイスのベースライン測定として。このメトリクスは、主に FLOPs やモデル サイズなどのメトリクスを通じてモデルの推論速度を最適化する以前の研究とは異なります。これらのメトリクスは、モバイル アプリケーションの実際のレイテンシを必ずしも適切に反映するとは限りません。

トレーニング戦略の調(diào)整

ここでは、MobileNetV3-L のトレーニング戦略が、他の軽量 ViTs モデルと調(diào)整されるように調(diào)整されています。これには、AdamW オプティマイザー [ViTs モデルに必須のオプティマイザー] の使用、5 エポックのウォームアップ トレーニング、およびコサイン アニーリング學(xué)習(xí)率スケジューリングを使用した 300 エポックのトレーニングが含まれます。この調(diào)整によりモデルの精度は若干低下しますが、公平性は保証されます。

ブロック設(shè)計(jì)の最適化

次に、著者らは一貫したトレーニング設(shè)定に基づいて最適なブロック設(shè)計(jì)を検討しました。ブロック設(shè)計(jì)は CNN アーキテクチャの重要なコンポーネントであり、ブロック設(shè)計(jì)の最適化はネットワークのパフォーマンスの向上に役立ちます。

1.3ms耗時(shí)!清華最新開源移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu) RepViT

トークン ミキサーとチャネル ミキサーを分離

これは主に MobileNetV3-L 用です。ブロック構(gòu)造は次のとおりです。トークンミキサーとチャネルミキサーを分離するように改良されました。元の MobileNetV3 ブロック構(gòu)造は、1x1 拡張畳み込み、その後に深さ方向の畳み込みと 1x1 投影層で構(gòu)成され、殘差接続を介して入力と出力を接続します。これに基づいて、RepViT は深さの畳み込みを進(jìn)めて、チャネル ミキサーとトークン ミキサーを分離できるようにします。パフォーマンスを向上させるために、トレーニング中にディープ フィルターにマルチブランチ トポロジを?qū)毪工?構(gòu)造再パラメータ化 も導(dǎo)入されています。最後に、著者らは MobileNetV3 ブロック內(nèi)のトークン ミキサーとチャネル ミキサーを分離することに成功し、そのようなブロックを RepViT ブロックと名付けました。

拡張率を下げて幅を増やす

チャネル ミキサーでは、元の拡張率は 4 です。これは、MLP ブロックの隠れ次元が 4 であることを意味します。これは、大量のコンピューティング リソースを消費(fèi)し、推論時(shí)間に大きな影響を與えます。この問題を軽減するには、拡張率を 2 に減らすことでパラメータの冗長性と遅延を削減し、MobileNetV3-L の遅延を 0.65 ミリ秒まで下げることができます。その後、ネットワークの幅を増やす、つまり各ステージのチャネル數(shù)を増やすことによって、Top-1 の精度は 73.5% に増加しましたが、遅延は 0.89 ミリ秒に増加しただけでした。

マクロ アーキテクチャ要素の最適化

このステップでは、この記事では、主にステム、ダウンサンプリング レイヤーなどのマクロ アーキテクチャ要素から始めて、モバイル デバイス上の MobileNetV3-L のパフォーマンスをさらに最適化します。 、分類子およびステージ全體の比率。これらのマクロアーキテクチャ要素を最適化することで、モデルのパフォーマンスを大幅に向上させることができます。

畳み込み抽出器を使用した淺いネットワーク

1.3ms耗時(shí)!清華最新開源移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu) RepViT寫真

ViT は通常、入力イメージをステムとして重複しないパッチに分割する「パッチ化」操作を使用します。ただし、このアプローチにはトレーニングの最適化とトレーニング レシピに対する感度に問題があります。したがって、著者らは代わりに、多くの軽量 ViT で採用されているアプローチである早期畳み込みを採用しました。対照的に、MobileNetV3-L は 4 倍のダウンサンプリングにさらに複雑なステムを使用します。このようにして、フィルターの初期數(shù)は 24 に増加しますが、総遅延は 0.86 ミリ秒に減少し、トップ 1 の精度は 73.9% に増加します。

より深いダウンサンプリング レイヤー

1.3ms耗時(shí)!清華最新開源移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu) RepViT

ViT では、通常、空間ダウンサンプリングは別のパッチ マージ レイヤーを通じて実裝されます。したがって、ここでは、個(gè)別のより深いダウンサンプリング層を採用して、ネットワークの深さを増やし、解像度の低下による情報(bào)損失を減らすことができます。具體的には、著者らはまず 1x1 畳み込みを使用してチャネル次元を調(diào)整し、次に殘差を介して 2 つの 1x1 畳み込みの入力と出力を接続してフィードフォワード ネットワークを形成しました。さらに、ダウンサンプリング層をさらに深くするために、前面に RepViT ブロックを追加しました。これにより、トップ 1 の精度が 0.96 ミリ秒のレイテンシで 75.4% に向上しました。

より単純な分類子

1.3ms耗時(shí)!清華最新開源移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu) RepViT

軽量 ViT では、通常、分類子の後に線形層で構(gòu)成されるグローバル平均プーリング層が続きます。対照的に、MobileNetV3-L はより複雑な分類子を使用します。最終ステージにはさらに多くのチャネルがあるため、著者らはそれを単純な分類子、グローバル平均プーリング層、および線形層に置き換えました。このステップにより、トップ 1 の精度を保ちながらレイテンシーが 0.77 ミリ秒に減少しました。その率は 74.8% です。

全體的なステージの割合

ステージの割合は、さまざまなステージのブロック數(shù)の割合を表し、各ステージでの計(jì)算の分布を示します。この論文では、より最適なステージ比 1:1:7:1 を選択し、ネットワークの深さを 2:2:14:2 に増やすことで、より深いレイアウトを?qū)g現(xiàn)しています。このステップにより、トップ 1 の精度が 1.02 ミリ秒のレイテンシで 76.9% に向上します。

マイクロ設(shè)計(jì)の調(diào)整

次に、RepViT は層ごとのマイクロ設(shè)計(jì)を通じて軽量 CNN を調(diào)整します。これには、適切なコンボリューション カーネル サイズの選択やスクイーズ勵(lì)起 (スクイーズと-勵(lì)起、SEと呼ばれる)層の位置。どちらの方法でもモデルのパフォーマンスが大幅に向上します。

コンボリューション カーネル サイズの選択

CNN のパフォーマンスとレイテンシは通常、コンボリューション カーネルのサイズに影響されることはよく知られています。たとえば、MHSA のような長距離のコンテキスト依存関係をモデル化するために、ConvNeXt は大規(guī)模な畳み込みカーネルを使用し、その結(jié)果、パフォーマンスが大幅に向上します。ただし、大規(guī)模なコンボリューション カーネルは、計(jì)算の複雑さとメモリ アクセス コストのため、モバイルに適していません。 MobileNetV3-L は主に 3x3 畳み込みを使用し、一部のブロックでは 5x5 畳み込みが使用されます。著者らはこれらを 3x3 畳み込みに置き換えた結(jié)果、76.9% のトップ 1 の精度を維持しながらレイテンシが 1.00 ミリ秒に短縮されました。

SE 層の位置

畳み込みに対するセルフアテンション モジュールの利點(diǎn)の 1 つは、データ駆動(dòng)型プロパティと呼ばれる、入力に基づいて重みを調(diào)整できることです。 。チャネル アテンション モジュールとして、SE レイヤーはデータ駆動(dòng)型プロパティの欠如における畳み込みの制限を補(bǔ)うことができるため、パフォーマンスの向上につながります。 MobileNetV3-L は、主に最後の 2 つのステージに焦點(diǎn)を當(dāng)てて、いくつかのブロックに SE レイヤーを追加します。ただし、低解像度ステージでは、高解像度ステージよりも SE によって提供されるグローバル平均プーリング操作から得られる精度の向上が小さくなります。著者らは、最小限の遅延増分で精度向上を最大化するために、すべての段階でブロック間で SE 層を使用する戦略を設(shè)計(jì)しました。このステップにより、トップ 1 精度が 77.4% に向上し、遅延が 0.87 ミリ秒に減少しました。 [実際、Baidu はこの點(diǎn)についてすでに実験と比較を行っており、かなり前にこの結(jié)論に達(dá)しました。SE 層は深層の近くに配置するとより効果的です]

ネットワーク アーキテクチャ

最後に、上記の改善戦略を統(tǒng)合することにより、RepViT-M1/ などの複數(shù)のバリアントを持つモデル RepViT の全體的なアーキテクチャが得られました。 M2/M3。同様に、さまざまなバリエーションは主にステージごとのチャネル數(shù)とブロック數(shù)によって區(qū)別されます。

1.3ms耗時(shí)!清華最新開源移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu) RepViT

#実験

畫像分類

1.3ms耗時(shí)!清華最新開源移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu) RepViT##検出とセグメンテーション

#概要1.3ms耗時(shí)!清華最新開源移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu) RepViT

このペーパーでは、軽量 ViT のアーキテクチャ上の選択を?qū)毪工毪长趣摔瑜辍⑤X量 CNN の効率的な設(shè)計(jì)を再検討します。これにより、リソースに制約のあるモバイル デバイス向けに設(shè)計(jì)された軽量 CNN の新しいファミリーである RepViT が登場しました。 RepViT は、さまざまな視覚タスクにおいて既存の最先端の軽量 ViT および CNN を上回り、優(yōu)れたパフォーマンスと遅延を示します。これは、モバイル デバイス向けの純粋に軽量な CNN の可能性を強(qiáng)調(diào)しています。

以上が1.3ミリ秒には1.3ミリ秒かかります。清華社の最新オープンソース モバイル ニューラル ネットワーク アーキテクチャ RepViTの詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國語 Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明
この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡(luò)ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脫衣畫像を無料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

寫真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中國語版

SublimeText3 中國語版

中國語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強(qiáng)力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

iPhoneで連絡(luò)先グループを作成する方法 iPhoneで連絡(luò)先グループを作成する方法 Jul 13, 2025 am 01:17 AM

iPhoneはアドレス帳アプリケーションで連絡(luò)先グループの作成を直接サポートしていませんが、次の方法で同様の機(jī)能を達(dá)成できます。1。アドレス帳アプリケーションで「グループ」関數(shù)を使用して、「編集」>「グループの追加」をクリックしてカスタムグループを作成します。 2.編集して、各連絡(luò)先を?qū)潖辘工毳哎氅`プに追加します。 3.グループメッセージを送信する必要がある場合は、情報(bào)アプリケーションで新しいマルチパーソン會(huì)話を作成できます。 4. iCloudまたはGmailを使用して、タグ付きグループを同期して、コンピューター上の多數(shù)の連絡(luò)先の管理を容易にします。これらの方法は、接觸グループの効率的な管理と組み合わせて使用されます。

iPhoneのロックが解除されているかどうかを確認(rèn)する方法 iPhoneのロックが解除されているかどうかを確認(rèn)する方法 Jul 15, 2025 am 01:17 AM

Tocheckifaniphoneisunlocked、1)gotosettings> gotosettings> cellular> cellurardataoptionsandlookforlabelslike like like like like like like like like like lock or "nosimrestrictions」

iPhoneのトレードイン値を確認(rèn)する方法 iPhoneのトレードイン値を確認(rèn)する方法 Jul 13, 2025 am 01:13 AM

iPhoneの減価償卻価値を決定するには、複數(shù)の要因と異なるプラットフォームを比較する必要があります。 2。最初の選択は、Appleの公式交換計(jì)畫であり、これにはシンプルで透明なプロセスがありますが、最終評価は機(jī)器の実際の條件に基づいている必要があります。 3. Gazelle、SwappaなどのサードパーティのWebサイトは、より高い引用を提供する場合がありますが、実際の狀況を説明し、充電トラップを回避することに注意を払う必要があります。 4.価値に影響するコア要因には、モデルとストレージ容量、機(jī)器のステータス、オペレーターのロックステータスなどが含まれます。小さな問題も見積に影響を與える可能性があります。 5.より高いリターンを追求する場合は、個(gè)人的に販売することを選択できますが、時(shí)間コストと取引のリスクを比較検討する必要があります。

Apple電話用のStablecoinsを購入する方法は? Apple電話用のStablecoinsはどこで購入できますか? Apple電話用のStablecoinsを購入する方法は? Apple電話用のStablecoinsはどこで購入できますか? Jul 24, 2025 pm 09:18 PM

USDTやその他のStablecoinsをApple攜帯電話で購入すると、海外のApple IDを介してComplaint Exchangeアプリをダウンロードし、認(rèn)証と実施のトランザクションを完了する必要があります。特定の手順は次のとおりです。1。非メインランド地域のApple IDを使用して、App Storeにログインします。 2。OKX、Binance、Huobi(HTX)、Gate.io、Kucoinなどの推奨プラットフォームをダウンロードします。 3。登録とID認(rèn)証を完了する(KYC)。 4.「コインを購入」または「C2C/P2Pトランザクション」ページを入力して、USDTを選択します。 5。支払い方法と注文に応じたフィルター商人。 6. Alipay、Wechat、または銀行カードを介して支払い、取引を確認(rèn)します。 7.商人がコインをアカウントに入れるのを待つと、プロセス全體が完了します。

iPhoneでファイルアプリを使用する方法 iPhoneでファイルアプリを使用する方法 Jul 19, 2025 am 01:48 AM

ファイル管理にiPhoneのファイルアプリを使用することは非常にシンプルで、毎日のタスクに適しています。 1.ファイルとフォルダーの整理:フォルダーは「新しいフォルダー」関數(shù)を介して作成でき、ファイルの変更、移動(dòng)、またはコピーをサポートします。また、名前、日付などでソートすることもできます。2。アクセスiCloudおよびその他のクラウドサービス:iClouddrive、googledrive、dropboxなどに接続し、「browse> location> edit」を介して表示されたサービスを管理し、ファイルをクラウドストレージに直接保存できます。 3.他のアプリケーションからファイルを開き、共有:下部の共有アイコンを介してファイルを開くアプリケーションを選択するか、電子メール、メッセージ、またはエアドロップでファイルを共有します。要するに、その機(jī)能は限られていますが、基本的です

iPhoneパスコードを忘れました iPhoneパスコードを忘れました Jul 26, 2025 am 09:53 AM

iPhoneのパスワードを忘れた場合は、次の方法を試すことができます。1。iTunes/Finderを使用してリカバリモードを入力してデバイスを復(fù)元します(コンピューターに接続する必要があります)。 2?!杆饯蝘Phoneを見つける」を有効にすると、iCloudを介してデバイスを消去できます。 3.支援については、Appleカスタマーサービスにお問い合わせください(購入証明書を提供する必要があります)。上記のメソッドの最初の2つは、データをクリアします。將來定期的にバックアップし、検索機(jī)能を有効にすることをお?jiǎng)幛幛筏蓼埂?/p>

iOSバイナンストレーディングプラットフォームアプリダウンロードv3.0.5 Apple攜帯電話にBinanceアプリをインストールするための詳細(xì)な手順 iOSバイナンストレーディングプラットフォームアプリダウンロードv3.0.5 Apple攜帯電話にBinanceアプリをインストールするための詳細(xì)な手順 Jul 23, 2025 pm 11:33 PM

1. Binance公式WebサイトからアプリのiOSバージョンを最初にダウンロードします。 2.クリックしてインストールし、アプリケーションアイコンがデスクトップに表示されるのを待ちます。 3.プロンプトが初めて開くときに「信頼されていないエンタープライズレベルの開発者」のプロンプトが求められている場合、「設(shè)定系V PNとデバイス管理」を入力する必要があります。 4.「エンタープライズアプリ」でBinance Developer Nameを見つけ、「信頼」をクリックします。 5。信頼を完了した後、デスクトップに戻ってアプリを通常開始できます。証明書が期限切れになった場合は、再度ダウンロードしてインストールし、信頼手順を繰り返す必要があります。資産のセキュリティを確保するために、必ず公式チャネルを介してアプリケーションを取得してください。プロセス全體が完了した後、Binanceアプリを使用して登録またはログインすることができます。

iPhoneでアプリをオフロードする方法 iPhoneでアプリをオフロードする方法 Jul 14, 2025 am 01:23 AM

iPhoneでアプリをアンインストールすることは、完全に削除されることを意味するものではなく、ユーザーはデータを保持しながらスペースを作成できます。アプリをアンインストールしてデータを保持する場合は、「設(shè)定」→「一般」→「iPhoneストレージスペース」→[アプリを選択]→[アンインストールアプリ]をクリックします。アプリとデータを完全に削除する場合は、ホーム畫面のアイコンを長く押すことができます→[アプリの削除]→[削除の確認(rèn)]をクリックします。 2つの違いは、アンインストール後、再インストールしても元のコンテンツを復(fù)元できることです。削除するとすべてのデータがクリアされ、次のインストールを開始する必要があります。操作前に、重要な情報(bào)が誤って削除されないように要件を明確にする必要があります。

See all articles