国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
一、前言
二、背景
三、MULTI-GRID ASSIGNMENT
五、實(shí)驗(yàn)及可視化
首頁 科技周邊 人工智能 用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

Jun 01, 2024 pm 09:46 PM
目標(biāo)檢測 網(wǎng)格

一、前言

目前領(lǐng)先的目標(biāo)檢測器是基于深度CNN的主干分類器網(wǎng)絡(luò)重新調(diào)整用途的兩級(jí)或單級(jí)網(wǎng)絡(luò)。YOLOv3就是這樣一種眾所周知的最先進(jìn)的單級(jí)檢測器,它接收輸入圖像并將其劃分為大小相等的網(wǎng)格矩陣。具有目標(biāo)中心的網(wǎng)格單元負(fù)責(zé)檢測特定目標(biāo)。

今天分享的,就是提出了一種新的數(shù)學(xué)方法,該方法為每個(gè)目標(biāo)分配多個(gè)網(wǎng)格,以實(shí)現(xiàn)精確的tight-fit邊界框預(yù)測。研究者還提出了一種有效的離線復(fù)制粘貼數(shù)據(jù)增強(qiáng)來進(jìn)行目標(biāo)檢測。新提出的方法顯著優(yōu)于一些當(dāng)前最先進(jìn)的目標(biāo)檢測器,并有望獲得更好的性能。

二、背景

目標(biāo)檢測網(wǎng)絡(luò)旨在使用精密匹配邊界框在圖像上定位對象并準(zhǔn)確標(biāo)記它們。最近,有兩種不同的方法可以實(shí)現(xiàn)這一目標(biāo)。第一種方法是性能方面,最主要的方法是兩階段目標(biāo)檢測,最好的代表是區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(RCNN)及其衍生物[Faster R-CNN: Towards real-time object detection with region proposal networks]、[Fast R-CNN]。相比之下,第二組目標(biāo)檢測實(shí)現(xiàn)的因其出色的檢測速度和輕量級(jí)而被人們所知,被稱為單階段網(wǎng)絡(luò),代表性示例為[You only look once: Unified, real-time object detection]、[SSD: Single shot multibox detector]、[Focal loss for dense object detection]。兩階段網(wǎng)絡(luò)依賴于一個(gè)潛在的區(qū)域建議網(wǎng)絡(luò),該網(wǎng)絡(luò)生成了可能包含感興趣對象的圖像的候選區(qū)域。該網(wǎng)絡(luò)生成的候選區(qū)域可以包含對象的感興趣區(qū)域,在單階段目標(biāo)檢測中,檢測是在一個(gè)完整的前向傳遞中同時(shí)處理分類和定位。因此,通常情況下,單階段網(wǎng)絡(luò)更輕、更快且易于實(shí)現(xiàn)。

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

今天的研究依然是堅(jiān)持YOLO的方法,特別是YOLOv3,并提出了一種簡單的hack,可以同時(shí)使用多個(gè)網(wǎng)絡(luò)單元元素預(yù)測目標(biāo)坐標(biāo)、類別和目標(biāo)置信度。每個(gè)對象的多網(wǎng)絡(luò)單元元素背后的基本原理是通過強(qiáng)制多個(gè)單元元素在同一對象上工作來增加預(yù)測緊密擬合邊界框的可能性。

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

多網(wǎng)格分配的一些優(yōu)點(diǎn)包括:

目標(biāo)檢測器提供它正在檢測的對象的多視角圖,而不僅僅依靠一個(gè)網(wǎng)格單元來預(yù)測對象的類別和坐標(biāo)。

(b ) 較少隨機(jī)和不確定的邊界框預(yù)測,這意味著高精度和召回率,因?yàn)楦浇木W(wǎng)絡(luò)單元被訓(xùn)練來預(yù)測相同的目標(biāo)類別和坐標(biāo);

(c) 減少具有感興趣對象的網(wǎng)格單元與沒有感興趣對象的網(wǎng)格之間的不平衡。

此外,由于多網(wǎng)格分配是對現(xiàn)有參數(shù)的數(shù)學(xué)利用,并且不需要額外的關(guān)鍵點(diǎn)池化層和后處理來將關(guān)鍵點(diǎn)重新組合到其對應(yīng)的目標(biāo),如CenterNet和CornerNet,可以說它是一個(gè)更實(shí)現(xiàn)無錨或基于關(guān)鍵點(diǎn)的目標(biāo)檢測器試圖實(shí)現(xiàn)的自然方式。除了多網(wǎng)格冗余注釋,研究者還引入了一種新的基于離線復(fù)制粘貼的數(shù)據(jù)增強(qiáng)技術(shù),用于準(zhǔn)確的目標(biāo)檢測。

三、MULTI-GRID ASSIGNMENT

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

上圖包含三個(gè)目標(biāo),即狗、自行車和汽車。為簡潔起見,我們將解釋我們在一個(gè)對象上的多網(wǎng)格分配。上圖顯示了三個(gè)對象的邊界框,其中包含更多關(guān)于狗的邊界框的細(xì)節(jié)。下圖顯示了上圖的縮小區(qū)域,重點(diǎn)是狗的邊界框中心。包含狗邊界框中心的網(wǎng)格單元的左上角坐標(biāo)用數(shù)字0標(biāo)記,而包含中心的網(wǎng)格周圍的其他八個(gè)網(wǎng)格單元的標(biāo)簽從1到8。

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

到目前為止,我已經(jīng)解釋了包含目標(biāo)邊界框中心的網(wǎng)格如何注釋目標(biāo)的基本事實(shí)。這種對每個(gè)對象僅一個(gè)網(wǎng)格單元的依賴來完成預(yù)測類別的困難工作和精確的tight-fit邊界框引發(fā)了許多問題,例如:

(a)正負(fù)網(wǎng)格之間的巨大不平衡,即有和沒有對象中心的網(wǎng)格坐標(biāo)

(b)緩慢的邊界框收斂到GT

(c)缺乏要預(yù)測的對象的多視角(角度)視圖。

所以這里要問的一個(gè)自然問題是,“顯然,大多數(shù)對象包含一個(gè)以上網(wǎng)格單元的區(qū)域,因此是否有一種簡單的數(shù)學(xué)方法來分配更多這些網(wǎng)格單元來嘗試預(yù)測對象的類別和坐標(biāo)連同中心網(wǎng)格單元?”。這樣做的一些優(yōu)點(diǎn)是(a)減少不平衡,(b)更快的訓(xùn)練以收斂到邊界框,因?yàn)楝F(xiàn)在多個(gè)網(wǎng)格單元同時(shí)針對同一個(gè)對象,(c)增加預(yù)測tight-fit邊界框的機(jī)會(huì)(d) 為YOLOv3等基于網(wǎng)格的檢測器提供多視角視圖,而不是對象的單點(diǎn)視圖。新提出的多重網(wǎng)格分配試圖回答上述問題。

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

Ground-truth encoding

四、訓(xùn)練

?A. The Detection Network: MultiGridDet

MultiGridDet是一個(gè)目標(biāo)檢測網(wǎng)絡(luò),通過從YOLOv3中刪除六個(gè)darknet卷積塊來使其更輕、更快。一個(gè)卷積塊有一個(gè)Conv2D Batch Normalization LeakyRelu。移除的塊不是來自分類主干,即Darknet53。相反,將它們從三個(gè)多尺度檢測輸出網(wǎng)絡(luò)或頭中刪除,每個(gè)輸出網(wǎng)絡(luò)兩個(gè)。盡管通常深度網(wǎng)絡(luò)表現(xiàn)良好,但太深的網(wǎng)絡(luò)也往往會(huì)快速過度擬合或大幅降低網(wǎng)絡(luò)速度。

B. The Loss function

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

Coordinate activation function plot with different β values

C. Data Augmentation

離線復(fù)制粘貼人工訓(xùn)練圖像合成工作如下:首先,使用簡單的圖像搜索腳本,使用地標(biāo)、雨、森林等關(guān)鍵字從谷歌圖像下載數(shù)千張背景無對象圖像,即沒有我們感興趣的對象的圖像。然后,我們從整個(gè)訓(xùn)練數(shù)據(jù)集的隨機(jī)q個(gè)圖像中迭代地選擇p個(gè)對象及其邊界框。然后,我們生成使用它們的索引作為ID選擇的p個(gè)邊界框的所有可能組合。從組合集合中,我們選擇滿足以下兩個(gè)條件的邊界框子集:

  • if arranged in some random order side by side, they must fit within a given target background image area
  • and should efficiently utilize the background image space in its entirety or at least most part of it without the objects overlap.

五、實(shí)驗(yàn)及可視化

Pascal VOC 2007上的性能比較

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

coco數(shù)據(jù)集上的性能比較

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注

從圖中可以看出,第一行顯示了六個(gè)輸入圖像,而第二行顯示了網(wǎng)絡(luò)在非極大抑制(NMS)之前的預(yù)測,最后一行顯示了MultiGridDet在NMS之后對輸入圖像的最終邊界框預(yù)測。

以上是用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注的詳細(xì)內(nèi)容。更多信息請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

熱門話題

Laravel 教程
1600
29
PHP教程
1502
276
目標(biāo)檢測新SOTA:YOLOv9問世,新架構(gòu)讓傳統(tǒng)卷積重?zé)ㄉ鷻C(jī) 目標(biāo)檢測新SOTA:YOLOv9問世,新架構(gòu)讓傳統(tǒng)卷積重?zé)ㄉ鷻C(jī) Feb 23, 2024 pm 12:49 PM

在目標(biāo)檢測領(lǐng)域,YOLOv9在實(shí)現(xiàn)過程中不斷進(jìn)步,通過采用新架構(gòu)和方法,有效提高了傳統(tǒng)卷積的參數(shù)利用率,這使得其性能遠(yuǎn)超前代產(chǎn)品。繼2023年1月YOLOv8正式發(fā)布一年多以后,YOLOv9終于來了!自2015年JosephRedmon和AliFarhadi等人提出了第一代YOLO模型以來,目標(biāo)檢測領(lǐng)域的研究者們對其進(jìn)行了多次更新和迭代。 YOLO是一種基于圖像全局信息的預(yù)測系統(tǒng),其模型性能不斷得到增強(qiáng)。通過不斷改進(jìn)算法和技術(shù),研究人員取得了顯著的成果,使得YOLO在目標(biāo)檢測任務(wù)中表現(xiàn)出越來越強(qiáng)大

用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注 用于精確目標(biāo)檢測的多網(wǎng)格冗余邊界框標(biāo)注 Jun 01, 2024 pm 09:46 PM

一、前言目前領(lǐng)先的目標(biāo)檢測器是基于深度CNN的主干分類器網(wǎng)絡(luò)重新調(diào)整用途的兩級(jí)或單級(jí)網(wǎng)絡(luò)。YOLOv3就是這樣一種眾所周知的最先進(jìn)的單級(jí)檢測器,它接收輸入圖像并將其劃分為大小相等的網(wǎng)格矩陣。具有目標(biāo)中心的網(wǎng)格單元負(fù)責(zé)檢測特定目標(biāo)。今天分享的,就是提出了一種新的數(shù)學(xué)方法,該方法為每個(gè)目標(biāo)分配多個(gè)網(wǎng)格,以實(shí)現(xiàn)精確的tight-fit邊界框預(yù)測。研究者還提出了一種有效的離線復(fù)制粘貼數(shù)據(jù)增強(qiáng)來進(jìn)行目標(biāo)檢測。新提出的方法顯著優(yōu)于一些當(dāng)前最先進(jìn)的目標(biāo)檢測器,并有望獲得更好的性能。二、背景目標(biāo)檢測網(wǎng)絡(luò)旨在使用

蘋果手機(jī)中設(shè)置相機(jī)網(wǎng)格的操作步驟 蘋果手機(jī)中設(shè)置相機(jī)網(wǎng)格的操作步驟 Mar 26, 2024 pm 07:21 PM

1、打開蘋果手機(jī)的桌面,找到并點(diǎn)擊進(jìn)入【設(shè)置】,2、在設(shè)置的頁面點(diǎn)擊進(jìn)入【相機(jī)】。3、點(diǎn)擊打開【網(wǎng)格】右側(cè)的開關(guān)即可。

如何利用C++進(jìn)行高性能的圖像追蹤和目標(biāo)檢測? 如何利用C++進(jìn)行高性能的圖像追蹤和目標(biāo)檢測? Aug 26, 2023 pm 03:25 PM

如何利用C++進(jìn)行高性能的圖像追蹤和目標(biāo)檢測?摘要:隨著人工智能和計(jì)算機(jī)視覺技術(shù)的快速發(fā)展,圖像追蹤和目標(biāo)檢測成為了重要的研究領(lǐng)域。本文將通過使用C++語言和一些開源庫,介紹如何實(shí)現(xiàn)高性能的圖像追蹤和目標(biāo)檢測,并提供代碼示例。引言:圖像追蹤和目標(biāo)檢測是計(jì)算機(jī)視覺領(lǐng)域中的兩個(gè)重要任務(wù)。它們在許多領(lǐng)域中都有著廣泛的應(yīng)用,如視頻監(jiān)控、自動(dòng)駕駛、智能交通系統(tǒng)等。為了

CSS布局技巧:實(shí)現(xiàn)圓形網(wǎng)格圖標(biāo)布局的最佳實(shí)踐 CSS布局技巧:實(shí)現(xiàn)圓形網(wǎng)格圖標(biāo)布局的最佳實(shí)踐 Oct 20, 2023 am 10:46 AM

CSS布局技巧:實(shí)現(xiàn)圓形網(wǎng)格圖標(biāo)布局的最佳實(shí)踐在現(xiàn)代網(wǎng)頁設(shè)計(jì)中,網(wǎng)格布局是一種常見且強(qiáng)大的布局技術(shù)。而圓形網(wǎng)格圖標(biāo)布局則是一種更加獨(dú)特和有趣的設(shè)計(jì)選擇。本文將介紹一些最佳實(shí)踐和具體代碼示例,幫助你實(shí)現(xiàn)圓形網(wǎng)格圖標(biāo)布局。HTML結(jié)構(gòu)首先,我們需要設(shè)置一個(gè)容器元素,在這個(gè)容器里放置圖標(biāo)。我們可以使用一個(gè)無序列表(<ul>)作為容器,列表項(xiàng)(<l

多個(gè)SOTA !OV-Uni3DETR:提高3D檢測在類別、場景和模態(tài)之間的普遍性(清華&港大) 多個(gè)SOTA !OV-Uni3DETR:提高3D檢測在類別、場景和模態(tài)之間的普遍性(清華&港大) Apr 11, 2024 pm 07:46 PM

這篇論文討論了3D目標(biāo)檢測的領(lǐng)域,特別是針對Open-Vocabulary的3D目標(biāo)檢測。在傳統(tǒng)的3D目標(biāo)檢測任務(wù)中,系統(tǒng)需要在預(yù)測真實(shí)場景中物體的定位3D邊界框和語義類別標(biāo)簽,這通常依賴于點(diǎn)云或RGB圖像。盡管2D目標(biāo)檢測技術(shù)因其普遍性和速度展現(xiàn)出色,但相關(guān)研究表明,3D通用檢測的發(fā)展相比之下顯得滯后。當(dāng)前,大多數(shù)3D目標(biāo)檢測方法仍依賴于完全監(jiān)督學(xué)習(xí),并受到特定輸入模式下完全標(biāo)注數(shù)據(jù)的限制,只能識(shí)別經(jīng)過訓(xùn)練過程中出現(xiàn)的類別,無論是在室內(nèi)還是室外場景。這篇論文指出,3D通用目標(biāo)檢測面臨的挑戰(zhàn)主要

Python中的計(jì)算機(jī)視覺實(shí)例:目標(biāo)檢測 Python中的計(jì)算機(jī)視覺實(shí)例:目標(biāo)檢測 Jun 10, 2023 am 11:36 AM

隨著人工智能的發(fā)展,計(jì)算機(jī)視覺技術(shù)已經(jīng)成為了人們關(guān)注的焦點(diǎn)之一。Python作為一種高效且易學(xué)的編程語言,在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用得到了廣泛的認(rèn)可和推廣。本文將重點(diǎn)介紹Python中的計(jì)算機(jī)視覺實(shí)例:目標(biāo)檢測。什么是目標(biāo)檢測?目標(biāo)檢測是計(jì)算機(jī)視覺領(lǐng)域中的一項(xiàng)關(guān)鍵技術(shù),其目的是在一張圖片或視頻中識(shí)別出特定目標(biāo)的位置和大小。相比于圖像分類,目標(biāo)檢測不僅需要識(shí)別出圖

YOLOv10來啦!真正實(shí)時(shí)端到端目標(biāo)檢測 YOLOv10來啦!真正實(shí)時(shí)端到端目標(biāo)檢測 Jun 09, 2024 pm 05:29 PM

過去幾年里,YOLOs因在計(jì)算成本和檢測性能之間實(shí)現(xiàn)有效平衡而成為實(shí)時(shí)目標(biāo)檢測領(lǐng)域的主流范式。研究人員針對YOLOs的結(jié)構(gòu)設(shè)計(jì)、優(yōu)化目標(biāo)、數(shù)據(jù)增強(qiáng)策略等進(jìn)行了深入探索,并取得了顯著進(jìn)展。然而,對非極大值抑制(NMS)的后處理依賴阻礙了YOLOs的端到端部署,并對推理延遲產(chǎn)生負(fù)面影響。此外,YOLOs中各種組件的設(shè)計(jì)缺乏全面和徹底的審查,導(dǎo)致明顯的計(jì)算冗余并限制了模型的性能。這導(dǎo)致次優(yōu)的效率,以及性能提升的巨大潛力。在這項(xiàng)工作中,我們旨在從后處理和模型架構(gòu)兩個(gè)方面進(jìn)一步推進(jìn)YOLOs的性能-效率邊

See all articles