


Dépassant considérablement la SFT, le secret derrière O1 / Deepseek-R1 peut également être utilisé dans les grands modèles multimodaux
Mar 12, 2025 pm 01:03 PMDes chercheurs de l'Université de Shanghai Jiaotong, de Shanghai AI Lab et de l'Université chinoise de Hong Kong ont lancé le projet open source visual-RFT (visual d'amélioration), qui ne nécessite qu'une petite quantité de données pour améliorer considérablement les performances des mockups du langage visuel (LVLM). Visual-RFT combine intelligemment l'approche d'apprentissage en renforcement basée sur les règles de Deepseek-R1 avec le paradigme de relachement de renforcement d'OpenAI (RFT), prolongeant avec succès cette approche du champ de texte au champ visuel.
En concevant les récompenses de règles correspondantes pour des taches telles que la sous-catégorisation visuelle et la détection d'objets, Visual-RFT surmonte les limites de la méthode Deepseek-R1 limitée au texte, au raisonnement mathématique et à d'autres domaines, fournissant une nouvelle fa?on de formation LVLM.
Avantages de Visual-RFT:
Par rapport aux méthodes de réglage de réglage des instructions visuelles traditionnelles (SFT), Visual-RFT présente les avantages significatifs suivants:
- Moins d'échantillons d'apprentissage: seulement 10 à 1000 données peuvent être utilisées pour atteindre un réglage fin efficace.
- Généralisation plus forte: dans les scénarios avec des données limitées, les performances sont meilleures que SFT.
Les chercheurs ont vérifié la RFT visuelle sur plusieurs taches de perception visuelle (détection, classification, emplacement, etc.), et les résultats ont montré que le RFT visuel a réalisé des améliorations de performances significatives et facilement un transfert de capacités, même dans les milieux du vocabulaire ouvert et de l'apprentissage de petits échantillons.
Les chercheurs ont con?u des récompenses vérifiables correspondantes pour différentes taches: des récompenses basées sur l'IOU sont utilisées pour les taches de détection et de positionnement, et les récompenses basées sur l'exactitude de la classification sont utilisées pour les taches de classification.
Dans la tache de positionnement d'inférence, Visual-RFT montre de fortes capacités de raisonnement visuel, comme l'identification avec précision de lunettes imperméables que les athlètes doivent porter en images.
Résultats expérimentaux:
Des expériences basées sur le modèle QWEN2-VL 2B / 7B montrent que Visual-RFT est supérieur à SFT dans la détection d'objets ouverts, la détection de petits échantillons, la classification à grains fins et les taches de positionnement d'inférence. Même si vous détectez un caractère d'anime spécifique (comme Slime), Visual-RFT peut être réalisé avec juste une petite quantité de données.
Informations open source:
Le projet Visual-RFT est open source et contient une formation, un code d'évaluation et des données.
Adresse du projet: http://www.miracleart.cn/link/ec56522bc9c2e15be17d11962eeec453
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Comment les utilisateurs novices choisissent-ils une plate-forme stablecoin s?re et fiable? Cet article recommande les 10 principales plates-formes de stablecoin en 2025, notamment Binance, Okx, Bybit, Gate.io, HTX, Kucoin, Mexc, Bitget, Coinx et Probit, et les compare et les analyse à partir de dimensions telles que la sécurité, les types de stablecoin, la liquidité, l'expérience de l'utilisateur, la structure des frais et les fonctions supplémentaires. Les données proviennent de Coingecko, Defillama et des évaluations communautaires. Il est recommandé que les novices choisissent des plateformes très conformes, faciles à utiliser et à soutenir le chinois, comme Kucoin et Coinex, et renforcent progressivement un petit nombre de tests.

Dans le contexte des fluctuations violentes sur le marché des crypto-monnaies, la demande des investisseurs de préservation des actifs devient de plus en plus importante. Cet article vise à répondre à la manière de couvrir efficacement les risques dans le cercle de monnaie turbulent. Il introduira en détail le concept de stablecoin, un outil de couverture de base, et fournira une liste de stablescoins TOP3 en analysant les options très reconnues actuelles sur le marché. L'article expliquera comment sélectionner et utiliser ces stablescoins en fonction de leurs propres besoins, afin de mieux gérer les risques dans un environnement de marché incertain.

Cet article discutera des stablescoins mondiaux et analysera les stablescoins qui ont l'attribut d'aversion au risque du "substitut d'or" dans le cycle à la baisse du marché (marché baissier). Nous expliquerons comment juger et choisir un outil de stockage de valeur relativement stable dans un marché baissier en comparant la valeur marchande, le mécanisme d'approbation, la transparence et la combinaison de vues communes sur Internet, et expliquer ce processus d'analyse.

Au fur et à mesure que les conditions du marché accélèrent, de plus en plus d'investisseurs intelligents ont commencé à augmenter tranquillement leurs positions dans le cercle des devises. Beaucoup de gens se demandent ce qui les fait prendre de manière décisive lorsque la plupart des gens attendent et voient? Cet article analysera les tendances actuelles à travers des données sur la cha?ne pour aider les lecteurs à comprendre la logique des fonds intelligents, afin de mieux saisir la prochaine série de possibilités de croissance potentielle de la richesse.

Cet article introduira plusieurs stablescoins grand public et expliquera en profondeur comment évaluer la sécurité d'un stablecoin à partir de plusieurs dimensions telles que la transparence et la conformité, afin de vous aider à comprendre quelles étalines sont généralement considérées comme des choix relativement fiables sur le marché, et à apprendre à juger vous-même leurs attributs "de danger".

Ethereum Price a connu plusieurs étapes critiques, de 0,70 $ en 2015 à 3 050 $ en 2025.1) De 2015 à 2016, ETH est passé de 0,70 $ à 20,64 $ à la mi-2016; 2) De 2017 à 2018, tiré par le boom de l'ICO, a atteint 1 417 $ début 2018, puis est tombé à 80 $ en raison de préoccupations réglementaires; 3) de 2019 à 2020 et est passé à 737 $ sous Defi; 4) à partir de 2021, a atteint un nouveau sommet de 4 864 $, puis est tombé à 1 200 à 200 $ en raison de la transformation de la POS; 5) de 2023 à 2024 à environ 3 000 $

Récemment, Bitcoin a frappé un nouveau sommet, Dogecoin a inauguré un fort rebond et le marché était chaud. Ensuite, nous analyserons les moteurs du marché et les aspects techniques pour déterminer si Ethereum a toujours des opportunités de suivre la montée.

Les pièces stables sont des monnaies numériques qui maintiennent une valeur stable en ancrant des actifs spécifiques. Ils sont principalement divisés en trois catégories: garantie de monnaie fiduciaire, garantie des actifs crypto et algorithmique. Parmi eux, les garanties de monnaie fiduciaire tels que l'USDT et l'USDC sont largement utilisées, et leurs réserves sont souvent investies dans des obligations du Trésor américain, formant un lien étroit avec le système financier traditionnel.
