


Melampaui SFT, rahsia di belakang O1/DeepSeek-R1 juga boleh digunakan dalam model besar multimodal
Mar 12, 2025 pm 01:03 PMPenyelidik dari Universiti Shanghai Jiaoto, Shanghai AI Lab dan Universiti Cina Hong Kong telah melancarkan projek sumber terbuka Visual-RFT (Visual Fine Fine Tuning), yang hanya memerlukan sedikit data untuk meningkatkan prestasi mockups bahasa visual (LVLM). Visual-RFT bijak menggabungkan pendekatan pembelajaran tetulang berasaskan peraturan DeepSeek-R1 dengan paradigma penalaan Fine-Penalaan Terbuka (RFT) OpenAI, berjaya memperluaskan pendekatan ini dari medan teks ke medan visual.
Dengan merancang ganjaran peraturan yang sepadan untuk tugas-tugas seperti subkategori visual dan pengesanan objek, Visual-RFT mengatasi batasan kaedah DeepSeek-R1 yang terhad kepada teks, penalaran matematik dan bidang lain, menyediakan cara baru untuk latihan LVLM.
Kelebihan Visual-RFT:
Berbanding dengan kaedah pengajaran visual tradisional (SFT), Visual-RFT mempunyai kelebihan penting berikut:
- Kurang keupayaan pembelajaran sampel: Hanya 10 hingga 1000 keping data boleh digunakan untuk mencapai penalaan yang berkesan.
- Generalisasi yang lebih kuat: Dalam senario dengan data terhad, prestasi lebih baik daripada SFT.
Para penyelidik mengesahkan Visual-RFT pada pelbagai tugas persepsi visual (pengesanan, klasifikasi, lokasi, dan lain-lain), dan hasilnya menunjukkan bahawa visual-RFT mencapai peningkatan prestasi yang signifikan dan pemindahan keupayaan yang mudah dicapai walaupun di bawah tetapan perbendaharaan kata terbuka dan pembelajaran sampel kecil.
Para penyelidik yang direka dengan ganjaran yang dapat disahkan untuk tugas-tugas yang berbeza: ganjaran berasaskan IOU digunakan untuk mengesan dan menempatkan tugas, dan ganjaran berasaskan klasifikasi yang dibenarkan digunakan untuk tugas klasifikasi.
Dalam tugas kedudukan kesimpulan, Visual-RFT menunjukkan keupayaan penalaran visual yang kuat, seperti dengan tepat mengenal pasti gelas kalis air yang perlu dipakai oleh atlet dalam gambar.
Hasil eksperimen:
Eksperimen berdasarkan model QWEN2-VL 2B/7B menunjukkan bahawa Visual-RFT lebih tinggi daripada SFT dalam pengesanan objek terbuka, pengesanan sampel kecil, klasifikasi halus dan tugas kedudukan kesimpulan. Walaupun anda mengesan watak anime tertentu (seperti lendir), Visual-RFT boleh dicapai dengan hanya sedikit data.
Maklumat Sumber Terbuka:
Projek Visual-RFT adalah sumber terbuka dan mengandungi latihan, kod penilaian dan data.
Alamat Projek: http://www.miracleart.cn/link/ec56522bc9c2e15be17d11962eeec453
Atas ialah kandungan terperinci Melampaui SFT, rahsia di belakang O1/DeepSeek-R1 juga boleh digunakan dalam model besar multimodal. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Kandungan 1. Apa itu ICN? 2. Kemas Kini Terkini ICNT 3. Perbandingan dan Model Ekonomi antara ICN dan Projek Depin dan Model Ekonomi lain 4. Kesimpulan dari peringkat seterusnya trek Depin pada akhir bulan Mei, ICN (ImpossibleCloudNetwork) @ICN_Protocol mengumumkan bahawa ia telah menerima pelaburan strategik dalam NGPCapital dengan penilaian AS $ 470 juta. Ramai reaksi pertama orang adalah: "Adakah Xiaomi melabur di Web3?" Walaupun ini bukan langkah langsung Lei Jun, orang yang bertaruh pada Xiaomi, Helium, dan Workfusion

Bagaimanakah pengguna pemula memilih platform stablecoin yang selamat dan boleh dipercayai? Artikel ini mengesyorkan 10 platform stablecoin teratas pada tahun 2025, termasuk Binance, OKX, Bybit, Gate.io, HTX, Kucoin, Mexc, Bitget, Coinex dan Probit, dan membandingkan dan menganalisisnya dari dimensi seperti keselamatan, jenis stablecoin, pengalaman pengguna, struktur yuran dan fungsi tambahan. Data berasal dari Coingecko, Defillama dan penilaian komuniti. Adalah disyorkan bahawa orang baru memilih platform yang sangat mematuhi, mudah untuk beroperasi dan menyokong Cina, seperti Kucoin dan Coinex, dan secara beransur -ansur membina keyakinan melalui sebilangan kecil ujian.

Terhadap latar belakang turun naik kekerasan dalam pasaran cryptocurrency, permintaan pelabur untuk pemeliharaan aset menjadi semakin menonjol. Artikel ini bertujuan untuk menjawab bagaimana untuk melindung nilai risiko secara berkesan dalam lingkaran mata wang bergelora. Ia akan memperkenalkan secara terperinci konsep StableCoin, alat lindung nilai teras, dan menyediakan senarai Top3 StableCoins dengan menganalisis pilihan yang sangat diiktiraf semasa di pasaran. Artikel ini akan menjelaskan cara memilih dan menggunakan stablecoins ini mengikut keperluan mereka sendiri, untuk menguruskan risiko dengan lebih baik dalam persekitaran pasaran yang tidak menentu.

Artikel ini akan membincangkan stablecoins arus perdana di dunia dan menganalisis stablecoins yang mempunyai atribut keengganan risiko "pengganti emas" dalam kitaran ke bawah pasaran (Bear Market). Kami akan menerangkan bagaimana untuk menilai dan memilih alat penyimpanan nilai yang agak stabil dalam pasaran beruang dengan membandingkan nilai pasaran, mekanisme pengesahan, ketelusan, dan menggabungkan pandangan umum secara komprehensif di Internet, dan menerangkan proses analisis ini.

Apabila keadaan pasaran meningkat, lebih banyak pelabur pintar telah mula secara senyap -senyap meningkatkan kedudukan mereka dalam bulatan mata wang. Ramai orang tertanya -tanya apa yang membuat mereka mengambil tegas apabila kebanyakan orang menunggu dan melihat? Artikel ini akan menganalisis trend semasa melalui data rantaian untuk membantu pembaca memahami logik dana pintar, untuk lebih memahami pusingan seterusnya peluang pertumbuhan kekayaan yang berpotensi.

Artikel ini akan memperkenalkan beberapa stablecoins arus perdana dan menerangkan secara mendalam bagaimana untuk menilai keselamatan stablecoin dari pelbagai dimensi seperti ketelusan dan pematuhan, untuk membantu anda memahami stablecoins yang umumnya dianggap sebagai pilihan yang agak boleh dipercayai di pasaran, dan belajar bagaimana untuk menilai atribut "bahaya" mereka sendiri.

Baru -baru ini, Bitcoin melanda tinggi baru, Dogecoin mengantar pemulihan yang kuat dan pasaran panas. Seterusnya, kami akan menganalisis pemandu pasaran dan aspek teknikal untuk menentukan sama ada Ethereum masih mempunyai peluang untuk mengikuti kenaikan.

Harga Ethereum telah melalui beberapa peringkat kritikal, dari $ 0.70 pada tahun 2015 kepada $ 3,050 pada tahun 2025. 1) dari 2015 hingga 2016, ETH meningkat dari $ 0.70 hingga $ 20.64 pada pertengahan 2016; 2) dari 2017 hingga 2018, didorong oleh ledakan ICO, mencapai $ 1,417 pada awal tahun 2018, dan kemudian jatuh ke $ 80 disebabkan oleh kebimbangan pengawalseliaan; 3) dari 2019 hingga 2020, dan meningkat kepada $ 737 di bawah Defi; 4) dari 2021, mencecah paras tertinggi baru sebanyak $ 4,864, dan kemudian jatuh ke $ 1,200-2,000 disebabkan oleh transformasi POS; 5) Dari 2023 hingga 2024 hingga kira -kira $ 3,000
