japanese熟女熟妇,国产95在线 | 欧美,av黄鳝钻进女人下面

Rumah

pembangunan bahagian belakang

Tutorial Python

Mengoptimumkan GPT-mini OpenAI untuk Mengesan Teks Dijana AI Menggunakan DSPy

Linda Hamilton

Nov 24, 2024 am 06:46 AM

Mengesan teks yang dijana AI telah menjadi topik hangat, dengan penyelidik dan pengamal membahaskan kebolehlaksanaan dan implikasi etikanya. Apabila model berkembang dengan lebih canggih, membezakan antara teks tulisan manusia dan teks yang dijana AI menjadi satu cabaran yang menarik dan keperluan kritikal.

Dalam siaran ini, kami akan meneroka cara memanfaatkan keupayaan pengoptimuman DSPy untuk memperhalusi GPT-4o-mini OpenAI untuk tugas ini menggunakan set data menarik sebanyak 1.39 juta sampel teks. Pada akhirnya, anda akan tahu cara untuk melaksanakan, menilai dan mengoptimumkan pengesan teks AI asas menggunakan DSPy—tiada kejuruteraan segera manual diperlukan.

Pemuatan Set Data

Mula-mula, mari muatkan set data, yang mengandungi sampel teks yang dilabelkan sebagai sama ada tulisan manusia atau AI yang dijana daripada pelbagai sumber manusia dan LLM. Untuk bermula, pastikan anda telah memasang Python 3, bersama-sama dengan pustaka set data DSPy dan muka peluk:

pip install dspy datasets

Saiz set data adalah lebih kurang 2GB, jadi bergantung pada kelajuan internet anda, langkah ini mungkin mengambil masa beberapa minit.

Berikut ialah kod untuk memuatkan dan membahagikan set data secara sama rata untuk latihan dan ujian:

from datasets import load_dataset

# Load the dataset
ds = load_dataset("artem9k/ai-text-detection-pile", split="train")

# For simplicity, we’ll do an even split of data for testing and training
NUM_EXAMPLES = 80  # Adjust this to experiment with dataset size
ds = ds.train_test_split(test_size=NUM_EXAMPLES, train_size=NUM_EXAMPLES)

Petua: Anda boleh melaraskan NUM_EXAMPLES untuk mencuba set data yang lebih besar atau untuk mengurangkan kos semasa menjalankan pengoptimuman.

Persediaan Model

Seterusnya, kami akan mencipta peramal DSPy asas menggunakan GPT-4o-mini OpenAI. GPT-4o-mini ialah versi ringan model GPT-4o OpenAI, menjadikannya menjimatkan kos untuk percubaan. DSPy memudahkan proses ini dengan menggunakan tandatangan, yang mentakrifkan pemetaan input-output berstruktur.

Ganti "YOUR_API_KEY" dengan kunci API OpenAI anda sebelum menjalankan kod:

import dspy
from typing import Literal

# Initialize the OpenAI GPT-4o-mini model
lm = dspy.LM('openai/gpt-4o-mini', api_key="YOUR_API_KEY")
dspy.configure(lm=lm, experimental=True)

# Define the AI text detector signature
class DetectAiText(dspy.Signature):
    """Classify text as written by human or by AI."""
    text: str = dspy.InputField()
    source: Literal['ai', 'human'] = dspy.OutputField()

# Create a basic predictor
detector = dspy.Predict(DetectAiText)

Perhatikan bahawa kami tidak melakukan sebarang kejuruteraan segera di sini. Sebaliknya, kami bergantung pada DSPy untuk mengendalikannya, serta perhubungan input-output secara automatik.

Anda boleh menguji "pengesan" dengan beberapa input sampel:

print(detector(text="Hello world (this definitely wasn't written by AI)"))

Ramalan akan muncul dalam medan 'sumber' output.

Menilai Pengesan

Sekarang kita mempunyai pengesan asas, mari kita nilai prestasinya menggunakan alat penilaian DSPy. Untuk ini, kami akan mentakrifkan metrik mudah yang menyemak sama ada model meramalkan sumber teks dengan betul (manusia atau AI).

Berikut ialah kod untuk menyediakan dan menjalankan penilaian:

from dspy.evaluate import Evaluate

# Define a simple evaluation metric
def validate_text_source(example: dspy.Example, pred, trace=None) -> int:
    return 1 if example.source.lower() == pred.source.lower() else 0

# Transform the dataset into DSPy-compatible "Example" objects
dspy_trainset = [
    dspy.Example(source=x['source'], text=x['text']).with_inputs('text') for x in ds['train']
]
dspy_devset = [
    dspy.Example(source=x['source'], text=x['text']).with_inputs('text') for x in ds['test']
]

# Evaluate the detector
evaluator = Evaluate(devset=dspy_devset, num_threads=12)  # Adjust threads based on your system
evaluator(detector, metric=validate_text_source)

Dalam ujian awal saya, saya mencapai ketepatan 76%–81%. Harap maklum bahawa keputusan mungkin berbeza-beza disebabkan oleh pensampelan rawak set data.

Optimizing OpenAI’s GPT-mini to Detect AI-Generated Text Using DSPy

Mengoptimumkan dengan DSPy

Kuasa sebenar DSPy terletak pada keupayaan pengoptimumannya. Dengan menggunakan pengoptimum MIPROv2, kami boleh meningkatkan prestasi pengesan tanpa mengubah gesaan secara manual. Pengoptimum mengautomasikan proses ini menggunakan contoh beberapa tangkapan, templat dinamik dan teknik penyeliaan sendiri.

Berikut ialah cara untuk menyediakan dan menjalankan pengoptimum:

pip install dspy datasets

Nota: Kos untuk pengoptimuman tunggal dijalankan dengan pratetap "ringan" biasanya kurang daripada $0.50 untuk set data sebanyak 80 contoh.

Keputusan dan Lelaran

Selepas menjalankan pengoptimuman, saya melihat peningkatan prestasi yang ketara. Larian pertama saya mencapai ketepatan 91.25%, berbanding 76%–81% garis dasar. Larian seterusnya berjulat antara 81.2% dan 91.25%, menunjukkan peningkatan yang konsisten dengan usaha yang minimum.

Optimizing OpenAI’s GPT-mini to Detect AI-Generated Text Using DSPy

Untuk memuatkan model yang dioptimumkan untuk kegunaan selanjutnya:

from datasets import load_dataset

# Load the dataset
ds = load_dataset("artem9k/ai-text-detection-pile", split="train")

# For simplicity, we’ll do an even split of data for testing and training
NUM_EXAMPLES = 80  # Adjust this to experiment with dataset size
ds = ds.train_test_split(test_size=NUM_EXAMPLES, train_size=NUM_EXAMPLES)

Anda boleh mengulang lagi dengan:

Melaraskan parameter auto pengoptimum (ringan, sederhana, berat) atau menetapkan sendiri parameter hiper.
Meningkatkan saiz set data untuk latihan dan penilaian.
Ujian dengan LLM yang lebih maju atau dikemas kini.

Kesimpulan

Hanya dalam beberapa langkah, kami menunjukkan cara DSPy memudahkan pengoptimuman LLM untuk kes penggunaan dunia sebenar. Tanpa sebarang kejuruteraan segera manual, kami mencapai peningkatan yang boleh diukur dalam mengesan teks yang dijana AI. Walaupun model ini tidak sempurna, fleksibiliti DSPy membolehkan lelaran berterusan, menjadikannya alat yang berharga untuk pembangunan AI berskala.

Saya sangat mengesyorkan pembacaan dokumentasi DSPy dan percubaan dengan pengoptimum lain dan corak LLM.

Kod penuh tersedia di GitHub.

Soalan? Komen? Beritahu saya, saya tidak sabar untuk melihat apa yang anda bina dengan DSPy!

Anda boleh mencari saya di LinkedIn | CTO & Rakan Kongsi @ EES.

Atas ialah kandungan terperinci Mengoptimumkan GPT-mini OpenAI untuk Mengesan Teks Dijana AI Menggunakan DSPy. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undress AI Tool

Gambar buka pakaian secara percuma

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Panduan: bilah bintang simpan fail lokasi/simpan fail hilang/tidak menyimpan

4 minggu yang lalu By DDD

Oguri Cap Build Guide | Musume Derby Pretty

2 minggu yang lalu By Jack chen

Agnes Tachyon Build Guide | Musume Derby Pretty

2 minggu yang lalu By Jack chen

Dune: Awakening - Lanjutan Planetologist Quest Walkthrough

4 minggu yang lalu By Jack chen

Tarikh Segala -galanya: Panduan Hubungan Dirk dan Harper

4 minggu yang lalu By Jack chen

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

8639

Tutorial Java

1785

Tutorial CakePHP

1729

Tutorial Laravel

1581

Tutorial PHP

1445

Tunjukkan Lagi

Related knowledge

Bagaimanakah rangka kerja Python atau PyTest memudahkan ujian automatik? Jun 19, 2025 am 01:10 AM

Python's Unittest and Pytest adalah dua kerangka ujian yang digunakan secara meluas yang memudahkan penulisan, penganjuran dan menjalankan ujian automatik. 1. Kedua -duanya menyokong penemuan automatik kes ujian dan menyediakan struktur ujian yang jelas: Unittest mentakrifkan ujian dengan mewarisi kelas ujian dan bermula dengan ujian \ _; Pytest lebih ringkas, hanya memerlukan fungsi bermula dengan ujian \ _. 2. Mereka semua mempunyai sokongan dakwaan terbina dalam: Unittest menyediakan kaedah AssertEqual, AssertTrue dan lain-lain, manakala PYTest menggunakan pernyataan menegaskan yang dipertingkatkan untuk memaparkan butiran kegagalan secara automatik. 3. Semua mempunyai mekanisme untuk mengendalikan penyediaan ujian dan pembersihan: un

Bagaimanakah Python boleh digunakan untuk analisis data dan manipulasi dengan perpustakaan seperti numpy dan panda? Jun 19, 2025 am 01:04 AM

Pythonisidealfordataanalysisysisduetonumpyandpandas.1) numpyexcelsatnumericalcomputationswithfast, multi-dimensiArarraySandvectorizedoperationsLikenp.sqrt ()

Apakah teknik pengaturcaraan dinamik, dan bagaimana saya menggunakannya dalam Python? Jun 20, 2025 am 12:57 AM

Pengaturcaraan Dinamik (DP) mengoptimumkan proses penyelesaian dengan memecahkan masalah kompleks ke dalam subproblem yang lebih mudah dan menyimpan hasilnya untuk mengelakkan pengiraan berulang. Terdapat dua kaedah utama: 1. Top-down (Hafalan): Recursif menguraikan masalah dan menggunakan cache untuk menyimpan hasil pertengahan; 2. Bottom-Up (Jadual): Bangun secara beransur-ansur dari keadaan asas. Sesuai untuk senario di mana nilai maksimum/minimum, penyelesaian optimum atau subproblem yang bertindih diperlukan, seperti urutan Fibonacci, masalah backpacking, dan lain -lain.

Bagaimana anda boleh melaksanakan iterators tersuai di Python menggunakan __iter__ dan __Next__? Jun 19, 2025 am 01:12 AM

Untuk melaksanakan iterator tersuai, anda perlu menentukan kaedah __iter__ dan __Next__ di dalam kelas. ① Kaedah __iter__ mengembalikan objek iterator itu sendiri, biasanya diri sendiri, bersesuaian dengan persekitaran berulang seperti untuk gelung; ② Kaedah __Next__ mengawal nilai setiap lelaran, mengembalikan elemen seterusnya dalam urutan, dan apabila tidak ada lagi item, pengecualian hentian harus dibuang; ③ Status mesti dikesan dengan betul dan keadaan penamatan mesti ditetapkan untuk mengelakkan gelung tak terhingga; ④ Logik kompleks seperti penapisan talian fail, dan perhatikan pembersihan sumber dan pengurusan memori; ⑤ Untuk logik mudah, anda boleh mempertimbangkan menggunakan hasil fungsi penjana sebaliknya, tetapi anda perlu memilih kaedah yang sesuai berdasarkan senario tertentu.

Apakah trend yang muncul atau arahan masa depan dalam bahasa pengaturcaraan Python dan ekosistemnya? Jun 19, 2025 am 01:09 AM

Trend masa depan dalam Python termasuk pengoptimuman prestasi, jenis yang lebih kuat, peningkatan runtime alternatif, dan pertumbuhan berterusan bidang AI/ML. Pertama, Cpython terus mengoptimumkan, meningkatkan prestasi melalui masa permulaan yang lebih cepat, pengoptimuman panggilan fungsi dan operasi integer yang dicadangkan; Kedua, jenis petikan sangat terintegrasi ke dalam bahasa dan alat untuk meningkatkan pengalaman keselamatan dan pembangunan kod; Ketiga, runtime alternatif seperti Pyscript dan Nuitka menyediakan fungsi baru dan kelebihan prestasi; Akhirnya, bidang AI dan Sains Data terus berkembang, dan perpustakaan yang muncul mempromosikan pembangunan dan integrasi yang lebih cekap. Trend ini menunjukkan bahawa Python sentiasa menyesuaikan diri dengan perubahan teknologi dan mengekalkan kedudukan utama.

Bagaimana saya melakukan pengaturcaraan rangkaian di python menggunakan soket? Jun 20, 2025 am 12:56 AM

Modul soket Python adalah asas pengaturcaraan rangkaian, menyediakan fungsi komunikasi rangkaian peringkat rendah, sesuai untuk membina aplikasi klien dan pelayan. Untuk menyediakan pelayan TCP asas, anda perlu menggunakan socket.socket () untuk membuat objek, mengikat alamat dan port, panggilan. Listen () untuk mendengar sambungan, dan menerima sambungan klien melalui .accept (). Untuk membina klien TCP, anda perlu membuat objek soket dan panggilan .Connect () untuk menyambung ke pelayan, kemudian gunakan .sendall () untuk menghantar data dan .recv () untuk menerima respons. Untuk mengendalikan pelbagai pelanggan, anda boleh menggunakan 1. Threads: Mulakan benang baru setiap kali anda menyambung; 2. Asynchronous I/O: Sebagai contoh, Perpustakaan Asyncio dapat mencapai komunikasi yang tidak menyekat. Perkara yang perlu diperhatikan

Polimorfisme dalam kelas python Jul 05, 2025 am 02:58 AM

Polimorfisme adalah konsep teras dalam pengaturcaraan berorientasikan objek Python, merujuk kepada "satu antara muka, pelbagai pelaksanaan", yang membolehkan pemprosesan bersatu pelbagai jenis objek. 1. Polimorfisme dilaksanakan melalui penulisan semula kaedah. Subkelas boleh mentakrifkan semula kaedah kelas induk. Sebagai contoh, kaedah bercakap () kelas haiwan mempunyai pelaksanaan yang berbeza dalam subkelas anjing dan kucing. 2. Penggunaan praktikal polimorfisme termasuk memudahkan struktur kod dan meningkatkan skalabilitas, seperti memanggil kaedah cabutan () secara seragam dalam program lukisan grafik, atau mengendalikan tingkah laku umum watak -watak yang berbeza dalam pembangunan permainan. 3. Polimorfisme pelaksanaan Python perlu memenuhi: Kelas induk mentakrifkan kaedah, dan kelas kanak -kanak mengatasi kaedah, tetapi tidak memerlukan warisan kelas induk yang sama. Selagi objek melaksanakan kaedah yang sama, ini dipanggil "jenis itik". 4. Perkara yang perlu diperhatikan termasuk penyelenggaraan

Bagaimana saya mengiris senarai dalam python? Jun 20, 2025 am 12:51 AM

Jawapan teras kepada pengirim senarai Python adalah menguasai sintaks [Start: End: Step] dan memahami kelakuannya. 1. Format asas pengirim senarai adalah senarai [Mula: akhir: langkah], di mana permulaan adalah indeks permulaan (termasuk), akhir adalah indeks akhir (tidak termasuk), dan langkah adalah saiz langkah; 2. Omit Mula secara lalai bermula dari 0, endek akhir secara lalai hingga akhir, omite langkah secara lalai kepada 1; 3. Gunakan my_list [: n] untuk mendapatkan item n pertama, dan gunakan my_list [-n:] untuk mendapatkan item n yang terakhir; 4. Gunakan langkah untuk melangkau unsur -unsur, seperti my_list [:: 2] untuk mendapatkan angka, dan nilai langkah negatif dapat membalikkan senarai; 5. Kesalahpahaman biasa termasuk indeks akhir tidak

See all articles

国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

Mengoptimumkan GPT-mini OpenAI untuk Mengesan Teks Dijana AI Menggunakan DSPy

Pemuatan Set Data

Persediaan Model

Menilai Pengesan

Mengoptimumkan dengan DSPy

Keputusan dan Lelaran

Kesimpulan

Alat AI Hot

Undress AI Tool

Undresser.AI Undress

AI Clothes Remover

Clothoff.io

Video Face Swap

Artikel Panas

Alat panas

Notepad++7.3.1

SublimeText3 versi Cina

Hantar Studio 13.0.1

Dreamweaver CS6

SublimeText3 versi Mac

Topik panas