


Cipta AI RAG Chatbot Anda Sendiri: Panduan Python dengan LangChain
Oct 20, 2024 pm 02:15 PMSiapa yang tidak mahu jawapan segera daripada dokumen mereka? Itulah yang dilakukan oleh bot sembang RAG—menggabungkan pengambilan semula dengan penjanaan AI untuk respons yang cepat dan tepat!
Dalam panduan ini, saya akan menunjukkan kepada anda cara membuat chatbot menggunakan Retrieval-Augmented Generation (RAG) dengan LangChain dan Streamlit. Chatbot ini akan menarik maklumat yang berkaitan daripada pangkalan pengetahuan dan menggunakan model bahasa untuk menjana respons.
Saya akan membimbing anda melalui setiap langkah, menyediakan berbilang pilihan untuk penjanaan respons, sama ada anda menggunakan OpenAI, Gemini atau Bunga Bunga—memastikan fleksibel dan penyelesaian kos efektif.
Apakah itu Penjanaan Dipertingkatkan (RAG)?
RAG ialah kaedah yang menggabungkan pendapatan semula dan penjanaan untuk menyampaikan respons chatbot yang lebih tepat dan peka konteks. Proses mendapatkan semula menarik dokumen yang berkaitan daripada pangkalan pengetahuan, manakala proses penjanaan menggunakan model bahasa untuk mencipta respons yang koheren berdasarkan kandungan yang diambil. Ini memastikan chatbot anda boleh menjawab soalan menggunakan data terbaharu, walaupun model bahasa itu sendiri belum dilatih secara khusus mengenai maklumat tersebut.
Bayangkan anda mempunyai pembantu peribadi yang tidak selalu tahu jawapan kepada soalan anda. Jadi, apabila anda bertanya soalan, mereka melihat melalui buku dan mencari maklumat yang relevan (pendapatan semula), kemudian mereka meringkaskan maklumat itu dan memberitahunya kembali kepada anda dalam perkataan mereka sendiri (generasi). Ini pada asasnya cara RAG berfungsi, menggabungkan yang terbaik dari kedua-dua dunia.
Dalam proses RAG Carta Alir akan kelihatan seperti ini:
Sekarang, mari kita mulakan, dan dapatkan chatbot kita sendiri!
Menyediakan Persekitaran Projek
Kami akan menggunakan Python kebanyakannya dalam TUTO ini, jika anda ketua JS, anda boleh mengikuti penjelasan dan meneliti dokumentasi langchain js.
Pertama, kita perlu menyediakan persekitaran projek kita. Ini termasuk mencipta direktori projek, memasang kebergantungan dan menyediakan kunci API untuk model bahasa yang berbeza.
1. Cipta Folder Projek dan Persekitaran Maya
Mulakan dengan mencipta folder projek dan persekitaran maya:
mkdir rag-chatbot cd rag-chatbot python -m venv venv source venv/bin/activate
2. Pasang Ketergantungan
Seterusnya, buat fail requirements.txt untuk menyenaraikan semua kebergantungan yang diperlukan:
langchain==0.0.329 streamlit==1.27.2 faiss-cpu==1.7.4 python-dotenv==1.0.0 tiktoken==0.5.1 openai==0.27.10 gemini==0.3.1 fireworks==0.4.0 sentence_transformers==2.2.2
Sekarang, pasang kebergantungan ini:
pip install -r requirements.txt
3. Menyediakan Kekunci API
Kami akan menggunakan OpenAI, Gemini atau Bunga Api untuk penjanaan respons chatbot. Anda boleh memilih mana-mana daripada ini berdasarkan keutamaan anda.
Jangan risau jika anda sedang bereksperimen, Fireworks menyediakan kunci API bernilai $1 secara percuma, dan model gemini-1.5-flash juga percuma sedikit sebanyak!
Sediakan fail .env untuk menyimpan kunci API untuk model pilihan anda:
mkdir rag-chatbot cd rag-chatbot python -m venv venv source venv/bin/activate
Pastikan anda mendaftar untuk perkhidmatan ini dan dapatkan kunci API anda. Kedua-dua Gemini dan Bunga Api menawarkan peringkat percuma, manakala OpenAI mengenakan caj berdasarkan penggunaan.
Pemprosesan dan Pecahan Dokumen
Untuk memberikan konteks chatbot, kami perlu memproses dokumen dan membahagikannya kepada bahagian yang boleh diurus. Ini penting kerana teks yang besar perlu dipecahkan untuk dibenamkan dan pengindeksan.
1. Cipta document_processor.py
Buat skrip Python baharu yang dipanggil document_processor.py untuk mengendalikan pemprosesan dokumen:
langchain==0.0.329 streamlit==1.27.2 faiss-cpu==1.7.4 python-dotenv==1.0.0 tiktoken==0.5.1 openai==0.27.10 gemini==0.3.1 fireworks==0.4.0 sentence_transformers==2.2.2
Skrip ini memuatkan fail teks dan membahagikannya kepada ketulan yang lebih kecil iaitu kira-kira 1000 aksara dengan pertindihan kecil untuk memastikan tiada konteks hilang antara ketulan. Setelah diproses, dokumen sedia untuk dibenamkan dan diindeks.
Mencipta Pembenaman dan Pengindeksan
Sekarang dokumen kami telah dipotong, langkah seterusnya ialah menukarnya kepada benam (pewakilan berangka teks) dan mengindeksnya untuk mendapatkan semula dengan pantas. (kerana mesin memahami nombor lebih mudah daripada perkataan)
1. Cipta embedding_indexer.py
Buat skrip lain yang dipanggil embedding_indexer.py:
pip install -r requirements.txt
Dalam skrip ini, benam dibuat menggunakan model Muka Memeluk (semua-MiniLM-L6-v2). Kami kemudian menyimpan pembenaman ini dalam kedai vektor FAISS, yang membolehkan kami mendapatkan semula potongan teks yang serupa dengan cepat berdasarkan pertanyaan.
Melaksanakan Retrieval dan Penjanaan Respons
Inilah bahagian yang menarik: menggabungkan pencarian semula dengan penjanaan bahasa! Anda kini akan membuat rantaian RAG yang mengambil bahagian yang berkaitan daripada kedai vektor dan menjana respons menggunakan model bahasa. (vectorstore ialah pangkalan data tempat kami menyimpan data kami ditukar kepada nombor sebagai vektor)
1. Cipta rag_chain.py
Mari buat fail rag_chain.py:
# Uncomment your API key # OPENAI_API_KEY=your_openai_api_key_here # GEMINI_API_KEY=your_gemini_api_key_here # FIREWORKS_API_KEY=your_fireworks_api_key_here
Di sini, kami memberi anda pilihan antara OpenAI, Gemini atau Bunga Api berdasarkan kunci API yang anda berikan. Rantaian RAG akan mendapatkan semula 3 dokumen paling relevan teratas dan menggunakan model bahasa untuk menjana respons.
Anda boleh bertukar antara model bergantung pada belanjawan atau pilihan penggunaan anda—Gemini dan Bunga Bunga adalah percuma, manakala OpenAI mengenakan caj berdasarkan penggunaan.
Membina Antara Muka Chatbot
Kini, kami akan membina antara muka bot sembang yang mudah untuk mengambil input pengguna dan menjana respons menggunakan rantaian RAG kami.
1. Cipta chatbot.py
Buat fail baharu yang dipanggil chatbot.py:
mkdir rag-chatbot cd rag-chatbot python -m venv venv source venv/bin/activate
Skrip ini mencipta antara muka chatbot baris perintah yang mendengar input pengguna secara berterusan, memprosesnya melalui rantai RAG dan mengembalikan respons yang dijana.
Mencipta UI Streamlit
Sudah tiba masanya untuk menjadikan bot sembang anda lebih mesra pengguna dengan membina antara muka web menggunakan Streamlit. Ini akan membolehkan pengguna berinteraksi dengan chatbot anda melalui penyemak imbas.
1. Cipta app.py
Buat app.py:
langchain==0.0.329 streamlit==1.27.2 faiss-cpu==1.7.4 python-dotenv==1.0.0 tiktoken==0.5.1 openai==0.27.10 gemini==0.3.1 fireworks==0.4.0 sentence_transformers==2.2.2
2. Jalankan Apl Streamlit
Untuk menjalankan apl Streamlit anda, hanya gunakan:
pip install -r requirements.txt
Ini akan melancarkan antara muka web di mana anda boleh memuat naik fail teks, bertanya soalan dan menerima jawapan daripada chatbot.
Mengoptimumkan Prestasi
Untuk prestasi yang lebih baik, anda boleh bereksperimen dengan saiz ketulan dan bertindih apabila membelah teks. Ketulan yang lebih besar memberikan lebih banyak konteks, tetapi ketulan yang lebih kecil boleh membuat pengambilan lebih cepat. Anda juga boleh menggunakan Streamlit caching untuk mengelak daripada mengulangi operasi yang mahal seperti menjana benam.
Jika anda ingin mengoptimumkan kos, anda boleh bertukar antara OpenAI, Gemini atau Bunga Api bergantung pada kerumitan pertanyaan—gunakan OpenAI untuk soalan yang rumit dan Gemini atau Bunga Bunga untuk soalan yang lebih mudah untuk mengurangkan kos.
Membungkus
Tahniah! Anda telah berjaya mencipta chatbot berasaskan RAG anda sendiri. Kini, kemungkinannya tidak berkesudahan:
- Buat rakan belajar peribadi anda sendiri.
- Tiada lagi melalui dokumentasi yang panjang—hanya "RAG it out" untuk jawapan yang cepat dan tepat!
Perjalanan bermula di sini, dan potensinya tidak terhad!
Anda boleh mengikuti kerja saya di GitHub. Jangan ragu untuk menghubungi—DM saya sentiasa terbuka di X dan LinkedIn.
Atas ialah kandungan terperinci Cipta AI RAG Chatbot Anda Sendiri: Panduan Python dengan LangChain. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Polimorfisme adalah konsep teras dalam pengaturcaraan berorientasikan objek Python, merujuk kepada "satu antara muka, pelbagai pelaksanaan", yang membolehkan pemprosesan bersatu pelbagai jenis objek. 1. Polimorfisme dilaksanakan melalui penulisan semula kaedah. Subkelas boleh mentakrifkan semula kaedah kelas induk. Sebagai contoh, kaedah bercakap () kelas haiwan mempunyai pelaksanaan yang berbeza dalam subkelas anjing dan kucing. 2. Penggunaan praktikal polimorfisme termasuk memudahkan struktur kod dan meningkatkan skalabilitas, seperti memanggil kaedah cabutan () secara seragam dalam program lukisan grafik, atau mengendalikan tingkah laku umum watak -watak yang berbeza dalam pembangunan permainan. 3. Polimorfisme pelaksanaan Python perlu memenuhi: Kelas induk mentakrifkan kaedah, dan kelas kanak -kanak mengatasi kaedah, tetapi tidak memerlukan warisan kelas induk yang sama. Selagi objek melaksanakan kaedah yang sama, ini dipanggil "jenis itik". 4. Perkara yang perlu diperhatikan termasuk penyelenggaraan

"Hello, dunia!" Program adalah contoh paling asas yang ditulis dalam Python, yang digunakan untuk menunjukkan sintaks asas dan mengesahkan bahawa persekitaran pembangunan dikonfigurasi dengan betul. 1. Ia dilaksanakan melalui garis cetakan kod ("Hello, World!"), Dan selepas berlari, teks yang ditentukan akan dikeluarkan pada konsol; 2. Langkah -langkah berjalan termasuk memasang python, menulis kod dengan editor teks, menyimpan sebagai fail .py, dan melaksanakan fail di terminal; 3. Kesilapan umum termasuk kurungan atau petikan yang hilang, penyalahgunaan cetakan modal, tidak menyimpan format .py, dan kesilapan persekitaran yang menjalankan; 4. Alat pilihan termasuk terminal editor teks tempatan, editor dalam talian (seperti replit.com)

Untuk menghasilkan rentetan rawak, anda boleh menggunakan kombinasi modul rawak dan rentetan Python. Langkah -langkah khusus ialah: 1. Import modul rawak dan rentetan; 2. Tentukan kolam watak seperti string.ascii_letters dan string.digits; 3. Tetapkan panjang yang diperlukan; 4. Panggil Random.Choices () untuk menjana rentetan. Sebagai contoh, kod tersebut termasuk importrandom dan importstring, set panjang = 10, aksara = string.ascii_letters string.digits dan laksanakan '' .join (random.c

Algorithmmsinpythonareessentialforefficientplemlemen-solvinginprogramming.theyarestep-by-stepproceduresedtosolvetaskslikesorting, carian, anddatamanipulation.CommontypesincludesortalgorithmslinybineShmseCkeCkeCkeCkeCkeCkeCkeCkeCkeCkeCkeCkeCkeCkeCkeChmmsline, carianShmseKorithmseCkeCkeChmmmslareLineShmseKorithmmslareLineShmmslikeCkeCkeCksort,

Listslicinginpythonextractsaportionofalistusingindices.1.itusesthesyntaxlist [start: end: step], wherestartislusive, endisexclusive, andstepdefinestheinterval.2.ifstartorendareomitt

Kaedah kelas adalah kaedah yang ditakrifkan dalam python melalui penghias @classmethod. Parameter pertamanya adalah kelas itu sendiri (CLS), yang digunakan untuk mengakses atau mengubah keadaan kelas. Ia boleh dipanggil melalui kelas atau contoh, yang mempengaruhi seluruh kelas dan bukannya contoh tertentu; Sebagai contoh, dalam kelas orang, kaedah show_count () mengira bilangan objek yang dibuat; Apabila menentukan kaedah kelas, anda perlu menggunakan penghias @classmethod dan namakan parameter pertama CLS, seperti kaedah change_var (new_value) untuk mengubah suai pembolehubah kelas; Kaedah kelas adalah berbeza daripada kaedah contoh (parameter diri) dan kaedah statik (tiada parameter automatik), dan sesuai untuk kaedah kilang, pembina alternatif, dan pengurusan pembolehubah kelas. Kegunaan biasa termasuk:

Modul CSV Python menyediakan cara mudah untuk membaca dan menulis fail CSV. 1. Apabila membaca fail CSV, anda boleh menggunakan csv.reader () untuk membaca garis mengikut baris dan mengembalikan setiap baris data sebagai senarai rentetan; Jika anda perlu mengakses data melalui nama lajur, anda boleh menggunakan csv.dictreader () untuk memetakan setiap baris ke dalam kamus. 2. Apabila menulis ke fail CSV, gunakan kaedah CSV.Writer () dan hubungi Writerow () atau Writerows () untuk menulis satu baris data tunggal atau berbilang; Jika anda ingin menulis data kamus, gunakan csv.dictwriter (), anda perlu menentukan nama lajur terlebih dahulu dan tulis tajuk melalui WriteHeader (). 3. Semasa mengendalikan kes kelebihan, modul secara automatik mengendalikannya

Parameter adalah ruang letak apabila menentukan fungsi, sementara argumen adalah nilai khusus yang diluluskan ketika memanggil. 1. Parameter kedudukan perlu diluluskan, dan perintah yang salah akan membawa kepada kesilapan dalam hasilnya; 2. Parameter kata kunci ditentukan oleh nama parameter, yang boleh mengubah pesanan dan meningkatkan kebolehbacaan; 3. Nilai parameter lalai diberikan apabila ditakrifkan untuk mengelakkan kod pendua, tetapi objek berubah harus dielakkan sebagai nilai lalai; 4 Args dan *kwargs boleh mengendalikan bilangan parameter yang tidak pasti dan sesuai untuk antara muka umum atau penghias, tetapi harus digunakan dengan berhati -hati untuk mengekalkan kebolehbacaan.
