poronovideos极度另类,av天堂网avtt

首頁

科技週邊

人工智慧

使用DeepSeek R1構(gòu)建RQA系統(tǒng)並簡化

Christopher Nolan

Mar 07, 2025 am 10:43 AM

> DeepSeek R1：通過基於檢索的問題回答

的AI應(yīng)用開創(chuàng)性的開源推理模型

DeepSeek R1正在迅速獲得其在構(gòu)建AI應(yīng)用方面的效率和準(zhǔn)確性的吸引力。本文詳細介紹了使用DeepSeek R1，Langchain和簡化的基於檢索的問答（RQA）系統(tǒng)的構(gòu)建。我們將在實際推理任務(wù)中探索其功能，並在實際應(yīng)用中展示其功能。

鍵學(xué)習(xí)成果：

掌握由DeepSeek R1驅(qū)動的RQA系統(tǒng)的增強的推理和解決問題的能力。
學(xué)會將DeepSeek R1集成到基於檢索的問題解答系統(tǒng)中。
>分析現(xiàn)實世界DeepSeek R1在編碼，數(shù)學(xué)和邏輯推理中的應(yīng)用。
（本文是數(shù)據(jù)科學(xué)博客馬拉鬆的一部分。）目錄的
表：

了解DeepSeek R1

> DeepSeek R1-Zero和R1培訓(xùn)

> DeepSeek R1的四個訓(xùn)練階段

> DeepSeek R1的關(guān)鍵功能

的本地部署
構(gòu)建RQA系統(tǒng)
>理解DeepSeek R1
在AI的動態(tài)領(lǐng)域，開源基礎(chǔ)模型正在改變企業(yè)AI的開發(fā)。由中國人工智能公司DeepSeek開發(fā)的DeepSeek R1是一種開源推理模型，旨在在需要邏輯推理，數(shù)學(xué)解決問題和實時決策的任務(wù)上表現(xiàn)出色。從一般推理到代碼生成的各種應(yīng)用程序，它的效率和性能延伸。 >
>

>許多大型語言模型（LLMS）遵循三階段的培訓(xùn)過程（預(yù)訓(xùn)練，監(jiān)督微調(diào)和強化學(xué)習(xí)），但DeepSeek R1-Zero採用了另一種方法。它利用了預(yù)先訓(xùn)練的DeepSeek-V3基本模型（6710億參數(shù)）和跳過監(jiān)督的微調(diào)，直接利用稱為組相對策略優(yōu)化（GRPO）的大規(guī)模增強學(xué)習(xí)技術(shù)。

基於近端策略優(yōu)化（PPO）的

> DeepSeek R1的四個訓(xùn)練階段

> DeepSeek R1建立在DeepSeek R1-Zero的基礎(chǔ)之上，並結(jié)合了四個關(guān)鍵培訓(xùn)階段：

冷啟動：在DeepSeek R1-Zero數(shù)據(jù)的高質(zhì)量子集上進行微調(diào)以增強可讀性。
推理強化學(xué)習(xí)：通過跨編碼，數(shù)學(xué)，科學(xué)和邏輯領(lǐng)域的大規(guī)模強化學(xué)習(xí)來增強推理技能。
拒絕採樣和監(jiān)督微調(diào)：生成多個樣本，僅通過拒絕採樣保留正確且可讀的樣本，然後再通過生成獎勵模型進行進一步的微調(diào)。 >
>多樣化的強化學(xué)習(xí)：利用基於規(guī)則的獎勵來完成數(shù)學(xué)和語言模型反饋以與人類偏好保持一致。

> deepSeek r1的密鑰特徵

>促進檢查，修改和集成到各種項目中。在GitHub和Azure AI Foundry等平臺上可用。

高性能：

可與各種基準(zhǔn)（數(shù)學(xué)，代碼生成，複雜推理）上的OpenAI的GPT-4媲專家（MOE）體系結(jié)構(gòu)的混合物

> ： 67.1億個參數(shù)模型僅激活每個正向參數(shù)370億個參數(shù)，優(yōu)化效率。

蒸餾型：提供較小，更可部署的型號（例如，DeepSeek-R1-Distill-Qwen-32b，Qwen-1.5b，7b，7b，14b）。 >

DeepSeek r1

本地部署

>使用Ollama很簡單：

>安裝Ollama。

在您的終端中運行以下命令（可以選擇模型大小）：>

構(gòu)建使用DeepSeek R1

ollama run deepseek-r1   # Default 7B model
ollama run deepseek-r1:1.5b # Specific model

的RQA系統(tǒng) Building a RQA System with DeepSeek R1 and Streamlit 讓我們使用langchain和deepseek r1構(gòu)建一個RQA系統(tǒng)：

步驟1：導(dǎo)入庫>

（步驟2-10：構(gòu)建簡易應(yīng)用程序的其餘步驟，包括文件上傳，嵌入創(chuàng)建，矢量存儲生成，檢索器設(shè)置，LLM定義，提示模板創(chuàng)建，QA鏈創(chuàng)建，UI定義和UI實現(xiàn)，與原始響應(yīng)相同。請參閱原始響應(yīng)。

輸出示例：

（用示例查詢和響應(yīng)說明了應(yīng)用程序的功能。）>

import streamlit as st
from langchain_community.document_loaders.csv_loader import CSVLoader
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS
from langchain_community.llms import Ollama
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain.chains.combine_documents.stuff import create_stuff_documents_chain
from langchain.chains import RetrievalQA

結(jié)論

DeepSeek R1代表了AI推理模型的重大進步。它的複雜技術(shù)和開源可訪問性的結(jié)合使其成為開發(fā)人員的強大工具。 RQA系統(tǒng)示例展示了其實際應(yīng)用和未來創(chuàng)新的潛力。

鑰匙要點：