国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
目錄
什麼是Markitdown MCP?
Markitdown MCP的主要特徵
降級(jí)在工作流程中的作用
設(shè)置Markitdown MCP服務(wù)器進(jìn)行集成
安裝
服務(wù)器配置
用標(biāo)記MCP轉(zhuǎn)換的降價(jià)轉(zhuǎn)換
步驟1:首先導(dǎo)入必要的庫(kù)。
步驟2:初始化Groq LLM,這是免費(fèi)的。您可以在這裡找到API鍵
步驟3:配置MCP服務(wù)器
步驟4:現(xiàn)在,定義異步功能
步驟5:此代碼調(diào)用run_conversion函數(shù)
輸出
完整代碼
LLM管道中的實(shí)際用例
結(jié)論
常見(jiàn)問(wèn)題
首頁(yè) 科技週邊 人工智慧 Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!

Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!

Apr 27, 2025 am 09:47 AM

處理文檔不再只是在您的AI項(xiàng)目中打開(kāi)文件,而是將混亂變成清晰度。諸如PDF,PowerPoints和Word之類(lèi)的文檔以各種形狀和大小淹沒(méi)了我們的工作流程。從這些文檔中檢索結(jié)構(gòu)化的內(nèi)容已成為當(dāng)今一項(xiàng)艱鉅的任務(wù)。 Microsoft的Markitdown MCP(Markdown轉(zhuǎn)換協(xié)議)簡(jiǎn)化了這一點(diǎn)。它將各種文件轉(zhuǎn)換為結(jié)構(gòu)化的標(biāo)記格式。這有助於開(kāi)發(fā)人員和技術(shù)作家改善文檔工作流程。本文解釋了Markitdown MCP並顯示了其用法。我們將介紹設(shè)置MarkitDown MCP服務(wù)器,還將在此協(xié)議的上下文中討論MarkitDown。在下面還介紹了使用標(biāo)記MCP服務(wù)器進(jìn)行測(cè)試。

目錄

  • 什麼是Markitdown MCP?
    • Markitdown MCP的主要特徵
  • 降級(jí)在工作流程中的作用
  • 設(shè)置Markitdown MCP服務(wù)器進(jìn)行集成
    • 安裝
    • 服務(wù)器配置
  • 用標(biāo)記MCP轉(zhuǎn)換的降價(jià)轉(zhuǎn)換
    • 步驟1:首先導(dǎo)入必要的庫(kù)。
    • 步驟2:初始化Groq LLM,這是免費(fèi)的。您可以在這裡找到API鍵
    • 步驟3:配置MCP服務(wù)器
    • 步驟4:現(xiàn)在,定義異步功能
    • 步驟5:此代碼調(diào)用run_conversion函數(shù)
  • LLM管道中的實(shí)際用例
  • 結(jié)論
  • 常見(jiàn)問(wèn)題

什麼是Markitdown MCP?

Markitdown MCP提供了用於文檔轉(zhuǎn)換的標(biāo)準(zhǔn)方法。它充當(dāng)服務(wù)器端協(xié)議。它在後端使用Microsoft的Markitdown庫(kù)。服務(wù)器託管一個(gè)靜止的API。用戶將諸如PDF或Word文件之類(lèi)的文檔發(fā)送到此服務(wù)器。然後,服務(wù)器處理這些文件。它使用高級(jí)解析和特定格式規(guī)則。輸出是保留原始文檔結(jié)構(gòu)的標(biāo)記文本。

Markitdown MCP的主要特徵

Markitdown MCP服務(wù)器包含幾個(gè)有用的功能:

  • 寬格式支持:它將PDF,DOCX和PPTX(例如PPTX)等通用文件轉(zhuǎn)換為Markdown。
  • 結(jié)構(gòu)保存:它使用方法來(lái)理解和維護(hù)文檔佈局,例如標(biāo)題和列表。
  • 可配置的輸出:用戶可以調(diào)整設(shè)置以控制最終的標(biāo)記樣式。
  • 服務(wù)器操作:它作為服務(wù)器過(guò)程運(yùn)行。這允許集成到自動(dòng)化系統(tǒng)和雲(yún)設(shè)置中。

降級(jí)在工作流程中的作用

Markdown是文檔的流行格式。它的簡(jiǎn)單語(yǔ)法使讀寫(xiě)易於讀寫(xiě)。像GitHub這樣的許多平臺(tái)都很好地支持了它。靜態(tài)站點(diǎn)發(fā)生器經(jīng)常使用它。將其他格式轉(zhuǎn)換為手動(dòng)花費(fèi)時(shí)間。 Markitdown MCP自動(dòng)進(jìn)行此轉(zhuǎn)換。這提供了明顯的好處:

  • 有效的內(nèi)容處理:將源文檔轉(zhuǎn)換為可用的降價(jià)。
  • 一致的協(xié)作:標(biāo)準(zhǔn)格式可幫助團(tuán)隊(duì)一起在文檔上共同努力。
  • 流程自動(dòng)化:在較大的自動(dòng)化工作流程中包括文檔轉(zhuǎn)換。

設(shè)置Markitdown MCP服務(wù)器進(jìn)行集成

我們可以使用GitHub Repo中提到的Docker Image(例如Claude,Windsurf,Cursor)等不同客戶端設(shè)置Markitdown MCP服務(wù)器。但是在這裡,我們將使用Langchain的MCP適配器創(chuàng)建本地MCP客戶端。我們需要運(yùn)行服務(wù)器將其與Langchain一起使用。服務(wù)器支持不同的運(yùn)行模式。

安裝

首先,安裝所需的Python軟件包。

 PIP安裝MarkitDown-MCP langchain langchain_mcp_adapters langgraph langchain_groq

服務(wù)器配置

使用STDIO模式運(yùn)行標(biāo)記MCP服務(wù)器。此模式連接標(biāo)準(zhǔn)輸入和輸出流。它適用於基於腳本的集成。直接在終端運(yùn)行以下內(nèi)容。

 Markitdown-MCP

服務(wù)器將開(kāi)始運(yùn)行一些警告。

Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!

我們還可以使用SSE(服務(wù)器範(fàn)圍事件)模式。此模式適合Web應(yīng)用程序或長(zhǎng)期運(yùn)行的連接。設(shè)置標(biāo)記MCP服務(wù)器以測(cè)試特定方案時(shí)也很有用。

 MarkitDown-MCP  -  -SSE--host 127.0.0.1-港口3001

選擇適合您集成計(jì)劃的模式。使用服務(wù)器通過(guò)STDIO本地測(cè)試通常是一個(gè)良好的開(kāi)始。我們建議在本文中使用STDIO模式。

用標(biāo)記MCP轉(zhuǎn)換的降價(jià)轉(zhuǎn)換

我們已經(jīng)介紹瞭如何使用Langchain在我們以前的博客MCP客戶端服務(wù)器中使用Langchain在本地建立MCP服務(wù)器和客戶端設(shè)置的方法。

現(xiàn)在,本節(jié)顯示瞭如何與Markitdown MCP服務(wù)器一起使用Langchain。它可以自動(dòng)化PDF文件轉(zhuǎn)換為Markdown。該示例通過(guò)Chatgroq採(cǎi)用了Groq的Llama模型。確保將GROQ API密鑰設(shè)置為環(huán)境變量,或?qū)⑵渲苯觽鬟f給Chatgroq。

步驟1:首先導(dǎo)入必要的庫(kù)。

來(lái)自MCP Import客戶端,StdioServerParameters
來(lái)自mcp.client.stdio import stdio_client
來(lái)自langchain_mcp_adapters.tools import load_mcp_tools
來(lái)自langgraph.prebuilt導(dǎo)入create_react_agent
導(dǎo)入異步
來(lái)自langchain_groq導(dǎo)入changroq

步驟2:初始化Groq LLM,這是免費(fèi)的。您可以在這裡找到API鍵

這是GROQ API密鑰:GROQ API鍵

#初始化groq型號(hào)
model = chatgroq(model =“ meta-llama/llama-4-scout-17b-16e-Instruct”,api_key =“ your_api_key”)

步驟3:配置MCP服務(wù)器

我們正在使用stdioserverparameters,並在此處直接使用已安裝的標(biāo)記MCP軟件包

server_params = stdioserverparameters(
命令=“ MarkitDown-MCP”,
args = []#STDIO模式不需要其他參數(shù)
)

步驟4:現(xiàn)在,定義異步功能

當(dāng)輸入時(shí),這將採(cǎi)用PDF路徑,客戶端開(kāi)始通信。 load_mcp_tools提供了與Markitdown MCP相互作用的功能。然後創(chuàng)建一個(gè)反應(yīng)代理,使用模型和MCP工具。該代碼為PDF創(chuàng)建File_uri,並發(fā)送提示,要求代理使用MCP轉(zhuǎn)換文件。

異步def run_conversion(pdf_path:str):
與stdio_client(server_params)AS(讀,寫(xiě))的異步:
與客戶端的異步(讀,寫(xiě))作為會(huì)話:

等待session.initialize()
打?。ā俺跏蓟疢CP會(huì)話?!保?
#加載可用工具
工具=等待LOAD_MCP_TOOLS(會(huì)話)
打印(f“已加載工具:{[工具中的工具名稱]工具中的工具]}”)

#創(chuàng)建反應(yīng)代理
agent = create_reaeact_agent(型號(hào),工具)
打?。ā皠?chuàng)建的反應(yīng)代理?!保?
#準(zhǔn)備文件URI(將本地路徑轉(zhuǎn)換為file:// uri)
file_uri = f“ file:// {pdf_path}”
#通過(guò)轉(zhuǎn)換請(qǐng)求調(diào)用代理
響應(yīng)=等待代理。 AINVOKE({{

“消息”:[(“用戶”,f“使用MarkitDown MCP將{file_uri}轉(zhuǎn)換為標(biāo)記,只需返回MCP服務(wù)器的輸出)]

}))

#返回最後一條消息內(nèi)容
返迴響應(yīng)[“消息”] [ -  1] .content

步驟5:此代碼調(diào)用run_conversion函數(shù)

我們正在呼籲和提取響應(yīng)中的降價(jià)。它將內(nèi)容保存到pdf.md,最後將輸出打印在終端中。

如果__name__ ==“ __ -main __”:

pdf_path =“/home/home/harsh/downloads/llm評(píng)估.pptx.pdf”#使用絕對(duì)路徑
結(jié)果= asyncio.run(run_conversion(pdf_path))

以F:f的開(kāi)放(“ pdf.md”,'w')
F.Write(結(jié)果)

打?。ā?\ nmarkDown轉(zhuǎn)換結(jié)果:”)
打?。ńY(jié)果)

輸出

Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!

完整代碼

來(lái)自MCP Import客戶端,StdioServerParameters
來(lái)自mcp.client.stdio import stdio_client

來(lái)自langchain_mcp_adapters.tools import load_mcp_tools
來(lái)自langgraph.prebuilt導(dǎo)入create_react_agent

導(dǎo)入異步
來(lái)自langchain_groq導(dǎo)入changroq
#初始化groq型號(hào)
model = changroq(model =“ meta-llama/llama-4-scout-17b-16e-Instruct”,api_key =“”)
#配置MCP服務(wù)器
server_params = stdioserverparameters(

命令=“ MarkitDown-MCP”,
args = []#STDIO模式不需要其他參數(shù)

)

異步def run_conversion(pdf_path:str):
與stdio_client(server_params)AS(讀,寫(xiě))的異步:

與客戶端的異步(讀,寫(xiě))作為會(huì)話:
等待session.initialize()

打?。ā俺跏蓟疢CP會(huì)話?!保?#加載可用工具
工具=等待LOAD_MCP_TOOLS(會(huì)話)

打印(f“已加載工具:{[工具中的工具名稱]工具中的工具]}”)
#創(chuàng)建反應(yīng)代理

agent = create_reaeact_agent(型號(hào),工具)
打印(“創(chuàng)建的反應(yīng)代理?!保?
#準(zhǔn)備文件URI(將本地路徑轉(zhuǎn)換為file:// uri)

file_uri = f“ file:// {pdf_path}”
#通過(guò)轉(zhuǎn)換請(qǐng)求調(diào)用代理
響應(yīng)=等待代理。 AINVOKE({{

“消息”:[(“用戶”,f“使用MarkitDown MCP將{file_uri}轉(zhuǎn)換為標(biāo)記,只是從MCP服務(wù)器中撤回輸出”)]

}))

#返回最後一條消息內(nèi)容
返迴響應(yīng)[“消息”] [ -  1] .content

如果__name__ ==“ __ -main __”:
pdf_path =“/home/harsh/harsh/downloads/llm評(píng)估.pdf”#使用絕對(duì)路徑

結(jié)果= asyncio.run(run_conversion(pdf_path))
以F:f的開(kāi)放(“ pdf.md”,'w')

F.Write(結(jié)果)
打印(“ \ nmarkDown轉(zhuǎn)換結(jié)果:”)
打?。ńY(jié)果)

檢查輸出

腳本生成一個(gè)pdf.md文件。該文件包含輸入PDF的降價(jià)版本。轉(zhuǎn)換質(zhì)量取決於原始文檔的結(jié)構(gòu)。 Markitdown MCP通常保留元素,例如:

  • 標(biāo)題(不同級(jí)別)
  • 段落文字
  • 列表(子彈和編號(hào))
  • 表(轉(zhuǎn)換為Markdown語(yǔ)法)
  • 代碼塊

輸出

Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!

在輸出中,我們可以看到它成功地檢索了標(biāo)題,內(nèi)容以及降價(jià)格式的普通文本。

因此,運(yùn)行本地服務(wù)器進(jìn)行測(cè)試有助於評(píng)估不同的文檔類(lèi)型。

也觀看:

LLM管道中的實(shí)際用例

集成標(biāo)記MCP可以改善幾個(gè)AI工作流程:

  • 知識(shí)基礎(chǔ)建設(shè):將文檔轉(zhuǎn)換為降價(jià)。將此內(nèi)容攝入知識(shí)庫(kù)或抹布系統(tǒng)。
  • LLM內(nèi)容準(zhǔn)備:將源文件轉(zhuǎn)換為Markdown。為L(zhǎng)LM摘要或分析任務(wù)準(zhǔn)備一致的輸入。
  • 文檔數(shù)據(jù)提取:將帶有表的文檔轉(zhuǎn)換為Markdown。這簡(jiǎn)化了解析結(jié)構(gòu)化數(shù)據(jù)。
  • 文檔自動(dòng)化:生成技術(shù)手冊(cè)。將源文件(例如Word文檔)轉(zhuǎn)換為靜態(tài)站點(diǎn)生成器的Markdown。

結(jié)論

Markitdown MCP提供了一種基於服務(wù)器的功能,用於文檔轉(zhuǎn)換的方法。它處理多種格式。它產(chǎn)生結(jié)構(gòu)化的降價(jià)輸出。將其與LLMS集成可以使文檔處理任務(wù)的自動(dòng)化。這種方法支持可擴(kuò)展的文檔實(shí)踐。使用服務(wù)器進(jìn)行測(cè)試使評(píng)估直接。通過(guò)其在這些工作流程中的實(shí)際應(yīng)用,最好理解MAKITDOWN的MCP。

探索Markitdown MCP GitHub存儲(chǔ)庫(kù)以獲取更多信息。

常見(jiàn)問(wèn)題

Q1。 Markitdown MCP的主要功能是什麼?

Ans。 Markitdown MCP將PDF和Word文件等文檔轉(zhuǎn)換為結(jié)構(gòu)化標(biāo)記。它為此任務(wù)使用基於服務(wù)器的協(xié)議。

Q2。標(biāo)記MCP服務(wù)器可以處理哪些文件格式?

Ans。服務(wù)器處理PDF,DOCX,PPTX和HTML文件。其他格式可以根據(jù)核心庫(kù)支持。

Q3。 Langchain如何使用Markitdown MCP?

Ans。 Langchain使用特殊工具與服務(wù)器進(jìn)行通信。然後,代理可以通過(guò)此服務(wù)器請(qǐng)求文檔轉(zhuǎn)換。

Q4。 Markitdown MCP開(kāi)源嗎?

Ans。是的,它是Microsoft的開(kāi)源軟件。用戶負(fù)責(zé)任何服務(wù)器託管成本。

Q5。我可以運(yùn)行標(biāo)記MCP服務(wù)器以進(jìn)行測(cè)試嗎?

Ans。是的,用於測(cè)試的服務(wù)器可以在本地運(yùn)行。使用STDIO或SSE模式進(jìn)行開(kāi)發(fā)和評(píng)估。

以上是Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開(kāi)發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺(jué)化網(wǎng)頁(yè)開(kāi)發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)程式碼編輯軟體(SublimeText3)

熱門(mén)話題

從採(cǎi)用到優(yōu)勢(shì):2025年塑造企業(yè)LLM的10個(gè)趨勢(shì) 從採(cǎi)用到優(yōu)勢(shì):2025年塑造企業(yè)LLM的10個(gè)趨勢(shì) Jun 20, 2025 am 11:13 AM

以下是重塑企業(yè)AI景觀的十種引人注目的趨勢(shì)。對(duì)LLMSorganizations的財(cái)務(wù)承諾正在大大增加其在LLMS的投資,其中72%的人預(yù)計(jì)他們的支出今年會(huì)增加。目前,近40%a

AI投資者停滯不前? 3條購(gòu)買(mǎi),建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 AI投資者停滯不前? 3條購(gòu)買(mǎi),建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 Jul 02, 2025 am 11:13 AM

投資蓬勃發(fā)展,但僅資本還不夠。隨著估值的上升和獨(dú)特性的衰落,以AI為中心的風(fēng)險(xiǎn)投資的投資者必須做出關(guān)鍵決定:購(gòu)買(mǎi),建立或合作夥伴才能獲得優(yōu)勢(shì)?這是評(píng)估每個(gè)選項(xiàng)和PR的方法

生成AI的不可阻擋的增長(zhǎng)(AI Outlook第1部分) 生成AI的不可阻擋的增長(zhǎng)(AI Outlook第1部分) Jun 21, 2025 am 11:11 AM

披露:我的公司Tirias Research已向IBM,NVIDIA和本文提到的其他公司諮詢。 Growth驅(qū)動(dòng)力的生成AI採(cǎi)用的激增比最樂(lè)觀的預(yù)測(cè)更具戲劇性。然後,

新蓋洛普?qǐng)?bào)告:AI文化準(zhǔn)備就緒需要新的心態(tài) 新蓋洛普?qǐng)?bào)告:AI文化準(zhǔn)備就緒需要新的心態(tài) Jun 19, 2025 am 11:16 AM

廣泛採(cǎi)用和情感準(zhǔn)備之間的差距揭示了人類(lèi)如何與越來(lái)越多的數(shù)字伴侶互動(dòng)。我們正在進(jìn)入共存階段,算法編織到我們的日?,F(xiàn)場(chǎng)

這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 Jun 20, 2025 am 11:16 AM

由於AI,那些日子是編號(hào)的。根據(jù)一個(gè)螺柱,搜索企業(yè)諸如Travel網(wǎng)站皮劃艇和Edtech Company Chegg之類(lèi)的企業(yè)正在下降,部分原因是60%的網(wǎng)站搜索不會(huì)導(dǎo)致用戶單擊任何鏈接。

AGI和AI超級(jí)智能將嚴(yán)重?fù)糁腥祟?lèi)天花板的假設(shè)障礙 AGI和AI超級(jí)智能將嚴(yán)重?fù)糁腥祟?lèi)天花板的假設(shè)障礙 Jul 04, 2025 am 11:10 AM

讓我們來(lái)談?wù)劇? 對(duì)創(chuàng)新AI突破的分析是我正在進(jìn)行的AI中正在進(jìn)行的福布斯列覆蓋的一部分,包括識(shí)別和解釋各種有影響力的AI複雜性(請(qǐng)參閱此處的鏈接)。 前往Agi和

思科在美國(guó)2025 思科在美國(guó)2025 Jun 19, 2025 am 11:10 AM

讓我們仔細(xì)研究一下我發(fā)現(xiàn)的最重要的東西,以及思科如何以其目前的努力來(lái)進(jìn)一步實(shí)現(xiàn)其野心。

構(gòu)建您的第一個(gè)LLM應(yīng)用程序:初學(xué)者的教程 構(gòu)建您的第一個(gè)LLM應(yīng)用程序:初學(xué)者的教程 Jun 24, 2025 am 10:13 AM

您是否曾經(jīng)嘗試過(guò)建立自己的大型語(yǔ)言模型(LLM)應(yīng)用程序?有沒(méi)有想過(guò)人們?nèi)绾翁岣咦约旱腖LM申請(qǐng)來(lái)提高生產(chǎn)率? LLM應(yīng)用程序已被證明在各個(gè)方面都有用

See all articles