国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
目錄
什么是Markitdown MCP?
Markitdown MCP的主要特征
降級在工作流程中的作用
設(shè)置Markitdown MCP服務(wù)器進行集成
安裝
服務(wù)器配置
用標(biāo)記MCP轉(zhuǎn)換的降價轉(zhuǎn)換
步驟1:首先導(dǎo)入必要的庫。
步驟2:初始化Groq LLM,這是免費的。您可以在這里找到API鍵
步驟3:配置MCP服務(wù)器
步驟4:現(xiàn)在,定義異步功能
步驟5:此代碼調(diào)用run_conversion函數(shù)
輸出
完整代碼
LLM管道中的實際用例
結(jié)論
常見問題
首頁 科技周邊 人工智能 Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!

Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!

Apr 27, 2025 am 09:47 AM

處理文檔不再只是在您的AI項目中打開文件,而是將混亂變成清晰度。諸如PDF,PowerPoints和Word之類的文檔以各種形狀和大小淹沒了我們的工作流程。從這些文檔中檢索結(jié)構(gòu)化的內(nèi)容已成為當(dāng)今一項艱巨的任務(wù)。 Microsoft的Markitdown MCP(Markdown轉(zhuǎn)換協(xié)議)簡化了這一點。它將各種文件轉(zhuǎn)換為結(jié)構(gòu)化的標(biāo)記格式。這有助于開發(fā)人員和技術(shù)作家改善文檔工作流程。本文解釋了Markitdown MCP并顯示了其用法。我們將介紹設(shè)置MarkitDown MCP服務(wù)器,還將在此協(xié)議的上下文中討論MarkitDown。在下面還介紹了使用標(biāo)記MCP服務(wù)器進行測試。

目錄

  • 什么是Markitdown MCP?
    • Markitdown MCP的主要特征
  • 降級在工作流程中的作用
  • 設(shè)置Markitdown MCP服務(wù)器進行集成
    • 安裝
    • 服務(wù)器配置
  • 用標(biāo)記MCP轉(zhuǎn)換的降價轉(zhuǎn)換
    • 步驟1:首先導(dǎo)入必要的庫。
    • 步驟2:初始化Groq LLM,這是免費的。您可以在這里找到API鍵
    • 步驟3:配置MCP服務(wù)器
    • 步驟4:現(xiàn)在,定義異步功能
    • 步驟5:此代碼調(diào)用run_conversion函數(shù)
  • LLM管道中的實際用例
  • 結(jié)論
  • 常見問題

什么是Markitdown MCP?

Markitdown MCP提供了用于文檔轉(zhuǎn)換的標(biāo)準(zhǔn)方法。它充當(dāng)服務(wù)器端協(xié)議。它在后端使用Microsoft的Markitdown庫。服務(wù)器托管一個靜止的API。用戶將諸如PDF或Word文件之類的文檔發(fā)送到此服務(wù)器。然后,服務(wù)器處理這些文件。它使用高級解析和特定格式規(guī)則。輸出是保留原始文檔結(jié)構(gòu)的標(biāo)記文本。

Markitdown MCP的主要特征

Markitdown MCP服務(wù)器包含幾個有用的功能:

  • 寬格式支持:它將PDF,DOCX和PPTX(例如PPTX)等通用文件轉(zhuǎn)換為Markdown。
  • 結(jié)構(gòu)保存:它使用方法來理解和維護文檔布局,例如標(biāo)題和列表。
  • 可配置的輸出:用戶可以調(diào)整設(shè)置以控制最終的標(biāo)記樣式。
  • 服務(wù)器操作:它作為服務(wù)器過程運行。這允許集成到自動化系統(tǒng)和云設(shè)置中。

降級在工作流程中的作用

Markdown是文檔的流行格式。它的簡單語法使讀寫易于讀寫。像GitHub這樣的許多平臺都很好地支持了它。靜態(tài)站點發(fā)生器經(jīng)常使用它。將其他格式轉(zhuǎn)換為手動花費時間。 Markitdown MCP自動進行此轉(zhuǎn)換。這提供了明顯的好處:

  • 有效的內(nèi)容處理:將源文檔轉(zhuǎn)換為可用的降價。
  • 一致的協(xié)作:標(biāo)準(zhǔn)格式可幫助團隊一起在文檔上共同努力。
  • 流程自動化:在較大的自動化工作流程中包括文檔轉(zhuǎn)換。

設(shè)置Markitdown MCP服務(wù)器進行集成

我們可以使用GitHub Repo中提到的Docker Image(例如Claude,Windsurf,Cursor)等不同客戶端設(shè)置Markitdown MCP服務(wù)器。但是在這里,我們將使用Langchain的MCP適配器創(chuàng)建本地MCP客戶端。我們需要運行服務(wù)器將其與Langchain一起使用。服務(wù)器支持不同的運行模式。

安裝

首先,安裝所需的Python軟件包。

 PIP安裝MarkitDown-MCP langchain langchain_mcp_adapters langgraph langchain_groq

服務(wù)器配置

使用STDIO模式運行標(biāo)記MCP服務(wù)器。此模式連接標(biāo)準(zhǔn)輸入和輸出流。它適用于基于腳本的集成。直接在終端運行以下內(nèi)容。

 Markitdown-MCP

服務(wù)器將開始運行一些警告。

Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!

我們還可以使用SSE(服務(wù)器范圍事件)模式。此模式適合Web應(yīng)用程序或長期運行的連接。設(shè)置標(biāo)記MCP服務(wù)器以測試特定方案時也很有用。

 MarkitDown-MCP  -  -SSE--host 127.0.0.1-港口3001

選擇適合您集成計劃的模式。使用服務(wù)器通過STDIO本地測試通常是一個良好的開始。我們建議在本文中使用STDIO模式。

用標(biāo)記MCP轉(zhuǎn)換的降價轉(zhuǎn)換

我們已經(jīng)介紹了如何使用Langchain在我們以前的博客MCP客戶端服務(wù)器中使用Langchain在本地建立MCP服務(wù)器和客戶端設(shè)置的方法。

現(xiàn)在,本節(jié)顯示了如何與Markitdown MCP服務(wù)器一起使用Langchain。它可以自動化PDF文件轉(zhuǎn)換為Markdown。該示例通過Chatgroq采用了Groq的Llama模型。確保將GROQ API密鑰設(shè)置為環(huán)境變量,或?qū)⑵渲苯觽鬟f給Chatgroq。

步驟1:首先導(dǎo)入必要的庫。

來自MCP Import客戶端,StdioServerParameters
來自mcp.client.stdio import stdio_client
來自langchain_mcp_adapters.tools import load_mcp_tools
來自langgraph.prebuilt導(dǎo)入create_react_agent
導(dǎo)入異步
來自langchain_groq導(dǎo)入changroq

步驟2:初始化Groq LLM,這是免費的。您可以在這里找到API鍵

這是GROQ API密鑰:GROQ API鍵

#初始化groq型號
model = chatgroq(model =“ meta-llama/llama-4-scout-17b-16e-Instruct”,api_key =“ your_api_key”)

步驟3:配置MCP服務(wù)器

我們正在使用stdioserverparameters,并在此處直接使用已安裝的標(biāo)記MCP軟件包

server_params = stdioserverparameters(
命令=“ MarkitDown-MCP”,
args = []#STDIO模式不需要其他參數(shù)
)

步驟4:現(xiàn)在,定義異步功能

當(dāng)輸入時,這將采用PDF路徑,客戶端開始通信。 load_mcp_tools提供了與Markitdown MCP相互作用的功能。然后創(chuàng)建一個反應(yīng)代理,使用模型和MCP工具。該代碼為PDF創(chuàng)建File_uri,并發(fā)送提示,要求代理使用MCP轉(zhuǎn)換文件。

異步def run_conversion(pdf_path:str):
與stdio_client(server_params)AS(讀,寫)的異步:
與客戶端的異步(讀,寫)作為會話:

等待session.initialize()
打印(“初始化MCP會話。”)

#加載可用工具
工具=等待LOAD_MCP_TOOLS(會話)
打?。╢“已加載工具:{[工具中的工具名稱]工具中的工具]}”)

#創(chuàng)建反應(yīng)代理
agent = create_reaeact_agent(型號,工具)
打?。ā皠?chuàng)建的反應(yīng)代理?!保?
#準(zhǔn)備文件URI(將本地路徑轉(zhuǎn)換為file:// uri)
file_uri = f“ file:// {pdf_path}”
#通過轉(zhuǎn)換請求調(diào)用代理
響應(yīng)=等待代理。AINVOKE({{

“消息”:[(“用戶”,f“使用MarkitDown MCP將{file_uri}轉(zhuǎn)換為標(biāo)記,只需返回MCP服務(wù)器的輸出)]

}))

#返回最后一條消息內(nèi)容
返回響應(yīng)[“消息”] [ -  1] .content

步驟5:此代碼調(diào)用run_conversion函數(shù)

我們正在呼吁和提取響應(yīng)中的降價。它將內(nèi)容保存到pdf.md,最后將輸出打印在終端中。

如果__name__ ==“ __ -main __”:

pdf_path =“/home/home/harsh/downloads/llm評估.pptx.pdf”#使用絕對路徑
結(jié)果= asyncio.run(run_conversion(pdf_path))

以F:f的開放(“ pdf.md”,'w')
F.Write(結(jié)果)

打?。ā?\ nmarkDown轉(zhuǎn)換結(jié)果:”)
打?。ńY(jié)果)

輸出

Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!

完整代碼

來自MCP Import客戶端,StdioServerParameters
來自mcp.client.stdio import stdio_client

來自langchain_mcp_adapters.tools import load_mcp_tools
來自langgraph.prebuilt導(dǎo)入create_react_agent

導(dǎo)入異步
來自langchain_groq導(dǎo)入changroq
#初始化groq型號
model = changroq(model =“ meta-llama/llama-4-scout-17b-16e-Instruct”,api_key =“”)
#配置MCP服務(wù)器
server_params = stdioserverparameters(

命令=“ MarkitDown-MCP”,
args = []#STDIO模式不需要其他參數(shù)

)

異步def run_conversion(pdf_path:str):
與stdio_client(server_params)AS(讀,寫)的異步:

與客戶端的異步(讀,寫)作為會話:
等待session.initialize()

打?。ā俺跏蓟疢CP會話?!保?#加載可用工具
工具=等待LOAD_MCP_TOOLS(會話)

打?。╢“已加載工具:{[工具中的工具名稱]工具中的工具]}”)
#創(chuàng)建反應(yīng)代理

agent = create_reaeact_agent(型號,工具)
打?。ā皠?chuàng)建的反應(yīng)代理?!保?
#準(zhǔn)備文件URI(將本地路徑轉(zhuǎn)換為file:// uri)

file_uri = f“ file:// {pdf_path}”
#通過轉(zhuǎn)換請求調(diào)用代理
響應(yīng)=等待代理。AINVOKE({{

“消息”:[(“用戶”,f“使用MarkitDown MCP將{file_uri}轉(zhuǎn)換為標(biāo)記,只是從MCP服務(wù)器中撤回輸出”)]

}))

#返回最后一條消息內(nèi)容
返回響應(yīng)[“消息”] [ -  1] .content

如果__name__ ==“ __ -main __”:
pdf_path =“/home/harsh/harsh/downloads/llm評估.pdf”#使用絕對路徑

結(jié)果= asyncio.run(run_conversion(pdf_path))
以F:f的開放(“ pdf.md”,'w')

F.Write(結(jié)果)
打?。ā?\ nmarkDown轉(zhuǎn)換結(jié)果:”)
打?。ńY(jié)果)

檢查輸出

腳本生成一個pdf.md文件。該文件包含輸入PDF的降價版本。轉(zhuǎn)換質(zhì)量取決于原始文檔的結(jié)構(gòu)。 Markitdown MCP通常保留元素,例如:

  • 標(biāo)題(不同級別)
  • 段落文字
  • 列表(子彈和編號)
  • 表(轉(zhuǎn)換為Markdown語法)
  • 代碼塊

輸出

Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!

在輸出中,我們可以看到它成功地檢索了標(biāo)題,內(nèi)容以及降價格式的普通文本。

因此,運行本地服務(wù)器進行測試有助于評估不同的文檔類型。

也觀看:

LLM管道中的實際用例

集成標(biāo)記MCP可以改善幾個AI工作流程:

  • 知識基礎(chǔ)建設(shè):將文檔轉(zhuǎn)換為降價。將此內(nèi)容攝入知識庫或抹布系統(tǒng)。
  • LLM內(nèi)容準(zhǔn)備:將源文件轉(zhuǎn)換為Markdown。為LLM摘要或分析任務(wù)準(zhǔn)備一致的輸入。
  • 文檔數(shù)據(jù)提取:將帶有表的文檔轉(zhuǎn)換為Markdown。這簡化了解析結(jié)構(gòu)化數(shù)據(jù)。
  • 文檔自動化:生成技術(shù)手冊。將源文件(例如Word文檔)轉(zhuǎn)換為靜態(tài)站點生成器的Markdown。

結(jié)論

Markitdown MCP提供了一種基于服務(wù)器的功能,用于文檔轉(zhuǎn)換的方法。它處理多種格式。它產(chǎn)生結(jié)構(gòu)化的降價輸出。將其與LLMS集成可以使文檔處理任務(wù)的自動化。這種方法支持可擴展的文檔實踐。使用服務(wù)器進行測試使評估直接。通過其在這些工作流程中的實際應(yīng)用,最好理解MAKITDOWN的MCP。

探索Markitdown MCP GitHub存儲庫以獲取更多信息。

常見問題

Q1。 Markitdown MCP的主要功能是什么?

Ans。 Markitdown MCP將PDF和Word文件等文檔轉(zhuǎn)換為結(jié)構(gòu)化標(biāo)記。它為此任務(wù)使用基于服務(wù)器的協(xié)議。

Q2。標(biāo)記MCP服務(wù)器可以處理哪些文件格式?

Ans。服務(wù)器處理PDF,DOCX,PPTX和HTML文件。其他格式可以根據(jù)核心庫支持。

Q3。 Langchain如何使用Markitdown MCP?

Ans。 Langchain使用特殊工具與服務(wù)器進行通信。然后,代理可以通過此服務(wù)器請求文檔轉(zhuǎn)換。

Q4。 Markitdown MCP開源嗎?

Ans。是的,它是Microsoft的開源軟件。用戶負(fù)責(zé)任何服務(wù)器托管成本。

Q5。我可以運行標(biāo)記MCP服務(wù)器以進行測試嗎?

Ans。是的,用于測試的服務(wù)器可以在本地運行。使用STDIO或SSE模式進行開發(fā)和評估。

以上是Markitdown MCP可以將任何文檔轉(zhuǎn)換為Markdowns!的詳細(xì)內(nèi)容。更多信息請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻,版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機

Video Face Swap

Video Face Swap

使用我們完全免費的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級代碼編輯軟件(SublimeText3)

從采用到優(yōu)勢:2025年塑造企業(yè)LLM的10個趨勢 從采用到優(yōu)勢:2025年塑造企業(yè)LLM的10個趨勢 Jun 20, 2025 am 11:13 AM

以下是重塑企業(yè)AI景觀的十種引人注目的趨勢。對LLMSorganizations的財務(wù)承諾正在大大增加其在LLMS的投資,其中72%的人預(yù)計他們的支出今年會增加。目前,近40%a

AI投資者停滯不前? 3條購買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 AI投資者停滯不前? 3條購買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 Jul 02, 2025 am 11:13 AM

投資蓬勃發(fā)展,但僅資本還不夠。隨著估值的上升和獨特性的衰落,以AI為中心的風(fēng)險投資的投資者必須做出關(guān)鍵決定:購買,建立或合作伙伴才能獲得優(yōu)勢?這是評估每個選項和PR的方法

生成AI的不可阻擋的增長(AI Outlook第1部分) 生成AI的不可阻擋的增長(AI Outlook第1部分) Jun 21, 2025 am 11:11 AM

披露:我的公司Tirias Research已向IBM,NVIDIA和本文提到的其他公司咨詢。Growth驅(qū)動力的生成AI采用的激增比最樂觀的預(yù)測更具戲劇性。然后,

這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 Jun 20, 2025 am 11:16 AM

由于AI,那些日子是編號的。根據(jù)一個螺柱,搜索企業(yè)諸如Travel網(wǎng)站皮劃艇和Edtech Company Chegg之類的企業(yè)正在下降,部分原因是60%的網(wǎng)站搜索不會導(dǎo)致用戶單擊任何鏈接。

AGI和AI超級智能將嚴(yán)重?fù)糁腥祟愄旎ò宓募僭O(shè)障礙 AGI和AI超級智能將嚴(yán)重?fù)糁腥祟愄旎ò宓募僭O(shè)障礙 Jul 04, 2025 am 11:10 AM

讓我們來談?wù)劇? 對創(chuàng)新AI突破的分析是我正在進行的AI中正在進行的福布斯列覆蓋的一部分,包括識別和解釋各種有影響力的AI復(fù)雜性(請參閱此處的鏈接)。 前往Agi和

構(gòu)建您的第一個LLM應(yīng)用程序:初學(xué)者的教程 構(gòu)建您的第一個LLM應(yīng)用程序:初學(xué)者的教程 Jun 24, 2025 am 10:13 AM

您是否曾經(jīng)嘗試過建立自己的大型語言模型(LLM)應(yīng)用程序?有沒有想過人們?nèi)绾翁岣咦约旱腖LM申請來提高生產(chǎn)率? LLM應(yīng)用程序已被證明在各個方面都有用

AMD繼續(xù)在AI中建立動力,還有很多工作要做 AMD繼續(xù)在AI中建立動力,還有很多工作要做 Jun 28, 2025 am 11:15 AM

總體而言,我認(rèn)為該活動對于展示AMD如何向客戶和開發(fā)人員移動球非常重要。在SU下,AMD的M.O.要制定明確,雄心勃勃的計劃并對他們執(zhí)行。她的“說/do”比率很高。公司做

未來預(yù)測從AI到AGI的道路上的大規(guī)模情報爆炸 未來預(yù)測從AI到AGI的道路上的大規(guī)模情報爆炸 Jul 02, 2025 am 11:19 AM

讓我們來談?wù)劇? 對創(chuàng)新AI突破的分析是我正在進行的AI中正在進行的福布斯列覆蓋的一部分,包括識別和解釋各種有影響力的AI復(fù)雜性(請參閱此處的鏈接)。對于那些讀者

See all articles