国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
概述該過程的概述
>逐步實現(xiàn)
步驟1:安裝和導(dǎo)入依賴項
>步驟6:關(guān)聯(lián)文本和圖像
鑰匙要點
>本文所示的媒體不歸Analytics Vidhya擁有,并由作者的酌情決定使用。
首頁 科技周邊 人工智能 使用LlamainDex的多模式財務(wù)報告生成

使用LlamainDex的多模式財務(wù)報告生成

Mar 09, 2025 pm 12:45 PM

在許多現(xiàn)實世界應(yīng)用中,數(shù)據(jù)并不純粹是文本的,其中可能包括圖像,表和圖表,這些圖表和圖表有助于加強敘述。多模式報告生成器允許您將文本和圖像同時合并到最終輸出中,從而使您的報告更具動態(tài)性和視覺上的豐富。

本文概述了如何使用以下方式構(gòu)建這樣的管道

    > llamaindex
  • 用于編排文檔解析和查詢引擎,
  • openai
  • 文本分析的語言模型,
  • llamaparse
  • 從pdf文檔中提取文本和圖像, >使用
  • a arize phoenix的可觀察性設(shè)置(通過llamaTrace)
  • 進行記錄和調(diào)試。
  • 最終結(jié)果是可以處理整個PDF幻燈片甲板(包括文本和視覺效果)的管道,并生成包含文本和圖像的結(jié)構(gòu)化報告。
>

學(xué)習(xí)目標

了解如何使用多模式管道整合有效的財務(wù)報告生成文本和視覺效果。
  • 學(xué)習(xí)利用Llamaindex和Llamaparse來增強結(jié)構(gòu)化產(chǎn)出的財務(wù)報告。
  • 探索llamaparse,以有效地從PDF文檔中提取文本和圖像。
  • >使用Arize Phoenix(通過LlamaTrace)來設(shè)置可觀察性,以記錄和調(diào)試復(fù)雜管道。
  • 創(chuàng)建一個結(jié)構(gòu)化查詢引擎,以生成與視覺元素相互交織的報告。
  • >本文是

> > data Science Blogathon的一部分。 目錄的>>

概述該過程的概述

    >
  • >逐步實現(xiàn)
    • 步驟1:安裝和導(dǎo)入依賴關(guān)系
    • 步驟2:設(shè)置可觀察性>
    • 步驟3:加載數(shù)據(jù) - 加載您的slide can 設(shè)置?? 5:用Llamaparse
    • 進行解析,步驟6:關(guān)聯(lián)文本和圖像
    • >
    • >步驟7:構(gòu)建摘要索引索引
    • 步驟8:定義結(jié)構(gòu)化的輸出架構(gòu)
    >該過程的概述
  • 構(gòu)建多模式報告生成器涉及創(chuàng)建一條管道,該管道無縫地集成了來自PDF等復(fù)雜文檔的文本和視覺元素。該過程始于安裝必要的庫,例如用于文檔解析和查詢編排的LlamainDex,以及用于提取文本和圖像的Llamaparse。使用Arize Phoenix(通過Llamatrace)來監(jiān)視和調(diào)試管道。

    >設(shè)置完成后,管道將處理PDF文檔,將其內(nèi)容解析到結(jié)構(gòu)化文本中,并渲染諸如表和圖表之類的視覺元素。然后關(guān)聯(lián)了這些解析的元素,創(chuàng)建一個統(tǒng)一的數(shù)據(jù)集。構(gòu)建了一個摘要,以啟用高級見解,并開發(fā)了結(jié)構(gòu)化的查詢引擎,以生成將文本分析與相關(guān)視覺效果融合的報告。結(jié)果是一個動態(tài)和交互式報告生成器,該生成器將靜態(tài)文檔轉(zhuǎn)換為用于用戶查詢的豐富的多模式輸出。

    >

    >逐步實現(xiàn)

    >按照本詳細指南構(gòu)建多模式報告生成器,從設(shè)置依賴項到使用集成的文本和圖像生成結(jié)構(gòu)化輸出。每個步驟都確保Llamaindex,Llamaparse和Arize Phoenix的無縫整合,以進行有效而動態(tài)的管道。

    步驟1:安裝和導(dǎo)入依賴項

    >

    您需要在Python 3.9.9上運行的以下庫:>

    • llama-index
    • llama-parse (用于文本圖像解析)>
    • llama-index-callbacks-arize-phoenix(用于可觀察性/登錄)
    • > nest_asyncio(處理筆記本中的異步事件循環(huán))
    !pip install -U llama-index-callbacks-arize-phoenix
    
    import nest_asyncio
    
    nest_asyncio.apply()
    >步驟2:設(shè)置可觀察性

    我們與LlamaTrace - Llamacloud API(Arize Phoenix)集成。首先,從llamatrace.com獲取API鍵,然后設(shè)置環(huán)境變量以將痕跡發(fā)送到鳳凰。 可以通過在此處注冊Llamatrace,然后導(dǎo)航到左下面板,然后單擊“鍵”,在此處找到API鍵。

    例如:

    步驟3:加載數(shù)據(jù) - 獲取幻燈片甲板

    PHOENIX_API_KEY = "<PHOENIX_API_KEY>"
    os.environ["OTEL_EXPORTER_OTLP_HEADERS"] = f"api_key={PHOENIX_API_KEY}"
    llama_index.core.set_global_handler(
        "arize_phoenix", endpoint="https://llamatrace.com/v1/traces"
    )
    進行示范,我們使用Conocophillips的2023年投資者會議幻燈片。我們下載了PDF:

    >檢查PDF幻燈片是否在數(shù)據(jù)文件夾中,如果不將其放在數(shù)據(jù)文件夾中并按照您的要求命名。

    import os
    import requests
    
    # Create the directories (ignore errors if they already exist)
    os.makedirs("data", exist_ok=True)
    os.makedirs("data_images", exist_ok=True)
    
    # URL of the PDF
    url = "https://static.conocophillips.com/files/2023-conocophillips-aim-presentation.pdf"
    
    # Download and save to data/conocophillips.pdf
    response = requests.get(url)
    with open("data/conocophillips.pdf", "wb") as f:
        f.write(response.content)
    
    print("PDF downloaded to data/conocophillips.pdf")
    >步驟4:設(shè)置模型

    >您需要嵌入模型和LLM。在此示例中:

    接下來,您將其注冊為LlamainDex的默認值:>

    from llama_index.llms.openai import OpenAI
    from llama_index.embeddings.openai import OpenAIEmbedding
    embed_model = OpenAIEmbedding(model="text-embedding-3-large")
    llm = OpenAI(model="gpt-4o")
    步驟5:用llamaparse

    解析文件 Llamaparse可以提取文本和圖像(通過多模式大型模型)提取文本和圖像。對于每個PDF頁面,它返回:

    from llama_index.core import Settings
    Settings.embed_model = embed_model
    Settings.llm = llm

    markdown Text

    (帶表,標題,子彈點等)

      渲染圖像
    • (本地保存)>
    print(f"Parsing slide deck...")
    md_json_objs = parser.get_json_result("data/conocophillips.pdf")
    md_json_list = md_json_objs[0]["pages"]

    使用LlamainDex的多模式財務(wù)報告生成

    print(md_json_list[10]["md"])

    !pip install -U llama-index-callbacks-arize-phoenix
    
    import nest_asyncio
    
    nest_asyncio.apply()

    使用LlamainDex的多模式財務(wù)報告生成

    >步驟6:關(guān)聯(lián)文本和圖像

    >

    我們?yōu)槊總€頁面創(chuàng)建一個>> textnode 對象的列表(LlamainDex的數(shù)據(jù)結(jié)構(gòu))。每個節(jié)點都有有關(guān)頁碼和相應(yīng)圖像文件路徑的元數(shù)據(jù):

    PHOENIX_API_KEY = "<PHOENIX_API_KEY>"
    os.environ["OTEL_EXPORTER_OTLP_HEADERS"] = f"api_key={PHOENIX_API_KEY}"
    llama_index.core.set_global_handler(
        "arize_phoenix", endpoint="https://llamatrace.com/v1/traces"
    )

    使用LlamainDex的多模式財務(wù)報告生成

    >步驟7:構(gòu)建摘要索引

    手里拿著這些文本節(jié)點,您可以創(chuàng)建一個摘要:

    摘要確保您可以輕松地檢索或生成整個文檔上的高級摘要。
    import os
    import requests
    
    # Create the directories (ignore errors if they already exist)
    os.makedirs("data", exist_ok=True)
    os.makedirs("data_images", exist_ok=True)
    
    # URL of the PDF
    url = "https://static.conocophillips.com/files/2023-conocophillips-aim-presentation.pdf"
    
    # Download and save to data/conocophillips.pdf
    response = requests.get(url)
    with open("data/conocophillips.pdf", "wb") as f:
        f.write(response.content)
    
    print("PDF downloaded to data/conocophillips.pdf")
    >步驟8:定義結(jié)構(gòu)化輸出模式

    我們的管道旨在產(chǎn)生帶有交織的文本塊和圖像塊的最終輸出。為此,我們創(chuàng)建了一種自定義的pydantic模型(使用Pydantic V2或確保兼容性),具有兩種塊類型-e

    textblock

    > imageBlock - 和一個父母模型 關(guān)鍵點:

    reportOutput from llama_index.llms.openai import OpenAI from llama_index.embeddings.openai import OpenAIEmbedding embed_model = OpenAIEmbedding(model="text-embedding-3-large") llm = OpenAI(model="gpt-4o")

    需要至少一個圖像塊,確保最終答案是多模式的。> >步驟9:創(chuàng)建一個結(jié)構(gòu)化查詢引擎 LlamainDex llamaindex允許您使用“結(jié)構(gòu)化的LLM”(即,將輸出自動解析為特定模式的LLM)。以下是:

    from llama_index.core import Settings
    Settings.embed_model = embed_model
    Settings.llm = llm

    使用LlamainDex的多模式財務(wù)報告生成

    print(f"Parsing slide deck...")
    md_json_objs = parser.get_json_result("data/conocophillips.pdf")
    md_json_list = md_json_objs[0]["pages"]

    使用LlamainDex的多模式財務(wù)報告生成

    print(md_json_list[10]["md"])

    使用LlamainDex的多模式財務(wù)報告生成結(jié)論

    通過將LlamainDex,Llamaparse和OpenAI結(jié)合使用,您可以構(gòu)建一個多模式報告生成器,該報表生成器將整個PDF(帶有文本,表格和圖像)處理到結(jié)構(gòu)化輸出中。這種方法可提供更豐富,更具視覺上信息的結(jié)果,這是利益相關(guān)者需要從復(fù)雜的公司或技術(shù)文檔中獲得關(guān)鍵見解的哪些。

    >可以隨意將此管道適應(yīng)您自己的文檔,為大型檔案添加檢索步驟,或集成特定領(lǐng)域的模型以分析基礎(chǔ)圖像。在這里鋪設(shè)的基礎(chǔ),您可以創(chuàng)建動態(tài),互動和視覺上豐富的報告,這些報告遠遠超出了簡單的基于文本的查詢。 使用LlamainDex的多模式財務(wù)報告生成非常感謝Llamaindex的Jerry Liu開發(fā)了這款驚人的管道。

    鑰匙要點

    • >使用文本和視覺效果將PDF轉(zhuǎn)換為結(jié)構(gòu)化格式,同時使用Llamaparse和Llamaindex保留原始內(nèi)容的完整性。
    • 生成視覺豐富的報告,這些報告與文本摘要和圖像相互交織,以更好地理解。
    • 通過整合文本和視覺元素以獲得更具洞察力和動態(tài)的輸出,可以增強財務(wù)報告的生成。> 利用Llamaindex和Llamaparse的利用,簡化了財務(wù)報告的過程,確保了準確且結(jié)構(gòu)化的結(jié)果。
    • 在處理之前檢索相關(guān)文檔,以優(yōu)化大型檔案的報告生成。
    • 改善視覺解析,結(jié)合特定圖表的分析,并結(jié)合文本和圖像處理的模型,以進行更深入的見解。
    • 常見問題
    • > Q1。什么是“多模式報告生成器”?多模式報告生成器是一個系統(tǒng),該系統(tǒng)在一個有凝聚力的輸出中生成包含多種類型的內(nèi)容(主要文本和圖像)的報告。在此管道中,您將PDF解析為文本和視覺元素,然后將它們組合成一個最終報告。為什么我需要安裝Llama-index-callbacks-arize-phoenix并設(shè)置可觀察性?諸如Arize Phoenix(通過Llamatrace)之類的可觀察性工具可讓您監(jiān)視和調(diào)試模型行為,跟蹤查詢和響應(yīng),并實時確定問題。在處理大型或復(fù)雜文檔和多個基于LLM的步驟時,這一點尤其有用。為什么要使用Llamaparse而不是標準的PDF文本提取器? 大多數(shù)PDF文本提取器僅處理原始文本,通常會丟失格式,圖像和表格。 Llamaparse能夠提取文本和圖像(渲染的頁面圖像),這對于構(gòu)建多模式管道至關(guān)重要,您需要在其中引用表,圖表或其他視覺效果。使用summaryIndex的優(yōu)點是什么? SummaryIndex是LlamainDex抽象,它組織您的內(nèi)容(例如PDF的頁面),因此它可以快速生成全面的摘要。它有助于從長文檔中收集高級見解,而無需手動塊或為每個數(shù)據(jù)運行檢索查詢。我如何確保最終報告至少包含一個圖像塊?
    • a。在ReportOutput Pydantic模型中,強制執(zhí)行塊列表至少需要一個ImageBlock。這在您的系統(tǒng)提示和架構(gòu)中說明了這一點。 LLM必須遵循這些規(guī)則,或者不會產(chǎn)生有效的結(jié)構(gòu)化輸出。

    >本文所示的媒體不歸Analytics Vidhya擁有,并由作者的酌情決定使用。

以上是使用LlamainDex的多模式財務(wù)報告生成的詳細內(nèi)容。更多信息請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻,版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機

Video Face Swap

Video Face Swap

使用我們完全免費的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級代碼編輯軟件(SublimeText3)

從采用到優(yōu)勢:2025年塑造企業(yè)LLM的10個趨勢 從采用到優(yōu)勢:2025年塑造企業(yè)LLM的10個趨勢 Jun 20, 2025 am 11:13 AM

以下是重塑企業(yè)AI景觀的十種引人注目的趨勢。對LLMSorganizations的財務(wù)承諾正在大大增加其在LLMS的投資,其中72%的人預(yù)計他們的支出今年會增加。目前,近40%a

AI投資者停滯不前? 3條購買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 AI投資者停滯不前? 3條購買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 Jul 02, 2025 am 11:13 AM

投資蓬勃發(fā)展,但僅資本還不夠。隨著估值的上升和獨特性的衰落,以AI為中心的風(fēng)險投資的投資者必須做出關(guān)鍵決定:購買,建立或合作伙伴才能獲得優(yōu)勢?這是評估每個選項和PR的方法

生成AI的不可阻擋的增長(AI Outlook第1部分) 生成AI的不可阻擋的增長(AI Outlook第1部分) Jun 21, 2025 am 11:11 AM

披露:我的公司Tirias Research已向IBM,NVIDIA和本文提到的其他公司咨詢。Growth驅(qū)動力的生成AI采用的激增比最樂觀的預(yù)測更具戲劇性。然后,

新蓋洛普報告:AI文化準備就緒需要新的心態(tài) 新蓋洛普報告:AI文化準備就緒需要新的心態(tài) Jun 19, 2025 am 11:16 AM

廣泛采用和情感準備之間的差距揭示了人類如何與越來越多的數(shù)字伴侶互動。我們正在進入共存階段,算法編織到我們的日?,F(xiàn)場

這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 Jun 20, 2025 am 11:16 AM

由于AI,那些日子是編號的。根據(jù)一個螺柱,搜索企業(yè)諸如Travel網(wǎng)站皮劃艇和Edtech Company Chegg之類的企業(yè)正在下降,部分原因是60%的網(wǎng)站搜索不會導(dǎo)致用戶單擊任何鏈接。

AGI和AI超級智能將嚴重擊中人類天花板的假設(shè)障礙 AGI和AI超級智能將嚴重擊中人類天花板的假設(shè)障礙 Jul 04, 2025 am 11:10 AM

讓我們來談?wù)劇? 對創(chuàng)新AI突破的分析是我正在進行的AI中正在進行的福布斯列覆蓋的一部分,包括識別和解釋各種有影響力的AI復(fù)雜性(請參閱此處的鏈接)。 前往Agi和

思科在美國2025 思科在美國2025 Jun 19, 2025 am 11:10 AM

讓我們仔細研究一下我發(fā)現(xiàn)的最重要的東西,以及思科如何以其目前的努力來進一步實現(xiàn)其野心。

構(gòu)建您的第一個LLM應(yīng)用程序:初學(xué)者的教程 構(gòu)建您的第一個LLM應(yīng)用程序:初學(xué)者的教程 Jun 24, 2025 am 10:13 AM

您是否曾經(jīng)嘗試過建立自己的大型語言模型(LLM)應(yīng)用程序?有沒有想過人們?nèi)绾翁岣咦约旱腖LM申請來提高生產(chǎn)率? LLM應(yīng)用程序已被證明在各個方面都有用

See all articles