国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
概述該過程的概述
>逐步實現(xiàn)
步驟1:安裝和導入依賴項
>步驟6:關聯(lián)文本和圖像
鑰匙要點
>本文所示的媒體不歸Analytics Vidhya擁有,並由作者的酌情決定使用。
首頁 科技週邊 人工智慧 使用LlamainDex的多模式財務報告生成

使用LlamainDex的多模式財務報告生成

Mar 09, 2025 pm 12:45 PM

在許多現(xiàn)實世界應用中,數(shù)據(jù)並不純粹是文本的,其中可能包括圖像,表和圖表,這些圖表和圖表有助於加強敘述。多模式報告生成器允許您將文本和圖像同時合併到最終輸出中,從而使您的報告更具動態(tài)性和視覺上的豐富。

本文概述瞭如何使用以下方式構建這樣的管道

    > llamaindex
  • 用於編排文檔解析和查詢引擎,
  • openai
  • 文本分析的語言模型,
  • llamaparse
  • 從pdf文檔中提取文本和圖像, >使用
  • a arize phoenix的可觀察性設置(通過llamaTrace)
  • 進行記錄和調試。
  • 最終結果是可以處理整個PDF幻燈片甲板(包括文本和視覺效果)的管道,並生成包含文本和圖像的結構化報告。
>

學習目標

了解如何使用多模式管道整合有效的財務報告生成文本和視覺效果。
  • 學習利用Llamaindex和Llamaparse來增強結構化產(chǎn)出的財務報告。
  • 探索llamaparse,以有效地從PDF文檔中提取文本和圖像。
  • >使用Arize Phoenix(通過LlamaTrace)來設置可觀察性,以記錄和調試複雜管道。
  • 創(chuàng)建一個結構化查詢引擎,以生成與視覺元素相互交織的報告。
  • >本文是

> > data Science Blogathon的一部分。 目錄的>>

概述該過程的概述

    >
  • >逐步實現(xiàn)
    • 步驟1:安裝和導入依賴關係
    • 步驟2:設置可觀察性>
    • 步驟3:加載數(shù)據(jù) - 加載您的slide can 設置?? 5:用Llamaparse
    • 進行解析,步驟6:關聯(lián)文本和圖像
    • >
    • >步驟7:構建摘要索引索引
    • 步驟8:定義結構化的輸出架構
    >該過程的概述
  • 構建多模式報告生成器涉及創(chuàng)建一條管道,該管道無縫地集成了來自PDF等複雜文檔的文本和視覺元素。該過程始於安裝必要的庫,例如用於文檔解析和查詢編排的LlamainDex,以及用於提取文本和圖像的Llamaparse。使用Arize Phoenix(通過Llamatrace)來監(jiān)視和調試管道。

    >設置完成後,管道將處理PDF文檔,將其內容解析到結構化文本中,並渲染諸如表和圖表之類的視覺元素。然後關聯(lián)了這些解析的元素,創(chuàng)建一個統(tǒng)一的數(shù)據(jù)集。構建了一個摘要,以啟用高級見解,並開發(fā)了結構化的查詢引擎,以生成將文本分析與相關視覺效果融合的報告。結果是一個動態(tài)和交互式報告生成器,該生成器將靜態(tài)文檔轉換為用於用戶查詢的豐富的多模式輸出。

    >

    >逐步實現(xiàn)

    >按照本詳細指南構建多模式報告生成器,從設置依賴項到使用集成的文本和圖像生成結構化輸出。每個步驟都確保Llamaindex,Llamaparse和Arize Phoenix的無縫整合,以進行有效而動態(tài)的管道。

    步驟1:安裝和導入依賴項

    >

    您需要在Python 3.9.9上運行的以下庫:>

    • llama-index
    • llama-parse (用於文本圖像解析)>
    • llama-index-callbacks-arize-phoenix(用於可觀察性/登錄)
    • > nest_asyncio(處理筆記本中的異步事件循環(huán))
    !pip install -U llama-index-callbacks-arize-phoenix
    
    import nest_asyncio
    
    nest_asyncio.apply()
    >步驟2:設置可觀察性

    我們與LlamaTrace - Llamacloud API(Arize Phoenix)集成。首先,從llamatrace.com獲取API鍵,然後設置環(huán)境變量以將痕跡發(fā)送到鳳凰。 可以通過在此處註冊Llamatrace,然後導航到左下面板,然後單擊“鍵”,在此處找到API鍵。

    例如:

    步驟3:加載數(shù)據(jù) - 獲取幻燈片甲板

    PHOENIX_API_KEY = "<PHOENIX_API_KEY>"
    os.environ["OTEL_EXPORTER_OTLP_HEADERS"] = f"api_key={PHOENIX_API_KEY}"
    llama_index.core.set_global_handler(
        "arize_phoenix", endpoint="https://llamatrace.com/v1/traces"
    )
    進行示範,我們使用Conocophillips的2023年投資者會議幻燈片。我們下載了PDF:

    >檢查PDF幻燈片是否在數(shù)據(jù)文件夾中,如果不將其放在數(shù)據(jù)文件夾中並按照您的要求命名。

    import os
    import requests
    
    # Create the directories (ignore errors if they already exist)
    os.makedirs("data", exist_ok=True)
    os.makedirs("data_images", exist_ok=True)
    
    # URL of the PDF
    url = "https://static.conocophillips.com/files/2023-conocophillips-aim-presentation.pdf"
    
    # Download and save to data/conocophillips.pdf
    response = requests.get(url)
    with open("data/conocophillips.pdf", "wb") as f:
        f.write(response.content)
    
    print("PDF downloaded to data/conocophillips.pdf")
    >步驟4:設置模型

    >您需要嵌入模型和LLM。在此示例中:

    接下來,您將其註冊為LlamainDex的默認值:>

    from llama_index.llms.openai import OpenAI
    from llama_index.embeddings.openai import OpenAIEmbedding
    embed_model = OpenAIEmbedding(model="text-embedding-3-large")
    llm = OpenAI(model="gpt-4o")
    步驟5:用llamaparse

    解析文件 Llamaparse可以提取文本和圖像(通過多模式大型模型)提取文本和圖像。對於每個PDF頁面,它返回:

    from llama_index.core import Settings
    Settings.embed_model = embed_model
    Settings.llm = llm

    markdown Text

    (帶錶,標題,子彈點等)

      渲染圖像
    • (本地保存)>
    print(f"Parsing slide deck...")
    md_json_objs = parser.get_json_result("data/conocophillips.pdf")
    md_json_list = md_json_objs[0]["pages"]

    使用LlamainDex的多模式財務報告生成

    print(md_json_list[10]["md"])

    !pip install -U llama-index-callbacks-arize-phoenix
    
    import nest_asyncio
    
    nest_asyncio.apply()

    使用LlamainDex的多模式財務報告生成

    >步驟6:關聯(lián)文本和圖像

    >

    我們?yōu)槊總€頁面創(chuàng)建一個>> textnode 對象的列表(LlamainDex的數(shù)據(jù)結構)。每個節(jié)點都有有關頁碼和相應圖像文件路徑的元數(shù)據(jù):

    PHOENIX_API_KEY = "<PHOENIX_API_KEY>"
    os.environ["OTEL_EXPORTER_OTLP_HEADERS"] = f"api_key={PHOENIX_API_KEY}"
    llama_index.core.set_global_handler(
        "arize_phoenix", endpoint="https://llamatrace.com/v1/traces"
    )

    使用LlamainDex的多模式財務報告生成

    >步驟7:構建摘要索引

    手裡拿著這些文本節(jié)點,您可以創(chuàng)建一個摘要:

    摘要確保您可以輕鬆地檢索或生成整個文檔上的高級摘要。
    import os
    import requests
    
    # Create the directories (ignore errors if they already exist)
    os.makedirs("data", exist_ok=True)
    os.makedirs("data_images", exist_ok=True)
    
    # URL of the PDF
    url = "https://static.conocophillips.com/files/2023-conocophillips-aim-presentation.pdf"
    
    # Download and save to data/conocophillips.pdf
    response = requests.get(url)
    with open("data/conocophillips.pdf", "wb") as f:
        f.write(response.content)
    
    print("PDF downloaded to data/conocophillips.pdf")
    >步驟8:定義結構化輸出模式

    我們的管道旨在產(chǎn)生帶有交織的文本塊和圖像塊的最終輸出。為此,我們創(chuàng)建了一種自定義的pydantic模型(使用Pydantic V2或確保兼容性),具有兩種塊類型-e

    textblock

    > imageBlock - 和一個父母模型 關鍵點:

    reportOutput from llama_index.llms.openai import OpenAI from llama_index.embeddings.openai import OpenAIEmbedding embed_model = OpenAIEmbedding(model="text-embedding-3-large") llm = OpenAI(model="gpt-4o")

    需要至少一個圖像塊,確保最終答案是多模式的。 > >步驟9:創(chuàng)建一個結構化查詢引擎 LlamainDex llamaindex允許您使用“結構化的LLM”(即,將輸出自動解析為特定模式的LLM)。以下是:

    from llama_index.core import Settings
    Settings.embed_model = embed_model
    Settings.llm = llm

    使用LlamainDex的多模式財務報告生成

    print(f"Parsing slide deck...")
    md_json_objs = parser.get_json_result("data/conocophillips.pdf")
    md_json_list = md_json_objs[0]["pages"]

    使用LlamainDex的多模式財務報告生成

    print(md_json_list[10]["md"])

    使用LlamainDex的多模式財務報告生成結論

    通過將LlamainDex,Llamaparse和OpenAI結合使用,您可以構建一個多模式報告生成器,該報表生成器將整個PDF(帶有文本,表格和圖像)處理到結構化輸出中。這種方法可提供更豐富,更具視覺上信息的結果,這是利益相關者需要從復雜的公司或技術文檔中獲得關鍵見解的哪些。

    >可以隨意將此管道適應您自己的文檔,為大型檔案添加檢索步驟,或集成特定領域的模型以分析基礎圖像。在這裡鋪設的基礎,您可以創(chuàng)建動態(tài),互動和視覺上豐富的報告,這些報告遠遠超出了簡單的基於文本的查詢。 使用LlamainDex的多模式財務報告生成非常感謝Llamaindex的Jerry Liu開發(fā)了這款驚人的管道。

    鑰匙要點

    • >使用文本和視覺效果將PDF轉換為結構化格式,同時使用Llamaparse和Llamaindex保留原始內容的完整性。
    • 生成視覺豐富的報告,這些報告與文本摘要和圖像相互交織,以更好地理解。
    • 通過整合文本和視覺元素以獲得更具洞察力和動態(tài)的輸出,可以增強財務報告的生成。 > 利用Llamaindex和Llamaparse的利用,簡化了財務報告的過程,確保了準確且結構化的結果。
    • 在處理之前檢索相關文檔,以優(yōu)化大型檔案的報告生成。
    • 改善視覺解析,結合特定圖表的分析,並結合文本和圖像處理的模型,以進行更深入的見解。
    • 常見問題
    • > Q1。什麼是“多模式報告生成器”?多模式報告生成器是一個系統(tǒng),該系統(tǒng)在一個有凝聚力的輸出中生成包含多種類型的內容(主要文本和圖像)的報告。在此管道中,您將PDF解析為文本和視覺元素,然後將它們組合成一個最終報告。為什麼我需要安裝Llama-index-callbacks-arize-phoenix並設置可觀察性?諸如Arize Phoenix(通過Llamatrace)之類的可觀察性工具可讓您監(jiān)視和調試模型行為,跟蹤查詢和響應,並實時確定問題。在處理大型或複雜文檔和多個基於LLM的步驟時,這一點尤其有用。為什麼要使用Llamaparse而不是標準的PDF文本提取器? 大多數(shù)PDF文本提取器僅處理原始文本,通常會丟失格式,圖像和表格。 Llamaparse能夠提取文本和圖像(渲染的頁面圖像),這對於構建多模式管道至關重要,您需要在其中引用表,圖表或其他視覺效果。使用summaryIndex的優(yōu)點是什麼? SummaryIndex是LlamainDex抽象,它組織您的內容(例如PDF的頁面),因此它可以快速生成全面的摘要。它有助於從長文檔中收集高級見解,而無需手動塊或為每個數(shù)據(jù)運行檢索查詢。我如何確保最終報告至少包含一個圖像塊?
    • a。在ReportOutput Pydantic模型中,強制執(zhí)行塊列表至少需要一個ImageBlock。這在您的系統(tǒng)提示和架構中說明了這一點。 LLM必須遵循這些規(guī)則,或者不會產(chǎn)生有效的結構化輸出。

    >本文所示的媒體不歸Analytics Vidhya擁有,並由作者的酌情決定使用。

以上是使用LlamainDex的多模式財務報告生成的詳細內容。更多資訊請關注PHP中文網(wǎng)其他相關文章!

本網(wǎng)站聲明
本文內容由網(wǎng)友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發(fā)現(xiàn)涉嫌抄襲或侵權的內容,請聯(lián)絡admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

從採用到優(yōu)勢:2025年塑造企業(yè)LLM的10個趨勢 從採用到優(yōu)勢:2025年塑造企業(yè)LLM的10個趨勢 Jun 20, 2025 am 11:13 AM

以下是重塑企業(yè)AI景觀的十種引人注目的趨勢。對LLMSorganizations的財務承諾正在大大增加其在LLMS的投資,其中72%的人預計他們的支出今年會增加。目前,近40%a

AI投資者停滯不前? 3條購買,建造或與人工智能供應商合作的戰(zhàn)略途徑 AI投資者停滯不前? 3條購買,建造或與人工智能供應商合作的戰(zhàn)略途徑 Jul 02, 2025 am 11:13 AM

投資蓬勃發(fā)展,但僅資本還不夠。隨著估值的上升和獨特性的衰落,以AI為中心的風險投資的投資者必須做出關鍵決定:購買,建立或合作夥伴才能獲得優(yōu)勢?這是評估每個選項和PR的方法

新蓋洛普報告:AI文化準備就緒需要新的心態(tài) 新蓋洛普報告:AI文化準備就緒需要新的心態(tài) Jun 19, 2025 am 11:16 AM

廣泛採用和情感準備之間的差距揭示了人類如何與越來越多的數(shù)字伴侶互動。我們正在進入共存階段,算法編織到我們的日常現(xiàn)場

生成AI的不可阻擋的增長(AI Outlook第1部分) 生成AI的不可阻擋的增長(AI Outlook第1部分) Jun 21, 2025 am 11:11 AM

披露:我的公司Tirias Research已向IBM,NVIDIA和本文提到的其他公司諮詢。 Growth驅動力的生成AI採用的激增比最樂觀的預測更具戲劇性。然後,

這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 Jun 20, 2025 am 11:16 AM

由於AI,那些日子是編號的。根據(jù)一個螺柱,搜索企業(yè)諸如Travel網(wǎng)站皮劃艇和Edtech Company Chegg之類的企業(yè)正在下降,部分原因是60%的網(wǎng)站搜索不會導致用戶單擊任何鏈接。

AGI和AI超級智能將嚴重擊中人類天花板的假設障礙 AGI和AI超級智能將嚴重擊中人類天花板的假設障礙 Jul 04, 2025 am 11:10 AM

讓我們來談談。 對創(chuàng)新AI突破的分析是我正在進行的AI中正在進行的福布斯列覆蓋的一部分,包括識別和解釋各種有影響力的AI複雜性(請參閱此處的鏈接)。 前往Agi和

思科在美國2025 思科在美國2025 Jun 19, 2025 am 11:10 AM

讓我們仔細研究一下我發(fā)現(xiàn)的最重要的東西,以及思科如何以其目前的努力來進一步實現(xiàn)其野心。

構建您的第一個LLM應用程序:初學者的教程 構建您的第一個LLM應用程序:初學者的教程 Jun 24, 2025 am 10:13 AM

您是否曾經(jīng)嘗試過建立自己的大型語言模型(LLM)應用程序?有沒有想過人們如何提高自己的LLM申請來提高生產(chǎn)率? LLM應用程序已被證明在各個方面都有用

See all articles