国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
學(xué)習(xí)目標(biāo)
解決剪貼模型限制:
>步驟2:設(shè)置OpenAI API鍵并導(dǎo)入庫(kù)
步驟4:從PDF
步驟5:保存提取的數(shù)據(jù)
步驟6:塊文本數(shù)據(jù)
>步驟7:加載名詞嵌入模型
步驟8:生成嵌入
>步驟9:將文本嵌入在qdrant
>步驟10:將圖像嵌入在qdrant
>步驟11:創(chuàng)建一個(gè)多模式獵犬
步驟12:用蘭鏈構(gòu)建多模式抹布
查詢模型
首頁(yè) 科技周邊 人工智能 用假嵌入增強(qiáng)破布系統(tǒng)

用假嵌入增強(qiáng)破布系統(tǒng)

Mar 03, 2025 pm 06:08 PM

>多模式檢索儀(RAG)系統(tǒng)正在通過(guò)整合多種數(shù)據(jù)類型(TEXT,圖像,音頻和視頻)來(lái)徹底改變AI,從而獲得更多細(xì)微差別和上下文感知的響應(yīng)。 這超過(guò)了傳統(tǒng)的抹布,這僅關(guān)注文本。 一個(gè)關(guān)鍵的進(jìn)步是通訊嵌入,為視覺(jué)和文本數(shù)據(jù)創(chuàng)建了一個(gè)統(tǒng)一的空間,從而實(shí)現(xiàn)了無(wú)縫的跨模式交互。 高級(jí)模型會(huì)生成高質(zhì)量的嵌入,改善信息檢索并彌合不同內(nèi)容形式之間的差距,最終豐富用戶體驗(yàn)。

學(xué)習(xí)目標(biāo)

  • 掌握了多模式抹布的基本原理及其優(yōu)勢(shì)比傳統(tǒng)抹布。
  • 了解嵌入統(tǒng)一文本和圖像嵌入空間中的作用。
  • 比較剪輯模型的somic視覺(jué)嵌入,分析性能基準(zhǔn)。
  • >使用somic Vision和Text Embeddings在Python中實(shí)現(xiàn)多模式的RAG系統(tǒng)。
  • 學(xué)習(xí)從PDF中提取和處理多模式檢索的文本和視覺(jué)數(shù)據(jù)。

*本文是*** 數(shù)據(jù)科學(xué)blogathon的一部分。

目錄的

>

    什么是多模式的抹布?
  • nive vision嵌入
  • >雜志嵌入的性能基準(zhǔn)
  • python實(shí)施多模式抹布,帶有通知嵌入
    • >步驟1:安裝必要的庫(kù)
    • >步驟2:設(shè)置OpenAI API鍵并導(dǎo)入庫(kù)
    • >
    • 步驟3:從PDF
    • 中提取圖像
    • 步驟4:從PDF
    • 提取文本
    • 步驟5:保存提取的文本和圖像
    • 步驟6:塊文本數(shù)據(jù)
    • >步驟7:加載名詞嵌入模型
    • 步驟8:生成嵌入
    • >步驟9:將文本嵌入在qdrant
    • 中存儲(chǔ)
    • >步驟10:將圖像嵌入在qdrant
    • >步驟11:創(chuàng)建一個(gè)多模式獵犬
    • 步驟12:用蘭鏈構(gòu)建多模式抹布
  • 查詢模型
  • 結(jié)論
  • 常見(jiàn)問(wèn)題
什么是多模式的抹布?

>多模式抹布代表了一個(gè)顯著的AI進(jìn)步,這是通過(guò)合并多種數(shù)據(jù)類型來(lái)基于傳統(tǒng)抹布的。與主要處理文本的傳統(tǒng)系統(tǒng)不同,多模式抹布處理并同時(shí)集成了多個(gè)數(shù)據(jù)表格。這導(dǎo)致了更全面的理解和背景感知的反應(yīng)。

鍵多模式抹布組件:

  • >數(shù)據(jù)攝入:來(lái)自各種來(lái)源的數(shù)據(jù)是使用專用處理器攝入的,確保驗(yàn)證,清潔和歸一化。
  • >
  • >向量表示:>使用神經(jīng)網(wǎng)絡(luò)(例如,圖像的剪輯,文本的剪輯,bert for Text)來(lái)處理統(tǒng)一的矢量嵌入,保留語(yǔ)義關(guān)系。
  • > 使用索引技術(shù)(HNSW,F(xiàn)AISS),將> >向量數(shù)據(jù)庫(kù)存儲(chǔ):
  • 嵌入嵌入在優(yōu)化的矢量數(shù)據(jù)庫(kù)(例如qdrant)中,以有效檢索。 查詢處理:
  • >傳入查詢被分析,轉(zhuǎn)換為與存儲(chǔ)數(shù)據(jù)相同的向量空間,并用于識(shí)別相關(guān)模態(tài)并生成用于搜索的嵌入。
  • nive vision嵌入

解決剪貼模型限制:

>

>剪輯以零拍功能出色時(shí),其文本編碼在圖像檢索之外的任務(wù)中表現(xiàn)不佳(如MTEB基準(zhǔn)測(cè)試所示)。 Nimic Embed Vision通過(guò)將其視覺(jué)編碼器與嵌入式文本潛在空間保持一致來(lái)解決這一點(diǎn)。

媒體嵌入視覺(jué)與提名嵌入文本一起訓(xùn)練,凍結(jié)文本編碼器并在圖像文本對(duì)上訓(xùn)練視覺(jué)編碼器。這樣可以確保最佳的結(jié)果和與名詞嵌入文本嵌入的向后兼容性。

>

>雜志嵌入的性能基準(zhǔn)Enhancing RAG Systems with Nomic Embeddings

剪輯模型雖然在零拍功能方面令人印象深刻,但在語(yǔ)義相似性(MTEB基準(zhǔn))等單峰任務(wù)中顯示出弱點(diǎn)。通用嵌入視覺(jué)通過(guò)將其視覺(jué)編碼器與名詞嵌入文本潛在空間保持一致,從而克服了這一點(diǎn),從而在圖像,文本和多模式任務(wù)(Imagenet Zero-Shot,MTEB,MTEB,DataComp Benchmarks)中產(chǎn)生了強(qiáng)大的性能。

python實(shí)施多模式抹布,帶有通知嵌入

本教程構(gòu)建了一個(gè)多模式抹布系統(tǒng),從包含文本和圖像的PDF檢索信息(使用帶有T4 GPU的Google Colab)。

>步驟1:安裝庫(kù)Enhancing RAG Systems with Nomic Embeddings

安裝必要的Python庫(kù):OpenAI,QDRANT,Transformers,Torch,Pymupdf等

>步驟2:設(shè)置OpenAI API鍵并導(dǎo)入庫(kù)

>

>設(shè)置OpenAI API密鑰并導(dǎo)入所需的庫(kù)(Pymupdf,PIL,Langchain,OpenAI等)。 (為簡(jiǎn)短而省略了代碼。)

步驟3:從PDF

中提取圖像

>使用pymupdf從PDF提取圖像,然后將其保存到目錄中。 (為簡(jiǎn)短而省略了代碼。)

步驟4:從PDF

提取文本

>使用pymupdf從每個(gè)PDF頁(yè)面中提取文本。 (為簡(jiǎn)短而省略了代碼。)

步驟5:保存提取的數(shù)據(jù)

>保存提取的圖像和文本。 (為簡(jiǎn)短而省略了代碼。)

步驟6:塊文本數(shù)據(jù)

>使用Langchain'sRecursiveCharacterTextSplitter將提取的文本分為較小的塊。 (為簡(jiǎn)短而省略了代碼。)

>步驟7:加載名詞嵌入模型

>使用擁抱面孔的變形金剛加載Nomic的文本和視覺(jué)嵌入模型。 (為簡(jiǎn)短而省略了代碼。)

步驟8:生成嵌入

生成文本和圖像嵌入。 (為簡(jiǎn)短而省略了代碼。)

>步驟9:將文本嵌入在qdrant

中存儲(chǔ)

>將文本嵌入在QDrant集合中。 (為簡(jiǎn)短而省略了代碼。)

>步驟10:將圖像嵌入在qdrant

>將圖像嵌入在單獨(dú)的QDrant集合中。 (為簡(jiǎn)短而省略了代碼。)

>步驟11:創(chuàng)建一個(gè)多模式獵犬

>創(chuàng)建一個(gè)函數(shù),以根據(jù)查詢檢索相關(guān)的文本和圖像嵌入。 (為簡(jiǎn)短而省略了代碼。)

步驟12:用蘭鏈構(gòu)建多模式抹布

>使用Langchain處理被檢索的數(shù)據(jù)并使用語(yǔ)言模型(例如GPT-4)生成響應(yīng)。 (為簡(jiǎn)短而省略了代碼。)

查詢模型

>示例查詢演示了系統(tǒng)從PDF中從文本和圖像中檢索信息的能力。 (示例查詢和輸出省略了,但在原始中存在。

結(jié)論

鑰匙要點(diǎn)

多模式抹布整合了多種數(shù)據(jù)類型,以更全面地理解。 nive vision嵌入統(tǒng)一視覺(jué)和文本數(shù)據(jù)以改進(jìn)信息檢索。

該系統(tǒng)使用專門(mén)的處理,向量表示和存儲(chǔ)以進(jìn)行有效檢索。
    nimic嵌入視力克服了剪輯在單峰任務(wù)中的局限性。
  • 常見(jiàn)問(wèn)題
  • (為簡(jiǎn)潔而省略了常見(jiàn)問(wèn)題,但以原始形式存在。)
  • >

    注意:為簡(jiǎn)短而省略了代碼片段,但核心功能和步驟仍然準(zhǔn)確地描述了。 原始輸入包含廣泛的代碼;包括所有這些都會(huì)使這一響應(yīng)過(guò)長(zhǎng)。 請(qǐng)參閱原始輸入以進(jìn)行完整的代碼實(shí)現(xiàn)。

    >

以上是用假嵌入增強(qiáng)破布系統(tǒng)的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請(qǐng)聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開(kāi)發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺(jué)化網(wǎng)頁(yè)開(kāi)發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

熱門(mén)話題

從采用到優(yōu)勢(shì):2025年塑造企業(yè)LLM的10個(gè)趨勢(shì) 從采用到優(yōu)勢(shì):2025年塑造企業(yè)LLM的10個(gè)趨勢(shì) Jun 20, 2025 am 11:13 AM

以下是重塑企業(yè)AI景觀的十種引人注目的趨勢(shì)。對(duì)LLMSorganizations的財(cái)務(wù)承諾正在大大增加其在LLMS的投資,其中72%的人預(yù)計(jì)他們的支出今年會(huì)增加。目前,近40%a

AI投資者停滯不前? 3條購(gòu)買(mǎi),建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 AI投資者停滯不前? 3條購(gòu)買(mǎi),建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 Jul 02, 2025 am 11:13 AM

投資蓬勃發(fā)展,但僅資本還不夠。隨著估值的上升和獨(dú)特性的衰落,以AI為中心的風(fēng)險(xiǎn)投資的投資者必須做出關(guān)鍵決定:購(gòu)買(mǎi),建立或合作伙伴才能獲得優(yōu)勢(shì)?這是評(píng)估每個(gè)選項(xiàng)和PR的方法

生成AI的不可阻擋的增長(zhǎng)(AI Outlook第1部分) 生成AI的不可阻擋的增長(zhǎng)(AI Outlook第1部分) Jun 21, 2025 am 11:11 AM

披露:我的公司Tirias Research已向IBM,NVIDIA和本文提到的其他公司咨詢。Growth驅(qū)動(dòng)力的生成AI采用的激增比最樂(lè)觀的預(yù)測(cè)更具戲劇性。然后,

這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 Jun 20, 2025 am 11:16 AM

由于AI,那些日子是編號(hào)的。根據(jù)一個(gè)螺柱,搜索企業(yè)諸如Travel網(wǎng)站皮劃艇和Edtech Company Chegg之類的企業(yè)正在下降,部分原因是60%的網(wǎng)站搜索不會(huì)導(dǎo)致用戶單擊任何鏈接。

AGI和AI超級(jí)智能將嚴(yán)重?fù)糁腥祟愄旎ò宓募僭O(shè)障礙 AGI和AI超級(jí)智能將嚴(yán)重?fù)糁腥祟愄旎ò宓募僭O(shè)障礙 Jul 04, 2025 am 11:10 AM

讓我們來(lái)談?wù)劇? 對(duì)創(chuàng)新AI突破的分析是我正在進(jìn)行的AI中正在進(jìn)行的福布斯列覆蓋的一部分,包括識(shí)別和解釋各種有影響力的AI復(fù)雜性(請(qǐng)參閱此處的鏈接)。 前往Agi和

構(gòu)建您的第一個(gè)LLM應(yīng)用程序:初學(xué)者的教程 構(gòu)建您的第一個(gè)LLM應(yīng)用程序:初學(xué)者的教程 Jun 24, 2025 am 10:13 AM

您是否曾經(jīng)嘗試過(guò)建立自己的大型語(yǔ)言模型(LLM)應(yīng)用程序?有沒(méi)有想過(guò)人們?nèi)绾翁岣咦约旱腖LM申請(qǐng)來(lái)提高生產(chǎn)率? LLM應(yīng)用程序已被證明在各個(gè)方面都有用

AMD繼續(xù)在AI中建立動(dòng)力,還有很多工作要做 AMD繼續(xù)在AI中建立動(dòng)力,還有很多工作要做 Jun 28, 2025 am 11:15 AM

總體而言,我認(rèn)為該活動(dòng)對(duì)于展示AMD如何向客戶和開(kāi)發(fā)人員移動(dòng)球非常重要。在SU下,AMD的M.O.要制定明確,雄心勃勃的計(jì)劃并對(duì)他們執(zhí)行。她的“說(shuō)/do”比率很高。公司做

未來(lái)預(yù)測(cè)從AI到AGI的道路上的大規(guī)模情報(bào)爆炸 未來(lái)預(yù)測(cè)從AI到AGI的道路上的大規(guī)模情報(bào)爆炸 Jul 02, 2025 am 11:19 AM

讓我們來(lái)談?wù)劇? 對(duì)創(chuàng)新AI突破的分析是我正在進(jìn)行的AI中正在進(jìn)行的福布斯列覆蓋的一部分,包括識(shí)別和解釋各種有影響力的AI復(fù)雜性(請(qǐng)參閱此處的鏈接)。對(duì)于那些讀者

See all articles