国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 web前端 js教程 逆向工程 GraphQL persistedQuery 擴(kuò)展

逆向工程 GraphQL persistedQuery 擴(kuò)展

Nov 25, 2024 am 12:44 AM

GraphQL 是一種查詢語言,用於從網(wǎng)站後端獲取深度嵌套的結(jié)構(gòu)化數(shù)據(jù),類似於 MongoDB 查詢。

請(qǐng)求通常是對(duì)某個(gè)通用 /graphql 端點(diǎn)的 POST,其正文如下:

Reverse engineering GraphQL persistedQuery extension

但是,對(duì)於大型資料結(jié)構(gòu),這會(huì)變得低效- 您在POST 請(qǐng)求正文中發(fā)送大型查詢,這(幾乎總是)相同,並且僅在網(wǎng)站更新時(shí)發(fā)生變化;POST 請(qǐng)求無法被快取等。因此,開發(fā)了一個(gè)名為「持久性查詢」的擴(kuò)充。這不是一個(gè)反抓取的秘密;而是一個(gè)秘密。您可以在此處閱讀有關(guān)它的公開文件。

TLDR:客戶端計(jì)算查詢文字的 sha256 雜湊值並僅發(fā)送該雜湊值。此外,您可以將所有這些內(nèi)容放入 GET 請(qǐng)求的查詢字串中,使其易於快取。以下是來自 Zillow 的請(qǐng)求範(fàn)例

Reverse engineering GraphQL persistedQuery extension

如您所見,它只是有關(guān) persistedQuery 擴(kuò)充功能的一些元資料、查詢的雜湊值以及要嵌入查詢中的變數(shù)。

這是來自 expedia.com 的另一個(gè)請(qǐng)求,以 POST 形式發(fā)送,但擴(kuò)展名相同:

Reverse engineering GraphQL persistedQuery extension

這主要優(yōu)化了網(wǎng)站效能,但它為網(wǎng)頁抓取帶來了一些挑戰(zhàn):

  • GET 請(qǐng)求通常更容易被阻止。
  • 隱藏查詢參數(shù):我們不知道完整的查詢,因此如果網(wǎng)站回應(yīng)「未找到持久性查詢」錯(cuò)誤(要求我們發(fā)送完整的查詢,而不僅僅是雜湊值),我們無法發(fā)送。
  • 一旦網(wǎng)站發(fā)生了一點(diǎn)點(diǎn)變化,客戶端開始請(qǐng)求新的查詢- 即使舊的查詢可能仍然有效,伺服器很快就會(huì)忘記它的ID/散列,並且您使用此散列的請(qǐng)求將永遠(yuǎn)不會(huì)工作再次強(qiáng)調(diào),因?yàn)槟鸁o法「提醒」伺服器完整的查詢文字。

因此,由於不同的原因,您可能會(huì)發(fā)現(xiàn)自己需要提取整個(gè)查詢文字。您可以深入研究網(wǎng)站 JavaScript,如果幸運(yùn)的話,您可能會(huì)在那裡找到完整的查詢文本,但通常,它是以某種方式從多個(gè)片段等動(dòng)態(tài)構(gòu)建的。

因此,我們想出了一個(gè)更好的方法:我們根本不碰客戶端 JavaScript。相反,我們將嘗試模擬客戶端嘗試使用伺服器不知道的雜湊的情況。因此,我們需要攔截瀏覽器發(fā)送的(有效)請(qǐng)求,並將雜湊值修改為偽造的,然後再傳遞給伺服器。

對(duì)於這個(gè)用例,存在一個(gè)完美的工具:mitmproxy,一個(gè)開源 Python 庫,它可以攔截您自己的設(shè)備、網(wǎng)站或應(yīng)用程式發(fā)出的請(qǐng)求,並允許您使用簡單的 Python 腳本對(duì)其進(jìn)行修改。

下載 mitmproxy,並準(zhǔn)備一個(gè) Python 腳本,如下所示:

import json

def request(flow):
    try:
        dat = json.loads(flow.request.text)
        dat[0]["extensions"]["persistedQuery"]["sha256Hash"] = "0d9e" # any bogus hex string here
        flow.request.text = json.dumps(dat)
    except:
        pass

這定義了 mitmproxy 將在每個(gè)請(qǐng)求上運(yùn)行的鉤子:它嘗試載入請(qǐng)求的 JSON 主體,將雜湊修改為任意值,並將更新的 JSON 寫入作為請(qǐng)求的新主體。

我們還需要確保將瀏覽器請(qǐng)求重新路由到 mitmproxy。為此,我們將使用名為 FoxyProxy 的瀏覽器擴(kuò)充功能。它在 Firefox 和 Chrome 中均可使用。

只需新增具有以下設(shè)定的路線:

Reverse engineering GraphQL persistedQuery extension

現(xiàn)在我們可以使用以下腳本來執(zhí)行 mitmproxy:mitmweb -s script.py

這將開啟一個(gè)瀏覽器選項(xiàng)卡,您可以在其中即時(shí)觀看所有攔截的請(qǐng)求。

Reverse engineering GraphQL persistedQuery extension

如果您轉(zhuǎn)到特定路徑並查看請(qǐng)求部分中的查詢,您將看到一些垃圾值已替換了雜湊值。

Reverse engineering GraphQL persistedQuery extension

現(xiàn)在,如果您訪問 Zillow 並打開我們嘗試用於擴(kuò)展的特定路徑,然後轉(zhuǎn)到回應(yīng)部分,客戶端會(huì)收到 PersistedQueryNotFound 錯(cuò)誤。

Reverse engineering GraphQL persistedQuery extension

Zillow 前端的反應(yīng)是將整個(gè)查詢作為 POST 請(qǐng)求發(fā)送。

Reverse engineering GraphQL persistedQuery extension

我們直接從此 POST 請(qǐng)求中提取查詢和哈希。為了確保 Zillow 伺服器不會(huì)忘記此哈希,我們定期使用完全相同的查詢和哈希運(yùn)行此 POST 請(qǐng)求。這將確保即使伺服器的快取被清理或重置或網(wǎng)站發(fā)生更改,抓取工具也能繼續(xù)運(yùn)作。

結(jié)論

持久性查詢是 GraphQL API 的強(qiáng)大最佳化工具,透過最小化負(fù)載大小和啟用 GET 請(qǐng)求快取來增強(qiáng)網(wǎng)站效能。然而,它們也為網(wǎng)路抓取帶來了重大挑戰(zhàn),主要是由於對(duì)伺服器儲(chǔ)存的雜湊值的依賴以及這些雜湊值可能無效的可能性。

使用 mitmproxy 攔截和操作 GraphQL 請(qǐng)求提供了一種有效的方法來顯示完整的查詢文本,而無需深入研究複雜的客戶端 JavaScript。透過強(qiáng)制伺服器回應(yīng) PersistedQueryNotFound 錯(cuò)誤,我們可以擷取完整的查詢負(fù)載並將其用於抓取目的。定期執(zhí)行提取的查詢可確保抓取器保持功能,即使發(fā)生伺服器端快取重置或網(wǎng)站發(fā)展也是如此。

以上是逆向工程 GraphQL persistedQuery 擴(kuò)展的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)程式碼編輯軟體(SublimeText3)

Java vs. JavaScript:清除混亂 Java vs. JavaScript:清除混亂 Jun 20, 2025 am 12:27 AM

Java和JavaScript是不同的編程語言,各自適用於不同的應(yīng)用場(chǎng)景。 Java用於大型企業(yè)和移動(dòng)應(yīng)用開發(fā),而JavaScript主要用於網(wǎng)頁開發(fā)。

JavaScript評(píng)論:簡短說明 JavaScript評(píng)論:簡短說明 Jun 19, 2025 am 12:40 AM

JavascriptconcommentsenceenceEncorenceEnterential gransimenting,reading and guidingCodeeXecution.1)單inecommentsareusedforquickexplanations.2)多l(xiāng)inecommentsexplaincomplexlogicorprovideDocumentation.3)

如何在JS中與日期和時(shí)間合作? 如何在JS中與日期和時(shí)間合作? Jul 01, 2025 am 01:27 AM

JavaScript中的日期和時(shí)間處理需注意以下幾點(diǎn):1.創(chuàng)建Date對(duì)像有多種方式,推薦使用ISO格式字符串以保證兼容性;2.獲取和設(shè)置時(shí)間信息可用get和set方法,注意月份從0開始;3.手動(dòng)格式化日期需拼接字符串,也可使用第三方庫;4.處理時(shí)區(qū)問題建議使用支持時(shí)區(qū)的庫,如Luxon。掌握這些要點(diǎn)能有效避免常見錯(cuò)誤。

為什麼要將標(biāo)籤放在的底部? 為什麼要將標(biāo)籤放在的底部? Jul 02, 2025 am 01:22 AM

PlacingtagsatthebottomofablogpostorwebpageservespracticalpurposesforSEO,userexperience,anddesign.1.IthelpswithSEObyallowingsearchenginestoaccesskeyword-relevanttagswithoutclutteringthemaincontent.2.Itimprovesuserexperiencebykeepingthefocusonthearticl

JavaScript與Java:開發(fā)人員的全面比較 JavaScript與Java:開發(fā)人員的全面比較 Jun 20, 2025 am 12:21 AM

JavaScriptIspreferredforredforwebdevelverment,而Javaisbetterforlarge-ScalebackendsystystemsandSandAndRoidApps.1)JavascriptexcelcelsincreatingInteractiveWebexperienceswebexperienceswithitswithitsdynamicnnamicnnamicnnamicnnamicnemicnemicnemicnemicnemicnemicnemicnemicnddommanipulation.2)

JavaScript:探索用於高效編碼的數(shù)據(jù)類型 JavaScript:探索用於高效編碼的數(shù)據(jù)類型 Jun 20, 2025 am 12:46 AM

javascripthassevenfundaMentalDatatypes:數(shù)字,弦,布爾值,未定義,null,object和symbol.1)numberSeadUble-eaduble-ecisionFormat,forwidevaluerangesbutbecautious.2)

什麼是在DOM中冒泡和捕獲的事件? 什麼是在DOM中冒泡和捕獲的事件? Jul 02, 2025 am 01:19 AM

事件捕獲和冒泡是DOM中事件傳播的兩個(gè)階段,捕獲是從頂層向下到目標(biāo)元素,冒泡是從目標(biāo)元素向上傳播到頂層。 1.事件捕獲通過addEventListener的useCapture參數(shù)設(shè)為true實(shí)現(xiàn);2.事件冒泡是默認(rèn)行為,useCapture設(shè)為false或省略;3.可使用event.stopPropagation()阻止事件傳播;4.冒泡支持事件委託,提高動(dòng)態(tài)內(nèi)容處理效率;5.捕獲可用於提前攔截事件,如日誌記錄或錯(cuò)誤處理。了解這兩個(gè)階段有助於精確控制JavaScript響應(yīng)用戶操作的時(shí)機(jī)和方式。

Java和JavaScript有什麼區(qū)別? Java和JavaScript有什麼區(qū)別? Jun 17, 2025 am 09:17 AM

Java和JavaScript是不同的編程語言。 1.Java是靜態(tài)類型、編譯型語言,適用於企業(yè)應(yīng)用和大型系統(tǒng)。 2.JavaScript是動(dòng)態(tài)類型、解釋型語言,主要用於網(wǎng)頁交互和前端開發(fā)。

See all articles