国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁(yè) 后端開發(fā) Golang 擴(kuò)展 Zensearch 的能力來(lái)查詢整個(gè)數(shù)據(jù)庫(kù)

擴(kuò)展 Zensearch 的能力來(lái)查詢整個(gè)數(shù)據(jù)庫(kù)

Nov 14, 2024 pm 12:08 PM

Scaling Zensearch

以前,我能夠毫無(wú)問(wèn)題地為我的搜索引擎抓取網(wǎng)頁(yè)并為其建立索引,直到我的數(shù)據(jù)庫(kù)增長(zhǎng)超過(guò) RabbitMQ 消息隊(duì)列的容納能力。如果消息隊(duì)列中的消息超過(guò)其默認(rèn)大小,RabbitMQ 會(huì)拋出錯(cuò)誤并引發(fā)恐慌,我可以更改默認(rèn)大小,但如果我的數(shù)據(jù)庫(kù)增長(zhǎng),則不會(huì)擴(kuò)展,因此為了讓用戶抓取網(wǎng)頁(yè)而不必?fù)?dān)心消息代理崩潰了。

創(chuàng)建段

我已經(jīng)實(shí)現(xiàn)了一個(gè)函數(shù),用于創(chuàng)建具有最大段大小或 MSS 的段,其原理與創(chuàng)建段時(shí) TCP 的原理相同,該段包含一個(gè) 8 字節(jié)標(biāo)頭,其中 8 字節(jié)標(biāo)頭中的每個(gè) 4 字節(jié)是序列號(hào),分段總數(shù),主體的其余部分是分段數(shù)據(jù)庫(kù)的有效負(fù)載。

// MSS is number in bytes
function createSegments(
  webpages: Array<Webpage>, // webpages queried from database
  MSS: number,
): Array<ArrayBufferLike> {
  const text_encoder = new TextEncoder();
  const encoded_text = text_encoder.encode(JSON.stringify(webpages));
  const data_length = encoded_text.byteLength;
  let currentIndex = 0;
  let segmentCount = Math.trunc(data_length / MSS) + 1; // + 1 to store the remainder
  let segments: Array<ArrayBufferLike> = [];
  let pointerPosition = MSS;

  for (let i = 0; i < segmentCount; i++) {
    let currentDataLength = Math.abs(currentIndex - data_length);

    let slicedArray = encoded_text.slice(currentIndex, pointerPosition);

    currentIndex += slicedArray.byteLength;
    // Add to offset MSS to point to the next segment in the array
    // manipulate pointerPosition to adjust to lower values using Math.min()

    // Is current data length enough to fit MSS?
    // if so add from current position + MSS
    // else get remaining of the currentDataLength
    pointerPosition += Math.min(MSS, currentDataLength);
    const payload = new Uint8Array(slicedArray.length);
    payload.set(slicedArray);
    segments.push(newSegment(i, segmentCount, Buffer.from(payload)));
  }
  return segments;
}

function newSegment(
  sequenceNum: number,
  segmentCount: number,
  payload: Buffer,
): ArrayBufferLike {
  // 4 bytes for sequenceNum 4 bytes for totalSegmentsCount
  const sequenceNumBuffer = convertIntToBuffer(sequenceNum);
  const segmentCountBuffer = convertIntToBuffer(segmentCount);
  const headerBuffer = new ArrayBuffer(8);
  const header = new Uint8Array(headerBuffer);
  header.set(Buffer.concat([sequenceNumBuffer, segmentCountBuffer]));
  return Buffer.concat([header, payload]);
}

function convertIntToBuffer(int: number): Buffer {
  const bytes = Buffer.alloc(4);
  bytes.writeIntLE(int, 0, 4);
  console.log(bytes);
  return bytes;
}

解析傳入的段

這種創(chuàng)建大型數(shù)據(jù)集的小片段的方法將有助于擴(kuò)展數(shù)據(jù)庫(kù)查詢,即使數(shù)據(jù)庫(kù)增長(zhǎng)也是如此。

現(xiàn)在搜索引擎如何解析緩沖區(qū)并將每個(gè)段轉(zhuǎn)換為網(wǎng)頁(yè)數(shù)組?

從段緩沖區(qū)讀取

首先提取段標(biāo)頭,因?yàn)闃?biāo)頭包含 2 個(gè)屬性,即序列號(hào)和總段數(shù),

func GetSegmentHeader(buf []byte) (*SegmentHeader, error) {
    byteReader := bytes.NewBuffer(buf)
    headerOffsets := []int{0, 4}
    newSegmentHeader := SegmentHeader{}

    for i := range headerOffsets {
        buffer := make([]byte, 4)
        _, err := byteReader.Read(buffer)
        if err != nil {
            return &SegmentHeader{}, err
        }
        value := binary.LittleEndian.Uint32(buffer)

        // this feels disgusting but i dont feel like bothering with this
        if i == 0 {
            newSegmentHeader.SequenceNum = value
            continue
        }
        newSegmentHeader.TotalSegments = value
    }
    return &newSegmentHeader, nil
}

func GetSegmentPayload(buf []byte) ([]byte, error) {
    headerOffset := 8
    byteReader := bytes.NewBuffer(buf[headerOffset:])
    return byteReader.Bytes(), nil

}

處理段的重傳和重新排隊(duì)

序列號(hào)將用于分段的重傳/重新排隊(duì),因此如果預(yù)期的序列號(hào)不是收到的序列號(hào),則從當(dāng)前分段開始重新排隊(duì)每個(gè)分段。

    // for retransmission/requeuing
        if segmentHeader.SequenceNum != expectedSequenceNum {
            ch.Nack(data.DeliveryTag, true, true)
            log.Printf("Expected Sequence number %d, got %d\n",
                expectedSequenceNum, segmentHeader.SequenceNum)
            continue
        }

附加段有效負(fù)載

如果搜索引擎接收到的段總數(shù)等于數(shù)據(jù)庫(kù)服務(wù)要發(fā)送的總段長(zhǎng)度,則總段將用于中斷監(jiān)聽生產(chǎn)者(數(shù)據(jù)庫(kù)服務(wù))然后中斷并解析聚合的段緩沖區(qū),如果不是,則繼續(xù)偵聽并將段有效負(fù)載緩沖區(qū)附加到網(wǎng)頁(yè)緩沖區(qū)以保存來(lái)自所有傳入段的字節(jié)。

        segmentCounter++
        fmt.Printf("Total Segments : %d\n", segmentHeader.TotalSegments)
        fmt.Printf("current segments : %d\n", segmentCounter)
        expectedSequenceNum++
        ch.Ack(data.DeliveryTag, false)
        webpageBytes = append(webpageBytes, segmentPayload...)
        fmt.Printf("Byte Length: %d\n", len(webpageBytes))

        if segmentCounter == segmentHeader.TotalSegments {
            log.Printf("Got all segments from Database %d", segmentCounter)
            break
        }

順便說(shuō)一句,我使用 vim

感謝您參加我的 ted 演講,我將為 zensearch 實(shí)現(xiàn)更多功能和修復(fù)。

以上是擴(kuò)展 Zensearch 的能力來(lái)查詢整個(gè)數(shù)據(jù)庫(kù)的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請(qǐng)聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁(yè)開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

如何在GO中的結(jié)構(gòu)實(shí)例上調(diào)用方法? 如何在GO中的結(jié)構(gòu)實(shí)例上調(diào)用方法? Jun 24, 2025 pm 03:17 PM

在Go語(yǔ)言中,調(diào)用結(jié)構(gòu)體方法需先定義結(jié)構(gòu)體和綁定接收者的方法,使用點(diǎn)號(hào)訪問(wèn)。定義結(jié)構(gòu)體Rectangle后,可通過(guò)值接收者或指針接收者聲明方法;1.使用值接收者如func(rRectangle)Area()int,通過(guò)rect.Area()直接調(diào)用;2.若需修改結(jié)構(gòu)體,應(yīng)使用指針接收者如func(r*Rectangle)SetWidth(...),Go會(huì)自動(dòng)處理指針與值的轉(zhuǎn)換;3.嵌入結(jié)構(gòu)體時(shí),內(nèi)嵌結(jié)構(gòu)體的方法會(huì)被提升,可直接通過(guò)外層結(jié)構(gòu)體調(diào)用;4.Go無(wú)需強(qiáng)制使用getter/setter,字

GO中的接口是什么?如何定義它們? GO中的接口是什么?如何定義它們? Jun 22, 2025 pm 03:41 PM

在Go語(yǔ)言中,接口是一種定義行為而不指定實(shí)現(xiàn)方式的類型。接口由方法簽名組成,任何實(shí)現(xiàn)這些方法的類型都自動(dòng)滿足該接口。例如,定義一個(gè)Speaker接口包含Speak()方法,則所有實(shí)現(xiàn)該方法的類型均可視為Speaker。接口適用于編寫通用函數(shù)、抽象實(shí)現(xiàn)細(xì)節(jié)和測(cè)試中使用mock對(duì)象。定義接口使用interface關(guān)鍵字并列出方法簽名,無(wú)需顯式聲明類型實(shí)現(xiàn)了接口。常見用例包括日志、格式化、不同數(shù)據(jù)庫(kù)或服務(wù)的抽象,以及通知系統(tǒng)等。例如,Dog和Robot類型均可實(shí)現(xiàn)Speak方法,并傳遞給同一個(gè)Anno

將Golang服務(wù)與現(xiàn)有Python基礎(chǔ)架構(gòu)集成的策略 將Golang服務(wù)與現(xiàn)有Python基礎(chǔ)架構(gòu)集成的策略 Jul 02, 2025 pm 04:39 PM

TOIntegrategolangServicesWithExistingPypythoninFrasture,userestapisorgrpcForinter-serviceCommunication,允許GoandGoandPyThonAppStoStoInteractSeamlessSeamLlyThroughlyThroughStandArdArdAdrotized Protoccols.1.usererestapis(ViaFrameWorkslikeSlikeSlikeGiningOandFlaskInpyThon)Orgrococo(wirs Propococo)

我如何使用時(shí)間軟件包來(lái)處理GO的時(shí)間和持續(xù)時(shí)間? 我如何使用時(shí)間軟件包來(lái)處理GO的時(shí)間和持續(xù)時(shí)間? Jun 23, 2025 pm 11:21 PM

Go的time包提供了處理時(shí)間和持續(xù)時(shí)間的功能,包括獲取當(dāng)前時(shí)間、格式化日期、計(jì)算時(shí)間差、處理時(shí)區(qū)、調(diào)度和休眠等操作。要獲取當(dāng)前時(shí)間,使用time.Now()獲取Time結(jié)構(gòu)體,并可通過(guò)Year()、Month()、Day()等方法提取具體時(shí)間信息;通過(guò)Format("2006-01-0215:04:05")可將時(shí)間格式化為字符串;計(jì)算時(shí)間差時(shí),用Sub()或Since()獲取Duration對(duì)象,再通過(guò)Seconds()、Minutes()、Hours()轉(zhuǎn)換為對(duì)應(yīng)單位;添

我如何根據(jù)語(yǔ)句使用語(yǔ)句執(zhí)行代碼? 我如何根據(jù)語(yǔ)句使用語(yǔ)句執(zhí)行代碼? Jun 23, 2025 pm 07:02 PM

Ingo,ifstatementSexecuteCodeBasedonConconditions.1.BasicsStructurerunsablockifaconditionistrue,例如IFX> 10 {...}。2.Elseclausehan dlesfalseconditions,例如,else {...}。3。elseifchainsmultipleconditions,例如,elseifx == 10 {...}。4.variableInitializationInsideIndifif,l

了解Web API的Golang和Python之間的性能差異 了解Web API的Golang和Python之間的性能差異 Jul 03, 2025 am 02:40 AM

Golangofferssuperiorperformance,nativeconcurrencyviagoroutines,andefficientresourceusage,makingitidealforhigh-traffic,low-latencyAPIs;2.Python,whileslowerduetointerpretationandtheGIL,provideseasierdevelopment,arichecosystem,andisbettersuitedforI/O-bo

如何使用lock()和unlock()方法來(lái)保護(hù)GO中的重要代碼部分? 如何使用lock()和unlock()方法來(lái)保護(hù)GO中的重要代碼部分? Jun 23, 2025 pm 08:37 PM

在Go中保護(hù)臨界區(qū)的標(biāo)準(zhǔn)方法是使用sync.Mutex的Lock()和Unlock()方法。1.聲明一個(gè)mutex并將其與要保護(hù)的數(shù)據(jù)一起使用;2.在進(jìn)入臨界區(qū)前調(diào)用Lock(),確保只有一個(gè)goroutine能訪問(wèn)共享資源;3.使用deferUnlock()確保鎖始終被釋放,避免死鎖;4.盡量縮短臨界區(qū)內(nèi)的操作以提高性能;5.對(duì)于讀多寫少的場(chǎng)景,應(yīng)使用sync.RWMutex,通過(guò)RLock()/RUnlock()進(jìn)行讀操作,通過(guò)Lock()/Unlock()進(jìn)行寫操作,從而提升并發(fā)效率。

去支持并發(fā)如何? 去支持并發(fā)如何? Jun 23, 2025 pm 12:37 PM

Gohandlesconcurrencyusinggoroutinesandchannels.1.GoroutinesarelightweightfunctionsmanagedbytheGoruntime,enablingthousandstorunco??ncurrentlywithminimalresourceuse.2.Channelsprovidesafecommunicationbetweengoroutines,allowingvaluestobesentandreceivedinas

See all articles