国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 php教程 php手冊 php利用scws實(shí)現(xiàn)mysql全文搜索功能的方法介紹

php利用scws實(shí)現(xiàn)mysql全文搜索功能的方法介紹

Mar 30, 2017 pm 04:04 PM
php

本文實(shí)例講述了php利用scws實(shí)現(xiàn)mysql全文搜索功能的方法。分享給大家供大家參考。具體方法如下:

scws這樣的中文分詞插件比較不錯,簡單的學(xué)習(xí)了一下,它包涵一些專有名稱、人名、地名、數(shù)字年代等規(guī)則集合,可以直接將語句按這些規(guī)則分開成一個一個關(guān)鍵詞,準(zhǔn)確率在90%-95%之間,按照安裝說明把scws的擴(kuò)展放入php的擴(kuò)展目錄里,下載規(guī)則文件和詞典文件,并在php配置文件引用它們,就可以用scws進(jìn)行分詞了.

1) 修改 php 擴(kuò)展代碼以兼容支持 php 5.4.x

2) 修正 php 擴(kuò)展中 scws_get_tops 的 limit 參數(shù)不允許少于 10 的問題

3) libscws 增加 scws_fork() 從既有的 scws 實(shí)例產(chǎn)生分支并共享詞典/規(guī)則集,主要用于多線程開發(fā).

4) 新增部分版本的 win32 的 dll 擴(kuò)展

PHP實(shí)例代碼如下:

<?php 
//實(shí)例化分詞插件核心類 
$so = scws_new(); 
//設(shè)置分詞時所用編碼 
$so->set_charset(&#39;utf-8&#39;); 
//設(shè)置分詞所用詞典(此處使用utf8的詞典) 
$so->set_dict(&#39;/path/dict.utf8.xdb&#39;); 
//設(shè)置分詞所用規(guī)則 
$so->set_rule(&#39;/path/rules.utf8.ini &#39;); 
//分詞前去掉標(biāo)點(diǎn)符號 
$so->set_ignore(true); 
//是否復(fù)式分割,如“中國人”返回“中國+人+中國人”三個詞。 
$so->set_multi(true); 
//設(shè)定將文字自動以二字分詞法聚合 
$so->set_duality(true); 
//要進(jìn)行分詞的語句 
$so->send_text(“歡迎來到火星時代IT開發(fā)”); 
//獲取分詞結(jié)果,如果提取高頻詞用get_tops方法 
while ($tmp = $so->get_result()) 
{ 
  print_r($tmp); 
} 
$so->close(); 
?>


注:如以上例子,輸入的文字,詞典,規(guī)則文件這三者的字符集必須統(tǒng)一,另外mysql 4.XX有的是不支持中文全文搜索的,可以存入關(guān)鍵字對應(yīng)的區(qū)位碼以方便全文搜索.

版本列表

版本 類型 平臺 性能 其它

SCWS-1.1.x C 代碼 *Unix*/*PHP* 準(zhǔn)確: 95%, 召回: 91%, 速度: 1.2MB/sec

PHP擴(kuò)展分詞速度: 250KB/sec [下載] [文檔] [安裝說明]

php_scws.dll(1) PHP擴(kuò)展庫 Windows/PHP 4.4.x 準(zhǔn)確: 95%, 召回: 91%,

php_scws.dll(2) PHP擴(kuò)展庫 Windows/PHP 5.2.x 準(zhǔn)確: 95%, 召回: 91%,

php_scws.dll(3) PHP擴(kuò)展庫 Windows/PHP 5.3.x 準(zhǔn)確: 95%, 召回: 91%,?

php_scws.dll(4) PHP擴(kuò)展庫 Windows/PHP 5.4.x 準(zhǔn)確: 95%, 召回: 91%,

PSCWS23 PHP源代碼 不限 (不支持UTF-8) 準(zhǔn)確: 93%, 召回: 89%,

PSCWS4 PHP源代碼 不限 準(zhǔn)確: 95%, 召回: 91%,

?以上就是php利用scws實(shí)現(xiàn)mysql全文搜索功能的方法,的內(nèi)容,更多相關(guān)內(nèi)容請關(guān)注PHP中文網(wǎng)(www.miracleart.cn)!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

如何在PHP中獲取當(dāng)前的會話ID? 如何在PHP中獲取當(dāng)前的會話ID? Jul 13, 2025 am 03:02 AM

在PHP中獲取當(dāng)前會話ID的方法是使用session_id()函數(shù),但必須先調(diào)用session_start()才能成功獲取。 1.調(diào)用session_start()啟動會話;2.使用session_id()讀取會話ID,輸出類似abc123def456ghi789的字符串;3.若返回為空,檢查是否遺漏session_start()、用戶是否首次訪問或會話是否被銷毀;4.會話ID可用於日誌記錄、安全驗(yàn)證和跨請求通信,但需注意安全性。確保正確開啟會話後即可順利獲取ID。

php從字符串獲取子字符串 php從字符串獲取子字符串 Jul 13, 2025 am 02:59 AM

要從PHP字符串中提取子字符串,可使用substr()函數(shù),其語法為substr(string$string,int$start,?int$length=null),若未指定長度則截取至末尾;處理多字節(jié)字符如中文時應(yīng)使用mb_substr()函數(shù)以避免亂碼;若需根據(jù)特定分隔符截取字符串,可使用explode()或結(jié)合strpos()與substr()實(shí)現(xiàn),例如提取文件名擴(kuò)展名或域名。

您如何執(zhí)行PHP代碼的單元測試? 您如何執(zhí)行PHP代碼的單元測試? Jul 13, 2025 am 02:54 AM

UnittestinginPHPinvolvesverifyingindividualcodeunitslikefunctionsormethodstocatchbugsearlyandensurereliablerefactoring.1)SetupPHPUnitviaComposer,createatestdirectory,andconfigureautoloadandphpunit.xml.2)Writetestcasesfollowingthearrange-act-assertpat

如何將字符串分為PHP中的數(shù)組 如何將字符串分為PHP中的數(shù)組 Jul 13, 2025 am 02:59 AM

在PHP中,最常用的方法是使用explode()函數(shù)將字符串拆分為數(shù)組。該函數(shù)通過指定的分隔符將字符串分割成多個部分並返回?cái)?shù)組,語法為explode(separator,string,limit),其中separator為分隔符,string為原字符串,limit為可選參數(shù)控制最大分割數(shù)量。例如$str="apple,banana,orange";$arr=explode(",",$str);結(jié)果為["apple","bana

JavaScript數(shù)據(jù)類型:原始與參考 JavaScript數(shù)據(jù)類型:原始與參考 Jul 13, 2025 am 02:43 AM

JavaScript的數(shù)據(jù)類型分為原始類型和引用類型。原始類型包括string、number、boolean、null、undefined和symbol,其值不可變且賦值時復(fù)制副本,因此互不影響;引用類型如對象、數(shù)組和函數(shù)存儲的是內(nèi)存地址,指向同一對象的變量會相互影響。判斷類型可用typeof和instanceof,但需注意typeofnull的歷史問題。理解這兩類差異有助於編寫更穩(wěn)定可靠的代碼。

在C中使用std :: Chrono 在C中使用std :: Chrono Jul 15, 2025 am 01:30 AM

std::chrono在C 中用於處理時間,包括獲取當(dāng)前時間、測量執(zhí)行時間、操作時間點(diǎn)與持續(xù)時間及格式化解析時間。 1.獲取當(dāng)前時間使用std::chrono::system_clock::now(),可轉(zhuǎn)換為可讀字符串但係統(tǒng)時鐘可能不單調(diào);2.測量執(zhí)行時間應(yīng)使用std::chrono::steady_clock以確保單調(diào)性,並通過duration_cast轉(zhuǎn)換為毫秒、秒等單位;3.時間點(diǎn)(time_point)和持續(xù)時間(duration)可相互操作,但需注意單位兼容性和時鐘紀(jì)元(epoch)

PHP如何處理環(huán)境變量? PHP如何處理環(huán)境變量? Jul 14, 2025 am 03:01 AM

toAccessenvironmentVariablesInphp,useGetenv()或$ _envsuperglobal.1.getEnv('var_name')retievesSpecificvariable.2。 $ _ en v ['var_name'] accessesvariablesifvariables_orderInphp.iniincludes“ e” .setVariablesViaCliWithvar = vualitephpscript.php,inapach

為什麼我們評論:PHP指南 為什麼我們評論:PHP指南 Jul 15, 2025 am 02:48 AM

PHPhasthreecommentstyles://,#forsingle-lineand/.../formulti-line.Usecommentstoexplainwhycodeexists,notwhatitdoes.MarkTODO/FIXMEitemsanddisablecodetemporarilyduringdebugging.Avoidover-commentingsimplelogic.Writeconcise,grammaticallycorrectcommentsandu

See all articles