国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 后端開發(fā) php教程 PHP 中的機器學習:使用 Rubix ML 構建新聞分類器

PHP 中的機器學習:使用 Rubix ML 構建新聞分類器

Nov 03, 2024 am 03:33 AM

Machine Learning in PHP: Build a News Classifier Using Rubix ML

介紹

機器學習無處不在——推薦電影、標記圖像,現在甚至對新聞文章進行分類。想象一下如果您可以在 PHP 中做到這一點!借助 Rubix ML,您可以以簡單易懂的方式將機器學習的強大功能引入 PHP。本指南將引導您構建一個簡單的新聞分類器,將文章分類為“體育”或“技術”等類別。最后,您將擁有一個工作分類器,可以根據新文章的內容預測其類別。

這個項目非常適合想要使用 PHP 進行機器學習的初學者,您可以按照 GitHub 上的完整代碼進行操作。

目錄

  1. 什么是 Rubix ML?
  2. 設置項目
  3. 創(chuàng)建新聞分類類
  4. 訓練模型
  5. 預測新樣本
  6. 最后的想法

Rubix 機器學習是什么?

Rubix ML 是一個 PHP 機器學習庫,它將 ML 工具和算法引入 PHP 友好的環(huán)境中。無論您從事分類、回歸、聚類,甚至自然語言處理,Rubix ML 都能滿足您的需求。它允許您加載和預處理數據、訓練模型并評估性能——所有這些都在 PHP 中進行。

Rubix ML 支持廣泛的機器學習任務,例如:

  • 分類:對數據進行分類,例如將電子郵件標記為垃圾郵件或非垃圾郵件。
  • 回歸:預測連續(xù)值,例如房價。
  • 聚類:對沒有標簽的數據進行分組,就像尋找客戶群一樣。
  • 自然語言處理 (NLP):處理文本數據,例如標記并將其轉換為 ML 可用的格式。

讓我們深入了解如何使用 Rubix ML 在 PHP 中構建簡單的新聞分類器!

設置項目

我們將首先使用 Rubix ML 設置一個新的 PHP 項目并配置自動加載。

第1步:初始化項目目錄

創(chuàng)建一個新的項目目錄并導航到其中:

mkdir NewsClassifier
cd NewsClassifier

第 2 步:安裝 Rubix ML 和 Composer

確保您已安裝 Composer,然后通過運行以下命令將 Rubix ML 添加到您的項目中:

composer require rubix/ml

步驟3:在composer.json中配置自動加載

要從項目的 src 目錄自動加載類,請打開或創(chuàng)建一個composer.json 文件并添加以下配置:

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}

這告訴 Composer 自動加載 NewsClassifier 命名空間下 src 文件夾中的任何類。

第 4 步:運行 Composer Autoload Dump

添加自動加載配置后,運行以下命令重新生成 Composer 的自動加載器:

mkdir NewsClassifier
cd NewsClassifier

第5步:目錄結構

您的項目目錄應如下所示:

composer require rubix/ml
  • src/:包含您的 PHP 腳本。
  • storage/:訓練后的模型的保存位置。
  • vendor/:包含 Composer 安裝的依賴項。

創(chuàng)建新聞分類類

在 src/ 中,創(chuàng)建一個名為 Classification.php 的文件。該文件將包含訓練模型和預測新聞類別的方法。

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}

此分類類包含以下方法:

  • 訓練:創(chuàng)建并訓練基于管道的模型。
  • 保存模型:將訓練好的模型保存到指定路徑
  • 預測:加載保存的模型并預測新樣本的類別。

訓練模型

在 src/ 中創(chuàng)建一個名為 train.php 的腳本來訓練模型。

composer dump-autoload

運行此腳本來訓練模型:

NewsClassifier/
├── src/
│   ├── Classification.php
│   └── train.php
├── storage/
├── vendor/
├── composer.json
└── composer.lock

如果成功,您將看到:

<?php

namespace NewsClassifier;

use Rubix\ML\Classifiers\KNearestNeighbors;
use Rubix\ML\Datasets\Labeled;
use Rubix\ML\Datasets\Unlabeled;
use Rubix\ML\PersistentModel;
use Rubix\ML\Pipeline;
use Rubix\ML\Tokenizers\Word;
use Rubix\ML\Transformers\TfIdfTransformer;
use Rubix\ML\Transformers\WordCountVectorizer;
use Rubix\ML\Persisters\Filesystem;

class Classification
{
    private $modelPath;

    public function __construct($modelPath)
    {
        $this->modelPath = $modelPath;
    }

    public function train()
    {
        // Sample data and corresponding labels
        $samples = [
            ['The team played an amazing game of soccer'],
            ['The new programming language has been released'],
            ['The match between the two teams was incredible'],
            ['The new tech gadget has been launched'],
        ];

        $labels = [
            'sports',
            'technology',
            'sports',
            'technology',
        ];

        // Create a labeled dataset
        $dataset = new Labeled($samples, $labels);

        // Set up the pipeline with a text transformer and K-Nearest Neighbors classifier
        $estimator = new Pipeline([
            new WordCountVectorizer(10000, 1, 1, new Word()),
            new TfIdfTransformer(),
        ], new KNearestNeighbors(4));

        // Train the model
        $estimator->train($dataset);

        // Save the model
        $this->saveModel($estimator);

        echo "Training completed and model saved.\n";
    }

    private function saveModel($estimator)
    {
        $persister = new Filesystem($this->modelPath);
        $model = new PersistentModel($estimator, $persister);
        $model->save();
    }

    public function predict(array $samples)
    {
        // Load the saved model
        $persister = new Filesystem($this->modelPath);
        $model = PersistentModel::load($persister);

        // Predict categories for new samples
        $dataset = new Unlabeled($samples);
        return $model->predict($dataset);
    }
}

預測新樣本

在 src/ 中創(chuàng)建另一個腳本,predict.php,根據訓練的模型對新文章進行分類。

<?php

require __DIR__ . '/../vendor/autoload.php';

use NewsClassifier\Classification;

// Define the model path
$modelPath = __DIR__ . '/../storage/model.rbx';

// Initialize the Classification object
$classifier = new Classification($modelPath);

// Train the model and save it
$classifier->train();

運行預測腳本對樣本進行分類:

php src/train.php

輸出應顯示每個示例文本及其預測類別。

最后的想法

通過本指南,您已經使用 Rubix ML 在 PHP 中成功構建了一個簡單的新聞分類器!這展示了 PHP 如何比您想象的更加通用,為文本分類、推薦系統等任務引入機器學習功能。該項目的完整代碼可在 GitHub 上獲取。

嘗試不同的算法或數據來擴展分類器。誰知道 PHP 可以進行機器學習?現在你知道了。
快樂編碼!

以上是PHP 中的機器學習:使用 Rubix ML 構建新聞分類器的詳細內容。更多信息請關注PHP中文網其他相關文章!

本站聲明
本文內容由網友自發(fā)貢獻,版權歸原作者所有,本站不承擔相應法律責任。如您發(fā)現有涉嫌抄襲侵權的內容,請聯系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅動的應用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機

Video Face Swap

Video Face Swap

使用我們完全免費的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級代碼編輯軟件(SublimeText3)

如何在PHP中實施身份驗證和授權? 如何在PHP中實施身份驗證和授權? Jun 20, 2025 am 01:03 AM

tosecurelyhandleauthenticationandationallizationInphp,lofterTheSesteps:1.AlwaysHashPasswordSwithPassword_hash()andverifyusingspasspassword_verify(),usepreparedStatatementStopreventsqlineptions,andStoreSeruserDatain usseruserDatain $ _sessiveferterlogin.2.implementrole-2.imaccessccsccccccccccccccccccccccccc.

如何在PHP中安全地處理文件上傳? 如何在PHP中安全地處理文件上傳? Jun 19, 2025 am 01:05 AM

要安全處理PHP中的文件上傳,核心在于驗證文件類型、重命名文件并限制權限。1.使用finfo_file()檢查真實MIME類型,僅允許特定類型如image/jpeg;2.用uniqid()生成隨機文件名,存儲至非Web根目錄;3.通過php.ini和HTML表單限制文件大小,設置目錄權限為0755;4.使用ClamAV掃描惡意軟件,增強安全性。這些步驟有效防止安全漏洞,確保文件上傳過程安全可靠。

PHP中==(松散比較)和===(嚴格的比較)之間有什么區(qū)別? PHP中==(松散比較)和===(嚴格的比較)之間有什么區(qū)別? Jun 19, 2025 am 01:07 AM

在PHP中,==與===的主要區(qū)別在于類型檢查的嚴格程度。==在比較前會進行類型轉換,例如5=="5"返回true,而===要求值和類型都相同才會返回true,例如5==="5"返回false。使用場景上,===更安全應優(yōu)先使用,==僅在需要類型轉換時使用。

如何與PHP的NOSQL數據庫(例如MongoDB,Redis)進行交互? 如何與PHP的NOSQL數據庫(例如MongoDB,Redis)進行交互? Jun 19, 2025 am 01:07 AM

是的,PHP可以通過特定擴展或庫與MongoDB和Redis等NoSQL數據庫交互。首先,使用MongoDBPHP驅動(通過PECL或Composer安裝)創(chuàng)建客戶端實例并操作數據庫及集合,支持插入、查詢、聚合等操作;其次,使用Predis庫或phpredis擴展連接Redis,執(zhí)行鍵值設置與獲取,推薦phpredis用于高性能場景,Predis則便于快速部署;兩者均適用于生產環(huán)境且文檔完善。

如何在PHP( - , *, /,%)中執(zhí)行算術操作? 如何在PHP( - , *, /,%)中執(zhí)行算術操作? Jun 19, 2025 pm 05:13 PM

PHP中使用基本數學運算的方法如下:1.加法用 號,支持整數和浮點數,也可用于變量,字符串數字會自動轉換但不推薦依賴;2.減法用-號,變量同理,類型轉換同樣適用;3.乘法用*號,適用于數字及類似字符串;4.除法用/號,需避免除以零,并注意結果可能是浮點數;5.取模用%號,可用于判斷奇偶數,處理負數時余數符號與被除數一致。正確使用這些運算符的關鍵在于確保數據類型清晰并處理好邊界情況。

我如何了解最新的PHP開發(fā)和最佳實踐? 我如何了解最新的PHP開發(fā)和最佳實踐? Jun 23, 2025 am 12:56 AM

TostaycurrentwithPHPdevelopmentsandbestpractices,followkeynewssourceslikePHP.netandPHPWeekly,engagewithcommunitiesonforumsandconferences,keeptoolingupdatedandgraduallyadoptnewfeatures,andreadorcontributetoopensourceprojects.First,followreliablesource

什么是PHP,為什么它用于Web開發(fā)? 什么是PHP,為什么它用于Web開發(fā)? Jun 23, 2025 am 12:55 AM

PHPbecamepopularforwebdevelopmentduetoitseaseoflearning,seamlessintegrationwithHTML,widespreadhostingsupport,andalargeecosystemincludingframeworkslikeLaravelandCMSplatformslikeWordPress.Itexcelsinhandlingformsubmissions,managingusersessions,interacti

如何設置PHP時區(qū)? 如何設置PHP時區(qū)? Jun 25, 2025 am 01:00 AM

tosetTherightTimeZoneInphp,restate_default_timezone_set()functionAtthestArtofyourscriptWithavalIdidentIdentifiersuchas'america/new_york'.1.usedate_default_default_timezone_set_set()

See all articles