L'apprentissage automatique (ML) est un outil puissant qui permet aux ordinateurs d'apprendre à partir de données et de faire des prédictions ou des décisions. Mais tous les apprentissages automatiques ne sont pas identiques : il existe différents types d’apprentissage, chacun adapté à des taches spécifiques. Les deux types les plus courants sont l'apprentissage supervisé et l'apprentissage non supervisé. Dans cet article, nous explorerons les différences entre eux, fournirons des exemples concrets et passerons en revue des extraits de code pour vous aider à comprendre leur fonctionnement.
Qu'est-ce que l'apprentissage supervisé??
L'apprentissage supervisé est un type d'apprentissage automatique dans lequel un algorithme apprend à partir de données étiquetées. En d’autres termes, les données que vous fournissez au modèle incluent les entités en entrée et les sorties correctes (étiquettes). L’objectif est que le modèle apprenne la relation entre les entrées et les sorties afin de pouvoir faire des prédictions précises sur de nouvelles données invisibles.
Exemples concrets d'apprentissage supervisé
Détection du spam par courrier électronique?:
- Saisie?: Le texte de l'e-mail.
- Sortie?: Libellé indiquant si l'e-mail est "Spam" ou "Not Spam".
- Le modèle apprend à classer les e-mails en fonction d'exemples étiquetés.
Prévisions des prix des maisons?:
- Entrée?: Caractéristiques de la maison (par exemple, superficie en pieds carrés, nombre de chambres, emplacement).
- Sortie?: Prix de la maison.
- Le modèle apprend à prédire les prix sur la base de données historiques.
Diagnostic médical?:
- Entrée?: données du patient (par exemple, sympt?mes, résultats de laboratoire).
- Sortie?: Diagnostic (par exemple ? Santé ? ou ? Diabète ?).
- Le modèle apprend à diagnostiquer sur la base de dossiers médicaux étiquetés.
Qu'est-ce que l'apprentissage non supervisé??
L'apprentissage non supervisé est un type d'apprentissage automatique dans lequel les algorithmes apprennent à partir de données non étiquetées. Contrairement à l’apprentissage supervisé, aucun résultat correct n’est fourni. Au lieu de cela, les modèles tentent de trouver par eux-mêmes des modèles, des structures ou des relations dans les données.
Exemples concrets d'apprentissage non supervisé
Segmentation client?:
- Entrée?: données client (par exemple, age, historique des achats, emplacement).
- Résultat?: groupes de clients similaires (par exemple, ? acheteurs à haute fréquence ?, ? acheteurs à petit budget ?).
- Le modèle identifie des groupes de clients ayant un comportement similaire.
Détection d'anomalies?:
- Entrée?: données de trafic réseau.
- Résultat?: identifiez les modèles inhabituels pouvant indiquer une cyberattaque.
- Le modèle détecte les valeurs aberrantes ou les anomalies dans les données.
Analyse du panier de marché?:
- Entrée?: données de transaction d'épicerie.
- Sortie?: groupes de produits qui sont souvent achetés ensemble (par exemple, ??pain et beurre??).
- Le modèle identifie les associations entre les produits.
Les principales différences entre l'apprentissage supervisé et l'apprentissage non supervisé
**方面** | **監(jiān)督學(xué)習(xí)** | **無(wú)監(jiān)督學(xué)習(xí)** |
---|---|---|
**數(shù)據(jù)** | 標(biāo)記的(提供輸入和輸出) | 未標(biāo)記的(僅提供輸入) |
**目標(biāo)** | 預(yù)測(cè)結(jié)果或?qū)?shù)據(jù)進(jìn)行分類(lèi) | 發(fā)現(xiàn)數(shù)據(jù)中的模式或結(jié)構(gòu) |
**示例** | 分類(lèi)、回歸 | 聚類(lèi)、降維 |
**復(fù)雜性** | 更容易評(píng)估(已知輸出) | 更難評(píng)估(沒(méi)有基本事實(shí)) |
**用例** | 垃圾郵件檢測(cè)、價(jià)格預(yù)測(cè) | 客戶(hù)細(xì)分、異常檢測(cè) |
Exemple de code
Examinons un peu de code et voyons comment l'apprentissage supervisé et non supervisé fonctionne dans la pratique. Nous utiliserons Python et la populaire bibliothèque Scikit-learn.
Exemple d'apprentissage supervisé?: Prédire les prix de l'immobilier
Nous utiliserons un modèle de régression linéaire simple pour prédire le prix d'une maison en fonction de caractéristiques telles que la superficie en pieds carrés.
# 導(dǎo)入庫(kù) import numpy as np import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression from sklearn.metrics import mean_squared_error # 創(chuàng)建樣本數(shù)據(jù)集 data = { 'SquareFootage': [1400, 1600, 1700, 1875, 1100, 1550, 2350, 2450, 1425, 1700], 'Price': [245000, 312000, 279000, 308000, 199000, 219000, 405000, 324000, 319000, 255000] } df = pd.DataFrame(data) # 特征 (X) 和標(biāo)簽 (y) X = df[['SquareFootage']] y = df['Price'] # 將數(shù)據(jù)分成訓(xùn)練集和測(cè)試集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 訓(xùn)練線(xiàn)性回歸模型 model = LinearRegression() model.fit(X_train, y_train) # 做出預(yù)測(cè) y_pred = model.predict(X_test) # 評(píng)估模型 mse = mean_squared_error(y_test, y_pred) print(f"均方誤差:{mse:.2f}")
Exemple d'apprentissage non supervisé?: segmentation client
Nous utiliserons l'algorithme de clustering K-means pour regrouper les clients en fonction de leur age et de leurs habitudes de dépenses.
# 導(dǎo)入庫(kù) import numpy as np import pandas as pd from sklearn.cluster import KMeans import matplotlib.pyplot as plt # 創(chuàng)建樣本數(shù)據(jù)集 data = { 'Age': [25, 34, 22, 45, 32, 38, 41, 29, 35, 27], 'SpendingScore': [30, 85, 20, 90, 50, 75, 80, 40, 60, 55] } df = pd.DataFrame(data) # 特征 (X) X = df[['Age', 'SpendingScore']] # 訓(xùn)練 K 均值聚類(lèi)模型 kmeans = KMeans(n_clusters=3, random_state=42) df['Cluster'] = kmeans.fit_predict(X) # 可視化集群 plt.scatter(df['Age'], df['SpendingScore'], c=df['Cluster'], cmap='viridis') plt.xlabel('年齡') plt.ylabel('消費(fèi)評(píng)分') plt.title('客戶(hù)細(xì)分') plt.show()
Quand utiliser l'apprentissage supervisé ou l'apprentissage non supervisé
Quand utiliser l'apprentissage supervisé?:
- Vous avez étiqueté les données.
- Vous souhaitez prédire des résultats ou classer des données.
- Exemples?: Prédire les ventes, classer les images, détecter les fraudes.
Quand utiliser l'apprentissage non supervisé?:
- Vous disposez de données non étiquetées.
- Vous souhaitez découvrir des motifs ou des structures cachés.
- Exemples?: regroupez les clients, réduisez les dimensions des données et recherchez les anomalies.
Conclusion
L'apprentissage supervisé et l'apprentissage non supervisé sont deux méthodes de base de l'apprentissage automatique, chacune avec ses propres avantages et cas d'utilisation. L'apprentissage supervisé est idéal pour faire des prédictions lorsque vous disposez de données étiquetées, tandis que l'apprentissage non supervisé est idéal lorsque vous souhaitez explorer et découvrir des modèles dans des données non étiquetées.
En comprenant les différences et en vous entra?nant avec des exemples concrets, tels que ceux présentés dans cet article, vous ma?triserez ces techniques de base d'apprentissage automatique. Si vous avez des questions ou souhaitez partager vos propres expériences, n'hésitez pas à laisser un commentaire ci-dessous.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

L'Unittest et Pytest de Python sont deux cadres de test largement utilisés qui simplifient l'écriture, l'organisation et l'exécution de tests automatisés. 1. Les deux prennent en charge la découverte automatique des cas de test et fournissent une structure de test claire: unittest définit les tests en héritant de la classe TestCase et en commen?ant par Test \ _; PyTest est plus concis, il suffit d'une fonction à partir de test \ _. 2. Ils ont tous un support d'affirmation intégré: Unittest fournit ASSERTEQUAL, ASSERTTRUE et d'autres méthodes, tandis que PyTest utilise une instruction ASSERT améliorée pour afficher automatiquement les détails de l'échec. 3. Tous ont des mécanismes pour gérer la préparation et le nettoyage des tests: l'ONU

PythonisidealfordataanalysysydUetonumpyandpandas.1) NumpyExcelsAtnumericalcomputations withfast, multidimensionalarraysandvectorizedoperationslikenp.sqrt (). 2) PandashandlesstructuredDatawitheSeriesandData

La programmation dynamique (DP) optimise le processus de solution en décomposant des problèmes complexes en sous-problèmes plus simples et en stockant leurs résultats pour éviter les calculs répétés. Il existe deux méthodes principales: 1. De haut en bas (mémorisation): décomposer récursivement le problème et utiliser le cache pour stocker les résultats intermédiaires; 2. Affaisant (tableau): construire de manière itérative des solutions à partir de la situation de base. Convient pour des scénarios où des valeurs maximales / minimales, des solutions optimales ou des sous-problèmes qui se chevauchent sont nécessaires, tels que les séquences de Fibonacci, les problèmes de randonnée, etc. Dans Python, il peut être mis en ?uvre par le biais de décorateurs ou des tableaux, et l'attention doit être accordée à l'identification des relations récursives, à la définition de la situation de la banquette et à l'optimisation de la complexité de l'espace.

Pour implémenter un itérateur personnalisé, vous devez définir les méthodes __iter__ et __Next__ dans la classe. ① La méthode __iter__ renvoie l'objet itérateur lui-même, généralement soi, pour être compatible avec des environnements itératifs tels que pour les boucles; ② La méthode __Next__ contr?le la valeur de chaque itération, renvoie l'élément suivant dans la séquence, et lorsqu'il n'y a plus d'éléments, une exception d'arrêt doit être lancée; ③ L'état doit être suivi correctement et les conditions de terminaison doivent être définies pour éviter les boucles infinies; ④ Logique complexe telle que le filtrage des lignes de fichiers et faire attention au nettoyage des ressources et à la gestion de la mémoire; ⑤ Pour une logique simple, vous pouvez envisager d'utiliser le rendement de la fonction du générateur à la place, mais vous devez choisir une méthode appropriée basée sur le scénario spécifique.

Les tendances futures de Python incluent l'optimisation des performances, les invites de type plus fortes, la montée des temps d'exécution alternatifs et la croissance continue du champ AI / ML. Premièrement, CPYthon continue d'optimiser, améliorant les performances grace à un temps de démarrage plus rapide, à l'optimisation des appels de fonction et à des opérations entières proposées; Deuxièmement, les invites de type sont profondément intégrées dans les langues et les cha?nes d'outils pour améliorer l'expérience de sécurité et de développement du code; Troisièmement, des temps d'exécution alternatifs tels que Pyscript et Nuitka offrent de nouvelles fonctions et des avantages de performance; Enfin, les domaines de l'IA et de la science des données continuent de se développer, et les bibliothèques émergentes favorisent un développement et une intégration plus efficaces. Ces tendances indiquent que Python s'adapte constamment aux changements technologiques et maintient sa position principale.

Le module de socket de Python est la base de la programmation réseau, offrant des fonctions de communication réseau de bas niveau, adaptées à la création d'applications client et serveur. Pour configurer un serveur TCP de base, vous devez utiliser socket.socket () pour créer des objets, lier des adresses et des ports, appelez .Listen () pour écouter les connexions et accepter les connexions client via .Accept (). Pour créer un client TCP, vous devez créer un objet Socket et appeler .Connect () pour vous connecter au serveur, puis utiliser .sendall () pour envoyer des données et .recv () pour recevoir des réponses. Pour gérer plusieurs clients, vous pouvez utiliser 1. Threads: Démarrez un nouveau thread à chaque fois que vous vous connectez; 2. E / S asynchrone: Par exemple, la bibliothèque Asyncio peut obtenir une communication non bloquante. Choses à noter

Le polymorphisme est un concept de base dans la programmation orientée objet Python, se référant à "une interface, plusieurs implémentations", permettant le traitement unifié de différents types d'objets. 1. Le polymorphisme est implémenté par la réécriture de la méthode. Les sous-classes peuvent redéfinir les méthodes de classe parent. Par exemple, la méthode Spoke () de classe animale a des implémentations différentes dans les sous-classes de chiens et de chats. 2. Les utilisations pratiques du polymorphisme comprennent la simplification de la structure du code et l'amélioration de l'évolutivité, tels que l'appel de la méthode Draw () uniformément dans le programme de dessin graphique, ou la gestion du comportement commun des différents personnages dans le développement de jeux. 3. Le polymorphisme de l'implémentation de Python doit satisfaire: la classe parent définit une méthode, et la classe enfant remplace la méthode, mais ne nécessite pas l'héritage de la même classe parent. Tant que l'objet implémente la même méthode, c'est ce qu'on appelle le "type de canard". 4. Les choses à noter incluent la maintenance

La réponse principale au découpage de la liste Python est de ma?triser la syntaxe [start: fin: étape] et comprendre son comportement. 1. Le format de base du découpage de la liste est la liste [Démarrage: fin: étape], où le démarrage est l'index de démarrage (inclus), la fin est l'index final (non inclus), et l'étape est la taille de pas; 2. OMIT START Par défaut Démarrer à partir de 0, omettre la fin par défaut à la fin, omettez l'étape par défaut à 1; 3. Utilisez My_List [: N] pour obtenir les N premiers éléments et utilisez My_List [-N:] pour obtenir les N derniers éléments; 4. Utilisez l'étape pour sauter des éléments, tels que My_List [:: 2] pour obtenir des chiffres pair, et les valeurs d'étape négatives peuvent inverser la liste; 5. Les malentendus communs incluent l'indice final pas
