Types de machine learning : Apprentissage supervisé et non supervisé

Types de machine learning : Apprentissage supervisé et non supervisé

Ce tutoriel explique les types d’apprentissage automatique, à savoir l’apprentissage supervisé, non supervisé, renforcé et semi-supervisé, à l’aide d’exemples simples. Vous apprendrez également les différences entre l’apprentissage supervisé et l’apprentissage non supervisé :

Dans le tutoriel précédent sur le machine learning, nous avons appris à connaître l’apprentissage automatique, son fonctionnement et ses applications. Nous avons également vu une comparaison entre l’apprentissage automatique et l’intelligence artificielle.

L’apprentissage automatique est un domaine scientifique qui traite des programmes informatiques apprenant par l’expérience et prédisant les résultats.

La principale caractéristique de l’apprentissage automatique est l’apprentissage par l’expérience. L’apprentissage se produit lorsque le système, alimenté par des données d’entrée de formation, modifie ses paramètres et s’ajuste pour produire le résultat souhaité. La sortie est la valeur cible définie dans les données d’apprentissage.

Types d’apprentissage automatique

Les programmes d’apprentissage automatique sont classés en 3 types, comme indiqué ci-dessous.

  • Supervisé
  • Non supervisé
  • Apprentissage par renforcement

Comprenons chacun de ces types en détail !

Machine Learning par Apprentissage supervisé

L’apprentissage supervisé se fait en présence d’un superviseur, tout comme l’apprentissage effectué par un petit enfant avec l’aide de son professeur. De même qu’un enfant est entraîné à reconnaître des fruits, des couleurs, des chiffres sous la supervision d’un enseignant, cette méthode est un apprentissage supervisé.

Dans cette méthode, chaque étape de l’enfant est contrôlée par l’enseignant et l’enfant apprend à partir du résultat qu’il doit produire.

Comment fonctionne l’apprentissage supervisé ?

Dans l’algorithme ML supervisé, le résultat est déjà connu. Il existe une correspondance entre l’entrée et la sortie. Par conséquent, pour créer un modèle, la machine est alimentée par de nombreuses données d’entrée d’apprentissage (dont l’entrée et la sortie correspondante sont connues).

Les données d’apprentissage permettent d’atteindre un certain niveau de précision pour le modèle de données créé. Le modèle construit est maintenant prêt à recevoir de nouvelles données d’entrée et à prédire les résultats.

Qu’est-ce qu’un ensemble de données qualifiées ?

L’ensemble de données dont les résultats sont connus pour une entrée donnée est appelé ensemble de données étiquetées. Par exemple, une image de fruit avec le nom du fruit est connue. Ainsi, lorsqu’une nouvelle image de fruit est présentée, elle est comparée à l’ensemble d’apprentissage pour prédire la réponse.

L’apprentissage supervisé est un mécanisme d’apprentissage rapide et très précis. Les problèmes d’apprentissage supervisé comprennent les problèmes de régression et de classification.

Certains des algorithmes d’apprentissage supervisé sont :

  • Arbres de décision,
  • le voisin le plus proche (K-Nearest Neighbor),
  • la régression linéaire,
  • Machine à vecteur de support et
  • les réseaux neuronaux.

Exemple d’apprentissage supervisé

  • Dans la première étape, un ensemble de données d’apprentissage est fourni à l’algorithme d’apprentissage automatique.
  • Avec l’ensemble de données d’apprentissage, la machine s’ajuste elle-même, en modifiant les paramètres pour construire un modèle logique.
  • Le modèle construit est ensuite utilisé pour un nouvel ensemble de données afin de prédire le résultat.

Types d’algorithmes d’apprentissage supervisé

La classification : Dans ce type de problèmes, nous prédisons la réponse en tant que classes spécifiques, telles que « oui » ou « non ». Lorsque deux classes seulement sont présentes, on parle de classification binaire. Pour plus de 2 classes, il s’agit d’une classification multi-classes. Les valeurs de réponse prédites sont des valeurs discrètes. Par exemple, s’agit-il de l’image du soleil ou de la lune ? L’algorithme de classification sépare les données en classes.
Régression : Les problèmes de régression prédisent la réponse sous forme de valeurs continues, comme la prédiction d’une valeur allant de -infini à infini. Elle peut prendre de nombreuses valeurs. Par exemple, l’algorithme de régression linéaire qui est appliqué, prédit le coût de la maison en fonction de nombreux paramètres tels que l’emplacement, l’aéroport à proximité, la taille de la maison, etc.

Machine learning par Apprentissage non supervisé

L’apprentissage non supervisé se fait sans l’aide d’un superviseur, tout comme un poisson apprend à nager tout seul. Il s’agit d’un processus d’apprentissage indépendant.

Dans ce modèle, comme il n’y a pas de sortie associée à l’entrée, les valeurs cibles sont inconnues/non étiquetées. Le système doit apprendre par lui-même à partir des données qu’il reçoit en entrée et détecter les modèles cachés.

Qu’est-ce qu’un ensemble de données non qualifié ?

Un ensemble de données dont les valeurs de sortie sont inconnues pour toutes les valeurs d’entrée est appelé ensemble de données non étiquetées.

Comment fonctionne l’apprentissage non supervisé ?

Comme il n’y a pas de valeurs de sortie connues qui peuvent être utilisées pour construire un modèle logique entre l’entrée et la sortie, certaines techniques sont utilisées pour extraire des règles de données, des modèles et des groupes de données de types similaires. Ces groupes aident les utilisateurs finaux à mieux comprendre les données et à trouver une sortie significative.

Les données d’entrée ne se présentent pas sous la forme d’une structure appropriée, tout comme les données de formation (dans l’apprentissage supervisé). Elles peuvent contenir des valeurs aberrantes, des données bruitées, etc. Ces entrées sont alimentées ensemble au système. Lors de la formation du modèle, les entrées sont organisées pour former des clusters.

Les algorithmes d’apprentissage non supervisé comprennent les algorithmes de regroupement et d’association tels que :

  • Apriori
  • le clustering K-means et d’autres algorithmes d’extraction de règles d’association.

Lorsque le modèle reçoit de nouvelles données, il prédit le résultat sous la forme d’une étiquette de classe à laquelle l’entrée appartient. Si l’étiquette de classe n’est pas présente, une nouvelle classe sera générée.

Au cours du processus de découverte de modèles dans les données, le modèle ajuste ses paramètres par lui-même, c’est pourquoi il est également appelé auto-organisateur. Les clusters seront formés en découvrant les similarités entre les entrées.

Par exemple, lors de l’achat de produits en ligne, si du beurre est mis dans le panier, il suggère d’acheter du pain, du fromage, etc. Le modèle non supervisé examine les points de données et prédit les autres attributs qui sont associés au produit.

Types d’algorithmes non supervisés

  • Algorithme de clustering : Les méthodes permettant de trouver les similitudes entre les éléments de données tels que la même forme, la même taille, la même couleur, le même prix, etc. et de les regrouper pour former un cluster sont l’analyse de cluster.
  • Détection des valeurs aberrantes : Dans cette méthode, l’ensemble de données est la recherche de tout type de dissemblances et d’anomalies dans les données. Par exemple, une transaction de grande valeur sur une carte de crédit est détectée par le système pour la détection des fraudes.
  • L’extraction de règles d’association : Dans ce type d’exploration, on découvre les ensembles d’éléments les plus fréquents ou les associations entre éléments. Des associations telles que « produits souvent achetés ensemble », etc.
  • Auto-codeurs : L’entrée est compressée sous une forme codée et est recréée pour éliminer les données bruyantes. Cette technique est utilisée pour améliorer la qualité des images et des vidéos.

Apprentissage par renforcement

Dans ce type d’apprentissage, l’algorithme apprend par le mécanisme de rétroaction et les expériences passées. On souhaite toujours que chaque étape de l’algorithme soit effectuée pour atteindre un objectif.

Ainsi, chaque fois que l’étape suivante doit être franchie, l’algorithme reçoit le retour d’information de l’étape précédente, ainsi que l’apprentissage par l’expérience pour prédire quelle pourrait être la meilleure étape suivante. Ce processus est également appelé processus d’essai et d’erreur pour atteindre l’objectif.

L’apprentissage par renforcement est un processus itératif à long terme. Plus le nombre de retours d’information est important, plus le système devient précis. L’apprentissage par renforcement de base est également appelé processus de décision de Markov.

Exemple d’apprentissage par renforcement

Un exemple d’apprentissage par renforcement est celui des jeux vidéo, où les joueurs complètent certains niveaux d’un jeu et gagnent des points de récompense. Le jeu fournit un retour d’information au joueur par le biais de mouvements bonus pour améliorer ses performances.

L’apprentissage par renforcement est utilisé pour la formation des robots, des voitures autonomes, la gestion automatique des stocks, etc.

Les algorithmes d’apprentissage par renforcement les plus populaires sont les suivants :

  • Q-Learning,
  • les réseaux adversariens profonds
  • Différence temporelle

La figure ci-dessous décrit le mécanisme de rétroaction de l’apprentissage par renforcement.

  • L’entrée est observée par l’agent qui est l’élément IA.
  • Cet agent IA agit sur l’environnement en fonction de la décision prise.
  • La réponse de l’environnement est envoyée à l’IA sous la forme d’une récompense en retour.
  • L’état et l’action réalisés sur l’environnement sont également enregistrés.

Exemple concret d’apprentissage supervisé et non supervisé

Pour l’apprentissage supervisé :

1) Prenons l’exemple d’un panier de légumes composé d’oignons, de carottes, de radis, de tomates, etc. et classons-les par groupes.

2) Nous créons un tableau de données d’apprentissage pour comprendre l’apprentissage supervisé.

Le tableau de données d’apprentissage caractérise les légumes en fonction de :

  • la forme
  • Couleur
  • Taille
FormeCouleurTailleLégume
rondemarrongrosOignon
ronderougemoyenTomate
cylindriquerosemoyenRadis
cyclindriqueorangemoyenCarotte
Tableau de données qualifiées

Lorsque ce tableau de données d’apprentissage est transmis à la machine, celle-ci construit un modèle logique en utilisant la forme, la couleur, la taille du légume, etc. pour prédire le résultat (légume).

Lorsqu’une nouvelle entrée est introduite dans ce modèle, l’algorithme analyse les paramètres et donne le nom du fruit.

Pour l’apprentissage non supervisé :

Dans l’apprentissage non supervisé, il crée des groupes ou des clusters basés sur des attributs. Dans l’échantillon de données ci-dessus, les paramètres des légumes sont les suivants :

1) Forme

Les légumes sont regroupés en fonction de leur forme.

  • Ronds : Oignon et tomate.
  • Cylindrique : Radis et Carotte.

Prenons un autre paramètre tel que la taille.

2) Taille

Les légumes sont regroupés en fonction de leur taille et de leur forme :

  • Taille moyenne et forme ronde : Tomate
  • Grande taille et forme ronde : Oignon

Dans l’apprentissage non supervisé, nous ne disposons pas d’un ensemble de données d’apprentissage ni d’une variable de résultat, tandis que dans l’apprentissage supervisé, les données d’apprentissage sont connues et sont utilisées pour entraîner l’algorithme.

Différence entre l’apprentissage supervisé et l’apprentissage non supervisé

SuperviséNon Supervisé
Dans les algorithmes d’apprentissage supervisé, la sortie pour l’entrée donnée est connue.Dans les algorithmes d’apprentissage non supervisé, la sortie pour l’entrée donnée est inconnue.
Les algorithmes apprennent à partir d’un ensemble de données étiquetées. Ces données permettent d’évaluer la précision des données d’apprentissage.L’algorithme reçoit des données non étiquetées où il essaie de trouver des modèles et des associations entre les éléments de données.
Elle comprend des algorithmes de classification et de régression.Il comprend des algorithmes de regroupement et d’apprentissage de règles d’association.
Certains algorithmes d’apprentissage supervisé sont la régression linéaire, Naïve Bayes et les réseaux neuronaux.Certains algorithmes d’apprentissage non supervisé sont le clustering à moyenne k, Apriori, etc.
Ce type d’apprentissage est relativement complexe car il nécessite des données qualifiées.Il est moins complexe car il n’est pas nécessaire de comprendre et d’étiqueter les données.
Il est plus précis que l’apprentissage non supervisé car les données d’entrée et la sortie correspondante sont bien connues, et la machine n’a besoin que de donner des prédictions.Il est moins précis car les données d’entrée ne sont pas étiquetées. Ainsi, la machine doit d’abord comprendre et étiqueter les données, puis donner des prédictions.
Il s’agit d’un processus d’analyse des données en ligne qui ne nécessite pas d’interaction humaineIl s’agit d’une analyse des données en temps réel.

Apprentissage semi-supervisé

L’approche d’apprentissage semi-supervisé utilise des données de formation étiquetées et non étiquetées. Ce type d’apprentissage est utile lorsqu’il est difficile d’extraire des caractéristiques utiles de données non étiquetées (approche supervisée) et que les experts en données trouvent difficile d’étiqueter les données d’entrée (approche non supervisée).

Seule une petite quantité de données étiquetées dans ces algorithmes peut conduire à la précision du modèle.

Parmi les exemples d’apprentissage semi-supervisé, citons les tomodensitogrammes et les IRM, où un expert médical peut étiqueter quelques points des scans pour une maladie quelconque, alors qu’il est difficile d’étiqueter tous les scans.

Conclusion sur les différents types de machine learning

Les tâches d’apprentissage automatique sont largement classées en tâches supervisées, non supervisées, semi-supervisées et d’apprentissage par renforcement.

L’apprentissage supervisé consiste à apprendre à l’aide de données étiquetées. Les algorithmes d’apprentissage automatique sont alimentés par un ensemble de données d’apprentissage dans lequel la sortie est connue pour chaque donnée d’entrée, afin de prédire les résultats futurs.

Ce modèle est très précis et rapide, mais il nécessite une grande expertise et du temps pour le construire. En outre, ces modèles doivent être reconstruits si les données changent. Les tâches ML telles que la régression et la classification sont effectuées dans un environnement d’apprentissage supervisé.

L’apprentissage non supervisé s’effectue sans l’aide d’un superviseur. Les données d’entrée fournies aux algorithmes ML sont non étiquetées, c’est-à-dire que pour chaque entrée, aucune sortie n’est connue. L’algorithme découvre de lui-même les tendances et les modèles dans les données d’entrée et crée une association entre les différents attributs de l’entrée.

Ce type d’apprentissage est utile pour trouver des modèles dans les données, créer des clusters de données et effectuer des analyses en temps réel. Des tâches telles que le clustering, les algorithmes KNN, etc. relèvent de l’apprentissage non supervisé.

Les tâches d’apprentissage semi-supervisé tirent parti des algorithmes supervisés et non supervisés en prédisant les résultats à l’aide de données étiquetées et non étiquetées. L’apprentissage par renforcement est un type de mécanisme de rétroaction dans lequel la machine apprend à partir d’une rétroaction constante de l’environnement pour atteindre son objectif.

Dans ce type d’apprentissage, les agents d’IA effectuent certaines actions sur les données et l’environnement leur donne une récompense. L’apprentissage par renforcement est utilisé par les jeux multijoueurs pour enfants, les voitures à conduite autonome, etc.

Laisser un commentaire