Comment fonctionne le machine learning ?
4 minutes de lecture
4 minutes de lecture
Sur cette page
L’apprentissage automatique est un sous-ensemble de intelligence artificielle (intelligence artificielle) qui se concentre sur la création et l’évolution de systèmes, qui ont la capacité d’exploiter des données et des modèles historiques, de prendre des décisions logiques et de faire des prédictions précises avec une implication humaine minimale ou nulle.
Dans les années 1950, intelligence artificielle pionnier Arthur Samuel a défini machine learning comme « le domaine d’étude qui donne aux ordinateurs la capacité d’apprendre sans être explicitement programmés ».
Les algorithmes d’apprentissage automatique, qui sont régis et pilotés par des modèles machine learning, sont conçus pour s’améliorer de manière adaptative à mesure que le volume de données (c’est-à-dire d’échantillons) augmente. Cependant, l’existence d’un biais machine learning sous-jacent (également appelé biais intelligence artificielle) a conduit à des prédictions erronées, qui à leur tour ont soutenu des décisions erronées et préjudiciables.
Actuellement utilisé par deux tiers de toutes les entreprises pour recommander des produits et services, Les experts disent que machine learning a déjà changé, ou changera bientôt, toutes les industries du monde à mesure que le technologie continue de progresser.
Alors que intelligence artificielle permet à des machines ou à des systèmes de penser comme un cerveau humain en utilisant des données pour raisonner, agir, s’adapter et tirer des conclusions, machine learning est une application du intelligence artificielle qui permet aux machines ou aux systèmes de transformer des données brutes en intelligence entreprise (connaissances) et d’en tirer des enseignements de manière autonome. L’apprentissage automatique entraîne l’intelligence artificielle à savoir quoi faire.
Essentiellement, le machine learning est le moteur qui permet à un système de développer son intelligence. L’apprentissage automatique n’est pas intelligence artificielle, mais plutôt une voie vers intelligence artificielle.
Le deep learning est un sous-ensemble (ou une forme spécialisée) du machine learning. Il utilise des couches d’algorithmes pour construire des réseaux de neurones artificiels capables d’apprendre et de prendre des décisions de manière autonome.
Si le système commence à générer des prédictions douteuses ou inexactes, un data scientist doit intervenir et faire des ajustements. Cependant, l’algorithme d’un modèle d’apprentissage profond a la capacité de déterminer, par lui-même, si les prédictions sont inexactes et peut apporter des corrections sans intervention humaine.
Un autre domaine de machine learning est le traitement du language naturel, qui vise à permettre aux machines et aux systèmes de reconnaître, de comprendre et de répondre correctement à la façon dont les êtres humains écrivent et parlent – ce qui, dans le monde technologie, est beaucoup plus diversifié et dynamique que de s’appuyer sur les chiffres et les données traditionnellement utilisés par les programmeurs.
Les chatbots tels que Siri d’Apple et Alexa d’Amazon sont des exemples de machine learning qui exploitent traitement du language naturel pour comprendre ce que les gens disent, ainsi que pour créer de nouveaux textes et effectuer des traductions.
Il existe quatre types de techniques de machine learning, qui façonnent et régissent les fonctions de base du modèle, telles que la classification des informations, la reconnaissance des formes, la prédiction des résultats et la prise de décisions fiables.
Apprentissage supervisé
L’apprentissage machine learning supervisé est un processus d’apprentissage dans lequel les algorithmes apprennent continuellement à partir de données étiquetées et, en tant que tels, deviennent plus intelligents et plus précis au fil du temps. Les étiquettes peuvent être organiques (c’est-à-dire disponibles dans les données elles-mêmes) ou ajoutées à l’extérieur. Parmi les exemples d’algorithmes d’apprentissage supervisé, citons les arbres de décision, les machines à vecteurs de support, les forêts aléatoires et le bayésien naïf.
Les algorithmes d’apprentissage supervisé se retrouvent dans des applications telles que la reconnaissance d’images et de parole, les systèmes de recommandation et la détection des fraudes.
Avec l’accès à des données pertinentes, l’apprentissage supervisé peut générer des prédictions précises et applicables, ce qui est l’objectif principal du modèle de machine learning. Cependant, l’apprentissage supervisé nécessite beaucoup de connaissances du domaine et d’efforts humains pour étiqueter les données.
Apprentissage non supervisé
L’Machine Learning non supervisé est une méthode d’apprentissage dans laquelle le modèle analyse des données non étiquetées pour trouver des modèles ou des tendances cachés et regroupe les points de données en clusters en fonction de similitudes ou d’anomalies. Par exemple, certains détaillants tirent parti de l’apprentissage non supervisé pour prédire quand certains types de clients sont susceptibles de quitter l’entonnoir de vente. Ces informations sont utilisées pour ajuster et cibler les campagnes et les messages marketing.
Le clustering K-means est l’algorithme d’machine learning non supervisé le plus rapide pour décomposer les points de données en groupes, même lorsque très peu d’informations sont disponibles.
Cependant, comme l’apprentissage non supervisé est autonome et n’implique pas d’intervention humaine, le manque de réponses prédéfinies pendant la formation peut rendre difficile la précision et la fiabilité mesurées.
Apprentissage semi-supervisé
Entre l’apprentissage supervisé et l’apprentissage non supervisé, l’apprentissage semi-supervisé porte bien son nom. Avec cette approche, le modèle est d’abord entraîné à l’aide d’un petit nombre d’échantillons étiquetés, qui sont ensuite appliqués de manière itérative à un plus grand volume de données non étiquetées (ce processus est connu sous le nom de pseudo-étiquetage). En fin de compte, le modèle est entraîné à l’aide d’un mélange de données étiquetées et étiquetées de manière itérative.
L’un des principaux avantages de l’apprentissage semi-supervisé est que le temps et les coûts requis pour la préparation des données sont considérablement inférieurs à ceux de l’apprentissage supervisé. De plus, contrairement à l’apprentissage non supervisé, l’apprentissage semi-supervisé peut s’appliquer à un large éventail de problèmes (par exemple, la classification, la régression, le clustering, l’association, etc.). Cependant, le principal inconvénient est que le processus d’itération est très complexe et n’est donc pas bien adapté à des problèmes plus complexes.
Apprentissage par renforcement
L’apprentissage par renforcement utilise une approche par essais et erreurs pour savoir quelles actions et décisions sont les plus favorables au fil du temps. Au cœur de l’apprentissage par renforcement se trouve un moteur de système de récompense qui indique au modèle quand il a pris une décision correcte (et a gagné une récompense) ou a pris une décision incorrecte (et est soumis à une pénalité).
L’apprentissage par renforcement peut être extrêmement efficace pour résoudre des problèmes complexes. Au fur et à mesure que le modèle apprend de ses erreurs et de ses expériences, le moteur de récompense et de punition réduit la probabilité d’erreurs répétées. Cependant, l’apprentissage par renforcement nécessite un grand volume de données et les coûts de maintenance peuvent être élevés.
Un apprentissage par renforcement excessif peut également entraîner une piste commerciale d’états, ce qui réduit la fiabilité des résultats. Les états sont des observations que l’agent (c’est-à-dire l’entité ou le programme indépendant qui perçoit via des capteurs et agit par des actionneurs ou des effecteurs) reçoit de l’environnement.
Le marché mondial du machine learning devrait atteindre 225,91 milliards de dollars d’ici 2030 et est déjà en train de transformer et de faire progresser diverses industries. Voici quelques exemples exemples concrets et d’applications de machine learning.
Ce ne sont là qu’un échantillon des cas d’utilisation existants du machine learning. Il y a aussi de nombreux développements machine learning passionnants à l’horizon, tels que la croissance de écosystèmes de données cloud, jusqu’au potentiel de l’utilisation de l’informatique quantique pour optimiser les algorithmes pour le big data.
Alors que le monde est en effervescence à propos de intelligence artificielle (et pour de nombreuses raisons valables), dans les coulisses et loin des projecteurs, machine learning est utilisé chaque jour dans de nouvelles initiatives de science des données pour transformer d’immenses quantités de données en informations fiables qui résolvent des problèmes importants et atteignent des objectifs louables : tout, de améliorant le divertissement, à améliorer l’éducation, à sauver des vies.
Pour en savoir plus sur machine learning, consultez le Sitecore Knowledge Base.
Comment fonctionne le machine learning ?
Jusqu’à présent, nous nous sommes penchés sur une définition de base du machine learning et avons mis en évidence certaines différences essentielles entre machine learning technologies et techniques étroitement associées. Une fois cette base en place, nous pouvons porter notre attention sur comment machine learning fonctionne.
En règle générale, il y a six étapes principales dans la construction d’un modèle machine learning pour entraîner intelligence artificielle :
Il est extrêmement important de s’assurer que les objectifs du modèle ciblent les exigences de l’entreprise, et pas seulement les exigences de l’apprentissage machine (par exemple, la précision, l’exactitude, etc.). L’objectif fondamental du modèle est de résoudre des objectifs considérable, pratiques et pertinent entreprise – que cela signifie améliorer les expériences de voyage, ce qui en fait plus facile et plus rapide pour les gens de trouver un emploi, ou en activant processus métier l’automatisation à grande échelle.
L’acronyme GIGO (« garbage in, garbage out ») s’applique ici. Sans accès à un volume suffisant de bonnes données, le modèle de machine learning sera intrinsèquement incapable de générer des prédictions précises et fiables. Garantir à la fois la quantité et la qualité des données permet au modèle de remplir son objectif d’entraînement de l’intelligence artificielle.
Ensuite, il existe une variété d’activités de préparation de données structurées (par exemple, les chiffres d’affaires), non structurées (par exemple, les enquêtes auprès des clients) et semi-structurées (par exemple, les e-mails) à couvrir, telles que la collecte, le nettoyage, l’agrégation, l’augmentation, l’étiquetage, la normalisation et la transformation.
Investir du temps, des efforts et des ressources de qualité ici est nécessaire. En effet, de nombreux modèles de machine learning, par ailleurs élégants et impressionnants, sont minés par des lacunes dans le processus de préparation des données.
Les données d’apprentissage sont le jeu de données utilisé pour entraîner le modèle de machine learning, ce qui apprend à l’algorithme à prendre des décisions.
Considérez cette étape du processus comme un effort d’assurance qualité qui comprend des tâches telles que :
L’opérationnalisation du modèle de machine learning peut être un processus relativement simple (par exemple, la génération d’un rapport) ou un effort plus complexe (par exemple, le déploiement de plusieurs points de terminaison). Cependant, même si le modèle fonctionne à plein régime, rien ne garantit – et il ne faut pas s’attendre à ce qu’il reste optimisé au fil du temps.