Comment fonctionne le machine learning ?

Actuellement utilisé par les deux tiers de toutes les entreprises pour recommander des produits et des services, le machine learning a déjà changé, ou changera bientôt, tous les secteurs d’activité dans le monde. Découvrez comment cela fonctionne.

4 minutes de lecture

An Artificial Intelligence brain with circuit board is on learning process. Futuristic design concept. Abstract digital and technology background. Vector Illustration.

Qu’est-ce que le machine learning ?

L’apprentissage automatique est un sous-ensemble de intelligence artificielle (intelligence artificielle) qui se concentre sur la création et l’évolution de systèmes, qui ont la capacité d’exploiter des données et des modèles historiques, de prendre des décisions logiques et de faire des prédictions précises avec une implication humaine minimale ou nulle.

Dans les années 1950, intelligence artificielle pionnier Arthur Samuel a défini machine learning comme « le domaine d’étude qui donne aux ordinateurs la capacité d’apprendre sans être explicitement programmés ».

Les algorithmes d’apprentissage automatique, qui sont régis et pilotés par des modèles machine learning, sont conçus pour s’améliorer de manière adaptative à mesure que le volume de données (c’est-à-dire d’échantillons) augmente. Cependant, l’existence d’un biais machine learning sous-jacent (également appelé biais intelligence artificielle) a conduit à des prédictions erronées, qui à leur tour ont soutenu des décisions erronées et préjudiciables.

Actuellement utilisé par deux tiers de toutes les entreprises pour recommander des produits et services, Les experts disent que machine learning a déjà changé, ou changera bientôt, toutes les industries du monde à mesure que le technologie continue de progresser.

Apprentissage automatique et intelligence artificielle

Alors que intelligence artificielle permet à des machines ou à des systèmes de penser comme un cerveau humain en utilisant des données pour raisonner, agir, s’adapter et tirer des conclusions, machine learning est une application du intelligence artificielle qui permet aux machines ou aux systèmes de transformer des données brutes en intelligence entreprise (connaissances) et d’en tirer des enseignements de manière autonome. L’apprentissage automatique entraîne l’intelligence artificielle à savoir quoi faire.

Essentiellement, le machine learning est le moteur qui permet à un système de développer son intelligence. L’apprentissage automatique n’est pas intelligence artificielle, mais plutôt une voie vers intelligence artificielle.

Comparaison entre l’apprentissage automatique et l’apprentissage profond

Le deep learning est un sous-ensemble (ou une forme spécialisée) du machine learning. Il utilise des couches d’algorithmes pour construire des réseaux de neurones artificiels capables d’apprendre et de prendre des décisions de manière autonome.

Si le système commence à générer des prédictions douteuses ou inexactes, un data scientist doit intervenir et faire des ajustements. Cependant, l’algorithme d’un modèle d’apprentissage profond a la capacité de déterminer, par lui-même, si les prédictions sont inexactes et peut apporter des corrections sans intervention humaine.

Apprentissage automatique et traitement du langage naturel

Un autre domaine de machine learning est le traitement du language naturel, qui vise à permettre aux machines et aux systèmes de reconnaître, de comprendre et de répondre correctement à la façon dont les êtres humains écrivent et parlent – ce qui, dans le monde technologie, est beaucoup plus diversifié et dynamique que de s’appuyer sur les chiffres et les données traditionnellement utilisés par les programmeurs.

Les chatbots tels que Siri d’Apple et Alexa d’Amazon sont des exemples de machine learning qui exploitent traitement du language naturel pour comprendre ce que les gens disent, ainsi que pour créer de nouveaux textes et effectuer des traductions.

Comment fonctionne le machine learning ?

Jusqu’à présent, nous nous sommes penchés sur une définition de base du machine learning et avons mis en évidence certaines différences essentielles entre machine learning technologies et techniques étroitement associées. Une fois cette base en place, nous pouvons porter notre attention sur comment machine learning fonctionne.

En règle générale, il y a six étapes principales dans la construction d’un modèle machine learning pour entraîner intelligence artificielle :

  1. Analysez et clarifiez le problème de l’entreprise et définissez à quoi ressemble le succès.
     
    Il est extrêmement important de s’assurer que les objectifs du modèle ciblent les exigences de l’entreprise, et pas seulement les exigences de l’apprentissage machine (par exemple, la précision, l’exactitude, etc.). L’objectif fondamental du modèle est de résoudre des objectifs considérable, pratiques et pertinent entreprise – que cela signifie améliorer les expériences de voyage, ce qui en fait plus facile et plus rapide pour les gens de trouver un emploi, ou en activant processus métier l’automatisation à grande échelle.
     
  2. Identifiez les exigences en matière de données et déterminez si suffisamment de données sont disponibles pour créer le modèle de machine learning.
     
    L’acronyme GIGO (« garbage in, garbage out ») s’applique ici. Sans accès à un volume suffisant de bonnes données, le modèle de machine learning sera intrinsèquement incapable de générer des prédictions précises et fiables. Garantir à la fois la quantité et la qualité des données permet au modèle de remplir son objectif d’entraînement de l’intelligence artificielle.
     
  3. Recueillir et préparer les données
     
    Ensuite, il existe une variété d’activités de préparation de données structurées (par exemple, les chiffres d’affaires), non structurées (par exemple, les enquêtes auprès des clients) et semi-structurées (par exemple, les e-mails) à couvrir, telles que la collecte, le nettoyage, l’agrégation, l’augmentation, l’étiquetage, la normalisation et la transformation.
     
    Investir du temps, des efforts et des ressources de qualité ici est nécessaire. En effet, de nombreux modèles de machine learning, par ailleurs élégants et impressionnants, sont minés par des lacunes dans le processus de préparation des données.
     
  4. Entraîner le modèle
     
    Les données d’apprentissage sont le jeu de données utilisé pour entraîner le modèle de machine learning, ce qui apprend à l’algorithme à prendre des décisions.
     
  5. Evaluer et mesurer performance
     
    Considérez cette étape du processus comme un effort d’assurance qualité qui comprend des tâches telles que :
    • Modèle indicateur évaluation : Mesures quantitatives permettant d’évaluer la performance et l’efficacité du modèle machine learning.
    • Calculs de matrice de confusion : Technique permettant de résumer les performances d’un algorithme de classification.
    • Indicateurs de performance du modèle : ceux qui se rapportent aux tâches de régression (par exemple, l’erreur quadratique moyenne, l’erreur quadratique moyenne et le R-carré), ainsi que ceux qui se rapportent aux tâches de classification (par exemple, l’exactitude, la précision et le rappel, le score F1 et AU-R (MSE), l’erreur quadratique moyenne (RMSE) et R² (R-carré). En revanche, les tâches de classification utilisent des mesures telles que l’exactitude, la matrice de confusion, la précision et le rappel, le score F1 et la courbe AUC-ROC).
    • Mesures de la qualité du modèle : elles évaluent la façon dont le modèle de machine learning se généralise aux données invisibles de la population cible.

  6. Opérationnaliser et itérer le modèle
     
    L’opérationnalisation du modèle de machine learning peut être un processus relativement simple (par exemple, la génération d’un rapport) ou un effort plus complexe (par exemple, le déploiement de plusieurs points de terminaison). Cependant, même si le modèle fonctionne à plein régime, rien ne garantit – et il ne faut pas s’attendre à ce qu’il reste optimisé au fil du temps.

Types de techniques algorithmiques

Il existe quatre types de techniques de machine learning, qui façonnent et régissent les fonctions de base du modèle, telles que la classification des informations, la reconnaissance des formes, la prédiction des résultats et la prise de décisions fiables.

Apprentissage supervisé
L’apprentissage machine learning supervisé est un processus d’apprentissage dans lequel les algorithmes apprennent continuellement à partir de données étiquetées et, en tant que tels, deviennent plus intelligents et plus précis au fil du temps. Les étiquettes peuvent être organiques (c’est-à-dire disponibles dans les données elles-mêmes) ou ajoutées à l’extérieur. Parmi les exemples d’algorithmes d’apprentissage supervisé, citons les arbres de décision, les machines à vecteurs de support, les forêts aléatoires et le bayésien naïf.

Les algorithmes d’apprentissage supervisé se retrouvent dans des applications telles que la reconnaissance d’images et de parole, les systèmes de recommandation et la détection des fraudes.

Avec l’accès à des données pertinentes, l’apprentissage supervisé peut générer des prédictions précises et applicables, ce qui est l’objectif principal du modèle de machine learning. Cependant, l’apprentissage supervisé nécessite beaucoup de connaissances du domaine et d’efforts humains pour étiqueter les données.

Apprentissage non supervisé
L’Machine Learning non supervisé est une méthode d’apprentissage dans laquelle le modèle analyse des données non étiquetées pour trouver des modèles ou des tendances cachés et regroupe les points de données en clusters en fonction de similitudes ou d’anomalies. Par exemple, certains détaillants tirent parti de l’apprentissage non supervisé pour prédire quand certains types de clients sont susceptibles de quitter l’entonnoir de vente. Ces informations sont utilisées pour ajuster et cibler les campagnes et les messages marketing.

Le clustering K-means est l’algorithme d’machine learning non supervisé le plus rapide pour décomposer les points de données en groupes, même lorsque très peu d’informations sont disponibles.

Cependant, comme l’apprentissage non supervisé est autonome et n’implique pas d’intervention humaine, le manque de réponses prédéfinies pendant la formation peut rendre difficile la précision et la fiabilité mesurées.

Apprentissage semi-supervisé
Entre l’apprentissage supervisé et l’apprentissage non supervisé, l’apprentissage semi-supervisé porte bien son nom. Avec cette approche, le modèle est d’abord entraîné à l’aide d’un petit nombre d’échantillons étiquetés, qui sont ensuite appliqués de manière itérative à un plus grand volume de données non étiquetées (ce processus est connu sous le nom de pseudo-étiquetage). En fin de compte, le modèle est entraîné à l’aide d’un mélange de données étiquetées et étiquetées de manière itérative.

L’un des principaux avantages de l’apprentissage semi-supervisé est que le temps et les coûts requis pour la préparation des données sont considérablement inférieurs à ceux de l’apprentissage supervisé. De plus, contrairement à l’apprentissage non supervisé, l’apprentissage semi-supervisé peut s’appliquer à un large éventail de problèmes (par exemple, la classification, la régression, le clustering, l’association, etc.). Cependant, le principal inconvénient est que le processus d’itération est très complexe et n’est donc pas bien adapté à des problèmes plus complexes.

Apprentissage par renforcement
L’apprentissage par renforcement utilise une approche par essais et erreurs pour savoir quelles actions et décisions sont les plus favorables au fil du temps. Au cœur de l’apprentissage par renforcement se trouve un moteur de système de récompense qui indique au modèle quand il a pris une décision correcte (et a gagné une récompense) ou a pris une décision incorrecte (et est soumis à une pénalité).

L’apprentissage par renforcement peut être extrêmement efficace pour résoudre des problèmes complexes. Au fur et à mesure que le modèle apprend de ses erreurs et de ses expériences, le moteur de récompense et de punition réduit la probabilité d’erreurs répétées. Cependant, l’apprentissage par renforcement nécessite un grand volume de données et les coûts de maintenance peuvent être élevés.

Un apprentissage par renforcement excessif peut également entraîner une piste commerciale d’états, ce qui réduit la fiabilité des résultats. Les états sont des observations que l’agent (c’est-à-dire l’entité ou le programme indépendant qui perçoit via des capteurs et agit par des actionneurs ou des effecteurs) reçoit de l’environnement.

Exemples d’applications de machine learning

Le marché mondial du machine learning devrait atteindre 225,91 milliards de dollars d’ici 2030 et est déjà en train de transformer et de faire progresser diverses industries. Voici quelques exemples exemples concrets et d’applications de machine learning.

  • Finance : L’apprentissage automatique est utilisé pour détecter la fraude en temps réel, automatiser les tâches de négociation et permettre aux « robots-conseillers » de fournir aux clients des conseils financiers automatisés en fonction des détails uniques de leur portefeuille et de leur profil de risque.
  • Entreprise : les entreprises utilisent machine learning pour concevoir des chatbots et des applications qui stimulent engagement client, augmentent les ventes et améliorer service. Les organisations utilisent également machine learning pour prendre des décisions fondées sur des données dans des domaines tels que le recrutement et l’allocation des ressources.
  • Assurance : l’apprentissage automatique est utilisé pour rationaliser les processus de souscription, accélérer l’intégration des clients et réduire les coûts opérationnels.
  • Génétique et génomique : L’apprentissage automatique est utilisé dans l’analyse de données dans le cadre d’études génétiques et génomiques pour mieux comprendre divers traits génétiques, tels que ceux qui contribuent à des troubles tels que l’hémophilie et le diabète.
  • Soins de santé : l’apprentissage automatique est utilisé pour aider les hôpitaux et les réseaux de santé à rationaliser les processus administratifs et les workflows, tandis que la reconnaissance d’images permet aux pathologistes de poser des diagnostics plus rapides et plus efficaces.
  • Commerce de détail : l’apprentissage automatique est utilisé par les détaillants pour définir, organiser, analyser et exploiter un immense volume de données de clients structurées, non structurées et semi-structurées - des communications organiques médias sociaux médiatiques à l’historique des transactions d’achat - afin d’améliorer les ventes, les bénéfices marque la reconnaissance et Engagement client.
  • Éducation : L’apprentissage automatique est utilisé pour évaluer les niveaux de compétence des élèves et élaborer des expériences et des programmes d’enseignement guidés qui les aident à devenir plus compétents.
  • Divertissement : L’apprentissage automatique est utilisé par les services de streaming (par exemple, Netflix, Amazon Prime Video, Disney+, Hulu, etc.) dans leurs moteurs de recommandation pour fournir aux abonnés un contenu pertinent en fonction des choix de visionnage passés, ainsi que du contenu auquel accèdent d’autres personnes qui partagent certaines préférences ou caractéristiques.
  • Véhicules autonomes : L’apprentissage automatique est utilisé dans le développement de la robotique avancée et des voitures autonomes. Les véhicules autonomes tirent parti de la vision par ordinateur (un type d’intelligence artificielle), de l’apprentissage machine et des données en temps réel provenant de capteurs pour aider à la navigation et à la prise de décision afin d’assurer la sécurité des passagers.

Ce ne sont là qu’un échantillon des cas d’utilisation existants du machine learning. Il y a aussi de nombreux développements machine learning passionnants à l’horizon, tels que la croissance de écosystèmes de données cloud, jusqu’au potentiel de l’utilisation de l’informatique quantique pour optimiser les algorithmes pour le big data.

Le mot de la fin

Alors que le monde est en effervescence à propos de intelligence artificielle (et pour de nombreuses raisons valables), dans les coulisses et loin des projecteurs, machine learning est utilisé chaque jour dans de nouvelles initiatives de science des données pour transformer d’immenses quantités de données en informations fiables qui résolvent des problèmes importants et atteignent des objectifs louables : tout, de améliorant le divertissement, à améliorer l’éducation, à sauver des vies.

Pour en savoir plus sur machine learning, consultez le Sitecore Knowledge Base.