Wie funktioniert maschinelles Lernen?

Maschinelles Lernen, das derzeit von zwei Dritteln aller Unternehmen genutzt wird, um Produkte und Dienstleistungen zu empfehlen, hat bereits jede einzelne Branche der Welt verändert oder wird sie bald verändern. Erfahren Sie, wie es funktioniert.

4 Minuten Lesedauer

Side view of a woman computer programmer working at her desk at a startup company. Businesswoman wearing a headset looking at computer monitor and thinking while coding at coworking office space.

Was ist maschinelles Lernen?

Maschinelles Lernen ist eine Teilmenge von künstliche Intelligenz (Künstliche Intelligenz), die sich auf die Erstellung und Weiterentwicklung von Systemen konzentriert, die in der Lage sind, historische Daten und Muster zu nutzen, logische Entscheidungen zu treffen und genaue Vorhersagen mit minimaler oder gar keiner menschlichen Beteiligung zu treffen.

In den 1950er Jahren definierte der Pionier der Künstlichen Intelligenz, Arthur Samuel, maschinelles Lernen als "das Studiengebiet, das Computern die Fähigkeit gibt, zu lernen, ohne explizit programmiert zu werden".

Algorithmen für maschinelles Lernen, die von Modellen des maschinellen Lernens gesteuert und gesteuert werden, sind so konzipiert, dass sie sich adaptiv verbessern, wenn das Datenvolumen (dh Stichproben) zunimmt. Die Existenz einer zugrunde liegenden Verzerrung des maschinellen Lernens (auch als künstliche Intelligenz bezeichnet) hat jedoch zu fehlerhaften Vorhersagen geführt, die wiederum fehlerhafte und schädliche Entscheidungen unterstützt haben.

Derzeit wird zwei Drittel der alle Unternehmen verwendet, um Produkte und Dienstleistungen zu empfehlen, Experten sagen, dass maschinelles Lernen bereits jede einzelne Branche der Welt verändert hat oder bald verändern wird, da die Technologie weiter voranschreitet.

Maschinelles Lernen vs. Künstliche Intelligenz

Während Künstliche Intelligenz es Maschinen oder Systemen ermöglicht, wie ein menschliches Gehirn zu denken, indem sie Daten verwenden, um zu argumentieren, zu handeln, sich anzupassen und zu Schlussfolgerungen zu kommen, ist maschinelles Lernen eine Anwendung der Künstlichen Intelligenz, die es Maschinen oder Systemen ermöglicht, Rohdaten in Unternehmens Intelligenz (Wissen) umzuwandeln und autonom daraus zu lernen. Maschinelles Lernen trainiert Künstliche Intelligenz zu wissen, was zu tun ist.

Im Wesentlichen ist maschinelles Lernen die Maschine, die es einem System ermöglicht, seine Intelligenz zu entwickeln. Maschinelles Lernen ist kein Künstliche Intelligenz, sondern ein Pfad zum Künstliche Intelligenz.

Maschinelles Lernen vs. Deep Learning

Deep Learning ist eine Teilmenge (oder spezialisierte Form) des maschinellen Lernens. Es verwendet Schichten von Algorithmen, um künstliche neuronale Netze zu erstellen, die in der Lage sind, autonom zu lernen und Entscheidungen zu treffen.

Wenn das System anfängt, fragwürdige oder ungenaue Vorhersagen zu generieren, muss ein Data Scientist eingreifen und Anpassungen vornehmen. Der Algorithmus in einem Deep-Learning-Modell ist jedoch in der Lage, selbstständig zu bestimmen, ob Vorhersagen ungenau sind, und kann ohne menschliches Eingreifen Korrekturen vornehmen.

Maschinelles Lernen vs. natürliche Sprachverarbeitung

Ein weiteres Feld des maschinellen Lernens ist die natürliche Sprachverarbeitung, die sich darauf konzentriert, Maschinen und Systeme in die Lage zu versetzen, richtig zu erkennen, zu verstehen und darauf zu reagieren, wie Menschen schreiben und sprechen - was in der Welt der Technologie weitaus vielfältiger und dynamischer ist, als sich auf die Zahlen und Daten zu verlassen, die üblicherweise von Programmierern verwendet werden.

Chatbots wie Apples Siri und Amazons Alexa sind Beispiele für maschinelles Lernen, das natürliche Sprachverarbeitung nutzt, um zu verstehen, was Menschen sagen, sowie neuen Text zu erstellen und Sprachübersetzungen durchzuführen.

Wie funktioniert maschinelles Lernen?

Bisher haben wir uns eine grundlegende Definition von maschinellem Lernen angesehen und einige wichtige Unterschiede zwischen maschinellem Lernen und eng verwandten Technologien und Techniken hervorgehoben. Auf dieser Grundlage können wir uns how maschinelles Lernen Works" zuwenden.

Im Allgemeinen gibt es sechs Kernschritte beim Aufbau eines maschinelles Lernen Modells zum Trainieren Künstliche Intelligenz:

  1. Analysieren und klären Sie das Unternehmen Problem und definieren Sie, wie Erfolg aussieht.
     
    Es ist von entscheidender Bedeutung sicherzustellen, dass die Ziele des Modells auf die Anforderungen von Unternehmen und nicht nur auf Anforderungen des maschinellen Lernens (z. B. Präzision, Genauigkeit usw.) abzielen. Der grundlegende Zweck des Modells besteht darin, signifikant, praktische und relevant Unternehmen Ziele zu lösen – ob das bedeutet, Verbesserung des Reiseerlebnisses, wodurch es einfacher und schneller für Menschen, Jobs zu finden, oder Geschäftsprozess Automatisierung in großem Maßstab.
     
  2. Identifizieren Sie Datenanforderungen, und ermitteln Sie, ob genügend Daten verfügbar sind, um das Modell für maschinelles Lernen zu erstellen.
     
    Hier gilt das Akronym GIGO ("garbage in, garbage out"). Ohne Zugriff auf eine ausreichende Menge an guten Daten ist das Modell des maschinellen Lernens von Natur aus nicht in der Lage, genaue und zuverlässige Vorhersagen zu erstellen. Durch die Sicherstellung sowohl der Datenquantität als auch der Datenqualität kann das Modell seinen Zweck erfüllen, Künstliche Intelligenz zu trainieren.
     
  3. Sammeln und Vorbereiten von Daten
     
    Als nächstes gibt es eine Vielzahl von strukturierten (z. B. Umsatzzahlen), unstrukturierten (z. B. Kundenumfragen) und halbstrukturierten (z. B. E-Mails) Datenaufbereitungsaktivitäten, die abgedeckt werden müssen, z. B. Erfassung, Bereinigung, Aggregation, Erweiterung, Kennzeichnung, Normalisierung und Transformation.
     
    Hier ist es notwendig, Zeit, Mühe und Ressourcen zu investieren. Tatsächlich werden viele ansonsten elegante und beeindruckende Modelle des maschinellen Lernens durch Lücken im Datenaufbereitungsprozess untergraben.
     
  4. Trainieren des Modells
     
    Trainingsdaten sind der Datensatz, der zum Trainieren des Modells für maschinelles Lernen verwendet wird, und dies bringt dem Algorithmus bei, Entscheidungen zu treffen.
     
  5. Bewertung und messen Leistung
     
    Stellen Sie sich diesen Schritt im Prozess als Qualitätssicherung vor, der Aufgaben wie die folgenden umfasst:
    • Bewertung der Metrik des Modells: Quantitative Maßnahmen zur Bewertung der Leistung und Effektivität des Modells des maschinellen Lernens.
    • Konfusionsmatrixberechnungen: Eine Technik zum Zusammenfassen der Leistung eines Klassifikationsalgorithmus.
    • Modellleistungsmetriken: Metriken, die sich auf Regressionsaufgaben beziehen (z. B. mittlerer quadratischer Fehler, mittlerer quadratischer Fehler und R-Quadrat), sowie solche, die sich auf Klassifizierungsaufgaben beziehen (z. B. Genauigkeit, Präzision und Abruf, F1-Score und AU-R (), Root Mean Squared Error (RMSE) und R² (R-Squared). Im Gegensatz dazu werden bei Klassifizierungsaufgaben Metriken wie Genauigkeit, Konfusionsmatrix, Präzision und Abruf, F1-Score und AUC-ROC-Kurve verwendet.
    • Modellqualitätsmessungen: Diese bewerten, wie gut sich das Modell des maschinellen Lernens auf ungesehene Daten in der Zielpopulation verallgemeinern lässt.

  6. Operationalisieren und Iterieren des Modells
     
    Die Operationalisierung des Modells des maschinellen Lernens kann ein relativ einfacher Prozess (z. B. das Generieren eines Berichts) oder ein komplexerer Aufwand (z. B. Bereitstellung mehrerer Endpunkte) sein. Aber selbst wenn das Modell auf allen Zylindern feuert, gibt es keine Garantie - und es sollte keine Erwartung geben -, dass es im Laufe der Zeit optimiert bleibt.

Arten von algorithmischen Techniken

Es gibt vier Arten von Techniken des maschinellen Lernens, die Kernfunktionen des Modells formen und steuern, z. B. das Klassifizieren von Informationen, die Mustererkennung, die Vorhersage von Ergebnissen und das Treffen zuverlässiger Entscheidungen.

Überwachtes Lernen
Überwachtes maschinelles Lernen ist ein Lernprozess, bei dem Algorithmen kontinuierlich aus gekennzeichneten Daten lernen und als solche im Laufe der Zeit intelligenter und genauer werden. Labels können organisch (d. h. in den Daten selbst verfügbar) oder extern hinzugefügt werden. Beispiele für überwachte Lernalgorithmen sind Entscheidungsbäume, Support Vector Machines, Random Forests und Naive Bayes.

Überwachte Lernalgorithmen finden sich in Anwendungen wie Bild- und Spracherkennung, Empfehlungssystemen und Betrugserkennung.

Mit dem Zugriff auf relevante Daten kann überwachtes Lernen genaue und anwendbare Vorhersagen generieren - was der Hauptzweck des Modells des maschinellen Lernens ist. Überwachtes Lernen erfordert jedoch ein hohes Maß an Fachwissen und menschlichen Aufwand, um die Daten zu kennzeichnen.

Unüberwachtes Lernen
Unüberwachtes maschinelles Lernen ist eine Lernmethode, bei der das Modell nicht gekennzeichnete Daten analysiert, um versteckte Muster oder Trends zu finden und Datenpunkte basierend auf Ähnlichkeiten oder Anomalien in Cluster zu gruppieren. Einige Einzelhändler nutzen beispielsweise unüberwachtes Lernen, um vorherzusagen, wann bestimmte Arten von Kunden den Verkaufstrichter wahrscheinlich verlassen werden. Diese Erkenntnisse werden genutzt, um Marketingkampagnen und -botschaften anzupassen und auszurichten.

K-Means-Clustering ist der schnellste unüberwachte Algorithmus für maschinelles Lernen, um Datenpunkte in Gruppen aufzuteilen, selbst wenn nur sehr wenige Informationen verfügbar sind.

Da unüberwachtes Lernen jedoch autonom ist und kein menschliches Eingreifen erfordert, kann das Fehlen vordefinierter Antworten während des Trainings es schwierig machen, Genauigkeit und Zuverlässigkeit zu messen.

Teilüberwachtes Lernen
Zwischen überwachtem Lernen und unüberwachtem Lernen wird treffend als semi-überwachtes Lernen bezeichnet. Bei diesem Ansatz wird das Modell zunächst mit einer kleinen Anzahl von markierten Stichproben trainiert, die dann iterativ auf eine größere Menge unmarkierter Daten angewendet werden (dieser Prozess wird als Pseudo-Labeling bezeichnet). Letztendlich wird das Modell mit einer Mischung aus beschrifteten und iterativ beschrifteten Daten trainiert.

Einer der Hauptvorteile des semi-überwachten Lernens besteht darin, dass der Zeit- und Kostenaufwand für die Datenaufbereitung im Vergleich zum überwachten Lernen signifikant geringer ist. Darüber hinaus kann das semi-überwachte Lernen im Gegensatz zum unüberwachten Lernen auf eine Vielzahl von Problemen angewendet werden (z. B. Klassifikation, Regression, Clustering, Assoziation usw.). Der Hauptnachteil ist jedoch, dass der Iterationsprozess sehr komplex ist und daher nicht gut für komplexere Probleme geeignet ist.

Reinforcement Learning
Reinforcement Learning verwendet einen Trial-and-Error-Ansatz, um zu lernen, welche Aktionen und Entscheidungen im Laufe der Zeit am günstigsten sind. Der Kern des Reinforcement Learning ist eine Belohnungssystem-Engine, die dem Modell mitteilt, wenn es eine richtige Entscheidung getroffen hat (und eine Belohnung verdient hat) oder eine falsche Entscheidung getroffen hat (und einer Strafe unterworfen wird).

Reinforcement Learning kann bei der Lösung komplexer Probleme äußerst effektiv sein. Da das Modell aus seinen Fehlern und Erfahrungen lernt, verringert die Belohnungs- und Bestrafungs-Engine die Wahrscheinlichkeit von Wiederholungsfehlern. Reinforcement Learning erfordert jedoch eine große Datenmenge, und die Wartungskosten können hoch sein.

Übermäßiges Reinforcement Learning kann auch zu einer Lead von Zuständen führen, was die Zuverlässigkeit der Ergebnisse verringert. Zustände sind Beobachtungen, die der Agent (d. h. die Entität oder das unabhängige Programm, das über Sensoren wahrnimmt und durch Aktuatoren oder Effektoren handelt) von der Umgebung erhält.

Beispiele für Anwendungen des maschinellen Lernens

Es wird prognostiziert, dass der globale Markt für maschinelles Lernen bis 2030 auf 225,91 Milliarden US-Dollar anwachsen wird und bereits verschiedene Branchen transformiert und vorantreibt. Im Folgenden finden Sie einige Beispiele und Anwendungen aus der maschinelles Lernen.

  • Finanzen: Maschinelles Lernen wird verwendet, um Betrug in Echtzeit zu erkennen, Handelsaufgaben zu automatisieren und "Robo-Advisors" zu ermöglichen, die Kunden eine automatisierte Finanzberatung basierend auf ihren einzigartigen Portfoliodetails und ihrem Profil bieten.
  • Geschäft: Unternehmen nutzen maschinelles Lernen, um Chatbots und Apps zu entwickeln, die die Kundenbindung / Kundenengagement steigern, den Umsatz steigern und den Service verbessern. Unternehmen nutzen maschinelles Lernen auch, um datengesteuerte Entscheidungen in Bereichen wie Rekrutierung und Ressourcenzuweisung zu treffen.
  • Versicherungen: Maschinelles Lernen wird eingesetzt, um Underwriting-Prozesse zu rationalisieren, das Onboarding von Kunden zu beschleunigen und die Betriebskosten zu senken.
  • Genetik und Genomik: Maschinelles Lernen wird in der Datenanalyse in der Forschung / Recherche in der Genetik und Genomik eingesetzt, um verschiedene genetische Merkmale besser zu verstehen, z. B. solche, die zu Erkrankungen wie Hämophilie und Diabetes beitragen.
  • Gesundheitswesen: Maschinelles Lernen wird eingesetzt, um Krankenhäusern und Gesundheitsnetzwerken zu helfen, administrative Prozesse und Arbeitsabläufe zu rationalisieren, während die Bilderkennung es Pathologen ermöglicht, schnellere und bessere Diagnosen zu stellen.
  • Einzelhandel: Maschinelles Lernen wird von Einzelhändlern eingesetzt, um eine immense Menge an strukturierten, unstrukturierten und halbstrukturierten Kundendaten zu identifizieren, zu organisieren, zu analysieren und zu nutzen – von organischer sozial Medienkommunikation bis hin zur Kauftransaktionshistorie – um Umsatz, Gewinn, Marke Anerkennung und Kundenbindung / Kundenengagement.
  • Bildung: Maschinelles Lernen wird verwendet, um die Fähigkeiten der Schüler zu bewerten und geführte Erlebnis/Erfahrungen und Lehrpläne zu entwickeln, die ihnen helfen, kompetenter zu werden.
  • Unterhaltung: Maschinelles Lernen wird von Streaming-Diensten (z. B. Netflix, Amazon Prime Video, Disney+, Hulu usw.) innerhalb ihrer Empfehlungsmaschinen verwendet, um Abonnenten relevante Inhalte basierend auf früheren Betrachtungsentscheidungen sowie Inhalte bereitzustellen, auf die andere Personen zugreifen, die bestimmte Vorlieben oder Merkmale teilen.
  • Autonome Fahrzeuge: Maschinelles Lernen wird bei der Entwicklungen fortschrittlicher Robotik und selbstfahrender Autos eingesetzt. Autonome Fahrzeuge nutzen Computer Vision (eine Art künstliche Intelligenz), maschinelles Lernen und Echtzeitdaten von Sensoren, um die Navigation und Entscheidungsfindung zu unterstützen und die Sicherheit der Passagiere zu gewährleisten.

Dies sind nur einige Beispiele für die bestehenden Anwendungsfälle für maschinelles Lernen. Es gibt auch viele spannende maschinelles Lernen Entwicklungen am Horizont, wie z. B. das Wachstum von Cloud-Datenökosystemen, bis hin zum Potenzial der Nutzung von Quantencomputing zur Optimierung von Algorithmen für Big Data.

Das letzte Wort

Während die Welt über Künstliche Intelligenz (und aus vielen triftigen Gründen) schwirrt, wird maschinelles Lernen hinter den Kulissen und abseits des Rampenlichts jeden Tag in neuen Data-Science-Initiativen eingesetzt, um immense Datenmengen in zuverlässige Erkenntnisse umzuwandeln, die wichtige Probleme lösen und ehrenwerte Ziele erreichen: alles von Verbesserung der Unterhaltung, bis hin zu Verbesserung der Bildung, bis Leben retten.

Erfahren Sie mehr über maschinelles Lernen im Sitecore Knowledge Center.

Wie funktioniert maschinelles Lernen? | Sitecore