Was ist Maschinelles Lernen?

„Maschinelles Lernen ist ein Feld der Künstlichen Intelligenz. Es wendet statistische Techniken an, um Computern die Fähigkeit zu verleihen, aus Daten zu lernen, ohne explizit programmiert zu sein.“ Diese Definition stammt von Arthur Samuel, dem Erfinder des Begriffes und einem der Pioniere auf dem Gebiet Künstliche Intelligenz.

Die grundlegende Definition stammt aus dem Jahr 1959 und hat an Gültigkeit seither nichts eingebüsst. Verändert haben sich seitdem jedoch die Rahmenbedingungen, Möglichkeiten und Einsatzgebiete für Maschinelles Lernen. Machine-Learning-Systeme können heute enorme Datenmengen verarbeiten, daraus sehr präzise Voraussagen treffen und somit sehr vielseitig angewendet werden.

Wie lernt eine Maschine?

Maschinelles Lernen ist ein Prozess. Die Fähigkeit einer Maschine, Muster zu erkennen, korrekt zu interpretieren und daraufhin richtig zu reagieren, wird erst durch das Trainieren mit Daten geschaffen. Der Lernprozess kann auf zwei unterschiedliche Arten verlaufen.

Beim überwachten Lernen wird der Maschine für jede Eingabe auch die korrekte Ausgabe formuliert. Ein gutes Beispiel für überwachtes Maschinelles Lernen ist die Erkennung von handgeschriebenen Buchstaben. Dabei werden dem Machine-Learning-System Bilder eines handschriftlichen ABC eingespeist. Zu jedem dieser Bilder ist in den Metadaten die von einem menschlichen „Lehrer“ formulierte Information hinterlegt, um welchen Buchstaben es sich jeweils handelt. Auf diese Weise lernt das System in der Trainingsphase die unterschiedlichen Ausprägungen, in denen Menschen einen Buchstaben schreiben. Ist das Training abgeschlossen, sollte das System aus dem Gelernten abstrahieren können und Handschriften eindeutig erkennen.

Dem gegenüber steht ein Ansatz, der als unbeaufsichtigtes Lernen bezeichnet wird. Während überwachtes Lernen Muster entdeckt, bei denen das System einen Datensatz von „richtigen Antworten“ hat, finden beim unüberwachten Lernen Machine-Learning-Systeme Muster, wo wir es nicht tun. Dies kann daran liegen, dass die „richtigen Antworten“ nicht beobachtbar oder nicht möglich sind, oder dass es für ein bestimmtes Problem nicht einmal eine „richtige Antwort“ an sich gibt. Die Algorithmen sind dabei auf sich gestellt, Strukturen und Gemeinsamkeiten in den Daten zu erkennen und daraus ein Lernmodell zu erstellen. Das führt dazu, dass solche Systeme oftmals eine Black Box sind, bei der auch die Programmierer nicht wissen, welche Annahmen das System aus den Daten gelernt hat.

Praktisch kommt unüberwachtes Maschinelles Lernen zum Beispiel dort zum Einsatz, wo Anbieter von Marketing-Daten riesige Datensätze scannen und Nutzer in bestimmte Cluster einordnen.

Anwendung und Einsatz von Maschinellem Lernen

Die Grundlagen für Maschinelles Lernen wurden bereits in der Mitte des vergangenen Jahrhunderts gelegt. Doch erst in den letzten Jahren entfaltet sich das Potential des Ansatzes. Mehrere Trends begünstigen die rasante Weiterentwicklung des Feldes und die Einsatzmöglichkeiten des Machine Learning in den letzten Jahren. Im Zuge der fortschreitenden Digitalisierung sind mehr und mehr Daten vorhanden, die sich zum Lernen verwenden lassen.

Computer werden gleichzeitig performanter, um große Datenmengen zu verarbeiten. Einen Schub erlebt Maschinelles Lernen daher auch, seit komplexe Grafikprozessoren mit mehreren Kernen parallele Berechnungen erlauben.

Mit zunehmender Größe des Datenbestandes steigt auch die Notwendigkeit, die Daten zu interpretieren, zu ordnen und weiterzuverarbeiten. Wissenschaftliche Entwicklungen fanden so schnell Eingang in kommerziell genutzte Anwendungen.

Spamerkennung in E-Mails
Bilderkennung in Google
Vorhersage von Börsenkursen oder der Nachfrage von Produkten
Textübersetzung von Anwendungen wie DeepL
Textklassifikation zum Beispiel in Online-Preisvergleichern oder News-Portalen
Spracherkennung / Sprachassistent wie in Siri, Cortana, Alexa etc.
Betrugserkennung, z.B. für Payment-Anbieter und im E-Commerce

Weitere Begriffe rund um Maschinelles Lernen

Je umfassender Künstliche Intelligenz und Maschinelles Lernen in den Alltag der Menschen eindringen, desto häufiger tauchen die damit in Zusammenhang stehenden Begriffe in den Medien auf.

Zu Unschärfen und Verwechslungen kommt es oft zwischen den Konzepten Künstliche Intelligenz, Maschinelles Lernen und Deep Learning. Der Zusammenhang ist im Grunde einfach, mit den Konzepten verhält es sich wie bei einer russischen Matrjoschka. Die größte, äußere Puppe ist das Feld Künstliche Intelligenz. Maschinelles Lernen ist ein Teilgebiet der Künstlichen Intelligenz, während Deep Learning als Unterdisziplin des Maschinellen Lernens gilt.

Das „Deep“ in Deep Learning bezieht sich auf die Anzahl der Schichten, durch die die Daten transformiert werden. Deep Learning nutzt im Prozess des Maschinellen Lernens hierarchische Schichten bzw. eine Hierarchie zur Erkennung von Mustern. So werden beispielsweise in einem tiefen neuronalen Netze zur Bilderkennung zuerst einfache Kanten und Kontraste in einem Bild erkannt, während spätere Schichten komplexe Strukturen erfassen.

Automatisches Maschinelles Lernen vereinfacht durch weitgehende Automatisierung das Setup eines Machine-Learning-Systems. Dabei werden entweder der gesamte Prozess oder ausgewählte Schritte automatisiert, sodass für die einzelnen Module und Lernschritte nicht je ein Experte benötigt wird. So kann zum Beispiel die Aufbereitung der Daten, die Auswahl von Merkmalen oder die Modellauswahl automatisiert werden. Der Google Dienst Cloud AutoML etwa verspricht, dass die Lösung selbst Anwendern mit geringen Programmierkenntnissen die Erstellung von Machine-Learning-Systemen wie Übersetzungsmodellen oder Modellen für natürliche Sprache ermöglicht.

Maschinelles Lernen bildet heute die technologische Grundlage dafür, aus großen Datenmengen automatisiert verwertbares Wissen zu generieren und darauf aufbauend intelligente Systeme zu entwickeln. Durch die Fähigkeit, Muster zu erkennen, Vorhersagen zu treffen und Inhalte kontextbezogen zu verarbeiten, wird Machine Learning zum zentralen Baustein moderner KI-Anwendungen. Erst diese datengetriebene Lernfähigkeit ermöglicht es, komplexe Prozesse zu automatisieren, Nutzerbedürfnisse besser zu verstehen und Inhalte dynamisch anzupassen. Darauf aufbauend entstehen praxisnahe Lösungen – etwa im E-Commerce und in der Medienbranche, in RAG-basierten Frage-Antwort-Systemen, in der KI-gestützten Textgenerierung oder in individuellen KI-Projekten –, die Daten nicht nur analysieren, sondern in direkten geschäftlichen Mehrwert übersetzen.

Ein weiterer Begriff, der oft im Zusammenhang mit Machine Learning fällt, ist Data Mining. Zwischen maschinellem Lernen und Data Mining bestehen viele Gemeinsamkeiten, aber auch signifikante Unterschiede. Maschinenlernen basiert auf bekannten Merkmalen und fokussiert auf Vorhersagen. Im Gegensatz dazu konzentriert sich Data Mining auf das Entdecken unbekannter Eigenschaften in den Daten.

Quellen & PDF:

Introduction to Machine Learning (Alex Smola & S.V.N. Vishwanathan | PDF)

Understanding Machine Learning: From Theory to Algorithms (Shai Shalev-Shwartz & Shai Ben-David | PDF)

Einführung in Maschinelles Lernen zur Datenanalyse (Prof. Dr. - Ing. Morris Riedel | PDF)

Machine Learning Basic Concepts (edX | PDF)

Annotation

Artikelarchive

Automatische Texterstellung

Business Intelligence

Chatbots

Chief Artificial Intelligence Officer

Computerlinguistik

Content At Scale

Content-Automation

Conversational AI

Conversational Insights

Conversational Performance

Customer Experience

Data-Mining

Datenstrategie

Deep-Learning

Duplicate Content

Entitaetenextraktion

Finanzkommunikation

Frontend-Widget

Generative Engine Optimisation

Generative-KI

Human-in-the-Loop (HITL)

Interne Verlinkung

JSON

KI-Agenten

KI-Halluzinationen

KI-Winter

Künstliche Intelligenz

Lemma

Maschinelles-Lernen

Morphologie

Natural Language Generation

Natural Language Understanding

Neuronale Netze

Ontologien

Produktbeschreibungen

Produktinformationsmanagement-System (PIM)

Prompting

Python

Restful-API

Retrieval-Augmented Generation (RAG)

Roboterjournalismus

Semantische Anreicherung

Sportberichte

Spracherkennung

Strukturierte Daten

Text-Spinning

Trusted AI

Varianz

Was ist ein Story Plot?

Was ist Natural Language Processing

Wetterberichte