Was ist Deep Learning?

Deep Learning, auch unter den Bezeichnungen „Deep Structured Learning“ oder „Hierarchisches Lernen“ bekannt, ist eine spezielle Methode aus dem Bereich des Maschinellen Lernens und damit auch ein Teilgebiet der Künstlichen Intelligenz. Obwohl das Konzept bereits in den 1980er-Jahren erstmalig formuliert wurde, gewinnt Deep Learning dank immer leistungsstärkerer Soft- und Hardware, dem Vorhandensein großer Datensätze und der Entwicklung besserer Algorithmen in der letzten Zeit beträchtlich an Bedeutung.

Wie funktioniert Deep Learning?

Beim Deep Learning werden häufig Algorithmen zur Mustererkennung aus dem Bereich der neuronalen Netze verwendet. Entgegen einem beliebten Bild zur Erklärung des Phänomens kopieren Deep Learning-Modelle neuronale Netze des menschlichen Gehirns nicht 1:1 – die Strukturen ähneln sich aktuell nur oberflächlich.

Auch wenn der Aufbau dem unseres Hirns (noch) nicht gleicht, liegt ein Erfolgsgeheimnis des Ansatzes darin, dass es in den letzten Jahren gelungen ist, sehr große Netzwerke mit vielen aufeinanderfolgenden Schichten anzulegen und zu trainieren. Die vielen Schichten zwischen Input und Output sorgen für eine komplexe, tiefe Struktur – daher „tiefgehendes Lernen“. Schließlich ergibt sich ein individuelles Modell, das die Erkennung von Mustern und die Vorhersagen bezüglich neuer Phänomene erlaubt.

Im Gegensatz zum allumfassenden Wissenserwerb eines Menschen beschränkt sich der Deep Learning-Prozess einer Maschine auf eine genau umgrenzte Problemstellung. Das heißt auch, dass die Daten, die zum Trainieren eines neuronalen Netzes verwendet werden, direkt für das zu lösende Problem relevant sein müssen.

Maschinelles Lernen kommt dort zur Anwendung, wo aus großen Datenmengen Muster abgeleitet und Entscheidungen getroffen werden sollen. Deep Learning hat gegenüber anderen Methoden des Maschinellen Lernens besonders dann Vorteile, wenn sehr viele unstrukturierte Daten vorliegen, also für Videos, Bilder, Audiodateien oder Text. Weiteres Plus von Deep Learning: Die Ergebnisse sind häufig präziser als der Output anderer Modelle.

Beispiel für Deep Learning

So kann beispielsweise eine Anwendung zur Bilderkennung lernen wie eine Katze aussieht. Das Machine-Learning-System bekommt dazu eine große Anzahl von Bildern eingespeist. Hohe Rechenleistung ist notwendig, um im Anschluß jedes einzelne Bild zu analysieren und zu bewerten.

Die erste Darstellungsschicht kann die einzelnen Pixel des Katzenbildes abstrahieren und anschließend Umrisse bzw. Kanten codieren. Im zweiten Layer des neuronalen Netzwerkes werden verschiedene Anordnungen von Kanten zusammengesetzt und codiert. Die dritte Schicht könnte Elemente wie Nase und Augen der Katze codieren, bevor der vierte Layer erkennt, dass das Bild ein Katzengesicht zeigt. Als Ergebnis ordnet das Modell das Bild der Kategorie Katze oder Nicht-Katze zu.

Das Besondere am Deep Learning sind die selbstoptimierenden Prozesse. Die Systeme lernen ohne durch Experten einprogrammierte Vorkenntnisse, welche Features aus den Input-Daten auf welcher Ebene am effektivsten transformiert werden. Das hat den Vorteil, dass der Mensch nicht eingreifen muss. Andererseits ist aber auch nicht immer ganz klar, was das System lernt. Deep Learning Modelle gelten daher auch als Black Box.

Anwendungen für Deep Learning

Klassifizikation bzw. Gruppierung von Daten und/oder die Erstellung von Vorhersagen – Deep Learning löst dort für menschliche Anwender Herausforderungen, wo Maschinen mit großem Daten-Input konfrontiert sind. Häufige Anwendungsfälle für Deep Learning sind Bild- und Spracherkennung, prädiktive Analysen, Empfehlungssysteme oder Anomalieerkennung.

„Dieses Bild zeigt unangemessene Inhalte“, „Diese Finanztransaktion ist Betrug“ oder „Diese E-Mail ist Spam!“ sind praktisch verwertbare Aussagen, die auf Deep Learning-basierte Klassifizierung zurückgehen.

Die Gruppierung von Daten ermöglicht Resultate wie „Der Anwender sucht sehr wahrscheinlich dieses Dokument“ oder „Diese beiden Geräusche sind ähnlich“. Letztgenanntes Beispiel ist eine der Voraussetzungen, um Tonausschnitte in größeren Audiodateien zu identifizieren und das gesprochene Wort als Text zu transkribieren.

Durch Deep Learning gewonnen wäre auch eine relevante Vorhersage wie beispielsweise: „Auf Basis der Daten zum bisherigen Nutzerverhalten prognostizieren wir für User XY eine Kündigung des Abos unseres SaaS-Service.“

Eine oder mehrere der beschriebenen Deep Learning-Prozesse kommen in alltäglich genutzten Services zum Einsatz, etwa in der Sprachsteuerung von Alexa, dem Bilder-Tagging von Facebook oder der automatischen Übersetzung von DeepL.

Quellen, Verweise & PDF:

Deep Learning (MIT Technology Review)

Deep Learning (MIT Press book)

Deep Learning (Université de Montréal, Yoshua Bengio - PDF)

Annotation

Automatische Texterstellung

Business Intelligence

Chatbots

Chief Artificial Intelligence Officer

Computerlinguistik

Content At Scale

Content-Automation

Customer Experience

Data-Mining

Datenstrategie

Deep-Learning

Duplicate Content

Entitaetenextraktion

Finanzkommunikation

Generative Engine Optimisation

Generative-KI

Human-in-the-Loop (HITL)

Interne Verlinkung

JSON

KI-Agenten

KI-Halluzinationen

KI-Winter

Künstliche Intelligenz

Lemma

Maschinelles-Lernen

Morphologie

Natural Language Generation

Natural Language Understanding

Neuronale Netze

Ontologien

Produktbeschreibungen

Produktinformationsmanagement-System (PIM)

Prompting

Python

RAG

Restful-API

Roboterjournalismus

Semantische Anreicherung

Sportberichte

Spracherkennung

Strukturierte Daten

Text-Spinning

Trusted AI Effizienz Verantwortung

Varianz

Was ist ein Story Plot?

Was ist Natural Language Processing

Wetterberichte