1. Was ist Natural Language Processing?
    2. In diesen Anwendungen steckt Natural Language Processing
    3. Wie funktioniert Language Processing?
    4. Sprache verarbeiten vs. Sprache verstehen vs. Sprache generieren
    5. Definition Natural Language Processing

 

Was ist Natural Language Processing?

 

Natural Language ProcessingZwischen Mensch und Computer bestehen gravierende Kommunikationsprobleme: während die Maschine nur spezielle Programmiersprachen beherrscht oder zumindest strukturierte Daten für die Verarbeitung benötigt, sprechen und verstehen Menschen „natürliche“ Sprache mit all ihren Ungenauigkeiten und Mehrdeutigkeiten.

Eine der Grundideen von Natural Language Processing (NLP) besteht daher darin, den Austausch zwischen beiden Seiten zu vereinfachen. Natural Language Processing ist ein Teilgebiet aus dem großen Feld Künstliche Intelligenz und stellt Technologien bereit, die Computern das Verstehen, Interpretieren und Erzeugen unstrukturierter menschlicher Sprache ermöglichen.

 

In diesen Anwendungen steckt Natural Language Processing

 

Die Anfänge von Natural Language Processing gehen zurück in die 1940er Jahre. Nach vielen Jahrzehnten nur langsamen Fortschrittes ist Natural Language Processing heute vor allem durch leistungsfähigere Hardware und Innovationen wie Maschinelles Lernen ein hochdynamisches Feld.

Der Aufschwung ist mit Sicherheit noch längst nicht am Ende angelangt, dennoch bildet natürliche Sprachverarbeitung schon heute die Grundlage einer Reihe von speziellen und alltäglichen Anwendungen:

  • Intelligente Online-Suchfunktionen komplettieren die Eingaben eines Users
  • Spam-Filter erkennen die Inhalte von E-Mails
  • Textanalyse zum Check von Dokumenten wie Verträgen auf formale und inhaltliche Fehler
  • Chatbots verarbeiten Eingaben eines Nutzers und antworten adäquat
  • Virtuelle Sprachassistenten verstehen Spracheingaben und formulieren Output
  • Maschinelles Übersetzen von Texten

 

Wie funktioniert Language Processing?

 

Strukturdiagramm Natural Language ProcessingUnabhängig davon, welche sprachlichen Inhalte ein Computer verarbeitet, muss er die einzelnen Teile unterscheiden und ihre Bedeutung erkennen, um das Ganze zu verstehen. Das theoretische Rüstzeug von Natural Language Processing liefert daher die Linguistik und hier vor allem die Computerlinguistik. Am anschaulichsten wird die Funktionsweise eines NLP-Systems, wenn man die einzelnen Phasen von Sprache und Sprachverarbeitung Schicht für Schicht unter die Lupe nimmt. Je nachdem, ob gesprochenes oder geschriebenes Wort verarbeitet wird, steht einer der folgenden Aspekte im Mittelpunkt.

Ein NLP-System, das gesprochene Eingaben aufnimmt, analysiert und kodiert die Schallwellen in ein digitalisiertes Signal und interpretiert die Daten anschließend nach verschiedenen Regeln oder durch Vergleich mit einem jeweils zugrundeliegenden Sprachmodell. Die linguistischen Teildisziplinen Phonologie und Phonetik bilden bei der Spracherkennung die theoretischen Grundlagen.

Egal, ob es sich um Input in Form einer Audio-Datei oder geschriebenen Text handelt: Um in späteren Schritten die Bedeutung einer Äußerung zu erkennen, muss ein Natural Language Processing-System die Eingabe in einzelne Bestandteile zerlegen.

Auf der Ebene von Sätzen und Phrasen, der Syntax, ermittelt Natural Language Processing die grammatikalische Struktur einer Äußerung. Unterhalb der Syntax bestimmen morphologische Verfahren einzelne Wörter und deren Einheiten. Ziel ist es hierbei, auf der lexikalischen Ebene die Bedeutung jedes einzelnen Begriffes zu verstehen und so die Voraussetzung für das Verständnis der gesamten Äußerung zu schaffen.

Im Zusammenspiel aus Informationen über Struktur eines Satzes und der Bedeutung einzelner Teile ergeben sich Hinweise auf die Bedeutung eines Satzes. Die einzelnen Teile in einen Kontext einordnen und so idealerweise mehrere Elemente einer zusammenhängenden Aussage korrekt zu verstehen, ist schließlich Aufgabe der Semantik.

Unterschiedliche, der Semantik zuzuordnende Verfahren können in einem Natural Language Processing-System einen Beitrag leisten bzw. Teilaspekte bedienen. Dazu zählen etwa die Entitätenextraktion (auch: Named Entity Recognition) die Sentimentanalyse oder die Disambiguierung.

 

Sprache verstehen vs. Sprache generieren vs. Sprache verarbeiten

 

Natural Language GenerationWeil natürliche Sprachverarbeitung so vielschichtig ist, hat es sich etabliert, Anwendungen mit eng definiertem Fokus in einen von zwei anerkannten Bereichen einzuordnen. Als Teildisziplinen von Natural Language Processing gelten Natural Language Understanding (NLU) und Natural Language Generation (NLG).

Natural Language Understanding (NLU) konzentriert sich in erster Linie darauf, einer Maschine das Verständnis eines Textes oder von gesprochenem Wort zu ermöglichen. Analysiert etwa eine Anwendung den Newsbeitrag eines Online-Portals und identifiziert daraus mittels Entitätenextraktion Elemente wie Personen, Orte und Ereignisse handelt es sich dabei „nur“ um Natural Language Understanding. Sobald es darum gehen würde, auf einen identifizierten Inhalt zu reagieren, etwa in einem Chatbot, wird die Anwendung NLP.

Natural Language Generation hingegen bezeichnet die Produktion von Text durch einen Algorithmus. Voraussetzung dafür sind strukturierte Daten wie sie etwa in Form von Börseninformationen, Produktmerkmalen, Sport- oder Wetterdaten vorliegen. Automatische Textgenerierung macht daraus dann in Echtzeit und beliebiger Anzahl Inhalte. Da Natural Language Generation Daten zu Sprache verarbeitet, wird das Teilgebiet unter den Überbegriff Natural Language Processing gefasst.

 

Definition Natural Language Processing

 

„Computer machen Sachen mit Sprache“ – so ließe sich Natural Language Processing umgangssprachlich definieren. Eine wissenschaftliche Definition des Begriffes Natural Language Processing stammt von der Informatikerin Elizabeth D. Liddy:

„Natural Language Processing is a theoretically motivated range of computational techniques for analyzing and representing naturally occurring texts at one or more levels of linguistic analysis for the purpose of achieving human-like language processing for a range of tasks or applications.“

„Natural Language Processing ist ein theoretisch fundierter Bereich von computergestützten Techniken zur Analyse und Darstellung natürlich vorkommender Texte auf einer oder mehreren Ebenen der linguistischen Analyse, mit dem Ziel, an menschliche Fähigkeiten reichende Ergebnisse der Sprachverarbeitung zu erzielen und so eine Reihe von Aufgaben oder Anwendungen zu ermöglichen.“

 

Quellen:

Weitere Lexikonartikel, die Sie interessieren könnten: