Retresco Hackathon Mai 2019: Texte generieren mal anders

Im Vorfeld des Retresco Hackathon, dem unternehmensinternen Highlight im Mai, kamen so viele Ideen für einzelne Projektgruppen zusammen wie noch nie. Schwerpunktmäßig drehten sich viele Vorschläge um verschiedene Formen der Textgenerierung – wie unsere Auswahl der umgesetzten Projekte zeigt.

 

Textgenerierung mit neuronalen Netzen

Eine Gruppe aus Computerlinguistik-Experten beschäftigte sich mit einem Ansatz aus der Forschung zu Natural Language Generation (NLG), bei dem die traditionelle Generierungspipeline durch ein neuronales Netz ersetzt wird.

Der Ansatz stammt aus der maschinellen Übersetzung, bei der ein solches Modell zum Beispiel einen französischen Satz in einen Englischen übersetzt. Für die NLG ersetzt man einfach den französischen Satz durch eine Kodierung strukturierter Daten und das Modell lernt dann direkt von den Daten den dazugehörigen Text zu „übersetzen.“

Die Texte, die auf eigenen Trainingsdaten basierten, zeigten die Stärken und Schwächen des Ansatzes, die auch in der Forschung beobachtet worden sind: die generierten Produktbeschreibungen sind flüssig lesbar und teilweise kommen neue Formulierungen heraus, die so in den Trainingsdaten nicht vorkommen. Für verständliche Texte braucht man jedoch sehr große Mengen an Trainingsdaten und manchmal stimmen die generierten Informationen im Text nicht oder sind inkonsistent.

 

Spracherkennung ohne Kopplung an Cloud-Lösung

Ein anderes Team aus Retrescos schaute sich genauer an, wie Spracherkennung funktionieren kann, ohne dass die ressourcenintensiven Prozesse der Sprachassistentensoftware über eine Cloud-Lösung laufen müssen.

Das ist vor allem für Business-Cases interessant, etwa wenn ein firmeninterner Chatbot mit Spracherkennung aus Gründen der Sicherheit und Geheimhaltung ausschließlich über ein Gerät funktionieren soll. Der Ansatz des Teams bestand darin, die Spracherkennung sehr spezifisch auf den jeweiligen Anwendungsfall zu trainieren.

Fazit: Die Erkennung der Absicht der getätigten Äußerung und die daraus folgende Handlung wie die Beantwortung der Frage kann auch bei den komplexen freien Fragen auf dem Gerät erfolgen. Als noch zu lösende Herausforderung erwiesen sich die Spracherkennung bzw. die Kommunikationsinterfaces (Sprache zu Text & Text zu Sprache), denn auch die Sprachausgabe hört sich noch sehr unklar an.

 

Dreamteam: Schreibroboter und Textroboter

Unter dem Motto „Blick über den Tellerrand“ stand das Setup eines Schreibroboters. Das Team stellte zwischen der Hardware und der rtr textengine eine Verbindung her und programmierte zusätzlich eine Eingabeoberfläche. Nach zwei Tagen Beschäftigung mit dem Gerät können wir resümieren: so viel Spaß die Einrichtung der schreibenden Maschine auch machte – automatische Texterstellung über textengine.io geht wesentlich schneller! Aber seht selbst:

 

Über Retresco | @retresco

Bereits seit 2008 entwickelt Retresco führende KI-Lösungen im Bereich Content Automation. In den letzten Jahren hat sich das Unternehmen zunehmend zu einem der führenden Anbieter in der automatischen Texterstellung (Natural Language Generation) entwickelt und dutzende Projekte für Kunden aus den Bereichen Medien, E-Commerce und Finanzdienstleistungen umgesetzt.