Retresco stellt sich den Fragen zu automatischer Textgenerierung im Deutschlandfunk

Johannes Sommer, Geschäftsführer der Berliner Firma Retresco, und der Computerlinguist Herr Prof. Dr. Hans Uszkoreit vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) stellen sich im Deutschlandfunk-Programm ‚Computer und Kommunikation‚ den Fragen von Redakteur Manfred Kloiber zur automatischen Texterstellung, dem aktuellen Entwicklungsstand sowie den Perspektiven.

Automatische Textgenerierung basiert auf Daten

In Sport, Wirtschaft und Wetter erscheinen immer mehr Artikel, die nicht unbedingt JournalistInnen, sondern sogenannte Software-Roboter geschrieben haben. Solche automatisch generierten Texte basieren auf strukturierten Daten, welche mit domänenspezifischem Wissen und zugehörigem Vokabular angereichert wurden. So wandelt auch Retrescos Software, die rtr textengine, innerhalb von Millisekunden Daten in natürlichsprachliche Texte um.

Während sich die Ressortexperten des Deutschlandfunks kritisch geben, bestätigen verschiedene Studien unabhängig voneinander, dass Leser die Qualität der automatisch generierten Artikel durchweg positiv bewerten. Sie können diese nur noch schwer von journalistischen Texten unterscheiden. Denn die Technologie in diesem Bereich der künstlichen Intelligenz hat bereits enorme Fortschritte gemacht und wird sich auch in den kommenden Jahren rasant weiterentwickeln.

Sebastian Golly, Leiter der Textgenerierung bei Retresco, erläutert anhand von Fußballberichten die Funktionsweise der rtr textengine. „Ich habe für eine Hamburger Amateurliga ein paar Spieltage herausgegriffen und lasse dazu einfach mal die entsprechenden Texte generieren. Jetzt können Sie sehen, dass hier im Sekundentakt Vorberichte rauspurzeln.“ Im Hintergrund analysiert das System in Sekundenschnelle die zugehörigen Daten, fasst die relevanten Aussagen zusammen und formuliert daraus fertige Sätze. Die rtr textengine generiert somit auf Knopfdruck aktuelle Vor- und Nachberichte zu allen Spielen aller Ligen.

Die Möglichkeiten der Berichterstattung in Echtzeit und On-Demand erhöhen die regionale Relevanz eines Portals enorm. Das Ergebnis ist eine größere Reichweite, gesteigerte Nutzerbindung und eine deutlich erhöhte Sichtbarkeit.

 

Der vollständige Podcast lässt sich hier nachhören.