Blog   

Journalismus und KI: wie kann von automatischer Textgenerierung und Klassifikation profitiert werden?

Teilen

Vom 02.05. bis 04.05. fand die re:publica 2018 in Berlin statt. Die Konferenz behandelte Themen zu Digitalisierung und Gesellschaft und ist die größte ihrer Art in Europa. Auf einen der dort gehaltenen Vorträge von Bettina Figl (@BettinaFigl) und Alexander Fanta (@FantaAlexx), „Robots and coding: How data is changing journalism“  möchten wir in unserem wöchentlichen Blogbeitrag genauer eingehen.

Der Vortrag der beiden Journalisten behandelte die Ängste rund um Roboter und Automationen die Einzug in die Redaktionen halten und zeigte auf, welche Chancen und gleichzeitig auch Herausforderungen „Roboterjournalimus“ und Datenjournalismus bietet [ro18]. Vieles was im Vortrag behandelt wurde, können wir bestätigen und möchten auf die am Ende von Alexander Fanta in den Raum gestellte Frage: „What does this mean for journalism?“ mit Ideen zum Einsatz unserer IT-Lösungen antworten. Denn die Zukunft der Nachrichten, der Kommunikation und die damit verbundenen Möglichkeiten für die Presse, Verlagshäuser und Nachrichtenorganisationen sind vielfältig.

Journalismus und automatische Textgenerierung

Die rtr textengine generiert in Echtzeit beliebig viele redaktionelle Texte. Diese generierten Texte gehören nicht den umfangreich recherchierten Artikeln investigativer Journalisten an, sondern Texten, die in ihrer Struktur einen ähnlichen Aufbau vorweisen, wie beispielsweise Wetterberichte, Produktbeschreibungen oder Sportberichte. Vor allem für den letzten Bereich kann die automatische Textgenerierung für die hyperlokale Berichterstattung einen Beitrag leisten, denn grundsätzlich kann jede Redaktion unsere Technologie in Anspruch nehmen.

Die Größe und Auflage spielt dabei keinerlei Rolle, da das redaktionelle Angebot auch kleinerer und mittlerer Medienangebote durch automatische Texterstellung der Nachrichten sinnvoll erweitert und und für verschiedene Zielgruppen abgedeckt werden kann. Ein weiterer Vorteil besteht in der schnellen Reaktion durch eine generierte Nachricht auf anomale oder spontane Ereignisse – sind Echtzeitdaten vorhanden kann die entsprechende Nachricht sofort erstellt und in den entsprechenden Kanälen geteilt werden. Beispielhaft dafür ist  der Quakebot der Los Angelos Times, der im März 2014 die erste Meldung zum leichten Erdbeben der Metropole generierte. [He,14] Gleiches gilt selbstverständlich für allerlei Arten von Berichten; vor allem für Sportberichte.

Das konkrete Anwendungsbeispiel: Ein regionales Nachrichtenportal in der Region will die gesamte Region mit Fußballergebnissen beliefern. Es gibt aber enorm viele vereinzelte Kreisligen, in denen einheimische Teams vertreten sind und über die berichtet werden muss. Hier kann sich die Berichterstattung als problematisch erweisen, denn in der Region gibt es eventuell nur einen oder zwei Redakteure, die zu den Spielen fahren können, um darüber zu berichten. Es ist daher fast unmöglich, so viele Berichte zu verfassen, dass jedes Spiel mit einem eigenen Sportbericht betextet werden kann. Genau für diesen Fall ist die automatische Generierung von Texten für die Contenterstellung ideal, Fans der Ligen sind in der Lage die Nachricht sofort lesen sowie teilen zu können und umso mehr Daten für die automatischen Generierung von Texten zur Verfügung stehen, umso besser sowie variantenreicher werden diese.

Vor ein paar Wochen konnte unser CEO Johannes Sommer auf der SportsInnovation 2018, einer bekannten Branchenplattform, rund um den Austausch der medialen Verwertung von Sportereignissen, innerhalb einer Live-Demo der rtr textengine, automatisierte Vor- und Nachberichte des Testspiels präsentieren. Damit hören die Einsatzmöglichkeiten jedoch nicht auf,  denn neben der Anwendung beispielsweise bei einem live ticker, lässt sich gleiches auch für Wetterberichte und Verkehrsberichte einer Lokalzeitung einsetzen.

Ein weiteres Beispiel ist die Erstellung von automatisierten Finanzberichten. In einem extra Beitrag über Ideen der Anwendung automatischer Textgenerierung für das Bankwesen, berichten wir in diesem gesonderten Artikel auf Banking Hub und geben auch hier unterschiedliche Möglichkeiten der Nutzung an.

Fazit: Der Journalist wird grundlegend in seiner Arbeit unterstützt. Verlagshäuser und Nachrichtenorganisationen erreichen mit automatisierten Texten eine Zielgruppe, die sie vorher in diesem Ausmaß gar nicht erst hätten bedienen können. Das sorgt am Ende für mehr Reichweite, verbessert die Kundenbindung und hilft demzufolge, die Einnahmen aus digitalen Abonnements zu erhöhen.

Journalismus und Klassifikation

Neben der automatischen Erstellung von Texten gibt es eine weitere interessante Möglichkeit für Journalisten Inhalte intelligent zu verwerten: Die Semantik ermöglicht die automatische Zuordnung von Inhalten zu passenden Themenwelten. Damit werden große Datenmengen analysiert und Texte zu Themen bzw. große Content-Mengen einheitlich archiviert sortiert.

In erster Linie bedeutet diese Art der Anwendung von KI für den Journalismus, da ein Klassifikator während der Anwendung trainiert wird, zunächst einmal eine Erleichterung. Denn aus unstrukturierten Daten werden strukturierte Daten, so dass die Recherchemöglichkeiten steigen. Dadurch werden selbstverständlich die Möglichkeiten der Inhalteverwertung und -nutzung für jeden einzelnen Bericht erweitert.

Das konkrete Anwendungsbeispiel: Ein Content- und Archivdienstleister für Medien- und Verlagshäuser oder aber auch Datenhäuser, welche Zugang zu Inhalten von Verlagspublikationen oder anderen Medien bieten, wollen ihre Archivierung effizienter gestalten. Das Problem besteht in der schieren Masse von Daten, die gesichtet und geordnet werden müssen. Um eine effiziente Lösung anzubieten, kann der Klassifikator und die Retresco-Semantik zur Anwendung kommen. Dabei werden Inhalte jeder Art analysiert und wichtige Keywords sowie Themen erkannt. So wird aus Chaos Ordnung, also aus unstrukturierten Daten maschinenlesbare Daten erstellt, die digital verwertbar sind.

Anwendungsbeispiel konnten wir über die Jahre in vielerlei Projekten anwenden, beispielhaft innerhalb eines Projekts für das Dokumentations- und Informationszentrum (DIZ) und innerhalb eines Projekts mit der Stasi-Mediathek.  Damit hören die Möglichkeiten jedoch nicht auf, denn die Textanalyse lässt sich vor allem im Bereich Chatbots und Enterprise Chatbots gewinnbringend einsetzen.

In einem unserer letzten Beiträge sind wir hier auf die Möglichkeiten für den E-Commerce eingegangen, aber auch für Medien- und Verlagshäuser gibt es hier vielfältige Anwendungsmöglichkeiten.

Fazit: Durch die Ordnung eines Archivs von Verlagshäusern und anderen Einrichtungen werden ganz neue Recherchemöglichkeiten für Journalisten möglich und ihre Zusammenarbeit untereinander wird erleichtert. Das sorgt am Ende für eine viel bessere Vernetzung, zu einem fließenderen Informationsaustausch und damit auch zu vielen fundiert und tiefergehenden Analysen.

Für beide Anwendungsmöglichkeiten unserer IT-Lösungen wurde Retresco im letzten Jahr der World Summit Award als beste digitale Lösung für den Bereich Business und Commerce verliehen, ein Award, der die Verbesserung digitaler Angebote und ihren positiven Einfluss auf die Gesellschaft prämiert. Damit wollen wir an dieser Stelle hervorheben, dass wir mit unseren IT-Lösungen Chancen bieten wollen, die alltägliche Arbeit eines Journalisten zu verbessern, an statt ihn zu ersetzen. Journalisten sind und bleiben unersetzbar.

Quellen:

[Ro,18] re:publica 2018, Vortrag von Bettina Figl und Alexander Fanta am 03.05.2018: „Robots and coding: How data ist changing journalism“
[He,14] heise online, 18.03.2014: „Quakebot schreibt erste Meldung zum Erdbeben in Los Angeles

Zurück zur Newsübersicht