Die Auf­merk­sam­keit um das The­ma Robo­ter­jour­na­lis­mus und die Anzahl derer, die sich mit dem The­ma aus­ein­an­der­set­zen, wird immer grö­ßer. Derer, die dazu for­schen, erfreu­li­cher­wei­se auch. Aus gege­be­nem Anlass also ein Blick in die aktu­el­le For­schung.

Beson­ders span­nend und daher tei­lens­wert erschie­nen uns die Ergeb­nis­se der Bache­lort­he­sis „Robo­ter als Gate­kee­per?“ von Mile­na-Sophia Schwo­ge an der Hoch­schu­le Han­no­ver.

Anhand jour­na­lis­ti­scher Qua­li­täts­kri­te­ri­en¹ wur­den 70 auto­ma­tisch gene­rier­te Fuß­ball­be­rich­te der rtr tex­ten­gi­ne – ohne mensch­li­ches Ein­wir­ken aus­ge­wählt, also weder außer­or­dent­lich gelun­ge­ne Tex­te noch wel­che mit einer außer­or­dent­lich sau­be­ren Daten­grund­la­ge – mit 70 – eben­so zufäl­lig aus­ge­wähl­ten – von Jour­na­lis­ten ver­fass­ten Fuß­ball­be­rich­ten der dpa ver­gli­chen.

 

Das Ergeb­nis?

 

Fan­gen wir vor­ne an. Die fak­ti­sche Bericht­erstat­tung der auto­ma­tisch und jour­na­lis­tisch erstell­ten Tex­te nimmt sich erst­mal nichts – sel­bes Spiel, sel­bes Ergeb­nis. Über­ra­schen­der­wei­se sind die auto­ma­tisch erstell­ten Tex­te jedoch deut­lich ver­ständ­li­cher geschrie­ben. Die dpa-Tex­te lie­ßen sich dem ermit­tel­ten Les­bar­keits­in­dex² zufol­ge oft als struk­tu­rell „schwie­rig“ oder „anspruchs­voll“ ein­ord­nen. Und nicht nur das, auch in punc­to Unter­halt­sam­keit steht der auto­ma­ti­sche Text dem jour­na­lis­ti­schen Bericht in nichts nach. So heißt es in der Arbeit, dass “eine gut trai­nier­te Soft­ware eben­falls in der Lage ist, einen Spiel­be­richt unter­hal­tend und somit anre­gend zu gestal­ten.” ³

Nicht zu über­tref­fen sind die Tex­te unse­rer tex­ten­gi­ne außer­dem in ihrer Aktua­li­tät. Wäh­rend die auto­ma­ti­sche Text­ge­ne­rie­rung unge­fähr 450 Mil­li­se­kun­den braucht, benö­tigt der mensch­li­che Repor­ter durch­schnitt­lich 7,8 Minu­ten. Das ist nicht welt­be­we­gend, möch­te man mei­nen, und wahr­schein­lich wür­de jeder Fuß­ball­fan auch eini­ge Minu­ten auf den Nach­be­richt zum Spiel sei­nes Teams war­ten — der ent­schei­den­de Unter­schied liegt aber in der Unmög­lich­keit, zu jedem Spiel jeder Regio­nal­li­ga einen Repor­ter zu schi­cken. Und zwi­schen einem Repor­ter im Zeit­druck und einem Nach­be­richt per Knopf­druck.

Als Fol­ge des­sen häu­fen sich die (Flüchtigkeits-)Fehler eher auf Sei­ten der Repor­ter, beim Robo­ter­jour­na­lis­ten kom­men sie qua­si gar nicht vor.

 

So weit, so gut. 1:0 für die tex­ten­gi­ne.*

 

Durch das vor­ge­ge­be­ne Reper­toire an For­mu­lie­run­gen, das bei einem mensch­li­chen Repor­ter logi­scher­wei­se grö­ßer, um nicht zu sagen unbe­grenzt, ist, kommt es bei den dpa-Berich­ten zu weni­ger sprach­li­chen Wie­der­ho­lun­gen.

Die außer­dem sehr ergeb­nis­ori­en­tiert berich­ten­de tex­ten­gi­ne, hat noch aus­bau­ba­res Poten­ti­al bei der Ein­ord­nung von Gesche­hen: Von Spiel­ergeb­nis, Eck­stö­ßen und roten Kar­ten kön­nen Mensch und Maschi­ne glei­cher­ma­ßen berich­ten, ob der Sieg aller­dings ver­dient, unge­recht­fer­tigt oder not­wen­dig war, um den Abstieg zu ver­mei­den, lässt sich nur bedingt aus der Daten­la­ge able­sen. Die­se Kon­tex­tua­li­sie­rung fällt dem Sport­jour­na­lis­ten dann doch etwas leich­ter.

 

Um letzt­end­lich bei der Fuß­ball­me­ta­pher zu blei­ben: Der Ver­gleich geht unent­schie­den aus. Und irgend­wie ist es doch ein Sieg für den Robo­ter­jour­na­lis­mus.*

 

In Zei­ten, in denen auto­ma­tisch und jour­na­lis­tisch erstell­te Tex­te sich nicht mehr unter­schei­den las­sen, wird es dar­um umso wich­ti­ger, über den Unter­schied zu infor­mie­ren. Die Ver­fas­se­rin Meli­na-Sophia Schwo­ge plä­diert daher in ihrer Arbeit für eine Kenn­zeich­nungs­pflicht auto­ma­tisch gene­rier­ter Tex­te. Ein Stand­punkt, den wir so tei­len.

 

Vie­len Dank an Mile­na-Sophia Schwo­ge (@MilenaSchwoge) für die Bereit­stel­lung ihrer Bache­lort­he­sis „Robo­ter als Gate­kee­per“.

 

Über Ret­res­co

Bereits seit 2008 ent­wi­ckelt Ret­res­co füh­ren­de AI-Lösun­gen im Bereich Con­tent Auto­ma­ti­on. In den letz­ten Jah­ren hat sich das Unter­neh­men zuneh­mend zu einem der welt­weit füh­ren­den Anbie­ter in der auto­ma­ti­schen Text­ge­ne­rie­rung (NLG) ent­wi­ckelt und dut­zen­de Pro­jek­te für Kun­den aus den Berei­chen Medi­en, E-Com­mer­ce und Finanz­dienst­leis­tun­gen umge­setzt.

 

Ansprech­part­ner

Fran­ca Ding
@francacharlotte
Mar­ke­ting Koor­di­na­to­rin, Ret­res­co GmbH
+49 (0)30 555 781 999
franca.ding@retresco.de

 


¹ Untersuchte Kriterien: Vielfalt, Aktualität, Relevanz, Richtigkeit, Objektivität, Transparenz, Verständlichkeit und Unterhaltsamkeit.
² Analyse nach dem sogenannten Flesch-Index, untersucht wurde die Struktur des Textes – ein Wert von 61,51 für die textengine und ein Wert von 51,51 für dpa.
³ Untersucht wurde die Anzahl an Metaphern, witzigen Formulierungen und Reizwörtern — bei der Häufigkeitsverteilung der einzelnen lag die textengine stets wenig unter und dpa stets wenig über 50%.
⁴ Anzahl von Fehlern/Unstimmigkeiten: 23/70 bei der dpa, 1/70 bei der textengine.

 

* Hierbei handelt es sich um Meinungen, die so von uns, nicht aber in der Bachelorthesis vertreten werden.

 

©  Mpho Moja­pe­lo