Johan­nes Som­mer, Geschäfts­füh­rer der Ber­li­ner Fir­ma Ret­res­co, und der Com­pu­ter­lin­gu­ist Herr Prof. Dr. Hans Uszko­reit vom Deut­schen For­schungs­zen­trum für Künst­li­che Intel­li­genz (DFKI) stel­len sich im Deutsch­land­funk-Pro­gramm ‘Com­pu­ter und Kom­mu­ni­ka­ti­on’ den Fra­gen von Redak­teur Man­fred Kloi­ber zur auto­ma­ti­schen Text­ge­ne­rie­rung, dem aktu­el­len Ent­wick­lungs­stand sowie den Per­spek­ti­ven.

 

Automatische Textgenerierung basiert auf Daten

In Sport, Wirt­schaft und Wet­ter erschei­nen immer mehr Arti­kel, die nicht unbe­dingt Jour­na­lis­tIn­nen, son­dern soge­nann­te Soft­ware-Robo­ter geschrie­ben haben. Sol­che auto­ma­tisch gene­rier­ten Tex­te basie­ren auf struk­tu­rier­ten Daten, wel­che mit domä­nen­spe­zi­fi­schem Wis­sen und zuge­hö­ri­gem Voka­bu­lar ange­rei­chert wur­den. So wan­delt auch Ret­res­cos Soft­ware, die rtr tex­ten­gi­ne, inner­halb von Mil­li­se­kun­den Daten in natür­lich­sprach­li­che Tex­te um.

Wäh­rend sich die Res­sort­ex­per­ten des Deutsch­land­funks kri­tisch geben, bestä­ti­gen ver­schie­de­ne Stu­di­en unab­hän­gig von­ein­an­der, dass Leser die Qua­li­tät der auto­ma­tisch gene­rier­ten Arti­kel durch­weg posi­tiv bewer­ten. Sie kön­nen die­se nur noch schwer von jour­na­lis­ti­schen Tex­ten unter­schei­den. Denn die Tech­no­lo­gie in die­sem Bereich der künst­li­chen Intel­li­genz hat bereits enor­me Fort­schrit­te gemacht und wird sich auch in den kom­men­den Jah­ren rasant wei­ter­ent­wi­ckeln.

Sebas­ti­an Gol­ly, Lei­ter der Text­ge­ne­rie­rung bei Ret­res­co, erläu­tert anhand von Fuß­ball­be­rich­ten die Funk­ti­ons­wei­se der rtr tex­ten­gi­ne. “Ich habe für eine Ham­bur­ger Ama­teur­li­ga ein paar Spiel­ta­ge her­aus­ge­grif­fen und las­se dazu ein­fach mal die ent­spre­chen­den Tex­te gene­rie­ren. Jetzt kön­nen Sie sehen, dass hier im Sekun­den­takt Vor­be­rich­te rau­spur­zeln.” Im Hin­ter­grund ana­ly­siert das Sys­tem in Sekun­den­schnel­le die zuge­hö­ri­gen Daten, fasst die rele­van­ten Aus­sa­gen zusam­men und for­mu­liert dar­aus fer­ti­ge Sät­ze. Die rtr tex­ten­gi­ne gene­riert somit auf Knopf­druck aktu­el­le Vor- und Nach­be­rich­te zu allen Spie­len aller Ligen.

Die Mög­lich­kei­ten der Bericht­erstat­tung in Echt­zeit und On-Demand erhö­hen die regio­na­le Rele­vanz eines Por­tals enorm. Das Ergeb­nis ist eine grö­ße­re Reich­wei­te, gestei­ger­te Nut­zer­bin­dung und eine deut­lich erhöh­te Sicht­bar­keit.

Hören Sie sich hier den gesam­ten Bei­trag als Deutsch­land­funk-Pod­cast an: