Automatische Texterstellung

 

  1. Auto­ma­ti­sche Tex­ter­stel­lung auf dem Vor­marsch
  2. Wie funk­tio­niert auto­ma­ti­sche Text­ge­ne­rie­rung?
  3. Anwen­dungs­bei­spie­le für auto­ma­ti­sche Tex­ter­stel­lung

 

 

Automatische Texterstellung auf dem Vormarsch

 

Auto­ma­ti­sche Tex­ter­stel­lung revo­lu­tio­niert die Erstel­lung von Inhal­ten in immer mehr Berei­chen. So set­zen Nach­rich­ten-Por­ta­le im Con­tent-Mix zuneh­mend auf Robo­ter­jour­na­lis­mus. Online-Shops nut­zen com­pu­ter­ge­ne­rier­te Tex­te zur Insze­nie­rung von Pro­duk­ten. Smar­te Anwen­dun­gen kre­ieren auto­ma­ti­siert indi­vi­du­el­le Reports wie Geschäfts­be­rich­te, Immo­bi­li­en-Expo­sés oder Fonds­re­ports.

Auto­ma­ti­sche Text­ge­ne­rie­rung, auch unter dem Syn­onym Natu­ral Lan­guage Gene­ra­ti­on (NLG) bekannt, ist ein Teil­ge­biet Künst­li­cher Intel­li­genz.  KI-basier­te Soft­ware ist heu­te in der Lage, natür­lich­sprach­li­che Inhal­te effi­zi­ent zu gene­rie­ren und in Echt­zeit bereit­zu­stel­len.

 

Wie funktioniert automatische Texterstellung?

 

Die Funk­ti­ons­wei­se von auto­ma­ti­scher Tex­ter­stel­lung ist auch ohne tief­ge­hen­des tech­ni­sches Vor­wis­sen schnell und ver­ständ­lich erklärt. Not­wen­di­ge Bedin­gung für die Erstel­lung von auto­ma­tisch gene­rier­ten Tex­ten sind immer struk­tu­rier­te Daten.

Ein­fach aus­ge­drückt han­delt es sich dabei um Infor­ma­tio­nen in Tabel­len­form. Am Bei­spiel Wet­ter­be­rich­te sind das etwa die Infor­ma­tio­nen zu Tem­pe­ra­tur, Luft­druck oder Nie­der­schlags­wahr­schein­lich­keit an einem Ort. Auf die Bör­se bezo­gen kön­nen das die Wer­te wie Zu- bzw. Abnah­me eines Inde­xes oder Kurs­schwan­kun­gen sein, beim Betex­ten von Pro­dukt­be­schrei­bun­gen Arti­kel­merk­ma­le wie Far­be, Grö­ße oder Gewicht. Für mensch­li­che Leser sind sol­che rei­nen Zah­len­ko­lon­nen weni­ger ein­gän­gig les­bar als Fließ­text.

Zur Ver­bes­se­rung des Nut­zer­er­leb­nis über­setzt spe­zi­el­le Soft­ware die Daten in Tex­te. Dabei fügt ein Pro­gramm die Infor­ma­tio­nen in inhalt­lich rele­van­te Bestand­tei­le einer intel­li­gen­ten Text­vor­la­ge ein. Bau­stei­ne einer sol­chen Vor­la­ge könn­ten am Bei­spiel eines auto­ma­ti­sier­ten Wet­ter­be­rich­tes etwa sein:

    • Satz 1: In Ber­lin beträgt die Höchst­tem­pe­ra­tur heu­te [XX]° C.
    • Satz 2: In der Nacht fal­len die Tem­pe­ra­tu­ren auf [XX]° C.
    • Satz 3: Die Regen­wahr­schein­lich­keit liegt bei [XX]%.

Erhält die Anwen­dung in die­sem Bei­spiel struk­tu­rier­te Daten zu Höchst- und Tiefst­wer­ten fül­len sich Satz 1 sowie Satz 2. Satz 3 wird nur ver­voll­stän­digt und auf einer Web­site aus­ge­ge­ben, wenn auch die Daten zur Nie­der­schlags­wahr­schein­lich­keit über­mit­telt wer­den.

Leis­tungs­fä­hi­ge Soft­ware geht über die rei­ne Beschrei­bung von Ereig­nis­sen hin­aus. Abhän­gig von der Struk­tur der Daten und den hin­ter­leg­ten Satz­vor­la­gen, sind kom­ple­xe Tools in der Lage, dem Anwen­der Inter­pre­ta­tio­nen von Daten in Text­form zu lie­fern. Beson­ders inter­es­sant sind die­se Use Cases für Ana­ly­sen von Unter­neh­mens­da­ten im Rah­men von Busi­ness Intel­li­gence.

Um wel­che Sor­te auto­ma­tisch gene­rier­ten Tex­tes es sich auch han­delt: die Vor­la­gen für die Ele­men­te von Tex­ten sind nicht von einem Com­pu­ter erstellt. Die­ser initia­le Input muss von einem mensch­li­chen Redak­teur mit ent­spre­chen­dem Domä­nen­wis­sen stam­men. Und auch nach dem Set­up soll­te das Sys­tem regel­mä­ßig auf neu auf­ge­tre­te­ne Grenz­fäl­le über­prüft und gepflegt wer­den. Auto­ma­ti­sche Tex­ter­stel­lung macht Tex­ter nicht kom­plett beschäf­ti­gungs­los — Natu­ral Lan­guage Gene­ra­ti­on ent­bin­det vor allem von Stan­dard­auf­ga­ben und schafft mehr Raum für krea­ti­ve Tätig­kei­ten.

 

Anwendungsbeispiele für automatische Texterstellung

 

Auto­ma­tisch erstell­te Tex­te sind so gut wie jedem Inter­net­nut­zer bereits begeg­net. Die Grö­ße eines Por­tals spielt bei für NLG-Anwen­dun­gen kei­ne Rol­le. So kom­men
com­pu­ter­ge­ne­rier­te Bei­trä­ge in den Online-Auf­trit­ten der Leit­me­di­en und in regio­na­len Zei­tungs­por­ta­len glei­cher­ma­ßen zum Ein­satz.

Fuß­ball­be­rich­te, Erd­be­ben­be­nach­rich­ti­gun­gen, Bör­sen­news, Wet­ter- oder Stau­mel­dun­gen sind eta­blier­te Anwen­dungs­be­rei­che auto­ma­ti­scher Text­ge­ne­rie­rung. Beson­ders inter­es­sant sind com­pu­ter­ge­ne­rier­te Bei­trä­ge für regio­na­le Medi­en. In Groß­bri­tan­ni­en fin­den ers­te Ver­su­che statt, bei denen Tex­te mit loka­ler Rele­vanz aus öffent­li­chen Daten­quel­len der Behör­den erstellt wer­den.

In punk­to Qua­li­tät lässt sich bei bestimm­ten Text­sor­ten des Robo­ter­jour­na­lis­mus kaum ein Unter­schied zwi­schen auto­ma­tisch erstell­ten Bei­trä­gen und denen mensch­li­cher Schrei­ber fest­stel­len. Tests mit Fuß­ball-Spiel­be­rich­ten erga­ben bei­spiels­wei­se, dass Leser die Erzeug­nis­se des “Robo­ter­jour­na­lis­ten” natür­li­cher ein­schätz­ten, als die Bei­trä­ge eines “ech­ten” Redak­teurs.

Wei­te Ver­brei­tung fin­det die auto­ma­ti­sche Tex­ter­stel­lung auch im E-Com­mer­ce. Weil Online-Shops fort­lau­fend gro­ße Men­gen an Pro­dukt­be­schrei­bun­gen benö­ti­gen, haben Port­al­be­trei­ber com­pu­ter­ge­stütz­te Text­ge­ne­rie­rung als effi­zi­en­ten Modus der Betex­t­ung ent­deckt.

Ein wei­te­res Anwen­dungs­ge­biet von auto­ma­ti­scher Text­ge­ne­rie­rung mit hohem direk­tem Ein­spar­po­ten­ti­al sind aus­for­mu­lier­te Reports aus dem Bereich Busi­ness Intel­li­gence. Wo von Ana­ly­se- und Reporting-Tools gro­ße Daten­men­gen erho­ben wer­den, hilft auto­ma­ti­sche Text­ge­ne­rie­rung dabei, Big Data zu inter­pre­tie­ren und aus Nul­len und Ein­sen ver­ständ­li­che Sto­ries zu machen.

Auto­ma­ti­sche Tex­ter­stel­lung macht nicht für jeden Anwen­dungs­be­reich Sinn. Wenn etwa auf­wän­di­ge Recher­chen die Basis für einen Hin­ter­grund-Bericht sind oder in einem Mei­nungs­bei­trag das Pro und Con­tra eines Stand­punk­tes ana­ly­siert wird, stößt Robo­ter­jour­na­lis­mus klar an Gren­zen. Hier wer­den auch wei­ter­hin jour­na­lis­ti­sche Pro­fis mit Gespür und Erfah­rung gefragt blei­ben.