Unser Auftraggeber, das Dokumentations- und Informationszentrum (DIZ) der Süddeutschen Zeitung und Südwestdeutschen Medienholding, ist ein Archivdienstleister und Contentvermarkter; bietet also Zugang zu den Inhalten der Verlagspublikationen und anderen Medien. Zur Arbeitserleichterung und effizienteren Archivierung kam hier unser Klassifikator zum Einsatz.

Ziel war die Teil­au­to­ma­ti­sie­rung des Archi­vie­rungs­pro­zes­ses mit der Mög­lich­keit der anschlie­ßen­den manu­el­len Kor­rek­tur – die Arbeit des Lek­to­rats bei DIZ wird also mit­hil­fe der Ret­res­co-Seman­tik maß­geb­lich effi­zi­en­ter gestal­tet. Die im Backend funk­tio­nie­ren­den Tech­no­lo­gi­en der seman­ti­schen Anrei­che­rung und des Klas­si­fi­ka­tors sind dabei im Front­end in einer über­sicht­li­chen Matrix ver­walt­bar.
Seman­tik
Alle Inhal­te wer­den seman­tisch ana­ly­siert, sprich Enti­tä­ten wie Fir­men und Per­so­nen erkannt und die rele­van­tes­ten zudem zur Klas­si­fi­ka­ti­on des Tex­tes vor­ge­schla­gen. Auf Basis der seman­ti­schen Anrei­che­rung kön­nen Inhal­te daher auto­ma­tisch ver­schie­de­nen The­men zuge­ord­net wer­den.
Damit ermög­licht die auto­ma­ti­sche Klas­si­fi­ka­ti­on sowohl eine ein­heit­li­che Archi­vie­rung als auch eine mehr­fa­che Ver­wer­tung von Inhal­ten.

 

Machi­ne Learning

Durch das Machi­ne Learning unse­res Klas­si­fi­ka­tors wer­den des­wei­te­ren auch Aspek­te erkannt, die nicht expli­zit im Text ste­hen, so wie das The­men-Dos­sier.

 

 

 

 

Matrix­ober­flä­che

Die Matrix­ober­flä­che des Klas­si­fi­ka­tors gibt eine direk­te Über­sicht über die The­men­ab­de­ckung. Das bringt nicht nur Ord­nung ins Archiv, son­dern ermög­licht gleich­zei­tig eine mühe­lo­se Bestands- auf­nah­me und deckt dadurch poten­ti­el­le Lücken auf einen Blick auf.

 

Die Ret­res­co-Seman­tik leis­tet mit ihrem Vor­schlags­we­sen infol­ge­des­sen einen ent­schei­de­nen Anteil zur effi­zi­en­ten Gestal­tung der Arbeit des Lek­to­rats.