STasi

Meisterhaftes Schaufenster in das Stasi-Archiv

„Je besser wir Diktatur begreifen, um so besser können wir Demokratie gestalten.“ Diese Worte des Bundesbeauftragten für die Stasi-Unterlagen Roland Jahn sind hoch aktuell. Roland Jahn ließ seinen Worten Taten folgen. 2014 beauftragte seine Behörde die Retresco GmbH mit der semantischen Erschließung einer Auswahl der Dokumenten-Bestände in seinem Archiv. Das Ergebnis lässt sich seit dem 8. Januar 2015 unter www.stasi-mediathek.de besichtigen. Technischer Kern des Projektes Stasi-Mediathek ist die semantische Volltextsuche von Retresco.

Was für ein Archiv! Mehr als 111 Kilometer Akten – Ordner-Rücken neben Ordner-Rücken gemessen. Dazu über 1,7 Millionen Fotos sowie zehntausende Stunden Film- und Tonmaterial aus den Überwachungs-Maßnahmen der DDR-Staatssicherheit. Es ist einer der größten Archivbestände in Deutschland. Und jetzt werden Ausschnitte mit Hilfe von Retresco der breiten Öffentlichkeit zugänglich gemacht – genau 25 Jahre nachdem erstmals mutige Demonstranten in die Berliner Stasi-Zentrale eindrangen.

Ein hoch ambitioniertes verlegerisches Projekt

Auf www.stasi-mediathek.de stehen 2.500 Dokumentenseiten, 250 Einzelbilder, sechs Stunden Tonaufzeichnungen und 15 Stunden Filme online zur Auswahl. Dieses Angebot wird stetig erweitert. Ein gesellschaftlich hoch relevantes und technologisch hoch ambitioniertes multimediales verlegerisches Projekt – politisches Bildungsmedium für junge und erwachsene Staatsbürger und historische Fachinformation für Experten unter einer Oberfläche.

Den Einstieg in das Web-Angebot ermöglicht die Suchfunktion: in eine Suchmaske eingegebene Stichwörter führen zu den Dokumenten und allen einzelnen Inhalten. Auch Videos und Audio-Dateien sowie Beschreibungen der Fotos sind im Volltext durchsuchbar. Über einen Zeitstrahl lassen sich Inhalte intuitiv finden: Er zeigt auf, aus welchen Zeiträumen Dokumente zu bestimmten Themen online zur Verfügung stehen. Alle Suchmethoden sind beliebig kombinierbar.

Bewährte linguistisch-semantische Algorithmen

Die Spezialisten von Retresco wenden ihre in zahlreichen Projekten bewährten linguistisch-semantischen Algorithmen an, um jedem Archivstück automatisch bedeutsame Schlagworte wie „Todesstrafe“ oder „Republikflucht“ zuzuordnen. Entitäten wie Personen, Organisationen, Ereignisse und Orte spielen eine weitere Schlüsselrolle. Diese und andere semantische Markierungen gehen mit allen ihren Synonymen und grammatischen Formen in den Suchindex ein. So verknüpfen sie die Dokumente im Content Management System.

Anwender können diese Verknüpfungen nutzen, indem sie ihrer Intuition folgend durch die semantisch vernetzten Daten navigieren. Aber auch für die gezielte Suche können Leser die Anreicherungen nutzen: eine „Auto-Vervollständigen“-Funktion schlägt in Abhängigkeit von der jeweils aktuellen Dokumenten-Auswahl nur die relevanten Schlagworte und Entitäten vor. Retresco-Technologie berechnet die vorgeschlagenen Begriffe jeweils dynamisch aus den nach der Filterung verbliebenen Dokumenten.

Redaktions-System spart Zeit

Den Redakteuren der Behörde stellt Retresco ein System zur Anpassung des Anreicherungs-Prozesses zur Verfügung. Damit können sie die semantischen Anreicherungen für jedes Dokument überprüfen und bei Bedarf korrigieren. Gleichzeitig können sie das Begriffs-Netzwerk erweitern und neue Zuordnungen schaffen. So verbessert sich laufend die automatische semantische Anreicherung. Besonders wichtig ist aber die Erweiterung des Fachvokabulars beim Verarbeiten der Stasi-spezifischen Fachsprache. Dadurch sparen die Redakteure Zeit im weiteren Verlauf der Bestands-Erschließung.

„Eine Meisterleistung,“ beurteilte spontan der Bundesbeauftragte Roland Jahn das Gesamtergebnis. Zu dem überwältigenden Eindruck trägt die interaktive Nutzeroberfläche im „Responsive Design“ bei. Retresco-Partnerfirma und Subunternehmerin 3pc GmbH hat diese gestaltet und umgesetzt. Die Anpassung der Oberfläche und Bedienelemente an Endgeräte unterschiedlichster Größe ermöglicht eindrucksvolles und manchmal beklemmendes „Semantic Storytelling“ auf allen Geräte-Plattformen. Die Angebote reichen vom Stöbern und Entdecken auf Smartphone und Tablet bis zur gezielten Recherche am Desktop-PC.

Retresco-Technologie begeistert Auftraggeber und Öffentlichkeit

Nicht nur der Auftraggeber ist begeistert – auch die Öffentlichkeit urteilt positiv über das neue „Schaufenster in das Stasi-Archiv”, wie Roland Jahn es nennt. Zahllose Twitter-Botschaften verbreiteten gleich am ersten Tag den Link zur Stasi-Mediathek. Aus den USA kam die Einschätzung „the coolest thing ever“. Die Berliner Morgenpost findet es „für alle Altersgruppen ein spannendes Angebot“, mdrINFO „eine lohnende Zeitreise“. Die „Behörde des Bundesbeauftragten für die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratischen Republik“ – so ihr offizieller Titel – wünscht sich, dass viele Bürger sich auf diese Zeitreise aufmachen.

Für Retresco ein wunderbares Projekt, in das sie ihre führenden Technologien im Bereich der automatischen Verschlagwortung, Verlinkung und semantischen Suche einbrachte. Dadurch verbesserte sie die Zugänglichkeit der Dokumente und das Nutzungserlebnis entscheidend. „Der spezifische Stasi-Jargon war zunächst eine Herausforderung, daran mussten unsere Verfahren angepasst werden. Das ist gelungen. Das Ergebnis ist aus unserer Sicht ein besonders schönes Zusammenspiel aus Technologie, Design und spannenden Inhalten.“ So Retresco-Projektleiter Wolf Winkler.

Schlagwörter: Online-Archive / semantische Suche / Multimedia-Suchmaschine / semantische Anreicherung / Semantic Storytelling / semantische Redaktions-Unterstützung / Semantic Publishing

Bild-Quelle: www.stasi-mediathek.de