Wie wir über 12 Millionen Mitgliedkarteien der NSDAP analysiert haben
Sprache: Deutsch

Seit März 2026 hat ein interdisziplinäres Team der ZEIT (Daten & Visualisierung, Data Science, Ressort Wissenschaft/Geschichte) mehr als 12 Millionen NSDAP-Mitgliedskarten aus den online gestellten Mikrofilm-Scans der US National Archives in eine komfortabel durchsuchbare Recherche-Umgebung überführt. Ausgangspunkt war ein massives Usability-Problem: Zwar waren tausende PDFs öffentlich verfügbar, doch Suche und Zugriff waren für viele Menschen praktisch unbenutzbar – gerade in dem Moment, in dem das gesellschaftliche Interesse an familiären Spuren im Nationalsozialismus stark anstieg. Wir zeigen in diesem Talk, wie wir aus rund 1,5 TB PDFs eine strukturierte Datengrundlage gewonnen haben – und welche technischen wie redaktionellen Entscheidungen dafür nötig waren.

Der Kern der Pipeline: Karteikarten erkennen, zuschneiden, klassifizieren und auslesen. Wir nutzten KI, um Karten von Leer- und Fotoseiten zu trennen, relevante Felder zu lokalisieren und Inhalte auch bei Schreibmaschine, Kurrent und Sütterlin zuverlässig zu transkribieren. Wir erläutern, warum Performance und Kosten beinahe zum Showstopper wurden, wie ein Modellwechsel die Laufzeit von „zu langsam“ auf gut einen Tag drückte, und wie die Ergebnisse in einer Datenbank (PostgreSQL) landeten, um Analysen in R, Python und DuckDB sowie eine benutzerfreundliche Suchoberfläche zu ermöglichen (Prototyping u. a. mit Figma/Svelte).

Neben dem Engineering diskutieren wir die ethischen und kommunikativen Spannungsfelder: Was bedeutet „einfacher Zugang“ zu Täter*innendaten? Wie bauen wir Transparenz über OCR-Fehler, Unsicherheiten und Dubletten ein? Und wie lässt sich eine Redaktion über ein Feedbacksystem und Community-Hinweise dauerhaft in die Datenqualitätsschleife integrieren? Der Talk liefert ein praxisnahes Muster für „AI-assisted archival search“ – zwischen Skalierung, Verantwortung und öffentlichem Interesse.

Das Profilbild der Vortragenden
Gregor Aisch

Gregor Aisch ist Senior Visual Data Journalist bei der ZEIT und Co-founder von Datawrapper, einem Datenvisualisierungstool, das bei Tausenden Journalisten im täglichen Einsatz ist.

Von 2014 bis Ende 2017 arbeitete Aisch als Graphics Editor bei der New York Times. Seine Arbeiten wurden mit zahlreichen internationalen Preisen ausgezeichnet, darunter Gold und “Best of Show Online” beim Malofiej Infographics World Summit.

The speaker’s profile picture
Nico Scordialo

Wir haben über 12 Millionen Mitgliedkarteien der NSDAP analysiert!