Javító és NSDAP tagsági fájl: Copy and Waste
D a „Harmadik Birodalom” vége most volt 81 évvel ezelőtt. Az adatújságírók, fejlesztők és levéltárosok nagy szerepet játszanak az emlékek megőrzésében és az utókor számára kézzelfoghatóvá tételében. A digitális archívumok iránti nagy érdeklődést mutatja, hogy a hozzáférések száma milliós nagyságrendű, mióta az Egyesült Államok Nemzeti Levéltára márciusban digitálisan hozzáférhetővé tette az NSDAP tagsági fájlt. Bár az archívumot nem úgy tervezték, hogy felhasználóbarát legyen, és rá kell nagyítani a fájlokra, hogy még azt is lássuk, kiről is van szó, az oldal a túlterheltség miatt többször is elérhetetlen volt.
Ennél is Idő és a Spiegel Amikor mindegyikük saját adatbázist épített fel mesterséges intelligencia eszközökkel, hogy jobban kereshetővé tegyék a több millió amerikai adatot, valószínűleg hasonló válaszban reménykedtek. És nagy nemzetközi figyelmet kaptak. Többek között a BBC, a CNN és a CBC számolt be arról, hogy most meg lehet vizsgálni, hogy a saját nagymamája vagy szomszédja tagja-e az NDSAP-nak. „Az eszközt milliószor nézték meg és több ezer alkalommal osztották meg. Négy számjegyű üzeneteket kaptunk róla” – írja a kiadó szóvivője Idő kérésre.
Az adatbázisokat a memóriamunka fontos eszközének tekintik. A Szövetségi Levéltár is régóta elérhetővé teszi a dokumentumokat, ha Ön egy adott személyről érdeklődik – ingyenesen. A digitális kereső funkciói Spiegel és Idő de engedd le az akadályokat. Ugyanakkor van kritika is: a keresés csak a fizetési akadály mögött érhető el. Ezért üdvözlendő lépés a Correctiv és a Katapult ötlete, hogy közösen készítsenek egy ingyenesen elérhető NSDAP tagsági fájlt. De a jó szándék nem mindig jó.
Mert nem sokkal később Miután a Correctiv és a Katapult május 11-én közzétette az adatbázist, újra le kellett venniük. A Idő A Correctiv bejelentette, hogy az adatok valószínűleg tőlük származnak. Hogyan történhetett ez meg? A Katapult és a Correctiv a külső fejlesztő Christoph Reith adatelőkészítését és „barnaarchívumát” használta, amely jelenleg nem érhető el online. „Egyértelműen utaltak a hasonlóságokra”, például az adatkészletekben és a térképképekben, írja a The Idő-A kiadó szóvivője a taz kérésére.
Az újságírói munka iránti bizalom csökken
A Correctiv azóta hosszú nyilatkozatban kért elnézést a honlapján. „Az ilyen formában történő közzététel nem felel meg az újságírói és dokumentumfilmes szabványainknak” – írja a Correctiv. Magyarázat a Katapultnál egyelőre nem található, de a magazin a hírlevélben szeretne rátérni – írja Benjamin Fredrich a taz szerkesztője. Mint mindig a média által elkövetett hibáknál, az átlátható hibakultúra jobb a semminél, de: A kár megtörtént.
A feltehetően ellopott adatok közzététele sérti az újságírói munkába vetett bizalmat. Az adatok eredetének, feldolgozásának és ellenőrzésének nyomon követhetőnek kell lennie, különösen a történelmi archívumok és a nagy adathalmazok esetében. Bárki, aki több millió dokumentumot tesz közzé, felelősséget vállal a pontosságért és az átláthatóságért. Az adatokat osztályozni kell, az eredményeket pedig ellenőrizni kell, különösen, ha mesterséges intelligencia segítségével érték el őket, ahogy ez a 80 milliós indexkártya adathalmaz esetében is történt. Valóban helyesen fejtette meg a kézzel írt neveket, születési helyeket és a párthoz való csatlakozás napjait?
Ezek az ellenőrzések összetettek és erőforrásokat igényelnek: a fejlesztők építik fel az adatbázis-rendszereket, az adatújságírók a történeteket keresik az adatokban. A vizualizálók érthető módon készítik elő az információkat. Ez csapatmunka. És csak néhány szerkesztőcsoport rendelkezik a szükséges erőforrásokkal. Az eset tanulsága tehát az: az adatújságírást bővíteni és finanszírozni kell. A jó adatkutatás nem oldalról történik. Szaktudásra, műszaki infrastruktúrára és elegendő időre van szüksége az ellenőrzéshez. Az ilyen projektek csak így tehetik hozzáférhetővé a történelmet anélkül, hogy új bizalmatlanságot keltenek.