Dokumentenarchiv
Für museum-digital sind kontrollierte Begriffe von zentraler Bedeutung. In vier verschiedenen Katalogen werden Akteure (Personen, Institutionen, ...) Geografika (Orte und Gebäude), Zeiten (Zeitpunkte und Zeiträume) sowie Schlagworte erfasst. Die einzelnen Begriffe werden angereichert mit Definitionen und Verweisen auf externe kontrollierte Vokabulare (Wikipedia, GND, ULAN, RKD, MBL, LAGIS, geonames, TGN, AAT, LCSH, ...). Gleichzeitig werden die Begriffe in Hierarchien eingepasst. Dies hat den Vorteil, dass bei einer Suche nach einem übergeordneten Begriff immer auch die Objekte zu den untergeordneten Begriffen gefunden werden. Eine Suche nach Kinderspielzeug findet so auch alle Schaukelpferde und eine Suche nach Fahrzeugen findet alle Automobile.
Vokabulararbeit ist bei museum-digital zentralisiert. Alle Museen in allen Instanzen einer Sprachvariante von museum-digital arbeiten mit dem jeweils gleichen Set von kontrollierten Begriffen. Gründliche Vokabularbeit ist sehr zeitaufwendig sein, deshalb wurde versucht möglichst viel davon den teilnehmenden Museen abzunehmen. Zentralisierte Vokabularbeit führt außerdem zu eindeutigeren Resultaten. Für die Vokabulararbeit haben wir ein eigenes Tool, nodac, entwickelt mit welchem viele Anreicherungen semi-automatisch durchgeführt werden können und mit dem es einfach ist, die jeweiligen Hierarchien zu erzeugen. Mit diesem Tool lassen sich zudem Massenkorrekturen durchführen. Aus freiwilligen Beiträgen der Museen, mit Unterstützung einiger Bundesländer, aus Projektmitteln und insbesondere durch ehrenamtlichen Einsatz wird die Normdatenarbeit von einem kleinem Team bewerkstelligt.
Die kontrollierten Vokabulare zu ordnen und anzureichern ist ein immer währender Prozess, nicht zuletzt weil neue Inhalte jeden Tag dazu kommen. Um eine klarere Einschätzung unseres Fortschritts treffen zu können, benutzen wir eine Ampel-Kategorisierung für den Prüfstatus der Einträge.