Magische Metadaten

… und deren Bedeutung für Literaturverwaltungsprogramme

 

Bildnachweis: Ted Eytan on flickr

Während meines Praktikums in einer Universitätsbibliothek führte ich Schulungen für eine Literaturverwaltungssoftware durch. Wenn die Teilnehmer sahen, wie einfach sich Titeldaten automatisch aus Datenbanken oder Bibliothekskatalogen importieren und sich daraus ein Literaturverzeichnis erstellen ließ - und das alles in Sekundenschnelle -, leuchteten alle Augen auf und jemand im Raum sagte: "Das ist Zauberei!".

Natürlich hat das mit Magie oder Zauberei nichts zu tun, sondern mit etwas viel einfacherem und eher langweiligem: Metadaten.

 

Was sind Metadaten?

Metadaten sind Daten über Daten. Diese Daten sind eine Art Beschreibung, die Bibliothekare, Verlage, Datenbank-Anbieter und Webseitenersteller über ihre Daten erstellen. Die ausgehenden Daten können Bücher, Zeitschriftenaufsätze oder Webseiten sein. Auch wenn der Begriff “Metadaten” aus dem zwanzigsten Jahrhundert stammt, gibt es das Konzept schon lange. So lange, wie Menschen versucht haben, physische Gegenstände und Wissen zu organisieren, um diese leichter wiederzufinden.

So können beispielsweise die Einträge in frühen Bandkatalogen (in Buchform) einer Klosterbibliothek als Metadaten gesehen werden. Später nutzten Bibliotheken Karteikarten, um Ihre Bestände zu verzeichnen. Jede Karte enthielt allgemeine Informationen über das Buch, wo man es in der Bibliothek findet und seine Themenschwerpunkte. Die Karteikarten waren nach Autor, Titel und Sachgebiet geordnet, damit Bibliotheksnutzer die Bücher schnell finden konnten. Diese sogenannten Zettelkataloge haben längst den Weg frei gemacht für Online-Kataloge, die viel mehr Informationen und Details liefern. Das Ziel hinter dem Katalog bleibt jedoch dasselbe: der Nutzer sollte ein relevantes Buch finden können, indem er nach dessen Thema oder anderen Informationen darüber sucht.

Früher zählten Bibliothekare zu den wenigen Menschen, die sich intensiv mit Metadaten auseinandersetzten. Heute sind sie damit jedoch nicht länger allein. Man könnte sagen, dass wir heute im Zeitalter der Metadaten leben. Denn viele von uns nutzen ständig Metadaten im täglichen Leben – auch wenn wir uns darüber nicht bewusst sind.

Wenn Sie nach etwas googeln, durchsucht die Suchmaschine neben dem Text einer Webseite auch deren Beschreibung in den Meta-Tags der Seite.
Wenn Sie einem Foto, das Sie auf Instagram hochladen, ein Hashtag ergänzen, helfen diese Metadaten anderen Nutzern, Ihr Bild zu finden.
Mit Hilfe von Metadaten finden Sie schnell die Lieder eines vielversprechenden Künstlers auf Streaming Plattformen wie Spotify.
Wenn Sie eine Hotelbuchung online durchführen und nach der Entfernung zum Zentrum sowie dem Preis des Hotels filtern, ist dies nur möglich, da die Datenbank im Hintergrund Metadaten für jedes Hotel gespeichert hat.

 

Was steckt hinter Metadaten?

Metadaten können für die Suche nach Informationen (wie im vorherigen Beispiel) nur nützlich sein, wenn sie in einer konsistenten und strukturierten Form aufbereitet wurden. Denn dann können sie von Programmen am besten verarbeitet werden. Literaturverwaltungsprogramme können beispielsweise Recherche-Ergebnisse am besten importieren, wenn die Daten in tabellarischer Form vorliegen, beispielsweise im RIS-Format. Hier ist ein Beispiel der Details, die Sie in einer RIS-Datei finden können:



Die Abkürzungen auf der linken Seite sind die Feldbezeichnungen und die Information auf der rechten Seite sind deren Werte. Wenn Sie eine RIS-Datei importieren, gleicht das Literaturverwaltungsprogramm ab, welches RIS-Feld welchem Feld des Programms entspricht. Dadurch ruft die Software die Werte des RIS-Feldes ab und fügt sie in das zugehörige Feld in der Literaturverwaltung ein. Das ist einfach, aber sehr effektiv.

Bibliographische Daten sind auch relativ unkomplizierte Metadaten. So ist häufig schnell ersichtlich, was der Titel eines Buches ist, wann es veröffentlicht wurde und wer der Autor ist. Denn Sie können die Daten auf dem Buch selbst sehen.

 

Und wenn Sie den Inhalt eines Mediums beschreiben möchten?

Das ist ein viel subjektiverer Prozess.

Denn Sie müssen sich entscheiden, welche Kategorien oder Schlagwörter am besten passen und wie detailliert oder “granular” die Beschreibung sein sollte. Posten Sie beispielsweise ein Bild Ihres Chihuahuas auf Twitter und wählen nur den Hashtag #hund, jemand anderes sucht aber nach dem Hashtag #chihuahua, findet er oder sie Ihr Bild nicht. Dasselbe kann bei Synonymen passieren. Beispielsweise stehen #dackel und #dachshund für dieselbe Hunderasse, sind aber zwei unterschiedliche Hashtags. Um das Problem zu umgehen, verwenden viele Datenbanken und Bibliothekskataloge sogenanntes Kontrolliertes Vokabular. Darüber wird sichergestellt, dass bei der Suche nach einem Synonym dieselben Treffer angezeigt werden wie bei der Suche nach dem anderen Begriff.

Wie sich unsere Sprache ändert, so ändert sich auch die kontrollierte Sprache bzw. Vokabular in Datenbanken. Die Katalogisierungsexpertin Lynn M. El-Hoshy beschreibt Schlagwortketten, wie Sie die amerikanische Library of Congress vergibt, wie folgt:

 “[…]Library of Congress Subject Headings (LCSH) are rich sources for tracking shifts and trends in terminology over the century. Why? Because subject headings serve as standardized labels for indexing the contents of library materials and reflect societal concerns and the language generally used to express them.”

Im kontrollierten Vokabular schlägt sich nieder, wie sich die Sprache und Begrifflichkeiten im Laufe der Zeit verändern. Das gilt auch für den Fokus der Inhalte, der die zu der jeweiligen Zeit aktuellen, gesellschaftlichen Themen zeigt.

So könnte eine Schlagwortkette für ein Buch über Autos zunächst “Fortbewegung, ohne Pferd” lauten. Erst als der Begriff “Automobil” gebräuchlicher wurde, hat sich auch das Schlagwort in der Bibliothek geändert. Ebenso müssen ständig neue Begriffe ergänzt werden, beispielsweise wenn eine neue medizinische Behandlungsform entdeckt wird.

 

Kann es zu viele Metadaten geben?

In der Vergangenheit wurden meist nur so viele Metadaten erfasst, wie auch auf eine Karteikarte eines Zettelkatalogs passten. In der heutigen digitalen Welt gibt es die Sorge um begrenzten Platz nicht mehr; es gibt praktisch kein technisches Limit für die Menge der Metadaten, die für ein Medium gespeichert werden könnten. Das kann allerdings zu neuen Problemen führen. So werden Zeitschriftenaufsätze in Datenbanken oft mit vielen Schlagwörtern ausgezeichnet. Wenn Sie den Artikel in Ihre Literaturverwaltung importieren, gelangen mit dem Artikel hunderte von Schlagwörtern in Ihre Literatursammlung, die für Ihre Arbeit unter Umständen nicht relevant sind.

Das Problem ist jedoch nicht nur auf den Import beschränkt. Wenn Sie mit Literaturverwaltungsprogrammen arbeiten, erstellen Sie auch selbst noch mehr, neue Metadaten. Es mag verlockend sein, so viele Informationen wie möglich bei jeder Quelle zu vergeben, um diese später leicht wiederzufinden. Allerdings benötigen Sie dafür viel Zeit, in der Sie vielleicht besser den Artikel wirklich gelesen oder Ihre eigene Arbeit geschrieben hätten. Statt eine Quelle endlos zu beschreiben, konzentrieren Sie sich am besten auf diejenigen Metadaten, die jetzt im Moment am wichtigsten für Sie sind. Überlegen Sie sich auch, welche Metadaten wohl in der Zukunft am nützlichsten für Sie sind, falls Sie die Quelle je wiederverwenden möchten.

Zwingend notwendig sind all diejenigen Informationen, die Sie für das Zitieren der Quelle und das Erstellen des Literaturverzeichnisses brauchen. Hier ist es wichtig, importierte Daten genau anhand des Original-Artikels oder -Buchs zu kontrollieren. Denn Metadaten werden entweder von Menschen oder maschinell erstellt und da sind Fehler möglich.

Denken Sie neben den fürs Zitieren wichtigen Daten daran, was noch für Ihren Workflow wichtig ist. Beispielweise könnten Sie Kategorien vergeben oder Ihre Quellen in Ordner je nach Thema einsortieren. Wenn Sie mit Citavi arbeiten, können Sie auch Textstellen, die Sie während des Lesens finden, kategorisieren. Die Textstelle könnte beispielsweise eine Aussage sein, die Sie wortwörtlich in Ihrer Arbeit zitieren möchten.

Bewertungen, Schlagwörter, Gruppen, Abstracts, Inhaltsverzeichnisse, Kommentare, Zusammenfassungen, Notizen und Signaturen in einer Bibliothek sind nur einige der vielen Optionen, die Ihnen Ihr Programm bietet. Nehmen Sie sich Zeit, Video-Tutorials anzuschauen oder Anleitungen zu lesen, um herauszufinden, welche Metadaten Ihr Programm anbietet, und welche Sie nutzen möchten.

Mit den vielen Metadaten können Sie viele nützliche Aufgaben erledigen, z.B. eine Leseliste mit Ihren eigenen Kommentaren für Ihren Buch-Club erstellen, ein Literaturverzeichnis für Ihre Arbeit mit einem Klick ausgeben oder wichtige Quellen mit Ihrem Kollegen weltweit teilen.

Es ist vielleicht keine Zauberei, aber Metadaten machen viele Aufgaben auch im modernen Leben leichter.

 

Welche Metadaten sind für Ihr Projekt wichtig? Haben Sie einen völlig falschen Metadaten-Import erleben müssen? Wir freuen uns, über Ihre Erfahrungen auf Facebook zu lesen.


 

 

Erstellt von: Jennifer Schultz – Veröffentlicht am: 16.07.2019
Tags: Gut zu wissen Wissen managen


Über Jennifer Schultz

Jennifer Schultz ist die einzige Amerikanerin im Citavi-Team, was ihr ihre Kollegen aber (normalerweise) nicht verübeln. Ihre Leidenschaft, Wissenschaftler bei ihrer Arbeit zu unterstützen, brachte ihr einen erfolgreichen Studienabschluss. Sie mag es aber auch, schwierige Sprachen zu lernen, draußen in der Natur zu sein und ihre Nase in ein Buch zu stecken.

Get a regular dose of research inspiration. Enter your email address to get bi-weekly emails whenever new content is added.