SUB-Logo

Projekt SSG-Fachinformation (SSG-FI)



Vortrag:

Die Konzeption des SSG-FI-Projektes der SUB Göttingen im Überblick

von Wilfried Enderle



Ausgangspunkt bei der Konzeption des Projektes war die einfache und banale Erkenntnis, daß im Internet wissenschaftlich relevante Informationen in zunehmendem Maße zur Verfügung stehen, die für eine SSG-Bibliothek, welche den Auftrag hat, für ihr Fach, ihr SSG, die wissenschaftlichen Publikationen vollständig zu sammeln und zu erschließen, von Bedeutung sind. Es mußte also ein Konzept gefunden werden, diese elektronischen Fachinformationen in das Angebot einer SSG-Bibliothek zu integrieren.

Das grobe Konzept, das für den Projektantrag entwickelt wurde, ging dabei von der Prämisse aus, daß eine Sammlung und Erschließung elektronischer Fachinformationen, die nur von automatisierten Verfahren ausgeht, also ausschließlich auf den Einsatz von Suchmaschinen setzt, keine Ergebnisse liefert, die den Ansprüchen wissenschaftlicher Nutzer genügt. Diese erwarten, so unsere Überlegung, ein System, das nach den Kriterien wissenschaftliche Qualität und Relevanz selektiert. Zugleich war und ist klar, daß es nicht möglich ist, mit rein intellektuellen Methoden im Internet Informationen auf Dokumentebene zu erfassen. Für die Erfassung auf Dokumentebene, also die Katalogisierung elektronischer Dokumente, können heute nur noch automatisierte Verfahren sinnvoll eingesetzt werden. Der springende Punkt ist, daß es keinen Sinn macht, pauschal automatisiert zu erfassen und zu erschließen, sondern daß man den Robots, die dies tun, vorgeben muß, welche thematischen Server denn fachlich relevant und hinreichend gut sind. Es gilt also durch intellektuelle Recherche und Bewertung einen Überblick über die relevanten thematischen Server, also die elektronischen Fachinformationen zu gewinnen. Und genau auf dieser Ebene setzt das Konzept des SSG-Fachinformationssystems an.

Eine implizite Prämisse des Projektes ist mithin, daß es möglich ist, mit intellektuellen Methoden die relevanten Internet-Fachinformationen zu erfassen. Warum wir der Meinung waren und sind, daß dies möglich ist, will ich versuchen kurz zu erläutern. Ich muß dabei etwas grundsätzlicher auf das Internet eingehen, weil in diesem Kontext leider viele Mißverständnisse dadurch entstehen, daß man sich nicht ausreichend klar macht, worüber man eigentlich redet.

Das Internet ist zunächst einmal ein Kommunikationsmedium. Es ist damit durchaus in Analogie zu sehen zu dem klassischen Kommunikationsmedium mit dem wir bislang gearbeitet haben, nämlich dem Papier. Bibliotheken sammeln und erschließen nun nicht alles, was weltweit in irgendeiner Form auf Papier gebracht wird, sondern nur diesen im Verhältnis zur weltweiten Papierproduktion sehr sehr kleinen Teil, der als Publikation gilt. Dafür existieren seit langem geeignete Selektionsmechanismen wie Bibliographien, Buchhandelskataloge usw. Analog verhält es sich mit dem Internet. Von den über 20 Millionen Webseiten, die es mittlerweile gibt, ist der überwiegende Teil unter der Rubrik Kommunikation abzuhaken und für Bibliotheken völlig irrelevant. Zwar steigt die Anzahl wissenschaftlicher Publikationen immer noch stetig, und ich will dieses Problem nicht verdrängen, doch die Zahl wissenschaftlicher Institutionen eines Faches, an denen Forschung betrieben wird, die Zahl der Fachverlage, die wissenschaftliche Arbeiten publizieren, ist immer noch begrenzt und meines Erachtens überschaubar. Und genau diese Einrichtungen bzw. die dort tätigen Wissenschaftler produzieren letztlich elektronische Fachinformationen, die auf entsprechenden Servern aufliegen.

Es geht also darum, um auf meinen Ausgangspunkt zurückzukommen, die thematischen Server dieser Einrichtungen zu recherchieren, auf ihren Inhalt und ihre Qualität hin zu prüfen und in einer standardisierten Form zu erfassen und über ein geeignetes System dem Nutzer diese Informationen zur Verfügung zu stellen.

Was ist nun ein thematischer Server? Was verstehen wir unter elektronischer Fachinformation? Unter Fachinformationen verstehen wir Informationen über Informationsressourcen, d.h. nicht primäre Informationen, den Text bzw. das Dokument selbst. In klassischer bibliothekarischer Terminologie erstellen wir also eine Bibliographie der Bibliographien. Das Fachinformationssystem ist ein Einstiegssystem für denjenigen, der wissen will, wo er Informationen zu seiner ihn interessierenden, spezifischen Fragestellung findet. Die Schwierigkeit, die sich stellt, ist dabei, daß thematische Server im Web in ihrer Struktur komplexer und vielschichtiger als gedruckte Fachinformationsquellen sind. Ein thematischer Server kann Literaturlisten oder eine fachbibliographische Datenbank zusammen mit elektronischen Texten umfassen, die ihrer Funktion nach einer wissenschaftlichen Publikation entsprechen, zugleich aber auch noch allgemeine Informationen zu Projekten, Personen, Adressverzeichnissen u.ä. enthalten, die eher temporären Informationscharakter haben. Dazu kommen noch die medientechnischen Unterschiede: Thematische Server werden laufend aktualisiert; sie können technische Strukturen beinhalten, die es bei gedruckten Medien nicht gibt, wie Verknüpfungen zu anderen Servern usw.

Eine Aufgabe des Projektes war es daher auch, nicht nur relevante thematische Server zu recherchieren und zu beschreiben, sondern auch Regeln und Konzepte zu entwickeln, wie thematische Server sinnvoll erfaßt und beschrieben werden können, so daß sie in die bibliothekarischen Dienste einer SSG-Bibliothek integriert werden können.

Da das primäre Ziel des SSG-FI-Projektes jedoch nicht darin bestand, Regeln für die Erfassung von Internetressourcen zu entwickeln, sondern ein konkretes, für den Nutzer praktikables und im Prinzip für alle SSG's anwendbares Konzept zur Erschließung und Nutzung von Fachinformationen zu realisieren, schien es uns notwendig, das SSG-FI-System nicht nur auf Internetressourcen zu beschränken, sondern generell alle Fachinformationsquellen, seien sie gedruckt, als CD-ROM oder im Internet publiziert, zu erfassen. Dahinter steht auch die Überlegung, daß vor allem im kulturwissenschaftlichen Bereich ein Fachinformationssystem, das sich nur auf elektronische Quellen bezieht, für den Nutzer nur ein eher peripheres, zusätzliches Informationshilfsmittel sein dürfte. Zusammen mit den einschlägigen gedruckten Hilfsmitteln kann es aber für ihn das primäre Einstiegsinstrument bei der Suche nach Informationsmitteln werden.

Auf der Basis dieser Überlegungen ergaben sich für das Projekt folgende konzeptionelle Leitlinien:

    - Das SSG-FI-System soll sowohl gedruckte als auch elektronische Fachinformationen umfassen, wobei im Rahmen des Projektes der Schwerpunkt auf die Erfassung elektronischer Internetressourcen gelegt wurde.

    - Es sollen im Rahmen eines SSG-FI-Systems nur sekundäre Fachinformationen erschlossen werden, also thematische Server, nicht aber einzelne elektronische Dokumente. Unter Fachinformation verstehen wir, ich wiederhole dies, Informationen über Informationsressourcen.

    - Die thematischen Server werden nach qualitativen Kriterien selektiert und bewertet. Es werden nicht pauschal alle thematisch einschlägigen Server erfaßt.

    - Das Projekt impliziert damit auch die Erarbeitung von Regeln, wie thematische Server erfaßt, beschrieben und bewertet werden sollen.

    - Das SSG-FI-System soll einen qualifizierten Überblick über vorhandene Informationsressourcen geben und damit auch eine Basis bilden für die ggf. notwendige automatisierte Erschließung elektronischer Primärdokumente. [s. zwei Seiten: Bibliothekare und wissenschaftliche Nutzer].

    - Es stellt damit zugleich eine zusätzliche SSG-Dienstleistung dar, eine Art „Bibliographie der Fachinformationsmittel", wie sie in der Regel von SSG-Bibliotheken bislang nicht angeboten wurden und ergänzt und komplettiert damit vorhandene SSG-Dienste.

    - Das Konzept für die Erfassung von Internetfachinformationen oder thematischen Servern soll nachnutzbar sein für andere SSG's, d.h. es soll konzeptionell so offen sein, daß heterogene Fachgebiete es nutzen können. Es soll auch keinerlei technische Einschränkungen in dem Sinne geben, daß bestimmte DV-Systeme eingesetzt werden müssen. Das wesentliche Ziel war die Erarbeitung einer Konzeption, die mit unterschiedlichen technischen Systemen realisiert werden kann.



Konkret wurden folgende Komponenten im Rahmen des Projektes entwickelt:

    - Eine Datenbankstruktur, also ein Datenformat zur Erfassung der Fachinformationen auf der Basis des Dublin Core Metadatenstandards.

    - Prototypisch wurde das SSG-FI-System auf der Basis von Allegro entwickelt, wobei prinzipiell jedes andere Datenbanksystem, das über eine http-Schnittstelle verfügt, verwendet werden kann.

    - Ein Sacherschließungskonzept auf der Basis von Fachklassifikationen, DDC-Notationen sowie verbalen, englischen Deskriptoren.

    - Ein Zugangssystem über einen WWW-Server, also konkret über HTML-Dateien, wobei wir für den Nutzer drei Einstiegsmöglichkeiten anbieten: Subject Guide, also Fachklassifikation, einen Formal Guide und eine lokale Search Engine.

    - Ein Konzept für eine verteilte Eingabe und Pflege des Systems über ein WWW-Formular.



Mit diesem Konzept versuchen wir natürlich auch strukturelle Fehler und Defizite derzeit bereits existierender sogenannter virtueller Bibliotheken zu vermeiden. Diese bestehen meines Erachtens u.a. in folgendem:

    - Es werden reine Linklisten angeboten, welche keine ausreichende Beschreibung der Ressource, auf die verwiesen wird, enthalten.

    - Die Linklisten oder virtuellen Bibliotheken haben kein inhaltliches Konzept für die Erfassung von Ressourcen. D.h. es werden Links zu allgemeinen Informationstexten, zu Projektbeschreibungen, zu anderen Linklisten ebenso behandelt wie Links zu Datenbanken oder Textarchiven.

    - Neben der formalen Differenzierung fehlt zumeist eine inhaltliche Bewertung.

    - Dazu werden zumeist die Daten nicht mit standardisierten Metadaten beschrieben.



Um abschließend nochmals das Konzept des SSG-FI-Systems zu verdeutlichen, will ich versuchen, seine Stellung und seine Funktion im Konzept einer virtuellen Fachbibliothek, wie sie derzeit grob im Rahmen der SUBITO 2 Arbeitsgruppe entworfen wird, zum umreißen. Dabei will ich betonen, daß es sich hier um ein sehr grobes, stark vereinfachendes Modell handelt, das die grundlegenden Komponenten und ihre wechselseitige Beziehung visualisieren soll. Detailprobleme sind dabei ausgeblendet. Das ganze hat in dieser Form vor allem heuristischen Charakter, um das Grundkonzept der virtuellen Fachbibliothek zu verdeutlichen.

Abb. 1: Konzept einer virtuellen Fachbibliothek

Konzept einer virtuellen Fachbibliothek



Bei einer virtuellen Fachbibliothek kann man grob zwei Ebenen unterscheiden: Die Dokumentebene, also die Ebene der eigentlichen Informationen, wobei der Begriff Dokument hier Informationen im weitesten Sinne umfaßt (auch z.B. Software, Bilder etc. - also „Informationseinheiten") [s. Detailbeschreibung]; und die Metadatenbene, also die nach bestimmten Regelen strukturierten Daten zur Beschreibung der Dokumente. Hier gibt es wiederum zwei Teilebenen: Diejenigen Datenbanken, die einzelne Dokumente beschreiben [s. Detailbeschreibung], und das Fachinformationssystem, das sekundäre Informationsressourcen beschreibt. Entscheidend ist die Verknüpfung dieser Systeme, die es erlaubt, diese für spezielle Fragen sowohl einzeln zu benutzen, als auch über einen Gesamtindex den gesamten Informationsraum mit einer Recherche abzufragen. [Gesichtspunkte: Datenformat (Metadatenstandard) und Schnittstelle (Z39.50)].

Ich will nicht weiter auf die Details und die damit zusammenhängenden Fragen und Probleme eingehen. Worauf es mir hier ankommt ist nur, Ihnen zu zeigen, daß das Fachinformationssystem, wie wir es in unserem Projekt konzipiert und realisiert haben, nur eine Komponente, ein Modul im Gesamtkonzept einer virtuellen oder digitalen Fachbibliothek ist; ein Modul mit einer spezifischen Funktion innnerhalb dieses Gesamtkonzepts.





[Letztmalige Aktualisierung: 22.01.1998 / cl]