Projekt SSG-Fachinformation (SSG-FI)
Das technische Konzept des SSG-FI Projektes
von Thomas Fischer
1. Allgemeines
Die Grundidee des SSG-FI-Systems besteht darin, daß fachspezifische
Informationen zugänglich gemacht werden sollen, die
- in Fachbüchern,
- im Internet,
- auf CD-ROM
vorliegen. Diese Informationsquellen sollen auf einheitliche Weise klassifiziert
(erschlossen) werden, damit eine gemeinsame Zugriffsmöglichkeit geschaffen
werden kann.
Je nach Fach können auch andere Bereiche erschlossen werden, z.B.
Mit dem SSG-FI-System sollen zwei aktuelle Ideen verwirklicht werden:
- Alle relevanten Informationsquellen sollen "an einem Ort"
katalogisiert werden.
- Die Informationen sollen den Benutzern so weit wie möglich direkt
zur Verfügung gestellt werden.
Dieses System ist
- offen für zukünftige Entwicklungen (höhere Datenübertragungsrate,
direkter Zugriff auf weitere Datenträger) und kann somit als ein Baustein
für eine Virtuelle Bibliothek gelten,
- über Internet allgemein zugänglich.
Warum Internet?
Das Internet hat sich in den letzten Jahren zu dem zentralen digitalen
Kommunikationsmedium entwickelt, mit dem Post verschickt, Informationen
gesucht und gefunden, eigene Informationen veröffentlicht werden.
Für das SSG-FI-System bietet das Internet wesentliche Vorteile, die
kein anderes Medium besitzt.
- Das Internet ist allgemein zugänglich, vom Büro und von zu
Hause, aus Deutschland und der ganzen Welt.
- Das Internet ist unabhängig vom benutzen Rechnertyp, ob UNIX,
WINDOWS, Macintosh, Amiga oder Cray: (fast) alle Rechnertypen können
auf das Internet zugreifen, und für (fast) alle Programme auf diesen
Rechnern stellen sich diese Dokumente auf die gleiche Weise dar.
- Das Internet ist komfortabel: gefundene Dateien könne auf dem
eigenen Rechner abgelegt und weiter benutzt werden, es gibt Such- und Kommunikationssysteme.
2. Die Benutzersicht
Die Struktur des SSG-FI-Systems ist hierarchisch gegliedert und möglichst
flach gehalten. Zunächst ist das gewünschte Fach auf der Homepage
des SSG-FI-Projektes auszuwählen. Hier stehen eventuell auch allgemeine
Systeminformationen zur Verfügung, die aber zur eigentlichen Benutzung
nicht wichtig sind. Dies ist die globale Auswahl:
Jeder Einzelbereich ist intern wieder auf die gleiche Weise gegliedert,
so daß sich in der lokalen Auswahl immer die drei Möglichkeiten
des Einstiegs über die Sachstruktur des Faches, die formale Beschreibung
der Informationsquelle und die (freie) Suche bieten:
Da gleichzeitig die Quellentypen Internet, CD-ROM und Buch unterschieden
werden, ergibt sich eine mehrdimensionale Datenstruktur:
Drei Zugriffe:
- allgemeine Suche
- Formale Klassifizierung
- Thematische Klassifizierung
Derzeit drei Schichten:
- Internet (online)
- CD-ROM (offline)
- Bücher (printed)
Das SSG-FI-Projekt befindet sich noch in der Entwicklung. Für die
verschiedenen Zugriffsweisen treten noch spezifische Probleme auf, die einerseits
gelöst werden sollen, andererseits aber auch konzeptionellen Schwierigkeiten
geschuldet sind, die die Komplexität der Materie widerspiegeln.
Suche:
- Die Suche muß technisch verbessert werden, insbesondere soll
der gezielte Zugriff auf einzelne Kategorien des SSG-FI-Systems ermöglicht
werden. Durch die Beschreibung der Informationsquellen mit Metadaten ist
das System darauf vorbereitet, nur die Suchmaschine ist noch nicht darauf
eingestellt. Technisch gesehen ist die Änderung problemlos.
Thematisch:
- Jedes Fach muß seinen eigenen fachspezifischen Katalog entwickeln.
Für einige Fächer (z.B. Reine Mathematik) gibt es international
einheitliche Klassifikationen, die allgemein akzeptiert sind, für
andere Fächer gibt es mehrere Klassifikationen, die nicht alle Bereiche
abdecken oder nur nationale oder lokale Bedeutung haben. So stellen sich
bei dem Aufbau eines neuen Fachinformationssystems immer mehr oder weniger
große Probleme einer einheitlichen Klassifikation.
Formal:
- Die Formalklassifikation erweist sich als schwierig, da sie für
die sehr unterschiedlichen Quellentypen einheitlich sein soll.
Dadurch ergeben sich verschiedene Probleme:
- Die gleichen Kategorien können in den verschiedenen Quellenbereichen unterschiedliche
Bedeutungen haben (was ist z.B. das Analogon eines biographischen Werkes in der
Welt des Internet oder der CD-ROMs?).
- Es gibt Kategorien, die für einen Quellentyp charakteristisch sind und bei den
anderen Quellentypen nicht auftreten oder kein rechtes Analogon haben
(z.B. der Server eines Fachbereiches im Internet).
- Die verschiedenen Kategorien kommen bei den verschiedenen Quellentypen
mit sehr unterschiedlicher Häufigkeit vor, so daß sich die Mehrzahl der Dokumente eines Types
in einigen wenigen Kategorien finden.
- Daher könnte eine Überarbeitung der Formalklassifikation nochmals notwendig werden,
wenn CD-ROMs und Bücher in größerem Umfang erfaßt worden sind.
3. Die Betreibersicht
Die Daten des SSG-FI-Systems werden von dem Betreiber gesammelt und
verwaltet, d.h. derzeit von der Projektarbeitsgruppe an der SUB Göttingen.
Für die Sammlung der Daten wurden etwa 50 Kategorien erstellt, mit
denen die Grunddaten der Informationsquellen und die Zusatzinformationen
wie Beschreibung, Klassifikation und Bewertung erfaßt werden. Zur
effektiven Verwaltung werden diese Daten in einer Datenbank gesammelt und
aus der Datenbank heraus in das Internet exportiert. Derzeit wird zu diesem
Zweck mit einer Allegro V15-Datenbank gearbeitet, aus der die Daten
in feste HTML-Dokumente übersetzt werden; für die Zukunft ist
an eine dynamische Erzeugung der Dateien direkt aus der Datenbank gedacht.
Der Eintrag der Daten in die Datenbank ist auf mehreren Wegen möglich.
1. Direkteintrag in die Allegro-Datenbankdatei
- Dies hat den Vorteil, daß die Suchfunktionen der Datenbank direkt
zur Verfügung stehen und z.B. ein Abgleich möglich ist, ob eine
Quelle schon einmal beschrieben wurde. Durch die verschiedenen Register
können verschiedene Blicke auf die Datenbank geworfen werden und
die Daten so besser kontrolliert werden.
Für die Verwaltung der Datenbank
ist diese Bearbeitungsweise unverzichtbar.
- Der Nachteil ist, daß Allegro als MS-DOS-basiertes System
einiges an Komfort zu wünschen übrig läßt (z.B. das
Hineinkopieren von mehrzeiligen Texten nicht möglich ist) und auch
keine zusätzlichen Unterstützungsfunktionen (z.B. Rechtschreibprüfung)
bietet.
2. Eingabe als strukturierte Textdatei
- Die Kategorien werden absatzweise eingetragen: erst die Nummer der
Kategorie, dann der Inhalt. Dies hat den Vorteil, daß das Textverarbeitungsprogramm
frei gewählt werden kann, z.B. ein komfortables Programm wie Word
mit Rechtschreibprüfung und umfangreichen Makro-Funktionen.
- Andererseits bringt die freie Eingabe der Kategorienummern die Gefahr
von Verwechslungen oder Verwirrungen mit sich. Ein weiterer Nachteil ist, daß nicht
die ganze Datenbank überschaut wird, und leicht Doppeleinträge möglich sind,
wenn keine zusätzlichen Maßnahmen getroffen werden.
3. Eingabe in ein HTML-Formular
- Hier wird ein umfangreiches Formular zur Verfügung gestellt, in
das die Kategorien eingetragen werden. Da das Formular eindeutig beschriftet
ist, sind Fehleinträge unwahrscheinlich, darüber hinaus können
einige Einträge durch die Auswahl aus vorgegebenen Listen ersetzt
werden, was die Datensicherheit weiter erhöht. Diese Form des Eintrags
ist außerdem nicht ortsgebunden: Über das Internet kann das
Formular jeder/m angeboten werden, die/der einen Beitrag zum SSG-FI-Projekt
leisten will. Natürlich erfordert das auch zusätzlichen Verwaltungsaufwand
für die Kontrolle und Integration der Daten.
- Wie bei der zweite Methode ist ein Problem, daß nicht die ganze
Datenbank überschaut wird und leicht Doppeleinträge möglich
sind.
Insgesamt ist es nötig, eine effektive Verwaltung zu implementieren,
die sichert, daß die Einträge eindeutig, zuverlässig und
aktuell sind. Die Methoden 2 und 3 erfordern den Import in die Datenbank,
und damit auch Entscheidungen darüber, wer was in der Datenbank eintragen und
ändern darf.
4. Was ist das SSG-FI-System?
Zusammenfassend sollen die Komponenten des SSG-FI-Systems beschrieben
werden, wie sie für andere Fächer zur Übernahme bereit gestellt
werden. Das SSG-FI-System besteht aus einer fachspezifischen Liste (einem
"Subject Guide" für jedes Fach) und den folgenden gemeinsamen
Komponenten:
- Ein Satz Formalkategorien (ca. 50 Kategorien des Fomal Guide):
- Dies ist die Liste der allgemeinen Kategorien, mit denen Internet-Quellen,
CD-ROMs und Bücher klassifiziert werden. Diese Liste gilt fachübergreifend
und sollte einheitlich für alle SSG-FI-Bereiche benutzt werden. Eventuelle
Veränderungen sollten immer für alle Benutzer dieser Liste gemeinsam
durchgeführt werden.
Ein Satz Metadaten (ca. 40 Daten, zum größten Teil an Dublin
Core angelehnt):
- Dies ist die Liste der Kategorien, mit denen die Internet-Quellen,
CD-ROMs und Bücher beschrieben werden. Diese Liste wird zwar intern
benutzt und erst durch den Export ins Internet öffentlich, sie sollte
aber fachübergreifend und einheitlich für alle SSG-FI-Bereiche
sein. Eventuell sind einzelne interne Sonderkategorien zur Datenverwaltung
möglich, es sollte (insbesondere zur Minimierung des Betreuungsaufwandes)
aber eine gemeinsame Liste bleiben.
Eine gemeinsame Plattform (HTML/Internet):
- Die einheitliche Zugriffsmöglichkeit des Internet erledigt Probleme
wie die Wahl eines Computersystems oder der Datenkonvertierung. Während
die Daten bei der SUB Göttingen unter Windows95 erfaßt und auf
einen WWW-Server unter LINUX veröffentlicht werden, kann jeder Betreiber
eines SSG-FI-System selbst entscheiden, auf welchem Betriebssystem mit
welcher Datenbank die Informationen verwaltet werden, und wie sie der Netz-Öffentlichkeit
zur Verfügung gestellt werden.
Ein einheitlicher Rahmen, in dem verschieden Sondersammelgebiete kooperieren
können:
- Die einheitlichen Kategorien des SSG-FI-Systems liefern eine gemeinsame
Struktur für verschiedene Fächer, die die fachübergreifende
Informationssuche erleichtert. Die Verknüpfung der Daten über
die nach Fach bzw. Themen geordneten Verteiler und die Wahlmöglichkeit,
auf die Datenquelle oder die Beschreibung zuzugreifen, sind für
alle Systeme gleich. Diese gemeinsame Daten- und Oberflächenstruktur
ermöglicht die reibungslose Integration verschiedener Fachinformationsführer
in einem System.
Auf die Dauer können so durch gleichgerichtete Aktivitäten
Datenbanken für die verschiedenen Sondersammelgebiete aufgebaut werden,
die fachübergreifend für die wissenschaftliche Nutzung zur Verfügung stehen und
durch den einheitlichen Aufbau als ein Gesamtsystem wirken.
[Letztmalige Aktualisierung: 29.01.1998 / cl]
|