SUB-Logo

Projekt SSG-Fachinformation (SSG-FI)



Das technische Konzept des SSG-FI Projektes



von Thomas Fischer



1. Allgemeines

2. Die Benutzersicht

3. Die Betreibersicht

4. Was ist das SSG-FI-System?

 

1. Allgemeines

Die Grundidee des SSG-FI-Systems besteht darin, daß fachspezifische Informationen zugänglich gemacht werden sollen, die

  • in Fachbüchern,
  • im Internet,
  • auf CD-ROM
vorliegen. Diese Informationsquellen sollen auf einheitliche Weise klassifiziert (erschlossen) werden, damit eine gemeinsame Zugriffsmöglichkeit geschaffen werden kann.

Je nach Fach können auch andere Bereiche erschlossen werden, z.B.

  • Filme,
  • Musik
  • etc.

Mit dem SSG-FI-System sollen zwei aktuelle Ideen verwirklicht werden:

  • Alle relevanten Informationsquellen sollen "an einem Ort" katalogisiert werden.
  • Die Informationen sollen den Benutzern so weit wie möglich direkt zur Verfügung gestellt werden.

Dieses System ist

  • offen für zukünftige Entwicklungen (höhere Datenübertragungsrate, direkter Zugriff auf weitere Datenträger) und kann somit als ein Baustein für eine Virtuelle Bibliothek gelten,
  • über Internet allgemein zugänglich.

Warum Internet?

Das Internet hat sich in den letzten Jahren zu dem zentralen digitalen Kommunikationsmedium entwickelt, mit dem Post verschickt, Informationen gesucht und gefunden, eigene Informationen veröffentlicht werden. Für das SSG-FI-System bietet das Internet wesentliche Vorteile, die kein anderes Medium besitzt.

  • Das Internet ist allgemein zugänglich, vom Büro und von zu Hause, aus Deutschland und der ganzen Welt.
  • Das Internet ist unabhängig vom benutzen Rechnertyp, ob UNIX, WINDOWS, Macintosh, Amiga oder Cray: (fast) alle Rechnertypen können auf das Internet zugreifen, und für (fast) alle Programme auf diesen Rechnern stellen sich diese Dokumente auf die gleiche Weise dar.
  • Das Internet ist komfortabel: gefundene Dateien könne auf dem eigenen Rechner abgelegt und weiter benutzt werden, es gibt Such- und Kommunikationssysteme.

 

2. Die Benutzersicht

Die Struktur des SSG-FI-Systems ist hierarchisch gegliedert und möglichst flach gehalten. Zunächst ist das gewünschte Fach auf der Homepage des SSG-FI-Projektes auszuwählen. Hier stehen eventuell auch allgemeine Systeminformationen zur Verfügung, die aber zur eigentlichen Benutzung nicht wichtig sind. Dies ist die globale Auswahl:

Globalstruktur

Jeder Einzelbereich ist intern wieder auf die gleiche Weise gegliedert, so daß sich in der lokalen Auswahl immer die drei Möglichkeiten des Einstiegs über die Sachstruktur des Faches, die formale Beschreibung der Informationsquelle und die (freie) Suche bieten:

Lokalstruktur

Da gleichzeitig die Quellentypen Internet, CD-ROM und Buch unterschieden werden, ergibt sich eine mehrdimensionale Datenstruktur:

Zwei Dimensionen, drei Schichten

 

Drei Zugriffe:

  • allgemeine Suche
  • Formale Klassifizierung
  • Thematische Klassifizierung

Derzeit drei Schichten:

  • Internet (online)
  • CD-ROM (offline)
  • Bücher (printed)

Das SSG-FI-Projekt befindet sich noch in der Entwicklung. Für die verschiedenen Zugriffsweisen treten noch spezifische Probleme auf, die einerseits gelöst werden sollen, andererseits aber auch konzeptionellen Schwierigkeiten geschuldet sind, die die Komplexität der Materie widerspiegeln.


Suche:
Die Suche muß technisch verbessert werden, insbesondere soll der gezielte Zugriff auf einzelne Kategorien des SSG-FI-Systems ermöglicht werden. Durch die Beschreibung der Informationsquellen mit Metadaten ist das System darauf vorbereitet, nur die Suchmaschine ist noch nicht darauf eingestellt. Technisch gesehen ist die Änderung problemlos.

Thematisch:
Jedes Fach muß seinen eigenen fachspezifischen Katalog entwickeln. Für einige Fächer (z.B. Reine Mathematik) gibt es international einheitliche Klassifikationen, die allgemein akzeptiert sind, für andere Fächer gibt es mehrere Klassifikationen, die nicht alle Bereiche abdecken oder nur nationale oder lokale Bedeutung haben. So stellen sich bei dem Aufbau eines neuen Fachinformationssystems immer mehr oder weniger große Probleme einer einheitlichen Klassifikation.

Formal:
Die Formalklassifikation erweist sich als schwierig, da sie für die sehr unterschiedlichen Quellentypen einheitlich sein soll. Dadurch ergeben sich verschiedene Probleme:
  1. Die gleichen Kategorien können in den verschiedenen Quellenbereichen unterschiedliche Bedeutungen haben (was ist z.B. das Analogon eines biographischen Werkes in der Welt des Internet oder der CD-ROMs?).
  2. Es gibt Kategorien, die für einen Quellentyp charakteristisch sind und bei den anderen Quellentypen nicht auftreten oder kein rechtes Analogon haben (z.B. der Server eines Fachbereiches im Internet).
  3. Die verschiedenen Kategorien kommen bei den verschiedenen Quellentypen mit sehr unterschiedlicher Häufigkeit vor, so daß sich die Mehrzahl der Dokumente eines Types in einigen wenigen Kategorien finden.
Daher könnte eine Überarbeitung der Formalklassifikation nochmals notwendig werden, wenn CD-ROMs und Bücher in größerem Umfang erfaßt worden sind.

 

3. Die Betreibersicht

Die Daten des SSG-FI-Systems werden von dem Betreiber gesammelt und verwaltet, d.h. derzeit von der Projektarbeitsgruppe an der SUB Göttingen. Für die Sammlung der Daten wurden etwa 50 Kategorien erstellt, mit denen die Grunddaten der Informationsquellen und die Zusatzinformationen wie Beschreibung, Klassifikation und Bewertung erfaßt werden. Zur effektiven Verwaltung werden diese Daten in einer Datenbank gesammelt und aus der Datenbank heraus in das Internet exportiert. Derzeit wird zu diesem Zweck mit einer Allegro V15-Datenbank gearbeitet, aus der die Daten in feste HTML-Dokumente übersetzt werden; für die Zukunft ist an eine dynamische Erzeugung der Dateien direkt aus der Datenbank gedacht.

Der Eintrag der Daten in die Datenbank ist auf mehreren Wegen möglich.

Eingabe und Ausgabe


1. Direkteintrag in die Allegro-Datenbankdatei
Dies hat den Vorteil, daß die Suchfunktionen der Datenbank direkt zur Verfügung stehen und z.B. ein Abgleich möglich ist, ob eine Quelle schon einmal beschrieben wurde. Durch die verschiedenen Register können verschiedene Blicke auf die Datenbank geworfen werden und die Daten so besser kontrolliert werden. Für die Verwaltung der Datenbank ist diese Bearbeitungsweise unverzichtbar.
Der Nachteil ist, daß Allegro als MS-DOS-basiertes System einiges an Komfort zu wünschen übrig läßt (z.B. das Hineinkopieren von mehrzeiligen Texten nicht möglich ist) und auch keine zusätzlichen Unterstützungsfunktionen (z.B. Rechtschreibprüfung) bietet.

2. Eingabe als strukturierte Textdatei
Die Kategorien werden absatzweise eingetragen: erst die Nummer der Kategorie, dann der Inhalt. Dies hat den Vorteil, daß das Textverarbeitungsprogramm frei gewählt werden kann, z.B. ein komfortables Programm wie Word mit Rechtschreibprüfung und umfangreichen Makro-Funktionen.
Andererseits bringt die freie Eingabe der Kategorienummern die Gefahr von Verwechslungen oder Verwirrungen mit sich. Ein weiterer Nachteil ist, daß nicht die ganze Datenbank überschaut wird, und leicht Doppeleinträge möglich sind, wenn keine zusätzlichen Maßnahmen getroffen werden.

3. Eingabe in ein HTML-Formular
Hier wird ein umfangreiches Formular zur Verfügung gestellt, in das die Kategorien eingetragen werden. Da das Formular eindeutig beschriftet ist, sind Fehleinträge unwahrscheinlich, darüber hinaus können einige Einträge durch die Auswahl aus vorgegebenen Listen ersetzt werden, was die Datensicherheit weiter erhöht. Diese Form des Eintrags ist außerdem nicht ortsgebunden: Über das Internet kann das Formular jeder/m angeboten werden, die/der einen Beitrag zum SSG-FI-Projekt leisten will. Natürlich erfordert das auch zusätzlichen Verwaltungsaufwand für die Kontrolle und Integration der Daten.
Wie bei der zweite Methode ist ein Problem, daß nicht die ganze Datenbank überschaut wird und leicht Doppeleinträge möglich sind.

Insgesamt ist es nötig, eine effektive Verwaltung zu implementieren, die sichert, daß die Einträge eindeutig, zuverlässig und aktuell sind. Die Methoden 2 und 3 erfordern den Import in die Datenbank, und damit auch Entscheidungen darüber, wer was in der Datenbank eintragen und ändern darf.

 

4. Was ist das SSG-FI-System?

Zusammenfassend sollen die Komponenten des SSG-FI-Systems beschrieben werden, wie sie für andere Fächer zur Übernahme bereit gestellt werden. Das SSG-FI-System besteht aus einer fachspezifischen Liste (einem "Subject Guide" für jedes Fach) und den folgenden gemeinsamen Komponenten:

Ein Satz Formalkategorien (ca. 50 Kategorien des Fomal Guide):
Dies ist die Liste der allgemeinen Kategorien, mit denen Internet-Quellen, CD-ROMs und Bücher klassifiziert werden. Diese Liste gilt fachübergreifend und sollte einheitlich für alle SSG-FI-Bereiche benutzt werden. Eventuelle Veränderungen sollten immer für alle Benutzer dieser Liste gemeinsam durchgeführt werden.

Ein Satz Metadaten (ca. 40 Daten, zum größten Teil an Dublin Core angelehnt):
Dies ist die Liste der Kategorien, mit denen die Internet-Quellen, CD-ROMs und Bücher beschrieben werden. Diese Liste wird zwar intern benutzt und erst durch den Export ins Internet öffentlich, sie sollte aber fachübergreifend und einheitlich für alle SSG-FI-Bereiche sein. Eventuell sind einzelne interne Sonderkategorien zur Datenverwaltung möglich, es sollte (insbesondere zur Minimierung des Betreuungsaufwandes) aber eine gemeinsame Liste bleiben.

Eine gemeinsame Plattform (HTML/Internet):
Die einheitliche Zugriffsmöglichkeit des Internet erledigt Probleme wie die Wahl eines Computersystems oder der Datenkonvertierung. Während die Daten bei der SUB Göttingen unter Windows95 erfaßt und auf einen WWW-Server unter LINUX veröffentlicht werden, kann jeder Betreiber eines SSG-FI-System selbst entscheiden, auf welchem Betriebssystem mit welcher Datenbank die Informationen verwaltet werden, und wie sie der Netz-Öffentlichkeit zur Verfügung gestellt werden.

Ein einheitlicher Rahmen, in dem verschieden Sondersammelgebiete kooperieren können:
Die einheitlichen Kategorien des SSG-FI-Systems liefern eine gemeinsame Struktur für verschiedene Fächer, die die fachübergreifende Informationssuche erleichtert. Die Verknüpfung der Daten über die nach Fach bzw. Themen geordneten Verteiler und die Wahlmöglichkeit, auf die Datenquelle oder die Beschreibung zuzugreifen, sind für alle Systeme gleich. Diese gemeinsame Daten- und Oberflächenstruktur ermöglicht die reibungslose Integration verschiedener Fachinformationsführer in einem System.

Auf die Dauer können so durch gleichgerichtete Aktivitäten Datenbanken für die verschiedenen Sondersammelgebiete aufgebaut werden, die fachübergreifend für die wissenschaftliche Nutzung zur Verfügung stehen und durch den einheitlichen Aufbau als ein Gesamtsystem wirken.

Datenbanken im SSG-FI-System




[Letztmalige Aktualisierung: 29.01.1998 / cl]