To
the homepage of Prof. Dr. Walther Umstätter
To the publicationlist 1970
- 1985: - / -
To the publicationlist
1986 - 1990: - / -
To the
publicationlist 1996 - 2000:
Published in: ABI-Technik 11 (4) S.277-288 (1991)
Abstract:
Isn't it time to give information technology the proper consideration for library subject cataloguing ? A word to the RSWK.
Millions of Deutschmarks are offered every year for
a planned utopia of a universal thesaurus, created by the RSWK
(rules for subject cataloguing) - A subject cataloguing
system which is still prepared for printed catalogues. Instead
of a better depth indexing, many librarians are compelled to spend
time and money for old fashioned intellectual work, coordination,
and a strange discussion about the narrowness of terms. As
a result: We find only 0.35 keywords per record
from RSWK which are helpful by searching the CD-ROM version
of BIBLIODATA, and unspecific terms like biology or human
are used as keywords. In consequence, roughly 90%
of all hits has to be retrieved
by free text searching in the titles. At the
same time we have in many
libraries a great lack of common
experience, knowledge and investigation in indexing online accessible
databases, created by librarians, and whole books can be
found only by a maximum of five topics.Real modern information
technology is commonly available and should be adopted by at least
some libraries now.
Doch im Gegenteil, es wird einfach behauptet, die RSWK "sind für
EDV-gestützte Kataloge geeignet (auch für Online-Recherchen),
was bei älteren Regelwerken naturgemäß nicht zu
erwarten ist." (1). An welcher Stelle allerdings sich die RSWK bei
Online-Recherchen in der DB als besonders geeignet
erwiesen hätte, war bisher schwer zu zeigen.
Die hier gefundenen Beispiele an der CD-ROM-Version
belegen eher erneut das Gegenteil. Bemerkenswert ist
auch die Tatsache, daß z.B. die Spitzen Klammern als
Sonderzeichen für Homonymenzusätze bei der
Druckausgabe durchaus hilfreich sein können. Daß
sie für das "range searching" oft bedeutungsvoll sind, wurde vermutlich
kaum bedacht. Es ist also schon heute bei der Aufbereitung
von RSWK-Ketten für manche Datenbanksoftware sinnvoll,
diese störenden Element als erstes zu beseitigen, um ein leistungsfähiges
Retrieval zu ermöglichen.
Um die Modernität zu untermauern, wird mit Stolz darauf
verwiesen, daß eine 40%ige Steigerung der
Permutationsmöglichkeiten gegenüber den älteren Katalogen
erreicht wird. Diese Möglichkeit verdanken wir natürlich
nichtzuletzt der Miniaturisierung der herkömmlichen Papierform
bei den COM-Katalogen. Mit Online hat das nichts zu tun und darauf,
daß man in "Bibliotheken mit konventionellen präkombinierten
Schlagwortkatalogen" andere Regeln
und andere Dienstleistungen anbieten muß"
als bei Online-Katalogen, hat kürzlich Gödert(2)
erneut hingewiesen.
Berücksichtigt man dazu die Entwicklungen neuronaler Backpropagation-Netze, wie sie Rumelhart, Hinton und Williams beschrieben haben, oder die z.Z. so moderne Fuzzy Logic und ihre Möglichkeiten im Erkennen von Zeichenketten und Mustern, so wird immer deutlicher, daß digitalisierte Information Erschließungsmittel anbietet, die vom jeweiligen Retrievalsystem abhängen und die vor einigen Jahren noch kaum vorstellbar waren.
Angesichts dieser Entwicklung muß man davon ausgehen, daß das Frei- und Volltextretrieval auf eigenen Microcomputern mit CD-ROMs und CD-PROMs, ebenso wie die Verarbeitung von Bildern und der Einsatz von Multimedia, in den nächsten Jahren ihren Aufschwung nehmen werden.
Sieht man daneben, daß das ESPRIT-unterstützte
dänische Projekt MOHAWC(4), an dem u.a. Anneliese Mark Pejtersen mitarbeitet,
sich anschickt, die Suche nach belletristischen Büchern in einer
Öffentlichen Bücherei durch Icons zu erleichtern, so wird auch
hier der wachsende Einsatz grafischer Möglichkeiten bei den
modernen Rechnern deutlich. Ein Beispiel dafür,
daß man nicht nur nach Stich- oder Schlagworten suchen
kann, sondern auch die Möglichkeit hat ein Buch zu suchen
von dem man nur noch weiß, daß es blau
war und eine Möwe seinen Umschlag zierte, ist BOOKHOUSE,
das in der Hjortespring Bibliothek in Kopenhagen getestet wird.
In diesem System besteht auch die Möglichkeit aus 3500
von insgesamt 6000 Büchern der Bibliothek diejenigen
herauszufinden,
die mit einem bereits bekannten Buch ?hnlichkeit haben.
Während bei BOOKHOUSE noch recht primitiv gezeichnete
Bilder und Icons die Grafik ausmachen, ist es beim Apple
Macintosh mit seinem HyperCard Programm ohne größere Programmierkenntnisse
möglich die eigene Bibliothek, ihre Regale und Kataloge
abzufotografieren, diese Bilder einzuscannen und über
sog. Buttons auf Mausklick nach ihrem Informationsgehalt zu
indexen bzw. abzufragen. Seit
einigen Jahren werden aus den relativ "dummen" OPAC-Systemen
der ersten und zweiten
Generation sog. intelligente
Benutzerschnittstellen und Suchmethoden entwickelt(5)
Nun behauptet Haller(6): "Es wird die totale Freitextsuche als ideale Lösung beschworen, gleichzeitig aber werden das Antwortverhalten des Computers und die übergroße Trefferquote bemängelt." Hier kann eigentlich nur auf veraltete, unzureichend programmierte oder falsch eingesetzte Rechner Bezug genommen worden sein. Wobei allerdings nicht geleugnet werden soll, daß die Aussage Hallers z.T. die Rechnerlandschaft des real existierenden Bibliothekswesen widerspiegelt.
Mit Recht hat der Wissenschaftsrat(7) darauf hingewiesen, daß in den Hochschulbibliotheken Maschinen für die Ausleihe eingesetzt werden, deren technischer Stand der zweiten Hälfte der 70er Jahre entspricht. Und das Fachinformationsprogramm der Bundesregierung 1990-1994 spricht sogar von den hohen Kosten für die Volkswirtschaft durch einen unwirtschaftlichen Suchprozeß und durch nicht genutztes Wissen in Bibliotheken.
Betrachtet man die Möglichkeiten des Online-Retrievals, so wie
es uns außerhalb der Bibliotheken zur Verfügung steht,
so haben wir im allgemeinen weder Probleme mit dem Freitextretrieval
noch mit dem Antwortverhalten. Im Gegenteil, wir haben gelernt, daß
diese Systeme durch ihre tiefere Erschließung den
bibliothekarischen Katalogen so weit überlegen
sind, daß sich eine Diskussion hierrüber
eigentlich erübrigt. Trotzdem wäre es abwegig
dies
als "ideale Lösung" zu bezeichnen, da wir inzwischen
zunehmend gute Erfahrungen mit dem Volltextretrieval im Onlinezugriff
und auf CD-ROM machen, und dies obwohl wir
noch weit von einer optimalen Lösung der damit verbundenen
Probleme entfernt sind.
Wir können schon heute ein elektronisches Lexikon dazu benutzen,
um uns, wie in einer Art Suchwortliste für das Volltextretrieval,
wichtige Wortstämme ausgeben zu lassen. So
wird es wohl nicht allzulange dauern, bis hierfür spezielle
Recherche-Deskriptorenlisten auf eigenen Rechnern zur Verfügung stehen.
Im Prinzip ist
dies nichts anderes, als die maschinengerechte
Umkehrung des RSWK-Gedankens, bei der Schlagwortvergabe auf lexikalische
Benennungen zurückzugreifen.
Unbeeinflußt von dieser Tatsache kann man
in erster Näherung durchaus davon ausgehen, daß
ein dickes Buch mehr Information enthält als ein dünnes.
Man kann in Grenzen darauf vertrauen, daß ein Herausgeber
auf Qualität achtet und daß er Etikettenschwindel,
in dem er z.B. ein Bilderbuch als Atlas deklariert,
vermeidet, um seinen Namen zu wahren. Aus solchen
Gründen sind formale Angaben, wie die Seitenzahl, das Format und die
Bebilde-
rung oder auch Begriffe wie Aufsatzsammlung, Einführung,
Wörterbuch, Enzyklopädie oder Schulbuch hilfreiche
Ergänzungen der Sacherschließung.
Ein Bibliotheksbenutzer, der im Katalog unter dem Begriff Orthogenese
nichts findet, wird automatisch zu dem weiteren Begriff
Evolution ausweichen, und im Falle, daß er
dort nicht fündig wird, unter Biologie ein
Nachschlagewerk suchen. Im Notfall greift er sogar zur
Allgemeinenzyklopädie, vorausgesetzt, sie
ist umfangreich genug. Sacherschließung ist also,
wie bereits Karen Spark Jones 1972(8) deutlich machte,
von der Größe der Dokumentensammlung abhängig
und hier liegt einer der Kritikpunkte hinsichtlich der RSWK
mit ihrem sogenannten engen Schlagwort, dessen ?quivalenzklassengröße
kaum kontrollierbar ist.
In der Sacherschließung mit Thesauri benutzt man sinnvollerweise
immer den Deskriptor, der dem Dokument (nach der
Terminologie der Information und Dokumentation leider als Dokumentarische
Bezugseinheit oder DBE bezeichnet) am nächsten kommt. Wird also ein
spezieller Gipfel der Ostalpen in einem Dokument beschrieben, so
kann der eine Thesaurus in seiner Indexierungsspezifität
alle diese Gipfel einzeln enthalten, ein zweiter mag bei den Ostalpen,
ein dritter bei den Alpen und ein vierter bei der Benennung
Gebirge enden. Dabei spielt natürlich auch die Indexierungsbreite
eine Rolle, die im Bibliotheksbereich meist so gering
ist, daß man froh sein kann, wenn überhaupt noch ein zweites
oder drittes Sachschlagwort vergeben wurde. Allein diese
Tatsache verbietet
schon das angestrebte enge Schlagwort für
Bibliotheken unterschiedlicher Größe.
Es ist nicht schwer einzusehen, daß unter dem Aspekt der
Sacherschließung ein Begriff als um so weiter angesehen
werden muß, je mehr verschiedene Unterbegriffe er einschließt.
Faßt man im obigen Beispiel also, alle Dokumente die unter
Bernina, Ortler, Marmolada, ... jeweils geindext waren, in der RSWK unter
Ostalpen zusammen, so läßt sich die
Begriffsweite, für das Dokumentationssystem als
Bezugsgröße, grob an der Zahl der subsummierten
Dokumente ablesen. Umgekehrt geht damit natürlich auch
eine zunehmende Begriffsunbestimmtheit einher. Konnte der Nutzer
also anfangs noch Bernina, Ortler oder Marmolada
dem Buch jeweils zuordnen, so müßte er unter
dem Begriff Alpen, die Dokumente einzeln auf Relevanz
prüfen. Aus dieser sberlegung ergibt sich
in erster Näherung eine Art Informationserhaltungsgesetz,
W = Weite eines Deskriptors
K = Konstante
U = Zahl der Unterbegriffe
W (Je weiter der
Deskriptor, desto mehr Dokumente sollte
K = ----- er auch repräsentieren, und somit ist U der
einge-
U schlossenen
Dokumentenzahl D proportional.)
W = K x D
das u.a. besagt, daß die Indexierung, nicht
wie oft fälschlich behauptet eine Informationskompression vornimmt,
sondern lediglich eine Abstraktion. Mit dem Zugewinn
an Unterbegriffen geht also automatisch ein Verlust
an Aussagespezifität verloren. Indexierungsbegriffe weisen
auf einige ausgewählte Aspekte eines
Buches hin, von denen der Indexierer annimmt, daß
sie für den Nutzer von Bedeutung sind und vernachlässigt
alle anderen. Je weiter daher das Begriffsspektrum eines
Deskriptors ist, desto mehr Aspekte eines Buches können
damit berücksichtigt werden. Desto größer ist allerdings
auch die Gefahr, daß damit Elemente Eingeschlossen sind, die
im Buch nicht mit abgedeckt werden.
Nun wäre es aber theoretisch möglich, daß sich
unter dem Begriff Ostalpen nicht 10 Bücher über 10
verschiedene Berge und Städte der Ostalpen verbergen, sondern beispielsweise
5 über Bozen und 5 über den Bernina. Nach der Informationstheorie
wäre in diesem Falle also der Mittlere Informationsgehalt
H für diese groben Randbedingungen eines subsumierenden Deskriptors
H = S pn x ld 1/pn
pn = Wahrscheinlichkeit des Wortes n aus einer Grundgesamtheit
ld = Logarithmus Dualis
wesentlich geringer, als es der Deskriptor erwarten läßt.
Beispiel 1: H1 = 10 x (1/10 x ld 10)
= 3,32 Bit
Beispiel 2: H2 = (1/2 x ld 2) + (1/2 x ld 2) = 1
Bit
Daß damit natürlich nichts über den Informationsgehalt
der Bücher selbst gesagt ist, über Qualität,
Umfang oder Inhalt, ist klar.
Unsere Formel macht hier lediglich eine Aussage über den Informationsgehalt
in diesem Unterbereich eines angenommenen Thesaurus.
Für den Rechercheur zeigt sich, die Einschätzung der
Informationsausbeute aufgrund der bedingten Wahrscheinlichkeit,
mit der bestimmte Dokumente unter einem Deskriptor zutage gefördert
werden. Er schlußfolgert also, mit anderen Worten,
aus jedem neu hinzugefundenen Buch, wieweit dies seinen
Sucherwartungen entspricht. Damit wird deutlich, daß
in einem Erschließungssystem die Begriffsweite immer nur von
den darin enthaltenen Dokumenten
bestimmt wird, und daß sie damit ausschließlich
vom gesamten dokumentierten System abhängt.
Wie problematisch und unbestimmt sogar ein Begriffe wie Indexierungstiefe
ist, erkennen wir an der DIN-31623 Teil 1, die die Indexierungstiefe
lediglich als "eine Kombination von Indexierungsbreite
und -spezifität" definiert - und damit genaugenommen garnicht.
Ob hier addiert, subtrahiert, dividiert, multipliziert
oder potenziert werden soll, bleibt völlig offen.
Der Hinweis, daß eine tiefere Indexierung
vorliegt, wenn die Bezeichnung spezifischer ist, bringtwenig.
Nähme man aber im Sinne der DIN-Norm eine Multiplikation
an, so könnte man für die Indexierungsbreite,
die Zahl der indexierten Benennungen einsetzen und
für die Indexierungsspezifität die Hierarchieebene
im Thesaurus. Es gälte dann:
Indexierungstiefe
= Indexierungsbreite x Indexierungsspezifität
T = B x S
Entsprechend wäre die Indexierungstiefe mit drei Deskriptoren auf
jeweils zweiter Ebene wie: Regionen / Alpenraum, Hochgebiete der
Erde / Berge, Himmelsrichtungen / Osten
mit T = 3 x 2 = 6 größer als die Indexierungstiefe
mit einem einzigen Deskriptor wie Marmolada auf vierter
Hierarchiestufe (Europa / Italien / Südtirol /
Marmolada) T = 1 x 4 = 4. Wir müßten
also je nach Thesaurus einen Korrekturfaktor einführen, der
die hierarchische
Struktur adäquat berücksichtigt, da es relativ
willkürlich ist, ob man drei breite oder dreißig eng begrenzte
Ebenen einrichtet.
Wie schwierig dies Unterfangen schon für einen echten
Thesaurus ist, muß kaum näher erläutert werden,
wenn man sich daran erinnert, daß die Hierarchiestufen
im thematischen Zentrum eines Thesaurus weitaus vielschichtiger
sein müssen, als in seiner Peripherie und daß
die einzelnen Deskriptoren sich gegenseitig in ihrer Bedeutung stark
beeinflussen können. Der Korrekturfaktor hätte
also je nach Thematik unterschiedliche Qualität.
Wir verstehen damit warum man in der DIN-Norm eine wirklichen Definition
umgangen hat. Irritierend ist nur, daß so getan
wird als wäre klar was Indexierungstiefe ist. Gerade hier liegt der
theo-
retische Fehler, daß man bei breiter Indexierung zu viel fände.
In Wirklichkeit kommt es aber gerade auf die Ausgewogenheit
von Indexierungsbreite und -spezifität an.
Die Indexierungstiefe
müßte also unter optimalen Bedingungen
Für Bibliotheken mit einer Indexierungsbreite von ein
bis zwei thematischen Gegenständen pro Buch, verbietet sich damit
zunächst das enge Schlagwort. Berücksichtigt
man die oben erwähnte Tatsache, daß
die Begriffsweite natürlich von der Zahl der darin enthaltenen Begriffe
abhängt, so läßt sich für diesen Fall B = W
setzen (dies entspricht dem Hinweis in der RSWK, daß
bei sechs und mehr Gegenständen
auf "eine umfassende Bezeichnung
ausgewichen" werden soll). Damit gilt:
Dabei ist:
n Häufigkeit mit der ein Schlagwort verwendet wird,
R Gesamtzahl aller Schlagwörter,
N durchschnittliche Verwendung dieser.
Für ein durchschnittliches Schlagwort können wir entsprechend
vereinfacht schreiben: T = Konst. = D / R, woraus sich auch ableitet,
daß die Zahl der Dokumente und die Zahl der Erschließungsbegriffe
in einem ausgewogenen Verhältnis stehn sollte. Die Zahl R x
N wird auch als Summe der postings bezeichnet. Die Hie-
rarchiestufe spielt also naheliegenderweise eine untergeordnete
Rolle. Am Rande sei bemerkt, daß sich diese überlegungen
mit den Erfahrungen bei den Rankingmethoden von Online- und OPAC-Systeme
decken. Entsprechend spielen sie natürlich auch bei der automatischen
Indexierung eine Rolle.
Im Volltext, folgt die "Indexierungsspezifität" mehr oder
minder automatisch der Indexierungsbreite insofern,
als es unsere Sprache verbietet, stereotyp nur Oberbegriffe
zu verwenden. Wir haben dann allerdings das Problem, daß
möglicherweise Volltexte mit äußerst unterschiedlichem
Umfang auf überschaubare Einheiten im Retrievalsystem zurückgeführt,
verknüpft bzw. vernetzt werden müssen. Je umfassender
wir ein bestimmtes Thema behandeln, desto
tiefer dringen wir in irgend einer Richtung darin ein und
desto stärker sind wir gezwungen auch spezifische Begriffe
zu wählen. Wir wissen aus Erfahrung und aus Untersuchungen an
MEDLARS, bzw. vergleichbaren Datenbasen ohne echten Thesaurus,
daß ein guter Thesaurus, im Retrieval nicht mehr und
auch nicht bessere Treffer erbringt, sondern lediglich eine weniger
schwankende Ausbeute in kurzer Retrievalzeit gewährleistet. So wichtig
dies bei hohen Recherchekosten ist, desto unwichtiger wird
die aufwendige Thesauruspflege bei stürzenden Rechner-
und Speicherkosten in Inhousesystemen.
Es gibt zunächst weder eine vollständigere
"Erschließung", als den Volltext selbst, noch eine ausgefeiltere
Syntax, als die unserer natürlichen Sprache. Die Volltextproblematik
liegt daher auch nicht in der Wiederauffindung, sondern darin, daß
wir nicht gewillt sind, immer ein ganzes Buch zu finden, wenn wir lediglich
einen Satz daraus brauchen. Die Aufbereitung und die Recherchemöglichkeiten
bei Volltexten sind daher das eigentliche Thema. Daß
man dabei jederzeit für einen rascheren Zugriff
unter bestimmten Aspekten zusätzliche Hinweise
indexieren kann, ist selbstverständlich. Nur am
Rande sei an dieser Stelle erwähnt,
daß Information im eigentlichen Sinne, und damit
auch im Sinne Shannon und Weavers, syntaktische Information ist.
Auf die Frage, ob pragmatische und semantische Information
nicht letztendlich auch nur auf Syntax basiert, kann hier nicht
näher eingegangen werden. Untersuchungen, sberlegungen
und Erfahrungen auf diesem Gebiet bleiben aber heute auf der Strecke,
weil wir unsere Zeit mit einem Sacherschließungssystem verbringen,
daß unseren Vätern
und Großvätern gut anstand.
Unsere Bibliothekbenutzer brauchen unabhängig von der Bibliotheksgröße, eine überschaubare Menge von Büchern im Regal vor dem sie stehen. Gleichgültig ob es sich um hundert Bücher zum Bibliotheks- und Dokumentationswesen, um die gleiche Menge zum Thema Sacherschließung oder um ebensoviele zur RSWK handelt. In jedem Fall ist der Leser bei einer überschaubaren Menge am ehesten in der Lage, über Aufmachung, Autor, Bilder, Erscheinungsjahr, Referenzen, Titel, Umfang und Verlag, stichprobenartig festzustellen, wieweit das Angebot seine Anforderungen zu erfüllen vermag. Es kommt hinzu, daß er damit die ausgeliehenen Bücher, im Gegensatz zur Katalogsuche, mit zeitlichem Gewinn bereits vernachlässigt. Er kann jede Quelle sofort auf Brauchbarkeit prüfen und seine Entscheidung fällen, ob ein Weitersuchen sinnvoll ist, ein Lesen am Ort ausreicht oder eine Ausleihe erfolgen sollte. Hierrin liegt die Stärke der buchzentrierten Bibliothek, solange nicht vergleichbare Größenordnungen im Volltext zur Verfügung stehen.
Benutzt er dagegen den Schlagwortkatalog, so ist er sich darüber
im klaren, daß er für jedes relevant
erscheinende Buch eine meist mehrminütige Zeitspanne zum
Suchen einkalkulieren muß. In Abhängigkeit von der Bibliotheksgröße
ist die Länge von etlichen Metern Regalsucharbeit zu absolvieren.
Der Katalogbenutzer macht also die Erfahrung, daß je nach Nutzung
und Typ der Bibliothek, vielleicht jedes dritte bis zehnte Werk vergriffen
ist, oder daß sogar das Bibliothekspersonal eingeschaltet
werden muß, was wiederum zu erheblichen Verzögerungen
bei der Weiterarbeit führt. Er muß auch damit leben, daß
das RSWK-Schlagwort "Evolution" lautet und sich dahinter Schwemmlers Symbiontentheorie
verbirgt, die im Buchtitel eine "unified theory" verspricht und eigentlich
eher
eine Sammlung von Hypothesen, als eine echte Theorie enthält.
Wenn Heinrich(9) darauf hinweist, daß bei vergleichsweise 73% der Suchen am Alphabetischen Katalog, nur 7% auf den Schlagwortkatalog bzw. 4% auf den SYK entfallen, und wenn man berücksichtigt wie selten viele Kataloge überhaupt benutzt werden, so kann dies in einer Zeit in der Online-Datenbanken immer preiswerter zur Verfügung stehen eigentlich nur als ein katastrophales Ergebnis dieser Sacherschließung gewertet werden. Die meist gehegte Hoffnung, es läge an der Unkenntnis der Nutzer, hilft hier kaum weiter. Nach Schubert, H.-J.(1) und Gödert(10) steigt der Anteil der Sachrecherchen in Online-Publikumskatalogen auf über 50% aller Recherchen. Und Hildreth (11) gibt nach einem 1981 erschienenen Report von Pritchard für SCORPIO sogar knapp 70% sachliche Einstiege an. Daß dabei 56% der Benutzer nicht viel oder wie es bei Gödert heißt, nicht alles was sie suchen finden, kann bei heutiger Sacherschließung kaum verwundern.
Der ebenfalls bei Gisela Heinrich erwähnte Hinweis auf das DFG-Projekt "Benutzerverhalten an deutschen Hochschulbibliotheken", das für die Suche im Sachkatalog durchschnittlich 10 Min. ergab, zeigt je nach Bibliothekstyp nur einen verschwindenden Bruchteil dessen, was der Bibliotheksbenutzer wirklich an Zeitaufwand aufbringen muß, um an seine gewünschte Information zu gelangen.
All dies hat etwas mit Informationslogistik zu tun und bedeutet
nichts anderes, als daß der Bibliotheksbenutzer über den
Katalog heutiger Prägung, schon aus Zeitmangel nur
mit sehr geringer Wahrscheinlichkeit die besten Buchtitel
zu seinem Thema findet. Diese Erfahrung macht er ohne jede wissenschaftliche
Untersuchung und kommt zu dem Schluß, daß
er den Schlagwortkatalog nur benutzt, wenn dies seine letzte Chance ist.
Dabei sollte die Faustregel, je leichter ein Buch für
den Leser verfügbar ist, desto besser sollte es für
ihn indikativ erschlossen sein, in erster Näherung
gelten. Nur so kann überflüssige Fernleihe
vermieden werden. Je schwerer es verfügbar ist,
(je weiter es entfernt ist), desto besser sollte es informativ
erschlossen sein - bis hin zum Volltext.
Es soll nicht bezweifelt werden, daß die Schlagwortnormdatei
mit über 300000 Ansetzungs- und Verweisungsformen
recht spezielle Begriffe enthält. Auch wenn ihr verständlicherweise
Orthogenese oder "Herationsvorschrift" fremd sind, so kennt sie doch die
Evolutionsstabile Strategie, von der allerdings nur
ein Fachmann
vermuten kann, daß sich dahinter die
sog. EES (Evolutionarily Stable Strategy) von J. Maynard Smith verbirgt,
die in den siebziger Jahren diskutiert wurde. Fraglich ist
allerdings, ob man Fachtermini so unbeschwert übersetzen darf.
Während für die Evolutionsstabile Strategie keine Definition
angeboten wird, ist die
der Evolutionsstrategie, umso aufschlußreicher. Sie lautet:
"Methode, die d. Mechanismen, nach denen sich die biol.
Evolution vollzieht, als Herationsvorschrift zur Optimierung von
Entscheidungsproblemen nachahmt." Ob diese Definition allerdings
bei der Beschlagwortung weiterhilft ist höchst fraglich. Man
gewinnt den
Eindruck, daß hier Spezialisten, die nur an wenigen Bibliotheken
vorhanden sind, wie H.-J. Schubert(1) richtig bemerkt, ihre Leistungen
nicht nur anderen Kollegen zur Verfügung, sondern auch
unter Beweis stellen.
An dem hier gewählten Beispiel des Schlagwortes Evolutionsstrategie
wird deutlich, welch ein Aufwand die Erstellung einer solchen Schlagwortnormdatei
als Extrakt aus 637 Nachschlagewerken mit ihren
Quellenangaben, Definitionen und Verweisen macht. Ob dieser
Aufwand wirklich durch eine Erleichterung in der Verbundkatalogisierung
gerechtfertigt ist, muß bezweifelt werden. Um die EES ist es bereits
ruhiger geworden, weil dieser Aspekt einer Spielstrategie ebenso wie die
Evolutionsstrategie sich wissenschaftlich weiter entwickelte. Ob und wann
das entsprechende Schlagwort also der SWK wieder entnommen werden
muß, bleibt abzuwarten. Und daß die Strategie der Evolution
zwar eine Optimierungsstrategie ist, aber weit über die
Frage von Entscheidungsprobleme hinaus geht,
dürfte an anderer Stelle gezeigt worden sein (12). Die Definition
von Begriffen sollte man weiterhin der Wissenschaft überlassen
und sie nicht mit den sog. scope notes zur Vereinheitlichung der
Indexierung verwechseln.
Spätestens beim Vergleich der Nachschlagewerke müßte eigentlich auffallen, daß die Forderung nach möglichst gebräuchlichen Termini sich je nach Leserschaft drastisch verschiebt. Es ist nicht das gleiche, ob ein Buch den Titel "Die Lepidoptera Europas" oder "Die Schmetterlinge Europas" trägt. Aller Wahrscheinlichkeit nach wird der Biologe aus guter Erfahrung eher nach dem einen und der Laie nach dem anderen greifen. Beide folgen ihrer Erfahrung von Gebräuchlichkeit. Wenn also die RSWK von Lepidoptera auf Schmetterlinge verweist, ist dies ein Zeichen dafür, an wen sie sich wendet. Evolutionsstabile Strategie statt "Evolutionarily Stable Strategy" (unter der Voraussetzung, daß diese gemeint ist) zu nehmen, untermauert diese Vermutung.
Wie heißt es bei H.-J. Schubert so richtig, "wie denn überhaupt die SWD sich in Richtung eines Universalthesaurus bewegt, ohne dieses utopische Ziel jemals erreichen zu können oder zu wollen."(1) Doch drei Seiten weiter lesen wir, ohne jeden Widerspruch, den Vorschlag der Deutschen Forschungsgemeinschaft "Die ...(RSWK) und ... (SWD) sollten daher ... in Richtung auf einen Universalthesaurus zur Erschließung von Bibliotheksmaterialien weiterentwickelt werden".
Hat eine Bibliothek fünf Titel unter dem Schlagwort Evolution, so ist seine Verwendung sicher angebracht. Hat sie dagegen eher fünfhundert, so empfiehlt sich, wie oben erwähnt, durchaus eine Einschränkung auf Evolution des Menschen, Evolution des Kosmos, Evolutionsstrategie, Evolutionstheorie, Orthogenetische Evolution, etc.. Bei der DDC ist man sich doch dieser Tatsache längst bewußt und verweist auf die Abridged Edition.
Sacherschließung in Bibliotheken geht nochimmer davon
aus, daß auch in Zukunft nur gedruckte Verzeichnisse
dem Endnutzer zur Verfügung gestellt werden. Sogar die bisherigen
OPACs änderten an dieser Einschätzung erstaunlich
wenig. Die verschiedenen Erschließungsmethoden
legen Sortierregeln durch Sonderzeichen, durch
bestimmte Schreibweise, durch Festlegung von Ketten oder
durch gewisse Permutationen fest (in denen je nach Einschätzung
der häufigsten bzw. wichtigsten Suchanfragen
die Person, die Sache oder das Geographikum
bevorzugt wird). Dabei werden Computer meist wie in
den 60er Jahren als Druckaufbereitungsanlagen eingesetzt.
Seit dem es Online-Systeme gibt, hat sich hier zunächst
durch die Möglichkeit der Bool'schen Logik, die
Sacherschließung in der Dokumentation verändert. Mortimer
Taube's Koordinate Indexing von 1951, das die Verbindung
von Uniterms durch AND, OR und NOT einschloß
und bewußt der alphabetischen und systematischen Ordnung von
früher gegenübergestellt wurde, war damals als Revolution der
Sacherschließung verstanden worden (13). Solche Systeme können
auf die meisten Kettenbildung und auf Permutationen verzichten.
Im Gegenteil, greift man Beispiele, wie "Ortung von Zerstörern durch U-Boote", "Frankreich und der deutsche Protestantismus" oder "Der Einfluß der Vereinten Nationen auf die Sowjetunion" auf, so ist zunächst zu bemerken, daß keine Schlagwort-Syntax diese Titel so Originalgetreu widergibt, wie eben die Titel selbst. Bei Eingabe der drei jeweils wichtigen Suchbegriffe in UND-Verknüpfung, würden in einem Online-System diese erscheinen. Wenn darüber hinaus Ursula Schulz(14) den gedanklichen Aufwand zur RSWK-Kettenbildung für nicht gerechtfertigt hält, so kann dem nur zugestimmt werden. In den meisten Fällen wird dabei auch vergessen, daß z.B. ein Buch mit dem Titel "Frankreich und der deutsche Protestantismus" auch für denjenigen von Interesse sein dürfte, der sich für den deutschen und den französische Protestantismus oder den französischen Protestantismus aus deutscher Sicht interessiert. Entsprechendes gilt für die beiden anderen Beispiele ebenso. Jeder der ausreichende Erfahrung im recherchieren hat weiß, wie oft wir nicht nur nach Synonymen sondern gerade nach Antonymen suchen um eine Thematik möglichst vollständig abzudecken. Wieviele Bücher gibt es denn beispielsweise über die Frage der Ortung von U-Booten in der Welt? Problematisch wird es doch nur, wenn wir dreißig oder mehr Bücher über die Ortung von U-Booten und Zerstörern finden, von denen nur ein oder zwei sich mit unserer eigenen Thematik beschäftigen, und wenn diese Bücher auch noch über die Fernleihe besorgt werden müssen. Gab es wirklich keine realistischeren Beispiele für die Verwendbarkeit der RSWK?
Die vergleichsweise seltenen Fälle, in denen die gleichordnende
Indexierung beim bisherigen Online-Retrieval unzureichend
war, konnten natürlich auch durch Rollenoperatoren oder sog. Links
bewältigt werden. Weitaus wichtiger war aber bei den bisherigen Online-Recherchen
die Tatsache, daß Wortstämme oder auch
sinntragende Silben beliebig suchbar wurden, und daß
der zunehmende Wechsel zur Freitextrecherche, z.B. mit
Kontextoperatoren vor
über zehn Jahren, hier erhebliche Verbesserungen brachte.
Inzwischen werden zunehmend Systeme entwickelt, die sich dazu eignen,
die Volltexte erschließbar zu machen.
Ich entsinne mich in diesem Zusammenhang einer Online-Recherche
in MEDLARS zu Thema Brustkrebs bei männlichen
Individuen. Zu breast neoplasms gibt es tausende von Veröffentlichungen,
in AND-Verknüpfung mit dem sog. check tag male kommen nochimmer hunderte
von Treffern mit Brustkrebs bei Frauen, indenen aber Männer
irgendeine für die Suche meist unwichtige Rolle spielen. Obwohl also
MEDLARS, mit Main- und Subheadings geradezu als Musterbeispiel
für ein syntaktisch indexierendes System gelten
kann, das wohl auch am besten untersucht und fortentwickelt
wurde, versagt es gerade bei dieser Frage. Darüberhinaus
befinden wir uns hier nun wirklich in einer Dimension sachlicher
Erschließung, in der es zeitlich und finanziell
unvertretbar ist, aus der Zahl von
Treffern die wenigen richtigen herauszusuchen. Damit sind wir
in solchen Fällen gezwungen nach fünf Auswegen zu suchen:
Von der Gesamtzahl der Worte im Titel sind etwa 63% sinntragend. Eliminiert man die Schlagwörter, die als Worte bereits im Titel auftauchen, bzw. in den Kettenwiederho lungen redundant sind, so bleiben noch 48% übrig.
Wir können also davon ausgehen, daß neben der
52%igen Redundanz rund die Hälfte der Schlagwörter eine wirkliche
Zusatzinformation zum Titel erbringen. Damit kommen etwa
1,70 einzelne Schlagwörter auf ein Buch.
Die Titel selbst enthalten demgegenüber nochimmer etwa ein
Dreifaches an Information. Als Beispiel wurde hier das Schlagwort
Evolution gewählt.Wobei hinsichtlich der Redundanz noch zu bemerken
ist, daß 59 der 108 Titel allein das
Wort Evolution schon im Titel enthalten. Bei den
anderen Titel kommen z.B. Begriffe wie Abstammung
oder Entwicklung vor. Bezüglich der
"Enge" der
Schlagwörter ist für diesen Fall zu sagen, daß
in
31 Schlagwortketten die Bezeichnung "Biologie" und
18 mal "Mensch" auftaucht. Daneben haben Formschlagwörter
wie
Aufsatzsammlung oder Einführung einen etwa
10%igen Anteil. Da sich Evolution auf Bewußtsein,
Denken, Gesellschaft, Materie, Mensch, Pflanze, Religion, Tier, u.a.m.
beziehen kann, ist eine nähere
Eingrenzung meist notwendig. Schränken wir hier beispielsweise
auf Mensch ein, so finden wir über die Schlagwörter
15 Bücher. Drei weitere wären unter
Hominisation, Menschheit und Menschenbild zu finden. Daß natürlich
etliche der Bücher nur über die Titelstichworte als relevant
erkennbar sind, muß wohl kaum erwähnt werden.
Eine zweite Stichprobe zum Titelwort Literaturd* erbrachte
84 Titel, von denen nur
18% durch Schlagwortketten erschlossen sind. Schon diese
Tatsache zeigt, wie gering die Verwendbarkeit der RSWK bei
der DB
bekanntlich ist. Hier lag die Zahl der durchschnittlich vergebenen
Ketten mit
1,43 nur um
4% höher als in der ersten Stichprobe.
Dagegen war die Zahl der Worte pro Kette mit
3,8 erheblich höher. Nach Beseitigung
der Redundanz blieben
allerdings auch hier nur etwa
50% der Worte erhalten, wenn man das Titelwort Literaturdokumentation
mit dem Schlagwort "Bibliographie" und Literaturdidaktik mit Unterricht
übersetzte, da diese Bezeichnungen meist zusätzlich
zum Sachschlagwort vergeben werden, ist die erhöhte
Zahl an Worten leicht verständlich. Wir müssen also zusammenfassend
feststellen, daß die Schlagwörter natürlich eine
Hilfe beim thematischen Suchen darstellen, daß sie aber den Recherchierenden
in keiner weise davon entbinden, sein gesamtes Freitextrecherche können
anzuwenden. Insgesamt verbessert die Schlagwortgebung mit Hilfe der
RSWK die Suchmöglichkeiten pro Buch um etwa
0,35 Worte.
Da empfiehlt es sich neben Wortstammsuchen wie
Evoluti* nach Entwicklung*, Abstammung*, Phylogen*, etc. ebenso zu
suchen, wie nach Darwin* oder Lamarck*. Wenn man sich aber darüber
im klaren ist, stellt sich die Frage, ob es nicht sinnvoll wäre,
sich ganz auf Frei- bzw. Volltextretrieval einzustellen. Dies entbindet
Indexer nicht davon beispielsweise in Büchern behandelte Zeiträume,
Geographika oder Formschlagwörter explizit zu erfassen. So zeigt
das Schlagwort Ostalpen, daß die RSWK hier Gebiete
wie Säntis, Dolomiten oder ™sterreich mithelfen zuzuordnen.
Ohne Zweifel können solche Aufgaben allerdings
auch durch sog. hedges beim Retrieval erleichtert werden.
Der Einsatz von Rechnern, sowohl beim Retrieval als auch
bei der Datenaufbereitung wird z.Z. von den Erschließungsregeln
sicher ungenügend berücksichtigt. Man wird auch in
Zukunft immerwieder geordnete Listen von Literaturausdrucken. Entscheidend
ist aber, daß hierfür heute recht leistungsfähige Reportgeneratoren
zur Verfügung stehen, und daß diese Druckausgaben
gegenüber dem direkten Retrieval in den Hintergrund rücken. Auch
hinsichtlich der Verweise von Namen und Körperschaften, ist
nicht einzusehen, warum nicht schlichte, für jedermann benutzbare
Dateien, die automatische Translation in Normansetzungen vornehmen
können. Das mehrfache Wiederholen eines Namens, für
verschiedene Druckausgaben, bis hin zum Verweis von Thompson, John
L. Cloudsley auf Cloudsley-Thompson, John L.
kann sicher eleganter und weniger Personalkostenintensiv
gelöst werden. Für das Online-Retrieval ist es schlicht überflüssig.
Es läßt sich leicht zeigen, daß mit heutigen Scannern
ganze Sachregister von geeigneten Büchern
in einer halben Stunde in entsprechende Datenbanken
eingelesen werden können. Auch wenn dies nur
mit einem sehr begrenzten Anteil an Büchern
möglich ist, und wenn dabei ein Rest an Fehlern auftreten kann,
so darf man die überragenden Verbesserungen einer solchen "Sacherschliessung"
gegenüber der RSWK oder etwa der von PRECIS unmöglich übersehen.
Bei Systemen, in denen mühelos jeder Begriff eingeordnet
werden kann, über die Hospitalität, über komplizierte
Kodierungen oder Schlüsselungen zu philosophieren wird zunehmend
anachronistisch. Es gibt keine Periodizität bei Katalogen,
es gibt aber Zeichen der Zeit, die nicht ohne wirtschaftliche Einbußen
übersehen werden dürfen. Solange die Einsortierung von
Karten in die diversen Karteikästen einen unvertretbaren
Personalaufwand erforderten,
konnte man einem Buch natürlich nicht mehr als drei Schlagwörter
zuordnen, aber gerade deswegen sind Kataloge dieser Art professionell
nichtmehr tragbar und werden seit Jahren
weltweit zunehmend eingefroren.
Optische Platten stellen heute ein Megabyte für Pfennigbeträge zur Verfügung, während die Magnetplatten preislich nochimmer konkurrenzfähig zu bleiben versuchen. Unter diesen Umständen, zu einem Buch nicht mehr als zwei oder drei Worte Zusatzinformation anzubieten und vom Nutzer zu verlangen, daß er mehrere Minuten pro Buch, seiner kostbaren Zeit, die täglich teurer wird, vergeudet, um festzustellen, daß auch dieses Werk für ihn z.Z. unbrauchbar ist, wird von Tag zu Tag unzumutbarer. Es kann kaum einen Zweifel darüber geben, daß wir hinsichtlich der RAK eine ganz ähnliche Situation vorfinden. Auch hier wäre zu überlegen, wieweit in absehbarer Zukunft statt der alten klassischen Formalen Erfassung, eine sehr viel umfangreichere Dokumentation des Objektes Buch angebracht wäre.
Um manche Bücher sinnvoll anzuschaffen oder auszusondern, brauchen wir z.B. hilfreiche Angaben darüber, wie oft sie bereits in deutschen Bibliotheken stehen, wo sie stehen, wieweit sie genutzt werden, wieviel Regalplatz sie verbrauchen, welche Auflagenzahl sie haben, etc. Auf diese Weise lassen sich Entscheidungen, die heute meist mehr aus dem Gefühl, der Erfahrung und aufgrund von Abschätzungen basieren, durch sog. decision support systems unterstützen. Durch die wachsende Zahl an unterschiedlichen Erscheinungsformen der gleichen Information, wird dabei auch eine bessere Erschließung notwendig, um überflüssige Doppelanschaffungen in unterschiedlicher Aufbereitung zu verhindern. Viele dieser Daten für ein decision support system wären vergleichsweise leicht verfügbar, sie müßten lediglich über ein Verbundnetz wie WIN angeboten werden und dürften nicht über lange Diskussionen darüber, nach welchem Regelkatalog man sie erfaßt, verzögert werden. Je nach eingesetzter Software kann die optimale Erfassung stark variieren. Darum wird es immer wichtiger, mit kleinen Programmen vorhandene Datenbestände beim Im- bzw. Export umzuwandeln. Auch wenn der Anstieg an geforderten Programmierkenntnissen in amerikanischen Bibliotheksschulen, von 9% 1980 auf 17% 1986 im Chi-Quadrat-Test nicht signifikant ist, so signalisiert er zumindest, daß durch die verbesserten Nutzerschnittstellen der Computer, Programmierkenntnisse nicht unwichtiger werden(16). Vielmehr wird durch die komfortablen Hilfen bei den neuen Objektorientierten Programmiersprachen die Datenmanipulation auf diesem Wege auch für Bibliothekare und Dokumentare immer einfacher.
Der entscheidende Gedanke ist, daß sowohl bei RAK
als auch bei den RSWK eine mehr oder minder unzuverlässige,
weil von menschlichen Individuen vorgenommene, Umsetzung
der originalen Buchvorlage stattfindet. Durch diese
mangelhafte Vereinheitlichung kommt es ebenso wie bei der Indexierung
eines Oberbegriffs, zu einem Informationsverlust, der nur durch die
Aufhäufung der Dokumente kompensiert wird. Diese Umsetzung
soll eine Vereinheitli-
chung in der Ansetzung erreichen, um gleiche Dokumente in
einem gedruckten Katalog gezielt auffinden zu können. Wenn wir
allerdings feststellen, und hierrüber kann es
heute keinen Zweifel mehr geben, daß das gezielte Auffinden
von Dokumenten über ein zeitgemäßes Online-Retrieval,
der Erschließung der gedruckten RSWK-Ketten weit
überlegen ist, so sollte hier möglichst bald
kein Geld mehr vergeudet werden. Bei ständig steigenden Personal-
kosten und rapide fallenden Datenverarbeitungskosten, wird dieses Mißverhältnis
von Jahr zu Jahr eklatanter. Die Datenverarbeitung spart bei ineffektiv
und personalintensiv arbeitenden Bibliotheken kein Personal,
sondern Personalkosten und macht damit Arbeitskräfte mit entsprechenden
Kenntnissen attraktiv - Vorausgesetzt, man läßt sie aktiv
werden.
Die Library of Congress setzte für die Anwendung von PRECIS
1977 Personalkosten in Höhe von etwa 20 - 30 Min. pro Katalogisat
(und dies dürfte inetwa vergleichbar sein, mit dem was wir einem Fachreferenten
zugestehen müssen) ein(17). Damit bleibt es nur eine Frage
der Einschätzung, von wann ab wir uns dieses Preis-Leistungsverhältnis
nichtmehr leisten können. Auch wenn Schubert für 1988 die
Erschließung von 89000 Bänden durch 12,25
Referenten
angibt(1), so ist diese Leistung zwar beeindruckend, nicht aber,
wenn man berücksichtigt, daß hier maximal fünf Themen
pro Dokument erschlossen werden. Die persönliche Leistung
der Fachreferenten ist also durchaus erwähnenswert,
wie lang sie noch bei diesem mangelhaften Effekt bezahlt werden
kann, ist allerdings
fraglich. Zumindest den Katalogisierern sollte
man frühzeitig genug mitteilen, ab wann diese Sacherschließungsmethode
obsolet wird, und sie nicht eines Tages vor vollendete Tatsachen stellen.
Es ist die Aufgabe von Führungskräften zur rechten Zeit zu
informieren und zu handeln, und nicht auf Biegen oder
Brechen bestimmte Verhältnisse zu erhalten,
bis aus einer Evolution eine Revolution wird und die menschlichen Härten
unvertretbar anwachsen. Jede Bibliothek muß daher das Recht
besitzen im geeigneten
Moment auf das für sie optimale, zeitgemäße
und finanzierbare Sacherschließungssystem überzuwechseln.
Die Hoffnung auf eine dauerhafte einheitliche Erschließungsmethode
mit langfristiger Zukunftsperspektive, auf der Basis der RSWK, ist im Zeitalter
der Informationstechnologie obsolet.
Selbstverständlich kann man eine Revolution
auch herbeireden. Wenn sie aber bereits vor der Tür steht, weil unbemerkt
die Stellen aus dem Bibliotheks- und Dokumentationswesen
verschwinden, dann trifft dieser Vorwurf nicht die, die auf sie aufmerksam
machen, sondern eher jene, die möglichst alles beim
alten lassen
wollen. Damit sei nichts gegen eine gesunde
Tradition gesagt. Nur ein veraltetes Bibliotheks- und Dokumentationswesen
vermag im sog. Informationszeitalter zu stagnieren oder sogar Stellenverluste
hinzunehmen. In einem Markt, der so rasch wächst, wächst
man mit, oder man sinkt zur Bedeutungslosigkeit ab. Die Bibliotheken
können es sich nicht leisten Personalmangel zu reklamieren
und dabei nostalgische Tätigkeiten zu kultivieren. Da der Wettbewerb,
durch die Vereinheitlichung der Katalogisierung, nicht zwischen
den Bibliotheken stattfindet, sondern zwischen den Bibliotheken
und all denen, die hier eine Marktlücke wittern,
fließen seit einigen Jahren die Personalstellen oft
unbemerkt in Rechenzentren, Informations- und Kommunikationszentren,
Dokumentationszentren u.a. mehr.
Unser Ziel müßte es daher heute sein, das Buch sowohl als
Objekt, als auch vom Inhalt her möglichst originalgetreu,
bis hin zur bildlichen Darstellung zu erschließen, um dieses
dokumentarische Produkt dann mit Hilfe der
modernen Datenverarbeitung den verschiedenen Wünschen
einer Wiederauffindung, Ordnung und Reorganisation zugänglich
zu machen. Das führt soweit, daß man z.B. Bernd Maaßen
oder Bernd Maassen gezielt suchen kann, wenn man
weiß, daß er in der jeweiligen Quelle
so erscheint. Beim Retrieval gegebenenfalls ein Maa??en zu
suchen wäre zumindest kaum ein Problem. Es ist auch nicht
uninteressant ob jemand im Titel "Schlagworte" oder "Schlagwörter",
Unterseeboot, Unterseekreuzer oder U-Boot verwendet, für ein
brauchbares Retrieval ist die Suche nach Schlagw*rt*, etc.
kein Hindernis. Daß man daneben als Suchhilfe "Sacherschließung"
oder "Kriegsschiffe für Unterwasserfahrten" indext und diese
Bezeichnungen in einem Thesaurus hierarchisch ordnet, ist eine
reine Frage dessen, wie groß der Aufwand ist und wie oft man mit
Anfragen dieser Art rechnet. Die andere Möglichkeit läge darin,
für solche Anfragen vorgefertigte Recherchestrategien, den
sog. SDIs vergleichbar, anzubieten. Das Online-Retrieval der letzten 15
Jahre hat aber gezeigt, daß solche immer gleichen Anfragen relativ
selten sind, und daß sich für eine oft gestellte komplexe Frage
meist nach kurzer Zeit ein eigener Terminus entwickelt. Der
Trend über den Frei- zum Volltext trägt auch der Tatsache Rechnung,
daß es gerade die unvorhersehbaren Fragen sind, die uns am meisten
Recherchezeit kosten.
Sogar unter dem Aspekt vernetzter Rechnerkonfiguration
ist es sinnvoll, den Gedanken einer vereinheitlichten Sacherschließung
über Bord zu werfen und für die verschiedenen
Bedürfnisse der Nutzer unterschiedliche Formen des Informationsangebotes
aufzubereiten. Das kann vom Touch-Screen mit Icons über
HyperCard bis hin zum IAIMS (Integrated Academic Information Management
System) reichen. Dabei hat das IAIMS-Projekt zum Ziel, ein Terminal,
mit
künstlicher Intelligenz auszustatten, um gerade
den Mangel an Vereinheitlichung in den verschiedenen
Datenbanken über die intelligente Schnittstelle
abzufangen. Ein Gedanke, der auch schon beim deutschen
BenHur-Projekt anklang, dort aber leider in seinen Anfängen
stecken blieb. Bedenkt man, wie lange es gedauert hat, ein System
wie die RSWK arbeitsfähig zu machen, so sollten wir in unserer
Sacherschließungspolitik in Zukunft etwas voraus-
schauender sein. Das heißt nicht, in der nächsten
Dekade Systeme für das nächste Jahrtausend zu entwickeln,
sondern heute das zu tun, was zeitgemäß und realistisch
ist und was morgen verbessert werden kann.
Mit Recht weist Haller auf die Veränderung
von Fachbegriffen hin, und auf das Wachstum der Schlagwortnormdatei
mit etwa 15.000
Schlagwörtern im Jahr. Nach Schubert sind es sogar
20.000 Neuansetzungen jährlich(1). Bei einer breiteren Anwendung der
RSWK im deutschen Sprachraum läge dieser Wert
noch um ein Mehrfaches höher. Auch hier wissen wir seit
längerem aus dem Science Citation Index, daß wir nicht
nur in der Tagespresse sondern auch in wissenschaftlichen Publikationen
jährlich mit einer Vielzahl von neuen Begriffen
konfrontiert werden, und daß die Hoffnung auf eine klassische Schlagwortnormdatei,
im Sinne einer verbindlichen Liste, eine Utopie ist. Sie muß
permanent auf dem neusten Stand gehalten werden, und das Bedeutet
eine rasche Einarbeitung neuer Bezeichnungen und eine Anpassung der
zunehmend vorhandenen. Auch dazu eignen sich Informationsverarbeitende
Maschinen über weite Strecken besser, als Regeln, die Menschen
vorher auswendig lernen müssen und über die sich
trefflich streiten läßt. Daß dieser
Aufwand terminologischer Kontrolle unterschätzt
wurde, zeigte schon 1987 ein Beitrag Geißelmanns(18),
auch wenn er zu der Auffassung kommt, und
dies ist für gedruckte Kataloge sicher richtig,
daß der Aufwand geleistet werden muß. Mußte
es aber nicht zu denken geben, wenn in Augsburg in sechs
Jahren 590.000 Korrekturen, wie Agrarwirtschaft zu Landwirtschaft
oder Tier zu Tiere erfolgten.
Da zwangsläufig immer größere Teile der
SWK Personennamen und Geographica enthalten, und weil mit zunehmender
Größe die Überarbeitung der alten Schlagwörter mit
ihren z.T. überholten Quellen nachweisen, Chronologischen Formen (s.
DDR) Verweisungen, Definitionen (s. Evolutionsstrategie) immer umfangreicher
wird, kann man bei steigenden Personalkosten kaum davon ausgehen,
daß diese Arbeit auf intellektuellem Niveau bezahlbar
ist. Die Umkehrung
der Problematik scheint hier wesentlich sinnvoller zu sein.
Mit einer möglichst umfangreichen und dokumentnahen Indexierung,
die in einem Online-Retrieval zur Verfügung
steht, sollten sog. hedges und Thesauri bei
zeitgemäßer Unterstützung mit künstlicher Intelligenz
die Recherchearbeiten erleichtern.
Es wird zu prüfen sein, wieweit man die bereits geleistete Arbeit bei der SWD für solche zukünftige Entwicklungen noch fruchtbringend nutzen kann. Dabei sollte nicht verschwiegen werden, daß man sich natürlich auch bei der Libray of Congress die gleiche Frage hinsichtlich ihrer Schlagwortliste stellt. Zumindest war BIBLIOFILE vor sechs Jahren und dann das Angebot der DB auf CD-ROM, ein erfreulicher Schritt nach vorn und schenkte uns damit die Hoffnung auf eine wachsende Einsicht in diese Informationstechnologie. Sie zeigte aber auch, daß es wesentlich einfacher ist eine alte Technologie durch eine neue zu ersetzen, als Langzeitprojekten, in denen Menschen engagiert tätig sind, eine neue Richtung zu geben.
Amerikanische Kollegen haben 1985 auf Schloß
Reisensburg, beim International Symposium "The Future of
Academic Libraries" der UB Ulm, deutsche Bibliothekare aufgefordert
an einem neuen Thesaurus der NLM (National Library of Medicine),
dem UMLS (Unified Medical Language System) mitzuarbeiten und
sind auf schlichtes Unverständnis gestoßen. Weil
dieses Erschließungssystem, dessen Aufbau bis in das nächste
Jahrtausend dauern wird, nicht nur für
Literatur und für Krankenakten gedacht ist, sondern auch
für den Einsatz in Wissensbanken. Für Expertensysteme fühlte
man sich damals verständlicherweise hier nicht zuständig.
Datenbanken von heute bieten nicht nur die gezielte Suche nach bestimmten
Fakten, Begriffen oder Zusammenhängen, sie stellen
zunehmend Programme und Funktionen zur Verfügung,
mit denen sich die Inhalte in Relation setzen lassen,
Vergleiche gezogen werden können oder die
sogar Schlußfolgerungen anbieten. In einer solchen Zeit
mit großem Aufwand an einem Sacherschließungssystem zu
arbeiten, wie es vor der Entdeckung der Computer angezeigt war, ist
auf die Dauer zu teuer.
Die Bibliothekare können die Entwicklungen der 4. und 5. Computergeneration nicht so achtlos übergehen, wie sie es zur Zeit noch tun. Wenn Maassen(18) zum Engagement der Kollegen aufruft um "die Mängel der RSWK so zu reduzieren, daß Fachreferenten aller Fachrichtungen mit diesem Regelwerk leben können" um "doch noch ein brauchbares Regelwerk für das Jahr 2000" zu schaffen, dann fragt man sich, ob die Informationsverarbeitenden Systeme moderner Prägung in den Bibliotheken auf Jahrzehnte hinaus ignoriert werden sollen.
Man muß bekanntlich nicht alle Möglichkeiten der Technik
nutzen, man sollte es auch nicht, aber die sozial wirksame Gewalt technischer
Möglichkeiten zu unterschätzen, ist eine Frage der Professionalität
und die ist unter Beibehaltung veralteter Methoden
effektiv in Gefahr. Daran kann auch die Ausbildung solange nichts ändern,
als sie unter dem Sachzwang steht die reale Bibliothekslandschaft
mit RSWK, RAK und PI zu berücksichtigen, während
die Problematik der Wissensbanken, der Expertensysteme, der
automatischen Indexierung, der Bildverarbeitung, etc. virulent wird.