Logo

To the homepage of Prof. Dr. Walther Umstätter
To the publicationlist 1970 - 1985 - / - To the publicationlist 1986 - 1990
To the publicationlist 1991 - 1995 - / - To the publicationlist 1996 - 2000


Published in: Nachr. f. Dok. 43 (4) S.227-242 (1992)

Die Skalierung von Information, Wissen und Literatur

Walther Umstätter, Fachhochschule für Bibliotheks- und Dokumentationswesen Köln

Zusammenfassung:

Daß Bits die kleinste Einheit der Information sind, kann als allgemein bekannt vorausgesetzt werden, daß man aber damit nicht unbedingt die Speicherform der Computer verwechseln darf, ist schon weniger bekannt. So beobachtet man immer wieder den Trugschluß, daß Bits lediglich die Informationsmenge in elektronischen Systemen beschreiben, aber beispielsweise nicht in geistigen Werken oder die des Wissens. Dies wäre aber so, als behauptete man, die Länge zwischen zwei Punkten ließe sich in Metern bestimmen, aber nicht die des Menschen. Es ist daher wichtig, deutlich zu machen, daß wissenschaftliche Literatur über weite Strecken Wissen als eine Form kompakter, d.h. begründeter Information enthält und daß der Mensch in Poppers Welt III damit ein Optimum im Verhältnis von Information und Redundanz anstrebt. Redundanz ist nicht nur für die Sicherung der Information von Bedeutung, sie ist auch für die Entstehung neuer Information unabdingbar. Wir müssen auch klarer zwischen Information und Interpretation unterscheiden. Die Interpretationstheorie kann bekanntlich in der Semiotik auf eine lange Entstehungsgeschichte zurückblicken. Informationswissenschaft stellt sich bei näherer Betrachtung als das bislang fehlende, allumfassende Bindeglied zwischen Geistes- und Naturwissenschaft dar und das Bit als Grundeinheit der Veränderlichkeit an sich. Informationswissenschaft benötigt mehr denn je eine solide Grundlage in der Ausbildung.

Abstract:

It is well known, that the bit is the smallest unit of information. But in most cases this unit is used for the memory of computers. So we can observe often that people believe, that bits can only contain the information in electronic systems but not in intellectual publications or in knowledge. This is like the assertion that a distance between two points can be measured by metres but not the length of a human person. It's necessary to make evident that scientific literature contains in many cases knowledge, i.e. information in compact form, or proved information. The relation of information and redundancy has to be brought into an optimum in Poppers world III. Redundancy is not only important for the information security, it is also necessary for creation of information. We have to distinguish precisely between information and interpretation. The theory of interpretation as a part of semiotics looks back to a long history. Information science at a more closely view is the all-embracing missing link between the Arts and the Sciences. And the bit appears as the fundamental unit of change. Information science today, needs more than ever before, a solid basis of education.


Information als Modewort

Daß Information als Modewort heute in unzähligen Bedeutungen erscheint, ist sicher verwirrend und für die Informationswissenschaft leider auch hinderlich. So diskutierte Michael K. Buckland (1991) kürzlich die Mehrdeutigkeit von Information als Prozeß, als Wissen und als Ding, wobei er zu dem Schluß kommt, daß alles Information ist oder sein kann, ohne darauf einzugehen, was Information nun wirklich auszeichnet. Auch Wenzlaff, B. hat in den Nachrichten für Dokumentation 1991, wie viele vor ihm, auf die zumindest scheinbar offenen Fragen in diesem Bereich erneut hingewiesen und eine Erweiterung des physikalischen Weltbildes gefordert. Wenn es dort heißt: "Die Information als ein Objekt und die Wirkung dieses Objektes als Steuerung zu beschreiben, kann nur als Problemverdrängung, nicht jedoch als eine Problemlösung angesehen werden." und im übernächsten Satz: "Die Information als ein 'rein energetischer Vorgang' bleibt für alle Interpretationen offen", dann fragt man sich, von welchem Informationsbegriff hier ausgegangen wird. Information als Bit, kann weder ein Objekt sein noch ein rein energetischer Vorgang. Dabei wird zum Ersten die Feststellung: DNS trägt Erbinformation mit DNS ist Erbinformation verwechselt. Zum Zweiten wird behauptet: Information müsse selbst Energie sein, da sie sonst kein wissenschaftlicher Gegenstand im Rahmen der Physik werden könnte. Als gäbe es in der Physik keine Masse und keine Beschleunigung. Gerade dieses Beispiel macht deutlich, wie irreführend und unbefriedigend die Diskussion im Informationsbereich zur Zeit ist.

Die Tatsache, daß der gemeine Sprachgebrauch "Information" sehr unbestimmt benutzt, ist kein Grund für die wiederholt geäußerte Annahme der Unbestimmbarkeit. Auch das Wort Kraft wird sehr unbestimmt, z.B. im Sinne von Stärke, Leistung, Energie, etc. oder auch bei Kraft seines Amtes, Kraftausdruck bzw. hypnotische Kräfte benutzt, und trotzdem ist seine wissenschaftliche Bedeutung von der Physik her, mit

Kraft = Masse x Beschleunigung

fundamental definiert. Ein Physikstudent, der dies nicht weiß, fällt durch die Prüfung. Behauptet dagegen ein Student im Informationsbereich z.B., Fachinformation könne als "Rohstoff" bezeichnet werden, so kann er sich dabei auf eine so bekannte Persönlichkeit wie den Bundesminister für Forschung und Technologie (1985) berufen.

Man könnte dies natürlich auch nur als eine griffige fachinformationspolitische Äußerung werten und damit sozusagen als Floskel übergehen. Aber auch im FI-Programm 1990/94 taucht diese "Floskel" wieder auf, und wird von den sicherlich wissenschaftlich ausgebildeten Beratern des Bundesministers mit halbseitiger, wenn auch wenig erhellender, Farbgrafik hervorgehoben. Bemerkenswerterweise heißt es dort auch gleich im ersten Satz: "Fachinformation ist das Wissen, das ... in Wirtschaft und Staat benötigt wird." Hier wird also Information und Wissen direkt gleichgesetzt, ganz im Sinne Wersig, Kuhlens (1991), u.a. (Budin, G. 1991), die "Information als Wissen in Aktion" definieren.

Solange allerdings "Informationswissenschaftler" definitorisch auf so schwankendem Boden basieren, werden sie unmöglich zu einer Wissenschaft gelangen können. Information ist bereits von Norbert Wiener klar von Materie und Energie abgegrenzt worden und seit Shannon und Weaver (1949) definiert. Die sich aus dieser Festlegung ergebenden Konsequenzen sind allerdings von fast unüberschaubarem Ausmaß, weil wir uns natürlich noch immer am Beginn einer neuen Wissenschaft befinden, die sozusagen Naturwissenschaft und Geisteswissenschaft verbindet. Daß Information in Belehrung, Botschaft, Unterrichtung, Orientierungshilfe, Wissen, Sehen, Hören, Fühlen, etc. enthalten ist (Folbert, O.G. und Hackl, C. 1986), und oft nachweislich mit Signal, Nachricht, Redundanz, Noise, etc. verwechselt wird, zeigt also keinesfalls, daß sie unbestimmbar wäre. Es ist vielmehr unsere Aufgabe, über die Konsequenzen der Formel des Mittleren Informationsgehaltes nachzudenken und zu prüfen, wieweit ihre Gültigkeit reicht. Daß dies auch eine eminente Bedeutung im sozialwissenschaftlichen, edukativen, politischen oder Wirtschaftsbereich hat, liegt auf der Hand. So schreibt Kleinbart, P. (1991), daß eine der entscheidenden Entdeckungen des Informationszeitalters die Erkenntnis war, daß Information quantifiziert und verkauft werden kann. Und etwas später: Der Manager der neunziger Jahre wird die Welt als einen Wirtschaftsmarkt und "information as the lifeblood of his commercial activity" begreifen müssen. Ein Grund für die Entstehung des Informationsmanagements aus der Sicht der Wirtschaftler.

Der Warencharakter der Information ist immer wieder beschworen worden, wobei sein monopolistischer Charakter fast nur bei Patenten realisiert wird (Umstätter, W. 1989).

Die große Verwirrung im Informationsbereich rührt natürlich daher, daß hoch redundant behauptet wird, daß die sogenannte syntaktische Information neben der semantischen und der pragmatischen für viele Bereiche nur sehr bedingt brauchbar ist, und daß wir daher nur sehr wenig über die wirkliche Bedeutung der Information wissen. Shannon selbst verleitete vermutlich zu dieser Auffassung, indem er schrieb, daß der semantische Aspekt der Kommunikation für den Ingenieur irrelevant sei. Dieser Schluß ergibt sich bekanntlich aus der Informationstheorie, nach der z.B. der Bildschirm mit dem rein zufälligen Pixelmuster, das für uns Menschen normalerweise gar keine Information enthält, den maximalen Informationsgehalt aufweist.

Dabei darf allerdings nicht vergessen werden, daß es eben die Prämisse der Information und Kommunikation ist, daß Sender und Empfänger den gleichen Zeichenvorrat besitzen, d.h. daß nur interpretierbare Signale als Information gewertet werden können. Der Bildschirm mit dem rein zufälligen schwarz-weißen Pixelmuster hat also nur unter der Bedingung der Interpretierbarkeit den höchsten Informationsgehalt. Trotzdem erscheint es uns auf den ersten Blick unsinnig, daß die Information am größten sein soll, wenn wir am wenigsten Ordnung darin erkennen. Bei einer Umkehrung dieser Beziehung wird aber rasch deutlich, daß ein völlig weißer oder schwarzer Bildschirm zum Informationsgehalt Eins bzw. Null führt. Die Information ist dagegen tatsächlich am größten, wenn eine äußerst Komplexe Struktur kodiert wird, die allerdings noch als Struktur identifizierbar bleiben muß. Als interessanter Gedanke drängt sich das "definierte Chaos" als maximale Information auf.

Was wir über Information "wirklich" wissen

Bereits Hartley definierte 1928 Information als die sukzessive Auswahl von Zeichen oder Wörtern aus einer gegebenen Liste. Daraus entwickelte Shannon die Formel für den Mittleren Informationsgehalt

H = -p log p ,

woraus Shannon und Weaver schlossen, daß "information turns out to be exactly that which is known in thermodynamics as entropy".

Nach Boltzmann ist die Entropie

S = k log W, wobei

k = Boltzman'sche Konstante und
W = thermodynamische Wahrscheinlichkeit bedeutet.

Schrödinger hat für W die Größe D = Maß für die atomistische Unordnung eingeführt, wobei die Inverse, 1/D entsprechend als Maß für die Ordnung angesehen werden kann. Er kommt so zu der umgeformten Boltzmann'schen Gleichung

-S = k log (1/D),

bei der wir auch von der sogenannten Negentropie sprechen.

Information ist damit eine invers-exponentielle Funktion der Entropie.

Wenn wir nun nach Stonier (1989) den strukturellen Informationsgehalt eines Systems I als Funktion der Ordnung 1/D betrachten

I = c 1/D

wobei c eine Konstante sei, so gilt für

S = k log (c/I) und

I = c e -S/k.

Diese beiden Gleichungen implizieren, daß für die Bedingung I kleiner c die Entropie negativ wird, und daß mit zunehmend negativer Entropie, die Information immer rascher gegen unendlich geht. Daß die Information auf Null sinkt, wenn die Entropie ins unendliche steigt, ist naheliegend. Damit wäre dort jede strukturelle Ordnung in Energie aufgelöst. Die beiden fundamentalen Größen Materie und Energie sind so durch die Information bzw. die Entropie miteinander verbunden. Information, im Gegensatz zur Entropie, kann jedoch nie negative Werte erreichen. Da nach dem 3. Hauptsatz der Wärmelehre von Walther Nernst, der absolute Nullpunkt unerreichbar ist und dort die Entropie gegen Null geht, sollte man annehmen, daß auch eine negative Entropie nicht erreicht werden kann. Damit müssen wir davon ausgehen, daß der Wechsel von der positiven zur negativen Entropie und damit zu allen Informationsgehalten größer c, auch ein Wechsel von der thermodynamischen Physik in den informationstheoretischen Teil dieser Welt ist.

Es ist wichtig, sich dabei bewußt zu machen, daß die Information als eine statistische Größe auftaucht, die den Ordnungsgrad nach dem fundamentalen Kriterium der Wahrscheinlichkeit und nicht nach räumlichen oder zeitlichen Zuordnungen bestimmt. Nun hat Stonier (S.126 ff. 1990) versucht, vergleichbar den Phononen, Fermionen oder Bosonen, Information in Form von "Infonen" zu postulieren, die den Charakter von Partikeln ohne Masse und Energie haben sollen. Dabei weist er darauf hin, daß "Our universe is filled with examples in which changes in organisation patterns - by definition, changes in information states - result in the appearance of waves or particles. Phase waves, for example, represent information superimposed on a carrier wave."

Leider unterlaufen Stonier allerdings zwei wesentliche Fehler.
1. betrachtet er Information als eine vom Empfänger unabhängige Realität und verwechselt sie so mit dem Signal, wobei er durchaus richtig bemerkt: "Meaning involves the interpretation" (S.18 1990). Interpretation, bzw. die Kodierung und Dekodierung von Signalen ist aber unabdingbare Randbedingung der Information. So definiert die Concise Encyclopedia of Information Technology (Stokes, A.V. 1982) Information als "The meaning attached to data." und das Dictionary of computing and new information technology (Meadows, A.J. et al 1984) als "Data processed and assembled into meaningful form."

2. behauptet er: "If distance d, time t, and direction, are forms of information, then 'velocity' - ... - must be a form of information; and ... 'acceleration' (...) must also be a form of information." (S.30 1990). Dies entspricht aber nicht seiner eigenen Festlegung der Information als wahrscheinlichkeitstheoretische Ordnung.

Da Information erfahrungsgemäß immer an Materie gebunden ist, bleibt sie ebenso wie die Entropie nicht unverändert. Beide sind gleichermaßen ungeeignet, Ware zu sein, schreibt Norbert Wiener (1964). Und auf S.112: "Der Gedanke, daß Information in einer sich ändernden Welt ohne merkbare Minderung ihres Wertes gestapelt werden kann, ist falsch."

Die hohe Bedeutung der Redundanz

Unbeschadet von diesen Feststellungen gilt nach der Shannon und Weaver'schen Gleichung natürlich weiterhin die Aussage, daß Information die Beseitigung oder besser die Reduktion von Ungewißheit bedeutet. Das impliziert genau genommen, daß wir immer nur über Dinge informiert werden können, von denen wir bereits Kenntnis haben, da jede Information, die uns als Empfänger trifft, nur eine Auswahl aus dem möglichen Symbolvorrat ist. Dagegen ist die Redundanz ein Maß für den Teil der Nachrichtensymbole, die eigentlich überflüssig sind, weil sie keine neue Information transportieren. Trotzdem sollte man die Bedeutung der Redundanz für die Sicherung der Information nicht unterschätzen. Sie wird in dem Moment zu Information, in dem das wachsende Rauschen die ursprüngliche Information zerstört.

Die Redundanz R ergibt sich aus dem Verhältnis von

H = mittlerer Informationsgehalt zu

Hmax = maximaler Informationsgehalt, nach

R = (Hmax - H) / Hmax = 1 - H / Hmax

oder

R = 1 - ld (verwendete Kodewörter) / ld (mögliche Kodewörter).

Wir erkennen daraus, daß Redundanz nicht nur keine Information im eigentlichen Sinne ist, sie ist vielmehr der Anteil, den wir von der Information abziehen müssen.

Andererseits ist Information ohne Redundanz völlig wertlos, da sie keine Verläßlichkeit mitbringt. Die Höhe der notwendigen Redundanz ist abhängig vom Noise, der mit der Information einhergeht. Nun gibt es allerdings bei der Datenübertragung verschiedene Arten der Redundanz.

1. Die Redundanz im fehlerprüfbaren Kode

2. Die Redundanz im fehlerkorrigierbaren Kode

Die einfachste Form der Redundanz ist die der Wiederholung. Die eleganteste Form ist sicher die, die wir mit Hilfe unseres Wissens erzeugen, in dem wir jede Information darauf prüfen, wieweit sie sich aus den bereits vorhandenen Informationen ableiten läßt. Unter diesem Gesichtspunkt ist also Wissen Information mit dem notwendigen Maß an Redundanz zur Absicherung dieser Information. Wir könnten auch sagen, daß Wissen im eigentlichen Sinne Information in kausal abgeleiteter Vernetzung ist (Umstätter, W. 1991).

Fachinformation muß daher weit über reines Wissen hinausreichen und tut dies auch. Wir benötigen eine Unzahl von Daten und Fakten, um Fachwissen zu erzeugen. Daß dieses Fachwissen in Wirtschaft und Staat dringend benötigt wird, dürfte, soweit es sich wirklich um Wissen handelt, außer Zweifel stehen. Wir gewinnen viele unserer Informationen direkt aus Messungen und Beobachtungen in Natur und Technik. Dies macht deutlich, daß Information unmöglich nur auf das Wissen in Aktion verkürzt werden kann. Eine solche Festlegung führte zwangsläufig zu der Annahme, daß z.B. Informationen, die von einem Computer zu einem anderen übertragen werden, ein Wissen bedingen. Damit entstünde eine heillose Begriffsverwirrung. Ganz abgesehen davon, daß die Unterscheidung von aktivem und passivem Wissen (Wissen in Aktion) in diesem Zusammenhang schwer nachvollziehbar ist.

Die Rolle der Interpretation

Kommen wir damit auf die sogenannte semantische und pragmatische Information zurück. Morris selbst, von dem diese Unterscheidung1938 stammte, und die dann von Peirce und Carnap aufgegriffen wurde, bedauerte 1946 selbst ihre Mehrdeutigkeit. Bis in die heutige Zeit finden wir eine erhebliche Verwirrung in der Literatur zu diesem Thema, worauf u.a. Lyons, J. (1979) hinweist. Auch Bar-Hillel und Carnaps Versuche, die semantische Information zu quantifizieren, hat, soweit sich erkennen läßt, zu keiner brauchbaren Anwendung geführt.

Der Grund dafür scheint mir in einem einfachen, aber verbreiteten Mißverständnis zu liegen. Die pragmatische Information, nach Morris als "the relation of signs to interpreters" zu definieren, bedeutet eigentlich nur, Information mit Interpretation gleichzusetzen. Nach der Informationstheorie ist, wie bereits erwähnt, der semantische Aspekt der Information irrelevant. Die Informationstheorie setzt eine gleiche Kodierung bei Sender und Empfänger voraus. Über die Art dieser Kodierung und damit über die Interpretation, macht sie keine Aussagen. Dagegen kann die Interpretation von Zeichen auf verschiedensten Strukturen gründen, auf einem einfachen Binärbaum oder auf äußerst komplexen Nervennetzen. Es ist gerade die Stärke der Informationstheorie, eine allgemeine davon unabhängige Bedeutung zu haben. Interpretation ist damit eine Randbedingung der Information, sie darf aber nicht mit Information verwechselt werden.

Die Interpretationstheorie ist Gegenstand der Semiotik, die als eine sehr alte Disziplin sich schon immer mit der Frage der Zeichenbedeutung beschäftigt hat, - weit bevor wir eine Informationstheorie besaßen. Auch wenn in dem, was wir unter Semiotik zusammenfassen können, erhebliche Widersprüchlichkeiten auftreten, und wir hier beiweitem keine der Informationstheorie vergleichbare Basis vorfinden, so müssen wir doch davon ausgehen, daß in der realen Welt die Kodierung bei Sender und Empfänger nur selten vollständig übereinstimmt. Kommunikation zwischen zwei Personen gelingt daher auf der Basis einer vergleichbaren Genetik und Umwelt. Ihre Erfahrung führt zu entsprechenden kommunikationsfähigen Kodierungen. Dabei muß die sogenannte semantische Information, als "the relations of signs to the objects to which the signs are applicable", im Interpretationsapparat sozusagen ein begriffliches Abbild haben. Es führt hier zu weit, über die Entstehungsmöglichkeiten solcher Interpretationssysteme zu diskutieren, da aber auch die physikalische Welt Informationen an den Menschen aussendet, ist klar daß unser sogenanntes Weltbild nichts anderes ist, als ein kodiertes Interpretationssystem unserer wahrnehmbaren Umwelt - ein inneres Modell.

Die Interpretationssysteme sind für die Entscheidung verantwortlich, welche ähnlichen Signale zu einer Äquivalenzklasse zusammengefaßt werden und welche Bedeutung diese kategorisierten Begriffe durch ihren Platz im Interpretationsbaum erhalten. Je mehr Signale unter einem Begriff kategorisiert werden, desto redundanter wird dieser erscheinen. Die Entstehung bzw. Konstruktion optimaler Interpretationssysteme ist das eigentliche faszinierende Problem einer solchen Interpretationstheorie. "Unsere gesamte Begriffsbildung führt zu einem System abgestufter Ähnlichkeiten." schreibt Schneider, H. (1978), und führt mit Recht die Systematik der Natur an, sowie die assoziativ magischen Vorstellungen der vorwissenschaftlichen Zeit.

Was Information auch nicht ist

Der Gedanke, daß wir Information wie einen Rohstoff in unserem Denken veredeln, ist natürlich naheliegend. Er ist aber eher eine Assoziation als eine wirkliche Überlegung. Denn bei näherer Betrachtung der gedanklichen Folgen zeigt sich rasch, daß dieser sog. Rohstoff lediglich ein immaterieller Vergleichsparameter dessen ist, was wir bekanntlich selbst durch das Denken erzeugen. Auch die Beobachtung, daß an der Börse im eigentlichen Sinne keine Rohstoffe gehandelt werden, sondern lediglich die Informationen anstelle der Rohstoffe, ist natürlich noch kein hinreichender Grund für ihre Gleichsetzung. Dieses Beispiel zeigt vielmehr den eigentlichen Charakter der Information, als geistiges Äquivalent aller realen und irrealen Erscheinungen. Aber natürlich nur als Zeichen in einem Kommunikationssystem. Information ist immer nur das Abgleichen des eigenen Informationsspeichers mit dem des Senders. Folglich gibt es auch keinen Informationsverbrauch.

Wenn wir also von Information als etwas käuflichem, etwas verwendbarem sprechen oder von etwas das wir veredeln können, so ist es sicher richtig, daß Information einen Wert hat, und daß sie die Basis gedanklicher Folgerungen darstellt. Dies ist aber kein Charakteristikum der Information. Vielmehr ist es ein Charakteristikum des Geldes, eine Wertrelation für alles zu schaffen, was mit Geld erkauft oder erreicht werden kann. Es führt auch nur zu Mißverständnissen, wenn das gedankliche Verarbeiten von Informationen, also das Denken bzw. das Erzeugen von Wissen, mit dem einfachen Interpretieren bzw. Dekodieren von Zeichen verwechselt wird.

Die Sichtweise Debons, A. (1974) "information as both a process and a commodity" zu betrachten, ist zwar allgemein verbreitet, aber damit noch keineswegs eine legitime Definition. Auch die Ansicht von Whittemore, B.J. and Yovits, M.C. (1974), daß Information dadurch gekennzeichnet ist, daß sie zu Entscheidungen führt, macht immer wieder deutlich, daß hier die Konsequenzen aus der Informationstheorie mit ihrer Definition verwechselt wird.

Da wir gesehen haben, daß der Informationsgehalt bei wachsend negativer Entropie einen unendlich hohen Wert erreicht, können wir nicht davon ausgehen, daß eine größere Akkumulation von Informationen jemals Sättigungserscheinungen aufweisen wird. Information ist damit im Gegensatz zu Rohstoffen auch nicht als begrenzte Größe anzusehen. Ebenso dürfte die Anwendbarkeit des Gossenschen Bedürfnissättigungsgesetzes, wie wir es für normale Waren kennen, hier sehr fraglich sein. Information erzeugt grundsätzlich einen Bedarf an neuen Informationen und nur für kurze Zeiträume einen Grenznutzen. Es steht sogar zu befürchten, daß jedes gelöste Problem in unserer Gesellschaft zwei neue Probleme auslöst (Umstätter, W. 1984).

Eine andere Frage ist die der Alterung. In allen uns bekannten Fällen haben wir bei Informationsträgern Verluste durch Alterung. Anders gesagt, Information ist auf Dauer immer von Dissipation begleitet, gleichgültig ob es sich um elektromagnetische Wellen im Raum, um Pits in einer CD-ROM oder um Lettern handelt, die in Stein gehauen sind. Diese Alterungserscheinung, auf die bereits Norbert Wiener hingewiesen hat, wird oft vernachlässigt, obwohl sie in der Informationslogistik von fundamentaler Bedeutung ist. Information muß also beständig restauriert, wiederholt und neu abgeglichen werden. Zeitlose Information existiert nicht. Information verändert vielmehr ihre Bedeutung, wenn sich das Interpretationssystem wandelt, wodurch sich z.B. auch der Wert einer Information drastisch verschieben kann.

Da der Wert einer Information immer vom Empfänger abhängt, ist es sinnvoll, die Wertbestimmung auch am Empfänger zu orientieren. Das kann im einfachsten Fall dadurch geschehen, daß Information möglichst direkt in ihrer Anwendung vermarktet wird. So bezahlen wir bei fast allen Hochtechnologie-Produkten in erster Linie das sog. Know-how, während bei Produkten, deren Herstellung weit verbreitet ist, vorwiegend Energie-, Zeit und Materialverbrauch zu Buche schlagen. Je weiter eine Information von ihrer Wirksamwerdung entfernt wird, desto mehr Zeit vergeht zwischen Sender und Empfänger. Dabei kann z.B. ein Programm für einen Computer von mehreren Personen erworben und wieder veräußert werden. Sein Wert entscheidet sich erst in der Anwendung von Rechnern mit passendem Betriebssystem. Daran ändert sich auch nichts, wenn einige der Zwischeneigentümer Verbesserungen vornehmen. Ihre Wertbestimmung basiert auf der Spekulation und der Risikoeinschätzung späterer Einsatzmöglichkeiten.

Nun sollte man annehmen, daß ein Bit immer ein Bit bleibt und damit durchaus zeitlos sein kann. Da aber jedes Bit seine Bedeutung zwangsläufig aus der Syntax seiner Vorgänger ableitet und somit immer eine zeitliche Folge bzw. Syntax darstellt, kann es nicht zeitlos sein. Dies gilt auch für parallelprozessierende Systeme, die zwar mehr als ein Bit gleichzeitig interpretieren, aber natürlich nie unendlich viele Bits.

Das Bit

Der duale Entscheidungsbaum der Bitkodierung ist die komprimierteste Form der Nachrichtenverschlüsselung und damit eine Möglichkeit, redundanzfrei zu kodieren.

Nun hat Cordonier, G. bereits 1960 angedeutet und Körner (1980) versucht nachzuweisen, daß das theoretische Maximum von Entscheidungen pro Ebene nicht bei 2, sondern bei 2,718 liegt. Da

Z = b (exp n), wobei

Z = Zeichen, b = Zweige pro Ebene, n = Zahl der Ebenen.

Die Entscheidungen insgesamt ergeben sich nach Körner mit

E = b x n.

Leitet man

Z = b (exp E/b)

nach b ab, und setzt dZ/db = 0, so folgt, lnb = 1 oder b = 2,718 (Basis des natürlichen Logarithmus e).

Da wir aber z.B. beim dualen System pro Ebene nicht zwei sondern nur eine Entscheidung fällen, ist die Zahl der Entscheidungen insgesamt nicht E = b x n sondern E = (b-1) x n. Für Z folgt

Z = b E / (b-1),

eine Funktion die damit kein Maximum bei e hat, sondern stetig steigt.

Um z.B. etwa eine Billion verschiedener Zeichen zu kodieren, bräuchte man bei

1 Entscheidung(en) / Ebene, d.h. 40 Ebenen, bei
2       "              "         25   "      "
9       "              "         12   "    und bei
9999    "              "          3   " .
Berücksichtigt man alle Entscheidungen, so ergeben sich insgesamt entsprechend
   1 x 40 =    40 Entscheidungen
   2 x 25 =    50       "
   9 x 12 =   108       "
9999 x  3 = 29997       "
Wir sehen also, daß eine Kodierung mit einer größeren Zahl von Entscheidungen pro Ebene durchaus möglich wäre, allerdings erhebliche Redundanzverluste brächte.

Die Skalierung der reinen Information folgt also dem Logarithmus Dualis und ist für unser normales Handeln bei der Quantifizierung und dem Verkauf von wirklicher Information höchst hinderlich, da wir schon aus Gründen der Einfachheit im allgemeinen gewohnt sind, Waren mit einer etwa linearen Mengenabhängigkeit zu bewerten. Abgesehen von Mengenrabatten gehen wir davon aus, daß z.B. 10 Meter Stoff das Zehnfache von einem Meter kosten. Dagegen müßte natürlich jedes Bit neue Information den Doppelten Wert des bisherigen haben, bzw. das 11te Bit den tausendfachen Preis des ersten Bits. So wie wir in der Informatik auch zwischen dem "least significant bit" und dem "most significant bit" unterscheiden müssen.

Wenn dieses Preisbewußtsein in keiner Weise unserer wirklichen Erfahrung entspricht, so liegt das daran, daß wir nur selten reine Information erwerben können. Der weitaus größte Teil an Nachrichten, die wir im realen Leben angeboten bekommen, sind wertlos, weil redundant, oder rauschend, weil unbrauchbar bzw. störend. Betrachten wir beispielsweise einen längeren Text, den wir als Nachricht erhalten. So ist informationstheoretisch schon jeder Buchstabe, jedes Wort und jeder Satz mit einer ausreichenden Menge an Redundanz versehen, um möglichst sicher zu stellen, daß durch etwaige Übertragungsfehler oder auch durch zeitweilige Konzentrationsschwächen des Empfängers keine wesentlichen Informationsverluste auftreten. Nach Zemanek (1959) beträgt der mittlere Informationsgehalt eines Buchstabens der deutschen Sprache, entsprechend seiner Vorkommenshäufigkeit (wenn nur 30 Großbuchstaben berücksichtigt werden) 4,11 Bit. Hmax ist entsprechend 4,9 und R = 0,16. Berücksichtigt man allerdings auch die gegenseitigen Beziehungen der Buchstaben in den Worten, so sinkt die Information auf etwa 1 Bit pro Buchstabe (Steinbuch, K. 1977). Dieser Wert wird noch weit stärker reduziert, wenn wir die Redundanz innerhalb der Sätze berücksichtigen und darüberhinaus die Tatsache, daß viele Sätze reine Wiederholungen bekannter Tatsachen sind - also früher schon einmal gesendet wurden. Wir müssen folglich davon ausgehen, daß der Informationsgehalt eines Bytes in einem zusammenhängenden Text für den Leser nicht 8 Bit, sondern eher ein Hundertstel oder weniger beträgt.

Wir sind, wie die Diskussion der letzten Jahre immer deutlicher zeigt, im allgemeinen nur wenig an dem interessiert, was man landläufig als Information bezeichnet, als vielmehr an Wissen. Weil Wissen als begründete Information uns eine vergleichsweise hohe Sicherheit dafür gibt, daß die empfangene Information auch korrekt ist. Es reduziert die überflüssige Redundanz und den Noise. Als Alternative bevorzugen wir Information aus Quellen, die unser Vertrauen genießen, also Personen, Zeitschriften oder Beobachtungen, deren Zuverlässigkeit wir aus guter Erfahrung kaum anzweifeln.

Die Eigenschaft des Bit's macht allerdings noch ein weiteres Phänomen deutlich. So wie die Masse in Kilogramm und die Kraft in Newton meßbar ist, und damit auch die Eigenschaften dieser physikalischen Größen erkennbar werden, zeigt das Bit das Charakteristikum einer Entscheidung bzw. einer Änderung oder Ungleichförmigkeit. Insofern entspricht Information, wohl am ehesten einer Beschleunigung in der Physik, wie auch Stonier bemerkt. Information ist damit Veränderung jeder Art in Raum und Zeit. Während also die gleichförmige Bewegung informationstheoretisch reine Redundanz darstellt - ein Körper bewegt sich mit konstanter Geschwindigkeit und Richtung weiter wie bisher - ist die erste Ableitung der Geschwindigkeit nach der Zeit, einer syntaktischen Änderung vergleichbar. Damit sind stabile, gleichförmig ablaufende Zustände von instabilen, d.h. solchen mit starker Veränderung, dadurch unterschieden, daß sie wahrscheinlicher sind, weil sie länger andauern. Physikalische Konstanten sind nach Stonier (S.29 ff 1990) ein Zeichen für die Information in einem System. Präziser gesagt, sind sie die Redundanzen, die uns den Informationsgehalt eines Systems deutlich machen.

Wir erkennen damit, daß die Veränderung bzw. die Beschleunigung als fundamentale Größe neben Kraft und Masse erscheint. Nach Einstein gehen wir davon aus, daß "die 'träge Masse' eine charakteristische Konstante des beschleunigten Körpers ist.", und daß die Beschleunigung bei gegebenem Schwerefeld unabhängig von der Natur und dem Zustand des Körpers existiert. Damit sind die schwere und die träge Masse eines Körpers einander gleich. "Die bisherige Mechanik hat diesen wichtigen Satz zwar registriert, aber nicht interpretiert." Dies geschah erst durch die Verallgemeinerung der Relativitätstheorie (Einstein, A. 1920).

Information als Grundgröße der Veränderlichkeit gegenüber einer gegebenen Situation, ist wohlgemerkt keine neue Definition des Informationsbegriffs, sondern lediglich eine neue Interpretation desselben. So wie viele sog. Definitionen der Information nichts anderes sind, als variantenreiche Folgerungen aus der Informationstheorie. Es ist auch kein Zufall, daß die allgemeine Relativitätstheorie deutlich gemacht hat, daß ein Beobachter in einem gleichförmig bewegten geschlossenen System keine Information erhält und damit in Ungewißheit lebt. Erst registrierbare Veränderungen setzt ihn in den Stand, diese Ungewißheit schrittweise abzubauen.

Die Halbwertszeit der Information

Wir können damit zusammenfassend feststellen, daß fast alle Nachrichten in Form von Vorträgen, Zeitschriften, Briefen, Mitteilungen, etc., die den Fachmann erreichen, nur relativ geringe Anteile an wirklicher Information enthalten, so daß man in erster Näherung davon ausgehen kann, daß z.B. durchschnittliche Zeitschriftenaufsätze eine etwa gleichbleibende Menge an Information anbieten, die mit dem üblichen und notwendigen Beiwerk an Einleitung, Begründung und Ausblick behaftet sind, um für sich verständlich zu sein. Damit einher geht auch die unvermeidbare Fehlerhaftigkeit in fast jedem Aufsatz. Für solche Publikationen gilt also durchaus unsere herkömmliche Erfahrung, daß zehn Aufsätze wahrscheinlich den Zehnfachen Informationsgehalt von einem Aufsatz haben. Dies gilt nicht zuletzt deswegen, weil diese Informationen meist kleine Mosaiksteine in einem unendlich großen Informationsmeer darstellen. Daneben haben auch Redundanzen für uns nach längerer Zeit wieder informativen Charakter, weil die Vergeßlichkeit, entsprechend dem Rauschen auf der Übertragungsleitung eines Kommunikationssystems, gespeicherte Informationen zerstört.

Erfahrungsgemäß enthalten neue Publikationen sinnvollerweise viele der relevanten Ergebnisse früherer Arbeiten, aber manchmal auch deren Widerlegung, so daß beim Lesen zunehmend alter Veröffentlichungen Redundanz und Noise wachsen. Dies spiegelt auch die sogenannte Halbwertszeit der Literatur wider, die sich sowohl im Zitierverhalten als auch in der entsprechenden Benutzung älterer Schriften zeigt. Sie beträgt in der sog. synchronen Studie, die zu einem bestimmten Zeitpunkt die Nutzung verschieden alten Materials untersucht, allgemein 4 - 5 Jahre. Für den Science Citation Index zeigt sich in den letzten 30 Jahren ein Wert gleicher Größenordnung, der allerdings wachsende Tendenz zeigt, weil insbesondere seit Ende der 70er Jahre überproportional Bücher und Reviews im SCI mit aufgenommen wurden. Das Zitationsverhalten gleicht somit einem Informationsfilter, beziehungsweise einem Selektionsmechanismus, bei dem Informationen permanent auf ihre Richtigkeit geprüft und in ein großes Wissensgebäude integriert werden (Umstätter, W. und Rehm, M. 1984).

Die diachrone Studie folgt der Nutzung bestimmter Publikationen im Laufe der Zeit (Line, M.B. und Sandison, A. 1974). Bei ihr liegt unter Berücksichtigung eines Literaturwachstums von etwa 15 Jahren Verdopplungsrate, die Halbwertszeit bei 6,4 Jahren. Dagegen zeigte eine Probe von 63 "mostly cited articles" (Garfield, E. 1977-1981) mit insgesamt 12122 ausgezählten Referenzen, (Die Untersuchung erfolgte im Rahmen einer Hausarbeit an der FHBD Köln von U. Beinke1984), die über 26 Jahre (SCI 1956 - 1982) verfolgt wurden, sogar eine Halbwertszeit von nur 3,2 Jahren. Wir erkennen daran, daß die "mostly cited articles" klar von den 4-5 % sog. "citation classics" der Weltliteratur zu unterscheiden sind. Sie verlieren rascher an Bedeutung als eine durchschnittliche Publikation, da ihre Information mit zunehmendem Bekanntheitsgrad in Redundanz oder bei ausgelöstem Widerspruch in Noise übergeht.

Dem widerspricht auch die Untersuchung von Arunachlam, S. and Singh, U.N. an 385 Zeitreihen nicht, wenn man das Wachstum des Science Citation berücksichtigt. Dort ergibt sich für 23 der stark zitierten Aufsätze eine bereinigte Halbwertszeit von 3.8 Jahren und nicht, wie Line (1985) vermutet, eine zunehmende Zitierung. Sein Versuch, zu zeigen, daß drei der insgesamt 385 Artikel von Arunachlam, S. and Singh, U.N. durch häufiges Zitieren immer häufiger zitiert werden, schlägt damit fehl. Dieses Ergebnis ist insofern erstaunlich, als es den viel zitierten Matthäuseffekt Mertons relativiert. Das wiederholte Zitieren bekannter Publikationen bezieht sich damit weniger auf bestimmte Aufsätze, als vielmehr auf die jeweils neusten Arbeiten ihrer Autoren. Es bleibt damit weiterhin eine bemerkenswerte Tatsache, daß viel zitierte Aufsätze von Anfang an eine hohe Beachtung finden oder nie. Die Ausnahmen sind selten. Den Leser interessiert weniger die Wiederholung von Bekanntem bekannter Autoren, als deren neuste Ergebnisse bzw. Informationen.

Für die "citation classics" zeigte sich interessanterweise eine Halbwertszeit, die annähernd der Verdopplungsrate der Literatur entspricht. So finden wir zwangsläufig eine zunehmende Halbwertszeit für alte Literatur, die noch immer zitiert wird. Ihr Maximum liegt bei 13 - 15 Jahren und damit in einer Größenordnung der Verdopplungsrate der Literatur. Zitationsklassiker werden damit sozusagen zeitunabhängig konstant oft pro Jahr zitiert. Über ihren Informationsgehalt könnte man damit die Aussage treffen, daß sie lediglich in permanenter Erinnerung gehalten werden. Mit anderen Worten: Wir zitieren Sokrates oder Descartes, weil die von ihnen angesprochenen Problem weitgehend ungelöst geblieben sind und in konstanter Erinnerung gehalten werden müssen. Ihre Gedanken enthalten für jede neue Generation wichtige Informationen.

Bei der Durchsicht allerneuster Literatur beträgt die Halbwertszeit etwa eine Woche (Umstätter, W. und Rehm, M. 1984). In dieser Zeit wird etwa die Hälfte der neu erschienen Publikationen von der Fachwelt durchgesehen. Wir können somit davon ausgehen, daß nach einem Monat fast 95% der Fachpublikationen ihr Publikum gefunden haben. Verfolgt man dagegen die Zahl der kopierten neu erschienenen Aufsätze in einer Universitätsbibliothek, so zeigt sich, daß die Aufsätze, die einer näheren Betrachtung unterzogen werden, einer Halbwertszeit von 5 Monaten unterliegen (Umstätter et al. 1982). Wir müssen also zwischen drei Arten der Informationsaufnahme in der Fachliteratur klar unterscheiden:

1. Das Durchsuchen der neusten Quellen nach Informationen.

t1/2 = 1 Woche

2. Das Studium und das Verstehen dieser Informationsinhalte.

t1/2 = 5 Monate

3. Die Diskussion in der Fachliteratur.

t1/2 = 5 Jahre

Die Tatsache, daß alle diese Untersuchungen zu Halbwertszeitfunktionen führen, macht deutlich, daß hier jeweils konstante Kräfte agieren, die mit einer stetigen prozentualen Abnahme pro Intervall wirksam werden. Daneben sind es die Wahrscheinlichkeiten, die uns im Literaturstudium leiten. Kein erfahrener Wissenschaftler wird seine Recherchen zu einem bestimmten Problem, in daß er sich einarbeiten will, bei alter Literatur beginnen. Er wird vielmehr versuchen, zunächst den neusten Stand der Diskussion zu ermitteln. Greift er dann zur Überprüfung der vorhandenen Untersuchungsergebnisse, der Behauptungen und der Hypothesen auf ältere Quellen zurück, so wächst zwangsläufig die Redundanz und der Noise. Wir erkennen daraus, daß die Zunahme der Redundanz eine Funktion der Vorgehensweise ist.

Während also Autoren mit jedem Aufsatz neue Redundanz erzeugen, wächst die Redundanz für den Informationssuchenden mit zunehmendem Alter der Literatur. Insofern sind die Halbwertszeiten der Literatur nur unter den gegebenen Umständen auch ein Maß für die Informationsabnahme mit dem Alter der Veröffentlichungen.

Das Verhältnis von Noise, Redundanz und Information

Eine der wichtigsten Aufgaben der Wissenschaft ist die radikale Bekämpfung von Noise und die Minimierung von Redundanz. Dabei muß möglichst klar zwischen Meinungsfreiheit in der Fachdiskussion einerseits und Unkenntnis schlecht ausgebildeter andererseits unterschieden werden.

Benutzen wir für die Auswahl von Publikationen ein Retrievalsystem, so verringern wir das Rauschen erheblich. Es wäre aber abwegig zu glauben, es würde sich bei jedem dieser Aufsätze um einen Informationsträger handeln. Abgesehen von den rund 50% der Treffer, die bei einer durchschnittlichen Recherche mit den bisherigen Retrievalmethoden unvermeidbarer Noise sind, erhalten wir meist weitere 30% Redundanz, weil wir ein Vorwissen haben und weil viele Autoren durch Mehrfachveröffentlichung ihrer Ergebnisse gegen den anderweitigen Noise anzukämpfen versuchen.

Wie häufig Autoren uns Leser lediglich für ihre eigenen Interessen zu beeinflussen suchen, die uns teilweise wenig interessieren, statt begründete Informationen in Form echten Wissens zu produzieren, dürfte jedem Leser ebenfalls geläufig sein. Diese Form von versteckter bis offener Reklame gehört zu den Informationsformen, die uns normalerweise geschenkt werden und uns daher am weitaus häufigsten treffen. Sie sind informationstheoretisch nicht selten als Redundanz oder Noise zu werten, die unsere Informationskanäle zu überfluten drohen, und deren einzige Information darin liegt, zu sehen, daß auch diese Publikation eine bestimmte Ansicht oder ein Paradigma unterstützt. Wenn also Maurice Line (1990) gern von "information litter" spricht, so meint er allem Anschein nach informationstheoretisches Rauschen und keine Information.

Durch die Vervielfältigung von Information in Kommunikationsmedien und natürlich auch in den Köpfen der Menschen, erzeugen wir ein hohes Maß an Redundanz. Bücher sind Kopien eines Autorenmanuskripts und damit natürlich reine Redundanz in unserer Gesellschaft, daß sie für den einzelnen Leser mehr oder weniger Information enthalten können, ist klar. Wir müssen uns damit bewußt machen, daß die sogenannte Informationsvermittlung nicht nur eine gesellschaftspolitische Redundanzvermittlung im eigentlichen Sinne ist, sie macht auch den weit unterschätzten Wert der Redundanz deutlich.

Informationsdienstleistung zeichnet sich bei näherer Betrachtung als eine Dienstleistung aus, bei der natürlich Information für den Endnutzer vermittlet wird, bei der aber der Dienstleister ausschließlich redundante Kopien vermittelt. Er hilft damit bei der Rauschunterdrückung, und, wie hinlänglich bekannt, bei der Vermeidung überflüssiger Doppelarbeit und überflüssiger Redundanz. Gefährlich ist dagegen die oft geäußerte Anschauung, der Dienstleister könnte die vermittelte Information in irgendeiner Weise vermarkten. Er hat vielmehr die Verpflichtung, darauf hinzuweisen, daß er lediglich für seine Dienstleistung bezahlt werden kann, keinesfalls aber für die Information, die wenn überhaupt, nur der Urheber veräußern darf. Dies gilt interessanterweise sogar für juristisch ungeschützte, allgemein zugängliche Informationen. Es sei nur an den klassischen Gedanken des "cogito ergo sum" erinnert, der möglicherweise hunderten von Menschen, ohne literarisch philosophische Vorkenntnisse, in den Sinn kam, und der doch solange einem Descartes zugeordnet wird, solange keine frühere Publikation dafür nachgewiesen werden kann.

Das Zusammentragen von Literatur, auch wenn es Millionen verschlingt, ist kein Alibi um zu behaupten, man hätte Information gesammelt, die man nun verkaufen dürfte. Wenn Bibliothekare, Dokumentare, Informatiker oder Information-Resources-Manager ihr "Handwerk" verstehen und aufgrund ihrer soliden Ausbildung Informationen sammeln, ordnen und verfügbar machen, so erbringen sie eine wichtige Dienstleistung im Informationsbereich, deren Wert sich vergleichsweise leicht berechnen und die sich auch ebenso leicht auf Effektivität überprüfen läßt. Urheberrechtlich handelt es sich hier zunächst um einfache Vervielfältigung bzw. informationstheoretisch um Erzeugung von Redundanz. Wieweit eine intellektuelle oder automatische Indexierung, eine raffinierte Klassifizierung, eine künstlerische bzw. schöpferische Qualität oder auch eine innovative Logistik vorliegt, ist natürlich die eigentliche Frage. Hier besteht zur Zeit die Gefahr, daß nach den EG-Richtlinien schon die Individualität eines Werkes und nicht ihre besondere Qualität ausreicht, um schutzwürdig zu werden (Brinckmann, H. 1991).

Juristisch dürfte es natürlich einfacher sein, den individuellen Charakter eines Werkes ähnlichen anderen gegenüber festzustellen, als dessen besondere Qualität. Genau genommen geht es aber um die Information, die der Urheber erzeugt hat und dies setzt voraus, daß man eine klare Vorstellung von Information hat. Während wir also bei Patenten den informativen Gehalt daran fest machen, daß die Erfindung neu und verwertbar sein muß, bezieht sich das Urheberrecht auf die schöpferische Qualität eines Werkes, über die sich trefflich streiten läßt.

Hervorgehoben werden muß aber, daß, entsprechend der Aufgaben von Nationalbibliotheken, wir dringend Institutionen brauchen, die urheberrechtlich geschützte Dokumente sammeln, um eine Individualitätsprüfung überhaupt möglich zu machen.

Da fast jedes Buch über weite Teile Elemente dessen enthält, was bereits in zahlreichen anderen Büchern stand, beinhaltet es vorwiegend Kopien von Redundanzen, die durch ihre neue Zusammenstellung zu einem besseren Verständnis beim Leser beitragen sollen. Durch das hohe Maß dieser Redundanzen wird der prozentuale Anteil an Information in unserer Gesellschaft soweit verringert, daß wir weitaus seltener wirkliche Information erhalten, als wir gemeinhin glauben. Dies ist in fünffacher Weise wichtig:

1. Vielen Werken und Aufsätzen lassen sich die wenigen wirklichen Information in eher überschaubarer Zahl zuordnen.

2. Die Wahrscheinlichkeit einer informierten Gesellschaft erhöht sich, da jede Redundanz mithilft, weitere Personen zu informieren.

3. Es wird einer Alterung der Information entgegengewirkt.

4. Die wirkliche Informationsflut wird eingedämmt und durch das didaktische Prinzip des "biologischen Lernens" ersetzt.

5. Die Information, die ich empfange, kann zwar für mich als Person informativ sein, aber nicht für mich als Teil der Gesellschaft. Sobald ich diese Information veräußere, trifft sie vorwiegend auf Empfänger, die sich lediglich über die Redundanz, die ihre Informationskanäle belasten, beklagen. Damit sind auch Wettbewerbsvorteile weitgehend ausgeschlossen.

Zu Punkt 1: Ein neuer Gedanke oder eine bemerkenswerte Beobachtung von allgemeinem Interesse, kann oft einem bestimmten Autor zugeordnet werden. Wir sprechen bereits von großen Persönlichkeiten, wenn diese durch mehrere Informationen bekannt wurden.

Zu Punkt 2: Der gesellschaftliche Konsens wächst mit jeder gemeinsamen Information und sie reduziert damit Konflikte, die sich aus Unkenntnis ergeben.

Zu Punkt 3: Da Alterung von Information ohne Redundanz einem Verlust dieser Information gleich kommt, muß daß Maß der Redundanz ausreichend groß sein, diesem Alterungsprozeß entgegenzuwirken, wie wir es bei den Zitationsklassikern beobachten konnten.

Zu Punkt 4: Unter "biologischem Lernen" sei hier verstanden, daß für den Lernvorgang zwei grundsätzliche Komponenten von Bedeutung sind.
A. Eine Information, die zunehmend redundant wird, erregt unsere Aufmerksamkeit, weil sie zunehmend an Verläßlichkeit gewinnt, weil sie uns eine wiederholte und damit erhöhte Bedeutung verspricht, und weil sie uns assoziative Verknüpfungen mit den damit verbundenen Informationen erlaubt.

B. Eine Information ist trotz geringer Redundanz von hoher Bedeutung, je informativer, d.h. je auffälliger und somit unwahrscheinlicher sie ist. Vorausgesetzt, es gibt ausreichend Gründe, sie trotzdem zu akzeptieren. Die Literatur muß damit immer eine notwendige Menge an Redundanz vorhalten, die ausreicht, die vorhandene Information zu sichern. Dies erfordert eine Begrenzung unzureichend ausgebildeter Autoren (durch qualifizierte Lehre und durch Herausgeber), ohne daß innovative Kräfte zu stark unterdrückt werden. "Biologisches Lernen" beinhaltet damit auch die Berücksichtigung der Widersprüchlichkeiten und Diskussionspunkte, die zunächst vom Noise nicht unterscheidbar sind, und die nur durch einen Wettbewerb der Paradigmen (entsprechend eines "struggle for life") zu klären sind. Es ergibt sich aus der biogenetischen Evolutionsstrategie (Umstätter, W. 1991).

Zu Punkt 5: Hier finden wir den Grund, warum natürlich immer wieder versucht wird, den Anschein zu erwecken, bestimmte Informationen würden nur exklusiv an bestimmte Nachfrager für teures Geld verkauft, damit diese ihren, meist finanziellen Vorteil, daraus ziehen können. Dort wo Informationen nicht durch gedankliches Folgern gewonnen werden können, sondern nur aus einer Informationsaufnahme von außen heraus, ist dies natürlich auch sehr gut möglich. Dies gilt z.B. für politische oder firmenstrategische Entscheidungen. Solche Informationen sind bekanntlich höchst ungeeignet, um sie beispielsweis allgemein publik zu machen - ausgenommen, man möchte damit den Markt steuern. Es ist irreführend, wenn man KMUs (Kleinen und Mittleren Unternehmen) suggeriert, sie könnten sich aus allgemein veröffentlichten Quellen Wettbewerbsvorteile verschaffen. Ihre einzige Chance bei der Nutzung solcher Angebote liegt darin, Informationsdefizite zu verhindern. Wettbewerbsvorteile erlangt man dagegen nur durch Informationsquellen, die man möglichst exklusiv nutzt bzw. durch Forschung und Entwicklung, bei denen man der Konkurrenz voraus ist.

Informationskompression

Es wird wiederholt die Ansicht geäußert, Dokumentation stelle eine Informationskompression dar, bzw. eine "Verdichtung des Inhalts" von Dokumenten. Das war bislang weigehend falsch, gewinnt allerdings unter heutigen Verhältnissen eine neue, vermutlich unerwartete Realität, indem wir in modernen Dokumentationssystemen Extrakte von Publikationen zusammenfügen können, in denen die Redundanzen minimierbar sind. Solche Dokumentationen oder State-of-the-art-Berichte moderner Prägung, können gedruckt erscheinen, als Datenbanken zur Verfügung stehen, HyperCard-artig multimedial Informationen anbieten oder auch Modelle und Simulationen bedienen helfen. Während eine Indexierung fast ausschließlich eine Abstraktion eines dokumentierten Inhalts, gegebenenfalls auch eine Zusatzinformation darstellt, erleben wir echte Informationskompressionen im Rahmen der zunehmende Digitalisierung aller Informationen. Sie gewinnen bei der Speicherung und Übertragung von Daten zunehmend an Bedeutung.

So beträgt, die Datenrate beim digitalisierten Fernsehbild 22 Megabyte pro Sekunde. Das liegt im allgemeinen über der Speicher- bzw. Übertragungsgeschwindigkeit von Local Area Networks, CD-ROM, Festplatten und I/O-Bussen der PC`s. Lediglich bei Glasfaser und Satellitenübertragung finden wir solche breitbandigen Transferraten. In etwa 3 - 4 Sekunden wäre eine 80 MB Festplatte gefüllt, bzw. in einer Stunde 81 Gigabyte. Durch DVI (Digital Video Interactive), das ursprünglich von General Electric für "action media" entwickelt wurde, kann durch RTV (Real-Time Video compression software) eine etwa hundertfache Datenkompression von Videobildern erfolgen. Ein Satz von Intel Spezialchips auf einer Einsteckkarte kann auch die Dekompression vornehmen, so daß Bilder einer Videokammera mit nur geringem Zeitverzug aufgenommen, gepackt, gespeichert, gelesen und wieder ausgepackt werden können.

Wir kennen heute verschiedene Algorithmen zur Informationskompression von Video Daten: CCITT, JPEG, LZW, MPEG, PackBits, PLV, RTV, u.a. DVI soll auch JPEG unterstützen, das vermutlich große Bedeutung für stehende Bilder haben wird. Für bewegte Bilder kommen nach David L. House (1991) in den nächsten fünf Jahren eher PLV und MPEG infrage. PLV erbringt VCR-Qualität . PLV, ebenso wie RTV können mit dem i750 Videoprozessor dekodiert werden, der weniger als 40 Dollar kostet. JPEG wird bei Bewegtbildern kaum eingesetzt. Es ist um das Vierfache langsamer als PLV und MPEG, und es braucht den vierfachen Speicherplatz. Intel entwickelt z.Z. einen MPEG-kompatiblen Videoprozessor. Die Prozessoren der Zukunft müssen in der Lage sein, verschiedene Kompressionsformen ineinander zu übersetzen. Intel verschickt z.Z. einen programmierbaren i750, der PLV dekodieren und RTV und JPEG kodieren und dekodieren kann.

Während JPEG mit Informationsverlusten um den Faktor 10 bis 100 komprimiert und dekomprimiert, je nachdem welcher Q-Faktor zwischen 0 und 255 eingestellt wird, komprimiert LZW (Lempel-Ziv & Welch compression ) ohne Informationsverlust. Auch PackBits beseitigt lediglich Redundanzen, ist aber LZW im Kompressionsfaktor weit unterlegen. Dafür erfordert LZW eine höhere Rechnerleistung für seinen Algorithmus.

Betrachten wir folgendes Beispiel (Abb. 1): Das Logo der "Nachrichten für Dokumentation nfd" besteht rein zeichenmäßig aus 33 ASCII-Zeichen mit 7+1 Bit (= 231 bzw. 264 Bits oder 33 Bytes). In originaler Größe und Farbe erfordert dieses Logo als TIFF-File (Tag Image File Format) auf dem NeXT-Computer die etwa 10.000 fache Menge an Bits. Wir erkennen daraus, daß ein solches Logo sehr verschiedene Arten der Information dem Empfänger anbietet. Die Plazierung auf der Zeitschrift bzw. dem Bildschirm, die Farbe, Größe, Schriftgrad, etc. können Informationsträger sein, die mit beliebiger Präzision wiedergegeben werden können. So zeigt sich, daß beispielsweise der Schrifttyp von "nfd" eine graduelle Abwandlung erfuhr und damit nichtmehr korrekt wiedergegeben wird. Hier wurde also absichtlich eine geringe Störung eingebracht, um zu demonstrieren, daß zwischen Sender (Logo eines nfd-Heftes bzw. dessen Layouter) und Empfänger (Betrachter des wiedergegebenen Bildes) möglichst hohe Wiedergabegenauigkeit gefordert werden muß, da ein Grafiker durchaus auf der vorgegebenen abgerundeten Form der Buchstaben bestehen kann.

Wie aus der Chaostheorie der Fraktale bekannt, kann man die Berandung einer Struktur mit beliebiger Genauigkeit vertiefen. Entsprechend läßt sich natürlich auch eine sog. tote Vergrößerung einer Form gewinnen, die zwar bitmäßig beliebig zu steigern ist, die aber für ein vorgegebenes Objekt keine zusätzliche Information bietet. Für das sog. unbewaffnete Auge liegt damit bei etwa 0,1 mm die Grenze der optischen Auflösung, und entsprechend können alle darüber hinausgehenden Feinheiten als überflüssiger Ballast angesehen werden. Diese Art der Übergenauigkeit ist in vielen Fällen weder der Redundanz noch dem Rauschen eindeutig zuzuordnen. Im Bereich der Computertechnik wird diese Problematik oft durch die Vektorgrafik überwunden, die uns die Möglichkeit gibt, trotz starker Vergrößerung eine gleichbleibend scharfe Konturierung zu behalten. Damit kann ein Layout auch bei verschiedenen Manipulationen morphologisch gleich bleiben.

Grafik und Schrift sind bekanntlich Teile des Urheberrechts und werden in Festlegungen wie der Standard Generalized Markup Language (SGML soll zusammen mit MAJOUR , dem Modular Application for JOUrnals eingesetzt werden), Adobes PostScript, Tex, o.ä. definiert. Auch dies ist eine Form der Informationskompression, indem man beispielsweise bei Microsofts "Interchange format bzw. Rich Text Format" ASCII-Zeichen mit Zusatzinformationen zum Layout versieht. ADONIS in einer solchen Aufbereitung wäre eine Volltextdatenbank von ungeahnten Möglichkeiten. Benutzt man, wie in unserer Abb. 1. JPEG (mit dem extremen Q-faktor 255), so läßt sich leicht erkennen, daß es bei der 45-fachen Kompression zu Informationsverlusten kommt, die durch zunehmende Unschärfe erkennbar werden. Darüberhinaus erfolgt ein weiterer gravierender Informationsverlust durch die Schwarz-Weiß-Darstellung beim Druck, die den Grad der Unschärfe noch erhöht.

Abb. 1: Oben : Wiedergabe des nfd-Logos. Unten: Nach Informationskompression / -reduktion mit JPEG, Q-Faktor 255 und einem Speicherbedarf von 2,2%.

Mit einem Q-Faktor von 10 bleibt dagegen fast die gesamte Information erhalten, während die Kompressionsrate bei 12 liegt. Ohne jeden Informationsverlust erreicht dagegen im vorliegenden Beispiel LZW eine Kompression des 30 Fachen. Es ist rechnerisch nachvollziehbar, daß die hier gemachten Angaben für ein System gelten, das seine Farben aus einer Palette von 16,7 Millionen (32 Bit/Bildpunkt) auswählt, und das 92 dots per inch auf den Bildschirm bringt. Das entspricht annähernd den Leistungen des menschlichen Auges. Trotzdem erreichen uns natürlich keine 250 KB Information bei der Betrachtung des originalen nfd-Logos, da das menschliche Auge mit einer noch wesentlich raffinierteren Methode der Informationskompression arbeitet. Nach unserem bisherigen Wissen tasten wir Bilder rasch nach bestimmten Elementen, wie senkrechte oder waagerechte Konturen, Farben, Bewegung, etc. ab, und rekonstruieren in unserem Gehirn daraus die Information. Durch einen solchen Filtermechanismus sind wir erfahrungsgemäß auch in der Lage, aus einem Gewirr von Stimmen gezielt nur die herauszuhören, die wir wünschen. Auch dieses Beispiel zeigt, wie gering der wirkliche Anteil an Information aus dem großen Angebot an Signalen ist.

Die Kreation von Information

Es soll noch einmal kurz auf den Vergleich von Information, Interpretation und Wissen eingegangen werden. Wir müssen unterscheiden zwischen Information, die wir aus unserem Wissen heraus selbst erzeugen können und für die wir lediglich eine Bestätigung vom Sender erwarten, sowie Informationen, die uns unerwartet treffen und damit zu einer Anpassung unseres Informationssystems zwingen. Empfängt z.B. ein Computer die ASCII-Zeichen "Nachrichten für Dokumentation nfd", so wird er sie entweder als solches eindeutig dekodieren oder aufgrund von Störungen nicht bzw. falsch identifizieren. Benutzen wir dagegen eine Texterkennung, die das Muster der Buchstaben zu identifizieren und zu disambiguieren versucht, so stellen wir an das Interpretationssystem erheblich höhere Ansprüche. Obwohl wir also die Vorlage mit der Buchstabenfolge "Nachrichten für Dokumentation nfd" als Sender dieses optischen Signals und das Interpretationssystem (OCR) als Empfänger ansehen können, wird dieses System manche Buchstaben nur aus der Syntax heraus disambiguieren können. So ist eine Entscheidung zwischen Null und O oft schwierig. Lediglich auf der nächst höheren Interpretationsebene wäre zu erkennen, daß die Zeichenkette "D0kumentation" im Wortschatz nicht existiert, und somit nur das Wort "Dokumentation" in Frage kommt. Es wäre sogar möglich, daß ein solches Interpretationssystem den Titel: "Nachrichten für Dokumentation ntd" dahingehend interpretiert, daß die Abkürzung "ntd" in "nfd" geändert werden muß.

Dieses für uns Menschen triviale Beispiel macht deutlich, daß ein Interpretationssystem zwar Information dekodiert, aber im fehlerkorrigierbaren Kode auch rekonstruieren kann. Es ist bei konsequenter Fortführung dieses Gedankens sogar in der Lage, selbst Information zu erzeugen und damit, vorausgesetzt die Information ist begründet, Wissen zu produzieren. Findet diese erzeugte Information ihre Bestätigung in der Rückkopplung mit dem Sender, dessen Information rekonstruiert bzw. vorhergesagt wird, so zeigt sich das Interpretationssystem als tauglich. Natürlich läßt sich auch Wissen in Form von Bits darstellen und damit als Information übertragen. Es zeichnet sich aber durch eine erhöhte Zuverlässigkeit oder Glaubwürdigkeit aus, indem es sozusagen mit einer optimalen Redundanz die Information absichert, und ist daher einfacher Information weit vorzuziehen. Trotzdem hat auch Wissen als begründete Information in seinem Informationscharakter nur eine begrenzte Wahrscheinlichkeit, bei der Beseitigung von Ungewißheit.

Als das raffinierteste Interpretationssystem kann die lebende Zelle angesehen werden, die die Information der DNS durch einen äußerst komplizierten und noch weitgehend unverstandenen Metabolismus interpretiert und so Lebewesen erzeugt, deren inneres Modell ihrer Umwelt, an der realen Welt seit Jahrmillionen getestet wird. Ein solches System erwirbt Wissen, das für sein Überleben notwendig ist. In diesem Zusammenhang gewinnt der Shannon'sche Begriff Redundanz oder Weitschweifigkeit eine neue Dimension, da hier unzählige Interpretationssystem mit unterschiedlichen Hypothesen miteinander konkurrieren. Wir haben es also nicht nur damit zu tun, daß eine bestimmte Kodierung Redundanz zeigt, sondern darüberhinaus damit, daß verschiedene Kodierungen um die optimale Interpretation der Signale im Wettbewerb stehen. Redundanz hat somit neben der wichtigen Funktion der Informationssicherung auch die der Suche nach einer optimalen Informationskomprimierung. Die Möglichkeit, eine äußerst komplexe Struktur mit einer einzigen Formel oder z.B. die gesamte Bedeutung der Information mit der Shannon-Weaver'schen Gleichung darzustellen, ist Teil einer solchen Informationskomprimierung.

Schluß

Sowohl in Diskussionen, als auch in der Literatur lassen sich vier hauptsächliche Fehleinschätzungen im Zusammenhang mit der Information beobachten:

1. Daß oft von Information die Sprache ist, ohne daß der meist überwiegende Anteil an Noise und Redundanz davon unterschieden wird.

2. Daß der Unterschied zwischen Information und ihrer Interpretation weitgehend unverstanden bleibt.

3. Daß Information auch falsch, irreführend oder rein fiktiv sein kann und erst durch die Redundanz an Verläßlichkeit gewinnt. Wobei wir eine Information zunächst immer als gegeben und damit als wahr ansehen müssen.

4. Daß wir nur Information empfangen können, die wir potentiell bereits besitzen, und daß das Denken diese Information jeweils selbst erzeugen muß.

Besonders deutlich wird das in einem Aufsatz von Cohen, J. und Stewart, I. (1991), die sogar den Informationsgehalt der DNS anzweifeln und zu dem Ergebnis kommen, daß unsere Hand aus Fleisch, Blut und Knochen, aber nicht aus Information besteht. Als würden Molekularstrukturen und Morphologie ohne Information existieren können. In Wirklichkeit ist der Durchbruch der Molekularbiologie in den 50er Jahren sicher nicht zufällig mit der Entstehung der Informationswissenschaft geschehen. Vielmehr sagte Erwin Schrödinger die genetische Information in "aperiodic crystals" für das Leben voraus, bevor Avery den Zusammenhang zwischen den Genen und der DNS erkannte (Mayr, E. 1982). Bücher selbst sind solche aperiodischen "Kristalle", die uns als geometrische Formen in den Zeilen entgegentreten (Hofstadter, D. R. 1979).

Die Konsequenzen der zahlreichen Fehleinschätzungen über Begriffe wie Information und Wissen reichen heute tief in den wirtschaftlichen, juristischen und politischen Bereich und zeigen dort unabsehbare Folgen, da wir im Informationszeitalter natürlich längst gezwungen sind, informationsbezogen zu handeln, ohne eine allgemein akzeptierte theoretische Grundlage zu bieten. Man behauptet also Information zu quantifizieren und zu verkaufen und dies mit einem weitgehend fehlerhaften Informationsbegriff. Sieht man vom störenden Rauschen ab, so vermarkten wir ausschließlich Redundanz, da Information im eigentlichen Sinne nur im Unikat vorliegt und zur Vermarktung völlig ungeeignet ist.

Es ist die hohe Bedeutung der Redundanz, die wir in den letzten Jahrzehnten unterschätzt haben. Sie sichert nicht nur die Information, sie hilft sie auch zu vermehren und sie verschiebt, wie wir gesehen haben auch ihre Quantifizierung und Bewertung, da Information ohne Redundanz wertlos ist.

Literatur:

Brinckmann, H.: Flüchtige Ware Information - Probleme der Rechtsordnung
Spektrum der Wissenschaft 11/91 S.150-159 (1991)

Buckland, M.K.: Information as Thing
JASIS 42 (5) S.351-360 (1991)

Budin, G.: The Structure and Role of Specialized Information in Scientific and Technical Terminologies.
In: Classification, Data Analysis, and Knowledge Organization. Eds.: Bock, H.-H. und Ihm, P. Springer-Verlag, Berlin, S.216-220 (1991)

Bundesminister für Forschung und Technologie: Fachinformationsprogramm 1985-88 der Bundesregierung 1990-1994 (1985)

Bundesminister für Forschung und Technologie: Fachinformationsprogramm der Bundesregierung 1990-1994 (1990)

Cohen, J. and Stewart, I.: The information in your hand
The Mathematical Intelligencer 13 (3) S.12-15 (1991)

Debons, A.: Introductory address III
In: Informatione Science. Search for identity Ed.: Debons, A., S.9-18 Marcel Dekker, Inc., New York (1974)

Einstein, A.: Über die spezielle und die allgemeine Relativitätstheorie. 9. Aufl.
Vieweg und Sohn, Braunschweig (1920)

Folbert, O.G. und Hackl, C. (Hrsg.): Der Informationsbegriff in Wissenschaft und Technik.
R. Oldenbourg Verl. München, Wien (1986)

Garfield, E.: Essays of an Information Scientist, Vol. 1-4
ISI Press, Philadelphia. (1977 - 1981)

Hofstadter, D. R.: Göder, Escher, Bach: An eternal golden braid
Vintage Books, New York (1979)

House, D.L.: DVI Update: Effective Multimedia on the PC
CD-ROM Professsional S.35-36 Nov. (1991)

Kleinbart, P.: The intersection of information, economics and universality in the financial world of the 1990s
J. of Inf. Sci. 17 S.137-143 (1991)

Körner, H.G.: Optimale Klassengröße, die mathematische Konstante e und Notationsfragen
Studium zur Klassifikation 9 S.50-66 (1980)

Kuhlen, R.: Pragmatische Aspekte beim Entwurf und Betrieb von Informationssystemen
Nachr. f. Dok. 42 (1) S.43-44 (1991)

Line, M.B. and Sandison, A.: 'Obsolescence' and Changes in the Use of Literature with Time
J. Doc. 30 S.283-350. (1974)

Line, M.B.: Citation Decay of Scientific Papers: Variation According to Citations Received
J. Information Sci. 9 S.90-91 (1985)

Line, M.: Information management in perspective
In: Information Management in Wissenschaft und Forschung, Ed. Cronin, B. und Klein, S., Vieweg, Braunschweig (1990)

Lyons, J.: semantics Vol. 1
Cambridge Univ. Press, Cambridge (1979)

Mayr, E.: The growth of biological thought
Harvard Univ. press, Cambridge S.824 (1982)

Meadows, A.J.; Gordon, M. and Singleton, A.: Dictionary of computing and new information technology
Century published, London (1984)

Schneider, H.: Hypothese, Experiment, Theorie
Walter de Gruyter, Berlin S.32 (1978)

Shannon, C.E. and Weaver, W.: The Mathematical Theory of Communication
Univ. Illinois. Press, Urbana (1949)

Steinbuch, K.: Kommunikationstechnik
Springer-Verlag, Berlin (1977)

Stokes, A.V.: Concise Encyclopedia of Information Technology
Gower, Aldershot (1982)

Stonier, T.: Towards a general theory of information II: information and entropy
Aslib. Proc. 41 (2) S.41-55 (1989)

Stonier, T.: Information and the Internal Structure of the Universe. An Exploration into Information Physics
Springer Verl. London (1990)

Umstätter, W; Rehm, M. und Dorogi, S.: Die Halbwertszeit in der naturwissenschaftlichen Literatur
Nachr. f. Dok. 33 (2) S.50-52 (1982)

Umstätter, W. und Rehm, M.: Bibliothek und Evolution
Nachr. f. Dokum. 35 S.237-249. (1984)
(Aufsatz im Volltext)

Umstätter, W.: Ergebnisse anwenden bevor sie entdeckt sind.
Umscha 84 (5) S.130-131 (1984)

Umstätter, W.: Was ist Information eigentlich wert?
In: Deutscher Dokumentartag 1988 DGD-Schrift (Doktag 1) 4/89, S.589-603 (1989)

Umstätter, W.: Die evolutionsstrategische Entstehung von Wissen.
Vortrag auf der 2. Tagung der Int. Ges. f. Wissensorg., 16.-18.Okt. 1991, Weilburg Im Druck (1991)
(Aufsatz im Volltext)

Wenzlaff, B.: Vielfalt der Informationsbegriffe
Nachr. f. Dok. 42 (5) S.355-361 (1982)

Whittemore, B.J. and Yovits, M.C.: A generalized concept for the analysis of information.
In: Informatione Science. Search for identity Ed.: Debons, A., S.29-45 Marcel Dekker, Inc., New York (1974)

Wiener, N.: Mensch und Maschine. Kybernetik und Gesellschaft
Athenäum Verl. Frankfurt (1964)

Zemanek, H.: Elementare Informationstheorie
R. Oldenbourg, München (1959)


Last update: 5. June 1997 / © by Walther Umstaetter