To
the homepage of Prof. Dr. Walther Umstätter
To the publicationlist 1970 - 1985 - / -
To
the publicationlist 1986 - 1990
To the publicationlist 1991 - 1995 - / -
To
the publicationlist 1996 - 2000
Published in: Nachr. f. Dok. 43 (4) S.227-242 (1992)
Die Tatsache, daß der gemeine Sprachgebrauch "Information" sehr unbestimmt benutzt, ist kein Grund für die wiederholt geäußerte Annahme der Unbestimmbarkeit. Auch das Wort Kraft wird sehr unbestimmt, z.B. im Sinne von Stärke, Leistung, Energie, etc. oder auch bei Kraft seines Amtes, Kraftausdruck bzw. hypnotische Kräfte benutzt, und trotzdem ist seine wissenschaftliche Bedeutung von der Physik her, mit
Kraft = Masse x Beschleunigung
fundamental definiert. Ein Physikstudent, der dies nicht weiß, fällt durch die Prüfung. Behauptet dagegen ein Student im Informationsbereich z.B., Fachinformation könne als "Rohstoff" bezeichnet werden, so kann er sich dabei auf eine so bekannte Persönlichkeit wie den Bundesminister für Forschung und Technologie (1985) berufen.
Man könnte dies natürlich auch nur als eine griffige fachinformationspolitische Äußerung werten und damit sozusagen als Floskel übergehen. Aber auch im FI-Programm 1990/94 taucht diese "Floskel" wieder auf, und wird von den sicherlich wissenschaftlich ausgebildeten Beratern des Bundesministers mit halbseitiger, wenn auch wenig erhellender, Farbgrafik hervorgehoben. Bemerkenswerterweise heißt es dort auch gleich im ersten Satz: "Fachinformation ist das Wissen, das ... in Wirtschaft und Staat benötigt wird." Hier wird also Information und Wissen direkt gleichgesetzt, ganz im Sinne Wersig, Kuhlens (1991), u.a. (Budin, G. 1991), die "Information als Wissen in Aktion" definieren.
Solange allerdings "Informationswissenschaftler" definitorisch auf so schwankendem Boden basieren, werden sie unmöglich zu einer Wissenschaft gelangen können. Information ist bereits von Norbert Wiener klar von Materie und Energie abgegrenzt worden und seit Shannon und Weaver (1949) definiert. Die sich aus dieser Festlegung ergebenden Konsequenzen sind allerdings von fast unüberschaubarem Ausmaß, weil wir uns natürlich noch immer am Beginn einer neuen Wissenschaft befinden, die sozusagen Naturwissenschaft und Geisteswissenschaft verbindet. Daß Information in Belehrung, Botschaft, Unterrichtung, Orientierungshilfe, Wissen, Sehen, Hören, Fühlen, etc. enthalten ist (Folbert, O.G. und Hackl, C. 1986), und oft nachweislich mit Signal, Nachricht, Redundanz, Noise, etc. verwechselt wird, zeigt also keinesfalls, daß sie unbestimmbar wäre. Es ist vielmehr unsere Aufgabe, über die Konsequenzen der Formel des Mittleren Informationsgehaltes nachzudenken und zu prüfen, wieweit ihre Gültigkeit reicht. Daß dies auch eine eminente Bedeutung im sozialwissenschaftlichen, edukativen, politischen oder Wirtschaftsbereich hat, liegt auf der Hand. So schreibt Kleinbart, P. (1991), daß eine der entscheidenden Entdeckungen des Informationszeitalters die Erkenntnis war, daß Information quantifiziert und verkauft werden kann. Und etwas später: Der Manager der neunziger Jahre wird die Welt als einen Wirtschaftsmarkt und "information as the lifeblood of his commercial activity" begreifen müssen. Ein Grund für die Entstehung des Informationsmanagements aus der Sicht der Wirtschaftler.
Der Warencharakter der Information ist immer wieder beschworen worden, wobei sein monopolistischer Charakter fast nur bei Patenten realisiert wird (Umstätter, W. 1989).
Die große Verwirrung im Informationsbereich rührt natürlich daher, daß hoch redundant behauptet wird, daß die sogenannte syntaktische Information neben der semantischen und der pragmatischen für viele Bereiche nur sehr bedingt brauchbar ist, und daß wir daher nur sehr wenig über die wirkliche Bedeutung der Information wissen. Shannon selbst verleitete vermutlich zu dieser Auffassung, indem er schrieb, daß der semantische Aspekt der Kommunikation für den Ingenieur irrelevant sei. Dieser Schluß ergibt sich bekanntlich aus der Informationstheorie, nach der z.B. der Bildschirm mit dem rein zufälligen Pixelmuster, das für uns Menschen normalerweise gar keine Information enthält, den maximalen Informationsgehalt aufweist.
Dabei darf allerdings nicht vergessen werden, daß es eben die Prämisse der Information und Kommunikation ist, daß Sender und Empfänger den gleichen Zeichenvorrat besitzen, d.h. daß nur interpretierbare Signale als Information gewertet werden können. Der Bildschirm mit dem rein zufälligen schwarz-weißen Pixelmuster hat also nur unter der Bedingung der Interpretierbarkeit den höchsten Informationsgehalt. Trotzdem erscheint es uns auf den ersten Blick unsinnig, daß die Information am größten sein soll, wenn wir am wenigsten Ordnung darin erkennen. Bei einer Umkehrung dieser Beziehung wird aber rasch deutlich, daß ein völlig weißer oder schwarzer Bildschirm zum Informationsgehalt Eins bzw. Null führt. Die Information ist dagegen tatsächlich am größten, wenn eine äußerst Komplexe Struktur kodiert wird, die allerdings noch als Struktur identifizierbar bleiben muß. Als interessanter Gedanke drängt sich das "definierte Chaos" als maximale Information auf.
H = -p log p ,
woraus Shannon und Weaver schlossen, daß "information turns out to be exactly that which is known in thermodynamics as entropy".
Nach Boltzmann ist die Entropie
S = k log W, wobei
k = Boltzman'sche Konstante und
W = thermodynamische Wahrscheinlichkeit bedeutet.
Schrödinger hat für W die Größe D = Maß für die atomistische Unordnung eingeführt, wobei die Inverse, 1/D entsprechend als Maß für die Ordnung angesehen werden kann. Er kommt so zu der umgeformten Boltzmann'schen Gleichung
-S = k log (1/D),
bei der wir auch von der sogenannten Negentropie sprechen.
Information ist damit eine invers-exponentielle Funktion der Entropie.
Wenn wir nun nach Stonier (1989) den strukturellen Informationsgehalt eines Systems I als Funktion der Ordnung 1/D betrachten
I = c 1/D
wobei c eine Konstante sei, so gilt für
S = k log (c/I) und
I = c e -S/k.
Diese beiden Gleichungen implizieren, daß für die Bedingung I kleiner c die Entropie negativ wird, und daß mit zunehmend negativer Entropie, die Information immer rascher gegen unendlich geht. Daß die Information auf Null sinkt, wenn die Entropie ins unendliche steigt, ist naheliegend. Damit wäre dort jede strukturelle Ordnung in Energie aufgelöst. Die beiden fundamentalen Größen Materie und Energie sind so durch die Information bzw. die Entropie miteinander verbunden. Information, im Gegensatz zur Entropie, kann jedoch nie negative Werte erreichen. Da nach dem 3. Hauptsatz der Wärmelehre von Walther Nernst, der absolute Nullpunkt unerreichbar ist und dort die Entropie gegen Null geht, sollte man annehmen, daß auch eine negative Entropie nicht erreicht werden kann. Damit müssen wir davon ausgehen, daß der Wechsel von der positiven zur negativen Entropie und damit zu allen Informationsgehalten größer c, auch ein Wechsel von der thermodynamischen Physik in den informationstheoretischen Teil dieser Welt ist.
Es ist wichtig, sich dabei bewußt zu machen, daß die Information als eine statistische Größe auftaucht, die den Ordnungsgrad nach dem fundamentalen Kriterium der Wahrscheinlichkeit und nicht nach räumlichen oder zeitlichen Zuordnungen bestimmt. Nun hat Stonier (S.126 ff. 1990) versucht, vergleichbar den Phononen, Fermionen oder Bosonen, Information in Form von "Infonen" zu postulieren, die den Charakter von Partikeln ohne Masse und Energie haben sollen. Dabei weist er darauf hin, daß "Our universe is filled with examples in which changes in organisation patterns - by definition, changes in information states - result in the appearance of waves or particles. Phase waves, for example, represent information superimposed on a carrier wave."
Leider unterlaufen Stonier allerdings zwei wesentliche Fehler.
1. betrachtet er Information als eine vom Empfänger unabhängige
Realität und verwechselt sie so mit dem Signal, wobei er durchaus
richtig bemerkt: "Meaning involves the interpretation" (S.18 1990). Interpretation,
bzw. die Kodierung und Dekodierung von Signalen ist aber unabdingbare Randbedingung
der Information. So definiert die Concise Encyclopedia of Information Technology
(Stokes, A.V. 1982) Information als "The meaning
attached to data." und das Dictionary of computing and new information
technology (Meadows, A.J. et al 1984) als "Data
processed and assembled into meaningful form."
2. behauptet er: "If distance d, time t, and direction, are forms of information, then 'velocity' - ... - must be a form of information; and ... 'acceleration' (...) must also be a form of information." (S.30 1990). Dies entspricht aber nicht seiner eigenen Festlegung der Information als wahrscheinlichkeitstheoretische Ordnung.
Da Information erfahrungsgemäß immer an Materie gebunden ist, bleibt sie ebenso wie die Entropie nicht unverändert. Beide sind gleichermaßen ungeeignet, Ware zu sein, schreibt Norbert Wiener (1964). Und auf S.112: "Der Gedanke, daß Information in einer sich ändernden Welt ohne merkbare Minderung ihres Wertes gestapelt werden kann, ist falsch."
Die Redundanz R ergibt sich aus dem Verhältnis von
H = mittlerer Informationsgehalt zu
Hmax = maximaler Informationsgehalt, nach
R = (Hmax - H) / Hmax = 1 - H / Hmax
oder
R = 1 - ld (verwendete Kodewörter) / ld (mögliche Kodewörter).
Wir erkennen daraus, daß Redundanz nicht nur keine Information im eigentlichen Sinne ist, sie ist vielmehr der Anteil, den wir von der Information abziehen müssen.
Andererseits ist Information ohne Redundanz völlig wertlos, da sie keine Verläßlichkeit mitbringt. Die Höhe der notwendigen Redundanz ist abhängig vom Noise, der mit der Information einhergeht. Nun gibt es allerdings bei der Datenübertragung verschiedene Arten der Redundanz.
1. Die Redundanz im fehlerprüfbaren Kode
2. Die Redundanz im fehlerkorrigierbaren Kode
Die einfachste Form der Redundanz ist die der Wiederholung. Die eleganteste Form ist sicher die, die wir mit Hilfe unseres Wissens erzeugen, in dem wir jede Information darauf prüfen, wieweit sie sich aus den bereits vorhandenen Informationen ableiten läßt. Unter diesem Gesichtspunkt ist also Wissen Information mit dem notwendigen Maß an Redundanz zur Absicherung dieser Information. Wir könnten auch sagen, daß Wissen im eigentlichen Sinne Information in kausal abgeleiteter Vernetzung ist (Umstätter, W. 1991).
Fachinformation muß daher weit über reines Wissen hinausreichen und tut dies auch. Wir benötigen eine Unzahl von Daten und Fakten, um Fachwissen zu erzeugen. Daß dieses Fachwissen in Wirtschaft und Staat dringend benötigt wird, dürfte, soweit es sich wirklich um Wissen handelt, außer Zweifel stehen. Wir gewinnen viele unserer Informationen direkt aus Messungen und Beobachtungen in Natur und Technik. Dies macht deutlich, daß Information unmöglich nur auf das Wissen in Aktion verkürzt werden kann. Eine solche Festlegung führte zwangsläufig zu der Annahme, daß z.B. Informationen, die von einem Computer zu einem anderen übertragen werden, ein Wissen bedingen. Damit entstünde eine heillose Begriffsverwirrung. Ganz abgesehen davon, daß die Unterscheidung von aktivem und passivem Wissen (Wissen in Aktion) in diesem Zusammenhang schwer nachvollziehbar ist.
Der Grund dafür scheint mir in einem einfachen, aber verbreiteten Mißverständnis zu liegen. Die pragmatische Information, nach Morris als "the relation of signs to interpreters" zu definieren, bedeutet eigentlich nur, Information mit Interpretation gleichzusetzen. Nach der Informationstheorie ist, wie bereits erwähnt, der semantische Aspekt der Information irrelevant. Die Informationstheorie setzt eine gleiche Kodierung bei Sender und Empfänger voraus. Über die Art dieser Kodierung und damit über die Interpretation, macht sie keine Aussagen. Dagegen kann die Interpretation von Zeichen auf verschiedensten Strukturen gründen, auf einem einfachen Binärbaum oder auf äußerst komplexen Nervennetzen. Es ist gerade die Stärke der Informationstheorie, eine allgemeine davon unabhängige Bedeutung zu haben. Interpretation ist damit eine Randbedingung der Information, sie darf aber nicht mit Information verwechselt werden.
Die Interpretationstheorie ist Gegenstand der Semiotik, die als eine sehr alte Disziplin sich schon immer mit der Frage der Zeichenbedeutung beschäftigt hat, - weit bevor wir eine Informationstheorie besaßen. Auch wenn in dem, was wir unter Semiotik zusammenfassen können, erhebliche Widersprüchlichkeiten auftreten, und wir hier beiweitem keine der Informationstheorie vergleichbare Basis vorfinden, so müssen wir doch davon ausgehen, daß in der realen Welt die Kodierung bei Sender und Empfänger nur selten vollständig übereinstimmt. Kommunikation zwischen zwei Personen gelingt daher auf der Basis einer vergleichbaren Genetik und Umwelt. Ihre Erfahrung führt zu entsprechenden kommunikationsfähigen Kodierungen. Dabei muß die sogenannte semantische Information, als "the relations of signs to the objects to which the signs are applicable", im Interpretationsapparat sozusagen ein begriffliches Abbild haben. Es führt hier zu weit, über die Entstehungsmöglichkeiten solcher Interpretationssysteme zu diskutieren, da aber auch die physikalische Welt Informationen an den Menschen aussendet, ist klar daß unser sogenanntes Weltbild nichts anderes ist, als ein kodiertes Interpretationssystem unserer wahrnehmbaren Umwelt - ein inneres Modell.
Die Interpretationssysteme sind für die Entscheidung verantwortlich, welche ähnlichen Signale zu einer Äquivalenzklasse zusammengefaßt werden und welche Bedeutung diese kategorisierten Begriffe durch ihren Platz im Interpretationsbaum erhalten. Je mehr Signale unter einem Begriff kategorisiert werden, desto redundanter wird dieser erscheinen. Die Entstehung bzw. Konstruktion optimaler Interpretationssysteme ist das eigentliche faszinierende Problem einer solchen Interpretationstheorie. "Unsere gesamte Begriffsbildung führt zu einem System abgestufter Ähnlichkeiten." schreibt Schneider, H. (1978), und führt mit Recht die Systematik der Natur an, sowie die assoziativ magischen Vorstellungen der vorwissenschaftlichen Zeit.
Wenn wir also von Information als etwas käuflichem, etwas verwendbarem sprechen oder von etwas das wir veredeln können, so ist es sicher richtig, daß Information einen Wert hat, und daß sie die Basis gedanklicher Folgerungen darstellt. Dies ist aber kein Charakteristikum der Information. Vielmehr ist es ein Charakteristikum des Geldes, eine Wertrelation für alles zu schaffen, was mit Geld erkauft oder erreicht werden kann. Es führt auch nur zu Mißverständnissen, wenn das gedankliche Verarbeiten von Informationen, also das Denken bzw. das Erzeugen von Wissen, mit dem einfachen Interpretieren bzw. Dekodieren von Zeichen verwechselt wird.
Die Sichtweise Debons, A. (1974) "information as both a process and a commodity" zu betrachten, ist zwar allgemein verbreitet, aber damit noch keineswegs eine legitime Definition. Auch die Ansicht von Whittemore, B.J. and Yovits, M.C. (1974), daß Information dadurch gekennzeichnet ist, daß sie zu Entscheidungen führt, macht immer wieder deutlich, daß hier die Konsequenzen aus der Informationstheorie mit ihrer Definition verwechselt wird.
Da wir gesehen haben, daß der Informationsgehalt bei wachsend negativer Entropie einen unendlich hohen Wert erreicht, können wir nicht davon ausgehen, daß eine größere Akkumulation von Informationen jemals Sättigungserscheinungen aufweisen wird. Information ist damit im Gegensatz zu Rohstoffen auch nicht als begrenzte Größe anzusehen. Ebenso dürfte die Anwendbarkeit des Gossenschen Bedürfnissättigungsgesetzes, wie wir es für normale Waren kennen, hier sehr fraglich sein. Information erzeugt grundsätzlich einen Bedarf an neuen Informationen und nur für kurze Zeiträume einen Grenznutzen. Es steht sogar zu befürchten, daß jedes gelöste Problem in unserer Gesellschaft zwei neue Probleme auslöst (Umstätter, W. 1984).
Eine andere Frage ist die der Alterung. In allen uns bekannten Fällen haben wir bei Informationsträgern Verluste durch Alterung. Anders gesagt, Information ist auf Dauer immer von Dissipation begleitet, gleichgültig ob es sich um elektromagnetische Wellen im Raum, um Pits in einer CD-ROM oder um Lettern handelt, die in Stein gehauen sind. Diese Alterungserscheinung, auf die bereits Norbert Wiener hingewiesen hat, wird oft vernachlässigt, obwohl sie in der Informationslogistik von fundamentaler Bedeutung ist. Information muß also beständig restauriert, wiederholt und neu abgeglichen werden. Zeitlose Information existiert nicht. Information verändert vielmehr ihre Bedeutung, wenn sich das Interpretationssystem wandelt, wodurch sich z.B. auch der Wert einer Information drastisch verschieben kann.
Da der Wert einer Information immer vom Empfänger abhängt, ist es sinnvoll, die Wertbestimmung auch am Empfänger zu orientieren. Das kann im einfachsten Fall dadurch geschehen, daß Information möglichst direkt in ihrer Anwendung vermarktet wird. So bezahlen wir bei fast allen Hochtechnologie-Produkten in erster Linie das sog. Know-how, während bei Produkten, deren Herstellung weit verbreitet ist, vorwiegend Energie-, Zeit und Materialverbrauch zu Buche schlagen. Je weiter eine Information von ihrer Wirksamwerdung entfernt wird, desto mehr Zeit vergeht zwischen Sender und Empfänger. Dabei kann z.B. ein Programm für einen Computer von mehreren Personen erworben und wieder veräußert werden. Sein Wert entscheidet sich erst in der Anwendung von Rechnern mit passendem Betriebssystem. Daran ändert sich auch nichts, wenn einige der Zwischeneigentümer Verbesserungen vornehmen. Ihre Wertbestimmung basiert auf der Spekulation und der Risikoeinschätzung späterer Einsatzmöglichkeiten.
Nun sollte man annehmen, daß ein Bit immer ein Bit bleibt und damit durchaus zeitlos sein kann. Da aber jedes Bit seine Bedeutung zwangsläufig aus der Syntax seiner Vorgänger ableitet und somit immer eine zeitliche Folge bzw. Syntax darstellt, kann es nicht zeitlos sein. Dies gilt auch für parallelprozessierende Systeme, die zwar mehr als ein Bit gleichzeitig interpretieren, aber natürlich nie unendlich viele Bits.
Nun hat Cordonier, G. bereits 1960 angedeutet und Körner (1980) versucht nachzuweisen, daß das theoretische Maximum von Entscheidungen pro Ebene nicht bei 2, sondern bei 2,718 liegt. Da
Z = b (exp n), wobei
Z = Zeichen, b = Zweige pro Ebene, n = Zahl der Ebenen.
Die Entscheidungen insgesamt ergeben sich nach Körner mit
E = b x n.
Leitet man
Z = b (exp E/b)
nach b ab, und setzt dZ/db = 0, so folgt, lnb = 1 oder b = 2,718 (Basis des natürlichen Logarithmus e).
Da wir aber z.B. beim dualen System pro Ebene nicht zwei sondern nur eine Entscheidung fällen, ist die Zahl der Entscheidungen insgesamt nicht E = b x n sondern E = (b-1) x n. Für Z folgt
Z = b E / (b-1),
eine Funktion die damit kein Maximum bei e hat, sondern stetig steigt.
Um z.B. etwa eine Billion verschiedener Zeichen zu kodieren, bräuchte man bei
1 Entscheidung(en) / Ebene, d.h. 40 Ebenen, bei 2 " " 25 " " 9 " " 12 " und bei 9999 " " 3 " .Berücksichtigt man alle Entscheidungen, so ergeben sich insgesamt entsprechend
1 x 40 = 40 Entscheidungen 2 x 25 = 50 " 9 x 12 = 108 " 9999 x 3 = 29997 "Wir sehen also, daß eine Kodierung mit einer größeren Zahl von Entscheidungen pro Ebene durchaus möglich wäre, allerdings erhebliche Redundanzverluste brächte.
Die Skalierung der reinen Information folgt also dem Logarithmus Dualis und ist für unser normales Handeln bei der Quantifizierung und dem Verkauf von wirklicher Information höchst hinderlich, da wir schon aus Gründen der Einfachheit im allgemeinen gewohnt sind, Waren mit einer etwa linearen Mengenabhängigkeit zu bewerten. Abgesehen von Mengenrabatten gehen wir davon aus, daß z.B. 10 Meter Stoff das Zehnfache von einem Meter kosten. Dagegen müßte natürlich jedes Bit neue Information den Doppelten Wert des bisherigen haben, bzw. das 11te Bit den tausendfachen Preis des ersten Bits. So wie wir in der Informatik auch zwischen dem "least significant bit" und dem "most significant bit" unterscheiden müssen.
Wenn dieses Preisbewußtsein in keiner Weise unserer wirklichen Erfahrung entspricht, so liegt das daran, daß wir nur selten reine Information erwerben können. Der weitaus größte Teil an Nachrichten, die wir im realen Leben angeboten bekommen, sind wertlos, weil redundant, oder rauschend, weil unbrauchbar bzw. störend. Betrachten wir beispielsweise einen längeren Text, den wir als Nachricht erhalten. So ist informationstheoretisch schon jeder Buchstabe, jedes Wort und jeder Satz mit einer ausreichenden Menge an Redundanz versehen, um möglichst sicher zu stellen, daß durch etwaige Übertragungsfehler oder auch durch zeitweilige Konzentrationsschwächen des Empfängers keine wesentlichen Informationsverluste auftreten. Nach Zemanek (1959) beträgt der mittlere Informationsgehalt eines Buchstabens der deutschen Sprache, entsprechend seiner Vorkommenshäufigkeit (wenn nur 30 Großbuchstaben berücksichtigt werden) 4,11 Bit. Hmax ist entsprechend 4,9 und R = 0,16. Berücksichtigt man allerdings auch die gegenseitigen Beziehungen der Buchstaben in den Worten, so sinkt die Information auf etwa 1 Bit pro Buchstabe (Steinbuch, K. 1977). Dieser Wert wird noch weit stärker reduziert, wenn wir die Redundanz innerhalb der Sätze berücksichtigen und darüberhinaus die Tatsache, daß viele Sätze reine Wiederholungen bekannter Tatsachen sind - also früher schon einmal gesendet wurden. Wir müssen folglich davon ausgehen, daß der Informationsgehalt eines Bytes in einem zusammenhängenden Text für den Leser nicht 8 Bit, sondern eher ein Hundertstel oder weniger beträgt.
Wir sind, wie die Diskussion der letzten Jahre immer deutlicher zeigt, im allgemeinen nur wenig an dem interessiert, was man landläufig als Information bezeichnet, als vielmehr an Wissen. Weil Wissen als begründete Information uns eine vergleichsweise hohe Sicherheit dafür gibt, daß die empfangene Information auch korrekt ist. Es reduziert die überflüssige Redundanz und den Noise. Als Alternative bevorzugen wir Information aus Quellen, die unser Vertrauen genießen, also Personen, Zeitschriften oder Beobachtungen, deren Zuverlässigkeit wir aus guter Erfahrung kaum anzweifeln.
Die Eigenschaft des Bit's macht allerdings noch ein weiteres Phänomen deutlich. So wie die Masse in Kilogramm und die Kraft in Newton meßbar ist, und damit auch die Eigenschaften dieser physikalischen Größen erkennbar werden, zeigt das Bit das Charakteristikum einer Entscheidung bzw. einer Änderung oder Ungleichförmigkeit. Insofern entspricht Information, wohl am ehesten einer Beschleunigung in der Physik, wie auch Stonier bemerkt. Information ist damit Veränderung jeder Art in Raum und Zeit. Während also die gleichförmige Bewegung informationstheoretisch reine Redundanz darstellt - ein Körper bewegt sich mit konstanter Geschwindigkeit und Richtung weiter wie bisher - ist die erste Ableitung der Geschwindigkeit nach der Zeit, einer syntaktischen Änderung vergleichbar. Damit sind stabile, gleichförmig ablaufende Zustände von instabilen, d.h. solchen mit starker Veränderung, dadurch unterschieden, daß sie wahrscheinlicher sind, weil sie länger andauern. Physikalische Konstanten sind nach Stonier (S.29 ff 1990) ein Zeichen für die Information in einem System. Präziser gesagt, sind sie die Redundanzen, die uns den Informationsgehalt eines Systems deutlich machen.
Wir erkennen damit, daß die Veränderung bzw. die Beschleunigung als fundamentale Größe neben Kraft und Masse erscheint. Nach Einstein gehen wir davon aus, daß "die 'träge Masse' eine charakteristische Konstante des beschleunigten Körpers ist.", und daß die Beschleunigung bei gegebenem Schwerefeld unabhängig von der Natur und dem Zustand des Körpers existiert. Damit sind die schwere und die träge Masse eines Körpers einander gleich. "Die bisherige Mechanik hat diesen wichtigen Satz zwar registriert, aber nicht interpretiert." Dies geschah erst durch die Verallgemeinerung der Relativitätstheorie (Einstein, A. 1920).
Information als Grundgröße der Veränderlichkeit gegenüber einer gegebenen Situation, ist wohlgemerkt keine neue Definition des Informationsbegriffs, sondern lediglich eine neue Interpretation desselben. So wie viele sog. Definitionen der Information nichts anderes sind, als variantenreiche Folgerungen aus der Informationstheorie. Es ist auch kein Zufall, daß die allgemeine Relativitätstheorie deutlich gemacht hat, daß ein Beobachter in einem gleichförmig bewegten geschlossenen System keine Information erhält und damit in Ungewißheit lebt. Erst registrierbare Veränderungen setzt ihn in den Stand, diese Ungewißheit schrittweise abzubauen.
Erfahrungsgemäß enthalten neue Publikationen sinnvollerweise viele der relevanten Ergebnisse früherer Arbeiten, aber manchmal auch deren Widerlegung, so daß beim Lesen zunehmend alter Veröffentlichungen Redundanz und Noise wachsen. Dies spiegelt auch die sogenannte Halbwertszeit der Literatur wider, die sich sowohl im Zitierverhalten als auch in der entsprechenden Benutzung älterer Schriften zeigt. Sie beträgt in der sog. synchronen Studie, die zu einem bestimmten Zeitpunkt die Nutzung verschieden alten Materials untersucht, allgemein 4 - 5 Jahre. Für den Science Citation Index zeigt sich in den letzten 30 Jahren ein Wert gleicher Größenordnung, der allerdings wachsende Tendenz zeigt, weil insbesondere seit Ende der 70er Jahre überproportional Bücher und Reviews im SCI mit aufgenommen wurden. Das Zitationsverhalten gleicht somit einem Informationsfilter, beziehungsweise einem Selektionsmechanismus, bei dem Informationen permanent auf ihre Richtigkeit geprüft und in ein großes Wissensgebäude integriert werden (Umstätter, W. und Rehm, M. 1984).
Die diachrone Studie folgt der Nutzung bestimmter Publikationen im Laufe der Zeit (Line, M.B. und Sandison, A. 1974). Bei ihr liegt unter Berücksichtigung eines Literaturwachstums von etwa 15 Jahren Verdopplungsrate, die Halbwertszeit bei 6,4 Jahren. Dagegen zeigte eine Probe von 63 "mostly cited articles" (Garfield, E. 1977-1981) mit insgesamt 12122 ausgezählten Referenzen, (Die Untersuchung erfolgte im Rahmen einer Hausarbeit an der FHBD Köln von U. Beinke1984), die über 26 Jahre (SCI 1956 - 1982) verfolgt wurden, sogar eine Halbwertszeit von nur 3,2 Jahren. Wir erkennen daran, daß die "mostly cited articles" klar von den 4-5 % sog. "citation classics" der Weltliteratur zu unterscheiden sind. Sie verlieren rascher an Bedeutung als eine durchschnittliche Publikation, da ihre Information mit zunehmendem Bekanntheitsgrad in Redundanz oder bei ausgelöstem Widerspruch in Noise übergeht.
Dem widerspricht auch die Untersuchung von Arunachlam, S. and Singh, U.N. an 385 Zeitreihen nicht, wenn man das Wachstum des Science Citation berücksichtigt. Dort ergibt sich für 23 der stark zitierten Aufsätze eine bereinigte Halbwertszeit von 3.8 Jahren und nicht, wie Line (1985) vermutet, eine zunehmende Zitierung. Sein Versuch, zu zeigen, daß drei der insgesamt 385 Artikel von Arunachlam, S. and Singh, U.N. durch häufiges Zitieren immer häufiger zitiert werden, schlägt damit fehl. Dieses Ergebnis ist insofern erstaunlich, als es den viel zitierten Matthäuseffekt Mertons relativiert. Das wiederholte Zitieren bekannter Publikationen bezieht sich damit weniger auf bestimmte Aufsätze, als vielmehr auf die jeweils neusten Arbeiten ihrer Autoren. Es bleibt damit weiterhin eine bemerkenswerte Tatsache, daß viel zitierte Aufsätze von Anfang an eine hohe Beachtung finden oder nie. Die Ausnahmen sind selten. Den Leser interessiert weniger die Wiederholung von Bekanntem bekannter Autoren, als deren neuste Ergebnisse bzw. Informationen.
Für die "citation classics" zeigte sich interessanterweise eine Halbwertszeit, die annähernd der Verdopplungsrate der Literatur entspricht. So finden wir zwangsläufig eine zunehmende Halbwertszeit für alte Literatur, die noch immer zitiert wird. Ihr Maximum liegt bei 13 - 15 Jahren und damit in einer Größenordnung der Verdopplungsrate der Literatur. Zitationsklassiker werden damit sozusagen zeitunabhängig konstant oft pro Jahr zitiert. Über ihren Informationsgehalt könnte man damit die Aussage treffen, daß sie lediglich in permanenter Erinnerung gehalten werden. Mit anderen Worten: Wir zitieren Sokrates oder Descartes, weil die von ihnen angesprochenen Problem weitgehend ungelöst geblieben sind und in konstanter Erinnerung gehalten werden müssen. Ihre Gedanken enthalten für jede neue Generation wichtige Informationen.
Bei der Durchsicht allerneuster Literatur beträgt die Halbwertszeit etwa eine Woche (Umstätter, W. und Rehm, M. 1984). In dieser Zeit wird etwa die Hälfte der neu erschienen Publikationen von der Fachwelt durchgesehen. Wir können somit davon ausgehen, daß nach einem Monat fast 95% der Fachpublikationen ihr Publikum gefunden haben. Verfolgt man dagegen die Zahl der kopierten neu erschienenen Aufsätze in einer Universitätsbibliothek, so zeigt sich, daß die Aufsätze, die einer näheren Betrachtung unterzogen werden, einer Halbwertszeit von 5 Monaten unterliegen (Umstätter et al. 1982). Wir müssen also zwischen drei Arten der Informationsaufnahme in der Fachliteratur klar unterscheiden:
1. Das Durchsuchen der neusten Quellen nach Informationen.
t1/2 = 1 Woche
2. Das Studium und das Verstehen dieser Informationsinhalte.
t1/2 = 5 Monate
3. Die Diskussion in der Fachliteratur.
t1/2 = 5 Jahre
Die Tatsache, daß alle diese Untersuchungen zu Halbwertszeitfunktionen führen, macht deutlich, daß hier jeweils konstante Kräfte agieren, die mit einer stetigen prozentualen Abnahme pro Intervall wirksam werden. Daneben sind es die Wahrscheinlichkeiten, die uns im Literaturstudium leiten. Kein erfahrener Wissenschaftler wird seine Recherchen zu einem bestimmten Problem, in daß er sich einarbeiten will, bei alter Literatur beginnen. Er wird vielmehr versuchen, zunächst den neusten Stand der Diskussion zu ermitteln. Greift er dann zur Überprüfung der vorhandenen Untersuchungsergebnisse, der Behauptungen und der Hypothesen auf ältere Quellen zurück, so wächst zwangsläufig die Redundanz und der Noise. Wir erkennen daraus, daß die Zunahme der Redundanz eine Funktion der Vorgehensweise ist.
Während also Autoren mit jedem Aufsatz neue Redundanz erzeugen, wächst die Redundanz für den Informationssuchenden mit zunehmendem Alter der Literatur. Insofern sind die Halbwertszeiten der Literatur nur unter den gegebenen Umständen auch ein Maß für die Informationsabnahme mit dem Alter der Veröffentlichungen.
Benutzen wir für die Auswahl von Publikationen ein Retrievalsystem, so verringern wir das Rauschen erheblich. Es wäre aber abwegig zu glauben, es würde sich bei jedem dieser Aufsätze um einen Informationsträger handeln. Abgesehen von den rund 50% der Treffer, die bei einer durchschnittlichen Recherche mit den bisherigen Retrievalmethoden unvermeidbarer Noise sind, erhalten wir meist weitere 30% Redundanz, weil wir ein Vorwissen haben und weil viele Autoren durch Mehrfachveröffentlichung ihrer Ergebnisse gegen den anderweitigen Noise anzukämpfen versuchen.
Wie häufig Autoren uns Leser lediglich für ihre eigenen Interessen zu beeinflussen suchen, die uns teilweise wenig interessieren, statt begründete Informationen in Form echten Wissens zu produzieren, dürfte jedem Leser ebenfalls geläufig sein. Diese Form von versteckter bis offener Reklame gehört zu den Informationsformen, die uns normalerweise geschenkt werden und uns daher am weitaus häufigsten treffen. Sie sind informationstheoretisch nicht selten als Redundanz oder Noise zu werten, die unsere Informationskanäle zu überfluten drohen, und deren einzige Information darin liegt, zu sehen, daß auch diese Publikation eine bestimmte Ansicht oder ein Paradigma unterstützt. Wenn also Maurice Line (1990) gern von "information litter" spricht, so meint er allem Anschein nach informationstheoretisches Rauschen und keine Information.
Durch die Vervielfältigung von Information in Kommunikationsmedien und natürlich auch in den Köpfen der Menschen, erzeugen wir ein hohes Maß an Redundanz. Bücher sind Kopien eines Autorenmanuskripts und damit natürlich reine Redundanz in unserer Gesellschaft, daß sie für den einzelnen Leser mehr oder weniger Information enthalten können, ist klar. Wir müssen uns damit bewußt machen, daß die sogenannte Informationsvermittlung nicht nur eine gesellschaftspolitische Redundanzvermittlung im eigentlichen Sinne ist, sie macht auch den weit unterschätzten Wert der Redundanz deutlich.
Informationsdienstleistung zeichnet sich bei näherer Betrachtung als eine Dienstleistung aus, bei der natürlich Information für den Endnutzer vermittlet wird, bei der aber der Dienstleister ausschließlich redundante Kopien vermittelt. Er hilft damit bei der Rauschunterdrückung, und, wie hinlänglich bekannt, bei der Vermeidung überflüssiger Doppelarbeit und überflüssiger Redundanz. Gefährlich ist dagegen die oft geäußerte Anschauung, der Dienstleister könnte die vermittelte Information in irgendeiner Weise vermarkten. Er hat vielmehr die Verpflichtung, darauf hinzuweisen, daß er lediglich für seine Dienstleistung bezahlt werden kann, keinesfalls aber für die Information, die wenn überhaupt, nur der Urheber veräußern darf. Dies gilt interessanterweise sogar für juristisch ungeschützte, allgemein zugängliche Informationen. Es sei nur an den klassischen Gedanken des "cogito ergo sum" erinnert, der möglicherweise hunderten von Menschen, ohne literarisch philosophische Vorkenntnisse, in den Sinn kam, und der doch solange einem Descartes zugeordnet wird, solange keine frühere Publikation dafür nachgewiesen werden kann.
Das Zusammentragen von Literatur, auch wenn es Millionen verschlingt, ist kein Alibi um zu behaupten, man hätte Information gesammelt, die man nun verkaufen dürfte. Wenn Bibliothekare, Dokumentare, Informatiker oder Information-Resources-Manager ihr "Handwerk" verstehen und aufgrund ihrer soliden Ausbildung Informationen sammeln, ordnen und verfügbar machen, so erbringen sie eine wichtige Dienstleistung im Informationsbereich, deren Wert sich vergleichsweise leicht berechnen und die sich auch ebenso leicht auf Effektivität überprüfen läßt. Urheberrechtlich handelt es sich hier zunächst um einfache Vervielfältigung bzw. informationstheoretisch um Erzeugung von Redundanz. Wieweit eine intellektuelle oder automatische Indexierung, eine raffinierte Klassifizierung, eine künstlerische bzw. schöpferische Qualität oder auch eine innovative Logistik vorliegt, ist natürlich die eigentliche Frage. Hier besteht zur Zeit die Gefahr, daß nach den EG-Richtlinien schon die Individualität eines Werkes und nicht ihre besondere Qualität ausreicht, um schutzwürdig zu werden (Brinckmann, H. 1991).
Juristisch dürfte es natürlich einfacher sein, den individuellen Charakter eines Werkes ähnlichen anderen gegenüber festzustellen, als dessen besondere Qualität. Genau genommen geht es aber um die Information, die der Urheber erzeugt hat und dies setzt voraus, daß man eine klare Vorstellung von Information hat. Während wir also bei Patenten den informativen Gehalt daran fest machen, daß die Erfindung neu und verwertbar sein muß, bezieht sich das Urheberrecht auf die schöpferische Qualität eines Werkes, über die sich trefflich streiten läßt.
Hervorgehoben werden muß aber, daß, entsprechend der Aufgaben von Nationalbibliotheken, wir dringend Institutionen brauchen, die urheberrechtlich geschützte Dokumente sammeln, um eine Individualitätsprüfung überhaupt möglich zu machen.
Da fast jedes Buch über weite Teile Elemente dessen enthält, was bereits in zahlreichen anderen Büchern stand, beinhaltet es vorwiegend Kopien von Redundanzen, die durch ihre neue Zusammenstellung zu einem besseren Verständnis beim Leser beitragen sollen. Durch das hohe Maß dieser Redundanzen wird der prozentuale Anteil an Information in unserer Gesellschaft soweit verringert, daß wir weitaus seltener wirkliche Information erhalten, als wir gemeinhin glauben. Dies ist in fünffacher Weise wichtig:
1. Vielen Werken und Aufsätzen lassen sich die wenigen wirklichen Information in eher überschaubarer Zahl zuordnen.
2. Die Wahrscheinlichkeit einer informierten Gesellschaft erhöht sich, da jede Redundanz mithilft, weitere Personen zu informieren.
3. Es wird einer Alterung der Information entgegengewirkt.
4. Die wirkliche Informationsflut wird eingedämmt und durch das didaktische Prinzip des "biologischen Lernens" ersetzt.
5. Die Information, die ich empfange, kann zwar für mich als Person informativ sein, aber nicht für mich als Teil der Gesellschaft. Sobald ich diese Information veräußere, trifft sie vorwiegend auf Empfänger, die sich lediglich über die Redundanz, die ihre Informationskanäle belasten, beklagen. Damit sind auch Wettbewerbsvorteile weitgehend ausgeschlossen.
Zu Punkt 1: Ein neuer Gedanke oder eine bemerkenswerte Beobachtung von allgemeinem Interesse, kann oft einem bestimmten Autor zugeordnet werden. Wir sprechen bereits von großen Persönlichkeiten, wenn diese durch mehrere Informationen bekannt wurden.
Zu Punkt 2: Der gesellschaftliche Konsens wächst mit jeder gemeinsamen Information und sie reduziert damit Konflikte, die sich aus Unkenntnis ergeben.
Zu Punkt 3: Da Alterung von Information ohne Redundanz einem Verlust dieser Information gleich kommt, muß daß Maß der Redundanz ausreichend groß sein, diesem Alterungsprozeß entgegenzuwirken, wie wir es bei den Zitationsklassikern beobachten konnten.
Zu Punkt 4: Unter "biologischem Lernen" sei hier verstanden,
daß für den Lernvorgang zwei grundsätzliche Komponenten
von Bedeutung sind.
A. Eine Information, die zunehmend redundant wird, erregt unsere
Aufmerksamkeit, weil sie zunehmend an Verläßlichkeit gewinnt,
weil sie uns eine wiederholte und damit erhöhte Bedeutung verspricht,
und weil sie uns assoziative Verknüpfungen mit den damit verbundenen
Informationen erlaubt.
B. Eine Information ist trotz geringer Redundanz von hoher Bedeutung, je informativer, d.h. je auffälliger und somit unwahrscheinlicher sie ist. Vorausgesetzt, es gibt ausreichend Gründe, sie trotzdem zu akzeptieren. Die Literatur muß damit immer eine notwendige Menge an Redundanz vorhalten, die ausreicht, die vorhandene Information zu sichern. Dies erfordert eine Begrenzung unzureichend ausgebildeter Autoren (durch qualifizierte Lehre und durch Herausgeber), ohne daß innovative Kräfte zu stark unterdrückt werden. "Biologisches Lernen" beinhaltet damit auch die Berücksichtigung der Widersprüchlichkeiten und Diskussionspunkte, die zunächst vom Noise nicht unterscheidbar sind, und die nur durch einen Wettbewerb der Paradigmen (entsprechend eines "struggle for life") zu klären sind. Es ergibt sich aus der biogenetischen Evolutionsstrategie (Umstätter, W. 1991).
Zu Punkt 5: Hier finden wir den Grund, warum natürlich immer wieder versucht wird, den Anschein zu erwecken, bestimmte Informationen würden nur exklusiv an bestimmte Nachfrager für teures Geld verkauft, damit diese ihren, meist finanziellen Vorteil, daraus ziehen können. Dort wo Informationen nicht durch gedankliches Folgern gewonnen werden können, sondern nur aus einer Informationsaufnahme von außen heraus, ist dies natürlich auch sehr gut möglich. Dies gilt z.B. für politische oder firmenstrategische Entscheidungen. Solche Informationen sind bekanntlich höchst ungeeignet, um sie beispielsweis allgemein publik zu machen - ausgenommen, man möchte damit den Markt steuern. Es ist irreführend, wenn man KMUs (Kleinen und Mittleren Unternehmen) suggeriert, sie könnten sich aus allgemein veröffentlichten Quellen Wettbewerbsvorteile verschaffen. Ihre einzige Chance bei der Nutzung solcher Angebote liegt darin, Informationsdefizite zu verhindern. Wettbewerbsvorteile erlangt man dagegen nur durch Informationsquellen, die man möglichst exklusiv nutzt bzw. durch Forschung und Entwicklung, bei denen man der Konkurrenz voraus ist.
So beträgt, die Datenrate beim digitalisierten Fernsehbild 22 Megabyte pro Sekunde. Das liegt im allgemeinen über der Speicher- bzw. Übertragungsgeschwindigkeit von Local Area Networks, CD-ROM, Festplatten und I/O-Bussen der PC`s. Lediglich bei Glasfaser und Satellitenübertragung finden wir solche breitbandigen Transferraten. In etwa 3 - 4 Sekunden wäre eine 80 MB Festplatte gefüllt, bzw. in einer Stunde 81 Gigabyte. Durch DVI (Digital Video Interactive), das ursprünglich von General Electric für "action media" entwickelt wurde, kann durch RTV (Real-Time Video compression software) eine etwa hundertfache Datenkompression von Videobildern erfolgen. Ein Satz von Intel Spezialchips auf einer Einsteckkarte kann auch die Dekompression vornehmen, so daß Bilder einer Videokammera mit nur geringem Zeitverzug aufgenommen, gepackt, gespeichert, gelesen und wieder ausgepackt werden können.
Wir kennen heute verschiedene Algorithmen zur Informationskompression von Video Daten: CCITT, JPEG, LZW, MPEG, PackBits, PLV, RTV, u.a. DVI soll auch JPEG unterstützen, das vermutlich große Bedeutung für stehende Bilder haben wird. Für bewegte Bilder kommen nach David L. House (1991) in den nächsten fünf Jahren eher PLV und MPEG infrage. PLV erbringt VCR-Qualität . PLV, ebenso wie RTV können mit dem i750 Videoprozessor dekodiert werden, der weniger als 40 Dollar kostet. JPEG wird bei Bewegtbildern kaum eingesetzt. Es ist um das Vierfache langsamer als PLV und MPEG, und es braucht den vierfachen Speicherplatz. Intel entwickelt z.Z. einen MPEG-kompatiblen Videoprozessor. Die Prozessoren der Zukunft müssen in der Lage sein, verschiedene Kompressionsformen ineinander zu übersetzen. Intel verschickt z.Z. einen programmierbaren i750, der PLV dekodieren und RTV und JPEG kodieren und dekodieren kann.
Während JPEG mit Informationsverlusten um den Faktor 10 bis 100 komprimiert und dekomprimiert, je nachdem welcher Q-Faktor zwischen 0 und 255 eingestellt wird, komprimiert LZW (Lempel-Ziv & Welch compression ) ohne Informationsverlust. Auch PackBits beseitigt lediglich Redundanzen, ist aber LZW im Kompressionsfaktor weit unterlegen. Dafür erfordert LZW eine höhere Rechnerleistung für seinen Algorithmus.
Betrachten wir folgendes Beispiel (Abb. 1): Das Logo der "Nachrichten für Dokumentation nfd" besteht rein zeichenmäßig aus 33 ASCII-Zeichen mit 7+1 Bit (= 231 bzw. 264 Bits oder 33 Bytes). In originaler Größe und Farbe erfordert dieses Logo als TIFF-File (Tag Image File Format) auf dem NeXT-Computer die etwa 10.000 fache Menge an Bits. Wir erkennen daraus, daß ein solches Logo sehr verschiedene Arten der Information dem Empfänger anbietet. Die Plazierung auf der Zeitschrift bzw. dem Bildschirm, die Farbe, Größe, Schriftgrad, etc. können Informationsträger sein, die mit beliebiger Präzision wiedergegeben werden können. So zeigt sich, daß beispielsweise der Schrifttyp von "nfd" eine graduelle Abwandlung erfuhr und damit nichtmehr korrekt wiedergegeben wird. Hier wurde also absichtlich eine geringe Störung eingebracht, um zu demonstrieren, daß zwischen Sender (Logo eines nfd-Heftes bzw. dessen Layouter) und Empfänger (Betrachter des wiedergegebenen Bildes) möglichst hohe Wiedergabegenauigkeit gefordert werden muß, da ein Grafiker durchaus auf der vorgegebenen abgerundeten Form der Buchstaben bestehen kann.
Wie aus der Chaostheorie der Fraktale bekannt, kann man die Berandung einer Struktur mit beliebiger Genauigkeit vertiefen. Entsprechend läßt sich natürlich auch eine sog. tote Vergrößerung einer Form gewinnen, die zwar bitmäßig beliebig zu steigern ist, die aber für ein vorgegebenes Objekt keine zusätzliche Information bietet. Für das sog. unbewaffnete Auge liegt damit bei etwa 0,1 mm die Grenze der optischen Auflösung, und entsprechend können alle darüber hinausgehenden Feinheiten als überflüssiger Ballast angesehen werden. Diese Art der Übergenauigkeit ist in vielen Fällen weder der Redundanz noch dem Rauschen eindeutig zuzuordnen. Im Bereich der Computertechnik wird diese Problematik oft durch die Vektorgrafik überwunden, die uns die Möglichkeit gibt, trotz starker Vergrößerung eine gleichbleibend scharfe Konturierung zu behalten. Damit kann ein Layout auch bei verschiedenen Manipulationen morphologisch gleich bleiben.
Grafik und Schrift sind bekanntlich Teile des Urheberrechts und werden in Festlegungen wie der Standard Generalized Markup Language (SGML soll zusammen mit MAJOUR , dem Modular Application for JOUrnals eingesetzt werden), Adobes PostScript, Tex, o.ä. definiert. Auch dies ist eine Form der Informationskompression, indem man beispielsweise bei Microsofts "Interchange format bzw. Rich Text Format" ASCII-Zeichen mit Zusatzinformationen zum Layout versieht. ADONIS in einer solchen Aufbereitung wäre eine Volltextdatenbank von ungeahnten Möglichkeiten. Benutzt man, wie in unserer Abb. 1. JPEG (mit dem extremen Q-faktor 255), so läßt sich leicht erkennen, daß es bei der 45-fachen Kompression zu Informationsverlusten kommt, die durch zunehmende Unschärfe erkennbar werden. Darüberhinaus erfolgt ein weiterer gravierender Informationsverlust durch die Schwarz-Weiß-Darstellung beim Druck, die den Grad der Unschärfe noch erhöht.
Abb. 1: Oben : Wiedergabe des nfd-Logos. Unten: Nach Informationskompression / -reduktion mit JPEG, Q-Faktor 255 und einem Speicherbedarf von 2,2%.
Mit einem Q-Faktor von 10 bleibt dagegen fast die gesamte Information erhalten, während die Kompressionsrate bei 12 liegt. Ohne jeden Informationsverlust erreicht dagegen im vorliegenden Beispiel LZW eine Kompression des 30 Fachen. Es ist rechnerisch nachvollziehbar, daß die hier gemachten Angaben für ein System gelten, das seine Farben aus einer Palette von 16,7 Millionen (32 Bit/Bildpunkt) auswählt, und das 92 dots per inch auf den Bildschirm bringt. Das entspricht annähernd den Leistungen des menschlichen Auges. Trotzdem erreichen uns natürlich keine 250 KB Information bei der Betrachtung des originalen nfd-Logos, da das menschliche Auge mit einer noch wesentlich raffinierteren Methode der Informationskompression arbeitet. Nach unserem bisherigen Wissen tasten wir Bilder rasch nach bestimmten Elementen, wie senkrechte oder waagerechte Konturen, Farben, Bewegung, etc. ab, und rekonstruieren in unserem Gehirn daraus die Information. Durch einen solchen Filtermechanismus sind wir erfahrungsgemäß auch in der Lage, aus einem Gewirr von Stimmen gezielt nur die herauszuhören, die wir wünschen. Auch dieses Beispiel zeigt, wie gering der wirkliche Anteil an Information aus dem großen Angebot an Signalen ist.
Dieses für uns Menschen triviale Beispiel macht deutlich, daß ein Interpretationssystem zwar Information dekodiert, aber im fehlerkorrigierbaren Kode auch rekonstruieren kann. Es ist bei konsequenter Fortführung dieses Gedankens sogar in der Lage, selbst Information zu erzeugen und damit, vorausgesetzt die Information ist begründet, Wissen zu produzieren. Findet diese erzeugte Information ihre Bestätigung in der Rückkopplung mit dem Sender, dessen Information rekonstruiert bzw. vorhergesagt wird, so zeigt sich das Interpretationssystem als tauglich. Natürlich läßt sich auch Wissen in Form von Bits darstellen und damit als Information übertragen. Es zeichnet sich aber durch eine erhöhte Zuverlässigkeit oder Glaubwürdigkeit aus, indem es sozusagen mit einer optimalen Redundanz die Information absichert, und ist daher einfacher Information weit vorzuziehen. Trotzdem hat auch Wissen als begründete Information in seinem Informationscharakter nur eine begrenzte Wahrscheinlichkeit, bei der Beseitigung von Ungewißheit.
Als das raffinierteste Interpretationssystem kann die lebende Zelle angesehen werden, die die Information der DNS durch einen äußerst komplizierten und noch weitgehend unverstandenen Metabolismus interpretiert und so Lebewesen erzeugt, deren inneres Modell ihrer Umwelt, an der realen Welt seit Jahrmillionen getestet wird. Ein solches System erwirbt Wissen, das für sein Überleben notwendig ist. In diesem Zusammenhang gewinnt der Shannon'sche Begriff Redundanz oder Weitschweifigkeit eine neue Dimension, da hier unzählige Interpretationssystem mit unterschiedlichen Hypothesen miteinander konkurrieren. Wir haben es also nicht nur damit zu tun, daß eine bestimmte Kodierung Redundanz zeigt, sondern darüberhinaus damit, daß verschiedene Kodierungen um die optimale Interpretation der Signale im Wettbewerb stehen. Redundanz hat somit neben der wichtigen Funktion der Informationssicherung auch die der Suche nach einer optimalen Informationskomprimierung. Die Möglichkeit, eine äußerst komplexe Struktur mit einer einzigen Formel oder z.B. die gesamte Bedeutung der Information mit der Shannon-Weaver'schen Gleichung darzustellen, ist Teil einer solchen Informationskomprimierung.
1. Daß oft von Information die Sprache ist, ohne daß der meist überwiegende Anteil an Noise und Redundanz davon unterschieden wird.
2. Daß der Unterschied zwischen Information und ihrer Interpretation weitgehend unverstanden bleibt.
3. Daß Information auch falsch, irreführend oder rein fiktiv sein kann und erst durch die Redundanz an Verläßlichkeit gewinnt. Wobei wir eine Information zunächst immer als gegeben und damit als wahr ansehen müssen.
4. Daß wir nur Information empfangen können, die wir potentiell bereits besitzen, und daß das Denken diese Information jeweils selbst erzeugen muß.
Besonders deutlich wird das in einem Aufsatz von Cohen, J. und Stewart, I. (1991), die sogar den Informationsgehalt der DNS anzweifeln und zu dem Ergebnis kommen, daß unsere Hand aus Fleisch, Blut und Knochen, aber nicht aus Information besteht. Als würden Molekularstrukturen und Morphologie ohne Information existieren können. In Wirklichkeit ist der Durchbruch der Molekularbiologie in den 50er Jahren sicher nicht zufällig mit der Entstehung der Informationswissenschaft geschehen. Vielmehr sagte Erwin Schrödinger die genetische Information in "aperiodic crystals" für das Leben voraus, bevor Avery den Zusammenhang zwischen den Genen und der DNS erkannte (Mayr, E. 1982). Bücher selbst sind solche aperiodischen "Kristalle", die uns als geometrische Formen in den Zeilen entgegentreten (Hofstadter, D. R. 1979).
Die Konsequenzen der zahlreichen Fehleinschätzungen über Begriffe wie Information und Wissen reichen heute tief in den wirtschaftlichen, juristischen und politischen Bereich und zeigen dort unabsehbare Folgen, da wir im Informationszeitalter natürlich längst gezwungen sind, informationsbezogen zu handeln, ohne eine allgemein akzeptierte theoretische Grundlage zu bieten. Man behauptet also Information zu quantifizieren und zu verkaufen und dies mit einem weitgehend fehlerhaften Informationsbegriff. Sieht man vom störenden Rauschen ab, so vermarkten wir ausschließlich Redundanz, da Information im eigentlichen Sinne nur im Unikat vorliegt und zur Vermarktung völlig ungeeignet ist.
Es ist die hohe Bedeutung der Redundanz, die wir in den letzten Jahrzehnten unterschätzt haben. Sie sichert nicht nur die Information, sie hilft sie auch zu vermehren und sie verschiebt, wie wir gesehen haben auch ihre Quantifizierung und Bewertung, da Information ohne Redundanz wertlos ist.
Buckland, M.K.: Information as Thing
JASIS 42 (5) S.351-360 (1991)
Budin, G.: The Structure and Role of Specialized
Information in Scientific and Technical Terminologies.
In: Classification, Data Analysis, and Knowledge Organization. Eds.:
Bock, H.-H. und Ihm, P. Springer-Verlag, Berlin, S.216-220 (1991)
Bundesminister für Forschung und Technologie: Fachinformationsprogramm 1985-88 der Bundesregierung 1990-1994 (1985)
Bundesminister für Forschung und Technologie: Fachinformationsprogramm der Bundesregierung 1990-1994 (1990)
Cohen, J. and Stewart, I.: The information in your
hand
The Mathematical Intelligencer 13 (3) S.12-15 (1991)
Debons, A.: Introductory address III
In: Informatione Science. Search for identity Ed.: Debons, A., S.9-18
Marcel Dekker, Inc., New York (1974)
Einstein, A.: Über die spezielle und die
allgemeine Relativitätstheorie. 9. Aufl.
Vieweg und Sohn, Braunschweig (1920)
Folbert, O.G. und Hackl, C. (Hrsg.): Der Informationsbegriff
in Wissenschaft und Technik.
R. Oldenbourg Verl. München, Wien (1986)
Garfield, E.: Essays of an Information Scientist,
Vol. 1-4
ISI Press, Philadelphia. (1977 - 1981)
Hofstadter, D. R.: Göder, Escher, Bach:
An eternal golden braid
Vintage Books, New York (1979)
House, D.L.: DVI Update: Effective Multimedia on
the PC
CD-ROM Professsional S.35-36 Nov. (1991)
Kleinbart, P.: The intersection of information,
economics and universality in the financial world of the 1990s
J. of Inf. Sci. 17 S.137-143 (1991)
Körner, H.G.: Optimale Klassengröße,
die mathematische Konstante e und Notationsfragen
Studium zur Klassifikation 9 S.50-66 (1980)
Kuhlen, R.: Pragmatische Aspekte beim Entwurf und
Betrieb von Informationssystemen
Nachr. f. Dok. 42 (1) S.43-44 (1991)
Line, M.B. and Sandison, A.: 'Obsolescence' and
Changes in the Use of Literature with Time
J. Doc. 30 S.283-350. (1974)
Line, M.B.: Citation Decay of Scientific Papers:
Variation According to Citations Received
J. Information Sci. 9 S.90-91 (1985)
Line, M.: Information management in perspective
In: Information Management in Wissenschaft und Forschung, Ed. Cronin,
B. und Klein, S., Vieweg, Braunschweig (1990)
Lyons, J.: semantics Vol. 1
Cambridge Univ. Press, Cambridge (1979)
Mayr, E.: The growth of biological thought
Harvard Univ. press, Cambridge S.824 (1982)
Meadows, A.J.; Gordon, M. and Singleton, A.: Dictionary
of computing and new information technology
Century published, London (1984)
Schneider, H.: Hypothese, Experiment, Theorie
Walter de Gruyter, Berlin S.32 (1978)
Shannon, C.E. and Weaver, W.: The Mathematical
Theory of Communication
Univ. Illinois. Press, Urbana (1949)
Steinbuch, K.: Kommunikationstechnik
Springer-Verlag, Berlin (1977)
Stokes, A.V.: Concise Encyclopedia of Information
Technology
Gower, Aldershot (1982)
Stonier, T.: Towards a general theory of information
II: information and entropy
Aslib. Proc. 41 (2) S.41-55 (1989)
Stonier, T.: Information and the Internal
Structure of the Universe. An Exploration into Information Physics
Springer Verl. London (1990)
Umstätter, W; Rehm, M. und Dorogi, S.: Die
Halbwertszeit in der naturwissenschaftlichen Literatur
Nachr. f. Dok. 33 (2) S.50-52 (1982)
Umstätter, W. und Rehm, M.: Bibliothek und
Evolution
Nachr. f. Dokum. 35 S.237-249. (1984)
(Aufsatz im Volltext)
Umstätter, W.: Ergebnisse anwenden bevor
sie entdeckt sind.
Umscha 84 (5) S.130-131 (1984)
Umstätter, W.: Was ist Information eigentlich
wert?
In: Deutscher Dokumentartag 1988 DGD-Schrift (Doktag 1) 4/89, S.589-603
(1989)
Umstätter, W.: Die evolutionsstrategische
Entstehung von Wissen.
Vortrag auf der 2. Tagung der Int. Ges. f. Wissensorg., 16.-18.Okt.
1991, Weilburg Im Druck (1991)
(Aufsatz im Volltext)
Wenzlaff, B.: Vielfalt der Informationsbegriffe
Nachr. f. Dok. 42 (5) S.355-361 (1982)
Whittemore, B.J. and Yovits, M.C.: A generalized
concept for the analysis of information.
In: Informatione Science. Search for identity Ed.: Debons, A., S.29-45
Marcel Dekker, Inc., New York (1974)
Wiener, N.: Mensch und Maschine. Kybernetik und
Gesellschaft
Athenäum Verl. Frankfurt (1964)
Zemanek, H.: Elementare Informationstheorie
R. Oldenbourg, München (1959)