Kaum etwas kann die Intuition der meisten Menschen so unbrauchbar machen wie Zahlen. Selbst bei relativ einfachen nummerischen Zusammenhängen haben fast alle Menschen eine falsche Auffassung, und wenn sie der Wirklichkeit konfrontiert werden, neigen sie eher dazu, die Darstellung der Wirklichkeit für fehlerhaft zu halten. Dabei ist es die unreflektierte Intuition über einen abstrakten Gegenstand, die fehlerhaft ist. Die unsinnliche Beschaffenheit des abstrakten Gegenstandes führt zur unsinngen Beschaffenheit der Annahmen.

Hierzu nur ein Beispiel, und zwar ein sehr einfaches und durchschaubares. Es beginnt mit einer an sich völlig unwichtigen Frage. Wir schreiben verschiedene, nummerisch messbare Erscheinungen der Wirklichkeit mit einem mehrere Größenordnungen überdeckenden Wertebereich als Zahlen auf, und zwar ruhig auch solche aus Bereichen, die keinen inhaltlichen Zusammenhang haben, damit die Auswahl ja schön willkürlich und damit quasi zufällig wirke. Eine solche Liste könnte etwa die Länge von Straßen in Metern, die Einwohnerzahlen von Städten, die Leistungsaufnahme von verschiedenen elektrischen Geräten und die Anzahl Dateien auf verschiedenen Festplatten zusammenführen. Wo man sich einmal vorsätzlich nur um Zahlen kümmert, da soll es auch nicht bekümmern, dass man hier Äpfel, Birnen und Kokosnüsse zusammenführt. Dabei gelte noch als Zusatzregel, dass jede dieser Zahlen größer oder gleich Eins ist und dass keine dieser Zahlen mit führenden Nullen notiert werde, sie beginnen also alle mit einer Ziffer zwischen 1 und 9. Die völlig unwichtige Frage lautet nun: Kommen in dieser Liste alle möglichen Anfangsziffern von 1 bis 9 gleich häufig vor?

Wer kurz nachdenkt und nicht völlig blind seiner Intuition folgt, hat hier natürlich sofort einen guten Einwand.

Bei einigen möglichen Quellen für Zahlen ist nämlich sofort klar, dass bestimmte Anfangsziffern bevorzugt werden. Dies gilt etwa für Verbraucherpreise, die vorsätzlich und manipulativ so gewählt werden, dass sie kleiner aussehen als sie sind. Wenn man zum Beispiel die Preise in Versandhauskatalogen oder sonstiger Reklame betrachtet, fällt sofort auf, dass 99 häufiger als 100 ist, ebenso wird eher 49 als 50 und eher 19 als 20 zum Preis gemacht. Der Zweck dieser Auswahl ist klar, es geht hier nicht um „Messwerte“ irgendeiner Art, sondern um einen sozialen Prozess, nämlich um die alltägliche Gaunerei, um Schwindel, um die Irreführung von Menschen. Der Zielgruppe dieses Schwindels, die zu einem betrüblich großen Anteil des vernünftigen Umganges mit Zahlen nicht mächtig ist, soll glauben gemacht werden, dass sie ein „Schnäppchen“ machen kann. Damit sie. Ebenso hastig wie unreflektiert zuschnappe. Die Häufigkeit und Gewöhnlichkeit dieses Kunstgriffes zeigt schon, dass zumindest die Rechnung der Schwindler aufgeht, wenn sie damit rechnen, dass kaum noch jemand rechnen kann.

Um diesem Einwand zu begegnen, werden Zahlenquellen mit dieser Art von vorsätzlichen Ungleichverteilungen einfach ausgeschlossen. Mit dieser Einschränkung der möglichen Quellen für Zahlen noch einmal die gleiche Frage: Sind die Anfangsziffern der Zahlen gleich verteilt oder nicht?

Mit dieser Vorsichtsmaßnahme beim betrachteten Material würden die meisten Menschen dazu neigen, alle Anfangsziffern für gleich häufig zu halten. Die so ermittelten Zahlen sind ja schließlich so gut wie zufällig, da wird keine auffällige Ungleichmäßigkeit erwartet.

Und. Das ist ein Fehlschluss. Und zwar einer, der auch intelligenten Menschen sehr leicht passiert.

Denn die aus der Wirklichkeit entnommenen Zahlen aus einem Bereich, der mehrere Größenordnungen überspannt, weisen eine deutliche Verteilung ihrer Anfangsziffern auf. Sie werden mit zunehmender Anfangsziffer immer seltener. Beginnen noch fast dreißig Prozent dieser Zahlen mit der Ziffer „Eins“, so steht die Ziffer „Neun“ lediglich an der ersten Stellen von nicht einmal fünf Prozent der Zahlen.

Das wirkt zunächst für die meisten Menschen unglaublich, und wenn man ihnen davon erzählt, zweifeln sie eher am Inhalt des Mitgeteilten als an ihrer eigenen Anschauung. Es handelt sich um das Benfordsche Gesetz, um eine schon recht lange bekannte Erscheinung in solchen Zahlenlisten. Dieses Gesetz hat dort, wo man professionell mit Zahlen umgeht, sogar eine Anwendung. Wenn Zahlen anders verteilt sind, als es nach dem Benfordschen Gesetz zu erwarten wäre, denn ist das ein Hinweis darauf, dass diese Zahlen in betrügerischer Absicht manipuliert wurden. Auf diese Weise kann zum Beispiel eine manipulierte Buchführung entdeckt werden, auch wenn die Betrüger sich „unverdächtige“ Geschäftsvorfälle für ihre Manipulationen ausgedacht haben.

Vielleicht wird das Benfordsche Gesetz ein bisschen überzeugender, wenn man es durch einen kleinen Versuch bestätigt. Die Dateien auf der Festplatte eines Computers sind ja ein gutes Beispiel für ein buntes Durcheinander; neben kleinen Texten gibt es große Multimedia-Daten, ausführbare Dateien und allerhand Binärformate, all dieses in weit auseinander liegenden Dateigrößen. Das Benfordsche Gesetz sollte sich auch in der Verteilung der Anfangsziffern von Dateigrößen zeigen.

Ich habe ein kurzes Programm geschrieben, um dieses Experiment zu machen. (Es wird weiter unten zum Download angeboten, so kann jeder das Ergebnis mit seiner eigenen Festplatte nachvollziehen.) Wenn ich dieses Programm auf das Wurzelverzeichnis meines unter Linux laufenden Arbeitsrechners loslasse, erhalte ich nach gut zehn Minuten die folgende Ausgabe — in der ersten Spalte steht die Anfangsziffer, in der zweiten Spalte die Häufigkeit ihres Auftretens und in der dritten Spalte wird diese Häufigkeit prozentual ausgegeben:

1      108232   28.609%
2       79662   21.057%
3       48951   12.939%
4       35642    9.421%
5       25987    6.869%
6       22929    6.061%
7       19348    5.114%
8       18908    4.998%
9       18658    4.932%

Das ist ein recht deutliches Ergebnis, das der nach Benfords Gesetz zu erwartenden Verteilung sehr nahe kommt.

Es ist aber auch das genaue Gegenteil dessen, was die meisten Menschen aufgrund ihrer Anschauung vermuten würden.

Für die Anschauung eines Menschen sind Ziffern und Zahlen nämlich zunächst abstrakte Symbole, die keine sinnliche Qualität haben. Deshalb besteht die Neigung, alle Ziffern für „gleichwertig“ zu halten, da sie zur gleichen sinnlichen Erfahrung führen, nämlich zu gar keiner. Auch hat die erste Ziffer einer Zahl keine andere Erfahrungsqualität als die folgenden Ziffern, nämlich wiederum gar keine. Weshalb sollte man da aus seiner Wahrnehmung heraus vermuten, dass eine solche Verteilung auftreten könnte? Das klingt einfach unlogisch.

In Wirklichkeit jedoch sind gerade die erste Ziffern einer Zahl alles andere als „gleichwertig“, und dies schon gar nicht, wenn wir Zahlen aus der „Wirklichkeit“ betrachten, die ja durch ein materielles Gegenstück gedeckt werden. Um die erste Ziffer einer Zahl von „Eins“ auf „Zwei“ zu erhöhen, muss das in der Zahl ausgedrückte Material verdoppelt, also um 100 Prozent vermehrt werden. (Streng genommen gilt das nur für die erste Zahl, die mit der Ziffer „Eins“ beginnt, aber ich will mit dieser Erläuterung etwas veranschaulichen und nicht in einer präzisen, aber dafür schwer eingängigen Darstellung verbergen.) Für den Schritt von „Zwei“ auf „Drei“ reicht eine Vermehrung um fünfzig Prozent. Auch hierzu eine kleine Tabelle. Die erste Spalte gibt an, auf welche Ziffer von der vorhergehenden erhöht werden soll, die zweite zeigt, wieviel Prozent Erhöhung des in der Zahl ausgedrückten Wertes erforderlich sind, um diese Ziffer zu erreichen.

2  100.0
3   50.0
4   33.3
5   25.0
6   20.0
7   16.6
8   14.2
9   12.5

Wenn eine Zahl, die mit der Ziffer „Neun“ beginnt, um nur wenig mehr 11 Prozent ansteigt, so befindet sie sich schon in der nächsten Größenordnung und beginnt wieder mit der Ziffer „Eins“ und benötigt wieder ein Wachstum um hundert Prozent, um die folgende Anfangsziffer „Zwei“ zu erreichen. Wenn ein beliebiger Wert im Laufe der Zeit anwächst, denn befindet sich also seine zahlenmäßige Darstellung für den größten Teil dieser Zeit im Bereich niedrigerer Anfangsziffern. Auf diesem Hintergrund wirkt das Benfordsche Gesetz gar nicht mehr überraschend oder gar unanschaulich und widersinnig — ich sagte ja schon eingangs, dass es ein sehr einfaches und durchschaubares Beispiel ist.

Eines kann man an diesem Beispiel aber ganz sicher lernen. Nämlich, dass auf die sinnlich gebundene Anschauung wenig Verlass ist, wenn abstrakte Dinge wie die Darstellung von Sachverhalten in Zahlen betrachtet werden. Diese Lektion. Ist. Umso wichtiger, als dass in Politik, Propaganda und Reklame geradezu ein Kult mit Zahlen betrieben wird, der immer mehr dumme Anhänger findet.

Download-Link: Mein Python-Programm für die Ermittlung der Verteilung der Anfangsziffern von Dateigrößen. Es handelt sich um ein Python-Skript. Um es auszuführen, wird ein Interpreter für diese Sprache benötigt, dieser steht für beinahe alles frei zur Verfügug, was Bits und Bytes bearbeiten kann.