Der besondere Trick, dass zweifelhafte Statistiken erkennt
Mit Benford Gesetz, können forensische Statistiker verdächtige Muster in der rohen Zahlen erkennen und schätzen, dass die Chancen Zahlen manipuliert wurden
Diese Woche könnte wir eine ganze Nation für die zwielichtigen Wirtschaftsstatistiken Übergabe Büste. Aber warum würde sie stören? Länder haben ein Interesse an ihrer Konten, wie Unternehmen und Privatpersonen zu verzerren. Bist du ein Mitglied der Eurozone wie Griechenland, zum Beispiel musst du verschiedene wirtschaftliche Kriterien erfüllen, und besteht die Gefahr von Sanktionen, wenn Sie zu verpassen.
Regierungsangaben unterliegen verschiedenen Prüfungen bereits, natürlich, aber neben Überprüfung, dass Dinge sich mit einander heiraten, forensische Statistiker haben auch Wege spotting-verdächtige Muster in die reinen Zahlen, und damit Abschätzung der Chancen, denen Figuren aus einem Satz von Konten manipuliert wurden. Eines der klügsten Werkzeuge ist etwas namens Benford-Gesetz.
Genommen Sie an, Sie haben Daten über, sagen wir, die Bevölkerung von jeder Nation der Welt. Jetzt nehmen Sie nur die "führende Ziffer" von jeder Zahl: die erste Zahl in der Reihe, wenn Sie mögen. Für die Bevölkerung Großbritanniens, die 61,838,154 im Jahr 2009 war, wäre diese führende Ziffer "6". Andorras war 85.168, so dass "acht". Und so weiter.
Nehmen Sie die führenden Ziffern, aus allen Ländern, könnte dann insgesamt Sie naiv erwarten die gleiche Anzahl von Einsen, Fours, Neunen und So weiter. Aber in der Tat, für die natürlich vorkommenden Daten, bekommen Sie mehr, als zweit, mehr zweien als dreier, und So weiter, bis hin zum 9. Dies ist Benfords-Gesetz: die Verteilung der führenden Ziffern folgt eine logarithmische Verteilung, so erhalten Sie ein "one" am häufigsten erscheinen als erste Ziffer rund 30 % der Zeit und eine neun als erste Ziffer nur 5 % der Zeit.
Das nächste Mal Sie auf einen Bus warten, Sie können darüber nachdenken warum dies (denken Sie daran geschieht, was führende Ziffern zu tun, wenn Mengen immer wieder, vielleicht verdoppeln) aber Realität stimmt mit dieser Theorie ziemlich ordentlich und wenn man th sehen Sie die Proportionen der jede führende Ziffer aus vielen realen Datasets, grafisch neben was Benford Gesetz sagt voraus, dass sie sein sollten , mit Daten aus Twitter-Nutzer Anhänger zählt die Anzahl der Bücher in verschiedenen Bibliotheken in den USA.
Es funktioniert nicht perfekt: es funktioniert nur, wenn Sie Gruppen von Zahlen, die mehrere Größenordnungen zum Beispiel umfassen untersuchen. So, für das Alter in Jahren der graduate arbeitenden Bevölkerung, die von etwa 20 bis 70 geht, wäre es viel gutes, aber für die persönlichen Ersparnisse aus dem nichts zu Millionen, sollte es in Ordnung sein. Und natürlich Benford Gesetz funktioniert in anderen Zählsystemen, also, wenn drei Finger Faultiere je rechnen entwickeln und in Basis-6 zählen oder vielleicht Basis-12, das Gesetz noch halten würde.
Diese Eigenschaft des natürlich vorkommenden Daten verwendet wurde, um für zweifelhafte Verhalten in Zahlen seit nunmehr vier Jahrzehnten zu überprüfen: Es wurde zuerst verwendet auf sozioökonomische Daten zur Unterstützung von Planung Anwendungen und dann auf Firmenkonten: vor US-Gerichten ist es sogar zulässig. Aber im Jahr 2009, Ökonom von Bundesbank vorgeschlagen mit Benford Gesetz auf Länder Wirtschaftsdaten und letzten Monat wurden die Ergebnisse veröffentlicht (Hat-Tip an Tim Harford für das Papier).
Forscher nahm makroökonomische Daten auf alle 27 EU-Staaten, Blick speziell auf die Buchhaltungsdaten Ländern übergeben, für die Überwachung, die alle kostenlos online-Repository Eurostat gebucht: Dinge wie öffentliche Defizit, Schulden, Einnahmen, Ausgaben usw.. Dann die ersten Ziffern von den Zahlen haben, und für Abweichungen von was Sie Voraussagen würde, überprüft mit Benford Gesetz.
Die Ergebnisse waren sehr lustig. Griechenland – deren Wirtschaft getankt hat – zeigte die größte und am problematischsten Abweichung von Benford Gesetz eines Landes des Euro.
Dies ist keine große Überraschung: die EU hat mehrere Untersuchungen in Griechenlands Zahlen bereits laufen, und die, die von 2005 bis 2008 wurden nach der Tat mehrfach nach oben korrigiert. Aber es ist nett, und wollten Sie entfernt einen sehr nerdy Nachmittag wile, ich rechne damit, Sie könnte sogar die Daten von Eurostat kostenlos herunterladen, und wiederholen Sie die Analyse selbst. Freude!