Arbeitslosigkeit steigt – oder ist das statistische Rauschen?
Kleine Abweichungen in Zahlen bekommen Politiker und Kommentatoren aufgeregt, aber wir sind möglicherweise falsch, Muster zu lesen

Was alles, was diese Zahlen bedeuten? "" Besorgniserregend"arbeitslos Aufstieg braucht dringenden Handlungsbedarf – Labour", war die BBC-Überschrift. Es erklärt das Problem in seinen eigenen Worten: "die Zahl der Arbeitslosen stieg von 38.000 auf 2,49 Millionen in den drei Monaten bis Juni, offiziellen Zahlen zeigen."
Jetzt gibt es Dutzende von verschiedenen Möglichkeiten auf den Arbeitsmarkt – zu quantifizieren werde ich nicht, sie alle hier zusammenzufassen. Die Arbeitslosenstatistik und der Arbeitskräfteerhebung sind allgemein verwendet, und Anzahl der geleisteten Arbeitsstunden ist informativ, auch: Sie können untereinander kämpfen, für welches das beste ist, und erhalten Sie abgelenkt durch Parteipolitik zu Inhalt Ihres Herzens. Aber behauptet, dass diese Zahl für die Anzahl der Arbeitslosen ist gestiegen, die BBC ist einfach falsch.
Hier ist der Grund. Die "Arbeitsmarkt" Zahlen kommen durch das Büro für nationale Statistiken, und es hat die neuesten Zahlen in ein PDF-Dokument veröffentlicht. Auf Seite 13, Tisch, 4. Reihe finden Sie die Zahlen, die die BBC zitiert. Arbeitslosigkeit im Alter von 16 Jahren vor 2.494.000 steht und um 38.000 in einem Viertel (32.000 pro Jahr) gestiegen. Aber sehen Sie auch einige andere Zahlen, nach dem Symbol "±" in einer Spalte markiert "Probenahme Variabilität des Wandels".
Diese Zahlen nennt man "95 %-Konfidenzintervall" und sind eine der nützlichsten Erfindungen des modernen Lebens.
Wir nicht jedes Mal, wenn wir wollen, dass einige Daten eine Vollerhebung der gesamten Bevölkerung, weil sie zu teuer und zeitaufwändig sind. Stattdessen nehmen wir, was wir hoffen eine repräsentative Stichprobe ist.
Dies kann auf zwei interessante Weise fehlschlagen. Erstens: eine Probe systematisch nicht repräsentativ sein kann: Wenn Sie über die Gesundheit der Bevölkerung als Ganzes wissen wollen aber Sie Personen im Wartezimmer ein GP befragen, dann du ein Idiot bist.
Eine Probe kann aber auch durch Zufall über Stichprobenfehler nicht repräsentativ. Dies verursacht nicht durch Idiotie. Stellen Sie sich einen großen Kaugummi Automaten mit Tausenden von blauen und gelben Kaugummi Kugeln. Sie wissen, dass genau 40 % von diesen Kugeln gelb sind. Wenn Sie eine Probe von 100 Kugeln nehmen, erhalten Sie möglicherweise 40 gelb sind, aber in der Tat, wie Sie bereits intuitiv wissen, manchmal erhalten Sie 32, manchmal 48, oder 37, oder 43, oder was auch immer. Dies wird Fehler bemustert.
Jetzt können Sie in der Regel am anderen Ende des Teleskops. Sie nehmen Ihre Probe von 100 Kugeln, aber du weißt nicht, des wahre Anteils der gelben Kugeln im Glas – Sie versuchen einzuschätzen, die – so dass Sie eine 95 %-Konfidenzintervall um welchen Anteil von gelb erhalten Sie in Ihrer Stichprobe von 100 Kugeln mit Hilfe einer Formel berechnen (in diesem Fall 1,96 x √ ((0.6x0.4) ÷ 100)).
Was bedeutet das? Streng (es macht immer noch mein Kopf schmerzte), dies bedeutet, dass wenn Sie wiederholt Proben von 100, dann auf 95 % dieser Versuche nahm, der wahre Anteil in das Glas irgendwo zwischen den oberen und unteren Grenzen der 95 %-Konfidenzintervalle Ihrer Proben liegen würde. Das ist alles, was, die wir sagen können.
So, wenn wir diese Beschäftigungszahlen anschauen, können Sie sehen, dass die gemeldeten Änderungen eindeutig nicht statistisch signifikant sind: die voraussichtliche Änderung im vergangenen Quartal 38.000, aber das 95 %-Konfidenzintervall ist ± 87.000, vom-49,000 bis 125.000 läuft. Die breite Palette umfasst deutlich Null, keine Veränderung überhaupt. Die jährliche Veränderung ist 32.000, aber wieder ist ± 111.000.
Ich weiß nicht, was für die Wirtschaft geschieht; Es ist wahrscheinlich nicht groß. Aber diese konkreten Zahlen nichts sagen, und es gibt ein ebenso wichtiges Problem aus, das ist ehrlich gesagt beständiger für sinnvolle politische Engagement. Wir sind bombardiert, jeden Tag, mit einer riesigen Menge an numerische Daten, mit absoluter Sicherheit und fetischistische Präzision. In Wirklichkeit Rollen viele diese Zahlen belaufen sich auf nichts anderes als statistische Rauschen, die sanfte statische Fuzz Zufallsvariation und Stichprobenfehler, Herstellung von Figuren, die rauf und runter treiben nach kein Muster, wie das Ändern eines Würfels. Dies, ich sage voraus, selbstbewusst, ändert sich nie.