Big Data und die Grippe: wie Wikipedia Influenza verfolgen kann
Durch die Überwachung der Anzahl der suchen Menschen nach Grippe Informationen auf Wikipedia, Forscher möglicherweise besser in der Lage, den Schweregrad einer Grippe-Saison, nach einer neuen Studie zu schätzen.
Forscher schuf ein neues Daten-Analyse-System, das Besuche in Wikipedia-Artikeln anschaut und fand das System konnte Grippe Ebenen in den Vereinigten Staaten, bis zu zwei Wochen früher als die Grippe-Daten von den Centers for Disease Control schätzen und Prävention veröffentlicht wurden.
Blick auf Daten über sechs Grippe Jahreszeiten zwischen Dezember 2007 und August 2013, schätzt das neue System Peak Grippe Woche besser als Google Grippe-Trends, eine andere Daten-basiertes System. Das Wikipedia-basierte System geschätzt genau der Höhepunkt Grippe Woche in drei von sechs Jahreszeiten, während das Google-System nur zwei Recht bekam, fanden die Forscher. [10 Technologien, die Ihr Leben verändern werden]
"Wir waren in der Lage, wirklich schöne Schätzungen über welche die [Grippe] in der Bevölkerung ist", sagte Studienautor David McIver, postdoctoral Fellow am Krankenhaus Boston der Kinder.
Das neue System untersucht Besuche in Wikipedia-Artikeln, die Begriffe im Zusammenhang mit grippalen Erkrankungen enthalten während Google Grippe-Trends bei Suchanfragen in Google eingegeben sieht. Die Forscher analysierten die Daten von Wikipedia wie oft in einer Stunde ein bestimmter Artikel angesehen wurde, und kombiniert ihre Daten mit Grippe aus der CDC, anhand eines Modells, die, das Sie geschaffen.
Das Forschungsteam wollte verwenden eine Datenbank, die für jedermann zugänglich ist und erstellen Sie eine System, die wäre genauer als Google Grippe-Trends, die Mängel aufweist. Zum Beispiel erhielt während der Schweinegrippe-Pandemie im Jahr 2009, und während der Grippesaison 2012-2013, Google Grippe-Trends ein bisschen "verwirrt" und überschätzt Grippe Zahlen wegen erhöhten Medienberichterstattung konzentrierte sich auf die beiden Krankheiten, sagte der Forscher.
Trifft eine Pandemie, Menschen suchen nach Nachrichten im Zusammenhang mit der Pandemie selbst, aber dies bedeutet nicht, dass sie die Grippe haben. In der Regel sagten das Problem mit Internet-basierte Schätzung Systeme ist, dass es praktisch unmöglich zu sagen, ob Menschen nach Informationen über eine Krankheit suchen, weil sie krank sind, die Forscher.
In dem neuen System, die Forscher versucht, dieses Problem zu überwinden, indem unter anderem eine Reihe von Wikipedia-Artikel "Handlungsfähigkeit als Marker für allgemeine Hintergrund-Ebene Aktivität der normalen Nutzung von Wikipedia," schrieb der Forscher in der Studie. Genau wie jedes andere Daten basierende System ist das Wikipedia-System jedoch nicht immun gegen die Fragen herauszufinden, die tatsächliche Motivation von jemandem überprüfen Informationen in Bezug auf die Grippe.
Daher sagte ist es wichtig, die Systeme wie Google Grippe-Trends und das Wikipedia-System als Ergänzung zu Daten aus amtlichen Quellen wie die CDC anzeigen, McIver.
"Wir versuchen nicht, etwas zu schaffen, die die CDC oder so etwas wie das ersetzen wird,", sagte er. Vielmehr sagten die Forscher Ziel ist ", beides gut zusammenarbeiten, geben uns eine ganzheitlichere Sicht was vor sich geht", sie.
Die Studie ist veröffentlicht in der Fachzeitschrift PLOS Computational Biology (17. April) heute.
Agata Blaszczak-Boxe anknüpfen Twitter . Folgen Sie Leben-Wissenschaft @livescience , Facebook & Google + .