Verständnis der "Form" der Daten, unsere Welt zu gestalten
Gurjeet Singh ist Mitgründer und CEO der Datenanalyse Unternehmen Ayasdi. Er erwarb seinen Doktortitel aus Stanford numerische Mathematik und vor der Gründung von Ayasdi, arbeitete er bei Texas Instruments und Google. Diese Op-Ed ist Teil einer Reihe von World Economic Forum Technology Pioneers, Klasse 2015 zur Verfügung gestellt. Singh trug dieses Artikels Leben Wissenschaft Experten stimmen: Op-Ed & Einblicke.
Wir leben in einer außergewöhnlichen Zeit. Die Fähigkeit zu generieren und Speichern von Daten hat schwindelerregende Ausmaße erreicht. Was innerhalb dieser Daten liegt die Chance für diese Generation, die dringendsten Probleme zu lösen – von Krankheit und das Klima zu ändern, zur Gesundheitsversorgung und Kundenverständnis. Das Ausmaß der Verkaufschance zeichnet sich durch die Größe der erstellten Daten – und es ist schon erstaunlich.
Internet Weltbevölkerung wuchs um mehr als 750 Prozent in den vergangenen 15 Jahren auf mehr als 3 Milliarden und werde in naher Zukunft die Durchdringung 50 Prozent-Marke. Diese Population mehr als 2,5 Millionen Teile des Inhalts auf Facebook teilt, tweets mehr als 300.000 Mal und sendet mehr als 204 Millionen SMS-Nachrichten – jede Minute.
Darüber hinaus wird die Beschleunigung in Datenwachstum in den kommenden Jahren drastisch erhöhen, als das Internet der Dinge ergreift 20 bis 30 Milliarden "Dinge" bis zum Jahr 2020 zu verbinden. Diese Geräte überträgt Daten über alles, von den Status Ihres Babys Windel, um die Hirn-Trauma von NFL-Spieler, für die Gesundheit Ihrer Rinder Herde erlebt. [Geld treibt Wetterdaten, aber was ist Klima? (OP-ED)]
Untermauerung dieser Explosion sind außergewöhnliche Fortschritte in der Daten-Storage-Technologie und Architektur. Qualitätsbereinigten Preise für Daten-Storage Geräte fiel mit einer durchschnittlichen jährlichen Rate von fast 30 Prozent von 2002 bis 2014. Mit einer inkrementellen Kosten zum Speichern von Daten effektiv bei Null reagierten Institutionen durch die Erfassung alles möglich ist, akzeptieren die Prämisse, dass was liegt innerhalb sinnvollen Wert für das Unternehmen produzieren.
Über die Zahlen hinaus sehen
Trotz der technischen Fortschritte in der Datenerhebung und-Speicherung hinkt Wissensgenerierung. Dies ist eine Funktion wie Organisationen ihre Daten heran, wie sie Analysen durchführen und wie sie lernen durch Maschinenintelligenz automatisieren.
Im Kern ist es ein mathematisches Problem. Für jeden Datensatz ist die Gesamtzahl der möglichen Hypothesen/Abfragen eine exponentielle, im Verhältnis zur Größe der Daten. Exponentialfunktionen sind schwer genug, für den Menschen zu verstehen; jedoch um Angelegenheiten weiter zu erschweren, die Größe der Daten selbst wächst exponentiell und ist ein weiterer Wendepunkt zu treffen, wie das Internet der Dinge einsetzt.
Das heißt, dass wir doppelte exponentielles Wachstum in der Zahl der Fragen, die wir stellen, können unsere Daten konfrontiert sind. Wenn wir die gleichen Ansätze wählen, die uns im Laufe der Zeit gedient haben – iterativ Fragen der Daten, bis wir die richtige Antwort bekommen – wir werden haben verloren auf eine Gelegenheit, unsere generationsübergreifende Chance zu begreifen. [Ihr Leben und Ihre Zukunft vorhergesagt von Daten]
Gibt es nicht, und wird nicht immer sein, genug Datenwissenschaftler in der Welt in diesen Ansatz erfolgreich sein noch können Forscher arm genug Bürger Datenanalysten mit neuer Software, dieses Bedürfnis zu befriedigen. Software, die Frage Fragen oder Hypothese Entwicklung zugänglicher oder effizienter macht keine kritische Anliegen: sie fallen nur weiter hinten, sobald neue Daten verfügbar sind jede Millisekunde.
Herausarbeitung der Form der Daten
Für die Gesellschaft wirklich entsperren den Wert, der in unsere Daten liegt, müssen wir unser Augenmerk auf die Daten, die Fragen für später beiseite.
Dies erweist sich auch ein mathematisches Problem zu sein. Daten, es stellt sich heraus, hat Form. Diese Form hat Bedeutung. Die Form der Daten erfahren Sie alles Wissenswerte über Ihre Daten aus seiner offensichtlichen Eigenschaften zu seiner am besten gehüteten Geheimnisse:
- Regression produziert Linien
- Kundensegmentierung erzeugt Gruppen
- Wirtschaftswachstum und Zinsen haben eine zyklische Natur (Krankheiten wie Malaria haben diese Form auch)
Durch die Kenntnis der Form und wo eine Analyse ist in dieser Form, wir erheblich verbessern unser Verständnis von wo wir wo wir gewesen sind sind, — und vielleicht noch wichtiger ist – was als nächstes passieren könnte. In der Form der Daten zu verstehen, verstehen wir jede Funktion des Datensatzes, sofort zu erfassen, was wichtig ist, so drastisch reduzieren die Anzahl der Fragen zu stellen und den Discovery-Prozess zu beschleunigen.
Durch eine Änderung unseres Denkens – und ausgehend von der Form der Daten, keine Reihe von Fragen (die oft mit erheblichen Verzerrungen kommen) — Wir können wissen aus diesen schnell wachsenden, massive und komplexe Datensätze extrahieren.
Das wissen, das in elektronischen Patientenakten, Rechnungsunterlagen und klinischen Aufzeichnungen verborgen liegt ist genug zu transformieren, so liefern wir Gesundheit und Umgang mit Krankheiten.
Das wissen, das liegt in der massiven Daten speichert der Regierungen, Universitäten und anderen Institutionen beleuchten das Gespräch über Klimawandel und Punkt des Weg, um Antworten auf was wir tun müssen, um den Planeten für künftige Generationen zu schützen.
Das wissen, das durch Web, Transaktion verdeckt ist, CRM, soziale und andere Daten wird ein klareres, sinnvolleres Bild des Kunden informieren und bestimmen wiederum die optimale Möglichkeit zur Interaktion.
Dies ist die Gelegenheit für unsere Generation, Daten in Wissen zu verwandeln. Um dorthin zu gelangen benötigen einen anderen Ansatz, aber einer mit der Fähigkeit, die Gesamtheit der Menschheit auswirken.
Lesen Sie mehr von der Technologiepioniere auf ihre Live-Science-Landing-Page. Alle Experten stimmen Fragen und Debatten zu folgen – und werden Sie Teil der Diskussion – auf Facebook, Twitter und Google +. Die Meinungen sind die des Autors und spiegeln nicht unbedingt die Meinung des Herausgebers. Diese Version des Artikels erschien ursprünglich am Leben Wissenschaft.