Die jüngsten Berichte machen Machine Learning-Sound wie ein Sport. Es ist nicht
Nachrichten, die Baidu, Google China, betrogen um die Führung zu übernehmen, in einem internationalen Wettbewerb für künstliche Intelligenz-Technologie hat einen Sturm unter den Computer-Science-Forscher verursacht. Es heißt Machine Learning "erste Betrug Skandal" von MIT Technology Review und Baidu ist jetzt vom Wettbewerb ausgeschlossen.
Die Imagenet Challenge ist ein Wettbewerb, betrieben von einer Gruppe amerikanischer Informatiker einhergehende erkennen und klassifizieren eine Reihe von Objekten in digitalen Bildern. Der Wettbewerb selbst ist keine Turing-Test, aber es ist eine wichtige Herausforderung und eines kommerziellen Bedeutung für viele Unternehmen.
Den Betrug von Baidu war anspruchsvoll, eher eine anfängliche gestohlenen Blick auf die Antworten folgte mehr von der gleichen wenn es unbemerkt. Auch das macht es klingen schlimmer als es war. Teil des Wettbewerbs Beteiligten mit Blick auf die Antworten sowieso: jemand im Baidu-Team hat es einfach mehr als sie durften offiziell.
In ihrer Abhandlung über die Einreichung, Baidu selbst waren nicht mehr als einen technischen Fortschritt behauptet: sie bauten einen große Supercomputer, die mehr Daten als früheren Implementierungen umgehen konnte. Ein notwendig voraus, aber sehr viel eine "Aufstockung" der vorhandenen Lösungen – eine, die finanziell außerhalb der Reichweite einer typischen akademischen Forschungsgruppe wäre. Sie nahmen an dem Wettbewerb als ein Versuch zu zeigen, dass nach solchen erhebliche Investitionen in Hardware, ihre neuen Supercomputer durchführen konnte. Sie haben sich inzwischen entschuldigt für das Brechen der Regeln des Wettbewerbs.
In jedem Fall wurde der Durchbruch im Bereich bereits von Geoff Hintons Gruppe an der University of Toronto erreicht. Sie produziert die Machine learning-Äquivalent der Hochsprung "Frosbury Flop", der 2012 Version des Wettbewerbs mit einer deutlichen Verbesserung zu gewinnen, dass alle führenden Einträge jetzt von ihrem Modell abgeleitet werden. Das Modell selbst auch auf eine zwei Jahrzehnte währenden Programm der Forschung von Yann LeCun, dann der New York University gebaut.
Der Anteil ausgeblasen
Das Ergebnis der Baidu Einstieg in den Wettbewerb wurde als "e-Print" Publikation veröffentlicht. E-Prints sind Artikel, die nicht untersuchten. Sie sind eine etwas formellere Versionen der "technischen Blog-Post". Das Problem wurde von der Gemeinschaft schnell, innerhalb von drei Wochen identifiziert und eine korrigierte Version wurde veröffentlicht. Das ist Wissenschaft in Aktion.
Der "Betrug Skandal" war als solche gekennzeichnet, durch die sehr gleichen renommierten technische Publikation, die erste Ergebnisse innerhalb von zwei Tagen die e-Print-Publikation zu seinen Lesern ausgestrahlt: MIT Technology Review.
Aussonderung MIT Technology Review kann in diesem Fall ein wenig unfair sein, denn dies ist Teil eines größeren Phänomens, wo technische Ergebnisse in der Presse trompetete sind, bevor sie vollständig schmeckte (geschweige denn sind verdaut) von der wissenschaftlichen Gemeinschaft. E-Print Publikation ist eine gute Sache, es erlaubt Ideen schnell zu verbreiten. Jedoch müssen die Auswirkungen dieser Ideen verstanden werden, bevor sie als wissenschaftliche Tatsache vorgelegt werden.
Im Idealfall Wissen bewegt sich vorwärts durch wissenschaftliche Konsens, aber in der Praxis ist dieser Konsens selbst schwankte durch äußere Kräfte. Dies wirft Fragen darüber, wer der ultimative Schiedsrichter der akademischen Qualität ist. Eine Antwort ist Meinung: die Meinung derjenigen, die Materie, wie Regierungen, Unternehmen, andere Wissenschaftler oder auch die Presse. Erfolg beim maschinellen Lernen hat dazu geführt, dass es solche Aufmerksamkeit anzieht.
Immer auf mit ihm seit Jahrzehnten
Ironischerweise fand die Entwicklungen, die neue Durchbrüche in AI alle aktiviert außerhalb solcher strenger Kontrolle. Im Jahr 2004 Haushaltsprogramm das kanadische Institut für Advanced Research (CIFAR) eine weitsichtige der Forschung. Eine internationale Zusammenarbeit von Forschern wurde gegeben, die Zeit, geistigen Raum und Geld, das sie brauchten, um diese bedeutende Durchbrüche zu machen. Diese Zusammenarbeit wurde von Geoff Hinton, der gleichen Forscher geführt dessen Team 2012 Durchbruch Ergebnis erreicht.
Dieser Durchbruch führte zu allen wichtigen Internet-Giganten kämpfen für ihre Pfund von akademischen Fleisch. Diese Forscher CIFAR beteiligt, Hinton wurde engagiert von Google, Yann LeCun führt Facebooks AI Research Team, Andrew Ng Heads-up Research bei Baidu und Nando de Freitas wurde vor kurzem eingestellt, um Google DeepMind, die London-Start-up, dass Google auf den Erwerb von £400 m überschüttet.
Die Baidu betrug Fall ist symptomatisch für eine große Veränderung in der Landschaft für diejenigen, die Arbeiten für maschinelles lernen und wer fuhr diese Fortschritte in AI. Bis 2012 wurden Ideen von Forschern im maschinellen Lernen unter dem Radar. Sie angenommen wurden, allgemein im Handel von Firmen wie Microsoft und Google, aber sie nicht viel über das öffentliche Bewusstsein beeinträchtigen. Aber zwei bahnbrechende Ergebnisse brachten diese Ideen in den Vordergrund in das Bewusstsein der Öffentlichkeit. Das Imagenet Ergebnis von Hinton Team gehörte. Der andere war ein Programm, die Atari Videospiele spielen lernen könnte. Es wurde von DeepMind, Auslösung den Kauf von Google erstellt.
Allerdings nur als Deep Blue Niederlage von Kasparov nicht Herold eine Morgendämmerung im Zeitalter der superintelligenten Computer, weder wird entweder von diesen Errungenschaften. Sie sind nicht durch besseres Verständnis der Grundlagen der Intelligenz, sondern durch mehr Daten, mehr Rechenleistung und mehr Erfahrung angekommen.
Wer folgt in deren Gefolge?
Diese scheinbare Durchbrüche haben der Appetit geweckt. Immer die Fachpresse ist anfällig für Tabloid Sensationalismus in diesem Bereich, aber wer kann es ihnen als Unternehmen und Universitäten Ramp-up ihrer Forderungen des wissenschaftlichen Fortschritts verdenken? Die Fortschritte sind etwas wie eine Illusion, sondern den Marsch der Technologen in einem wissenschaftlichen Gefolge nach.
Die Wake-Generatoren sind eine viel schwerer zu Ortrack, auch für ihre Kolleginnen und Wissenschaftler identifizieren. Aber die sehr reale Gefahr ist, dass die Erwartungen der bedeutenden Fortschritt oder das Missverständnis des zugrunde liegenden Phänomens über eine AI-Blase des Typs sahen wir vor 30 Jahren bringen wird. Diese Bläschen sind sehr schädlich. Wenn hohe Erwartungen sind nicht sofort erfüllt dann ganze akademische Domänen entlassen werden können und weitblickende Vorschläge wie die CIFAR gehen Sie nicht finanziert.
Selbst wenn Baidu Ergebnis gültig, wäre es nur die Art der vielfältigen wissenschaftlichen Entwicklung gewesen, die meisten von uns verbringen den Großteil unserer Zeit mit dem Versuch zu kochen. Es keine Ankündigung vor der Veröffentlichung in MIT Technology Review Wert und der Rückzug vor der Veröffentlichung hätte nur eine Fußnote hinzufügen, die vielseitige Kollektion, die alle kluge Wissenschaftler wissenschaftlich vorsichtig halten. Wiederholbarkeit ist eher langweilig, der einzig wahre Marker für wissenschaftlichen Fortschritt. Ob das innerhalb der wissenschaftlichen Gemeinschaft oder durch Übertragung von Ideen in der kommerziellen Welt ist.
Wenn die Berichterstattung über den Skandal MIT Technology Review bezieht sich auf Teilnahme an diesen Wettbewerben als "Sport". Ich fühle mich sportliche Analogien, die eine falsche Vorstellung des Spektakels des wissenschaftlichen Fortschritts zu geben. Es ist eher wie ein Maler bei der Arbeit beobachten. Es ist sehr selten, dass jede einzelne Pinselstrich das gesamte Bild zeigt. Und auch wenn das Bild fertig ist, kann es nur eine begrenzte Menge darüber, was die nächste Verleihung werden geben.
Neil Lawrence ist Professor des Machine Learning und Computational Biology an der University of Sheffield.
Dieser Artikel erschien ursprünglich auf das Gespräch. Lesen Sie den original Artikel. Bild von Shutterstock/Olga Nikonova