Chinas Deepseek ist Amerikas Ai Sputnik -Moment

In technischen Kreisen gibt es ein häufig Für künstliche Intelligenz (KI), bei denen die hochmodernsten Frontier-Modelle und Forschung von US-Startups wie OpenAI erstellt wurden, von denen angenommen wurde, dass sie zwei bis drei Jahre vor ihren chinesischen Kollegen waren. Die schnelle Veröffentlichung von zwei neuen Modellen des chinesischen Unternehmens Deepseek-der V3 im Dezember und R1 in diesem Monat-stellt diese tief verwurzelte Annahme auf und löst einen historischen Rout in US-amerikanischen Tech-Aktien aus.

Deepseeks R1 -Argumentationsmodell übereinstimmt (und manchmal schlägt) O1 von O1 in einer Reihe von Mathematik-, Code- und Argumentationsaufgaben – und zu 2 Prozent des Preises des letzteren. Ein chinesisches KI -Modell ist jetzt so gut wie die führenden US -KI -Modelle und verwendet nur einen winzigen Bruchteil der verfügbaren GPU -Ressourcen.

Dies ist bemerkenswert und ein Gamechanger für das globale KI -Wettrüsten. Zum einen bedeutet dies, dass das Spiel nicht mehr für tief in die Focketierung mit Chip-Stockpiles (wie die USA und China) vorgesehene Spieler vorbehalten ist. Dies war auch ein wichtiger amerikanischer Vorteil, der einst als kritischer Wassergraben bei der Aufrechterhaltung der Fähigkeitslücke zwischen den USA und chinesischen Modellen angesehen wurde. Deepseek zeigte, dass algorithmische Innovationen die Skalierungsgesetze überwinden können. Angesichts von begrenzten Chips aufgrund von US-Exportkontrollen verwendete das chinesische Unternehmen innovative Software-Optimierungstechniken, von der Sparse-Experten-Architekturen bis hin zur Quantisierung, die es ihnen ermöglichten, beispiellose Kosteneffizienz zu erreichen und konkurrierende Modelle zu übertreffen.

Als Deepseek -Gründer Liang Wenfeng, der durch Training ein KI -Forscher ist, sagte in einem Interview Im vergangenen Jahr sind „angesichts disruptiver Technologien den von Closed Source erstellten Erdgraben vorübergehend. Sogar Openais geschlossener Quellansatz kann andere nicht daran hindern, aufzuholen. “

Deepseeks Fähigkeit, in wenigen Monaten Frontier -Modelle nachzuholen, zeigt, dass kein Labor, keine geschlossene oder Open Source einen echten, dauerhaften technologischen Vorteil beibehalten können. Wir haben eine Ära des KI Mittelmächte wird in den Kampf eintreten, wobei die Trainingsstrategien verwendet werden geteilt von Deepseek.

Zweitens wird China zum weltweiten Führer in Open Source KI. Deepseek ist nur eines von vielen chinesischen KI-Unternehmen, die alle ihre Modelle vollständig öffnen und es Entwicklern weltweit ermöglichen, ihre Modellgewichte und -methoden zu verwenden, zu reproduzieren und zu ändern. Chinas großer Tech -Riese Alibaba hat Qwen, sein Flaggschiff AI Foundation Model, Open Source, gemacht. So haben neuere KI -Startups wie Minimax, die im Januar auch eine Reihe von Open -Source -Modellen (sowohl grundlegende als auch multimodale, dh in der Lage ist, mehrere Arten von Medien zu bewältigen).

Wettbewerbsfähige Benchmark -Tests haben gezeigt, dass die Leistung dieser chinesischen Open -Source -Modelle mit den am besten geschlossenen Quell -Western -Modellen entspricht. Auf Umarmung, einer amerikanischen Plattform, auf der ein Repository von Open -Source -Tools und -Daten stattfindet, gehören chinesische LLMs regelmäßig zu den am meisten heruntergeladenen. Dies bringt nicht nur mehr globale Entwickler in ihr Ökosystem, sondern führt auch zu mehr Innovation.

Stellen Sie sich ein LLM als Betriebssystem vor – ähnlich wie das iOS von Apple und Googles Android -, bei dem Benutzer neue Anwendungen entwickeln können. Wenn Sie die besten Modelle der Vereinigten Staaten geschlossen halten, ist China besser bereit, seinen technologischen Einfluss in Ländern zu erweitern, die um den Zugang zu den hochmodernen Angeboten wetteifern, zu geringen Kosten. Diese chinesischen KI -Unternehmen demokratisieren auch ironischerweise den Zugang zu KI und halten die ursprüngliche Mission von Openai am Leben: die KI zum Nutzen der Menschheit voranzutreiben. Länder außerhalb der KI-Supermächte oder gut etablierten Tech-Hubs haben jetzt einen Versuch, eine Innovationswelle mit erschwinglichen Trainingsmethoden freizuschalten.

Drei US -Exportkontrollen haben keinen Würgegriff mehr über den KI -Fortschritt. Chinesische Unternehmen wie Deepseek haben gezeigt, die Fähigkeit zu erzielen, erhebliche KI-Fortschritte zu erzielen, indem sie ihre Modelle zu exportkonformen NVIDIA H800-einer herabgestuften Version der fortgeschritteneren KI-Chips von den meisten US-Unternehmen verwendet haben-und durch die Nutzung komplexer Softwaretechniken. Ein Großteil der „Chokepoint“ -Taktiken der Vereinigten Staaten hat sich bisher auf Hardware konzentriert, aber die sich schnell entwickelnde Landschaft algorithmischer Innovationen bedeutet, dass Washington möglicherweise alternative Routen der technologischen Kontrolle untersuchen muss. Wie viele betont haben, ist die Notwendigkeit wirklich die Mutter der Erfindung. Deepseek und andere waren nicht in der Lage, sich auf die neuesten Chips zu verlassen, und waren gezwungen, mehr mit weniger und Einfallsreichtum anstelle von brutaler Gewalt zu tun.

Dieser Meilenstein gibt es nicht zu unterschätzen. Während viele China aufgrund der Flut der lähmenden US -Exportkontrollen zuvor auf dem KI -Rennen gezählt hatten, zeigt Deepseek, dass China zurück ist und möglicherweise an der Spitze steht. Wenn westliche Bemühungen, Chinas KI -Fortschritt zu behindern oder zu behindern, wahrscheinlich zwecklos sein wird, hat das eigentliche Rennen gerade erst begonnen: Lean, Creative Engineering wird das Spiel gewinnt; Nicht bloße finanzielle Heft- und Exportkontrollen.

Source link