Dienstag, Dezember 9, 2025
Der Informant
  • Global
  • Politik
  • Verteidigung
  • Unternehmen
  • Gesundheit
  • Sport
  • Tech
  • Unterhaltung
  • Lebensstil
No Result
View All Result
DerInformant.com
  • Global
  • Politik
  • Verteidigung
  • Unternehmen
  • Gesundheit
  • Sport
  • Tech
  • Unterhaltung
  • Lebensstil
No Result
View All Result
DerInformant.com
No Result
View All Result
Home Technologie

Anthropischer CEO möchte bis 2027 die Black Box of AI -Modelle öffnen

DerInformant by DerInformant
April 25, 2025
in Technologie
Reading Time: 3 mins read
0 0
A A
0
Anthropischer CEO möchte bis 2027 die Black Box of AI -Modelle öffnen
Share on FacebookShare on Twitter

Write a journalistic article in German fully based on

Der anthropische CEO Dario Amodei veröffentlichte am Donnerstag einen Aufsatz, in dem hervorgehoben wurde, wie wenig Forscher über die inneren Funktionsweise der weltweit führenden KI -Modelle verstanden haben. Um das zu beheben, legte Amodei ein ehrgeiziges Ziel für Anthropic fest, um die meisten KI -Modellprobleme bis 2027 zuverlässig zu erkennen.

Amodei erkennt die bevorstehende Herausforderung an. In „Die Dringlichkeit der Interpretierbarkeit“ hat der CEO sagt, dass Anthropic frühe Durchbrüche erzielt hat, um festzustellen, wie Modelle zu ihren Antworten gelangen – jedoch betont, dass weit mehr Forschung erforderlich ist, um diese Systeme zu dekodieren, wenn sie stärker werden.

„Ich bin sehr besorgt über die Bereitstellung solcher Systeme, ohne die Interpretierbarkeit besser im Griff zu haben“, schrieb Amodei im Aufsatz. „Diese Systeme werden absolut von zentraler Bedeutung für die Wirtschaft, die Technologie und die nationale Sicherheit sein und so viel Autonomie in der Lage sein, dass ich es für die Menschheit im Grunde genommen inakzeptabel halte, die Funktionsweise ihrer Arbeit völlig zu wissen.“

Anthropic ist eines der Pionierunternehmen in mechanistischer Interpretierbarkeit, ein Feld, das die schwarze Box von KI -Modellen öffnen und verstehen soll, warum sie die Entscheidungen treffen, die sie treffen. Trotz der schnellen Leistungsverbesserungen der KI -Modelle der Tech -Industrie haben wir immer noch relativ wenig Vorstellung davon, wie diese Systeme zu Entscheidungen kommen.

Zum Beispiel hat OpenAI kürzlich neue Argumentations-KI-Modelle O3 und O4-Mini auf den Markt gebracht, die bei einigen Aufgaben besser abschneiden, aber auch mehr als seine anderen Modelle halluzinieren. Das Unternehmen weiß nicht, warum es passiert.

„Wenn ein generatives KI -System etwas tut, z. B. ein finanzielles Dokument zusammenfassen, haben wir keine Ahnung, auf einer bestimmten oder präzisen Ebene, warum es die Entscheidungen trifft – warum es bestimmte Wörter gegenüber anderen auswählt oder warum es gelegentlich einen Fehler macht, obwohl es normalerweise genau ist“, schrieb Amodei im Aufsatz.

Der anthropische Mitbegründer Chris Olah sagt, dass KI-Modelle „mehr als sie gebaut werden“, bemerkt Amodei im Aufsatz. Mit anderen Worten, KI -Forscher haben Wege gefunden, die KI -Modellinformationen zu verbessern, aber sie wissen nicht genau warum.

Im Aufsatz sagt Amodei, es könnte gefährlich sein, Agi zu erreichen – oder wie er es nennt, „ein Land mit Genies in einem Rechenzentrum“, ohne zu verstehen, wie diese Modelle funktionieren. In einem früheren Aufsatz behauptete Amodei, die Tech -Industrie könne bis 2026 oder 2027 einen solchen Meilenstein erreichen, glaubt jedoch, dass wir diese KI -Modelle nicht vollständig verstehen.

Langfristig sagt Amodei, Anthropic möchte im Wesentlichen „Gehirnscans“ oder „MRTs“ hochmoderner KI-Modelle durchführen. Diese Untersuchungen würden dazu beitragen, eine Vielzahl von Problemen in KI -Modellen zu ermitteln, einschließlich ihrer Tendenzen, zu lügen, Macht oder andere Schwächen zu suchen, sagt er. Dies könnte fünf bis zehn Jahre dauern, bis diese Maßnahmen erforderlich sind, um die zukünftigen KI -Modelle von Anthropic zu testen und einzusetzen, fügte er hinzu.

Anthropic hat einige Forschungsdurchbrüche gemacht, die es ihm ermöglicht haben, besser zu verstehen, wie seine KI -Modelle funktionieren. Zum Beispiel hat das Unternehmen kürzlich Wege gefunden, die Denkwege eines KI -Modells zu verfolgen, was das Unternehmen nennt, Schaltungen. Anthropisch identifizierte einen Schaltkreis, der KI -Modellen hilft, zu verstehen, welche US -Städte sich befinden, in denen US -amerikanische Staaten stellt. Das Unternehmen hat nur einige dieser Schaltkreise gefunden, aber Schätzungen gibt es Millionen innerhalb von AI -Modellen.

Anthropic hat selbst in die Interpretierbarkeitsforschung investiert und kürzlich seine ersten Investitionen in ein Startup getätigt, das auf Interpretierbarkeit arbeitet. Im Aufsatz forderte Amodei Openai und Google DeepMind auf, ihre Forschungsbemühungen auf diesem Gebiet zu erhöhen.

Amodei fordert die Regierungen auf, Vorschriften für „leichte“ Vorschriften aufzuerlegen, um die Interpretierbarkeitsforschung zu fördern, z. B. Anforderungen an Unternehmen, ihre Sicherheitspraktiken offenzulegen. In dem Aufsatz sagt Amodei auch, dass die USA Exportkontrollen auf Chips nach China setzen sollten, um die Wahrscheinlichkeit eines außer Kontrolle geratenen, globalen KI-Rennens zu begrenzen.

Anthropic hat sich immer von OpenAI und Google für die Sicherheit auf den Schwerpunkt auf der Sicherheit hervorgehoben. Während andere Technologieunternehmen die kontroverse KI -Sicherheitsrechnung in Kalifornien, SB 1047, zurückzusetzen, gab Anthropic bescheidene Unterstützung und Empfehlungen für die Gesetzesvorlage, die Sicherheitsberichterstattungsstandards für Frontier -KI -Modellentwickler festgelegt hätte.

In diesem Fall scheint Anthropic auf eine branchenweite Anstrengung zu drängen, um AI-Modelle besser zu verstehen und nicht nur ihre Fähigkeiten zu erhöhen.

Source link

Tags: AnthropischKI Sicherheit
ShareTweetSendShare
Previous Post

China Forces Weibo richten die schwulen Gemeinschaft aus, ‚Genosse‘ aus dem Namen zu fallen

Next Post

Musks Tesla bekommt einen Auftrieb, während die USA Bürokratie auf selbstfahrende Autosregeln schneiden, um China entgegenzuwirken

Related Posts

Urlaubsersparnis: Anker SOLIX C300 sinkt auf 199,99 $
Technologie

Urlaubsersparnis: Anker SOLIX C300 sinkt auf 199,99 $

November 21, 2025
Die besten Angebote für Black Friday-Chromebooks: Was Sie erwartet und frühe Verkäufe
Technologie

Die besten Angebote für Black Friday-Chromebooks: Was Sie erwartet und frühe Verkäufe

November 21, 2025
Die besten Funktionen der AirPods sind mit der kostenlosen App für Android und Linux verfügbar
Technologie

Die besten Funktionen der AirPods sind mit der kostenlosen App für Android und Linux verfügbar

November 20, 2025
Monarch Tractor bereitet sich auf Entlassungen vor und warnt seine Mitarbeiter, dass es zu einer Schließung kommen könnte
Technologie

Monarch Tractor bereitet sich auf Entlassungen vor und warnt seine Mitarbeiter, dass es zu einer Schließung kommen könnte

November 20, 2025
Was ist der Veröffentlichungstermin für Folge 4 der 28. Staffel von South Park auf Paramount+?
Technologie

Was ist der Veröffentlichungstermin für Folge 4 der 28. Staffel von South Park auf Paramount+?

November 19, 2025
Die Black Friday-Monitor-Angebote von Samsung kommen früh an: Sparen Sie jetzt bis zu 500 US-Dollar!
Technologie

Die Black Friday-Monitor-Angebote von Samsung kommen früh an: Sparen Sie jetzt bis zu 500 US-Dollar!

November 19, 2025
Next Post
Musks Tesla bekommt einen Auftrieb, während die USA Bürokratie auf selbstfahrende Autosregeln schneiden, um China entgegenzuwirken

Musks Tesla bekommt einen Auftrieb, während die USA Bürokratie auf selbstfahrende Autosregeln schneiden, um China entgegenzuwirken

Die Reaktion von AT & T auf eine wachsende Bedrohung betrifft die Kunden Ärger für die Kunden

Die Reaktion von AT & T auf eine wachsende Bedrohung betrifft die Kunden Ärger für die Kunden

„Der jüdische Geist“: Holocaust -Überlebende, befreite israelische Geiseln, versammeln sich in Auschwitz für „Marsch der Lebenden“

"Der jüdische Geist": Holocaust -Überlebende, befreite israelische Geiseln, versammeln sich in Auschwitz für "Marsch der Lebenden"

CATEGORIES

  • business
  • Gesundheit
  • health
  • Lebensstil
  • lifestyle
  • Meinung
  • Politik
  • Sport
  • Technologie
  • Uncategorized
  • Unterhaltung
  • Unternehmen
  • Verteidigung
  • Weltweit
No Result
View All Result

LATEST UPDATES

  • Die Zahl der zivilen Todesfälle in der Ukraine übersteigt die Zahl des letzten Jahres, da der Winter die Krise verschärft, warnt der Sicherheitsrat
  • Bitcoin fällt unter 81.000 US-Dollar und erreicht den niedrigsten Stand seit 2022
  • „Warum nicht mit dem Zug fahren? Ist das erste Klasse?‘: Laura Loomer verspottet den Sozialisten Mamdani, weil er ein Flugzeug genommen hat
  • Warum es an der Zeit ist, die HCC-Codierung intern einzuführen
  • Haftungsausschluss
  • Kontakt
  • Cookie-Richtlinie
  • Datenschutzerklärung
  • Geschäftsbedingungen

Copyright © 2024 DerInformant.
DerInformant.com is not responsible for the content of external sites. DerInformant.com is a proud member of BXL MEDIA

No Result
View All Result
  • Global
  • Politik
  • Verteidigung
  • Unternehmen
  • Gesundheit
  • Sport
  • Tech
  • Unterhaltung
  • Lebensstil

Copyright © 2024 DerInformant.
DerInformant.com is not responsible for the content of external sites. DerInformant.com is a proud member of BXL MEDIA

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Verwalte deine Privatsphäre

To provide the best experiences, we and our partners use technologies like cookies to store and/or access device information. Consenting to these technologies will allow us and our partners to process personal data such as browsing behavior or unique IDs on this site and show (non-) personalized ads. Not consenting or withdrawing consent, may adversely affect certain features and functions.

Click below to consent to the above or make granular choices. Your choices will be applied to this site only. You can change your settings at any time, including withdrawing your consent, by using the toggles on the Cookie Policy, or by clicking on the manage consent button at the bottom of the screen.

Functional Always active
The technical storage or access is strictly necessary for the legitimate purpose of enabling the use of a specific service explicitly requested by the subscriber or user, or for the sole purpose of carrying out the transmission of a communication over an electronic communications network.
Preferences
The technical storage or access is necessary for the legitimate purpose of storing preferences that are not requested by the subscriber or user.
Statistics
The technical storage or access that is used exclusively for statistical purposes. The technical storage or access that is used exclusively for anonymous statistical purposes. Without a subpoena, voluntary compliance on the part of your Internet Service Provider, or additional records from a third party, information stored or retrieved for this purpose alone cannot usually be used to identify you.
Marketing
The technical storage or access is required to create user profiles to send advertising, or to track the user on a website or across several websites for similar marketing purposes.
Statistics

Marketing

Features
Always active

Always active
Manage options Manage services Manage {vendor_count} vendors Read more about these purposes
Optionen verwalten
{title} {title} {title}