Oliver Cragg / Android Authority
Kurz zusammengefasst
Apple hat die Modelle vorgestellt, die die Grundlage für die kommenden KI-Funktionen auf iPhone, iPad und Mac bilden werden. Die Basismodelle gibt es je nach Anwendungsfall als On-Device- und Server-Varianten. Apples Modelle können mit GPT-3.5 mithalten, sind aber nicht die besten der Branche.
Apple hat gestern auf der WWDC 2024 eine ganze Reihe von KI-Funktionen für iPhone, iPad, Mac und Siri angekündigt, aber überraschenderweise keine näheren Angaben zu den generativen KI-Modellen gemacht, die diese Funktionen unterstützen sollen. Gerüchten zufolge würde das Unternehmen auf ChatGPT von OpenAI oder Gemini von Google setzen, aber diese Gerüchte erwiesen sich als halbwahr. So soll es zwar tatsächlich noch in diesem Jahr eine ChatGPT-Integration für iOS, iPadOS und macOS geben, aber sie wird weder die überarbeitete Siri noch andere Apple Intelligence-Funktionen unterstützen.
Aber dank eines neuen Beitrags auf Apples Forschungsblog zum maschinellen Lernen wissen wir jetzt mehr über die KI-Strategie des Unternehmens für 2024 und darüber hinaus. Zunächst einmal wird sich das Unternehmen auf seine eigenen großen Sprachmodelle (LLMs) verlassen, anstatt Angebote von Drittanbietern wie Google und OpenAI zu lizenzieren.
Apple sagt, dass seine Basismodelle „auf Benutzererfahrungen wie das Schreiben und Verfeinern von Texten, das Priorisieren und Zusammenfassen von Benachrichtigungen, das Erstellen spielerischer Bilder für Unterhaltungen mit Familie und Freunden und das Ausführen von In-App-Aktionen zur Vereinfachung der Interaktion zwischen Apps abgestimmt“ seien. Der Blogbeitrag befasst sich dann mit einigen technischen Aspekten hinter seinen generativen KI-Modellen, wobei der Schwerpunkt auf der Optimierung für geringe Latenz und Leistung auf dem Gerät liegt.
Apple liegt im KI-Rennen noch zurück, holt aber deutlich auf.
Bemerkenswerter ist jedoch, dass wir hier zum ersten Mal einen Einblick in die Leistungsfähigkeit der KI-Modelle von Apple erhalten und sehen, wie sie im Vergleich zur Konkurrenz abschneiden.
In einem Diagramm können wir beispielsweise sehen, dass menschliche Prüfer in etwa 50 % der Fälle Antworten aus Apples Cloud-Modell bevorzugten, verglichen mit GPT-3.5, dem Basismodell, das mit der kostenlosen Version von ChatGPT angeboten wird. Die beiden Modelle lagen in 25,3 % der Fälle gleichauf, was bedeutet, dass GPT-3.5 nur in 24,7 % der Testfälle eindeutig die Nase vorn hatte.
Allerdings schrumpfte Apples Vorsprung auf nur noch 28,5 %, als das Cloud-Modell mit GPT-4 Turbo verglichen wurde. In weiteren 29,8 % der Fälle war jedoch Gleichstand zu verzeichnen.
Auch das On-Device-Modell von Apple zeigt eine bewundernswerte Leistung und schlägt bei den meisten getesteten Antworten entweder Mistral-7B und Gemma-2B oder kann mit ihnen mithalten.
Das On-Device-Modell von Apple hat eine Größe von etwa drei Milliarden Parametern. Mithilfe typischer Modelloptimierungstechniken wie der Quantisierung ist es kompakt genug, um auf Geräten wie dem iPhone 15 Pro und 15 Pro Max mit nur 8 GB RAM ausgeführt zu werden.
Das Cloud-basierte Modell hingegen ist größer und leistungsfähiger. Obwohl Apple die Größe des Cloud-Modells nicht explizit angegeben hat, ist es so konzipiert, dass es vollständig auf Apple Silicon-betriebenen Rechenzentren läuft. Letzteres ist ein wichtiger Datenschutzgewinn für Apple-Anhänger, da das Unternehmen garantieren kann, dass ihre sensiblen Daten niemals an ein Drittunternehmen wie OpenAI weitergegeben werden.
Zum Thema Sicherheit behauptet Apple, dass seine Basismodelle ebenfalls wesentlich sicherer seien als die der Konkurrenz. Das Cloud-basierte Modell des Unternehmens lieferte in nur 6,6 % der Fälle „verletzende Antworten wegen schädlicher Inhalte, sensibler Themen und Sachlichkeit“ – weit weniger als die 15,5 % von GPT-3.5 Turbo und die 20,1 % von GPT-4 Turbo.
Dieser Benchmark könnte ein Hinweis darauf sein, warum das Unternehmen einen hybriden Ansatz für Siri gewählt hat, der bestimmte Anfragen selektiv an ChatGPT auslagert. Anstatt auf sachliche oder potenziell aufrührerische Fragen zu antworten, die die Marke des Unternehmens beschädigen könnten, kann Apple einfach Ergebnisse aus Drittquellen zusammen mit einem Haftungsausschluss anbieten.
Interessanterweise behauptet Apple, dass beide seiner Basismodelle die besten heute verfügbaren KI-Modelle in der Zusammenfassung übertreffen. Und in der Komposition erringt GPT-4 Turbo nur einen knappen Sieg.
Diese Ergebnisse klingen zwar beeindruckend, aber es ist zu beachten, dass es sich zum jetzigen Zeitpunkt nur um Behauptungen handelt. Unabhängige Tests könnten zu einem anderen Ergebnis kommen, das den Giganten aus Cupertino nicht begünstigt. Es hilft auch nicht, dass die KI-Branche schnell Innovationen hervorbringt und Apples KI-Funktionen erst in einigen Monaten veröffentlicht werden. OpenAI ist beispielsweise bereits auf GPT-4o umgestiegen und könnte kurz davor stehen, GPT-5 zu veröffentlichen, wenn iOS 18 die meisten iPhone-Benutzer erreicht. Nur die Zeit wird zeigen, ob Apples Vorsprung bis Ende dieses Jahres anhält.
Kommentare