Googles Haupt-Keynote zur I/O 2024 war vollgepackt mit einer Menge neuer KI-Funktionen, die dank Gemini auf Desktops und Mobilgeräten verfügbar sein werden. Es wird neue Möglichkeiten geben, Google über Videos und multimodale Eingabeaufforderungen zu durchsuchen, während Smartphones mit Project Astra schließlich KI-Superkräfte durch die Kamera erhalten.
Aber es gibt eine Funktion, die mir wirklich aufgefallen ist: „Fotos mit Gemini in Google Fotos fragen“.
Erstens: Was sind Zwillinge?
Zunächst einmal: Was sind Zwillinge? Es handelt sich im Grunde um Googles KI-Modellfamilie, zu der Gemini Nano, Gemini Pro und Gemini Ultra gehören. Kurz gesagt handelt es sich um Googles Version von OpenAI und seine eigenen GPT-Modelle wie ChatGPT.
Gemini kann Text wie andere große Sprachmodelle (LLMs), wie etwa GPT von OpenAI, verstehen und generieren. Allerdings kann Gemini noch ein bisschen mehr – es versteht, verarbeitet und kombiniert andere Formen von Informationen wie Bilder, Video, Audio und sogar Code.
Für Android-Smartphones wird Gemini Nano verwendet, das lokal auf dem Gerät selbst ausgeführt wird. Dank des Gemini-Nano-Modells werden bestehende Funktionen wie „Circle to Search“ noch besser und bieten die Möglichkeit, Schülern bei Hausaufgaben in Physik und Mathematik zu helfen.
Es erkennt außerdem noch besser, was gerade auf Ihrem Bildschirm angezeigt wird, da Sie Gemini Fragen zu einem Video stellen können, das Sie gerade ansehen, oder zu einer langen PDF-Datei, die Sie gerade durchblättern, anstatt Dutzende von Seiten zu scrollen. Gemini Nano bringt sogar multimodale Funktionen auf Ihr Smartphone, z. B. Suchanfragen mit mehreren Anfragen in einer.
„Ask Photos with Gemini“ ist eine der vielen neuen Gemini-Funktionen, die auf der I/O 2024 angekündigt wurden, und wird später in diesem Jahr in Google Fotos verfügbar sein. Um es kurz zu machen: Sie können Ihre riesige Fotobibliothek mit einem eher gesprächigen Ansatz statt mit Schlüsselwörtern durchsuchen.
In der Google I/O-Demo hat Google gezeigt, dass man einfach fragen kann: „Wie lautet nochmal mein Nummernschild?“ oder „Wann hat meine Tochter schwimmen gelernt?“ um Fotos anzuzeigen, die diese Anfragen beantworten.
Mit Anfragen wie „Zeigen Sie mir, wie weit meine Tochter beim Schwimmen fortgeschritten ist“ geht es sogar noch einen Schritt weiter. Abfragen wie diese veranlassen Gemini, Ihre Fotos noch einmal nach Datum und Kontext zu durchsuchen, um ein passendes Ergebnis zu erhalten.
Als „Ask Photos with Gemini“ auf der Bühne gezeigt wurde, war ich aufgeregt und kann es kaum erwarten, es in die Hände zu bekommen.
Der KI-Begleiter eines Elternteils
Ich bin erst seit etwas mehr als zwei Jahren Mutter. Aber in dieser Zeit habe ich mehr Fotos gemacht als je zuvor, weil ich es liebe, alle kleinen Momente meiner Tochter festzuhalten, sei es nur, dass sie süß und albern ist, oder die wichtigen Meilensteine, die ich in einem Foto oder Video festhalten möchte. Mit einem iPhone 15 Pro mit 1 TB und den unzähligen Android-Handys, die ich teste, mache ich ständig Fotos von meiner Tochter.
Sie denken vielleicht, dass es übertrieben ist – vielleicht ist es das auch. Aber ich habe nicht viele Fotos, geschweige denn Videos meiner Kindheit von meinen Eltern. Sie haben nicht wirklich alle meine besonderen Momente eingefangen und ich habe nur vage Erinnerungen, nichts besonders Detailliertes oder Spezifisches. Mit all der Technologie, die wir jetzt haben, hat es mir geholfen, dafür zu sorgen, dass meine Tochter einen visuellen Beweis ihrer Kindheit erhält.
Obwohl ich Fotos und Videos mache, um sie mit Familienmitgliedern und ausgewählten Freunden zu teilen, halte ich diese Momente hauptsächlich fest, weil ich später auf sie zurückblicken möchte. Ob ich nur einen schnellen Muntermacher suche, um mir ein Lächeln ins Gesicht zu zaubern, oder ob ich eine senile alte Dame bin und einen Spaziergang in die Vergangenheit brauche, ich gehe meine visuellen Erinnerungen ziemlich oft durch.
Bei „Ask Photos with Gemini“ kann ich es kaum erwarten, mir die Fortschritte meiner Tochter bei verschiedenen Lebensereignissen zu zeigen. Zum Beispiel beginnen wir sie im August mit der Vorschule. Ich würde Zwillinge gerne bitten, mir ihre Fortschritte in der Schule zu zeigen oder mir einfach alle ihre „ersten Tage“ für jedes Schuljahr zu zeigen. Oder wenn sie Fahrradfahren lernt, kann ich sehen, wie sie von Stützrädern auf ein vollwertiges Fahrrad umsteigt. Verdammt, Zwillinge könnten es mir sogar zeigen, wenn meine Tochter jedes Jahr die Kerzen auf ihrer Geburtstagstorte ausbläst.
Es gibt für mich so viele Möglichkeiten, Ask Photos zu nutzen, aber das sind nur ein paar Ideen, die mir in den Sinn kommen. Und während es für Eltern großartig ist, um die Meilensteine ihrer Kinder zu feiern, eignet es sich auch hervorragend für andere Dinge. Ich kann mir vorstellen, es für meine Jubiläen, Feiertage und sogar für meine Haustiere zu verwenden.
Klar, ich könnte jetzt alle meine Fotos durchgehen und nach Gesichtern und Schlüsselwörtern suchen. Aber Ask Photos with Gemini scheint eine viel einfachere, schnellere und natürlichere Möglichkeit zu sein, dies zu tun. Und wenn Sie über eine Fotobibliothek mit über 50.000 Fotos und Videos verfügen, könnte ich eine einfachere Möglichkeit zum Durchsuchen gebrauchen.
Ich kann es kaum erwarten, es zu verwenden
„Ask Photos“ ist nicht die einzige Gemini-KI-Funktion, die Google auf der Google I/O 2024 vorgestellt hat. Und obwohl ich aufgrund ihrer Praktikabilität am meisten davon begeistert bin, gibt es noch andere aufregende Dinge, die ich mir ansehen möchte.
Projekt Astra schien zum Beispiel faszinierend. Ich benutze mein Handy oft, um ein Foto von etwas aufzunehmen, das ich für später speichern und mehr darüber erfahren möchte, zum Beispiel Pflanzen und Blumen. Aber mit Astra haben Sie diese KI-Qualität direkt in der Kamera und sie kann Ihnen in Echtzeit sagen, was Sie gerade sehen. Und obwohl Google keine Smart-Brillen angekündigt hat, zeigte Project Astra, dass dies irgendwann eine unglaubliche Funktion in Smart-Brillen sein würde.
Ich bin auch sehr gespannt darauf, mir die multimodalen Eingabeaufforderungsanfragen in der Google-Suche mit Gemini anzuschauen. Ich bin nicht der Typ Mensch, der gerne etwas plant. Wenn Google mir also die Laufarbeit abnehmen kann, dann bin ich voll und ganz dafür. Und obwohl ich nicht glaube, dass die Betrugswarnungen in Echtzeit für mich besonders nützlich sein werden (ich gehe sowieso nie ans Telefon), wird sie für andere eine sehr nützliche Funktion sein.
„Ask Photos with Gemini“ soll später in diesem Sommer in Google Fotos verfügbar sein, und ich kann es kaum erwarten, es auszuprobieren.
Empfehlungen der Redaktion