Von MIKE MAGEE
Als OpenAI beschloss, auf die lautstarken Forderungen der Kunden nach sprachgestützter Interaktion über Chat GPT zu reagieren, ging CEO Sam Altman aufs Ganze. Denn er wusste, dass es dabei um mehr als nur Wettbewerbsvorteile oder Bequemlichkeit ging. Es ging um Beziehungen – tiefe, stabile, loyale und verbindliche Beziehungen.
Ihm war wahrscheinlich auch bewusst, dass der Anteil der psychischen Gesundheit in der telemedizinisch vermittelten Versorgung von 1 % im Jahr 2019 auf 33 % im Jahr 2022 gestiegen war. Und dass die Pandemie eine Explosion virtueller psychiatrischer Dienste ausgelöst hatte. In einem einzigen Jahr, zwischen 2020 und 2021, stieg die Zahl der Psychologen, die sowohl persönliche als auch virtuelle Sitzungen anbieten, von 30 % auf 50 %. Warum? Die American Psychological Association legt nahe, dass diese mündliche Kommunikation persönlich, vertraulich, effizient und effektiv ist. Oder mit einem Wort – nützlich.
Wie Forbes 2021 berichtete, „begannen prominente Unterstützungsmaßnahmen wie die Kampagne des Olympia-Schwimmers Michael Phelps mit dem virtuellen Therapie-Startup Talkspace, das langjährige Stigma abzubauen, während Achtsamkeits-Apps wie Calm Meditationssitzungen auf Knopfdruck anboten. Aber es waren die Covid-19-Pandemie und die kollektiven psychologischen Folgen, die die psychische Gesundheit schließlich in den Mainstream brachten.“ Als Beweis führten sie an, dass sich die Finanzierung von Start-ups im Bereich der psychischen Gesundheit in den letzten vier Jahren mehr als verfünffacht hat.
Altman verfolgte auch die Geschichte. Das erste „Massenmedium“ in den USA war das sprachgesteuerte Radio. Er verstand auch dessen Wachstumskurve vor einem Jahrhundert. Von einer Präsenz in 1 % der Haushalte im Jahr 1923 war es nur 14 Jahre später in 3/4 aller US-Haushalte zu finden.
Altman sah auch die Zeichen an der Wand. Die heranwachsenden Generationen, die Biden sanft ermutigten, die Bühne zu verlassen, waren sowohl einsam als auch verbunden.
Aus der jüngsten Nielson- und Edison-Studie geht hervor, dass der durchschnittliche Erwachsene in den USA mittlerweile vier Stunden pro Tag mit dem Konsum von Audioinhalten und der dazugehörigen Werbung verbringt. 67 % dieser Zeit entfallen auf Radio, 20 % auf Podcasts, 10 % auf Musik-Streaming und 3 % auf Satellitenradio.
Nach der Pandemie ist die Nutzung von Online-Audio durch die jüngeren Generationen sprunghaft angestiegen. Im Jahr 2005 hörten nur 15 % der jungen Erwachsenen online. Im Jahr 2023 waren es bereits 75 %. Und da ihr Hörverhalten zugenommen hat, ist die Einsamkeitsrate bei jungen Erwachsenen von 38 % im Jahr 2020 auf heute 24 % gesunken.
Ein Jahrzehnt zuvor wagte sich Drehbuchautor Spike Jonze mit „Her“ auf dieses Terrain. Der Film war brillant besetzt und zeigte Joaquin Phoenix als einsamen, introvertierten Theodore Twombly, der unter einer bevorstehenden Scheidung leidet. In seiner Verzweiflung entwickelte er mehr als nur eine Beziehung (eigentlich eine Freundschaft) mit einer einfühlsamen, beruhigenden weiblichen KI, deren Stimme von der Schauspielerin Scarlett Johansson übernommen wurde.
Scarletts Leistung war so überzeugend, dass sie damit in den Wettbewerb um das mit fünf Oscars ausgezeichnete beste Originaldrehbuch katapultiert wurde. Sie beeindruckte offenbar auch Sam Altman, der Scarlett ein Jahrzehnt später bat, die „Stimme“ der virtuellen Hauptrolle von ChatGPT zu sein. Sie lehnte ab, da sie die potenziellen Nachteile erkannte, die es mit sich brachte, ein virtuelles Wesen zu werden. Anschließend suchte er einen „Scarlett-ähnlichen“ Synchronsprecher und wählte „Sky“ als eine von fünf Stimmen aus, die ChatGPT verkörpern sollten. Unter der Androhung einer massiven Klage wegen geistigen Eigentums hat Altman Sky kürzlich „getötet“, aber die anderen vier virtuellen Begleiter (von 400, die vorgesprochen haben) haben überlebt.
Was den Inhalt angeht, sodass „was Sie sagen“ ebenso gut repräsentiert wird wie „wie Sie es sagen“, haben Unternehmen wie Google das im Griff. Ihr LLM-Produkt (Large Language Model) wurde mit Inhalten von über 10 Millionen Websites trainiert, darunter HealthCommentary.org. Google-Ingenieur Blaise Aguera y Arcas sagt: „Künstliche neuronale Netzwerke machen Fortschritte in Richtung Bewusstsein.“
Wo all dies für die Menschheit endet, bleibt eine offene Frage. Bekannt ist, dass das Gegenmittel gegen Einsamkeit und Isolation Beziehungen sind. Aber welche Art von Beziehungen? Wer weiß das schon? Der Evolutionspsychologe Robin Dunbar aus Oxford glaubt, dass er es weiß.
Altman hat dieser Rezension der Atlantic-Autorin Sheon Han aus dem Jahr 2021 wahrscheinlich große Aufmerksamkeit geschenkt: „Robin Dunbar ist vor allem für seine gleichnamige ‚Dunbar-Zahl‘ bekannt, die er als die Anzahl stabiler Beziehungen definiert, die Menschen kognitiv gleichzeitig aufrechterhalten können. (Die vorgeschlagene Zahl ist 150.) Aber nachdem er seine jahrzehntelange Karriere damit verbracht hat, die Komplexität von Freundschaften zu studieren, hat er viele weitere Zahlen entdeckt, die unsere engen Beziehungen prägen. So stellt sich beispielsweise heraus, dass Dunbars Zahl weniger eine absolute numerische Schwelle ist, sondern vielmehr eine Reihe konzentrischer Kreise, von denen jeder für qualitativ unterschiedliche Arten von Beziehungen steht. … Alle diese Zahlen (und viele nicht-numerische Erkenntnisse über Freundschaft) erscheinen in seinem neuen Buch „Friends: Understanding the Power of Our Most Important Relationships“.
Doch viele Experten sind sich inzwischen einig, dass die Stimme der Schlüssel zu sein scheint. Kurzform für Altman: Wählen Sie die richtige Stimme und Sie könnten für jeden ChatGPT-„Käufer“ 149 neue „Freunde“ gewinnen.
Mike Magee MD ist Medizinhistoriker und regelmäßiger Mitarbeiter von THCB. Er ist der Autor von CODE BLUE: Inside America’s Medical Industrial Complex. (Grove/2020)