Nach der Amtseinführung des taiwanesischen Präsidenten Lai Ching-te am 20. Mai tauchte die Behauptung auf, Lai habe sich in einer durchgesickerten Audioaufnahme über seine Vorgängerin Tsai Ing-wen beschwert.
Experten zufolge ist der Ton jedoch wahrscheinlich KI-generiert. Mithilfe eines KI-Analysetools fand AFCL auch Anzeichen digital manipulierter Audiodaten.
Ein Video mit angeblich durchgesickertem Audio wurde geteilt auf X, früher bekannt als Twitter, von einem Benutzer namens „Guyan Muchan“. AFCL hat die von diesem Benutzer geteilten Behauptungen bereits mehrfach widerlegt.
Das eine Minute und 33 Sekunden lange Video besteht aus zwei Teilen.
Im ersten Teil ist eine männliche Stimme mit taiwanesischem Akzent zu hören, die einen „lang anhaltenden Bruch“ zwischen Lai und Tsai beschreibt, die beide hochrangige Mitglieder von Taiwans Demokratischer Fortschrittspartei (DPP) sind. Sie sagt, dass es zwischen den beiden Persönlichkeiten aufgrund ihrer Differenzen einmal fast zu Handgreiflichkeiten gekommen wäre.
Nach 45 Sekunden ist Lais angebliche Stimme zu hören, die sich über Tsai wegen ihrer angeblichen Meinungsverschiedenheiten beschwert.
Es liegen jedoch nicht genügend Beweise dafür vor, dass es sich bei der Audioaufnahme um eine Originalaufnahme von Lai handelt.
KI generiert
AFCL nutzte das Open-Source-KI-Erkennungstool Bienenstock eine angebliche 45-sekündige Aufnahme von Lai zu analysieren und in vier Teile zu unterteilen.
Bei drei Teilen wurde eine Wahrscheinlichkeit von über 90 % festgestellt, dass sie von KI erstellt wurden. Der Audioausschnitt von 11 bis 20 Sekunden wurde mit einer Wahrscheinlichkeit von 55,9 % als von KI erstellt eingeschätzt.
Expertenanalyse
Chih-Chung Hsuein außerordentlicher Professor für Statistik an der taiwanesischen National Cheng Kung University mit Spezialgebiet Deep Learning und Bildverarbeitung, analysierte die angeblich durchgesickerten Audiodateien von Lai mithilfe eines eigenen audiovisuellen Erkennungssystems.
Dieses System misst die Ähnlichkeit der KI auf einer Skala von 0 bis 1. Hsu fand heraus, dass die Stimme in der Audioaufnahme einen Wert von 0,674 hatte, was auf eine relativ geringe Ähnlichkeit mit Lais Stimme hindeutet.
Hsu fügte hinzu, dass qualitativ hochwertige, KI-generierte Audiodaten und echte Stimmen normalerweise eine Punktzahl von 0,85 oder höher erreichen, warnte jedoch auch, dass die niedrige Punktzahl auf die schlechte Qualität der hochgeladenen Audiodatei zurückzuführen sein könnte.
Paul Liu, ein taiwanesischer Experte für Informationssicherheit, wies darauf hin, dass die Audiodatei Clippings enthalte, die bei einer geheimen Aufnahme nicht vorkommen dürften.
Die übermäßige Verzerrung ließ darauf schließen, dass sich das Mikrofon extrem nahe an Lai befand, was Liu angesichts des sensiblen Themas jedoch für unwahrscheinlich hielt.
Er fügte hinzu, dass das flache Tempo und das Fehlen unregelmäßiger Pausen und Atemzüge an KI-Audio erinnerten.
„Ich hatte erwartet, dass Lais Stimme vor Wut höher wird und nicht eintönig bleibt, angesichts der emotionalen Natur des Themas“, sagte Liu und fügte hinzu, dass die Glaubwürdigkeit der Aufnahme deutlich abnimmt, weil weder Zeit noch Ort genau angegeben sind.
Auch das taiwanesische Präsidialbüro erklärte unter Berufung auf eine Analyse des Nationalen Sicherheitsbüros, dass die Audioaufnahme gefälscht sei.
Übersetzt von Shen Ke. Herausgegeben von Shen Ke und Taejun Kang.