Der Google-Dienst ReCaptcha soll sicherstellen, dass Menschen, die auf Webseiten zugreifen, auch echte Menschen sind und nicht etwa Bots, die beispielsweise ein Forum mit Spam zumüllen wollen.
Seit dem letzten Versionsupdate haben viele Menschen, die mit ReCaptcha gegen Missbrauch gesicherte Internetseiten nutzen, deutliche Probleme mit Googles Menschen-Identifikator und suchen nach Auswegen aus der Problematik.
Speech-to-Text ist der Schlüssel
Jetzt haben Forscher der University of Maryland mit UnCaptcha eine praktikable Methode entwickelt, um dieses System automatisiert zu überwinden. Bei der Nutzung von Googles eigener Sprachanalyse für Speech-to-Text gelingt das den Forschern in 90 Prozent der Fälle, berichtet auch Motherboard in einem Artikel zu UnCaptcha.
Die Forscher nutzen dabei aus, dass Googles ReCaptcha für Menschen mit Sehbehinderung als Alternative zu den Bildern ein Audio-Captcha benutzt. Die Forscher haben dieses Audio-Captcha automatisiert durch eine Speech-to-Text-Engine analysieren zu lassen und ReCaptcha so knacken können.
Voll automatisiert zum Erfolg
Damit lässt sich offensichtlich nicht nur theoretisch das vorgelesene Captcha maschinell wieder zurückgewinnen und dann auch voll automatisiert in das Google-Formular eintragen. In einer ersten Version von ReCaptcha wurden zu diesem Zweck vorgelesene Ziffern verwendet, die das Forscherteam mit einer Erfolgsrate von etwa 85 Prozent zurückgewinnen konnte.