Der Traum vom automatischen Transkribieren – Amberscript

Transkribieren ist mühsam und zeitraubend. Wie schön wäre da ein automatischer Dienst! Amberscript verspricht genau das. Ich habe es getestet.

[Photo by Oscar Ivan Esquivel Arte on Unsplash]

Interviews zu transkribieren gehört wohl zu einer der nervigsten, monotonsten und zeitraubendsten Aufgaben, die für Sozialwissenschaftlerinnen, aber auch Journalistinnen anfallen. Jede Hilfe, die diese mühselige Aufgabe erleichtert, ist also gern gesehen. Vor einiger Zeit schrieb ich hier über oTranscribe, einen Service im Browser, der beim Transkribieren unterstützt. Jetzt bin ich auf Amberscript aufmerksam geworden, ein Online-Service, der automatisiertes Transkribieren verspricht. Kann das funktionieren?

Wie (gut) kann das funktionieren?

Wie funktioniert Amberscript? Da alles im Browser abläuft, ist man schon mal an kein Betriebssystem gebunden. Auf der Seite startet man im Dashboard, eine Art Übersicht. Dort kann man dann die gewünschte Datei hochladen. Positiv fällt auf: Es werden acht verschiedene Formate unterstützt. Neben klassischen MP3-Files, auch WAV, M4A, oder AAC. Auch die maximale Größe von 4GB sollte für die allermeisten Zwecke ausreichend sein.

Nach erfolgtem Upload heißt es dann Warten. Das Transkribieren erfolgt zwar automatisiert, aber auch Software benötigt natürlich eine gewissen Zeit, um eine anspruchsvolle Aufgabe wie Sprache-zu-Text-Umwandlung zu bewerkstelligen. Die benötigte Zeit ist allerdings drastisch (!) kürzer als bei einer manuellen Transkription. Ich konnte zwei Interviews zu je 30 Minuten testen, eines auf englisch, eines auf deutsch. Beide standen in wenigen Minuten transkribiert zur Verfügung. Ist die Transkription abgeschlossenen erhält man einen Link per Mail. Das Transkript steht auch im Dashboard zur Verfügung.

Das Dashboard
Das Dashboard

In der Transkrioptionsansicht kann man dann das Transkript noch weiter verfeinern. Hierfür werden Tools bereitgestellt, die auch von oTranscribe schon bekannt sind und enorm hilfreich sind, wie das Verlangsamen der Abspielgeschwindigkeit, die Möglichkeit fünf Sekunden zurückzuspringen, oder einzelne Passagen zu markieren. Zum Glück werden auch Tastenkombinationen unterstützt, was einfach enorm hilfreich ist, da man so nicht ständig mit der Maus arbeiten muss.

Insgesamt kann ich sagen, dass mir das Layout sehr gut gefällt. Es ist modern, übersichtlich und funktional. Für den Export des fertigen Transkripts kann man sich zwischen den Textformaten Word, Json und einfachen Textdateien entscheiden. Hinzu kommen noch die Spezialformate SRT, VTT und EBU-STL, die für Untertitel genutzt werden.

Das fertige Transkript zur weiteren Bearbeitung
Das fertige Transkript zur weiteren Bearbeitung

Die Gretchenfrage: Datenschutz bei Amberscript

Nun aber zur Gretchenfrage: Wie gut sind die Transkripte denn? Ich kann sagen: Gut, aber kein kompletter Ersatz für händisches Trankribieren. Auch Amberscript wird dieses leidige Thema zumindest noch nicht abschaffen. Enorm helfen kann das Tool aber auf jeden Fall. In jedem Fall bekommt man ein erstes Transkript, welches man im zweiten Schritt manuell durchgehen und ausbessern kann. So fällt zumindest der erste, sehr zeitraubende Arbeitsschritt weg.

Ich konnte bisher ein Interview auf englisch und einen Podcast auf deutsch testen. Mit dem englischen Transkript war ich schon sehr zufrieden und überrascht, wie gut die Engine funktioniert. Das deutschsprachige Gespräch hätte stärker überarbeitet werden müssen, wenngleich auch hier eine brauchbare Grundlage vorlag. Es ist aber zu erwarten, dass sich die Qualität in Zukunft nur verbessert, da Künstliche Intelligenzen dazulernen.

Logo von Amberscript

Um es kurz zu machen: Ja, man bekommt eine deutliche Erleichterung. Nein, es ist kein kompletter Ersatz für eine manuelle Transkription. Zusätzlich bietet Amberscript aber noch einen Perfekt-Modus an, bei dem das automatische Transkript noch von Menschenhand überarbeitet wird. Hier wird mit einem zu 100% korrekten Transkript geworben.

Positiv hervorzuheben ist in jedem Fall, dass extrem viele Sprachen unterstützt werden. Neben sehr häufigen Sprachen wie Englisch, Französisch, Spanisch oder Deutsch, sind u.a. auch Mandarin, Hebräisch, Hindi oder Russisch und Türkisch möglich.

Wie sicher sind meine Daten?

Zwei wichtige Fragen sind aber noch offen: Was kostet das und wie ist es um den Datenschutz bestellt? Schließlich handelt es sich oftmals um Interviewmaterial für das hohe Datenschutzstandards gelten.

Prinzipiell ist die Datenschutzfrage positiv zu beantworten. Amberscript hat dieses Problem auf dem Schirm (was weiß Gott nicht selbstverständlich ist bei Online-Services und Start-Ups). Sie weisen auf die Möglichkeit hin, sogenannte Non Disclosure Agreements oder Data Processing Agreements unterzeichnen zu können, sofern das gewünscht wird. Auf meine Nachfrage hin versicherte mir man zudem, dass die Server DSGVO-konform in Frankfurt/Main und Amsterdam stehen. Bestehende Transkripte werden nach sechs Monaten gelöscht. Zudem wird versichert, dass weder Audiodateien, noch Transkripte verkauft werden oder auch nur Mitarbeiter*innen, Unternehmen oder Dritten verfügbar gemacht werden. Eine Ausnahme sind natürlich die manuellen Nachbesserungen. Hier greifen dann ggf. NDAs und DPAs.

Nichtsdestotrotz sollte man im Einzelfall abwägen und ggf. die eigenen Projektbestimmungen checken. Ich denke aber, dass nichts grundsätzlich gegen die Lösung von Amberscript mit Blick auf den Datenschutz spricht.

Was kostet das und lohnt es sich?

Amberscript bietet zwei verschiedene Tarife für den automatisierten Modus an: bezahlen pro Stunde oder pro Monat. Hat man nur wenig Material, so empfiehlt sich der Tarif pro Stunde. Hier zahlt man 20€ pro Stunde Audio- oder Videomaterial.

Bucht man einen ganzen Monat, so kostet das 75€. Dafür kann man Material im Umfang von bis zu 5 Stunden hochladen und transkribieren lassen. Wer nun den manuellen Service beanspruchen möchte, bezahlt pro Minute. 1,70€ werden hierfür fällig.

Ich denke, dass diese Preise zwar nicht unfassbar günstig, aber vertretbar sind. Wer schon einmal transkribiert hat, wird wissen, dass man für eine Stunde Interview schnell das fünf- oder sechsfache an Zeit benötigt. Da relativieren sich 20€ schnell, wenn man den eigenen Stundenlohn als Berechnungsgrundlage nimmt.

Schön ist außerdem, dass man zunächst 30 Minuten testen kann. So kann man auch feststellen, ob das eigene Audiomaterial geeignet ist, um von Amberscript transkribiert zu werden. Funktioniert der Testlauf gut, kann man sich so leichter für diese Ausgabe entscheiden.

Mein Fazit ist also grundlegend positiv. Man darf halt nur keine Wunderdinge erwarten. Zumindest noch nicht. Ich denke, dass wir schon in wenigen Jahren an einem Punkt sind, an dem wir perfekte Transkripte automatisiert erhalten. In der Zwischenzeit müssen wir noch eine Überarbeitungsrunde einbauen. Die Zeitersparnis ist aber auch jetzt schon beträchtlich und solange keine Datenschutzbedenken bestehen, kann man mindestens mal einen intensiven Blick auf den Service von Amberscript werfen. Ich persönlich werde es mit Sicherheit in meinen Werkzeugkoffer aufnehmen.

2 Kommentare

  1. Hi,

    schöner Erfahrungsbericht! Ich teste aktuell auch Amberscript und die Alternative Trint – falls nicht bekannt: https://trint.com/
    Ist auf jeden Fall auch einen Blick wert! Da ist auf jeden Fall Bewegung in dem Thema 🙂

    Viele Grüße
    Felix

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.