Meta, das Instagram, Facebook, Threads und WhatsApp unter seinem eigenen Dach vereint, macht mit seinen Updates in der Welt der künstlichen Intelligenz auf sich aufmerksam. Meta macht die Sprachübersetzung mit seinem neuen Künstliche-Intelligenz-Paket noch makelloser und beeindruckender. Jetzt kann es sogar Flüstern übersetzen. Hier sind die Details…
Metas neue KI macht die Sprachübersetzung nahtloser!
Im August stellte Meta SeamlessM4T vor, ein KI-Übersetzungsmodell, das fast 100 Sprachen für Text und 36 Sprachen für Sprache unterstützt. Aber Meta bleibt nicht dabei stehen. Es hat die Architektur des Algorithmus aktualisiert, um ihn weiter zu verbessern. Mit seiner aktualisierten Architektur wird dieser Algorithmus Sprachübersetzungen spontaner und aussagekräftiger machen. Zu diesem Zweck hat der Technologieriese Meta jetzt 2 neue Funktionen zu diesem Tool hinzugefügt.
Die erste der beiden neuen Funktionen überträgt, wie der Name schon sagt, Ihre Äußerungen auf Ihre übersetzte Sprache. Meta nennt diese Funktion Seamless Phraser. Mit dieser Funktion übersetzt der Algorithmus Ihren Tonfall, Ihren emotionalen Tonfall und Ihr Flüstern sowie die Geschwindigkeit, mit der Sie sprechen.
Bislang klang übersetzte Sprache immer roboterhaft. Wir können sagen, dass diese Funktion sowohl für unser tägliches Leben als auch für die Produktion von Inhalten eine potenziell bahnbrechende Entwicklung darstellt. Darüber hinaus wird diese Funktion von mehreren Sprachen unterstützt. Zu diesen Sprachen gehören Englisch, Spanisch, Deutsch, Französisch, Italienisch, Spanisch, Deutsch, Französisch und Italienisch. Sogar Chinesisch ist verfügbar.
Die zweite Funktion startet die Übersetzung eines Gesprächs, während der Sprecher noch spricht. So können andere die Übersetzung schneller hören. Meta nennt diese Funktion „Seamless Streaming“. Leider hat diese Funktion einige Nachteile. Es gibt immer noch eine kurze Verzögerung bei der Übersetzung, wenn auch nur knapp zwei Sekunden. Aber Sie müssen nicht warten, bis jemand einen Satz beendet hat, um die Übersetzung zu hören.
Laut Meta liegt die Schwierigkeit hier darin, dass verschiedene Sprachen unterschiedliche Satzstrukturen haben. Daher muss entschieden werden, ob der Kontext ausreicht, um eine Übersetzung zu erstellen oder ob man weiter zuhören soll. Zu diesem Zweck musste der Tech-Gigant einen Algorithmus entwickeln, der auf die Analyse von Teil-Audioeingaben spezialisiert ist.
Metas neueste Entwicklung im Bereich der nahtlosen Kommunikation lässt seine Konkurrenten in den Schatten stellen. Sie sieht auch beeindruckender aus als die mobilen Dolmetschertools von Unternehmen wie Google und Samsung. Es ist noch nicht bekannt, wann die Öffentlichkeit diese neuen Funktionen nutzen können wird. Experten gehen jedoch davon aus, dass Meta sie in Augmented-Reality-Brillen einbauen wird.