Schlagwort: GeminiKIModelle

  • Google Translate wird 20 Jahre und bietet Aussprachetraining an

    Das alte Google Translate in Dark

    Nano Banana

    Kurzfassung

    Quellen

    Google Translate feiert sein zwanzigjähriges Bestehen und integriert fortschrittliche Gemini-KI-Modelle für Echtzeitübersetzungen.
    Die neue Audio-to-Audio-Verarbeitung ermöglicht flüssigere Konversationen ohne störende Verzögerungen oder unnatürliche Pausen.
    Eine neue KI-gestützte Funktion analysiert zudem die eigene Aussprache beim Sprachenlernen und gibt den Nutzern direktes Feedback.

    Google Blog: Celebrating 20 years of Google Translate

    Google Translate feiert sein zwanzigjähriges Jubiläum und integriert aktuelle KI-Modelle für eine nahtlose Echtzeitübersetzung von Sprache zu Sprache. Gleichzeitig erhält die mobile Applikation ein dediziertes Training, das die korrekte Aussprache fremder Vokabeln gezielt analysiert. Was können wir aus 20 Jahren mitnehmen? Anfänglich als kleines Experiment gestartet, bedient der Übersetzungsdienst mittlerweile 95 Prozent der Weltbevölkerung in beinahe 250 Sprachen. Monatlich konvertieren über eine Milliarde Anwender weltweit rund eine Billion Wörter. Dabei wandelt sich die Nutzung spürbar weg von kurzen Textabfragen hin zu komplexeren Interaktionen. Über ein Drittel der geführten Live-Übersetzungs-Sitzungen dauern heute länger als fünf Minuten. Menschen greifen auf die Technik zunehmend für tiefergehende Gespräche wie Bewerbungsinterviews oder den ausgiebigen kulturellen Austausch zurück. Nebenbei weckt die visuelle Übersetzung per Kamera sowie das Verstehen von moderner Jugendsprache wachsendes Interesse. Ungeachtet all dieser funktionalen Fortschritte bleibt das menschliche Grundbedürfnis nach Höflichkeit bestehen. Die weltweit am häufigsten konvertierte Phrase lautet über all die Jahre hinweg schlichtweg »Danke«.

    Was sind die neuen Funktionen Bisher stützten sich Live-Gespräche vorwiegend auf eine umständliche Textkonvertierung. Durch die Einbindung neuester Audio-to-Audio-Fähigkeiten aktueller Gemini-KI-Modelle verarbeiten diese die gesprochenen Worte nun direkt. Dadurch erfassen die KI-Modelle den inhaltlichen Kontext sowie feine sprachliche Nuancen wesentlich präziser. Anwender führen auf diese Weise natürliche Dialoge, ohne durch künstliche Verzögerungen aus dem Takt zu geraten. Abseits der reinen Live-Übersetzung rückt das aktive Erlernen einer Fremdsprache immer stärker in den Fokus. Dafür stellt der Konzern ein neues Aussprachetraining bereit, das die Artikulation der Nutzer gezielt analysiert und sofortiges Feedback liefert. Lernende bauen auf diese Weise im Vorfeld Sicherheit für reale Unterhaltungen auf. Das neue Training steht in den USA und Indien für Englisch, Spanisch und Hindi ab sofort zur Verfügung. Anzeige