Künstliche Intelligenz

 Wird Technologie uns helfen, Fremdsprachen zu lernen?

 Wird Technologie uns helfen, Fremdsprachen zu lernen?

Konversations-KI-Technologien werden allgegenwärtig, und immer mehr Produkte, die automatische Spracherkennung, natürliches Sprachverständnis und Sprachsynthese verwenden, kommen auf den Markt. Machine Learning Specialist ist der Beruf der Zukunft.


Unsplash
Markus Winkler
 

Erinnern Sie sich daran, englische oder deutsche Wörter in ein Blackjack-Spiel zu stopfen? Für die Nachwelt wäre es wie das Formen von Tontafeln mit Schilf.

In einem Jahr könnten Business-Meetings in Teams und Zoome so aussehen: Ich kaufe einen Bitcoin-Avatar (genau wie ich, nur schöner), richte mich dann in der Office-Version ein und füge die Option der maschinellen Übersetzung hinzu. Jetzt kann ich Urdu sprechen. oder Hindi.

Überprüfen Sie auch:

Im Moment ist es nur eine Fantasie, es gibt fast 6,5 Tausend Menschen auf der Welt. Sprachen, und der Prozess des Lernens von dieser Basis erfordert Zeit und Ressourcen. Allerdings ist jetzt eine automatische Echtzeitübersetzung in die gängigsten Sprachen – Englisch, Französisch und Deutsch – möglich.

Warum ist Live-Übersetzung so schwierig? Fangen wir damit an, dass man zwei unterschiedliche Technologien kombinieren muss: Die erste Schicht ist die Spracherkennung, also die Umwandlung von Sprache in Text. Das zweite Problem ist die maschinelle Übersetzung. Das Softwaresystem für die maschinelle Übersetzung interpretiert die Satzstruktur der Ausgangssprache (aus der wir übersetzen) und erstellt eine Übersetzung basierend auf der Grammatik der Zielsprache (in die wir übersetzen). Der Prozess umfasst das Aufschlüsseln komplexer und vielfältiger Satzstrukturen, das Identifizieren von Wortarten, das Auflösen von Mehrdeutigkeiten und das Zusammenfügen von Informationen in die Komponenten und die Struktur einer neuen Sprache.

Für diese Aufgaben wurden zunächst statistische Methoden eingesetzt. In der maschinellen Übersetzung und Spracherkennung wurden zunächst statistische Geräte wie Hidden Markov Chains verwendet. „Seit etwa 2013-2015 gab es einen Methodenwechsel, und wir haben eine Verschiebung von klassischen, statistischen und probabilistischen Modellen zu Algorithmen auf der Grundlage von tiefem maschinellem Lernen gesehen. Wir entwickeln und entwickeln derzeit solche Modelle in OPI PIB“, sagt er Dr.M. Marek Kozowski, Leiter des Linguistic Engineering Lab. Deep-Learning-Algorithmen wurden zunächst in der Bildverarbeitung verfeinert. Sie sind hervorragend darin, Bilder zu kategorisieren, die schnell in die Medizin einfließen. Algorithmen beispielsweise unterstützen die Arbeit eines Radiologen, weil sie Unregelmäßigkeiten in Bildern sehr effektiv erkennen. Die Briten berichteten kürzlich über Arbeiten zum Einsatz künstlicher Intelligenz bei der Früherkennung der Alzheimer-Krankheit auf der Grundlage der Analyse der Rede der Befragten.

Ein weiterer großer Durchbruch geschah vor 5 Jahren. Im Jahr 2017 wurden die ersten Forschungsartikel von Google Brain über die Verwendung von Transformer Networks basierend auf Self Attention Mechanism veröffentlicht. „Einer der Meilensteine, der einen schnelleren und breiteren Übergang vom Labor zur Industrie ermöglichte, war die Ankunft des tiefen neuronalen Netzwerks vom Transformer-Typ. Zwei Jahre später – im Jahr 2019 – gab es bereits viele wissenschaftliche Veröffentlichungen über diese Netzwerke und ihre mehrere Anwendungen“, fährt Dr. Kosowski. Ende 2021 gewann sein Team einen nationalen Wettbewerb, der von Centrum Govtech und UOKiK organisiert wurde und sich auf künstliche Intelligenz bezieht. Sie besteht darin, intelligente Methoden zu entwickeln, die die Offenlegung verbotener Klauseln in Verträgen unterstützen. Es war die Verwendung von Transformer-Netzwerken, die OPI-Ingenieure überzeugte, da sie eine genauere und schnellere Erkennung bestimmter Zeichenfolgen im Vergleich zu klassischen maschinellen Lernmethoden oder sogar tiefen rekursiven Netzwerken ermöglichten. Apropos qualitatives Genauigkeitsmaß, das Transformer Grids bieten, das ist eine Verbesserung von etwa 5-10 % gegenüber den besten vorherigen Ansätzen. Theoretisch nicht viel, aber unter Berücksichtigung des Skaleneffekts beginnt es bereits, die Endabnahme und die finanziellen Gewinne erheblich zu beeinflussen. Erstens sind Transformer-Netzwerke auch schneller (sie können mehr Daten in kürzerer Zeit verarbeiten) und dank der Vielzahl von Bibliotheken oder der Anzahl vortrainierter Modelle einfacher in der Industrie zu implementieren. Es sind auch keine großen Teams von Wissenschaftlern für die langfristige Abstimmung erforderlich“, sagt Marek Kozowski. Er sagt, dass Transducer derzeit die erste und beste Architektur (wie BERT oder GPT-3) für Aufgaben der Verarbeitung natürlicher Sprache (NLP) sind In einer Spracherkennungsaufgabe sind Transformer-Netzwerke auch die qualitativ beste Lösung geworden.Jedoch sind kürzlich Modelle namens Vision Transformer (ViT) erschienen, die ein reinesModell eines Transformer-Netzwerks ohne die Notwendigkeit von Faltungsblöckenbieten.

Es kann Ihr virtueller Mitarbeiter sein

Ein Bericht des Forschungs- und Beratungsunternehmens Metrigy über intelligente virtuelle Assistenten ergab, dass fast 24 % der Befragten an Meetings mit nicht englischsprachigen Personen teilnehmen. Übersetzungskosten, oft nicht unerheblich. Manchmal kann zum Beispiel ein menschlicher Übersetzer krank werden, was einer Maschine nicht passieren würde. Ja, die Qualität maschineller Übersetzungen ist immer noch nicht gleichzusetzen mit menschlichen Übersetzungen, und KI wird sich nicht zynisch oder genau anfühlen, aber sie wird in der Realität des täglichen Geschäfts immer besser, insbesondere bei Fachübersetzungen. Mehr als die Hälfte der befragten Unternehmen nutzen externe Dienste, um zu übersetzen, was andere sagen, und die durchschnittlichen Kosten für eine solche Übersetzung betragen 172 US-Dollar pro Meeting. Durch die Integration intelligenter virtueller Meeting-Assistenten mit Übersetzungsfunktionen können Sie die Kosten erheblich senken.

Mit neuen Tools und Technologien ist es einfacher denn je, eine KI-Chat-App zu erstellen, die eine viel breitere Palette von Anwendungen ermöglicht, wie z. B. virtuelle Assistenten oder Echtzeit-Transkription. Diese Technologien sind bereits auf dem Markt verfügbar. Im Jahr 2019 erwarb CISCO Webex Echtzeit-Übersetzungstechnologie durch den Erwerb von Voicea, einer professionellen Meeting- und KI-basierten Sprachtechnologie. Cisco Webex bietet derzeit Simultanübersetzung in 9 Sprachen an. Die vorgestellte Lösung nutzt Google Translate und Voice Machine Learning. Der Google-Teil ist derselbe wie die Übersetzung, und der Sprachteil ist die automatische Spracherkennung und Aufzeichnung, Erfassung und Signatur. Hier kommt maschinelles Lernen ins Spiel: Da immer mehr Menschen diese Funktion nutzen, verbessert sich die Übersetzung im Laufe der Zeit, wenn Sie mehr Arten von Lauten und Dialekten lernen. Der Wort-für-Wort-Teil ist jedoch Google Translate.

Microsoft wiederum hat im Oktober 2021 ein sehr komplexes Transformer-Network-Modell für maschinelle Übersetzung (Very Deep Transformers for Neural Machine Translation) veröffentlicht und gezeigt, dass seine Modelle für gängige Sprachpaare (Englisch, Französisch und Deutsch) derzeit die beste Übersetzung in hoher Qualität liefern . Transformer-basierte Verfahren verbessern auch die Qualität der Spracherkennung erheblich. Wie von Dr. Marek Kozowski, ihr größtes Geschäft ist die einfache Implementierung. Sie müssen nicht Dutzende von Wissenschaftlern einstellen, um sie auf eine bestimmte Anwendung einzustellen, um sie auszuführen. In diesem Fall hängt viel von der Größe des Trainingssets ab und davon, wie viel Rechenleistung wir von diesen Modellen lernen müssen. Auf der Verbraucher- und integrierten Seite ist alles viel einfacher geworden, und diese Netzwerke sind trotz ihrer Komplexität leichter zugänglich und kostengünstiger in der Nutzung. Darüber hinaus ermöglicht Ihnen die Verfügbarkeit von Grafikkarten-Stacks, diese Modelle schnell zu trainieren und immer bessere Ergebnisse zu erzielen.

Ähnliche Artikel

Schaltfläche "Zurück zum Anfang"