L'intelligence artificielle

 La technologie nous aidera-t-elle à apprendre des langues étrangères ?

 La technologie nous aidera-t-elle à apprendre des langues étrangères ?

Les technologies d’IA conversationnelle deviennent omniprésentes et de plus en plus de produits utilisant la reconnaissance automatique de la parole, la compréhension du langage naturel et la synthèse vocale sont entrés sur le marché. Le spécialiste de l’apprentissage automatique est le métier d’avenir.


Unsplash
Marcus Winkel
 

Vous souvenez-vous d’avoir fourré des mots anglais ou allemands dans un jeu de blackjack ? Pour la postérité, ce serait comme sculpter des tablettes d’argile avec des roseaux.

Dans un an, les réunions de travail en équipe et zoome pourraient ressembler à ça : j’achète un avatar bitcoin (tout comme moi, en plus joli), puis je m’installe en version bureautique, en y ajoutant l’option de traduction automatique. Maintenant, je peux parler ourdou. ou hindi.

Vérifiez également :

Pour le moment, ce n’est encore qu’un fantasme, il y a près de 6,5 mille personnes dans le monde. langues, et le processus d’apprentissage à partir de cette base prend du temps et des ressources. Cependant, la traduction automatique en temps réel dans les langues les plus populaires – anglais, français et allemand est désormais possible.

Pourquoi la traduction en direct est-elle si difficile ? Commençons par le fait que vous devez combiner deux technologies différentes : la première couche est la reconnaissance vocale, c’est-à-dire la conversion de la voix en texte. Le deuxième problème est la traduction automatique. Le système logiciel de traduction automatique interprète la structure de la phrase de la langue source (à partir de laquelle nous traduisons) et crée une traduction basée sur la grammaire de la langue cible (vers laquelle nous traduisons). Le processus implique de décomposer des structures de phrases complexes et diverses, d’identifier des parties du discours, de résoudre des ambiguïtés et d’assembler des informations dans les composants et la structure d’une nouvelle langue.

Initialement, des méthodes statistiques ont été utilisées pour ces tâches. Dans la traduction automatique et la reconnaissance vocale, initialement, des dispositifs statistiques, tels que des chaînes de Markov cachées, ont été utilisés. « Depuis environ 2013-2015, il y a eu un changement dans les méthodes, et nous avons vu un passage des modèles classiques, statistiques et probabilistes aux algorithmes basés sur l’apprentissage automatique en profondeur. Nous développons et développons actuellement de tels modèles dans OPI PIB » – dit Dr M. Marek Kozowski, responsable du laboratoire d’ingénierie linguistique. Les algorithmes d’apprentissage en profondeur ont d’abord été affinés dans le traitement d’images. Ils sont excellents pour catégoriser les images qui sont rapidement intégrées à la médecine. Les algorithmes, par exemple, soutiennent le travail d’un radiologue, car ils détectent très efficacement les irrégularités des images. Les Britanniques ont récemment rapporté des travaux sur l’utilisation de l’intelligence artificielle dans le diagnostic précoce de la maladie d’Alzheimer basés sur l’analyse du discours des répondants.

Une autre grande percée s’est produite il y a 5 ans. En 2017, les premiers articles de recherche de Google Brain sur l’utilisation des Transformer Networks basés sur le Self Attention Mechanism ont été publiés. « L’un des jalons qui a permis une transition plus rapide et plus large du laboratoire vers l’industrie a été l’arrivée du réseau de neurones profonds de type Transformer. Deux ans plus tard – en 2019 – il y avait déjà beaucoup de publications scientifiques sur ces réseaux et leurs applications multiples », poursuit le Dr. Kozovsky. Fin 2021, son équipe a remporté un concours national organisé par Centrum Govtech et UOKiK, qui est lié à l’intelligence artificielle. Elle consiste à développer des méthodes intelligentes qui supportent la divulgation des clauses interdites dans les contrats. C’est l’utilisation des réseaux Transformer qui a séduit les ingénieurs d’OPI, permettant une détection plus précise et plus rapide de certaines chaînes, par rapport aux méthodes classiques d’apprentissage automatique ou même aux réseaux récursifs profonds. En parlant de la mesure de précision qualitative fournie par Transformer Grids, il s’agit d’une amélioration d’environ 5 à 10 % par rapport aux meilleures approches précédentes. Pas grand-chose en théorie, mais compte tenu de l’effet d’échelle, cela commence déjà à affecter significativement l’acceptation finale et les bénéfices financiers. Tout d’abord, les réseaux Transformer sont également plus rapides (ils sont capables de traiter plus de données en moins de temps) et plus faciles à mettre en œuvre dans l’industrie grâce à la multiplicité des bibliothèques ou au nombre de modèles pré-entraînés. Cela ne nécessite pas non plus de grandes équipes de scientifiques pour un réglage à long terme « – dit Marek Kozowski. Il dit que les transducteurs sont actuellement la première et la meilleure architecture de choix (telle que l’architecture BERT ou GPT-3) dans les tâches de traitement du langage naturel (NLP) Dans une tâche de reconnaissance vocale, les réseaux de transformateurs sont également devenus la meilleure solution de qualité.

Cela peut être votre collègue virtuel

Un rapport de la société de recherche et de conseil Metrigy sur les assistants virtuels intelligents a révélé que près de 24 % des personnes interrogées assistent à des réunions avec des non-anglophones. Coûts de traduction, souvent non négligeables. Parfois, un traducteur humain peut tomber malade, par exemple, ce qui n’arriverait pas à une machine. Oui, la qualité des traductions automatiques n’est toujours pas égale aux traductions humaines, et l’IA ne se sentira pas cynique ou précise, mais elle s’améliore dans les réalités des affaires quotidiennes, en particulier avec les traductions spécialisées. Plus de la moitié des entreprises interrogées utilisent des services externes pour traduire ce que les autres disent, et le coût moyen d’une telle traduction est de 172 $ par réunion. L’intégration d’assistants de réunion virtuels intelligents avec des fonctions de traduction vous permet de réduire considérablement les coûts.

Avec de nouveaux outils et technologies, il est plus facile que jamais de créer une application de chat IA, permettant une gamme beaucoup plus large d’applications, telles que les assistants virtuels ou la transcription en temps réel. Ces technologies sont déjà disponibles sur le marché. En 2019, CISCO Webex a acquis une technologie de traduction en temps réel en acquérant Voicea, une réunion professionnelle et une technologie vocale basée sur l’IA. Cisco Webex propose actuellement une traduction simultanée en 9 langues. La solution présentée utilise Google Translate et l’apprentissage automatique de la voix. La partie Google est la même que la traduction, et la partie vocale est la reconnaissance automatique de la parole et la capture et la signature de l’enregistrement. C’est là qu’intervient l’apprentissage automatique : à mesure que de plus en plus de personnes utilisent cette fonctionnalité, la traduction s’améliore au fil du temps à mesure que vous apprenez plus de types de sons et de dialectes. Cependant, la partie mot à mot est Google Translate.

À son tour, en octobre 2021, Microsoft a publié un modèle très complexe de Transformer Network pour la traduction automatique (Very Deep Transformers for Neural Machine Translation) et a démontré que ses modèles pour les paires de langues communes (anglais, français et allemand) fournissent actuellement la meilleure traduction de haute qualité. . Les méthodes basées sur les transformateurs améliorent également considérablement la qualité de la reconnaissance vocale. Comme l’a noté le Dr. Marek Kozowski, leur plus grande activité est la facilité de mise en œuvre, vous n’avez pas besoin d’embaucher des dizaines de scientifiques pour les régler sur une application spécifique pour les exécuter. Dans ce cas, beaucoup dépend de la taille de l’ensemble d’apprentissage et de la puissance de calcul que nous devons apprendre de ces modèles. Tout est devenu beaucoup plus simple côté consommateur et intégré, et ces réseaux, malgré leur complexité, sont plus accessibles et moins coûteux à utiliser. De plus, la disponibilité des piles de cartes graphiques vous permet de former rapidement ces modèles et d’obtenir des résultats de mieux en mieux.

Articles similaires

Bouton retour en haut de la page