La tecnologia ci aiuterà a imparare le lingue straniere?
La tecnologia ci aiuterà a imparare le lingue straniere?
Le tecnologie di intelligenza artificiale conversazionale stanno diventando onnipresenti e sempre più prodotti che utilizzano il riconoscimento vocale automatico, la comprensione del linguaggio naturale e la sintesi vocale sono entrati nel mercato. Lo specialista dell’apprendimento automatico è la professione del futuro.
Ti ricordi di aver inserito parole inglesi o tedesche in un gioco di blackjack? Per i posteri sarebbe come scolpire tavolette di argilla con canne.
Tra un anno, le riunioni di lavoro in team e zoome potrebbero essere così: compro un avatar bitcoin (proprio come me, solo più carino), poi mi installo nella versione office, aggiungendo l’opzione della traduzione automatica. Ora posso parlare l’urdu. o hindi.
Controlla anche:
Al momento è ancora solo una fantasia, ci sono quasi 6,5 mila persone nel mondo. lingue e il processo di apprendimento da questa base richiede tempo e risorse. Tuttavia, ora è possibile la traduzione automatica in tempo reale nelle lingue più popolari: inglese, francese e tedesco.
Perché la traduzione dal vivo è così difficile? Partiamo dal fatto che devi combinare due diverse tecnologie: il primo livello è il riconoscimento vocale, ovvero la conversione della voce in testo. Il secondo problema è la traduzione automatica. Il sistema software di traduzione automatica interpreta la struttura della frase della lingua di partenza (da cui stiamo traducendo) e crea una traduzione basata sulla grammatica della lingua di arrivo (in cui stiamo traducendo). Il processo prevede la scomposizione di strutture sintattiche complesse e diverse, l’identificazione di parti del discorso, la risoluzione di ambiguità e l’assemblaggio di informazioni nei componenti e nella struttura di una nuova lingua.
Inizialmente, per questi compiti sono stati utilizzati metodi statistici. Nella traduzione automatica e nel riconoscimento vocale, inizialmente sono stati utilizzati dispositivi statistici, come le catene di Markov nascoste. “Dal 2013 al 2015 circa, c’è stato un cambiamento nei metodi e abbiamo assistito al passaggio dai modelli classici, statistici e probabilistici agli algoritmi basati sul deep machine learning. Attualmente stiamo sviluppando e sviluppando tali modelli in OPI PIB” – afferma il dottor M. Marek Kozowski, capo del laboratorio di ingegneria linguistica. Gli algoritmi di deep learning sono stati inizialmente perfezionati nell’elaborazione delle immagini. Sono eccellenti nel classificare le immagini che vengono rapidamente incorporate nella medicina. Gli algoritmi, ad esempio, supportano il lavoro di un radiologo, perché rilevano le irregolarità nelle immagini in modo molto efficace. Gli inglesi hanno recentemente riportato un lavoro sull’uso dell’intelligenza artificiale nella diagnosi precoce del morbo di Alzheimer sulla base dell’analisi del discorso degli intervistati.
Un’altra grande svolta è avvenuta 5 anni fa. Nel 2017 sono stati pubblicati i primi articoli di ricerca di Google Brain sull’uso di Transformer Networks basati sul meccanismo di attenzione personale. “Una delle pietre miliari che ha consentito una transizione più rapida e ampia dal laboratorio all’industria è stato l’arrivo della rete neurale profonda di tipo Transformer. Due anni dopo, nel 2019, c’erano già molte pubblicazioni scientifiche su queste reti e le loro molteplici applicazioni”, continua il dott. Kozovsky. Alla fine del 2021, la sua squadra ha vinto una competizione nazionale organizzata da Centrum Govtech e UOKiK, che riguarda l’intelligenza artificiale. Consiste nello sviluppo di metodi intelligenti che supportino la divulgazione delle clausole vietate nei contratti. È stato l’uso delle reti Transformer a conquistare gli ingegneri OPI, consentendo un rilevamento più accurato e rapido di determinate stringhe, rispetto ai classici metodi di apprendimento automatico o persino alle reti ricorsive profonde. Parlando della misura di precisione qualitativa fornita da Transformer Grids, si tratta di un miglioramento del 5-10% circa rispetto ai migliori approcci precedenti. Non molto in teoria, ma tenendo conto dell’effetto di scala, sta già iniziando a influenzare in modo significativo l’accettazione finale e i profitti finanziari. Innanzitutto, le reti Transformer sono anche più veloci (sono in grado di elaborare più dati in meno tempo) e più facili da implementare nel settore grazie alla molteplicità di librerie o al numero di modelli pre-addestrati. Inoltre, non richiede grandi team di scienziati per la messa a punto a lungo termine” – afferma Marek Kozowski. Afferma che i trasduttori sono attualmente l’architettura di prima e migliore scelta (come l’architettura BERT o GPT-3) nelle attività di elaborazione del linguaggio naturale (NLP) In un compito di riconoscimento vocale, anche le reti Transformer sono diventate la soluzione di migliore qualità.Tuttavia, recentemente sono comparsi modelli chiamati Vision Transformer (ViT), che offrono un modello puro di una rete di trasformatori, senza la necessità di blocchi convoluzionali.
Può essere il tuo collega virtuale
Un rapporto della società di ricerca e consulenza Metrigy sugli assistenti virtuali intelligenti ha rilevato che quasi il 24% degli intervistati partecipa a riunioni con persone che non parlano inglese. Costi di traduzione, spesso non insignificanti. A volte un traduttore umano può ammalarsi, ad esempio, cosa che non accadrebbe a una macchina. Sì, la qualità delle traduzioni automatiche non è ancora all’altezza delle traduzioni umane e l’IA non si sentirà cinica o accurata, ma sta migliorando nelle realtà del lavoro quotidiano, specialmente con traduzioni specializzate. Più della metà delle aziende intervistate utilizza servizi esterni per tradurre ciò che dicono gli altri e il costo medio di tale traduzione è di $ 172 per riunione. L’integrazione di assistenti per riunioni virtuali intelligenti con le funzioni di traduzione consente di ridurre notevolmente i costi.
Con i nuovi strumenti e tecnologie, è più facile che mai creare un’app di chat AI, consentendo una gamma molto più ampia di applicazioni, come assistenti virtuali o trascrizione in tempo reale. Queste tecnologie sono già disponibili sul mercato. Nel 2019, CISCO Webex ha acquisito la tecnologia di traduzione in tempo reale acquisendo Voicea, una riunione professionale e una tecnologia vocale basata sull’intelligenza artificiale. Cisco Webex offre attualmente la traduzione simultanea in 9 lingue. La soluzione presentata utilizza Google Translate e l’apprendimento automatico vocale. La parte di Google è la stessa della traduzione e la parte vocale è il riconoscimento vocale automatico e l’acquisizione e la firma della registrazione. È qui che entra in gioco l’apprendimento automatico: man mano che sempre più persone utilizzano questa funzione, la traduzione migliora nel tempo man mano che impari più tipi di suoni e dialetti. Tuttavia, la parte parola per parola è Google Translate.
A sua volta, nell’ottobre 2021 Microsoft ha pubblicato un modello Transformer Network molto complesso per la traduzione automatica (Very Deep Transformers for Neural Machine Translation) e ha dimostrato che i suoi modelli per coppie di lingue comuni (inglese, francese e tedesco) attualmente forniscono la migliore traduzione di alta qualità . I metodi basati su trasformatore migliorano anche significativamente la qualità del riconoscimento vocale. Come notato dal dott. Marek Kozowski, la loro più grande attività è la facilità di implementazione, non è necessario assumere dozzine di scienziati per sintonizzarli su un’applicazione specifica per eseguirli. In questo caso, molto dipende dalle dimensioni del training set e da quanta potenza di calcolo dobbiamo imparare da questi modelli. Tutto è diventato molto più semplice dal lato consumer e integrato e queste reti, nonostante la loro complessità, sono più accessibili e meno costose da utilizzare. Inoltre, la disponibilità di pile di schede grafiche consente di addestrare rapidamente questi modelli e ottenere risultati sempre migliori.