Teknoloji yabancı dil öğrenmemize yardımcı olacak mı?

Teknoloji yabancı dil öğrenmemize yardımcı olacak mı?
Konuşmalı AI teknolojileri her yerde bulunur hale geliyor ve otomatik konuşma tanıma, doğal dil anlama ve konuşma sentezi kullanan daha fazla ürün pazara girdi. Makine öğrenimi uzmanı geleceğin mesleğidir.
Bir blackjack oyununa İngilizce veya Almanca sözcükleri tıkıştırdığınızı hatırlıyor musunuz? Gelecek nesiller için, sazlarla kil tabletler yapmak gibi olurdu.
Bir yıl içinde, ekiplerdeki ve zoom’daki iş toplantıları şöyle görünebilir: Bir bitcoin avatarı satın alıyorum (tıpkı benim gibi, sadece daha güzel), sonra makine çevirisi seçeneğini ekleyerek ofis sürümüne geçiyorum. Artık Urduca konuşabiliyorum. veya Hintçe.
Ayrıca kontrol edin:
Şu anda hala sadece bir hayal, dünyada neredeyse 6,5 bin insan var. diller ve bu temelden öğrenme süreci zaman ve kaynak gerektirir. Ancak, en popüler dillere – İngilizce, Fransızca ve Almanca – otomatik gerçek zamanlı çeviri artık mümkün.
Canlı çeviri neden bu kadar zor? İki farklı teknolojiyi birleştirmeniz gerektiği gerçeğiyle başlayalım: ilk katman konuşma tanıma, yani sesin metne dönüştürülmesidir. İkinci konu makine çevirisidir. Makine çevirisi yazılım sistemi, kaynak dilin (çeviri yaptığımız) cümle yapısını yorumlar ve hedef dilin (çeviri yaptığımız) dilbilgisine dayalı bir çeviri oluşturur. Süreç, karmaşık ve çeşitli cümle yapılarını parçalamayı, konuşmanın bölümlerini tanımlamayı, belirsizlikleri çözmeyi ve yeni bir dilin bileşenlerine ve yapısına bilgi toplamayı içerir.
Başlangıçta, bu görevler için istatistiksel yöntemler kullanıldı. Makine çevirisi ve konuşma tanımada, başlangıçta, gizli Markov zincirleri gibi istatistiksel cihazlar kullanıldı. “Yaklaşık 2013-2015’ten bu yana yöntemlerde bir değişiklik oldu ve klasik, istatistiksel ve olasılıklı modellerden derin makine öğrenimine dayalı algoritmalara geçiş gördük. Şu anda OPI PIB’de bu tür modelleri geliştiriyor ve geliştiriyoruz” – diyor Dr.M. Marek Kozowski, Dil Mühendisliği Laboratuvarı Başkanı. Derin öğrenme algoritmaları başlangıçta görüntü işlemede rafine edildi. Tıbba hızla dahil edilen görüntüleri kategorize etmede mükemmeldirler. Algoritmalar, örneğin, görüntülerdeki düzensizlikleri çok etkili bir şekilde tespit ettikleri için bir radyoloğun çalışmasını destekler. İngilizler kısa süre önce, yanıtlayanların konuşmalarının analizine dayalı olarak, Alzheimer hastalığının erken teşhisinde yapay zekanın kullanımına ilişkin bir çalışma bildirdiler.
5 yıl önce büyük bir gelişme daha yaşandı. 2017 yılında, Öz Dikkat Mekanizmasına dayalı Transformer Ağlarının kullanımına ilişkin ilk Google Beyin araştırma makaleleri yayınlandı. “Laboratuvardan sektöre daha hızlı ve daha geniş bir geçişi sağlayan kilometre taşlarından biri de Transformer tipi derin sinir ağının gelişiydi. İki yıl sonra – 2019’da – bu ağlar ve bunların işlevleri hakkında zaten birçok bilimsel yayın vardı. çoklu uygulamalar,” diye devam ediyor Dr. Kozovski. 2021’in sonunda ekibi, Centrum Govtech ve UOKiK tarafından düzenlenen yapay zeka ile ilgili ulusal bir yarışmayı kazandı. Sözleşmelerdeki yasaklanmış maddelerin açıklanmasını destekleyen akıllı yöntemler geliştirmeyi içerir. OPI mühendislerini kazanan, klasik makine öğrenimi yöntemlerine ve hatta derin özyinelemeli ağlara kıyasla belirli dizilerin daha doğru ve daha hızlı algılanmasını sağlayan Transformer ağlarının kullanılmasıydı. Transformer Grids’in sağladığı niteliksel doğruluk ölçüsünden bahsetmişken, bu, önceki en iyi yaklaşımlara göre yaklaşık %5-10’luk bir gelişmedir. Teoride çok fazla değil, ancak ölçeğin etkisi dikkate alındığında, kesin kabulü ve finansal karları önemli ölçüde etkilemeye başladı bile. Her şeyden önce, Transformer ağları da daha hızlıdır (daha az zamanda daha fazla veri işleyebilirler) ve çok sayıda kütüphane veya önceden eğitilmiş model sayısı sayesinde endüstride uygulanması daha kolaydır. Ayrıca uzun vadeli ayarlama için büyük bilim insanlarından oluşan ekipler gerektirmiyor” diyor Marek Kozowski. Dönüştürücülerin şu anda doğal dil işleme (NLP) görevlerinde ilk ve en iyi seçim mimarisi (BERT veya GPT-3 mimarisi gibi) olduğunu söylüyor. .Bir konuşma tanıma görevinde Transformer ağları da en kaliteli çözüm haline geldi.Ancak, son zamanlarda, konvolüsyonel bloklara ihtiyaç duymadan bir transformatör ağının saf bir modelini sunan Vision Transformer (ViT) adlı modeller ortaya çıktı.
Sanal iş arkadaşınız olabilir
Araştırma ve danışmanlık firması Metrigy tarafından akıllı sanal asistanlar hakkında bir rapor, katılımcıların yaklaşık %24’ünün İngilizce konuşmayanlarla toplantılara katıldığını buldu. Çeviri maliyetleri, genellikle önemsiz değildir. Bazen bir insan tercüman, örneğin bir makinenin başına gelmeyecek şekilde hastalanabilir. Evet, makine çevirilerinin kalitesi hala insan çevirilerine eşit değil ve yapay zeka alaycı veya doğru hissetmeyecek, ancak özellikle özel çevirilerle günlük işlerin gerçeklerinde daha iyi hale geliyor. Ankete katılan şirketlerin yarısından fazlası, diğerlerinin söylediklerini çevirmek için harici hizmetler kullanıyor ve bu tür bir çevirinin ortalama maliyeti toplantı başına 172 dolar. Akıllı sanal toplantı yardımcılarını çeviri işlevleriyle entegre etmek, maliyetleri önemli ölçüde azaltmanıza olanak tanır.
Yeni araçlar ve teknolojilerle, sanal asistanlar veya gerçek zamanlı transkripsiyon gibi çok daha geniş bir uygulama yelpazesine olanak tanıyan bir AI sohbet uygulaması oluşturmak hiç olmadığı kadar kolay. Bu teknolojiler zaten piyasada mevcuttur. 2019’da CISCO Webex, profesyonel bir toplantı ve yapay zeka tabanlı ses teknolojisi olan Voicea’yı satın alarak gerçek zamanlı çeviri teknolojisini satın aldı. Cisco Webex şu anda 9 dile eşzamanlı çeviri sunmaktadır. Sunulan çözüm, Google Çeviri ve sesli makine öğrenimini kullanır. Google kısmı çeviri ile aynıdır ve ses kısmı otomatik konuşma tanıma ve kayıt yakalama ve imzadır. İşte burada makine öğrenimi devreye giriyor: Gittikçe daha fazla insan bu özelliği kullandıkça, siz daha fazla ses ve lehçe türü öğrendikçe çeviri zamanla gelişir. Ancak, kelimesi kelimesine kısım Google Translate’dir.
Buna karşılık, Ekim 2021’de Microsoft, makine çevirisi için çok karmaşık bir Transformer Network modeli (Neural Machine Translation için Çok Derin Transformatörler) yayınladı ve ortak dil çiftlerine (İngilizce, Fransızca ve Almanca) yönelik modellerinin şu anda en iyi yüksek kaliteli çeviriyi sağladığını gösterdi. . Transformatör tabanlı yöntemler de ses tanıma kalitesini önemli ölçüde artırır. Dr. Marek Kozowski, onların en büyük işi uygulama kolaylığıdır, onları çalıştırmak için belirli bir uygulamaya ayarlamak için düzinelerce bilim insanını işe almanıza gerek yoktur. Bu durumda, çok şey eğitim setinin boyutuna ve bu modellerden ne kadar bilgi işlem gücü öğrenmemiz gerektiğine bağlıdır. Tüketici ve entegre tarafta her şey çok daha basit hale geldi ve bu ağlar, karmaşıklıklarına rağmen daha erişilebilir ve kullanımı daha ucuz. Ek olarak, grafik kartı yığınlarının mevcudiyeti, bu modelleri hızlı bir şekilde eğitmenize ve daha iyi ve daha iyi sonuçlar elde etmenize olanak tanır.