İnsan destekli makine öğrenimi nedir? Daha iyi veriler ve daha etkili modeller
İnsan destekli makine öğrenimi nedir? Daha iyi veriler ve daha etkili modeller
İnsan ve makine öğrenimi döngüsü, eğitim verilerindeki hataları ortadan kaldırmak ve modelin doğruluğunu artırmak için insan geri bildirimini kullanır.
Makine öğrenimi modelleri genellikle mükemmel olmaktan uzaktır. Modelin tahminlerini, kredi onay derecelendirmesi gibi insanların hayatlarını etkileyen amaçlar için kullanırken, bir insanın tahminlerden en azından bazılarını gözden geçirmesi tavsiye edilir: düşük güven düzeyine sahip olanlar, aralığın dışına çıkanlar ve bir kalite kontrol. rastgele örneklem.
Ek olarak, iyi etiketlenmiş (açıklamalı) verilerin olmaması genellikle denetimli öğrenmeyi zorlaştırır (öğrencilerinizin yapacak hiçbir şeyinin olmadığı bir profesör değilseniz). Etiketlenmemiş veriler üzerinde yarı denetimli öğrenmeyi uygulamanın bir yolu, insanların model tohumlama için bazı verileri etiketlemesi, daha fazla veriyi etiketlemek (kendi kendine etiketleme) için ara modele yüksek güvenilir tahminler kullanması (veya model öğrenimini aktarması) ve tahminler göndermesidir. Kontrol etmek için düşük güven hakkında İnsan (aktif öğrenme). Süreç tekrarlanabilir ve uygulamada geçişten geçişe doğru gelişme eğilimindedir.
Ayrıca kontrol edin:
Kısacası, insan döngüsü makine öğrenimi, makine öğrenimi modellerini eğitmek için kullanılan verilerin kalitesini artırmak için insan geri bildirimine dayanır. Genel olarak, insan makine öğrenimi, bir insanın etiketleyebileceği (açıklama) iyi verileri örneklemek, bu verileri modeli eğitmek için kullanmak ve modeli açıklama için daha fazla veri örneklemek üzere kullanmakla ilgilidir. Bu süreci yönetmek için birçok hizmet mevcuttur.
Amazon SageMaker Temel Gerçeği
Amazon SageMaker iki veri tanımlama hizmeti sunar: Amazon SageMaker Ground Truth Plus ve Amazon SageMaker Ground Truth. Her iki seçenek de resimler, metinler ve videolar gibi ham verileri tanımlar ve makine öğrenimi modelleri için yüksek kaliteli eğitim veri kümeleri oluşturmak için bilgi etiketleri ekler. Ground Truth Plus ile Amazon uzmanları sizin için veri etiketi iş akışları kurar ve bu süreçte önceden öğrenme ve etiketleme için otomatik doğrulama uygulanır.
amazon artırılmış yapay zeka
Amazon SageMaker Ground Truth, verilerin ön sınıflandırmasıyla ilgilenirken, Amazon Augmented AI (Amazon A2I), düşük güvenilirliğe sahip tahminlerin veya uygulanan modellerden rastgele tahmin örneklerinin insan tarafından doğrulanmasını sağlar. Gelişmiş AI, hem inceleme iş akışı oluşturmayı hem de insan gözden geçirenleri yönetir. AWS AI ve makine öğrenimi hizmetlerinin yanı sıra Amazon SageMaker uç noktasında dağıtılan modellerle entegre olur.
DataRobot – Halkadaki İnsan
DataRobot, belirsiz tahminleri, harici girdileri ve düşük izlenen alanları tespit etmek için kurallar belirlemenize izin veren mütevazı bir AI özelliğine sahiptir. Bu kurallar üç olası eyleme yol açabilir: eylem yok (yalnızca izleme); tahmini geçersiz kılar (genellikle “güvenli” bir değerle); veya bir hata döndürün (tahmini reddedin). DataRobot, döngüdeki insan hakkında belgeler yazdı, ancak sitelerinde tevazu kuralları dışında herhangi bir uygulama bulamadım.
Google Cloud Döngü İçinde İnsan
Google Cloud, Document AI hizmetlerinde yerleşik olarak bulunan Döngü İçinde İnsan (HITL) işleme sunar, ancak bu yazıda olduğu gibi görüntü veya video işleme için hiçbir şey yoktur. Şu anda Google, aşağıdaki işlemciler için HITL inceleme iş akışlarını desteklemektedir:
Sipariş İşlemcileri:
faturalar
gelirler
Kredi İşlemcileri:
1003 Analist
1040 Ayrıştırıcı
1040 Analizör Tablo C
1040 Tablo E Ayrıştırıcı
1099-DIV Analizörü
1099-G Analizörü
1099-INT .Analizör
1099-MISC Analizörü
banka ekstresi analisti
HOA Analisti tarafından analiz edilen ifade
Mortgage Özü Analizörü
Ödeme Kuponu Analizörü
Emekli Analisti / Yatırım Tablosu
W2 محلل Analizörü
W9 Ayrıştırıcı
insan hizmet programları
Veri kümelerini etiketlemek için görüntü sınıflandırması, nesne algılama ve anlamsal bölümleme gibi insan görüntü açıklamalarını yapılandırmak zor olabilir. Neyse ki, etiketleyicilerin kullanabileceği birçok iyi ticari ve açık kaynak araç var.
Kendisini “AI endüstrisine güç sağlamak için etik iş gücü çözümleri sunan bir sosyal girişim” olarak tanımlayan bir şirket olan Humans in the Loop, favori açıklama araçları hakkında düzenli olarak blog yazıyor. En son girişlerinde, 10 açık kaynaklı bilgisayarla görü açıklama aracını listelemişlerdir: Label Studio, Diffgram, LabelImg, CVAT, ImageTagger, LabelMe, VIA, Make Sense, COCO Annotator ve DataTurks. Bu araçlar genellikle eğitim setlerine açıklama eklemek için kullanılır ve bazıları açıklama setlerini yönetebilir.
Örneğin, Computer Vision Annotation Tool (CVAT) güçlüdür, günceldir ve Chrome’da çalışır. Piyasadaki birçok araçtan çok daha hızlı olduğu için hala bizim ve müşterilerimizin etiketleme için kullandığı ana araçlardan biri.”
GitHub’da CVAT README şöyle yazıyor: “CVAT, bilgisayarla görü için ücretsiz, web tabanlı etkileşimli bir görüntü ve video açıklama aracıdır. Ekibimiz tarafından farklı özelliklere sahip milyonlarca nesneye açıklama eklemek için kullanılır. Birçok kullanıcı arayüzü ve kullanıcı deneyimi kararları geri bildirimlere dayanır. Profesyonel veri açıklama ekiplerinden. cvat.org’da çevrimiçi deneyin.” Demoyu çalıştırmak için bir oturum açmak gereklidir.
CVAT, MIT lisansı altında açık kaynak olarak yayınlanmaktadır. Intel’in aktif borçlularının çoğu, Rusya’nın Nizhny Novgorod kentinde faaliyet gösteriyor. CVAT tanıtım videosu, etiketleme sürecinin nasıl çalıştığını gösterir.
Gördüğünüz gibi, insan döngüsü işleme, makine öğrenimi sürecine iki noktada katkıda bulunabilir: denetimli öğrenme için etiketlenmiş veri kümelerinin ilk oluşturulması ve model çalıştırıldığında potansiyel olarak sorunlu tahminlerin gözden geçirilmesi ve düzeltilmesi. İlk kullanım durumu, modelin düzleştirilmesine yardımcı olur ve ikinci durum, modelin ayarlanmasına yardımcı olur.
Kaynak: InfoWorld