ما هو التعلم الآلي بمساعدة الإنسان؟ بيانات أفضل ونماذج أكثر فاعلية

ما هو التعلم الآلي بمساعدة الإنسان؟ بيانات أفضل ونماذج أكثر فاعلية
تستخدم حلقة التعلم البشري والآلي التعليقات البشرية للتخلص من الأخطاء في بيانات التدريب وزيادة دقة النموذج.
غالبًا ما تكون نماذج التعلم الآلي بعيدة عن الكمال. عند استخدام تنبؤات النموذج للأغراض التي تؤثر على حياة الأشخاص ، مثل تصنيف الموافقة الائتمانية ، يُنصح الإنسان بمراجعة بعض التوقعات على الأقل: تلك التي لديها مستوى ثقة منخفض ، وتلك التي تقع خارج النطاق ، و عينة عشوائية لمراقبة الجودة.
بالإضافة إلى ذلك ، غالبًا ما يؤدي الافتقار إلى البيانات الجيدة الموسومة (المشروحة) إلى صعوبة التعلم الخاضع للإشراف (إلا إذا كنت أستاذًا ليس لدى طلابك ما يفعلونه). تتمثل إحدى طرق تنفيذ التعلم شبه الخاضع للإشراف على البيانات غير المميزة في أن يقوم الأشخاص بتسمية بعض البيانات لبذر النموذج ، واستخدام تنبؤات عالية الثقة للنموذج المؤقت (أو نقل نموذج التعلم) لتمييز المزيد من البيانات (وضع العلامات الذاتية) ، وإرسالها تنبؤات حول الثقة المنخفضة للتحقق البشري (التعلم النشط). يمكن تكرار العملية وتميل إلى التحسين من الانتقال إلى الانتقال في الممارسة.
تحقق أيضًا من:
باختصار ، يعتمد التعلم الآلي للحلقة البشرية على ردود الفعل البشرية لتحسين جودة البيانات المستخدمة لتدريب نماذج التعلم الآلي. بشكل عام ، يدور التعلم الآلي البشري حول أخذ عينات من البيانات الجيدة التي يمكن للإنسان وضع علامة عليها (التعليق التوضيحي) ، واستخدام تلك البيانات لتدريب النموذج ، واستخدام النموذج لأخذ عينات من المزيد من البيانات للتعليق عليها. هناك العديد من الخدمات المتاحة لإدارة هذه العملية.
Amazon SageMaker Ground Truth
تقدم Amazon SageMaker خدمتين لوصف البيانات: Amazon SageMaker Ground Truth Plus و Amazon SageMaker Ground Truth. يحدد كلا الخيارين البيانات الأولية مثل الصور والنصوص وملفات الفيديو ، ويضيفان تسميات إعلامية لإنشاء مجموعات بيانات تدريبية عالية الجودة لنماذج التعلم الآلي. باستخدام Ground Truth Plus ، قام خبراء Amazon بإعداد تدفقات عمل تسمية البيانات نيابة عنك ، وفي هذه العملية ، يتم تطبيق التعلم المسبق والتحقق الآلي من وضع العلامات.
الذكاء الاصطناعي المعزز من أمازون
بينما تتعامل Amazon SageMaker Ground Truth مع التصنيف المسبق للبيانات ، توفر Amazon Augmented AI (Amazon A2I) تحققًا بشريًا من تنبؤات منخفضة الثقة أو عينات تنبؤ عشوائية من النماذج المنفذة. يدير الذكاء الاصطناعي المعزز كلاً من إنشاء سير عمل المراجعة والمراجعين البشريين. يتكامل مع AWS AI وخدمات التعلم الآلي بالإضافة إلى النماذج المنشورة على نقطة نهاية Amazon SageMaker.
DataRobot – الإنسان في الحلقة
يحتوي DataRobot على ميزة متواضعة للذكاء الاصطناعي تسمح لك بوضع قواعد لاكتشاف التنبؤات غير المؤكدة والمدخلات الخارجية والمناطق منخفضة المراقبة. يمكن أن تؤدي هذه القواعد إلى ثلاثة إجراءات ممكنة: لا يوجد إجراء (المراقبة فقط) ؛ إبطال التنبؤ (عادةً بقيمة “آمنة”) ؛ أو إرجاع خطأ (رفض التنبؤ). كتب DataRobot وثائق حول الإنسان في الحلقة ، لكنني لم أجد أي تطبيق على موقعهم بخلاف قواعد التواضع.
Google Cloud Human-in-the-Loop
تقدم Google Cloud معالجة Human-in-the-Loop (HITL) المدمجة في خدمات Document AI ، ولكن كما في حالة هذه الكتابة ، لا شيء لمعالجة الصور أو الفيديو. حاليًا ، تدعم Google سير عمل مراجعة HITL للمعالجات التالية:
معالجات الطلب:
الفواتير
الإيصالات
معالجات القروض:
1003 محلل
1040 المحلل اللغوي
محلل 1040 الجدول ج
1040 الجدول E Parser
محلل 1099-DIV
1099-G محلل
محلل 1099-INT
محلل 1099-MISC
محلل كشف الحساب البنكي
بيان محلل بواسطة محلل HOA
مستخلص الرهن محلل
محلل قسيمة الدفع
محلل التقاعد / بيان الاستثمار
محلل W2
W9 المحلل اللغوي
برامج الخدمة البشرية
قد يكون من الصعب تكوين التعليقات التوضيحية للصورة البشرية ، مثل تصنيف الصور واكتشاف الكائنات والتجزئة الدلالية ، لتسمية مجموعات البيانات. لحسن الحظ ، هناك العديد من الأدوات التجارية والمفتوحة المصدر الجيدة التي يمكن لواضعي العلامات استخدامها.
Humans in the Loop ، وهي شركة تصف نفسها على أنها “مؤسسة اجتماعية تقدم حلولًا أخلاقية للقوى العاملة لدعم صناعة الذكاء الاصطناعي ،” تدون بشكل دوري حول أدوات التعليقات التوضيحية المفضلة لديها. في أحدث هذه الإدخالات ، قاموا بإدراج 10 أدوات شرح توضيحي مفتوحة المصدر لرؤية الكمبيوتر: Label Studio و Diffgram و LabelImg و CVAT و ImageTagger و LabelMe و VIA و Make Sense و COCO Annotator و DataTurks. غالبًا ما تُستخدم هذه الأدوات لإضافة تعليقات توضيحية لمجموعات التدريب ، ويمكن لبعضها إدارة مجموعات التعليقات التوضيحية.
على سبيل المثال ، تتميز أداة التعليق التوضيحي لرؤية الكمبيوتر (CVAT) بوظائف قوية ومحدثة وتعمل في Chrome. لا تزال إحدى الأدوات الرئيسية التي نستخدمها نحن وعملائنا في وضع العلامات ، نظرًا لأنها أسرع بكثير من العديد من الأدوات في السوق “.
يكتب CVAT README على GitHub ، “CVAT هو أداة مجانية للتعليقات التوضيحية للصور ومقاطع فيديو تفاعلية تعتمد على الويب من أجل رؤية الكمبيوتر. يتم استخدامه من قبل فريقنا للتعليق على ملايين الكائنات ذات الخصائص المختلفة. تستند العديد من قرارات واجهة المستخدم وتجربة المستخدم إلى التعليقات الواردة من فرق التعليقات التوضيحية للبيانات المحترفة. جربه عبر الإنترنت على cvat.org ”. من الضروري إنشاء تسجيل دخول لتشغيل العرض التوضيحي.
تم إصدار CVAT كمصدر مفتوح بموجب ترخيص MIT. يعمل معظم الملتزمون النشطون لشركة Intel في نيجني نوفغورود ، روسيا. يوضح الفيديو التمهيدي لـ CVAT كيف تعمل عملية وضع العلامات.
كما ترى ، يمكن أن تساهم معالجة الحلقة البشرية في عملية التعلم الآلي عند نقطتين: الإنشاء الأولي لمجموعات البيانات الموسومة للتعلم الخاضع للإشراف ، ومراجعة وتصحيح التنبؤات التي يحتمل أن تكون إشكالية عند تشغيل النموذج. تساعد حالة الاستخدام الأولى على تمهيد النموذج وتساعد الحالة الثانية على ضبط النموذج.
المصدر: InfoWorld