Əsas Çıxarışlar
- Tədqiqatçılar deyirlər ki, onlar süni intellektə baxaraq və dinləyərək videoları etiketləməyi öyrədə bilərlər.
- Süni intellekt sistemi vizual və audio data arasında paylaşılan anlayışları tutmaq üçün məlumatları təmsil etməyi öyrənir.
-
Bu, süni intellektə insanların öyrənməkdə çətinlik çəkmədiyi, lakin kompüterlərin qavramaqda çətinlik çəkdiyi anlayışları başa düşməyi öyrətmək səyinin bir hissəsidir.
Yeni süni intellekt sistemi (AI) videolarınıza baxa, dinləyə və baş verənləri etiketləyə bilər.
MIT tədqiqatçıları süni intellektə video və audio arasında paylaşılan hərəkətləri çəkməyi öyrədən texnika hazırlayıblar. Məsələn, onların metodu anlaya bilər ki, videoda ağlayan körpənin hərəkəti səs klipində deyilən “ağlama” sözü ilə bağlıdır. Bu, süni intellektə insanların öyrənməkdə çətinlik çəkmədiyi, lakin kompüterlərin qavramaqda çətinlik çəkdiyi anlayışları başa düşməyi öyrətmək səylərinin bir hissəsidir.
"Ümumi öyrənmə paradiqması, nəzarət edilən öyrənmə, yaxşı təsvir edilmiş və tamamlanan məlumat dəstləriniz olduqda yaxşı işləyir", - AI mütəxəssisi Phil Winder Lifewire-a e-poçt müsahibəsində bildirib. "Təəssüf ki, verilənlər dəstləri nadir hallarda tamamlanır, çünki real dünyada yeni vəziyyətlər təqdim etmək kimi pis vərdiş var."
Daha Ağıllı AI
Kompüterlər gündəlik ssenariləri başa düşməkdə çətinlik çəkirlər, çünki onlar insanlar kimi səs və şəkillərdən daha çox məlumatları sındırmalıdırlar. Maşın bir fotoşəkili "gördükdə" həmin şəkli təsvirin təsnifatı kimi tapşırıqları yerinə yetirmək üçün istifadə edə biləcəyi məlumatlara kodlamalıdır. Daxiletmələr videolar, audio kliplər və şəkillər kimi bir çox formatda olduqda süni intellekt zəifləyə bilər.
"Burada əsas problem odur ki, maşın bu müxtəlif üsulları necə uyğunlaşdıra bilər? İnsanlar olaraq bu, bizim üçün asandır," MIT tədqiqatçısı və mövzu ilə bağlı məqalənin ilk müəllifi Alexander Liu öz çıxışında dedi. xəbər buraxılışı. "Biz bir avtomobil görürük və sonra keçən avtomobilin səsini eşidirik və bunların eyni şey olduğunu bilirik. Lakin maşın öyrənməsi üçün bu o qədər də sadə deyil."
Liu komandası vizual və audio data arasında paylaşılan anlayışları tutmaq üçün məlumatları təmsil etməyi öyrəndiyini söyləyən AI texnikası inkişaf etdirdi. Bu bilikdən istifadə edərək, onların maşın öyrənmə modeli videoda konkret hərəkətin harada baş verdiyini müəyyən edə və onu etiketləyə bilər.
Yeni model videolar və onlara uyğun mətn başlıqları kimi xam məlumatları götürür və videodakı obyektlər və hərəkətlər haqqında xüsusiyyətlər və ya müşahidələri çıxararaq onları kodlaşdırır. Daha sonra bu məlumat nöqtələrini yerləşdirmə məkanı kimi tanınan şəbəkədə xəritələşdirir. Model oxşar məlumatları şəbəkədə tək nöqtələr kimi birləşdirir; bu məlumat nöqtələrinin və ya vektorlarının hər biri fərdi sözlə təmsil olunur.
Məsələn, hoqqabazlıq edən şəxsin videoklipi "hoqqa" etiketli vektorla əlaqələndirilə bilər.
Tədqiqatçılar modeli elə hazırlayıblar ki, vektorları etiketləmək üçün yalnız 1000 sözdən istifadə edə bilsin. Model hansı hərəkətləri və ya konsepsiyaları bir vektorda kodlaşdırmaq istədiyinə qərar verə bilər, lakin o, yalnız 1000 vektordan istifadə edə bilər. Model datanı ən yaxşı ifadə etdiyi sözləri seçir.
"Əgər donuzlar haqqında video varsa, model 1000 vektordan birinə "donuz" sözünü təyin edə bilər. Daha sonra model audio klipdə kiminsə "donuz" sözünü dediyini eşidirsə, onu kodlaşdırmaq üçün yenə də eyni vektordan istifadə etməlidir," Liu izah etdi.
Videolarınız, Şifrə Açıldı
MIT tərəfindən hazırlanmış kimi daha yaxşı etiketləmə sistemləri süni intellektdə qərəzliyi az altmağa kömək edə bilər, biometrik firma Innovatrics-in tədqiqat və inkişaf rəhbəri Marian Beszedes Lifewire-a e-poçt müsahibəsində deyib. Beszedes, məlumat sənayesinin süni intellekt sistemlərinə istehsal prosesi perspektivindən baxa biləcəyini təklif etdi.
"Sistemlər xam məlumatları giriş (xammal) kimi qəbul edir, əvvəlcədən emal edir, qəbul edir, qərarlar və ya proqnozlar verir və analitik çıxışlar (hazır məhsullar) verir", - Beszedes bildirib. "Biz bu proses axınına "məlumat fabriki" deyirik və digər istehsal prosesləri kimi, keyfiyyətə nəzarət edilməlidir. Məlumat sənayesi süni intellektə meylini keyfiyyət problemi kimi qəbul etməlidir.
"İstehlakçı nöqteyi-nəzərindən yanlış etiketlənmiş məlumatlar, məsələn, xüsusi şəkillər/videolar üçün onlayn axtarışı çətinləşdirir," Beszedes əlavə edib. "Düzgün inkişaf etmiş süni intellekt ilə siz etiketləməni avtomatik, daha sürətli və əl ilə etiketləmə ilə müqayisədə daha neytral edə bilərsiniz."
Lakin MIT modelinin hələ də bəzi məhdudiyyətləri var. Birincisi, onların tədqiqatları eyni anda iki mənbədən alınan məlumatlara yönəldi, lakin real dünyada insanlar eyni vaxtda bir çox məlumat növü ilə qarşılaşırlar, Liu dedi
"Və biz bilirik ki, 1000 söz bu cür verilənlər bazası üzərində işləyir, lakin onun real dünya problemi üçün ümumiləşdirilə biləcəyini bilmirik," Liu əlavə etdi.
MIT tədqiqatçıları deyirlər ki, onların yeni texnikası bir çox oxşar modelləri üstələyir. Əgər süni intellekt videoları başa düşmək üçün öyrədilə bilərsə, siz nəhayət dostunuzun tətil videolarına baxmağı atlaya və əvəzində kompüter tərəfindən yaradılmış hesabat əldə edə bilərsiniz.