AI İndi Videolarınızı Baxaraq Anlaya bilir

2025 Müəllif: Abigail Brown | [email protected]. Son dəyişdirildi: 2025-01-24 12:01

Əsas Çıxarışlar

Tədqiqatçılar deyirlər ki, onlar süni intellektə baxaraq və dinləyərək videoları etiketləməyi öyrədə bilərlər.
Süni intellekt sistemi vizual və audio data arasında paylaşılan anlayışları tutmaq üçün məlumatları təmsil etməyi öyrənir.
Bu, süni intellektə insanların öyrənməkdə çətinlik çəkmədiyi, lakin kompüterlərin qavramaqda çətinlik çəkdiyi anlayışları başa düşməyi öyrətmək səyinin bir hissəsidir.

Yeni süni intellekt sistemi (AI) videolarınıza baxa, dinləyə və baş verənləri etiketləyə bilər.

MIT tədqiqatçıları süni intellektə video və audio arasında paylaşılan hərəkətləri çəkməyi öyrədən texnika hazırlayıblar. Məsələn, onların metodu anlaya bilər ki, videoda ağlayan körpənin hərəkəti səs klipində deyilən “ağlama” sözü ilə bağlıdır. Bu, süni intellektə insanların öyrənməkdə çətinlik çəkmədiyi, lakin kompüterlərin qavramaqda çətinlik çəkdiyi anlayışları başa düşməyi öyrətmək səylərinin bir hissəsidir.

"Ümumi öyrənmə paradiqması, nəzarət edilən öyrənmə, yaxşı təsvir edilmiş və tamamlanan məlumat dəstləriniz olduqda yaxşı işləyir", - AI mütəxəssisi Phil Winder Lifewire-a e-poçt müsahibəsində bildirib. "Təəssüf ki, verilənlər dəstləri nadir hallarda tamamlanır, çünki real dünyada yeni vəziyyətlər təqdim etmək kimi pis vərdiş var."

Daha Ağıllı AI

Kompüterlər gündəlik ssenariləri başa düşməkdə çətinlik çəkirlər, çünki onlar insanlar kimi səs və şəkillərdən daha çox məlumatları sındırmalıdırlar. Maşın bir fotoşəkili "gördükdə" həmin şəkli təsvirin təsnifatı kimi tapşırıqları yerinə yetirmək üçün istifadə edə biləcəyi məlumatlara kodlamalıdır. Daxiletmələr videolar, audio kliplər və şəkillər kimi bir çox formatda olduqda süni intellekt zəifləyə bilər.

"Burada əsas problem odur ki, maşın bu müxtəlif üsulları necə uyğunlaşdıra bilər? İnsanlar olaraq bu, bizim üçün asandır," MIT tədqiqatçısı və mövzu ilə bağlı məqalənin ilk müəllifi Alexander Liu öz çıxışında dedi. xəbər buraxılışı. "Biz bir avtomobil görürük və sonra keçən avtomobilin səsini eşidirik və bunların eyni şey olduğunu bilirik. Lakin maşın öyrənməsi üçün bu o qədər də sadə deyil."

Liu komandası vizual və audio data arasında paylaşılan anlayışları tutmaq üçün məlumatları təmsil etməyi öyrəndiyini söyləyən AI texnikası inkişaf etdirdi. Bu bilikdən istifadə edərək, onların maşın öyrənmə modeli videoda konkret hərəkətin harada baş verdiyini müəyyən edə və onu etiketləyə bilər.

Yeni model videolar və onlara uyğun mətn başlıqları kimi xam məlumatları götürür və videodakı obyektlər və hərəkətlər haqqında xüsusiyyətlər və ya müşahidələri çıxararaq onları kodlaşdırır. Daha sonra bu məlumat nöqtələrini yerləşdirmə məkanı kimi tanınan şəbəkədə xəritələşdirir. Model oxşar məlumatları şəbəkədə tək nöqtələr kimi birləşdirir; bu məlumat nöqtələrinin və ya vektorlarının hər biri fərdi sözlə təmsil olunur.

Məsələn, hoqqabazlıq edən şəxsin videoklipi "hoqqa" etiketli vektorla əlaqələndirilə bilər.

Tədqiqatçılar modeli elə hazırlayıblar ki, vektorları etiketləmək üçün yalnız 1000 sözdən istifadə edə bilsin. Model hansı hərəkətləri və ya konsepsiyaları bir vektorda kodlaşdırmaq istədiyinə qərar verə bilər, lakin o, yalnız 1000 vektordan istifadə edə bilər. Model datanı ən yaxşı ifadə etdiyi sözləri seçir.

"Əgər donuzlar haqqında video varsa, model 1000 vektordan birinə "donuz" sözünü təyin edə bilər. Daha sonra model audio klipdə kiminsə "donuz" sözünü dediyini eşidirsə, onu kodlaşdırmaq üçün yenə də eyni vektordan istifadə etməlidir," Liu izah etdi.

Videolarınız, Şifrə Açıldı

MIT tərəfindən hazırlanmış kimi daha yaxşı etiketləmə sistemləri süni intellektdə qərəzliyi az altmağa kömək edə bilər, biometrik firma Innovatrics-in tədqiqat və inkişaf rəhbəri Marian Beszedes Lifewire-a e-poçt müsahibəsində deyib. Beszedes, məlumat sənayesinin süni intellekt sistemlərinə istehsal prosesi perspektivindən baxa biləcəyini təklif etdi.

"Sistemlər xam məlumatları giriş (xammal) kimi qəbul edir, əvvəlcədən emal edir, qəbul edir, qərarlar və ya proqnozlar verir və analitik çıxışlar (hazır məhsullar) verir", - Beszedes bildirib. "Biz bu proses axınına "məlumat fabriki" deyirik və digər istehsal prosesləri kimi, keyfiyyətə nəzarət edilməlidir. Məlumat sənayesi süni intellektə meylini keyfiyyət problemi kimi qəbul etməlidir.

"İstehlakçı nöqteyi-nəzərindən yanlış etiketlənmiş məlumatlar, məsələn, xüsusi şəkillər/videolar üçün onlayn axtarışı çətinləşdirir," Beszedes əlavə edib. "Düzgün inkişaf etmiş süni intellekt ilə siz etiketləməni avtomatik, daha sürətli və əl ilə etiketləmə ilə müqayisədə daha neytral edə bilərsiniz."

Lakin MIT modelinin hələ də bəzi məhdudiyyətləri var. Birincisi, onların tədqiqatları eyni anda iki mənbədən alınan məlumatlara yönəldi, lakin real dünyada insanlar eyni vaxtda bir çox məlumat növü ilə qarşılaşırlar, Liu dedi

"Və biz bilirik ki, 1000 söz bu cür verilənlər bazası üzərində işləyir, lakin onun real dünya problemi üçün ümumiləşdirilə biləcəyini bilmirik," Liu əlavə etdi.

MIT tədqiqatçıları deyirlər ki, onların yeni texnikası bir çox oxşar modelləri üstələyir. Əgər süni intellekt videoları başa düşmək üçün öyrədilə bilərsə, siz nəhayət dostunuzun tətil videolarına baxmağı atlaya və əvəzində kompüter tərəfindən yaradılmış hesabat əldə edə bilərsiniz.

Tövsiyə:

AI İndi Videolarınızı Baxaraq Anlaya bilir

Mündəricat:

Əsas Çıxarışlar

Daha Ağıllı AI

Videolarınız, Şifrə Açıldı

Tövsiyə:

Telefon operatorunuz sizin haqqınızda çox şey bilir, ekspertlər deyir

Google Haqqımda Nə Bilir?

Maşınınız Haqqınızda Hər Şeyi Bilir. Hər şey

HP-nin Yeni VR Qulaqlıq Nə Zaman Diqqət Etdiyinizi Bilir

Alexa Kitabları Oxuya bilir: Sevimlilərinizi necə dinləmək olar

Çipset Soyuducu Quraşdırılır

Google Cədvəldə ARRAYFORMULA-dan Necə İstifadə Edilir

Apple Watch App Store-dan necə istifadə etməli

MHL: Bu nədir və onu necə istifadə etmək olar

Kompüterdə Video və ya TV Çəkmə Kartını quraşdırın və konfiqurasiya edin

Minecraft-da necə ev tikmək olar

Huawei Watch 3 HarmonyOS ilə Başlanacaq

14 iPhone və ya iPad-inizi Möhtəşəm edən iOS 11 Xüsusiyyətləri

AccessFind İnterneti necə daha əlçatan edə bilər

Şəbəkənizi İctimai Şəbəkəyə Necə Dəyişdirmək olar

Twitter Lentinizdə Öz Tweetlərinizi Necə Axtarırsınız

Apple MacBook Pro 13-düym (M1, 2020) İcmal: Yeni CPU Oyunu Dəyişir

Sürüşməni iPhone-da Gmail-i silmək və ya arxivləşdirmək üçün necə qurmaq olar

HDMP Faylı (Bu nədir və Necə Açılır)

Tilde İşarəsini Necə Yazmaq olar