Tezliklə, Siz Kompüterlə Danışdığınızı Bilməyəcəksiniz

Mündəricat:

Tezliklə, Siz Kompüterlə Danışdığınızı Bilməyəcəksiniz
Tezliklə, Siz Kompüterlə Danışdığınızı Bilməyəcəksiniz
Anonim

Əsas Çıxarışlar

  • Kompüter tərəfindən yaradılan nitqi realdan ayıra bilməyəcəyiniz gün sürətlə yaxınlaşır.
  • Google bu yaxınlarda daha təbii söhbətlərə imkan verə biləcək model olan LaMDA-nı təqdim etdi.
  • İnsan kimi nitq yaratmaq həm də böyük miqdarda emal gücü tələb edir.
Image
Image

Hal-hazırda, kompüterlə danışdığınız zaman bunu demək asandır, lakin bu, AI-dəki son irəliləyişlər sayəsində tezliklə dəyişə bilər.

Google bu yaxınlarda LaMDA-nı təqdim etdi, şirkətin iddia etdiyinə görə, onun danışıq süni intellekt köməkçilərinin qabiliyyətini artıra və daha təbii söhbətlərə imkan verə bilər. LaMDA hər hansı bir təlim olmadan demək olar ki, hər şey haqqında normal söhbət etməyi hədəfləyir.

Bu, insanla danışıb-danışmadığınızı düşünməyə vadar edən süni intellekt layihələrindən biridir.

"Mənim təxminlərimə görə, növbəti 12 ay ərzində istifadəçilər bu yeni, daha emosional səslərə məruz qalmağa və onlara öyrəşməyə başlayacaqlar," Ceyms Kaplan, danışıq süni intellekt virtual səs köməkçisi və axtarışı olan MeetKai şirkətinin baş direktoru mühərrik, e-poçt müsahibəsində deyilir.

"Bu baş verəndən sonra bugünkü sintez edilmiş nitq istifadəçilərə 2000-ci illərin əvvəllərindəki nitq kimi səslənəcək."

Xarakterli Səsli Köməkçilər

Google-un LaMDA-sı Google Research tərəfindən icad edilmiş neyron şəbəkə arxitekturası olan Transformer üzərində qurulub. Digər dil modellərindən fərqli olaraq, Google-un LaMDA-sı real dialoq üzrə təlim keçmişdir.

Təbii səslənən süni intellekt nitqinin hazırlanmasında çətinliklərin bir hissəsi söhbətlərin açıq ucluq xarakteridir, Google-dan Eli Collins bloq yazısında yazdı.

Image
Image

"Dostunuzla televiziya şousu haqqında söhbət, həmin ölkənin ən yaxşı regional mətbəxi ilə bağlı mübahisəyə başlamazdan əvvəl verilişin çəkildiyi ölkə haqqında müzakirəyə çevrilə bilər" dedi.

Robot nitqi ilə işlər sürətlə gedir. Danışıq süni intellektinə sərmayə qoyan Tsingyuan Ventures şirkətinin idarəedici partnyoru Erik Rosenblum bildirib ki, kompüterlə nitqdə ən fundamental problemlərdən bəziləri faktiki olaraq həll olunub.

Məsələn, Otter.ai proqram təminatı tərəfindən edilən transkripsiyalar və ya DeepScribe tərəfindən götürülən tibbi qeydlər kimi xidmətlərdə nitqi başa düşməkdə dəqiqlik dərəcəsi artıq olduqca yüksəkdir.

"Növbəti sərhəd daha çətin olsa da," o əlavə etdi.

"Təbii dilin işlənməsindən xeyli kənara çıxan bir problem olan kontekst anlayışını saxlamaq və insanlarla qarşılıqlı əlaqədə olan kompüterlər kimi empatiya məyusluq, qəzəb, səbirsizlik və s. anlamalıdır. Bu məsələlərin hər ikisi üzərində işləyir, lakin hər ikisi qənaətbəxş deyil."

Neyron Şəbəkələr Açardır

Həyata bənzər səslər yaratmaq üçün şirkətlər dərin neyron şəbəkələri kimi texnologiyadan, məlumatları təbəqələr vasitəsilə təsnif edən maşın öyrənməsi formasından istifadə edirlər, Matt Muldoon, ReadSpeaker-ın Şimali Amerika prezidenti, mətndən nitqə proqram təminatı hazırlayan şirkət, e-poçt müsahibəsində bildirib.

"Bu təbəqələr siqnalı dəqiqləşdirir, onu daha mürəkkəb təsnifatlara ayırır", - o əlavə edib. "Nəticə, insan kimi qeyri-adi səslənən sintetik nitqdir."

İnkişaf mərhələsində olan başqa bir texnologiya, bir mətndən nitqə səsin səsini digərinin danışıq tərzi ilə birləşdirən Prosody Transferdir, Muldoon bildirib. Yeni neyron mətndən nitqə səs yaratmaq üçün lazım olan təlim məlumatlarının miqdarını azaldan köçürmə öyrənməsi də var.

Kaplan deyir ki, insana bənzər nitq yaratmaq həm də çox böyük emal gücü tələb edir. Şirkətlər adi prosessorlarla birlikdə işləyən fərdi modullar olan neyron sürətləndirici çiplər hazırlayır.

"Bunun növbəti mərhələsi bu çipləri daha kiçik aparatlara yerləşdirmək olacaq, çünki hal-hazırda bu, görmə üçün süni intellekt tələb olunduqda kameralar üçün artıq edilir" dedi. "Bu cür hesablama qabiliyyətinin qulaqlıqların özündə mövcud olması çox çəkməyəcək."

Süqəni süni intellektə əsaslanan nitqi inkişaf etdirmək üçün bir problem hər kəsin fərqli danışmasıdır, ona görə də kompüterlər bizi başa düşməkdə çətinlik çəkirlər.

"Fikirləşin ki, Corciya vs Boston vs Şimali Dakota vurğuları və ingilis dili sizin əsas diliniz olub-olmamasıdır," MDinc-də səsli axtarış analitikası üzərində işləyən Monika Dema e-poçtda bildirib. "Qlobal olaraq düşünsək, bunu Almaniya, Çin və Hindistanın bütün regionları üçün etmək baha başa gəlir, lakin bu, bunun mümkün olmadığı və ya edilə bilməyəcəyi anlamına gəlmir."

Tövsiyə: