AI kompüter nitqini necə daha təbii edə bilər

Mündəricat:

AI kompüter nitqini necə daha təbii edə bilər
AI kompüter nitqini necə daha təbii edə bilər
Anonim

Əsas Çıxarışlar

  • Şirkətlər kompüter tərəfindən yaradılan nitqin daha realist olması üçün yollar tapmaq üçün yarışır.
  • NVIDIA bu yaxınlarda öz səsinizlə süni intellekt öyrətməyə imkan verməklə təbii nitqin səsini çəkə bilən alətlər təqdim etdi.
  • İntonasiya, emosiya və musiqililik kompüter səslərində hələ də çatışmayan xüsusiyyətlərdir.
Image
Image

Kompüter tərəfindən yaradılan nitq tezliklə daha insani səslənə bilər.

Kompüter hissələri istehsalçısı NVIDIA bu yaxınlarda sizin səsinizlə süni intellekt öyrətməyə imkan verməklə təbii nitqin səsini çəkə bilən alətlər təqdim etdi. Proqram həmçinin bir natiqin sözlərini başqasının səsindən istifadə edərək çatdıra bilər. Bu, kompüter nitqini daha reallaşdırmaq üçün inkişaf edən təkanların bir hissəsidir.

"Qabaqcıl səsli AI texnologiyası istifadəçilərə təbii danışmağa imkan verir, bir çox sorğuları bir cümlədə birləşdirərək və orijinal sorğudakı təfərrüatları daim təkrarlamaq ehtiyacını aradan qaldırır," Michael Zagorsek, nitqin tanınması şirkətinin baş əməliyyat direktoru SoundHound, Lifewire-a e-poçt müsahibəsində bildirib.

"Artıq əksər səsli AI platformalarında mövcud olan çoxsaylı dillərin əlavə edilməsi rəqəmsal səsli köməkçiləri daha çox coğrafiyada və daha çox əhali üçün əlçatan edir" deyə o əlavə edib.

Robonitq yüksəlir

Amazon-un Alexa və Apple-ın Siri, hətta on il əvvəlki kompüter nitqindən qat-qat yaxşı səslənir, lakin onlar tezliklə həqiqi insan səsləri ilə səhv salınmayacaqlar.

Süni nitqin daha təbii səslənməsi üçün NVIDIA-nın mətndən nitqə tədqiqat qrupu RAD-TTS modelini hazırlayıb. Sistem fərdlərə səs sürəti, tonallıq, tembr və digər amillər daxil olmaqla mətndən nitqə (TTS) modelini öyrətməyə imkan verir.

Şirkət I Am AI video seriyası üçün daha çox danışıq xarakterli səsli hekayə yaratmaq üçün yeni modelindən istifadə etdi.

"Bu interfeys ilə video prodüserimiz video skripti oxuyarkən özünü yaza bilər və sonra nitqini qadın danışanın səsinə çevirmək üçün AI modelindən istifadə edə bilər. səs aktyoru - konkret sözləri vurğulamaq üçün sintez edilmiş nitqi düzəldir və videonun tonunu daha yaxşı ifadə etmək üçün rəvayətin tempini dəyişdirir ", NVIDIA öz saytında yazıb.

Səsləndiyindən Daha Çətin

Kompüter tərəfindən yaradılan nitqin təbii səslənməsi çətin bir problemdir, ekspertlər deyirlər.

"Siz onun kompüter versiyasını yaratmaq üçün yüzlərlə saat kiminsə səsini yazmalısınız", - "Kukarella" mətndən nitq proqramı şirkətinin baş direktoru Nazim Rəhimov Lifewire-a e-poçt müsahibəsində bildirib. “Və səsyazma yüksək keyfiyyətli, peşəkar studiyada yazılmalıdır. Nə qədər çox saat keyfiyyətli nitq yüklənsə və işlənsə, nəticə bir o qədər yaxşı olar."

Mətndən nitqə oyunda, səs qüsuru olan şəxslərə kömək etmək və ya istifadəçilərə öz səsləri ilə dillər arasında tərcümə etməyə kömək etmək üçün istifadə edilə bilər.

İntonasiya, emosiya və musiqililik kompüter səslərində hələ də çatışmayan xüsusiyyətlərdir.

Əgər süni intellekt bu çatışmayan keçidləri əlavə edə bilsə, kompüter tərəfindən yaradılan nitq "həqiqi aktyorların səslərindən fərqlənməyəcək" dedi. "Bu, davam edən işdir. Digər səslər radio aparıcıları ilə rəqabət apara biləcək. Tezliklə siz oxuya bilən və audiokitab oxuya bilən səslər görəcəksiniz."

Nitq texnologiyası geniş çeşiddə biznesdə daha populyarlaşır.

"Avtomobil sənayesi daha təhlükəsiz və daha əlaqəli sürücülük təcrübələri yaratmaq üçün səsli süni intellektdən son zamanlar mənimsəyir," Zaqorsek bildirib.

"O vaxtdan bəri, brendlər müştərilərin təcrübələrini yaxşılaşdırmaq və məhsul və xidmətləri ilə qarşılıqlı əlaqədə daha asan, təhlükəsiz, daha rahat, səmərəli və gigiyenik üsullara olan tələbi ödəmək yollarını axtardıqları üçün səsli köməkçilər getdikcə daha çox istifadə olunur."

Adətən, səsli süni intellekt avtomatik nitqin tanınması (ASR) istifadə edərək nitqi mətnə köçürməklə və sonra həmin mətni təbii dil anlayışı (NLU) modelinə çatdırmaqla başlayan iki addımlı prosesdə sorğuları cavablara çevirir.

Image
Image

SoundHound-un yanaşması real vaxtda nitqi izləmək üçün bu iki addımı bir prosesdə birləşdirir. Şirkət iddia edir ki, bu texnika səsli köməkçilərə istifadəçi sorğularının mənasını hətta şəxs danışmağı bitirməzdən əvvəl başa düşməyə imkan verir.

Kompüter nitqində gələcək irəliləyişlər, o cümlədən yalnız quraşdırılmış (bulud bağlantısı tələb olunmur) hibrid (yerləşdirilmiş plus bulud) və yalnız bulud "arasında müxtəlif əlaqə seçimlərinin mövcudluğu bütün sənayelər üzrə şirkətlərə daha çox seçim verəcəkdir. qiymət, məxfilik və emal gücünün mövcudluğu baxımından "dedi Zagoresk.

NVIDIA bildirib ki, onun xəbərləri AI modelləri səsvermə işindən kənara çıxır.

"Mətndən nitqə oyunda, səs çatışmazlığı olan şəxslərə kömək etmək və ya istifadəçilərə öz səsləri ilə dillər arasında tərcümə etməyə kömək etmək üçün istifadə edilə bilər", - şirkət yazıb. "O, hətta mahnının melodiyasına deyil, həm də vokalın arxasındakı emosional ifadəyə uyğun gələn məşhur müğənnilərin çıxışlarını yenidən yarada bilər."

Tövsiyə: