Tech

Így tudjuk eltenni a hangunkat az örökkévalóságnak

Most már bárki el tudja raktároztatni a hangját, otthonról, ráadásul ingyen

Az Acapela negyed százada foglalkozik azzal, hogy leírt szövegből beszélt hangokat képezzen gépi úton, ám az elmúlt években a mesterséges intelligenciának köszönhetően ez a terület is komoly fejlődésen ment keresztül – írta meg a raketa.hu

Így tudjuk eltenni a hangunkat az örökkévalóságnak
Képünk illusztráció
Fotó: NorthFoto

A TechCrunch-on olvasható hír szerint korábban nyolc órát vett igénybe, mire elég hangmintája volt a cégnek egy-egy betegtől. Ma ugyanezt már ötven rövidke mondat felolvastatásával, nagyjából tíz perc alatt meg tudják oldani. „Egyértelműen forradalom zajlik a (mesterséges intelligencia kialakításához használt) neurális hálózatokon alapuló »szövegből hang« rendszereknél” – idézi Remy Cadic alapítót a lap.

A Microsoft olyan hatékony hanghamisító szoftvert készített, hogy inkább nem hozza nyilvánosságra azt; a VALL-E nevű szoftvernek elég egy három másodperces hangminta és máris tudja utánozni szinte bárkinek a hangját.

Míg a Microsoftnál elsősorban a kísérletezés állhatott a projekt hátterében, az Acapela „My own voice” (a saját hangom) szolgáltatása a degeneratív betegséggel küzdőkön hivatott segíteni.

Amennyiben később romlana a betegek állapota, akkor egy ilyen rendszer, a megfelelő hardverekkel párosítva, rengeteg helyzetben könnyítheti meg a mindennapjaikat. A cégnél még arra is ügyeltek, hogy gyerekek is könnyen tudják használni a szoftvert, illetve, hogy az ő esetükben is valósághű hangokat legyen képes generálni a program.

Mi is kipróbáltuk a My own voice-t, és ugyan a folyamat nem teljesen magától értetődő, de a kisebb akadályokat könnyen meg lehet ugrani. Ilyen például az, hogy a regisztrációk jóváhagyása még kézzel történik, így némi időt vesz igénybe, vagy hogy a felvételek kezelőfelülete helyenként akadozik. A szoftver valamivel több mint húsz nyelvet kezel, köztük a régióból a csehet és a lengyelt is, a magyart azonban egyelőre nem.

Aki talál olyan nyelvet, amelyet beszél, az az ígéreteknek megfelelően nagyjából tíz perc alatt végezhet is a felolvasással. Miután jóváhagyta a felvételeit, e-mailen kap értesítést arról, hogy elkezdheti próbálgatni a szintetikus hangját. Erre nekünk körülbelül fél napot kellett várnunk, azóta egy egyértelműen mesterségesen csengő, de a hangszínünket, hanglejtésünket igen jól imitáló rendszert tesztelhetünk szabadon; fizetni csak akkor kéne, ha később valóban szükség lenne az elkészült mesterséges hangra, és le akarnánk azt tölteni az erre a célra szolgáló kütyükre.

Kapcsolódó írásaink