Ďalší významný míľnik vo vývoji umelej inteligencie.
Nedávno nám Google predviedol, ako znie syntetický hlas, ktorý vytvorí počítač, a dnes tu máme niečo, čo ho dokáže nielen vytvoriť, ale aj naozaj dôveryhodne okopírovať. A všetko, čo na to softvér Lyrebird s kapacitami umelej inteligencie od kanadského startupu potrebuje, je audio nahrávka s dĺžkou aspoň 60 sekúnd.
Presne tak, stačí mu presne jedna minúta, aby dokázal strašidelne realisticky napodobniť akýkoľvek ľudský hlas a vytvoriť z neho monológ alebo dialóg, píše web The Verge. "Pár rokov dozadu to bolo nemožné, avšak analytické schopnosti strojového učenia dokázali, že sú perfektné pre idiosynkráziu ľudskej reči."
Lyrebird claims it can recreate any voice using just one minute of sample audiohttps://t.co/csz1N6lpv7 pic.twitter.com/hj5fcu0DAY
— The Verge (@verge) 25. apríla 2017
Pre porovnanie, aký úspech rovnomenný startup dosiahol, môžeme použiť prototyp softvéru od Adobe, takzvaný Project VoCo. Ten predstavuje akýsi Photoshop na úpravu hlasu a aby sme s jeho pomocou mohli napodobniť niekoho hlas, musíme najskôr zohnať až 20 minútový záznam.
"Nahraj 1 minútu niekoho hlasu a Lyrebird môže komprimovať jeho/jej DNA hlasu do unikátneho kľúču. Tento kľúč použije na generovanie čohokoľvek s príslušným hlasom."
A new Canadian startup called Lyrebird aims to replicate people's voices using AI. @AnnieGaus has the story: https://t.co/TVC2ATpgA4 pic.twitter.com/S9ywepy9zw
— Anchor (@anchor) 25. apríla 2017
Softvér Lyrebird pozostáva zo súboru niekoľkých algoritmov, bez ktorých by táto unikátna funkcionalita nefungovala. A keďže využíva prvky strojového učenia, časom sa bude v napodobňovaní zdokonalovať, až príde do bodu, kedy hlasové kópie nerozpoznáme od originálu.
Pokiaľ ťa zaujíma viac, tak niekoľko autentických príkladov nájdeš nižšie. Zaujímavý je najmä rozhovor medzi bývalým americkým prezidentom Obamom a tým súčasným, čiže s Trumpom.