WaveNetEQ využíva knižnicu s rečovými dátami na realistické vyplnenie krátkych segmentov v konverzácii. Umelá inteligencia je trénovaná tak, aby produkovala zvuky slabík, pričom dokáže vyplniť medzery do 120 milisekúnd.
Firma prichádza s novinkou v čase, keď ľudia v dôsledku šírenia koronavírusu začali oveľa viac využívať na komunikáciu z karantény práve videohovory.
Pri telefonovaní cez internet sú dáta rozdelené na takzvané pakety. Zlé internetové pripojenie môže zapríčiniť, že pakety sa nedostanú k prijímateľovi v správnom poradí a čase, alebo o ne môže prísť úplne. To môže spôsobiť výrazný pokles kvality hovoru.
Google uviedol, že 99 percent hovorov prostredníctvom aplikácie Duo je poznačených problémami so zvukom. WaveNetHQ pracuje tak, že vyplní konkrétne rečové dáta v medzerách spôsobených výpadkami zvuku.
Pri tvorbe systému použili hlasy sto ľudí v 48 jazykoch, aby sa dokázal čo najlepšie naučiť charakteristiky ľudského hlasu. Systém je v súčasnosti dostupný pre smartfón Pixel 4, no tento rok ho firma plánuje rozšíriť pre ďalšie zariadenia s Androidom.
Google zároveň potvrdil, že nový systém je chránený pred zneužitím údajov treťou stranou.