Vedci už vedia rozpoznať zvuk aj bez mikrofónu. Pomocou kamery

Vedcom z inštitútu MIT sa pomocou algoritmu a špeciálnej kamery podarilo rozpoznať reč ľudí na diaľku, aj cez zvukotesné okno. Takzvaný vizuálny mikrofón sníma vibrácie z bežných predmetov, z ktorých softvér následne rekonštruuje zvuk.

07.08.2014 19:00
zvuk, zvuková vlna, audio signál, sound Foto:
Ilustračné foto
debata

Špehovanie naberá nový rozmer. Vedci z Massachussetts Institute of Technology (MIT) v spolupráci so spoločnosťou Microsoft a Adobe vyvinuli algoritmus, ktorý dokáže rekonštruovať audio signál analyzovaním mikroskopických vibrácií konkrétneho objektu zachyteného na videu. Výskumníci svoj experiment demonštrovali okrem iného aj na balíku čipsov, ktorého mikroskopické pohyby na úrovni desatiny mikrometra sledovali vysokofrekvenčnou kamerou za zatvoreným zvukotesným oknom zo vzdialenosti necelých piatich metrov.

Zvuk je možné rozpoznať aj na diaľku, len pomocou kamery bez mikrofónu
Zatiaľ čo ľudské oko mikroskopické pohyby objektu, ktorý reaguje na zvukové vlny, nezachytí, špeciálne kamery to dokážu aj z väčšej vzdialenosti a z rôznych povrchov. Vedci skúšali zachytiť pohyby zo vzdialenosti piatich metrov napríklad z alobalu, povrchu pohára s vodou či listov rastliny. “Akonáhle sa zvuková vlna priblíži k objektu, spôsobí jeho kmitanie. Takáto vibrácia vytvára veľmi jemný vizuálny signál, ktorý zvyčajne nie je možné ľudským okom zachytiť,” tvrdí Abe Davis z výskumného tímu.

Rekonštrukcia zvuku z videozáznamu

Rekonštrukcia zvukového signálu z videa vyžaduje, aby bola frekvencia snímok vo videu vyššia než frekvencia zvukového signálu. V experimente boli použité špeciálne vysokofrekvenčné kamery schopné zachytiť 2 až 4-tisíc snímok za sekundu. Zatiaľ čo bežné fotoaparáty a aj niektoré smartfóny dnes zachytávajú videá s frekvenciou 60 snímok za sekundu, najlepšie profesionálne kamery dokážu zachytiť až 100-tisíc snímok za sekundu.

Vedci experimentovali aj s videokamerou v smartfóne a vo foťáku
Vedci sa pokúsili zrekonštruovať zvukový záznam aj z videa so štandardnými 60 snímkami za sekundu. Síce sa im nepodarilo vytvoriť vernú kópiu zvukovej stopy, dokázali však získať informácie o vysokofrekven­čných vibráciách, čo postačilo na to, aby dokázali identifikovať pohlavie hovoriaceho človeka ako aj počet rozprávajúcich sa ľudí v miestnosti. Výskum by mohol priniesť nové možnosti napríklad pri forenznej analýze.

© Autorské práva vyhradené

debata chyba
Viac na túto tému: #špehovanie #zvuk #MIT #audio signál