Vedci dokážu predpovedať chrípku využitím údajov z Wikipédie

Vedci z Harvardovej univerzity vynašli algoritmus, ktorý im umožní veľmi presne predvídať epidémiu chrípky na základe vyhľadávaní na Wikipédii s ochýlkou len 0,27 percenta.

21.04.2014 12:37
chripka Foto:
Ilustračné foto
debata

Zdravotnícke organizácie po celom svete sa už dlhé roky zaujímajú o spôsob sledovania a predpovedania epidémií v lokálnom ale aj svetovom merítku. Zatiaľ, až na pár výnimiek, však majú len limitované možnosti, ktoré sú často nepresné. Vedci si preto dali za úlohu nájsť algoritmus, ktorý umožní šírenie ochorení a epidémií predvídať čo najpresnejšie. Vedci z Harvard Medical School hlásia prvé pozitívne výsledky ich niekoľkoročného výskumu.

Algoritmus sleduje vyhľadávania na Wikipédii
Tím autorov vyvinul nový algoritmus, ktorý dokáže vývoj chrípky v Spojených štátoch nie len sledovať ale pomocou dát získaných z Wikipédie aj predpovedať. Algoritmus sleduje čo ľudia najčastejšie v internetovej encyklopédii vyhľadávajú a z akých lokalít sa určité vyhľadávania opakujú častejšie než inde. Príkladom sú pojmy ako „chrípková sezóna“, „horúčka“ alebo „epidémia“. Každú hodinu následne algoritmus sťahuje verejne dostupné informácie o počte ľudí, ktorí na dané stránky pristupovali. Informoval o tom server Businessweek.

Google môže byť pri analýze hroziacej chrípkovej epidémie nepresný
Výskumníci následne získané dáta porovnali s údajmi z Centra pre kontrolu a prevenciu chorôb a vo výsledku zistili, že dokážu pomerne presne predpovedať množstvo prípadov chrípky v krajine a to až dva týždne pred jej vypuknutím s odchýlkou 0,27 percenta. O niečo podobné sa pokúša aj projekt Google Flu Trends, ktorého výsledky ale nie sú natoľko presné, aby mohli byť považované za dôveryhodné. „Zatiaľ čo Google Flu Trends dokáže dobre odhadnúť šírenie ochorení podobných chrípke, pri väčšom záujme médií o epidémie a pandémie sú výsledky menej presné. Rovnako tak sú menej presné, ak je sledované obdobie niečím špecifické a výnimočné, ako napríklad počas chrípkovej sezóny v roku 2012–2013, kedy sa počet nakazených ľudí vymykal normálu. V takomto období kľúčové slová súvisiace s chrípkou vyhľadávajú aj ľudia, ktorí ňou v skutočnosti nakazení nie sú,“ uvádza McIver z výskumného tímu.

Algoritmus z Harvardovej univerzity by však mohol mať aj širšie využitie. Vedci ho chcú použiť napríklad pri predikovaní ochorení v konkrétnych mestách, no ešte predtým musia nájsť spôsob ako dáta získať bez narušenia súkromia používateľov Wikipédie. Encyklopédia totiž štandardne IP adresy tretím stranám neposkytuje, preto sú možnosti ohľadom zistenia presnej lokality osôb zatiaľ značne obmedzené. Východiskom môžu byť údaje získané zo sociálnych sietí. O čosi podobné sa pokúsili aj výskumníci z Pennsylvania State University, ktorí analyzovali príspevky na Twittri.

Pri sledovaní šírenia chrípky môžu pomôcť aj sociálne siete
Vedci sa zamerali na príspevky 104 študentov, z ktorých niektorí počas roka prekonali chrípku. Kľúčom, ktorý by mohol byť použiteľný globálne, bolo podľa príspevkov odhadnúť, ktorí študenti chrípkou nakazení boli a ktorí nie. Následne bol analýze podrobený aj zoznam odberateľov u sledovanej vzorky ľudí, ktorý poslúžil ako referenčná vzorka pri potvrdení všetkých zistení.

Algoritmus v príspevkoch a kľúčových slovách vyhľadával frázy ako „chrípka“, „horúčka“, „kašeľ“ alebo „lieky“ a takisto frázy, ktoré by mohli nepriamo súvisieť so zdravotným stavom, ako je napríklad účasť na večierku alebo športové aktivity. Podľa týchto dát bolo údajne možné s 99-percentnou úspešnosťou identifikovať, či študent v konkrétnom mesiaci ležal doma s chrípkou a horúčkou. Na rozdiel od výskumu z Harvardovej univerzity chcú vedci z Pennsylvania State University sledovať len konkrétnu skupinu ľudí. Takto získané výsledky by mohli byť použité pri opatreniach proti šíreniu nákazy už na úrovni miest.

© Autorské práva vyhradené

debata chyba
Viac na túto tému: #chrípka #epidémia #Wikipedia #Harvardova univerzita