Keď v pondelok podvečer zaznamenali služby Facebook, WhatsApp a Instagram rozsiahly výpadok, mnoho ľudí si myslelo, že im nefunguje internet. Niet sa čomu čudovať, keďže stovky miliónov ľudí trávia práve používaním týchto služieb niekoľko hodín denne. Zhruba šesť hodín trvalo, kým sa Facebooku podarilo problém vyriešiť a služby opätovne sprístupniť miliardám ľudí po celom svete. Výpadok totiž nemal len lokálny charakter, ale ovplyvnil používateľov po celom svete, od Kanady, cez Európu, Áziu až po Austráliu.

Je to ako dátové centrum bez pripojenia na internet
V krátkom blogovom príspevku sa Facebook pokúsil vysvetliť, čo sa stalo a vyvrátiť tak pochybnosti o prípadnom kybernetickom útoku či konšpirácie v súvislosti s odhalením identity bývalej zamestnankyne Frances Haugen, ktorá na verejnosť vynášala nepríjemné detaily z kuchyne spoločnosti. Fatálna chyba, s ktorou sa museli inžinieri vysporiadať, pritom nemusela vôbec vzniknúť. Ako neskôr v podrobnej správe vysvetlila firma Cloudflare, to čo sa stalo možno prirovnať k odpojeniu všetkých dátových káblov z dátového centra naraz. Ak by tak niekto spravil, servery by v podstate okamžite odpojil od internetu. A niečo podobné sa stalo aj Facebooku.
“Zmena konfigurácie na chrbticových smerovačoch, ktoré koordinujú sieťový prenos medzi dátovými centrami, spôsobila prerušenie komunikácie. To malo kaskádový efekt pri zamedzení dostupnosti našich služieb,” upresnil Facebook. Keďže Facebook patrí medzi najväčšie IT firmy, disponuje vlastnými servermi, ktoré si aj sám spravuje. Prevádzkované služby vrátane Instagramu a WhatsApp fungujú výhradne na týchto serveroch. Ak sa preto podobná chyba vyskytne, má vplyv na fungovanie všetkých služieb v portfóliu firmy.

Chýbajúce puzzle vo veľkej skladačke
Pre lepšie pochopenie si to možno predstaviť ako jedno veľké puzzle tvorené stovkami tisíc dielov. Každý diel, označovaný aj ako autonómny systém, je samostatnou sieťou. Jednu takú prevádzkuje aj Facebook. Ak sa následne užívatelia internetu pokúsia navštíviť niektorú z jeho služieb, hlavný systém umožní počítačom pripojiť sa do jeho siete s využitím takzvaného dynamického smerovacieho protokolu BGP.

Aby sa užívateľ mohol k službám pripojiť, protokol BGP musí najprv zistiť, ktorá z ciest je najefektívnejšia a najlepšia a na ňu užívateľa odkáže. To, čo sa stalo v pondelok podvečer naznačuje, že Facebook tomuto systému prestal poskytovať informácie a on preto nemal užívateľov kam nasmerovať. Neexistovala preto možnosť, ako sa na Facebook, Instagram a WhatsApp pripojiť a služby sa chovali ako nedostupné. Zatiaľ pritom nevedno, či má výpadok na svedomí ľudský faktor alebo chyba softvéru.