Spoločnosť Microsoft opäť rozvírila hladiny vo svete umelej inteligencie. Tentokrát však nie s megalomanským modelom, ktorého prevádzka si vyžaduje servery veľkosti futbalového ihriska, ale premyslenou sériou kompaktných jazykových modelov Phi-4. Tie dokazujú, že aj menšie jazykové modely môžu excelovať v náročných úlohách, ktoré boli donedávna doménou veľkých modelov ako GPT-4 či DeepSeek R1.
Nová generácia modelov od Microsoftu pozostáva z trojice Phi-4-reasoning, Phi-4-reasoning-plus a Phi-4-mini-reasoning. Všetky majú jednu spoločnú vlastnosť – špecializujú sa na tzv. reasoning — teda schopnosť logického a štruktúrovaného uvažovania. V praxi to znamená, že dokážu rozložiť zložité problémy na menšie časti, analyzovať ich a nájsť správne riešenie. A to aj pri úlohách z matematiky, programovania či fyziky. Zaujímavosťou je, že tieto modely sú otvorené pre výskumníkov a vývojárov bez obmedzení, a sú navrhnuté tak, aby ich bolo možné prevádzkovať aj na bežných počítačoch či dokonca mobilných zariadeniach.
Prečo sú tieto modely také výnimočné?
Najväčšiu pozornosť si vyslúžil modeli Phi-4-reasoning-plus, ktorý prešiel počas vývoja náročným tréningom s viac ako 16 miliardami tokenov, z ktorých väčšina bola špeciálne upravená na zlepšenie schopností porozumenia a riešenia logických úloh.
Model používa štruktúrované výstupy, ktorými zvyšuje presnosť, a zároveň robí odpovede zrozumiteľnejšími pre ľudí, čo je dôležité v oblastiach ako sú zdravotníctvo, financie či vzdelávanie. Napriek svojmu „skromnému“ rozsahu poráža v mnohých testoch oveľa väčšie modely. Na prestížnom matematickom teste AIME 2025 dokázal Phi-4-reasoning-plus predbehnúť aj tak pokročilé a rozsiahle modely ako DeepSeek-R1.
Vzdelávanie budúcnosti: AI ako domáci učiteľ
Najmenší z trojice, Phi-4-mini-reasoning, bol trénovaný na viac než milióne syntetických matematických úloh, generovaných modelom DeepSeek-R1, pričom pokrýva škálu znalostí od základnej školy až po doktorandskú úroveň. Jeho optimalizácia pre mobilné zariadenia otvára cestu aplikáciám, ktoré môžu priniesť kvalitné individuálne vzdelávanie priamo do vrecka – bez potreby trvalého pripojenia na internet alebo výkonného hardvéru.