„Vä?šina ?udí dokáže už od raného veku od?íta? ?as a používa? kalendáre. Naše výsledky poukazujú na významnú medzeru v schopnosti AI robi? nie?o, ?o sú pre ?udí v podstate základné schopnosti,“ uvádza hlavný autor štúdie Rohit Saxena vo vyhlásení. Dodáva, že tieto nedostatky je potrebné odstráni?, ak má AI úspešne fungova? v oblastiach vyžadujúcich presnú prácu s ?asom, napríklad tvorbe ?asových rozvrhov, automatizácii a asisten?ných technológiách.
Tím vedcov z Edinburghskej univerzity zverejnil zatia? nerecenzovanú štúdiu s výsledkami svojho výskumu v elektronickom archíve vedeckých prác arXiv. Prezentovali ich po?as tohtoro?nej Medzinárodnej konferencie o reprezentatívnom u?ení (2025 International Conference on Learning Representations – ICLR 2025), ktorá sa konala 24. až 28. apríla v Singapure.
Autori štúdie skúmali schopnos? AI od?íta? ?as tak, že rôzne multimodálne ve?ké jazykové modely (MLLM) schopné spracova? vizuálne i textové informácie „nak?mili“ súborom obrázkov hodín a kalendárov. Výskumníci použili model Llama 3.2-Vision od spolo?nosti Meta, Claude-3.5 Sonnet spolo?nosti Anthropic, Gemini 2.0 spolo?nosti Google a GPT-4o od OpenAI.
Výsledky boli chabé. AI dokázala úspešne od?íta? ?as v 38,7 percenta prípadov. Rovnako tvrdý oriešok predstavovali aj dátumy. Ke? dostala AI náro?nú otázku typu „Na aký de? padne 153. de? roka?,“ AI uspela iba v 26,3 percentách prípadov. Vedci však majú vysvetlenie.
„Rané systémy (AI) trénovali na ozna?ených príkladoch. Od?ítanie ?asu z hodín si vyžaduje nie?o iné – priestorové myslenie. Model musí detegova? prekrývajúce sa ru?i?ky, mera? uhly a zvláda? rôzne dizajny, napríklad rímske ?íslice alebo štylizované ciferníky. Nau?i? AI rozozna?, že ‚toto sú hodiny‘ je omnoho jednoduchšie ako nau?i? ju od?íta? z nich ?as,“ vysvet?uje Saxena.
Problémy s po?ítaním dní v kalendároch môžu pôsobi? prekvapivo, pretože aritmetika je základným kame?om výpo?tovej techniky, AI však pracuje inak.
„Aritmetika je pre tradi?né po?íta?e malina, pre LLM však nie. AI nepoužíva matematické algoritmy, výsledky predpovedá na základe vzorov z tréningových dát,“ približuje Saxena a dodáva, že AI ob?as trafí aritmetický výsledok, no nedopracuje sa k nemu konzistentnou logikou založenou na pravidlách.
Štúdia je najnovším prírastkom do série dôkazov o rozdielnosti v „chápaní“ AI a myslení ?udí. AI tvorí odpovede na základe známych vzorcov a dostatku údajov, zlyháva však v prípadoch vyžadujúcich generalizáciu alebo abstraktné myslenie. Rovnako si nevie poriadi? ani v zriedkavých prípadoch – napríklad pri priestupných rokoch.
„AI je výkonná, no ke? si úloha vyžaduje použitie (priestorového) vnímania a logiky, stále je treba dôkladné testovanie, záložnú logiku a ?loveka v procese,“ uzatvára Saxena.
Zdroj feed teraz.sk
