Ayon sa Anthropic, nilagyan nila ang Claude 3.7 Sonnet ng pangunahing memorya, input mula sa screen pixels, at kakayahang gumamit ng function calls upang pindutin ang mga button at mag-navigate sa laro. Dahil dito, nagawa ng AI na patuloy na maglaro ng Pokémon.
Isa sa mga natatanging tampok ng Claude 3.7 Sonnet ay ang kakayahan nitong magsagawa ng "extended thinking." Katulad ng AI models mula sa OpenAI at DeepSeek, ang Claude 3.7 Sonnet ay may kakayahang gumamit ng mas maraming computing power at oras upang malutas ang mas mahihirap na problema.
Ang tampok na ito ay napatunayang kapaki-pakinabang sa paglalaro ng Pokémon Red. Sa paghahambing, ang naunang bersyon nitong Claude 3.0 Sonnet ay hindi man lang nakalabas ng bahay sa Pallet Town kung saan nagsisimula ang laro. Samantalang ang Claude 3.7 Sonnet ay matagumpay na nakalaban at nanalo laban sa tatlong Pokémon gym leaders at nakakuha ng kanilang mga badge.
Bagamat hindi malinaw kung gaano karaming computing power ang ginamit ng Claude 3.7 Sonnet upang makamit ang mga tagumpay na ito, sinabi ng Anthropic na gumamit ito ng 35,000 aksyon upang marating ang gym leader na si Lt. Surge.
Ang Pokémon Red ay isang toy benchmark lamang, subalit matagal nang ginagamit ang mga laro bilang paraan ng pagsusuri ng AI models. Sa mga nakalipas na buwan, maraming bagong apps at platform ang lumitaw upang subukan ang kakayahan ng AI sa paglalaro ng iba’t ibang laro, mula sa Street Fighter hanggang Pictionary.
Sa mabilis na pag-unlad ng AI, maaaring hindi na magtagal bago may makahanap ng mas mabisang paraan upang mapabuti pa ang performance ng mga AI models sa gaming at iba pang larangan.
0 Mga Komento