OpenAI Inilunsad ang o3 at o4-mini: Bagong Henerasyon ng AI Reasoning Models
Naglabas ang OpenAI ng dalawang bagong modelo ng AI — ang o3 at o4-mini — na layuning makapagbigay ng mas matalinong tugon sa mga tanong sa pamamagitan ng pag-pause at pag-reason bago tumugon. Ang hakbang na ito ay bahagi ng patuloy na tunggalian sa pagitan ng OpenAI at iba pang higante sa larangan ng AI tulad ng Google, Anthropic, at xAI.
Ano ang pinagkaiba ng o3 at o4-mini?
Inilalarawan ng OpenAI ang o3 bilang kanilang “pinaka-advanced na reasoning model” sa ngayon. Malaki ang kakayahan nito sa pagsusuri ng mga problemang may kinalaman sa agham, matematika, programming, at maging sa visual data. Sa kabilang banda, ang o4-mini ay idinisenyo para sa mas mabilis at abot-kayang paggamit nang hindi isinasakripisyo ang kalidad ng sagot.
Narito ang ilang detalye:
- o3: Tumutok sa mataas na performance sa matitinding task.
- o4-mini: Mas mura at mas mabilis, ngunit malapit pa rin ang kalidad sa o3.
- May variant ang o4-mini na tinatawag na “o4-mini-high”, na tumatagal ng kaunti sa pagproseso para magbigay ng mas maaasahang sagot.
Bagong Kakayahan: Multimodal at Tool-Enabled na Pag-iisip
Ang dalawang modelong ito ay may kakayahang gumamit ng mga tools sa loob ng ChatGPT tulad ng web search, Python code execution, at image processing. Hindi ito basta simpleng chatbot — kaya nitong magproseso ng mga larawan, magsagawa ng visual analysis, at bumuo ng desisyon mula roon.
Kabilang sa mga kayang gawin ng o3 at o4-mini ay ang:
- Pagsagot gamit ang mga kasangkapan tulad ng browser at code interpreter;
- Pag-unawa sa mga larawang in-upload, kabilang ang sketches at diagrams;at
- Pagproseso ng malabo o mababang kalidad na imahe gamit ang reasoning phase
Gaano kahusay ang performance ng mga ito?
Sa larangan ng coding at lohikal na pagsusuri, humakot ng mataas na marka ang mga bagong modelo. Sa SWE-bench Verified, isang benchmark test para sa AI coding ability, nalampasan ng o3 at o4-mini ang karamihan sa mga kasalukuyang modelong AI.
Scores sa SWE-bench Verified:
- o3 – 69.1%
- o4-mini – 68.1%
- Claude 3.7 Sonnet (mula Anthropic) – 62.3%
- o3-mini (naunang bersyon) – 49.3%
Makikita rito na malaki ang naging pagtalon sa kalidad mula sa dating mga modelo ng OpenAI.
Sino ang makikinabang dito?
Available na ang mga bagong modelong ito para sa mga sumusunod na gumagamit ng ChatGPT:
- Pro, Plus, at Team subscribers
- Developers sa pamamagitan ng Chat Completions at Responses API
- Presyo ng paggamit para sa developers:
- o3: $10/milyong input tokens, $40/milyong output tokens
- o4-mini: $1.10/milyong input tokens, $4.40/milyong output tokens
Abot-kaya ang o4-mini para sa mga nagsisimula pa lang o may limitadong budget, habang ang o3 ay para sa mga nangangailangan ng mas mataas na precision.
Ano ang susunod na hakbang ng OpenAI?
Bilang bahagi ng kanilang roadmap, inihahanda ng OpenAI ang “o3-pro”, isang mas makapangyarihang bersyon ng o3 na eksklusibo para sa ChatGPT Pro users. Samantala, sinabi ni OpenAI CEO Sam Altman na posibleng ito na ang huling stand-alone reasoning models bago isama ang mga ito sa isang pinagsama-samang modelo: ang GPT-5.
0 Mga Komento