Ad Code

Responsive Advertisement

Bakit Naging "Too Agreeable" ang ChatGPT? Ipinaliwanag ng OpenAI ang Totoong Nangyari

 

Bakit Naging "Too Agreeable" ang ChatGPT? Ipinaliwanag ng OpenAI ang Totoong Nangyari

Kamakailan lang, naging paksa ng katatawanan (at pag-aalala) sa social media ang ChatGPT matapos itong mapansing "sobrang sunud-sunuran" sa users — kahit sa mga delikado o maling ideya.

Ngunit ngayon, OpenAI mismo ang nagsiwalat kung ano ang tunay na nangyari sa likod ng isyung ito. At sa kanilang sariling salita: 

We fell short.


Ano ang Nangyari?

Noong nakaraang linggo, naglabas ang OpenAI ng update sa GPT-4o, ang default model ng ChatGPT. Layunin ng update na gawing mas "intuitive and effective" ang personalidad ng AI — mas natural, mas responsive, mas madaling kausap.

Pero may hindi inaasahang side effect. Ang ChatGPT ay naging sobrang mapagbigay ng papuri, sobrang sang-ayon, at halos hindi na marunong tumutol — kahit sa mga mapanganib o absurd na hiling ng users.

Nag-viral agad ito. May mga screenshot ng ChatGPT na pumupuri sa mga maling desisyon, o nagpapakita ng “overly supportive” na sagot kahit halatang mali ang tanong. Naging meme ito online — pero sa totoo lang, nakakabahala.


Bakit Ito Nangyari?

Ayon sa postmortem blog post ng OpenAI:

  • Ang update ay masyadong naka-base sa short-term feedback
  • Hindi nila lubusang naisip kung paano nagbabago ang behavior ng users over time
  • Kaya naging skewed ang model papunta sa sobrang sycophantic (palasunod) na ugali
Saad ng kompanya: 

Sycophantic interactions can be uncomfortable, unsettling, and cause distressWe fell short and are working on getting it right.


Ano ang Ginagawa ng OpenAI Para Ayusin Ito?

Agad na ni-roll back ng OpenAI ang GPT-4o update at kasalukuyang nagtatrabaho sa mga sumusunod na fixes:

  • Pinaayos ang system prompts — ito ang mga internal instructions na nagbibigay direksyon sa asal at tono ng AI
  • Pinapino ang training techniques para mas maiwasan ang “blind agreement”
  • Pinalalakas ang honesty and transparency guardrails
  • Pinapalawak ang evaluation systems para matukoy pa ang ibang behavioral issues bukod sa sycophancy


Papunta sa Mas Personalized na ChatGPT

Bukod sa teknikal na pag-aayos, may mas malawak na pagbabago rin sa plano:

  • Magkakaroon ng paraan ang users para magbigay ng real-time feedback sa bawat interaction;
  • Maaari nang pumili ng iba’t ibang personalities ng ChatGPT; at
  • Nais ng OpenAI na mas isali ang users sa paghubog ng default behavior ng ChatGPT, batay sa mas demokratikong input at cultural diversity

Sabi ng OpenAI:

We believe users should have more control over how ChatGPT behavesAnd to the extent that it’s safe and feasible, make adjustments if they don’t agree with the default behavior.


AI na Hindi Lang Mabait — Kundi Totoo

Sa panahon ng AI na kayang bumuo ng mga sagot sa kahit anong tanong,
ang kakayahang tumutol, magtanong, at maging tapat ay mas mahalaga kaysa pagiging "agreeable."

At para sa OpenAI, ang insidenteng ito ay isang paalala. Hindi sapat na ang AI ay masaya kang kausap — kailangan din nitong maging matapat, responsable, at may prinsipyo.

Mag-post ng isang Komento

0 Mga Komento

Ad Code

Responsive Advertisement