AI Model na Nag-decode ng Code sa Proteins para Malaman ang Kanilang Lokasyon
Ang mga proteins ay ang mga "workhorses" ng ating mga cells, at mayroong libu-libong uri ng proteins sa ating cells, bawat isa ay may espesyal na tungkulin. Matagal nang alam ng mga mananaliksik na ang istruktura ng isang protein ay nagtatakda ng mga kakayahan nito, ngunit kamakailan lamang ay napagtanto nila na ang lokalisasyon ng isang protein ay kasing kahalaga rin para sa pagganap nito. Ang mga cell ay puno ng mga compartments na tumutulong mag-organisa ng iba't ibang molekula upang magsagawa ng mga shared functions. Ang pag-alam kung saan matatagpuan ang isang protein at kung sino ang kasama nito sa lokasyon, ay makakatulong sa mas mahusay na pag-unawa ng tungkulin ng protein sa isang malusog o diseased na cell.
Gayunpaman, hanggang ngayon ay wala pang sistematikong paraan para tuklasin ang lokalisasyon ng protein.
Ang AlphaFold, isang tool na ginagamit sa AI, ay matagal nang nakakatulong sa pag-predict ng istruktura ng mga proteins gamit ang kanilang amino acid sequence. Ngunit ang mga region ng amino acids sa protein na hindi tumutupi sa isang tiyak na istruktura, kundi mahalaga para sa pagtulong sa proteins na sumama sa dynamic compartments ng cell, ay hindi pa rin ganap na nauunawaan.
Kaya’t nagtanong si MIT Professor Richard Young at ang kanyang mga kasamahan kung maaaring gamitin ang code sa mga region na ito upang mahulaan ang lokalisasyon ng protein, tulad ng ginagawa ng mga modelo para sa istruktura ng protein. Sa tulong ng machine learning, nakabuo sila ng ProtGPS, isang modelo na maaaring mag-predict kung saan matatagpuan ang isang protein sa loob ng cell at kung paano ang mga mutations sa protein ay maaaring magbago ng lokalisasyon nito. Ang kanilang modelo ay ipinakita sa isang paper na inilathala sa Science noong Pebrero 6.
Pagtukoy ng Lokalisasyon at Pagbabago Dahil sa Mutations
Sinanay ng mga mananaliksik ang ProtGPS gamit ang dalawang set ng proteins na may kilalang lokalisasyon. Napag-alaman nila na kayang ipredict ng model ang lokalisasyon ng proteins nang may mataas na accuracy. Sinubukan din nila kung kaya ng ProtGPS na mahulaan ang pagbabago ng lokalisasyon dulot ng mga disease-associated mutations sa isang protein.
Ang mga mutations, o pagbabago sa sequence ng genes at proteins, ay kilalang nagdudulot ng mga sakit. Ngunit hindi pa rin alam ng mga mananaliksik kung paano nagiging sanhi ang mga mutations ng mga sintomas ng sakit. Pinaghihinalaan ng mga mananaliksik na ang mga mutations ay maaaring magdulot ng pagbabago sa protein localization, kaya't tinesting nila ito gamit ang ProtGPS. Natuklasan nila na may mga pagkakataon kung saan ang isang mutation ay nagpapalit ng lokalisasyon ng protein, at nang subukan nila ito sa cells, nakumpirma ang mga hula ng ProtGPS.
Pagbuo ng Novel Proteins gamit ang ProtGPS
Ang mga mananaliksik ay hindi lamang nagnanais na mag-predict ng lokalisasyon ng mga proteins, kundi pati na rin lumikha ng novel proteins na kayang mag-localize sa isang tiyak na compartment sa loob ng cell. Ang layunin nila ay magdisenyo ng mga new amino acid sequences na kapag nabuo sa cell, ay mag-localize sa isang partikular na lokasyon.
Isang halimbawa ng tagumpay ng modelo ay nang magdisenyo sila ng 10 proteins na nakatakdang mag-localize sa nucleolus. Pagkatapos subukan ito sa cell, napag-alaman nilang apat sa mga protein ay matagumpay na nag-localize sa nucleolus, at ang iba ay may bahagyang bias patungo sa lokasyong iyon.
Ang kakayahang magdisenyo ng mga functional proteins ay makakatulong sa mga therapeutic design. Halimbawa, kung ang isang gamot ay kailangang mag-interact sa isang target na matatagpuan sa isang partikular na compartment, magagamit ang modelo upang magdisenyo ng gamot na mag-localize rin doon, kaya't magiging mas epektibo ito at bababa ang mga side effects.
Hinaharap ng ProtGPS at Pagpapalawak ng Aplikasyon
Ang mga mananaliksik ay umaasa na ang ProtGPS ay magiging isang platform na magagamit ng iba pang mga researcher upang mapalalim ang kaalaman sa protein function at dysfunction. Nagplano rin silang palawakin ang prediksyon ng lokalisasyon nito para sa mas maraming compartments at subukan ang mas maraming therapeutic hypotheses.
Ayon kay Henry Kilgore, isang postdoc sa lab ni Young:
Ngayon na alam na natin na mayroong code sa proteins para sa kanilang lokalisasyon, at kaya ng machine learning models na maintindihan ito at mag-create ng mga functional proteins, nagbukas ito ng maraming posibilidad para sa mga study at aplikasyon.
0 Mga Komento