September 27, 2024

Generatieve AI voor cellulair zicht – UHN Foundation

Generatieve AI voor cellulair zicht – UHN Foundation

(Van links naar rechts), co-eerste auteurs van het onderzoek en promovendi van het Toronto General Hospital Research Institute (TGHRI), Haotian Cui en Chloe Wang, en Dr. Bo Wang, senior AI-wetenschapper bij UHN en een wetenschapper bij TGHRI, zijn senior auteur. (Foto: UHN Onderzoekscommunicatie).

Een onderzoeksteam van het Toronto General Hospital Research Institute (TGHRI) heeft een leermodel voor kunstmatige intelligentie (AI) gebouwd om complexe biologische interacties te begrijpen op basis van grootschalige datasets voor eencellige analyse.

Recente ontwikkelingen binnen Stadion Genen en genexpressiepatronen in afzonderlijke cellen hebben een schat aan gegevens opgeleverd waarmee onderzoekers meer te weten kunnen komen over cellulaire diversiteit, functie en hoe cellen reageren op verschillende omstandigheden.

Het gebruik van een techniek die single-cell RNA-sequencing wordt genoemd – een methode die de genexpressieniveaus in elke cel meet om te bepalen hoe deze functioneert – heeft geleid tot de ontwikkeling van uitgebreide dataatlassen.

“Het grote volume aan sequentiegegevens heeft voor enorme analytische uitdagingen gezorgd”, zegt dr. Bo Wang, wetenschapper bij TGHRI en senior auteur van het onderzoek.

“Om dit probleem aan te pakken, wilden we een basismodel ontwikkelen om machinaal leren te gebruiken om het gedrag van eencellige cellen te decoderen en te voorspellen op basis van sequentiegegevens”, voegt Dr. Wang toe, die ook een senior AI-wetenschapper is bij UHN en medeleider van UHN. AI. centrum.

Het basismodel kan worden omschreven als een gigantische database met informatie die is getraind op een groot aantal verschillende datasets en kan worden aangepast voor een verscheidenheid aan taken. Taalkundige modellen, zoals ChatGPT, worden op tekst getraind om patronen en betekenissen in taal te leren. Het formulier kan vervolgens worden gebruikt om te helpen bij taken zoals het beantwoorden van vragen, het samenvatten van tekst of het vertalen van talen.

“Hoewel teksten uit woorden bestaan, kunnen cellen worden onderscheiden door de genen en eiwitproducten waarvoor ze coderen”, zegt Haotian Cui, een promovendus in het laboratorium van Dr. Wang en mede-eerste auteur van het onderzoek.

“Op basis van dit principe hebben we een basismodel ontwikkeld, scGPT (single-cell GPT) genaamd, om de biologie van eencellige cellen te onderzoeken door meer dan 33 miljoen cellen vooraf te trainen.”

“Voor de toekomst is het ons doel om ons model nog slimmer te maken.”

Door te trainen op een diverse dataset met miljoenen cellen uit verschillende weefsels en aandoeningen (d.w.z. celtypen uit 51 organen of weefsels en 441 onderzoeken), leerde scGPT patronen in genexpressie en celgedrag begrijpen en leerde het hoe nieuwe informatie te genereren. Gebaseerd op wat je hebt geleerd.

Het grootste deel maakt gebruik van speciale tools, transformatorblokken genaamd, om de gegevens te helpen begrijpen en verwerken. Na de initiële training kunnen de instellingen worden aangepast om het beter te laten werken met nieuwe informatie, wat handig kan zijn voor verschillende taken.

Het team ontdekte dat scGPT effectief is voor taken zoals het identificeren van celtypen, het voorspellen van genactiviteit in cellen, het corrigeren van batcheffectfouten in sequentiegegevens en het detecteren van belangrijke genetische interacties die variëren afhankelijk van het celtype of de toestand.

Deze aanpak verbetert de modellering van single-cell sequencing-gegevens en biedt waardevolle inzichten in gen-gen-interacties die specifiek zijn voor verschillende aandoeningen, zoals celtoestanden en genexpressiestoornissen.

“De release van scGPT-modellen en workflows zal het onderzoek in de celbiologie en daarbuiten kunnen versnellen, waardoor een uniforme aanpak voor single-cell omics-analyse ontstaat – het profileren van afzonderlijke cellen in verschillende populaties”, zegt Chloe Wang, co-eerste auteur van ScGPT. Studie- en PhD-student bij TGHRI.

Door gebruik te maken van de kracht van een vooraf getraind generatief AI-model hopen onderzoekers de weg vrij te maken voor innovatieve therapeutische strategieën en het begrip van cellulaire processen te verdiepen.

“Voor de toekomst is ons doel om ons model slimmer te maken en beter te begrijpen hoe cellen in verschillende situaties functioneren”, voegt dr. Bo Wang toe, die ook de Canada Tier II Research Chair in Artificial Intelligence for Medicine is en assistent-professor bij UCLA. Universiteit van Toronto.

Sinds de eerste druk van deze monografie in mei 2023 en de release van scGPT heeft het een grote impact gehad op het veld, met meer dan 13.000 installaties en 55 citaten vóór de officiële publicatie ervan.

Door UHN Communicatieonderzoek