, 2021/10/8
A DeepMind mesterséges intelligenciával foglalkozó vállalat feltérképezte 350 000 fehérje 3D szerkezetét, és az adatokat szabadon hozzáférhetővé tette.
A mesterséges intelligencia fehérje hajtogatásának jövőbeli idővonala. A humán interleukin-12 receptorához kötődő emberi interleukin-12 3D-s nézete. Credit: Ian Haydon, UW Medicine Institute for Protein Design (UW Medicine Institute for Protein Design). Az AlphaFold egy mesterséges intelligencia (AI) program, amely mély tanulást használ a fehérjék 3D szerkezetének előrejelzésére. A Google londoni székhelyű leányvállalata, a DeepMind által kifejlesztett program 2020 novemberében került a címlapokra, amikor a CASP (Critical Assessment of Structure Prediction) versenyen indult.
Ezt a világméretű kihívást kétévente rendezi meg a tudományos közösség, és ez a legismertebb fehérjemodellezési benchmark. A résztvevőknek "vakon" kell megjósolniuk különböző fehérjék 3D szerkezetét, és számítási módszereiket ezt követően összehasonlítják a valós laboratóriumi eredményekkel. A CASP kihívást 1994 óta rendezik meg, és a Global Distance Test (GDT) nevű mérőszámot használja, amely 0-tól 100-ig terjed.
A korábbi évek győztesei általában a 30-40-es érték körül mozogtak, és a 90-es pontszámot tekintették a kísérletileg meghatározott eredménynek megfelelőnek. 2018-ban azonban a DeepMind csapata 58,9-es mediánértéket ért el a GDT-nél, és 68,5-es összesített pontszámot az összes célpontra vonatkozóan, ami messze a legmagasabb eredmény minden algoritmus közül.
Majd 2020-ban az AlphaFold programjuk 2.0-s verziója versenyzett a CASP-n, és ismét győzött - ezúttal még nagyobb pontossággal. Az AlphaFold 2.0 az összes céltárgyat tekintve 92,4-es átlagot ért el, átlagos hibahatára pedig egy atom szélességéhez (0,16 nanométer) hasonlítható. Andrei Lupas, a németországi Max Planck Intézet biológusa, aki a CASP-ben az egyes csapatok teljesítményét értékelte, így nyilatkozott az AlphaFoldról: "Ez meg fogja változtatni az orvostudományt. Meg fogja változtatni a kutatást. Meg fogja változtatni a biomérnöki munkát. Mindent meg fog változtatni."
Két példa az AlphaFold által megjósolt fehérjeszerkezetekre (kékkel), összehasonlítva a kísérleti eredményekkel (zölddel). Ebben a hónapban a DeepMind további előrelépéseket jelentett be. Az AlphaFold legújabb verziója már 16-szor gyorsabb, mint tavaly. Ennél is fontosabb, hogy a vállalat az AI segítségével 350 000 fehérje 3D szerkezetét hozta létre, és ezeket az adatokat egy új adatbázisban szabadon hozzáférhetővé tette. Eddig csak 180 000 fehérjeszerkezet létezett a köztudatban, így a DeepMind számításai gyakorlatilag megduplázták ezt a számot.
Az új adatok 20 különböző szervezetre terjednek ki - köztük olyan állatokra, mint az egerek, a gyümölcslegyek és olyan baktériumok, mint az E. coli. Fontos, hogy az emberi szervezetben található mintegy 20 000 fehérje 98,5%-át is tartalmazza. "Úgy gondoljuk, hogy ez az emberi proteom eddigi legteljesebb és legpontosabb képe" - mondta Dr. Demis Hassabis, vezérigazgató és társalapító. "Úgy véljük, hogy ez a munka a legjelentősebb hozzájárulás, amelyet az AI a tudományos ismeretek jelenlegi állásának előmozdításához tett.
És úgy gondolom, hogy ez egy nagyszerű illusztrációja és példája annak, hogy az AI milyen előnyökkel járhat a társadalom számára. Nagyon izgatottan várjuk, hogy a közösség mit fog kezdeni ezzel". A fehérjék - hogy a híres Q-t idézzem a Star Trek: TNG-ből - az építőkövei annak, amit életnek nevezünk. Kialakulásuk aminosavakkal kezdődik, amelyek peptidekké és hosszabb polipeptidekké állnak össze, majd fehérjékké hajtogatják magukat. Ezek a struktúrák nélkülözhetetlenek a biológiai folyamatokhoz.
Hogy csak egy példát említsünk: a hemoglobin a vörösvértestek fehérjéje, amely oxigént szállít a test szerveihez és szöveteihez, és szén-dioxidot szállít a szervekből és szövetekből vissza a tüdőbe. A fehérjék hajtogatásának összetettsége évtizedek óta óriási kihívásnak bizonyul, rendkívül időigényes és költséges a kutatók számára. A DeepMind által kifejlesztett mesterséges intelligencia vitathatatlanul a legjelentősebb áttörést jelenti ezen a területen, mivel lehetővé teszi, hogy hat hónapos laboratóriumi munka percek alatt elvégezhető legyen.
Az új - összesen mintegy 50 gigabájt méretű - adatbázis lehetővé teszi a tudósok számára világszerte, hogy gyorsabb és pontosabb betekintést nyerjenek ezekbe a molekulákba, azok 3D-s szerkezetébe és kölcsönhatásaiba. Az első kiadást követően a DeepMind azt tervezi, hogy folyamatosan bővíti az adatokat, és az év végére 100 millió fehérjeszerkezetet kíván közzétenni. A vállalat legújabb munkájáról szóló tanulmány ebben a hónapban jelenik meg a Nature folyóiratban.
A fehérjeszerkezetek felbecsülhetetlen értékű információt szolgáltatnak mind a biológiai folyamatokra vonatkozó következtetésekhez, mind pedig az olyan beavatkozásokhoz, mint a szerkezetalapú gyógyszerfejlesztés vagy a célzott mutagenezis" - írják a szerzők. "Évtizedes erőfeszítések után az emberi fehérjeszekvenciák összes maradékának 17%-át fedi le kísérletileg meghatározott szerkezet.
Itt drámaian kiterjesztjük a szerkezeti lefedettséget a legkorszerűbb gépi tanulási módszer, az AlphaFold2 méretarányos alkalmazásával szinte a teljes emberi proteomra. [...] Arra számítunk, hogy a rutinszerű, nagy léptékű és nagy pontosságú szerkezet-előrejelzés fontos eszközzé válik, amely lehetővé teszi új kérdések strukturális szempontból történő megválaszolását."
"Ez egy Rosetta-kő-pillanat a biológia számára" - mondta David Friedberg, a The Production Board vezérigazgatója, egy olyan amerikai vállalat, amely élvonalbeli egészségügyi, biotechnológiai és élettudományi projektekbe fektet be. "A DeepMind lefordította az emberi genetikai kódot a testünket működtető fizikai gépekre (fehérjékre). Új terápiák százai fognak megjelenni, ahogy a tudósok feltérképezik, hogy a molekulák hogyan léphetnek kölcsönhatásba a fehérjékkel az emberi egészség megváltoztatása érdekében."
Az AlphaFold alkalmazásai azonban túlmutatnak az orvostudományon. Segíthet például a hulladékanyagok lebontását végző új enzimek szintézisében, vagy a szélsőséges időjárási viszonyoknak ellenálló növények előállításában. "Azt hiszem, igazán izgalmas pillanatban vagyunk" - mondta Dr. Hassabis. "A következő évtizedben mi és mások a mesterséges intelligencia területén reméljük, hogy olyan elképesztő áttöréseket érhetünk el, amelyek valóban felgyorsítják a Földön jelentkező igazán nagy problémák megoldását.