skip to Main Content

AI avslöjar proteinstrukturer på nolltid

Foto: Thor Balkhed

På några få timmar kan AI ta fram proteinstrukturer som annars skulle ta flera månader, eller till och med år, att få fram. Det innebär ett paradigmskifte för proteinforskningen. Men den nya tekniken kan inte ersätta alla experiment.

Hela forskarvärlden häpnade i november 2020. Med hjälp av artificiell intelligens, AI, hade Deepmind med sitt program Alphafold 2 lyckats förutsäga proteinstrukturer från sekvenser med så hög träffsäkerhet att ledningen för den återkommande tävlingen CASP, Critical assessment of protein structure prediction, misstänkte att de hemlighållna experimentella strukturerna hade läckts.

Så var inte fallet. Programmet var bara ett stort steg före alla andra – och hade lyckats förutsäga strukturmodeller vars likhet med experimentella strukturer var på samma nivå som mellan olika strukturer av samma protein bestämda med etablerade metoder.

Sommaren 2021 släpptes programvaran fri och genom ett samarbete med institutet European bioinformatics institute, EBI, blev en databas med strukturmodeller av alla proteiner från människa och 20 andra modellorganismer tillgängliga. Världens forskare kan nu snabbt och med högre träffsäkerhet än någonsin tidigare få en bild av hur varje enskilt protein ser ut och därmed få nya ledtrådar till molekylära mekanismer.

Den genetiska kodens översättning till proteinets aminosyrasekvens har varit känd sedan 1960-talet. Men det har varit en gåta för forskarna hur aminosyrasekvensen sedan bestämmer hur den tredimensionella strukturen hos det funktionella proteinet blir.

Det första proteinet – myoglobin från kaskelottval – strukturbestämdes redan 1959. Sedan dess har forskare med hjälp av experimentella metoder, såsom kristallografi, kärnmagnetisk resonans, NMR och elektronmikroskopi, strukturbestämt mer än 70 000 unika proteiner och de komplex de bildar med småmolekyler, nukleinsyror och andra proteiner.

Proteinstrukturerna som tas fram med AI är mycket bra, men inte perfekta. Programmen ger en uppskattning av noggrannheten och kvaliteten hos förutsägelsen för olika delar av modellen. Den är ofta högre för enskilda välstrukturerade delar, domäner, av ett protein och lägre för mer flexibla delar samt för hur de olika domänerna är positionerade. Noggrannheten är också något lägre vid förutsägelse av strukturer med väldigt unik sekvens, som därför sämre matchar det som redan finns i databaserna.

Genombrotten i strukturförutsägelse får omedelbart stora konsekvenser i många grundvetenskapliga och tillämpade forskningsområden.

Strukturbaserad läkemedelsutveckling slog igenom i början av 1990-talet, då bland annat hiv-proteasinhibitorer utvecklades med hjälp av proteinets struktur. Området har sedan dess utvecklats till ett stort forskningsfält med ett fruktbart samspel mellan beräkningsbaserade och experimentella metoder. Kunskap om strukturen hos coronavirusets spikprotein har varit viktig för att kunna ta fram vacciner mot viruset, och strukturbiologiska studier av livets grundläggande processer har legat till grund för många Nobelpris.

De proteinstrukturer som kan förutsägas med AI-algoritmer ger en ny startpunkt för alla dessa forskningsprojekt. För proteinfamiljer där inga experimentella strukturer finns, lägger de AI-beräknade strukturerna grund för hypoteser som går att testa experimentellt.

Strukturmodellerna kan användas för simulering av hur småmolekyler, exempelvis läkemedelskandidater, kan binda till ett enzym eller en receptor. Modellerna kan också användas för att lösa kristallstrukturer eller tolka lågupplösta elektronmikroskopibilder av proteinkomplex.

Storskalig strukturförutsägelse applicerat på mängder av proteiner från ett stort antal organismer kommer att vara mycket värdefullt inom bioteknik, för att ge en bättre grund till att välja kandidatproteiner till olika tillämpningar. Inom läkemedelsforskningen kan dessa strukturmodeller ge viktig information, både för läkemedelsmål och möjliga sidoeffekter.

AI gör det möjligt att använda all tillgänglig information i form av experimentellt bestämda strukturer och kända proteinsekvenser. Genombrottet skulle alltså över huvud taget inte varit möjligt utan både utveckling av AI-algoritmer och tillgänglig information från vilken algoritmerna kan lära sig samband mellan proteinsekvens och proteinstruktur.

Här tog det tyvärr slut… Hela den här artikeln kan läsas i Kemisk Tidskrift nr 4 2021. Kemisk Tidskrift skickas ut till medlemmar i Svenska Kemisamfundet. Kemisk Tidskrift – Svenska Kemisamfundet

Läs mer om medlemskapet här: Medlemskap – Svenska Kemisamfundet

Text: Maria Selmer