
Hücrelerin yorulmak bilmeyen moleküler iş makineleri olan proteinler, yaşamın temel yapıtaşlarını oluşturmaktadır. Yıllar boyunca bilim insanları, bu karmaşık moleküllerin işlevlerini anlayabilmek için öncelikle üç boyutlu yapılarını çözmek zorunda olduklarının bilincindeydi. Ancak geleneksel laboratuvar yöntemleriyle bir proteinin yapısını aydınlatmak son derece zahmetli, yüksek maliyetli ve aylar hatta yıllar alan bir süreçtir. İlgilenilen proteinin izole edilip saflaştırılması, kristalleşmesi için ideal fizikokimyasal koşulların bulunması ve ardından atomların kesin dizilimini belirlemek amacıyla X-ışını kristalografisi (X-ray crystallography) veya Kriyo-Elektron Mikroskopisi (Cryo-EM) gibi ağır altyapı gerektiren yöntemlerin kullanılması şarttı.
Ne var ki, yalnızca tek bir proteinin yapısını izole bir şekilde haritalandırmak, araştırmacılara o proteinin canlı organizma içindeki gerçek işlevi hakkında her zaman eksiksiz bir tablo sunmuyor. Çünkü hücresel süreçlerin tamamına yakını, proteinlerin tek başlarına değil, birbirleriyle dinamik bir etkileşime girerek oluşturdukları devasa ‘protein kompleksleri’ aracılığıyla yürütülüyor. Bir hücrenin metabolizması, büyümesi ve hastalıklara verdiği tepkiler, tamamen bu etkileşim ağının sağlığına bağlıdır.
Biyoloji, aslında moleküller bir araya geldiğinde ve etkileşime girdiğinde gerçekleşir. Proteinler doğada birimler olarak birlikte çalışır; her birinin özel etkileşim partnerleri, değişken konformasyonel durumları ve spesifik stokiyometrileri vardır. Tüm bu karmaşık dinamikler, ancak tek bir yapı taşından çoklu yapı birimlerine, yani komplekslere geçiş yaptığınızda tam anlamıyla görünür hale gelir.
Bu çarpıcı tespiti yapan Seul Ulusal Üniversitesi’nden hesaplamalı biyolog Martin Steinegger, tam da bu felsefeden yola çıkarak teknoloji devleri Google DeepMind, NVIDIA ve Avrupa Moleküler Biyoloji Laboratuvarı’na bağlı Avrupa Biyoinformatik Enstitüsü (EMBL-EBI) ile çığır açan bir işbirliğine imza attı. Ekibin hedefi, dünya genelinde büyük sükse yaratan yapay zeka sistemi AlphaFold’un kapasitesini zorlamak ve protein komplekslerinin yapılarını endüstriyel bir ölçekte tahmin edilebilir kılmaktı.
Hatırlanacağı üzere 2021 yılında AlphaFold2’nin piyasaya sürülmesi, tekil protein yapılarının yüzde 90’a varan benzeri görülmemiş bir doğrulukla tahmin edilebileceğini kanıtlamıştı. Önceki sistemler en fazla yüzde 60 oranında bir başarı sağlayabiliyordu. AlphaFold’un bu inanılmaz tahmin gücünün arkasında, Steinegger’in önerisiyle entegre edilen ve metagenomik kaynaklı proteinleri içeren Büyük Fantastik Veritabanı (Big Fantastic Database – BFD) yatıyordu. Sistem, Çoklu Dizi Hizalama (Multiple Sequence Alignment – MSA) adı verilen bir yöntemle farklı organizmalardan gelen benzer protein dizilerini yan yana diziyor, yapay zeka bu diziler arasındaki evrimsel ilişkileri analiz ederek üç boyutlu modeli inşa ediyordu.
Ancak sistemin büyük bir handikabı vardı: Tekil proteinlerdeki başarı, karmaşık protein komplekslerinin büyük ölçekli ve hızlı tahminine aynı oranda yansımıyordu. AlphaFold’u tekli protein modellemesinden çıkarıp, milyonlarca protein kompleksini haritalayacak bir üretim bandına dönüştürmek için ekip üç kritik alana odaklandı:
Araştırma ekibi bu devasa teknolojik engelleri aşmak için doğrudan çip ve yapay zeka donanımı devi NVIDIA ile masaya oturdu. Birlikte, MMseqs2-GPU adını verdikleri yeni bir araç geliştirdiler. Bu araç, büyük veri tabanlarındaki protein homologlarının aranması sürecini, doğruluğundan hiçbir taviz vermeden GPU’ların paralel işlem gücüyle inanılmaz bir hıza taşıdı. Eş zamanlı olarak EMBL-EBI’deki yapısal biyoinformatik ekibinin lideri Sameer Velankar, AlphaFold’un tahminlerindeki güvenilirlik metriklerini katı standartlara bağladı ve bilim dünyasına sunulacak olan AlphaFold Veritabanı’nın kullanıcı arayüzünü baştan tasarladı.
İnsan da dahil olmak üzere sadece model organizmalara odaklanan önceki projelerin aksine, bu yeni işbirliği literatürde çok az çalışılmış türleri bile sisteme dahil etti. Steinegger bu vizyonu, ‘Artık genomları değil, farklı organizmalardaki karmaşık yapıları doğrudan karşılaştırabildiğimiz Karşılaştırmalı Yapı-Omik (Comparative Structure-Omics) dönemindeyiz. İnsanlar ve diğer organizmalar arasındaki hücresel çalışma mekanizması farklarını moleküler yapılar üzerinden okumak, biyolojinin en heyecan verici sırlarını açığa çıkaracak’ sözleriyle özetliyor.
Devrim niteliğindeki bu yeni AlphaFold boru hattı (pipeline) kullanılarak, ekip tam 31 milyon protein kompleksinin yapısını tahmin etmeyi başardı. Bu veri seti içinden, en yüksek güvenilirlik puanlarına sahip olan ve tamamen aynı iki proteinden oluşan 1.8 milyon ‘homodimer’ yapı seçilerek açık erişimli AlphaFold Veritabanı’na yüklendi. İncelenmesi devam eden veya güvenilirlik skoru daha düşük olan diğer modeller ise ileri araştırmalar için devasa bir veri havuzu olarak paylaşıldı.
Uzmanlar, bu modellerin hala birer ‘tahmin’ olduğunu ve kesin in vivo davranışları birebir yansıtmayabileceğini hatırlatıyor. Ancak sunulan bu 1.8 milyon yüksek doğruluklu başlangıç noktası; yıllar süren ıslak laboratuvar çalışmalarını, maliyetli cihaz yatırımlarını ve deneme-yanılma döngülerini günler hatta saatler seviyesine indirerek bilimsel hızı yeniden tanımlıyor.
Tüm Hakları Saklıdır @ 2025 - Tasarım ve Yazılım: brain.work