πŸ„½πŸ„ΎπŸ…ƒπŸ„΄ [180] Data Science untuk Biologi dan Kesehatan: DeepMind mampu memprediksi ekspresi gen dari barisan DNA dengan Deep Learning

DNA membawa informasi genetik yang menentukan segala sesuatu yang terjadi di tubuh manusia, mulai dari warna mata hingga kerentanan terhadap penyakit dan kelainan tertentu.

Bagian dari DNA di dalam tubuh manusia yang dikenal sebagai gen mengandung instruksi tentang urutan asam amino protein yang memegang peranan penting di dalam tubuh manusia.

Namun gen ini memuat kurang dari 2% dari genom. Sisanya yang 98% dari 3 miliar susunan huruf dalam genom (disebut non-coding) berisi berbagai instruksi yang masih kurang dipahami dengan baik tentang kapan dan dimana gen harus diproduksi atau diekspresikan dalam tubuh manusia.

DeepMind menggunakan Deep Learning telah membuka pemahaman yang lebih dalam tentang domain kompleks seperti itu. Ia akan mempercepat kemajuan ilmiah dan menawarkan potensi manfaat bagi kesehatan manusia.

DeepMind memperkenalkan  Enformer yang bebasis pada model Deep Learning bernama Transformer. Ia secara akurat akan memprediksi ekspresi gen dari urutan DNA.

Tujuan utama dari Enformer untuk meramalkan perubahan susunan huruf DNA sebagai variasi genetik yang akan mempengaruhi ekspresi gen.

Model Transformer yang digunakan di Enformer ini biasanya dipakai untuk pengurutan kata (atau huruf) di dalam masalah bahasa yang ditemui di Natural Language Processing (NLP).

Transformers dirancang agar mampu membaca bagian teks yang panjang di suatu naskah. Kemampuan ini sekarang dimanfaatkan untuk melihat urutan DNA yang panjang.

Enformer mengenali kosakata dari urutan DNA sebagaimana ia mampu memeriksa ejaan di dalam suatu bahasa. Dengan demikian ia mempunyai kemampuan untuk menunjukkan urutan DNA yang berpotensi akan mengubah ekspresi gen.

Enformer yang diperkenalkan DeepMind mampu melihat jarak urutan DNA yang semakin menjauh yang masih mampu mempengaruhi ekspresi gen.

Studi sebelumnya tentang ekspresi gen menggunakan jaringan saraf convolutional (Convolutional Neural Network) sebagai blok bangunan utama. Namun, akurasi dan kegunaannya terhambat oleh masalah pemodelan untuk melihat pengaruh urutan DNA yang saling berjauhan jaraknya yang masih mempengaruhi ekspresi gen.

Enformer mengungguli model sebelumnya dalam memprediksi dampak variasi genetik pada ekspresi gen.

Keunggulan Enformer ini bisa membantu untuk menguraikan peningkatan jumlah variasi jenis penyakit yang ditemukan dalam studi yang terkait dengan genom.

Enformer merupakan langkah maju yang signifikan dalam studi tentang urutan genom yang kompleks. Tim bermaksud untuk berkolaborasi dengan peneliti dan organisasi lain yang tertarik menggunakan model komputasi untuk menjawab masalah besar terkait genom.

Penelitian ini telah dipublikasikan di Nature Methods dengan judul makalah Effective gene expression prediction from sequence by integrating long-range interactions.

Referensi:
https://deepmind.com/blog/article/enformer

DeepMind Introduces ‘Enformer’, A Deep Learning Architecture For Predicting Gene Expression From DNA Sequence

Leave a comment