Peneliti & Kolaborator ITMO Mengembangkan Algoritma Baru untuk Menghubungkan Gen dan Penyakit Tertentu

  • Whatsapp


Para peneliti dari Laboratorium Keanekaragaman Genom ITMO dan Pusat Penelitian Kelas Dunia untuk Personalized Medicine telah mengembangkan GPrior (prioritas gen), sebuah algoritma yang menggunakan data dari studi asosiasi genome-wide (GWAS) untuk mengidentifikasi gen yang bertanggung jawab atas penyakit tertentu. Untuk penelitian ini, kelompok tersebut menggunakan data tentang skizofrenia, penyakit jantung koroner, dan penyakit radang usus untuk menguji algoritme. Baca terus untuk mengetahui lebih lanjut tentang pengembangan dan prospek GPrior.

Kredit gambar: Pixabay (Lisensi Pixabay gratis)

GWAS dan kekurangannya

Metode studi asosiasi genome-wide (GWAS) memungkinkan untuk mengumpulkan basis data yang cukup besar dari varian DNA spesifik yang terkait dengan peningkatan risiko penyakit tertentu. Namun, dengan GWAS tidak mungkin untuk mengidentifikasi gen tertentu yang tidak berfungsi dan menyebabkan keruntuhan seluruh tubuh. GWAS dibatasi oleh genotipe berbasis microchip yang hanya dapat menunjukkan dengan tepat lokus genom yang terkait dengan penyakit – dan lokus ini dapat mencakup lusinan gen dengan hanya satu atau dua di antaranya yang benar-benar berkaitan dengan penyakit tersebut. Itulah mengapa sulit untuk menggunakan GWAS ketika mengembangkan solusi medis tertentu.

Di seluruh dunia, para peneliti bekerja untuk mengembangkan metode pascapemrosesan untuk data yang diperoleh melalui GWAS. Ini adalah tugas yang agak menantang karena mereka harus memproses database besar dengan konten yang tidak diketahui – tidak ada cara untuk mengetahui lokus genom terkait mana yang harus dianalisis dan mana yang diabaikan.

Sebuah plot Manhattan dari beberapa lokus risiko yang terkait erat. Setiap titik adalah polimorfisme nukleotida tunggal; lokasinya dicerminkan pada sumbu X, sedangkan sumbu Y menunjukkan tingkat asosiasi. Plot diambil dari studi GWAS gangguan mikrosirkulasi di pembuluh darah. Kredit gambar: M. Kamran Ikram, wikipedia.org (CC OLEH 2.5)

Para ilmuwan dari Laboratorium Keanekaragaman Genom ITMO dengan rekan-rekan dari Pusat Penelitian Kelas Dunia untuk Personalized Medicine datang dengan solusi mereka sendiri untuk masalah tersebut. GPrior adalah alat berbasis pembelajaran mesin yang membantu memprioritaskan gen yang terkait dengan peningkatan risiko penyakit menggunakan pembelajaran positif tanpa label (di mana dimungkinkan untuk mengajarkan model hanya menggunakan contoh positif).

“Dalam sebagian besar kasus, kita dapat dengan aman mengatakan bahwa satu gen tertentu tidak bertanggung jawab atas perkembangan fenotipe. Data yang diperoleh melalui GWAS memberi kita sejumlah kecil contoh positif gen yang perannya dalam perkembangan fenotipe yang dapat kita identifikasi dengan aman, dan sejumlah besar gen, yang tidak kita ketahui secara pasti – mereka dapat positif atau negatif. Algoritme kami mengambilnya sendiri untuk memecahkan teka-teki ini dan menandai semua kasus yang belum ditentukan ini, ”jelas Nikita Kolosov, penulis studi, seorang peneliti di Laboratorium Internasional “Teknologi Komputer” dan pemrogram di Laboratorium Keanekaragaman Genom dan Pusat Penelitian Kelas Dunia untuk Pengobatan Pribadi.

Pisahkan gandum dari sekam

Bagaimana kita bisa melatih algoritme untuk melihat apa yang penting dalam sejumlah besar data? Pendekatan klasik untuk melatih pengklasifikasi, seperti algoritme untuk mendeteksi tumor dalam gambar, bergantung pada sejumlah besar contoh positif (gambar dengan tumor di dalamnya) dan negatif (gambar yang pasti tidak menampilkannya). Metode ini tidak berlaku dalam penentuan prioritas gen – terlalu banyak data yang tidak teridentifikasi dan tidak bertanda dalam input.

Itulah mengapa para peneliti memutuskan untuk mengambil pendekatan lain: mereka menggunakan lima pengklasifikasi berbeda yang secara berurutan menganalisis kumpulan data yang menetapkan anotasi fungsional untuk setiap gen di dalamnya. Algoritme menggunakan dua jenis fitur yang penulis sebut sebagai SNP (polimorfisme nukleotida tunggal) dan level gen. Rantai nukleotida serupa pada lokus kromosom homolog dianalisis pada tingkat SNP, sedangkan pada tingkat gen, anotasi fungsional ditetapkan, seperti namanya, untuk gen tertentu. Dengan cara ini, dimungkinkan untuk membuat tabel dengan semua gen dan fungsinya.

Ansambel GPrior kerangka pembelajaran berlabel positif. Kredit gambar: alam.org

“Kami mengambil output GWAS dan varian gen yang berkorelasi dengan fenotipe tertentu (seperti penyakit) dan menautkannya ke gen tertentu dengan menetapkan berbagai anotasi fungsional. Kami juga menggunakan anotasi tambahan seperti tingkat ekspresi di jaringan yang berbeda (ginjal, hati, dll.) dan kemudian menggunakannya untuk memprioritaskan semua gen yang kami analisis. Hasilnya, kami mendapatkan daftar peringkat gen berdasarkan kemungkinannya untuk dihubungkan dengan perkembangan fenotipe tertentu,” jelas Nikita Kolosov.

Ansambel serba guna

Menurut penulis penelitian, metode baru ini tidak hanya sangat efisien tetapi juga merupakan alat serbaguna yang fleksibel. Algoritme memungkinkan untuk mengambil pendekatan individual untuk setiap kumpulan data baru berkat ansambel lima pengklasifikasi pada intinya yang secara berurutan menganalisis sejumlah besar data.

Algoritma baru adalah tersedia di GitHub dan terbuka untuk peneliti dari seluruh dunia dan pengembang berencana untuk terus mendukung dan meningkatkannya lebih lanjut.

Namun, secara umum, penulis mengakui bahwa belum ada solusi yang memuaskan untuk mengidentifikasi gen risiko pada penyakit poligenik. Untuk saat ini, tugas tersebut masih rumit oleh sejumlah besar masalah.

Nikita Kolosov berpendapat bahwa langkah dari GWAS ke elemen genetik spesifik yang berpotensi bertanggung jawab atas perkembangan penyakit adalah langkah yang agak tidak sepele. Pada saat yang sama, ini adalah tugas yang harus diselesaikan karena begitu kita menemukan penyebab genetik suatu penyakit, akan memungkinkan untuk mengembangkan pengobatan farmasi yang efisien.

“Memahami struktur genetik dan mengidentifikasi kombinasi gen di balik penyakit tertentu akan menjadi penemuan terobosan,” kata peneliti. “Banyak kondisi poligenik, seperti skizofrenia atau penyakit jantung koroner, dapat dikaitkan dengan efek gabungan dari mutasi pada sejumlah besar gen yang berinteraksi satu sama lain. Mendekonstruksi fitur kompleks seperti itu dan mengidentifikasi alasan genetiknya adalah tugas penting untuk kedokteran. Dan kolaborasi antara pusat genomik dan bioinformatika terkemuka, seperti ITMO, Pusat Penelitian Kelas Dunia untuk Personalized Medicine, dan Broad Institute dalam kasus kami, adalah kunci untuk solusi baru yang efektif.”

Referensi: Nikita Kolosov, Mark J. Daly, Mykyta Artomov. Prioritas gen penyakit dari GWAS menggunakan pembelajaran berlabel positif berbasis ensemble. Jurnal Genetika Manusia Eropa, 29, 1527–1535 (2021).

Sumber: Universitas ITMO




Pos terkait

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Situs ini menggunakan Akismet untuk mengurangi spam. Pelajari bagaimana data komentar Anda diproses.