Bioinformatika
merupakan ilmu terapan yang lahir dari perkembangan teknologi informasi
dibidang molekular. Pembahasan dibidang bioinformatik ini tidak terlepas dari
perkembangan biologi molekular modern, salah satunya peningkatan pemahaman
manusia dalam bidang genomic yang terdapat dalam molekul DNA.
Kemampuan untuk
memahami dan memanipulasi kode genetik DNA ini sangat didukung oleh teknologi
informasi melalui perkembangan hardware dan soffware. Baik pihak pabrikan
sofware dan harware maupun pihak ketiga dalam produksi perangkat lunak. Salah
satu contohnya dapat dilihat pada upaya Celera Genomics, perusahaan
bioteknologi Amerika Serikat yang melakukan pembacaan sekuen genom manusia yang
secara maksimal memanfaatkan teknologi informasi sehingga bisa melakukan
pekerjaannya dalam waktu yang singkat (hanya beberapa tahun).
Perkembangan
teknologi DNA rekombinan memainkan peranan penting dalam lahirnya
bioinformatika. Teknologi DNA rekombinan memunculkan suatu pengetahuan baru
dalam rekayasa genetika organisme yang dikenala bioteknologi. Perkembangan
bioteknologi dari bioteknologi tradisional ke bioteknologi modren salah satunya
ditandainya dengan kemampuan manusia dalam melakukan analisis DNA organisme,
sekuensing DNA dan manipulasi DNA.
Sekuensing DNA satu
organisme, misalnya suatu virus memiliki kurang lebih 5.000 nukleotida atau
molekul DNA atau sekitar 11 gen, yang telah berhasil dibaca secara menyeluruh
pada tahun 1977. Kemudia Sekuen seluruh DNA manusia terdiri dari 3 milyar
nukleotida yang menyusun 100.000 gen dapat dipetakan dalam waktu 3 tahun,
walaupun semua ini belum terlalu lengkap. Saat ini terdapat milyaran data
nukleotida yang tersimpan dalam database DNA, GenBank di AS yang didirikan
tahun 1982.
Bioinformatika ialah ilmu yang mempelajari penerapan teknik komputasi untuk mengelola dan menganalisis
informasi hayati. Bidang ini mencakup penerapan metode-metode matematika, statistika, dan informatika untuk memecahkan masalah-masalah
biologi, terutama yang terkait dengan penggunaan sekuens DNA dan asam amino. Contoh topik utama
bidang ini meliputi pangkalan data untuk mengelola
informasi hayati, penyejajaran sekuens (sequence alignment), prediksi
struktur untuk meramalkan struktur protein atau pun struktur sekunder RNA, analisis filogenetik, dan analisis
ekspresi gen.
Bioinformatika
pertamakali dikemukakan pada pertengahan 1980an untuk mengacu kepada penerapan ilmu komputer dalam bidang biologi. Meskipun
demikian, penerapan bidang-bidang dalam bioinformatika seperti pembuatan
pangkalan data dan pengembangan algoritma untuk analisis sekuens biologi telah dilakukan
sejak tahun 1960an.
Kemajuan teknik biologi molekuler dalam mengungkap sekuens biologi
protein (sejak awal 1950an) dan asam nukleat (sejak 1960an) mengawali perkembangan
pangkalan data dan teknik analisis sekuens biologi. Pangkalan data sekuens
protein mulai dikembangkan pada tahun 1960an di Amerika Serikat, sementara pangkalan data sekuens DNA
dikembangkan pada akhir 1970an di Amerika Serikat dan Jerman pada Laboratorium Biologi Molekuler Eropa (European Molecular Biology Laboratory).
Penemuan teknik sekuensing DNA yang lebih cepat pada pertengahan
1970an menjadi landasan terjadinya ledakan jumlah sekuens DNA yang dapat
diungkapkan pada 1980an dan 1990an. Hal ini menjadi salah satu pembuka jalan bagi
proyek-proyek pengungkapan genom, yang meningkatkan
kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan
lahirnya bioinformatika.
Perkembangan jaringan
internet juga mendukung berkembangnya
bioinformatika. Pangkalan data bioinformatika yang terhubungkan melalui
internet memudahkan ilmuwan dalam mengumpulkan hasil sekuensing ke dalam
pangkalan data tersebut serta memperoleh sekuens biologi sebagai bahan
analisis. Selain itu, penyebaran program-program aplikasi
bioinformatika melalui internet memudahkan ilmuwan dalam mengakses
program-program tersebut dan kemudian memudahkan pengembangannya.
Pangkalan Data sekuens biologi dapat berupa pangkalan
data primer untuk menyimpan sekuens primer asam nukleat dan protein, pangkalan data sekunder untuk
menyimpan motif sekuens protein, dan pangkalan data struktur untuk menyimpan
data struktur protein dan asam nukleat.
Pangkalan data utama
untuk sekuens asam nukleat saat ini adalah GenBank (Amerika Serikat), EMBL (the European
Molecular Biology Laboratory, Eropa), dan DDBJ (DNA Data Bank of
Japan, Jepang). Ketiga pangkalan
data tersebut bekerja sama dan bertukar data secara harian untuk menjaga
keluasan cakupan masing-masing pangkalan data. Sumber utama data sekuens asam
nukleat adalah submisi (pengumpulan) langsung dari peneliti individual, proyek
sekuensing genom, dan pendaftaran paten. Selain berisi sekuens asam nukleat, entri dalam pangkalan
data sekuens asam nukleat pada umumnya mengandung informasi tentang jenis asam
nukleat (DNA atau RNA), nama organisme sumber asam nukleat tersebut, dan
segala sesuatu yang berkaitan dengan sekuens asam nukleat tersebut.
Selain asam nukleat,
beberapa contoh pangkalan data penting yang menyimpan sekuens primer protein
adalah PIR (Protein Information Resource, Amerika
Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga
pangkalan data tersebut telah digabungkan dalam UniProt, yang didanai terutama oleh Amerika
Serikat. Entri dalam UniProt mengandung informasi tentang sekuens protein, nama
organisme sumber protein, pustaka yang berkaitan, dan komentar yang pada
umumnya berisi penjelasan mengenai fungsi protein tersebut.
Perangkat
bioinformatika yang berkaitan erat dengan penggunaan pangkalan data sekuens
Biologi ialah BLAST (Basic Local
Alignment Search Tool). Penelusuran BLAST (BLAST search) pada
pangkalan data sekuens memungkinkan ilmuwan untuk mencari sekuens baik asam
nukleat maupun protein yang mirip dengan sekuens tertentu yang dimilikinya. Hal
ini berguna misalnya untuk menemukan gen sejenis pada beberapa organisme atau untuk memeriksa keabsahan hasil sekuensing atau untuk memeriksa fungsi gen hasil
sekuensing. Algoritma yang mendasari kerja
BLAST adalah penyejajaran sekuens.
PDB (Protein Data
Bank, Bank Data Protein) ialah pangkalan data tunggal yang menyimpan model
struktur tiga dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR, dan mikroskopi elektron). PDB menyimpan data
struktur sebagai koordinat tiga dimensi yang menggambarkan
posisi atom-atom dalam protein
atau pun asam nukleat.
Tidak ada komentar:
Posting Komentar