Pemanfaatan Teknik Topic Modeling dalam Analisis Bio Informatika untuk Digital dengan LDA
Keywords:
Bioinformatika, Topic Modeling, Latent Dirichlet Allocation, Big Data Biologis, Analisis TeksAbstract
Kemajuan yang cepat dalam bioinformatika, terutama karena perkembangan teknologi sekuensing generasi berikutnya, telah menciptakan volume data biologis digital yang sangat besar dan rumit. Data ini mencakup informasi tentang genom, transkriptom, proteom, dan publikasi ilmiah yang bertambah setiap tahun. Situasi ini memunculkan tantangan besar dalam mengolah, mengelompokkan, dan menarik informasi berarti dari data biologis digital yang ada. Salah satu metode yang dapat digunakan untuk mengatasi tantangan tersebut adalah teknik pemodelan topik. Pemodelan topik adalah metode pembelajaran mesin tanpa pengawasan yang berfokus pada menemukan pola atau tema tersembunyi dalam kumpulan data. Dalam penelitian ini, kami menggunakan algoritma Latent Dirichlet Allocation (LDA) untuk menganalisis data bioinformatika digital yang berupa abstrak jurnal ilmiah. LDA mendeskripsikan setiap dokumen sebagai kombinasi dari beberapa topik dan tiap topik sebagai distribusi probabilistik dari kata-kata tertentu, sehingga dapat mengungkap struktur tersembunyi dalam data teks ilmiah. Hasil dari penelitian ini menunjukkan bahwa penggunaan LDA pada data bioinformatika digital dapat mengidentifikasi tujuh topik utama yang mencerminkan tren penelitian terbaru, termasuk penerapan machine learning dalam analisis kanker, metabolomik, pemodelan protein, dan juga penemuan obat berbasis data. Dengan begitu, teknik pemodelan topik yang menggunakan LDA dapat menjadi alat yang bermanfaat dalam mendukung analisis dan pemetaan pengetahuan bioinformatika di zaman digital ini.




