πŸ„½πŸ„ΎπŸ…ƒπŸ„΄ [185] Saat model Statistik berhenti dan deep learning algorithm yang melanjutkannya

Gambar di atas merupakan hasil scatter plot dari data (x,y).

Model Statistik apa yang akan mampu menghubungkan nilai x dengan nilai y bila korelasinya sendiri mendekati nol untuk data tersebut?

Dengan kata lain, bisakah model Statistik dibangun agar bisa diprediksi nilai y dari nilai x?

Umumnya statistikawan tidak akan terpikir untuk mencoba memodelkan hubungan antara x dan y seperti yang teramati di data itu.

Tidak ada harapan akan bisa digunakan model Statistik apapun untuk memodelkan hubungan antara x dan y di data tersebut sehingga y bisa diprediksi dari x, sekalipun dipilihkan model nonlinier.

Kemampuan statistikawan memilih-milih model nonlinier juga terbatas.

Disinilah peranan deep learning algorithm (algoritma pembelajaran mendalam) muncul.

Algoritma pembelajaran mendalam tersebut akan menggantikan statistikawan ketika mencoba berbagai cara mencarikan fungsi nonlinier yang akan menghubungkan nilai x dengan nilai y dengan ukuran fitness yang bagus.

Kenapa ada sepercik harapan bahwa deep learning algorithm akan mampu mencarikan fungsi nonlinier sehingga x bisa memprediksi y dengan baik?

Inilah janji Universal Approximation Theorem.

Sebagi eksperimen, data yang nampaknya menunjukkan tidak adanya hubungan antara x dan y itu ternyata diciptakan dari fungsi y = sin(x), dengan x bilangan prima. Sifatnya, nilai fungsinya relatif lebih banyak mengumpul di sekitar -1 dan di sekitar 1 dibanding di nilai yang lainnya.

Fungsi sin(x) bisa diaproksimasi dengan berbagai cara melalui metode numerik. Namun harus diketahui dulu kehadiran fungsi sin(x) agar bisa diaproksimasi. Inilah classical algorithm.

Deep learning algorithm juga bisa berupaya mendapatkan fungsi nonlinier yang akan mengaproksimasi fungsi sin(x) itu.

Perbedaannya dengan classical algorithm, kali ini deep learning algorithm tidak pernah diberitahu kalau ia sedang berurusan dengan penentuan aproksimasi fungsi sin(x). Yang tersedia di hadapannya hanyalah data (x,y).

Cukup dengan kehadiran data (x,y) deep learning algorithm akan mulai bekerja mencarikan pola hubungan antara input x dengan output y sehingga akhirnya ia mampu memprediksi y dengan nilai x dengan nilai ukuran keakuratan yang baik.

Inilah learning algorithm. Ia hanya membutuhkan domain knowledge yang akan memberikan harapan jaminan bahwa x dan y memang berhubungan.

Inilah alasan utama kenapa seorang ahli Data Science perlu memiliki domain knowledge yang melatarbelakangi kemunculan suatu data.

Leave a comment