Note [138] Resampling sebagai data augmentation untuk menunjang proses learning

Pada kajian deep learning kadang dibutuhkan data yang banyak sekali agar diperoleh hasil yang baik dari proses learning-nya.

Teknik yang disebut data augmentation memungkinkan sebuah data (misalnya sebuah gambar) bisa diubah-ubah menjadi berbagai data baru yang akan menambah jumlah data untuk proses learning.

Untuk data yang berupa gambar, dapat digunakan berbagai tranformasi untuk memperoleh data baru, antara lain: horizontal flipping, vertical flipping, skewing, cropping, rotating, dsb.

Termasuk pula dengan tehnik penambahan noise pada gambar agar obyek utamanya menjadi semakin kabur.

Contohnya, gambar kucing di atas sebetulnya berasal hanya dari sebuah foto yang di-ubah-ubah dengan berbagai transformasi: di-flip (vertical flip), dimiringkan (rotating), di-zoom-in dsb.

Dengan cara demikian dari setiap foto kucing akan bertambah jumlahnya menjadi tujuh buah foto kucing.

Seolah-olah kucing tadi difoto lagi berulang-ulang dengan berbagai posisi.

Bila semula datanya hanya terdiri dari 1000 foto, dengan berbagai transformasi tersebut kini jumlah sampelnya akan menjadi 7000 foto.

Apalagi bila pada 7000 foto tadi ditambahi berbagai noise agar foto kucing semakin kabur. Ini akan membuat jumlah sampelnya akan semakin besar lagi.

Di dalam Ilmu Statistika, proses penambahan noise agar jumlah sampel menjadi semakin besar ini disebut stochastic bootsrapping.

Seluruh proses data augmantation ini kadang disebut pula dengan istilah resampling. Proses resampling ini akan membuat jumlah sampel yang ada akan menjadi semakin besar.

Tentu saja data augmentation tidak akan memecahkan segala persoalan yang muncul di deep learning.

Referensi dan sumber foto:
https://www.kdnuggets.com/2020/02/easy-image-dataset-augmentation-tensorflow.html

Categories: Tags: ,

Leave a comment