Note [136] Hal terpenting dalam perkembangan Ilmu Statistika selama 50 tahun terakhir

Paper ini membahas kontribusi utama di dalam Ilmu Statistika selama setengah abad. Ia akan menjelaskan keterkaitannya dengan komputasi modern dan big data. Ia juga membahas bagaimana Statistika dapat dikembangkan dan diperluas dalam beberapa dekade mendatang.

Tujuan dari artikel ini untuk memancing pemikiran dan diskusi mengenai tema penelitian yang lebih besar di dalam Statistika dan data science.

Paper ini akan membahas delapan sub-bidang yang paling berperan dalam perkembangan Statistika terkini.

  1. Counterfactual causal inference menempatkan inferensi kausal dalam kerangka statistik sehingga masalah kausalitas dapat secara tepat didefinisikan dan diekspresikan. Ia juga menghubungkan ide-ide dalam pengambilan sampel dan imputasi data yang hilang (Little (1993), Little dan Rubin (2002)).
  2. Bootstrapping and simulation-based inference membuka pintu ke bentuk pemodelan nonparametrik secara implisit.
  3. Overparameterized models and regularization memformalkan dan memperluas praktek untuk membatasi ukuran model berdasarkan kemampuan untuk memperkirakan parameternya dari data melalui validasi silang dan kriteria informasi (Akaike (1973), Mallows (1973), Watanabe (2010)).
  4. Bayesian multilevel models memformalkan teknik empirical Bayes untuk memperkirakan prior diatribution dari data. Penggunaan metode tersebut akan meningkatkan stabilitas komputasi dan inferensi yang mampu menjangkau berbagai masalah yang jauh lebih luas lagi.
  5. Generic computation algorithms memungkinkan praktisi terapan untuk dengan cepat menyesuaikan advanved models untuk inferensi kausal, analisis multilevel, reinforcement learning dan bidang lainnya. Ia akan memberikan dampak lebih luas pada perkembangan statistika sendiri dan machine learning.
  6. Adaptive decision analysis menghubungkan masalah rekayasa optimal control ke bidang statistical learning, jauh melampaui classical experimental design (rancangan percobaan klasik).
  7. Robust inference memformalkan intuisi tentang kestabilan inferensi yang memperkenankan evaluasi formal dan pemodelan berbagai prosedur untuk menangani outlier dan misspesifikasi model. Robust inference telah membantu memformulasika ide-ide dalam penaksiran nonparametrik (Owen (1988)).
  8. Exploratory data analysis akan menjadi jembatan untuk memahami dan mendiagnosa masalah di berbagai model probabilitas yang kompleks melalui tehnik visualisasi untuk menemukan informasi yang sesuai dari data.

Sebagian besar sejarah Statistika dapat dipandang sebagai penggabungan ide-ide dari luar bidang Statistika sendiri. Ide-ide apa lagi di masa depan yang kiranya akan layak dikembangkan dari luar bidang Statistika?

Dalam dua puluh tahun terakhir, deep learning telah sukses besar. Dengan teori statistika tradisional sering kali tampaknya ia berjuang untuk mengejar ketertinggalannya.

Sejauh Statistika terapan dan data science yang sering dilakukan dalam bidang sains dan teknik, maka dapat diharapkan akan banyak perkembangan baru yang datang dari bidang deep learning. Seperti halnya dulu perkembangan di dalam Statistika yang berasal dari bidang terapan seperti Psikologi dan Genetika.

Mengingat bahwa hampir semua implentasi metode statistik dan data science secara komputasi akan mahal, maka dapat diantisipasi penelitian masa depan tentang validasi metode inferensi akan mengambil ide-ide dari rekayasa perangkat lunak dan menerapkannya pada masalah learning dari data yang noisy.

Ilmu Statistika harus terus terbuka terhadap gagasan dalam bentuk kerangka teori umum serta model dan metode khusus yang berasal dari bidang lain.

Ketika metode statistik menjadi lebih maju, akan selalu muncul kebutuhan yang bersifat terus-menerus untuk memahami hubungan antara data, model, dan teori substantif.

Referensi:
https://arxiv.org/abs/2012.00174

Categories: Tags: ,

Leave a comment