Note [162] Potensi model bahasa untuk mengajari mesin berlogika

Sekelompok peneliti dari Google Research telah menggunakan model bahasa untuk mengajari mesin melakukan sintesa (berlogika).

Ada dua buah tugas mesin. Pertama, mesin ditugaskan untuk membikinkan program komputer (Python code). Kedua, mesin ditugaskan menjawab pertanyaan tentang persoalan di Matematika.

Model-model Deep Learning yang digunakan demikian besar, mulai dari model dengan 244 juta parameters sampai model dengan 137 milyar parameters.

Lima tahun lalu, bila seseorang menjalankan sebuah model Deep Learning dengan 100 juta parameters maka ia sudah berprestasi menggunakan model terbesar.

Kalau setiap komputer ditugaskan untuk melakukan penaksiran 100 juta sampai 500 juta parameters, berapa ratus komputer diperlukan untuk menyelesaikannya secara serempak untuk model terbesar?

Tentu ini akan melibatkan ratusan komputer untuk menjalankannya secara serempak.

Hasilnya sudah lumayan.

Mesin bisa ditugaskan membikin program komputer (Python code) dengan akurasi jawaban sekitar 60% dan bisa menjawab pertanyaan matematik dengan akurasi jawaban sekitar 80%.

Gambar di atas memberikan ilustrasi uji coba komunikasi antara seseorang (warna ungu) dan mesin (warna biru).

Mula-mula mesin diminta untuk menuliskan program komputer (Python code) untuk mencari bilangan terbesar yang yang bisa disusun dari angka-angka yang ada di sebuah list.

Mesin merespon: ‘Berikan dulu contoh list-nya’.

Contohnya, dari list [1,2,3] maka bisa disusun angka 321 sebagi bilangan terbesar.

Ketika sudah diberikan contohnya, mesin mula-mula memberikan jawaban umum dengan Python code, mungkin belum efisien algoritmanya.

Ketika orang itu melihat jawabannya, lalu ia memberikan feedback agar dibikinkan Python code yang lebih efisien algoritmanya melalui pertanyaan-pertanyaan berikutnya.

Mesin pun meresponnya dengan urutan jawaban sesuai feedback yang diperoleh dari orang itu.

Sampai akhirnya mesin bisa memberikan Python code sebagai jawaban yang paling efisien algoritmanya.

Dari contoh ini, nampak mesin secara interaktif bisa menjawab dengan baik berbagai pertanyaan orang tentang pembuatan Python code untuk berbagai tugas yang diberikannya.

Ini memberikan gambaran bahwa mesin sudah mulai mampu memahami bahasa, sehingga ia bisa memahami isi pertanyaan yang diajukan seseorang dan mesin langsung memberikan respon melalui penyajian jawabannya.

We use big language models to synthesize computer programs, execute programs, solve math problems, and dialog with humans to iteratively refine code.

The models can solve 60% and 81% of the programming and math problems, respectively.

Referensi:
https://twitter.com/gstsdn/status/1427794393373626368?s=09

Leave a comment