AI baru saja memenangkan turnamen poker melawan pemain profesional

Seorang AI baru saja mengklaim kemenangan gaming atas manusia dengan memenangkan turnamen poker 20 hari. AI, yang disebut Libratus, mengambil empat pemain poker Head-Up No-Limit Texas Hold Up Em terbaik di dunia di kasino Pennsylvania. Setelah 120.000 tangan, Libratus menang dengan memimpin lebih dari $ 1,7 juta chip.

“Saya merasa luar biasa,” kata Tuomas Sandholm, seorang ilmuwan komputer di Universitas Carnegie Mellon yang merupakan bagian dari tim yang menciptakan AI. “Ini adalah kisah David versus Goliath, dan Libratus bisa melempar kerikil.”

AI yang mahir bermain poker online luar biasa karena poker adalah permainan “informasi tidak sempurna”: pemain tidak tahu kartu apa yang dimiliki lawan mereka, jadi jangan pernah memiliki pandangan penuh tentang kondisi permainan. Ini berarti AI harus memperhitungkan bagaimana lawannya bermain dan memperbaiki pendekatannya sehingga ia tidak menyerah ketika ia memiliki tangan yang bagus atau menggertak.

“Ini adalah tonggak yang sangat penting untuk kecerdasan buatan,” kata Georgios Yannakakis di University of Malta. “Ini seperti kenyataan. Dunia nyata adalah permainan informasi yang tidak sempurna, jadi dengan menyelesaikan poker online menjadi selangkah lebih dekat dengan kecerdasan buatan umum. ”

Algoritma Libratus tidak khusus untuk poker, atau bahkan hanya untuk game. AI belum diajarkan strategi apa pun dan sebaliknya harus mencari cara sendiri untuk bermain berdasarkan informasi yang diberikan – dalam hal ini, aturan poker. Ini berarti bahwa Libratus dapat diterapkan pada situasi apa pun yang memerlukan respons berdasarkan informasi yang tidak sempurna.

“Ada aplikasi dalam keamanan dunia maya, negosiasi, pengaturan militer, lelang dan banyak lagi,” kata Sandholm. Laboratoriumnya juga telah melihat bagaimana AI dapat meningkatkan perang melawan infeksi, dengan melihat rencana perawatan sebagai strategi permainan. “Anda dapat belajar memerangi penyakit dengan lebih baik bahkan jika Anda tidak memiliki obat-obatan tambahan yang Anda inginkan – Anda hanya menggunakannya dengan lebih cerdas,” kata Sandholm.

Menumpahkan kacang
Tim Carnegie Mellon sebelumnya tidak mengetahui tentang metode Libratus, takut bahwa penjelasan apa pun dapat membantu pesaing manusianya. Tapi sekarang, Sandholm bersedia mengatakan lebih banyak tentang cara kerjanya.

Libratus memiliki tiga bagian utama. Yang pertama tidak banyak berubah sejak 2015 ketika tim Sandholm pertama kali memasuki AI dalam turnamen serupa melawan pemain profesional (saat itu, manusia menang). Bagian ini menghitung daftar besar strategi yang dapat digunakan AI ketika permainan dimulai. Pada awal turnamen, Libratus telah menghabiskan setara dengan 15 juta jam perhitungan mengasah strateginya.

Baca juga: CARA LEBIH BANYAK UNTUK MAINKAN SLOT CASINO ONLINE

Bagian kedua, sekarang sepenuhnya dirancang ulang oleh Sandholm dan mahasiswa PhD-nya Noam Brown, bekerja untuk meningkatkan strategi Libratus dengan masing-masing tangan. Disebut “pemecah endgame”, itu memperhitungkan “kesalahan” yang dibuat lawan AI – contoh di mana mereka membiarkan diri mereka terbuka untuk dieksploitasi – untuk memprediksi hasil masing-masing pihak. Tim tidak bisa mengetahui dari analisis statistik jika versi sebelumnya dari pemecah permainan meningkatkan permainan AI sama sekali, kata Sandholm. “Tapi yang baru ini luar biasa.”

Bagian terakhir AI mencari kelemahan strategisnya sendiri sehingga bisa mengubah cara bermainnya sebelum sesi berikutnya. Ini berusaha untuk mengidentifikasi hal-hal yang dieksploitasi lawannya, seperti “kirim” hadiah yang pemain lain perhatikan.

Ini penting karena, di turnamen terakhir, para pemain manusia dapat mengetahui bagaimana AI bermain ketika memiliki kartu yang berbeda dan mengubah cara mereka bertaruh yang sesuai.

Baca juga: Strategi Turnamen Poker Online

Lebih sulit untuk bermain setiap hari
“Sangat bagus kali ini – cukup luar biasa,” kata Jason Les, salah satu pemain profesional, ketika turnamen memasuki hari-hari terakhir. “Tampaknya memiliki semacam komponen pembaruan strategi yang mempelajari cara terbaik untuk bermain kami. Strateginya tampaknya membaik seiring berjalannya waktu dan semakin sulit dan semakin ketat setiap hari. ”

Meskipun kalah, para pemain profesional akan membagi pot hadiah $ 200.000 berdasarkan kinerja mereka – dan para peneliti tidak akan benar-benar membawa pulang setiap kemenangan. Setelah kemenangannya, tim Libratus berencana untuk mempublikasikan algoritma AI dalam jurnal yang ditinjau sejawat.

Masih ada jalan panjang sebelum AI dapat mengambil dunia nyata, kata Simon Lucas di University of Essex, Inggris. “Di dunia nyata, kamu sering memiliki lebih banyak pilihan daripada di permainan kartu. Kemungkinannya lebih terbuka, ”katanya.

Tapi itu masih pencapaian yang fantastis karena poker adalah permainan yang kompleks, katanya. “Ini adalah langkah maju yang mengesankan dan masalah besar.”