Transcript
GbD73URAcp4 • Algoritma Pengambilan Keputusan
/home/itcorpmy/itcorp.my.id/harry/yt_channel/out/wawasan-cerdas/.shards/text-0001.zst#text/0005_GbD73URAcp4.txt
Kind: captions Language: id Oke, selamat datang. Pernah kepikiran enggak gimana caranya sebuah mesin bisa belajar untuk mengambil keputusan? Nah, hari ini kita akan bongkar resep dasarnya. Sebuah algoritma yang kelihatannya sederhana dari tahun 60-an tapi ternyata jadi cikal bakal AI canggih yang kita kenal sekarang. Yuk, kita mulai dengan pertanyaan yang kelihatannya simpel tapi penting banget. Bayangin deh, ada mesin yang harus misahin mana email spam, mana yang bukan. atau bayangin teleskop canggih yang harus bedain Galaxy Spiral dan elipse. Pertanyaannya, gimana caranya mesin itu tahu apa yang harus dia perhatikan? Ciri-ciri apa yang paling penting untuk ditanyakan? Nah, untuk menjawab itu kita harus paham dulu tugas dasarnya. Dalam dunia AI, tugas seperti ini dikenal sebagai klasifikasi. Sebenarnya klasifikasi ini adalah sesuatu yang kita sebagai manusia lakukan setiap detik tanpa sadar. kita otomatis mengelompokkan barang, memberi label pada berbagai hal. Ya, pokoknya kita mengkategorikan semua yang ada di sekitar kita. Contohnya banyak banget. Coba lihat deh. Mulai dari yang sepele kayak misahin email spam sampai yang rumit kayak nentuin kipe Galaxy di astronomi. Bahkan di dunia keuangan nentuin nasabah bakal lunasin pinjaman atau enggak. Intinya selalu sama, memasukkan sesuatu ke dalam kategori yang sudah ada. Jadi kalau kita formalkan sedikit, inilah yang para data scientis sebut sebagai klasifikasi. Tujuannya bikin sebuah model atau program pintar yang bisa melakukan semua penyortiran ini secara otomatis dan yang paling penting seakurat mungkin. Oke, tujuannya udah jelas. Pertanyaannya sekarang, gimana cara bikin modelnya? Ada enggak sih cara yang populer dan gampang dipahami? Ada. Bayangin aja kita lagi main tebak-tebakan. Kita bikin semacam diagram alur yang isinya cuma pertanyaan ya atau tidak yang sederhana. Nah, metode super efektif ini namanya adalah pohon keputusan atau yang sering disebut decision tree. Contoh gampangnya begini. Misal kita mau nentuin apakah seekor hewan itu mamalia atau bukan. Kita bisa mulai dengan pertanyaan, apakah hewan ini berdarah panas? Kalau jawabannya tidak, ya udah jelas itu bukan mamalia. Selesai. Tapi kalau ya, kita lanjut ke pertanyaan berikutnya. Apakah dia melahirkan? Kalau ya, oke, itu Mamia. Kalau tidak berarti bukan. Simpel kan? Kita cuma ngikutin alurnya sampai ketemu jawaban akhir. Tapi, nah ini dia pertanyaan jutaan dolarnya. Gimana caranya si mesin atau komputer tahu pertanyaan mana yang harus diajukan duluan? Kenapa harus tanya berdarah panas dulu, bukan melahirkan? Gimana caranya dia nentuin urutan pertanyaan paling efisien? Gimana pohon ini dibuat? Jawabannya ada di sebuah algoritma fundamental yang jadi cetak biru atau resep dasar untuk membangun pohon keputusan ini. Namanya adalah algoritme hunt. Idenya itu sebenarnya elegan dan sederhana banget, bagi dan taklukkan. Jadi, algoritma Hunt ini bekerja dengan cara terus-menerus memecah sekumpulan data jadi kelompok-kelompok yang lebih kecil sampai tiap kelompok itu jadi murni. prosesnya itu cuma dua langkah simpel yang diulang terus atau kalau istilah kerennya rekursif. Langkah pertama lihat datanya. Apakah semua isinya udah satu jenis? Misalnya semua nasabah di kelompok itu lunas pinjamannya. Kalau iya bagus kita kasih label di situ dan stop. Tapi kalau isinya masih campur aduk kita lanjut ke langkah kedua. Cari satu pertanyaan terbaik untuk memecah kelompok itu jadi lebih kecil dan lebih rapi. Nah, setelah dipecah kita ulangi lagi proses dari awal untuk tiap kelompok kecil yang baru terbentuk. Gitu aja terus. Oke, biar lebih kebayang, yuk kita lihat langsung gimana algoritma ini bekerja. Kita pakai contoh nyata ya. Misalnya untuk memprediksi resiko gagal bayar pinjaman. Nah, ini data kita. Kita punya beberapa informasi tentang nasabah-nasabah sebelumnya. Apakah mereka punya rumah, status perkawinannya, pendapatan tahannya, dan yang paling penting apakah mereka akhirnya gagal bayar atau enggak. Tugas si algoritma ini adalah belajar dari data historis ini untuk menemukan aturannya. Oke, langkah pertama. Di awal banget semua data kita 10 nasabah ini berkumpul jadi satu di akar pohon. Jelas ya, kelompok ini masih campur aduk. Ada yang gagal bayar, ada yang enggak. Karena belum murni, kita harus cari cara untuk memecahnya. Nah, di sinilah keajaibannya. Algoritma ini ngecek semua kemungkinan pertanyaan dan nemuin yang perbaik. Apakah nasabah ini pemilik rumah? Ternyata semua nasabah yang punya rumah di data kita itu enggak ada yang gagal bayar. Wow. Berarti cabang iya punya rumah ini langsung jadi murni. Enggak perlu dipecah lagi. Cabang ini selesai. Oke, satu cabang udah beres. Sekarang algoritma fokus ke sisanya, yaitu kelompok yang enggak punya rumah. Di sini datanya masih campur aduk, jadi prosesnya diulang. Cari pertanyaan terbaik untuk kelompok ini. Dan ketemulah status perkawinan. Ternyata pertanyaan ini bisa misahin lagi datanya dan menciptakan kelompok murni yang baru. Dan akhirnya untuk sisa data yang masih campur aduk, algoritma ini melakukan satu pemecahan terakhir kali ini berdasarkan pendapatan tahunan. Dan voala pemecahan ini berhasil menciptakan dua kelompok murni terakhir. Sekarang semua ujung cabang atau daun dari pohon kita udah murni. Artinya pohon keputusan kita sudah selesai dibangun. Tentu aja contoh barusan itu kan kelihatan mulus banget ya. Di dunia nyata data itu lebih berantakan. Jadi untuk membangun pohon keputusan yang andal ada beberapa tantangan praktis yang harus diatasi. Ada dua pertanyaan besar yang harus dijawab. Pertama, gimana sih cara nentuin pertanyaan terbaik di tiap langkah? Nah, di sini algoritma pakai perhitungan matematis kayak indeks gini atau entropi. Anggap aja ini alat untuk ngukur tingkat kekacauan data. Algoritma akan milih pertanyaan yang bisa paling drastis mengurangi kekacauan itu. Pertanyaan kedua adalah kapan kita harus berhenti mecah data? Kalau berhenti kecepatan, pohonnya jadi terlalu simpel dan enggak akurat. Tapi kalau kelamaan, bisa-bisa pohonnya jadi terlalu rumit dan malah belajar dari noise atau kebetulan-kebetulan di data, bukan pola yang sebenarnya. Selain itu, algoritma yang bagus juga harus siap sama kondisi-kondisi aneh. Misalnya, gimana kalau setelah dipecah ada satu cabang yang enggak ada datanya sama sekali atau gimana kalau ada dua data yang atributnya sama persis tapi hasilnya bada? Nah, algoritma ini punya aturan-aturan simpel tapi cerdas untuk menangani kasus-kasus kayak gitu yang bikin dia jadi lebih kuat pas dihadapkan sama data dunia nyata. Jadi, intinya apa? Logika yang kelihatannya sederhana ini, logika memecah data secara berulang atau rekursif ternyata adalah salah satu fondasi paling dasar dari machine learning. Sebuah ide dari tahun 0-an yang jadi cikalbakal AI super kompleks yang kita lihat sekarang ini bikin kita mikir ya kira-kira aturan sederlanga apaagi ya yang mungkin jadi dasar dari sistem-sistem cerdas yang jauh lebih kompleks di masa depan.