Transcript
GbD73URAcp4 • Algoritma Pengambilan Keputusan
/home/itcorpmy/itcorp.my.id/harry/yt_channel/out/wawasan-cerdas/.shards/text-0001.zst#text/0005_GbD73URAcp4.txt
Kind: captions
Language: id
Oke, selamat datang. Pernah kepikiran
enggak gimana caranya sebuah mesin bisa
belajar untuk mengambil keputusan? Nah,
hari ini kita akan bongkar resep
dasarnya. Sebuah algoritma yang
kelihatannya sederhana dari tahun 60-an
tapi ternyata jadi cikal bakal AI
canggih yang kita kenal sekarang. Yuk,
kita mulai dengan pertanyaan yang
kelihatannya simpel tapi penting banget.
Bayangin deh, ada mesin yang harus
misahin mana email spam, mana yang
bukan. atau bayangin teleskop canggih
yang harus bedain Galaxy Spiral dan
elipse. Pertanyaannya, gimana caranya
mesin itu tahu apa yang harus dia
perhatikan? Ciri-ciri apa yang paling
penting untuk ditanyakan? Nah, untuk
menjawab itu kita harus paham dulu tugas
dasarnya. Dalam dunia AI, tugas seperti
ini dikenal sebagai klasifikasi.
Sebenarnya klasifikasi ini adalah
sesuatu yang kita sebagai manusia
lakukan setiap detik tanpa sadar. kita
otomatis mengelompokkan barang, memberi
label pada berbagai hal. Ya, pokoknya
kita mengkategorikan semua yang ada di
sekitar kita. Contohnya banyak banget.
Coba lihat deh. Mulai dari yang sepele
kayak misahin email spam sampai yang
rumit kayak nentuin kipe Galaxy di
astronomi. Bahkan di dunia keuangan
nentuin nasabah bakal lunasin pinjaman
atau enggak. Intinya selalu sama,
memasukkan sesuatu ke dalam kategori
yang sudah ada. Jadi kalau kita
formalkan sedikit, inilah yang para data
scientis sebut sebagai klasifikasi.
Tujuannya bikin sebuah model atau
program pintar yang bisa melakukan semua
penyortiran ini secara otomatis dan yang
paling penting seakurat mungkin. Oke,
tujuannya udah jelas. Pertanyaannya
sekarang, gimana cara bikin modelnya?
Ada enggak sih cara yang populer dan
gampang dipahami? Ada. Bayangin aja kita
lagi main tebak-tebakan. Kita bikin
semacam diagram alur yang isinya cuma
pertanyaan ya atau tidak yang sederhana.
Nah, metode super efektif ini namanya
adalah pohon keputusan atau yang sering
disebut decision tree. Contoh gampangnya
begini. Misal kita mau nentuin apakah
seekor hewan itu mamalia atau bukan.
Kita bisa mulai dengan pertanyaan,
apakah hewan ini berdarah panas? Kalau
jawabannya tidak, ya udah jelas itu
bukan mamalia. Selesai. Tapi kalau ya,
kita lanjut ke pertanyaan berikutnya.
Apakah dia melahirkan? Kalau ya, oke,
itu Mamia. Kalau tidak berarti bukan.
Simpel kan? Kita cuma ngikutin alurnya
sampai ketemu jawaban akhir. Tapi, nah
ini dia pertanyaan jutaan dolarnya.
Gimana caranya si mesin atau komputer
tahu pertanyaan mana yang harus diajukan
duluan? Kenapa harus tanya berdarah
panas dulu, bukan melahirkan? Gimana
caranya dia nentuin urutan pertanyaan
paling efisien? Gimana pohon ini dibuat?
Jawabannya ada di sebuah algoritma
fundamental yang jadi cetak biru atau
resep dasar untuk membangun pohon
keputusan ini. Namanya adalah algoritme
hunt. Idenya itu sebenarnya elegan dan
sederhana banget, bagi dan taklukkan.
Jadi, algoritma Hunt ini bekerja dengan
cara terus-menerus memecah sekumpulan
data jadi kelompok-kelompok yang lebih
kecil sampai tiap kelompok itu jadi
murni. prosesnya itu cuma dua langkah
simpel yang diulang terus atau kalau
istilah kerennya rekursif. Langkah
pertama lihat datanya. Apakah semua
isinya udah satu jenis? Misalnya semua
nasabah di kelompok itu lunas
pinjamannya. Kalau iya bagus kita kasih
label di situ dan stop. Tapi kalau
isinya masih campur aduk kita lanjut ke
langkah kedua. Cari satu pertanyaan
terbaik untuk memecah kelompok itu jadi
lebih kecil dan lebih rapi. Nah, setelah
dipecah kita ulangi lagi proses dari
awal untuk tiap kelompok kecil yang baru
terbentuk. Gitu aja terus. Oke, biar
lebih kebayang, yuk kita lihat langsung
gimana algoritma ini bekerja. Kita pakai
contoh nyata ya. Misalnya untuk
memprediksi resiko gagal bayar pinjaman.
Nah, ini data kita. Kita punya beberapa
informasi tentang nasabah-nasabah
sebelumnya. Apakah mereka punya rumah,
status perkawinannya, pendapatan
tahannya, dan yang paling penting apakah
mereka akhirnya gagal bayar atau enggak.
Tugas si algoritma ini adalah belajar
dari data historis ini untuk menemukan
aturannya. Oke, langkah pertama. Di awal
banget semua data kita 10 nasabah ini
berkumpul jadi satu di akar pohon. Jelas
ya, kelompok ini masih campur aduk. Ada
yang gagal bayar, ada yang enggak.
Karena belum murni, kita harus cari cara
untuk memecahnya. Nah, di sinilah
keajaibannya. Algoritma ini ngecek semua
kemungkinan pertanyaan dan nemuin yang
perbaik. Apakah nasabah ini pemilik
rumah? Ternyata semua nasabah yang punya
rumah di data kita itu enggak ada yang
gagal bayar. Wow. Berarti cabang iya
punya rumah ini langsung jadi murni.
Enggak perlu dipecah lagi. Cabang ini
selesai.
Oke, satu cabang udah beres. Sekarang
algoritma fokus ke sisanya, yaitu
kelompok yang enggak punya rumah. Di
sini datanya masih campur aduk, jadi
prosesnya diulang. Cari pertanyaan
terbaik untuk kelompok ini. Dan
ketemulah status perkawinan. Ternyata
pertanyaan ini bisa misahin lagi datanya
dan menciptakan kelompok murni yang
baru. Dan akhirnya untuk sisa data yang
masih campur aduk, algoritma ini
melakukan satu pemecahan terakhir kali
ini berdasarkan pendapatan tahunan. Dan
voala pemecahan ini berhasil menciptakan
dua kelompok murni terakhir. Sekarang
semua ujung cabang atau daun dari pohon
kita udah murni. Artinya pohon keputusan
kita sudah selesai dibangun. Tentu aja
contoh barusan itu kan kelihatan mulus
banget ya. Di dunia nyata data itu lebih
berantakan. Jadi untuk membangun pohon
keputusan yang andal ada beberapa
tantangan praktis yang harus diatasi.
Ada dua pertanyaan besar yang harus
dijawab. Pertama, gimana sih cara
nentuin pertanyaan terbaik di tiap
langkah? Nah, di sini algoritma pakai
perhitungan matematis kayak indeks gini
atau entropi. Anggap aja ini alat untuk
ngukur tingkat kekacauan data. Algoritma
akan milih pertanyaan yang bisa paling
drastis mengurangi kekacauan itu.
Pertanyaan kedua adalah kapan kita harus
berhenti mecah data? Kalau berhenti
kecepatan, pohonnya jadi terlalu simpel
dan enggak akurat. Tapi kalau kelamaan,
bisa-bisa pohonnya jadi terlalu rumit
dan malah belajar dari noise atau
kebetulan-kebetulan di data, bukan pola
yang sebenarnya. Selain itu, algoritma
yang bagus juga harus siap sama
kondisi-kondisi aneh. Misalnya, gimana
kalau setelah dipecah ada satu cabang
yang enggak ada datanya sama sekali atau
gimana kalau ada dua data yang
atributnya sama persis tapi hasilnya
bada? Nah, algoritma ini punya
aturan-aturan simpel tapi cerdas untuk
menangani kasus-kasus kayak gitu yang
bikin dia jadi lebih kuat pas dihadapkan
sama data dunia nyata. Jadi, intinya
apa? Logika yang kelihatannya sederhana
ini, logika memecah data secara berulang
atau rekursif ternyata adalah salah satu
fondasi paling dasar dari machine
learning. Sebuah ide dari tahun 0-an
yang jadi cikalbakal AI super kompleks
yang kita lihat sekarang ini bikin kita
mikir ya kira-kira aturan sederlanga
apaagi ya yang mungkin jadi dasar dari
sistem-sistem cerdas yang jauh lebih
kompleks di masa depan.