Berikut adalah rangkuman komprehensif dan terstruktur dari konten video yang Anda berikan.

Perbandingan Qwen 2.5 vs DeepSeek vs ChatGPT: Siapa Penguasa AI Terbaru?

Inti Sari (Executive Summary)

Video ini membahas peluncuran model AI terbaru dari Alibaba, Qwen 2.5, yang diklaim mampu mengungguli performa DeepSeek dan model buatan Meta. Melalui serangkaian pengujian langsung yang mencakup pembuatan gambar, analisis visual, pembuatan video, batas pengetahuan (knowledge cutoff), dan kemampuan analisis data statistik, Qwen 2.5 menunjukkan performa yang sangat kompetitif dan bahkan unggul dalam beberapa aspek krusial dibandingkan kompetitornya.

Poin-Poin Kunci (Key Takeaways)

Keunggulan Visual: Qwen 2.5 mampu menghasilkan gambar dan video secara langsung, sementara DeepSeek (dalam antarmuka yang diuji) hanya merespons teks.
Akurasi Analisis: Dalam tes menghitung objek dalam gambar, Qwen 2.5 lebih akurat daripada ChatGPT.
Update Pengetahuan: Qwen 2.5 memiliki data pengetahuan terbaru hingga Desember 2024, mengungguli ChatGPT (Juni 2024) dan DeepSeek (Desember 2023).
Kemampuan Analisis Data: Ketiga AI mampu melakukan analisis statistik (Paired T-Test), namun Qwen 2.5 menyajikan langkah-langkah perhitungan yang paling detail.
Kesimpulan: Berdasarkan pengujian, Qwen 2.5 dinilai sebagai model yang "lebih mengagumkan" dan superior dibandingkan DeepSeek maupun ChatGPT untuk kasus-kasus yang diuji.

Rincian Materi (Detailed Breakdown)

1. Pendahuluan dan Latar Belakang

Alibaba baru-baru ini merilis model AI bernama Qwen 2.5. Model ini menarik perhatian karena klaim yang dibuat oleh pengembangnya bahwa Qwen 2.5 mampu melampaui performa model AI buatan DeepSeek dan Meta. Video ini melakukan uji coba langsung untuk memverifikasi klaim tersebut dengan membandingkan Qwen 2.5 melawan DeepSeek dan ChatGPT.

2. Uji Pembuatan Gambar (Image Generation)

Skenario: Ketiga AI diminta membuat gambar dengan prompt: "Buat gambar burung khas Papua yang sangat eksotik sedang bertengger di salah satu dahan pohon di tengah hujan hujan tropis."
Hasil:
- Qwen 2.5: Menghasilkan gambar yang dinilai sangat indah, eksotik, dan terlihat natural/realistis. Narator lebih menyukai hasil ini.
- DeepSeek: Hanya menghasilkan teks deskripsi. Untuk membuat gambar di DeepSeek, pengguna perlu menggunakan integrasi Hugging Face (yang dibahas di video lain).
- ChatGPT: Menghasilkan gambar yang bagus, namun narator tetap lebih mempreferensi hasil dari Qwen 2.5.

3. Uji Analisis Gambar (Image Analysis)

Skenario: Ketiga AI diminta menghitung jumlah kambing dalam sebuah foto. Jumlah sebenarnya adalah 12 ekor.
Hasil:
- Qwen 2.5: Berhasil mengidentifikasi dengan benar jumlah kambing, yaitu 12 ekor.
- DeepSeek: Gagal mengunggah gambar secara langsung (muncul pesan "no text extracted"). Narator mencatat bahwa banyak pengguna melaporkan kendala serupa pada fitur ini.
- ChatGPT: Mampu menganalisis gambar, namun hanya menghitung 9 ekor kambing (gagal mendeteksi kambing yang berada di bagian belakang).

4. Uji Pembuatan Video (Video Generation)

Skenario: AI diminta membuat video dengan prompt: "Buat video yang memperlihatkan beberapa mobil di Jalan Raya."
Hasil:
- Qwen 2.5: Berhasil membuat video mobil di jalan raya. Video dapat diunduh atau dibuat ulang (regenerate).
- DeepSeek: Hanya merespons dengan teks, tidak ada video yang dihasilkan.
- ChatGPT: Menyatakan bahwa ia tidak bisa membuat video dan hanya mampu membuat gambar realistis.

5. Perbandingan Batas Pengetahuan (Knowledge Cutoff)

Pengujian dilakukan dengan mematikan fitur pencarian web (web search) untuk melihat pengetahuan internal masing-masing AI.
* Qwen 2.5: Pengetahuan hingga Desember 2024 (Paling terkini, selisih sekitar 1,5 bulan dari waktu video dibuat).
* ChatGPT: Pengetahuan hingga Juni 2024.
* DeepSeek: Pengetahuan hingga Desember 2023 (Paling lama di antara ketiganya).

6. Uji Analisis Data Statistik (Paired T-Test)

Skenario: Sebuah dokumen berisi data untuk uji Paired T-Test diunggah ke masing-masing AI untuk dianalisis.
Hasil:
- ChatGPT: Mampu melakukan analisis dengan benar (menghasilkan t-statistik -60 dan p-value 0,00...). Namun, versi gratisan memiliki batasan dalam pengunggahan dokumen.
- DeepSeek: Juga mampu melakukan analisis dengan benar (t-statistik -60 dan p-value < 0,001). Pada video sebelumnya, DeepSeek pernah dinilai lebih unggul dari ChatGPT dalam hal ini.
- Qwen 2.5: Mampu melakukan analisis dan memberikan hasil yang akurat. Kelebihannya adalah Qwen memberikan langkah-langkah perhitungan yang sangat detail (Langkah 1: data awal, Langkah 2: hitung selisih, Langkah 3: statistik dasar, dst) beserta kesimpulannya.

Kesimpulan & Pesan Penutup

Berdasarkan serangkaian pengujian yang meliputi visual, akurasi, kedalaman pengetahuan, dan analisis data, Qwen 2.5 dinilai sebagai model yang paling mengesankan dan unggul (superior) dibandingkan dengan DeepSeek maupun ChatGPT.

Pesan Penutup & Call to Action:
Narator, yang juga merupakan pembicara dan fasilitator topik AI, mengundang instansi atau kampus untuk mengundangnya dalam sesi sharing atau seminar (terkait jadwal di Padang dan Bandung). Selain itu, narator meminta penonton untuk memberikan komentar atau saran mengenai cara membuat atau menganalisis gambar menggunakan DeepSeek untuk dibahas dalam video selanjutnya.