Jika pernah membaca sesuatu tentang chatbot AI canggih seperti ChatGPT, Google Bard atau alternative Chatbot AI lainnya mungkin akan menemukan istilah model bahasa besar (LLM). Keluarga GPT LLM OpenAI memberdayakan ChatGPT, sementara Google LaMDA adalah chatbot Bardnya Google sebagai sejarah kecerdasan buatannya sendiri.
Ini adalah model pembelajaran mesin yang kuat yang dapat menghasilkan teks yang terdengar alami. Namun seperti yang biasanya terjadi pada teknologi baru, tidak semua model bahasa besar sama. Jadi dalam artikel ini, mari kita lihat lebih dekat apa itu Google LaMDA dan model bahasa besar yang menggerakkan chatbot Google Bard.
Apa itu Google LaMDA?
LaMDA adalah model bahasa percakapan yang dikembangkan sepenuhnya di Google. Kita dapat menganggapnya sebagai saingan langsung GPT-4 yang diusung oleh model bahasa mutakhir OpenAI. Istilah LaMDA adalah singkatan dari Language Model for Dialogue Applications. Sama seperti artinya, itu menandakan bahwa model tersebut telah dirancang khusus untuk meniru dialog manusia.
Ketika Google pertama kali meluncurkan model bahasa besarnya pada tahun 2020, itu tidak bernama LaMDA. Pada saat itu kita mengenalnya sebagai Meena, AI yang dilatih dalam sekitar 40 miliar kata. Demo awal menunjukkan model tersebut mampu menceritakan lelucon penuh dengan sendirinya, tanpa merujuk ke database atau daftar yang telah diprogram sebelumnya.
Google akan terus memperkenalkan model bahasanya sebagai LaMDA kepada audiens yang lebih luas. Perusahaan mengatakan bahwa LaMDA telah dilatih tentang percakapan dan cerita manusia. Ini membuatnya terdengar lebih alami dan bahkan menampilkan berbagai persona. LaMDA juga dapat menghasilkan teks seperti halnya ChatGPT.
Selain menghasilkan dialog mirip manusia, LaMDA berbeda dari chatbot yang ada karena dapat memprioritaskan balasan yang masuk akal dan menarik. LaMDA memprioritaskan saran yang bermanfaat dan jawaban yang cerdas.
Menurut posting blog Google di LaMDA, akurasi faktual menjadi perhatian besar karena chatbots yang ada akan menghasilkan teks fiksi yang kontradiktif atau langsung ketika ditanya tentang subjek baru. Jadi untuk mencegah model bahasanya menyebarkan informasi yang salah, perusahaan mengizinkannya untuk mendapatkan fakta dari sumber informasi pihak ketiga. LaMDA generasi kedua ini dapat mencari informasi di Internet seperti manusia.
Bagaimana cara kerja LaMDA
Sebelum kita berbicara tentang LaMDA secara khusus, ada baiknya berbicara tentang cara kerja model bahasa modern secara umum. Model GPT Google LaMDA dan OpenAI keduanya mengandalkan arsitektur pembelajaran mendalam transformer Google dari tahun 2017. Transformer pada dasarnya memungkinkan model untuk membaca beberapa kata sekaligus dan menganalisis bagaimana keterkaitannya satu sama lain. Berbekal pengetahuan ini, model yang terlatih dapat membuat prediksi untuk menggabungkan kata dan membentuk kalimat baru.
Khusus untuk LaMDA, pelatihannya berlangsung dalam dua tahap:
- Pra-pelatihan : Pada tahap pertama LaMDA dilatih dengan kumpulan data 1,56 triliun kata yang bersumber dari “data dialog publik dan teks web”. Menurut Google, LaMDA menggunakan kumpulan data 40 kali lebih besar dari model bahasa perusahaan sebelumnya.
- Penyempurnaan : Menurut peneliti Google penyempurnaan jauh lebih efektif dalam meningkatkan keamanan model dan akurasi faktual. Keamanan mengukur seberapa sering model menghasilkan teks yang berpotensi berbahaya, termasuk cercaan dan polarisasi pendapat.
Untuk tahap penyempurnaan Google merekrut manusia untuk melakukan percakapan dengan LaMDA dan mengevaluasi kinerjanya. Jika menjawab dengan cara yang berpotensi membahayakan, pekerja manusia akan membubuhi keterangan percakapan dan menilai tanggapannya. Akhirnya penyempurnaan ini meningkatkan kualitas respons LaMDA jauh melampaui kondisi prapelatihan awalnya.
Perbandingan LaMDA vs GPT-3 dan ChatGPT
Di atas kertas, LaMDA bersaing dengan model bahasa OpenAI GPT-3 dan GPT-4. Namun Google belum memberi cara untuk mengakses LaMDA secara langsung pada saat penulisan artikel ini. Kita hanya dapat menggunakannya melalui Bard yang utamanya adalah pengiring pencarian dan bukan pembuat teks tujuan umum. Di sisi lain siapa pun dapat mengakses GPT-3 melalui API OpenAI.
Demikian pula ChatGPT tidak sama dengan GPT-3 atau model OpenAI yang lebih baru. ChatGPT memang didasarkan pada GPT-3.5 tetapi telah disesuaikan lebih lanjut untuk meniru percakapan manusia.
Jadi bagaimana perbandingan LaMDA vs GPT-3? Berikut ini ikhtisar singkat tentang perbedaan utama:
- Pengetahuan dan akurasi : LaMDA dapat mengakses internet untuk mendapatkan informasi terbaru, sementara GPT-3 dan bahkan GPT-4 memiliki batas pengetahuan pada September 2021 saat penulisan artikel ini. Jika ditanya tentang peristiwa yang lebih terkini, model ini dapat menghasilkan fiksi tanggapan.
- Data pelatihan : Dataset pelatihan LaMDA sebagian besar terdiri dari dialog, sementara GPT-3 menggunakan semuanya mulai dari entri Wikipedia hingga buku tradisional. Itu membuat GPT-3 lebih umum dan dapat disesuaikan untuk aplikasi seperti ChatGPT.
- Pelatihan manusia : Di bagian sebelumnya kita sudah berbicara tentang bagaimana Google mempekerjakan pekerja manusia untuk menyempurnakan modelnya demi keselamatan dan kualitas. Sebaliknya GPT-3 OpenAI tidak menerima pengawasan manusia atau penyetelan. Tugas itu diserahkan kepada pengembang atau pembuat aplikasi seperti ChatGPT dan Bing Chat.
Dapatkah berkomunikasi dengan LaMDA
Saat ini kita tidak dapat berbicara dengan LaMDA secara langsung. Tidak seperti GPT-3 dan GPT-4, Google tidak menawarkan API yang dapat digunakan untuk berinteraksi dengan model bahasanya. Sebagai solusinya kita dapat berbicara dengan Bard yaitu AI chatbot Google yang dibangun di atas LaMDA.
Namun kita tidak dapat melihat semua yang ditawarkan LaMDA melalui Bard. Itu telah dibersihkan dan lebih lanjut disesuaikan untuk berfungsi hanya sebagai pendamping pencarian. Misalnya makalah penelitian Google menunjukkan bahwa model tersebut dapat merespons dalam beberapa bahasa, Bard saat ini baru bisa mendukung bahasa Inggris. Keterbatasan ini kemungkinan karena Google baru mempekerjakan crowdworker berbahasa Inggris yang berbasis di AS untuk menyempurnakan LaMDA demi keamanan. Tapi mungkin waktu yang akan datang akan lebih banyak bahasa yang didukung.
Demikian juga saat Google sudah semakin percaya diri dengan teknologinya, kita akan melihat LaMDA muncul di Gmail, Drive, Penelusuran, dan aplikasi lainnya.
Apakah Google LaMDA seperti hidup?
LaMDA menjadi berita utama ketika seorang insinyur Google mengklaim bahwa model itu hidup karena dapat meniru manusia lebih baik daripada chatbot sebelumnya. Namun perusahaan menyatakan bahwa model bahasanya tidak memiliki perasaan.
Apakah LaMDA lulus Tes Turing?
Ya, banyak ahli yang percaya bahwa LaMDA bisa lolos Turing Test. Tes ini digunakan untuk memeriksa apakah sistem komputer memiliki kecerdasan seperti manusia. Namun beberapa berpendapat bahwa LaMDA hanya memiliki kemampuan untuk membuat orang percaya itu cerdas, bukan memiliki kecerdasan yang sebenarnya.
Apa kepanjangan dari LaMDA?
LaMDA adalah singkatan dari Language Model for Dialogue Applications. Ini adalah model bahasa besar yang dikembangkan oleh Google.