Large Language Model (LLM) merupakan salah satu model dalam Artificial Intelligence yang menggunakan teknik deep learning untuk memahami, merangkum, membuat dan memprediksi teks.

LLM dikembangkan berdasarkan dataset yang sangat masif, terdiri dari teks hingga kode program, yang memungkinkannya bisa menganalisis hubungan antar kata dan frase.
Hasilnya berupa teks yang secara “grammar” akan nyambung dan berarti.
Paling tidak ada 6 pekerjaan yang bisa dilakukan oleh LLM :
- Machine translation
- Text summarization
- Question answering
- Code generation
- Creative writing
- Chatbots
LLM saat ini sedang sangat aktif dikembangkan. Saya saja yang baru memantau alias mempelajari LLM dalam 2 minggu terakhir cukup amazed dengan banyaknya model yang bermunculan.
Mulai dari ChatGPT 4 buatan OpenAI, PaLM 2 buatan Google, Kosmos 2 buatan Microsoft hingga yang saat ini cukup menarik perhatian saya karena dikembangkan oleh TII UAE yaitu Falcon.
Banyak model LLM yang tersedia.
Tetapi perlu diingat bahwa sesuai dengan namanya LARGE, maka secara resource juga harus benar-benar besar.
Model Falcon 7B saja rasa-rasanya masih terlalu berat untuk dijalankan di laptop dengan dedicated GPU, apalagi model yang memiliki parameter hingga 40B lebih.
Seingat saya, BloombergGPT ditraining di puluhan server dengan masing-masing 8 kartu grafis Nvidia selama 2 bulan. Berapa juta dollar habisnya?
Yah, apapun itu, ketika kita sudah tertarik dengan suatu bidang ya eksplor saja sejauh yang bisa kita lakukan.
Kabarnya “man saaro ‘ala darbi washola”. Siapa yang berada di jalannya di akan sampai tujuan.
Kalau ini bisa kita pelajari, kita kuasai, kita kembangkan… Semoga saja suatu saat bisa menjadi ajang pengembangan diri.