LLM ทำงานยังไง อธิบายแบบไม่ต้องใช้คณิตศาสตร์
โมเดลภาษาขนาดใหญ่ไม่ได้ "รู้" อย่างที่เราคิด มันแค่ทายคำถัดไปเก่งมาก มาดูเบื้องหลังแบบเข้าใจง่าย
ทุกคนพูดถึง ChatGPT, Claude, Gemini แต่น้อยคนรู้ว่าจริง ๆ แล้วมันทำงานยังไง บทความนี้จะอธิบายแบบไม่ต้องมีพื้นฐานเทคนิคเลย
ลองนึกถึงเวลาที่โทรศัพท์เดาคำถัดไปตอนเราพิมพ์ข้อความ โมเดลภาษาขนาดใหญ่ (LLM) ก็ทำงานคล้ายกัน แค่เก่งกว่ามหาศาล มันไม่ได้ “เข้าใจ” โลกแบบที่เราเข้าใจ แต่มันเก่งเรื่องการทายคำถัดไปจากบริบท
AI ไม่ได้ “รู้” แต่ “ทาย”
หัวใจของ LLM คือการทำนาย เมื่อเราพิมพ์ประโยคเข้าไป มันจะคำนวณว่าคำไหนน่าจะตามมามากที่สุด แล้วทายทีละคำจนได้คำตอบทั้งย่อหน้า
มันไม่ได้ค้นข้อมูลจากฐานข้อมูล แต่สร้างคำตอบขึ้นมาใหม่จากรูปแบบที่เคยเรียนรู้
นี่คือเหตุผลที่ AI ตอบได้ลื่นไหลเหมือนคนเขียน แต่ก็เป็นเหตุผลเดียวกับที่บางครั้งมันมั่นใจทั้งที่ผิด
โทเคน คือหน่วยความคิดของ AI
AI ไม่ได้มองข้อความเป็นคำ แต่เป็นชิ้นเล็ก ๆ ที่เรียกว่า “โทเคน” (token) คำหนึ่งอาจเป็นหนึ่งหรือหลายโทเคนก็ได้
- ข้อความยาว = โทเคนเยอะ = ประมวลผลนานและแพงขึ้น
- ภาษาไทยมักใช้โทเคนมากกว่าภาษาอังกฤษในข้อความเท่ากัน
ลองสั่งงานจริง
ถ้าอยากให้ AI ช่วยสรุป ลองสั่งแบบเจาะจง เช่น
สรุปบทความนี้ให้เหลือ 3 ข้อ
สำหรับคนที่ไม่มีพื้นฐานเทคนิค
ใช้ภาษาง่าย ๆ
ทำไมบางครั้ง AI ตอบมั่ว
อาการที่เรียกว่า hallucination เกิดเพราะ AI ทายคำที่ “ฟังดูน่าจะถูก” มากกว่าจะตรวจสอบความจริง มันจึงสร้างชื่อหนังสือ ตัวเลข หรือลิงก์ที่ไม่มีอยู่จริงได้อย่างมั่นใจ
แล้วเราควรใช้มันยังไง
คำตอบสั้น ๆ คือ ใช้มันเป็นผู้ช่วย ไม่ใช่ผู้ตัดสินใจ ให้มันร่าง ให้มันระดมไอเดีย แล้วเราตรวจและตัดสินใจเอง — นี่คือหัวใจของการอยู่กับ AI โดยที่ยังเป็นมนุษย์