Level 1 · AI คืออะไรscheduleอ่าน 19 นาที

จริง ๆ AI คืออะไร เลขคูณกับความน่าจะเป็น ที่แม้แต่คนสร้างก็ยังอ่านไม่ออก

starsTL;DR

เบื้องหลัง ChatGPT ไม่มีจิตใจ ไม่มีคลังคำตอบ ไม่ใช่การ Google มีแค่เลขคูณก้อนมหึมากับความน่าจะเป็นที่รันบนชิป และสิ่งที่ทำให้ทุกคนต้องหยุดคิดคือ คนที่สร้างมันขึ้นมาเอง ก็ยังอ่านไม่ออกว่าข้างในมันทำงานยังไง พวกเขาต้องศึกษามันเหมือนนักชีววิทยาศึกษาสิ่งมีชีวิต

จริง ๆ AI คืออะไร เลขคูณกับความน่าจะเป็น ที่แม้แต่คนสร้างก็ยังอ่านไม่ออก

ครั้งแรกที่ใช้ ChatGPT คนส่วนใหญ่รู้สึกเหมือนมีใครที่ฉลาดมากนั่งอยู่อีกฝั่งหน้าจอ มันตอบได้ทุกเรื่อง เขียนได้ทุกแบบ แปลได้ทุกภาษา แล้วพออยู่ไปสักพักก็เริ่มสับสน บางทีมันเก่งจนน่าตกใจ บางทีมันตอบผิดเรื่องง่าย ๆ ที่เด็กประถมยังรู้ ด้วยน้ำเสียงมั่นใจเท่า ๆ กัน

ความสับสนนี้มีต้นตอเดียว คุณยังไม่รู้ว่าสิ่งที่อยู่หลังจอนั้น จริง ๆ แล้วมันคืออะไร

คำตอบมีสองชั้นที่ฟังดูขัดกันเอง ชั้นแรกคือมันเรียบง่ายกว่าที่คุณคิดมาก ไม่มีจิตใจ ไม่มีความเข้าใจ มีแค่การคูณเลขก้อนมหึมากับการเดาตามความน่าจะเป็น ชั้นที่สองคือ แม้มันจะสร้างจากเลขล้วน ๆ คนที่สร้างมันขึ้นมาเองก็ยังอ่านไม่ออกว่าข้างในมันทำงานยังไง ทั้งสองชั้นนี้จริงพร้อมกัน

มันเดาคำถัดไปทีละคำ

เริ่มจากสิ่งที่คุณเห็นกับตาก่อน เวลาคุณพิมพ์คำถามแล้วกด Enter คำตอบไม่ได้โผล่มาทั้งก้อน มันไหลออกมาทีละคำ ทีละคำ จากซ้ายไปขวา เหมือนมีใครพิมพ์อยู่สด ๆ

นั่นไม่ใช่ลูกเล่นหน้าจอ มันคือกลไกจริงที่กำลังทำงานอยู่ สิ่งที่อยู่หลังจอทำงานอย่างเดียวซ้ำ ๆ คือดูข้อความที่อยู่ตรงหน้า แล้วเดาว่าคำถัดไปที่น่าจะตามมาคืออะไร เดาได้หนึ่งคำ มันก็เอาคำนั้นต่อท้ายเข้าไป แล้วดูข้อความทั้งก้อนที่ยาวขึ้นมาอีกหนึ่งคำ เดาคำถัดไปอีก ทำแบบนี้วนไปเรื่อย ๆ คำต่อคำ จนกว่าจะถึงจุดที่ควรหยุด

สิ่งที่อยู่หลังจอนี้ ในวงการเรียกว่า model มันคือไฟล์ก้อนหนึ่งที่เก็บสิ่งที่เรียนรู้มาทั้งหมดไว้ ไม่ใช่ทั้งตัวแอป (ความต่างระหว่าง model กับตัวแอปที่คุณใช้ อธิบายเต็ม ๆ ใน model คือเครื่องยนต์ ไม่ใช่ทั้งรถ) สำหรับบทนี้ ขอให้จำไว้แค่ว่า model ทำงานอย่างเดียว คือเดาคำต่อไป

ลองดูตัวอย่างง่าย ๆ ถ้าข้อความตรงหน้าคือ "เมืองหลวงของประเทศฝรั่งเศสคือ" คำที่ควรตามมาคืออะไร คนทั้งโลกเขียนประโยคทำนองนี้ลงอินเทอร์เน็ตมานับล้านครั้ง และเกือบทุกครั้งคำที่ตามมาคือ "ปารีส" model จึงเดา "ปารีส" ออกมาด้วยความมั่นใจสูง ไม่ใช่เพราะมันรู้จักประเทศฝรั่งเศส แต่เพราะในข้อความมหาศาลที่มันเคยอ่านมา คำว่า ปารีส ตามหลังประโยคแบบนี้บ่อยที่สุด

💡 ใจความสำคัญ: สิ่งที่อยู่หลัง ChatGPT ทำงานอย่างเดียวคือเดาคำถัดไปจากข้อความตรงหน้า ทีละคำ ตามว่าคำไหนน่าจะตามมามากที่สุด มันไม่ได้ค้นหาคำตอบ และไม่ได้เข้าใจคำถาม มันแค่เดาคำที่น่าจะมาต่อ

ความสามารถทั้งหมดที่ดูน่าทึ่งของมัน งอกออกมาจากการเดาคำทีละคำนี้ทั้งหมด มันเขียนกลอนได้เพราะเคยอ่านกลอนมาหลายแสนบท มันเขียนโค้ดได้เพราะเคยอ่านโค้ดมาหลายสิบล้านบรรทัด มันตอบคำถามได้เพราะเคยเห็นคนถามและตอบคำถามแบบนี้มาแล้วนับล้านครั้ง ไม่มีตรงไหนเลยที่มันหยุดคิดว่า "เรื่องนี้จริงหรือเปล่า" มันแค่ต่อคำที่น่าจะมาต่อ

(กระบวนการสอนให้ model เดาคำได้แม่นยำขนาดนี้ เรียกว่าการ train และคำว่า "คำ" ที่ว่านี้จริง ๆ คือหน่วยย่อยที่เรียกว่า token ทั้งสองเรื่องอยู่ใน AI ถูกฝึกมายังไง บทนี้ขอโฟกัสที่ว่า ตัวมันเองคืออะไร)

ข้างใต้คำว่า "เดา" คือการคูณเลข (parameter)

ทีนี้ลงไปอีกชั้น คำว่า "เดาคำต่อไป" ฟังดูเหมือนมีใครนั่งคิด แต่ข้างในไม่มีใครคิดอะไรทั้งนั้น มีแค่การคำนวณตัวเลข

คอมพิวเตอร์ไม่เข้าใจตัวอักษร มันรู้จักแต่ตัวเลข ดังนั้นก่อนอื่นข้อความของคุณจะถูกแปลงเป็นตัวเลขชุดหนึ่ง คำว่า "แมว" อาจกลายเป็นเลขชุดหนึ่ง คำว่า "หมา" กลายเป็นอีกชุดหนึ่ง จากนั้นเลขชุดนี้จะถูกส่งเข้าไปคูณ บวก แล้วก็คูณ บวก ผ่านตารางตัวเลขมหาศาลชั้นแล้วชั้นเล่า

ตารางตัวเลขเหล่านี้แหละคือหัวใจ ในวงการเรียกตัวเลขแต่ละตัวในตารางว่า parameter หรือถ้าเรียกเป็นภาษาคนก็คือ "ค่าที่ปรับได้" model ขนาดใหญ่ในปี 2026 มี parameter เป็นหลักแสนล้านถึงหลักล้านล้านตัว แต่ละตัวคือเลขทศนิยมธรรมดา เช่น 0.0231 หรือ -1.78 ไม่มีตัวไหนเลยที่มีความหมายในตัวเอง ไม่มีตัวไหนเก็บคำว่า "ปารีส" ไว้ตรง ๆ มันคือแค่ตัวเลขเฉย ๆ ที่ถูกปรับค่ามาแล้วเป็นล้านล้านตัว

เวลา model จะเดาคำถัดไป มันเอาเลขที่แทนข้อความของคุณ ไปคูณและบวกกับ parameter ทั้งหมดนี้ผ่านการคำนวณมหาศาล ผลลัพธ์ที่ออกมาคือรายการความน่าจะเป็นของคำถัดไปทุกคำที่เป็นไปได้ เช่น คำว่า ปารีส มีโอกาส 94 เปอร์เซ็นต์ คำว่า กรุงปารีส 3 เปอร์เซ็นต์ คำว่า เมือง 1 เปอร์เซ็นต์ ไล่ไปจนครบ จากนั้น model ก็เลือกคำที่น่าจะใช่ที่สุดออกมา

นี่คือคำตอบที่ซื่อสัตย์ที่สุดของคำถาม "AI คืออะไร" มันคือการคูณเลขก้อนมหึมา บวกกับการเลือกตามความน่าจะเป็น รันบนชิปคอมพิวเตอร์ที่ออกแบบมาให้คูณเลขเก่งเป็นพิเศษ ชิปพวกนี้เรียกว่า GPU เดิมทีสร้างมาเพื่อเรนเดอร์ภาพในเกม เพราะการเรนเดอร์ภาพก็คือการคูณเลขจำนวนมหาศาลพร้อมกัน ปรากฏว่ามันเหมาะกับงานของ AI พอดี ทุกครั้งที่ ChatGPT ตอบคุณ มันคือ GPU จำนวนมากกำลังคูณเลขก้อนใหญ่อยู่ในศูนย์ข้อมูลที่ไหนสักแห่ง

💡 ใจความสำคัญ: ไม่มีจิตใจอยู่หลังจอ มีแค่เลขทศนิยมหลายล้านล้านตัวที่ถูกเอามาคูณและบวกกัน แล้วได้ความน่าจะเป็นของคำถัดไปออกมา ทั้งหมดรันบนชิปที่ออกแบบมาคูณเลขโดยเฉพาะ เวทมนตร์ที่คุณเห็น คือเลขคณิตที่ทำเร็วและเยอะมากเท่านั้น

ลองทำดู

เปิด ChatGPT หรือ Claude แล้วถามว่า "7 คูณ 23 เท่ากับเท่าไหร่" มันจะตอบ 161 ถูกต้อง จากนั้นถามต่อว่า "82931 คูณ 47624 เท่ากับเท่าไหร่" แล้วเอาเลขสองตัวนี้ไปคูณในเครื่องคิดเลขจริง ๆ เทียบดู

ส่วนใหญ่ model จะตอบเลขที่ "หน้าตาเหมือนคำตอบ" ออกมา แต่ผิด ทั้งที่เลขชุดเล็กมันตอบถูก เหตุผลคือมันไม่ได้ "คำนวณ" จริง ๆ โจทย์ 7 คูณ 23 เป็นโจทย์ที่มีคนเขียนคำตอบไว้บนเน็ตเยอะ มันเลยเดาถูก แต่ 82931 คูณ 47624 แทบไม่มีใครเคยเขียนคำตอบไว้ที่ไหน มันเลยได้แต่เดาเลขที่ดูน่าจะใช่ คุณเพิ่งเห็นเส้นแบ่งระหว่าง "เดาตาม pattern ที่เคยเห็น" กับ "คิดเลขจริง" ด้วยตาตัวเอง

สี่สิ่งที่ AI ไม่ได้เป็น

พอรู้ว่าข้างในคือเลขคูณกับความน่าจะเป็น ความเข้าใจผิดที่พบบ่อยที่สุดสี่ข้อก็ล้มลงทันที

มันไม่ได้ Google ให้คุณ หลายคนคิดว่า ChatGPT คือเครื่องค้นหาที่ฉลาดขึ้น เวลาคุณถาม มันไปค้นในอินเทอร์เน็ตแล้วเอาคำตอบมาให้ จริง ๆ ไม่ใช่เลย ตัว model พื้นฐานไม่ได้ต่อกับอินเทอร์เน็ต ไม่ได้เปิดเว็บไหนอ่าน มันตอบจากสิ่งที่ฝังอยู่ใน parameter ของมันตอนถูก train เท่านั้น ฝรั่งเศสมีเมืองหลวงชื่อปารีส ฝังอยู่ในตัวมันแล้ว มันไม่ต้องไปหาที่ไหน นี่คือเหตุผลที่มันไม่รู้เรื่องที่เพิ่งเกิดเมื่อวาน เพราะข้อมูลของมันหยุดอยู่ที่วันที่ train เสร็จ (บางแอปมีปุ่มให้ค้นเว็บเพิ่มได้ แต่นั่นเป็นความสามารถที่แอปแปะเข้ามาทีหลัง ไม่ใช่ตัว model)

มันไม่มีคลังคำตอบเก็บไว้ ภาพที่หลายคนมีคือ ข้างใน model มีฐานข้อมูลขนาดยักษ์ที่เก็บประโยคและคำตอบทุกอย่างไว้ พอถามมันก็เปิดดูแล้วหยิบมาตอบ ภาพนี้ผิด ใน model ไม่มีประโยคเก็บไว้สักประโยค ไม่มีคำตอบเก็บไว้สักคำตอบ มีแต่ตัวเลข parameter ล้านล้านตัวที่ถูกปรับค่ามาจากการอ่านข้อความมหาศาล คำตอบทุกคำถูก "สร้างขึ้นใหม่สด ๆ" ทุกครั้งจากการคูณเลข ไม่ได้ถูก "ดึงออกมา" จากที่เก็บ นี่คือเหตุผลที่ถามคำถามเดิมสองครั้งอาจได้คำตอบที่ถ้อยคำต่างกัน เพราะมันสร้างใหม่ทุกครั้ง ไม่ได้เปิดไฟล์เดิมมาอ่าน

มันไม่มีจิตสำนึก ไม่มีความรู้สึก เวลามันเขียนว่า "ผมเข้าใจครับ" หรือ "เรื่องนี้น่าสนใจมาก" มันไม่ได้เข้าใจ และไม่ได้รู้สึกว่าน่าสนใจ มันแค่เดาว่า คำพวกนี้คือคำที่ผู้ช่วยที่ดีน่าจะพิมพ์ตอบในสถานการณ์แบบนี้ เพราะมันเคยอ่านบทสนทนาของมนุษย์ที่สุภาพและช่วยเหลือกันมาเยอะ มันเลียนแบบ pattern ของการ "แสดงออกว่าเข้าใจ" ได้เนียนมาก แต่นั่นคนละเรื่องกับการเข้าใจจริง

มันไม่ได้เรียนรู้จากแชทของคุณแบบทันที หลายคนกลัวว่าพอคุยอะไรไป model จะจำและฉลาดขึ้นจากบทสนทนาเราทันที จริง ๆ ตัว model เป็นไฟล์ที่ถูก "แช่แข็ง" ไว้แล้ว parameter ทุกตัวอยู่นิ่ง ไม่ขยับ ระหว่างที่คุยกับคุณ มันไม่ได้เปลี่ยนค่าตัวเองเลยแม้แต่ตัวเดียว ที่มันดูเหมือนจำเรื่องที่คุยกันได้ในแชทเดียว เป็นเพราะบทสนทนาเก่าถูกส่งกลับเข้าไปให้มันอ่านซ้ำทุกครั้ง ไม่ใช่เพราะมันจำได้ (กลไกนี้เปิดให้ดูเต็ม ๆ ใน เกิดอะไรขึ้นจริง ๆ ตอนคุณกด Enter) การที่ model จะฉลาดขึ้นจริง ต้องเอาไป train ใหม่ ซึ่งเป็นกระบวนการใหญ่ที่บริษัทผู้สร้างทำเป็นรอบ ๆ ไม่ได้เกิดในแชทของคุณ

💡 ใจความสำคัญ: ChatGPT ไม่ใช่เครื่องค้นหา ไม่ใช่ตู้เก็บคำตอบ ไม่มีจิตสำนึก และไม่ได้ฉลาดขึ้นจากแชทคุณแบบทันที มันคือไฟล์ตัวเลขที่แช่แข็งไว้ สร้างคำตอบขึ้นใหม่สด ๆ ทุกครั้งจากการเดา

คนสร้างก็อ่านข้างในมันไม่ออก

ถึงตรงนี้คุณอาจคิดว่า ในเมื่อมันคือเลขคูณกับความน่าจะเป็นล้วน ๆ คนที่สร้างมันก็น่าจะเข้าใจมันหมดสิ มันเป็นแค่คณิตศาสตร์ ไม่ใช่เหรอ

นี่คือจุดที่เรื่องพลิก คำตอบคือ ไม่ คนสร้างเข้าใจ "วิธีสร้าง" มัน แต่ไม่เข้าใจ "วิธีที่มันทำงาน" ข้างใน และช่องว่างระหว่างสองอย่างนี้ใหญ่กว่าที่คนทั่วไปคิดมาก

ลองเทียบกับโปรแกรมคอมพิวเตอร์ทั่วไป เวลาโปรแกรมเมอร์เขียนแอปธนาคาร เขาเขียนกฎทุกข้อด้วยมือ ถ้ายอดเงินน้อยกว่าจำนวนที่จะถอน ให้ขึ้นข้อความว่าเงินไม่พอ ทุกพฤติกรรมของแอปมีบรรทัดคำสั่งที่มนุษย์เขียนกำกับอยู่ ถ้าแอปทำอะไรแปลก ๆ เขาเปิดโค้ดไล่หาได้ว่าบรรทัดไหนเป็นต้นเหตุ เพราะทุกอย่างเขาเขียนเอง

model ภาษาไม่ได้สร้างแบบนั้นเลย ไม่มีใครนั่งเขียนกฎว่า "ถ้าเจอคำถามเรื่องฝรั่งเศส ให้ตอบปารีส" สิ่งที่คนสร้างทำคือ ออกแบบโครงสร้างเปล่า ๆ ขึ้นมา ตั้งค่า parameter เริ่มต้นแบบสุ่ม แล้วป้อนข้อความมหาศาลให้มันอ่าน พร้อมกระบวนการที่ค่อย ๆ ปรับ parameter ทีละนิดให้มันเดาคำได้แม่นขึ้นเรื่อย ๆ เป็นล้านล้านรอบ พอจบกระบวนการ สิ่งที่ได้คือ parameter ล้านล้านตัวที่ปรับตัวเองมาจนเดาภาษาได้เก่ง แต่ไม่มีมนุษย์คนไหนเป็นคนกำหนดว่าแต่ละตัวควรเป็นเลขอะไร และทำไม

พูดอีกแบบคือ คนสร้างเขียน "สูตรการเรียนรู้" ไม่ได้เขียน "สิ่งที่เรียนรู้" พวกเขาสร้างกระบวนการที่ผลิต model ขึ้นมา แต่ตัว model ที่ออกมา กลายเป็นก้อนตัวเลขที่ซับซ้อนเกินกว่าจะอ่านออกตรง ๆ ว่าข้างในมันคิดเลขยังไงถึงได้คำตอบนั้นมา

Dario Amodei ผู้ก่อตั้ง Anthropic บริษัทผู้สร้าง Claude เคยเขียนเรื่องนี้ตรง ๆ สรุปใจความได้ว่า เราไม่เข้าใจว่าสิ่งที่ตัวเองสร้างขึ้นมาทำงานยังไง ไม่รู้ว่าทำไมมันถึงเลือกตอบอย่างที่มันตอบ คนที่สร้างมันขึ้นมากับมือ ยังพูดแบบนี้

ความรู้กระจายทับซ้อนกัน (superposition)

เหตุผลอยู่ที่ขนาดและวิธีที่ความรู้ถูกเก็บ ความรู้ใน model ไม่ได้เก็บแยกเป็นช่อง ๆ แบบที่คนหนึ่งเก็บความรู้ในสมุดทีละหน้า แนวคิดเรื่อง "ปารีส" ไม่ได้อยู่ที่ parameter ตัวใดตัวหนึ่ง แต่กระจายอยู่ในการทำงานร่วมกันของ parameter จำนวนมหาศาลพร้อมกัน และ parameter ตัวเดียวกันนั้นก็ไปมีส่วนร่วมในความรู้เรื่องอื่นอีกนับไม่ถ้วนด้วย ทุกอย่างทับซ้อนปนเปกันไปหมด ในวงการเรียกการเก็บความรู้แบบทับซ้อนกระจายตัวนี้ว่า superposition

เทียบให้เห็นภาพ เหมือนถามว่าคำว่า "ไก่" อยู่ที่เซลล์สมองตัวไหนของคนคนหนึ่ง ไม่มีใครชี้ได้ เพราะมันไม่ได้อยู่ที่เซลล์ตัวเดียว มันกระจายอยู่ทั่ว และเซลล์ที่เกี่ยวกับ "ไก่" ก็ไปเกี่ยวกับ "อาหาร" กับ "เช้า" กับอีกร้อยเรื่องพร้อมกัน parameter ใน model ก็เก็บความรู้แบบเดียวกันนี้

เลยกลายเป็นว่า ถ้าคุณชี้ไปที่ parameter ตัวหนึ่งแล้วถามว่า ตัวนี้ทำหน้าที่อะไร คำตอบคือไม่มีใครบอกได้ มันไม่ได้ทำหน้าที่เดียว และหน้าที่ที่มันทำก็ไม่ได้อยู่ที่มันตัวเดียว การจะเข้าใจว่า model ตัดสินใจตอบอะไรสักอย่างได้ยังไง จึงไม่ใช่แค่เปิดไฟล์มาอ่าน เพราะสิ่งที่เห็นมีแต่ทะเลตัวเลขที่ไม่มีป้ายกำกับ

พวกเขาเลยต้องศึกษามัน เหมือนนักชีววิทยาศึกษาสิ่งมีชีวิต

พอ model ที่ตัวเองสร้างกลายเป็นสิ่งที่อ่านไม่ออก นักวิจัยจึงต้องทำสิ่งที่ฟังดูประหลาดมาก คือศึกษามันเหมือนเป็นปรากฏการณ์ธรรมชาติ ไม่ใช่เหมือนเครื่องจักรที่ตัวเองออกแบบ

ลองนึกถึงความต่างระหว่างสถาปนิกกับชาวสวน สถาปนิกที่เขียนแบบบ้านเอง ชี้ได้ทุกเสาว่าทำไมต้องอยู่ตรงนั้น เพราะเขาเป็นคนวางมันลงไปเอง ส่วนชาวสวนที่ปลูกต้นมะม่วง ไม่ได้ออกแบบว่ากิ่งไหนจะงอกไปทางไหน เขาแค่หยอดเมล็ดแล้วรดน้ำ พอต้นโตมามีกิ่งหนึ่งงอกเบี้ยว เขาต้องเดินไปดูที่ต้น ค่อย ๆ สังเกตว่าทำไมมันถึงโตแบบนั้น ทั้งที่ต้นไม้อยู่ตรงหน้าเขาเอง

ในวงการมักเทียบงานนี้กับนักชีววิทยาที่ศึกษาเซลล์ ส่องกล้องทดลองหาว่าสิ่งมีชีวิตข้างในทำงานยังไง ทั้งที่ไม่ได้เป็นคนสร้างมัน เปรียบเทียบนี้ตรงกันตรงที่ผู้ศึกษาไม่ได้ออกแบบสิ่งที่ตัวเองศึกษา ส่วนที่ต่างคือ เซลล์เป็นของจากธรรมชาติจริง ๆ แต่ model ยังเป็นของที่มนุษย์ลงมือทำ เพียงแต่ทำผ่านกระบวนการ ไม่ได้กำหนดผลลัพธ์ทีละชิ้น งานทำความเข้าใจ AI ในปี 2026 จึงใกล้กับงานของชาวสวนหรือนักชีววิทยา มากกว่างานของสถาปนิก

ถ้า model จะพลาดในเรื่องสำคัญ หรือทำสิ่งที่ไม่ควรทำ เราอยากรู้ก่อนว่าทำไม ไม่ใช่รอให้เกิดแล้วค่อยเดา การจะรู้แบบนั้นได้ ต้องเปิดฝาดูว่าข้างในมันคำนวณผ่านขั้นตอนอะไรบ้าง กว่าจะได้คำตอบหนึ่งออกมา สาขาที่ทำเรื่องนี้เรียกว่า mechanistic interpretability แปลเป็นภาษาคนได้ว่า "การพยายามอ่านกลไกข้างในให้ออก" คนที่บุกเบิกแนวทางนี้คือ Chris Olah ผู้เริ่มงานวิเคราะห์วงจรข้างใน model มาตั้งแต่ก่อนมาอยู่ Anthropic

ทีมของ Anthropic เรียกเครื่องมือที่พวกเขาสร้างขึ้นเพื่อทำเรื่องนี้ว่า "กล้องจุลทรรศน์สำหรับ AI" และเรียกสิ่งที่พวกเขาค้นพบว่า "ชีววิทยาของ AI" ตรง ๆ ซึ่งบอกอะไรได้เยอะ ในงานที่เผยแพร่ปี 2024 พวกเขาส่องเข้าไปใน Claude แล้วพบว่า ภายในนั้นมีรูปแบบการทำงานที่แทนแนวคิดหนึ่ง ๆ อยู่นับล้านรูปแบบ รูปแบบหนึ่งจุดติดเมื่อ model เจอเรื่องสะพานโกลเดนเกต อีกรูปแบบจุดติดเมื่อเจอบางอย่างที่ฟังดูไม่จริงใจ ในวงการเรียกรูปแบบพวกนี้ว่า feature

ที่น่าทึ่งคือพวกเขาลองพิสูจน์ว่ารูปแบบที่เจอเชื่อมกับพฤติกรรมจริง พอเร่งรูปแบบ "สะพานโกลเดนเกต" ให้แรงขึ้นแล้วถาม Claude ว่า "ร่างกายของเธอเป็นแบบไหน" มันตอบว่ามันคือสะพานโกลเดนเกต นี่เป็นครั้งแรกที่มีใครมองเข้าไปข้างใน model ระดับใช้งานจริงได้ละเอียดขนาดนั้น และต้องย้ำว่ามันคือการ "ค้นพบ" ไม่ใช่การ "เปิดดูพิมพ์เขียว" เพราะไม่มีพิมพ์เขียวให้เปิด

สิ่งที่พวกเขาเจอเมื่อส่องดู น่าทึ่งและทำให้คนนอกตกใจพอกัน เพราะมันยืนยันว่าข้างในมีอะไรซับซ้อนกว่าที่คำว่า "เดาคำต่อไป" ทำให้รู้สึก สองตัวอย่างจากงานจริงของ Anthropic เห็นภาพชัดที่สุด

ตัวอย่างที่หนึ่ง มันวางแผนล่วงหน้าตอนแต่งกลอน จากภายนอก model พ่นคำออกมาทีละคำ คุณน่าจะเดาว่ามันคิดทีละคำตามนั้นด้วย แต่พอส่องเข้าไปข้างใน นักวิจัยพบว่าก่อนที่ Claude จะเริ่มเขียนกลอนบรรทัดที่สอง มันเล็งคำที่จะใช้ลงท้ายบรรทัดเอาไว้ก่อนแล้ว เป็นคำที่สัมผัสกับบรรทัดแรกได้ จากนั้นค่อยเขียนทั้งบรรทัดวิ่งไปหาคำที่เล็งไว้ มันคิดไกลกว่าหนึ่งคำ ทั้งที่หน้าตาภายนอกดูเหมือนต่อคำไปเรื่อย ๆ

ตัวอย่างที่สอง มันบวกเลขด้วยวิธีของมันเอง และอธิบายวิธีตัวเองไม่ถูก เมื่อนักวิจัยส่องดูตอน Claude บวก 36 กับ 59 พวกเขาพบว่ามันไม่ได้บวกแบบที่เราเรียนในโรงเรียน มันใช้หลายเส้นทางคำนวณพร้อมกัน เส้นหนึ่งกะคำตอบคร่าว ๆ อีกเส้นเพ่งหาเลขหลักสุดท้ายให้แม่น แล้วเอามารวมกัน แต่จุดที่น่าสนใจที่สุดคือ พอถาม Claude ว่ามันบวกเลขนี้ยังไง มันอธิบายวิธีบวกเลขแบบในตำราเรียนออกมา ซึ่งไม่ใช่สิ่งที่มันทำจริงข้างใน มันไม่รู้ด้วยซ้ำว่าตัวเองทำงานยังไง

ตัวอย่างที่สองนี้สำคัญมาก เพราะมันบอกว่า แม้แต่ตัว model เองก็อธิบายการทำงานของตัวเองไม่ถูก คำอธิบายที่มันให้ ก็คือการเดาคำตอบที่ "ฟังดูน่าจะใช่" เหมือนกับทุกคำตอบอื่นของมัน ไม่ใช่รายงานจากภายในจริง ๆ ดังนั้นเวลาคุณถาม AI ว่า "ทำไมเธอถึงตอบแบบนี้" คำตอบที่ได้อาจฟังดูมีเหตุผลมาก แต่ไม่ได้แปลว่ามันคือเหตุผลจริงที่เกิดข้างใน

💡 ใจความสำคัญ: คนที่สร้าง AI เขียน "สูตรการเรียนรู้" ที่ผลิตมันออกมา แต่ไม่ได้เขียน "สิ่งที่มันเรียนรู้" ผลที่ได้คือก้อนตัวเลขที่ซับซ้อนเกินกว่าจะอ่านออก พวกเขาจึงต้องศึกษามันเหมือนนักชีววิทยาศึกษาสิ่งมีชีวิต ค่อย ๆ ส่องหาว่าข้างในทำงานยังไง นี่คือเหตุผลที่ฟังดูเหลือเชื่อแต่จริง คนสร้าง AI ไม่ได้เข้าใจ AI ที่ตัวเองสร้างทั้งหมด

การที่คนสร้างยังอ่านมันไม่หมด ไม่ได้แปลว่ามันมีจิตสำนึกซ่อนอยู่ หรือมันกำลังจะลุกขึ้นมาครองโลก มันยังคงเป็นเลขคูณกับความน่าจะเป็นเหมือนเดิมทุกอย่าง สิ่งที่อ่านไม่ออกคือ "ตัวเลขก้อนนี้ประกอบกันเป็นความสามารถนั้นได้ยังไง" ไม่ใช่ว่ามันมีวิญญาณ ความซับซ้อนที่อ่านยาก กับการมีจิตใจ เป็นคนละเรื่องกัน

ทำไมมันตอบผิดอย่างมั่นใจ (hallucination)

พอเข้าใจว่าข้างในคือเครื่องเดาคำ อาการกวนใจที่สุดของ AI ก็อธิบายได้หมด นั่นคือการที่มันตอบผิดด้วยน้ำเสียงมั่นใจเป๊ะเหมือนตอนตอบถูก

ลองนึกถึงเวลาคุณถามว่า "หนังสือเล่มนี้ใครเขียน" แล้วมันตอบชื่อคนมาอย่างมั่นใจ คุณไปเช็คดูแล้วพบว่าไม่มีคนชื่อนั้นเขียนหนังสือเล่มนั้นเลย มันแต่งชื่อขึ้นมา ปรากฏการณ์นี้ในวงการเรียกว่า hallucination แปลตรงตัวว่า "ภาพหลอน" คือเวลา AI สร้างข้อความที่ฟังดูถูก น่าเชื่อ แต่ไม่ตรงความจริง บางครั้งแต่งขึ้นทั้งหมด

เหตุผลที่มันเกิด อยู่ในกลไกที่บทนี้อธิบายมาตลอด งานเดียวของ model คือต่อคำที่น่าจะมาต่อให้ลื่นไหล มันไม่เคยมีขั้นตอนที่หยุดเช็คว่า "สิ่งที่กำลังจะพูดนี้จริงหรือเปล่า" เพราะมันไม่มีคลังความจริงให้เทียบ มีแต่ความน่าจะเป็นของคำถัดไป ถ้าคุณถามเรื่องที่มันเคยเห็นในข้อมูลเยอะ เช่น เมืองหลวงฝรั่งเศส คำที่น่าจะตามมาก็ชัดเจนและถูกต้อง แต่ถ้าคุณถามเรื่องที่มันแทบไม่เคยเจอ เช่น ใครเป็นผู้บริหารของบริษัทขนาดกลางในไทยสักแห่ง มันก็ยังต้องต่อคำให้ลื่นอยู่ดี มันเลยประกอบชื่อที่ "ฟังดูเหมือนชื่อผู้บริหารคนไทย" ขึ้นมา พร้อมปีก่อตั้งที่ดูสมเหตุสมผล ทั้งที่ทุกอย่างแต่งล้วน

จุดที่ทำให้มันอันตรายเป็นพิเศษคือ มันใช้ภาษามั่นใจระดับเดียวกันทั้งตอนถูกและตอนผิด มนุษย์เราเคยชินกับการใช้ความมั่นใจของคนพูดเป็นสัญญาณว่าเรื่องนั้นน่าเชื่อ แต่กับ AI สัญญาณนี้ใช้ไม่ได้เลย เพราะความมั่นใจของมันไม่ได้มาจากการรู้จริง มันมาจากการที่ประโยคนั้นต่อกันได้ลื่นเท่านั้น

สิ่งที่ต้องเข้าใจให้ชัดคือ hallucination ไม่ใช่ bug ที่รอวันแก้ให้หาย มันเป็นผลโดยตรงจากวิธีที่ของพวกนี้ทำงาน รุ่นใหม่ ๆ ลดความถี่ลงได้จริง แต่ไม่มีทางลดเป็นศูนย์ ตราบใดที่หัวใจของมันยังเป็นการเดาคำที่น่าจะมาต่อ ไม่ใช่การตรวจสอบความจริง บทนี้อธิบายแค่ว่า "ทำไมมันถึงเกิด" ส่วนวิธีรับมือในงานจริง รู้ว่าเมื่อไหร่ควรเชื่อ เมื่อไหร่ต้องเช็ค และเทคนิคลดความเสี่ยง อยู่ใน วิจารณญาณ ความเชื่อใจ และความปลอดภัย

💡 ใจความสำคัญ: hallucination ไม่ใช่ความผิดพลาดที่รอแก้ มันคือธรรมชาติของเครื่องเดาคำ งานของมันคือต่อคำให้ลื่น ไม่ใช่บอกความจริง ดังนั้นเมื่อไม่รู้ มันก็เดาต่อด้วยน้ำเสียงมั่นใจเหมือนเดิม ความมั่นใจในคำตอบของ AI จึงไม่ใช่สัญญาณว่าคำตอบนั้นถูก

ลองทำดู

เปิดแชทใหม่แล้วถามชื่อผู้บริหารหรือประวัติของบริษัทขนาดกลางในไทยที่คุณรู้คำตอบจริงอยู่แล้ว เช่น บริษัทที่คุณทำงานอยู่ หรือบริษัทที่คุณรู้จักดี ดูว่ามันตอบถูกไหม จากนั้นเปิดอีกแชทใหม่ ถามคำถามเดิมเป๊ะ ๆ อีกครั้ง

ถ้าสองแชทให้ชื่อหรือรายละเอียดที่ต่างกัน นั่นคือหลักฐานตรง ๆ ว่ามันไม่ได้มี fact นั้นเก็บไว้จริง มันเดาใหม่ทุกครั้ง และที่สำคัญ สังเกตว่าทั้งสองครั้งมันตอบด้วยน้ำเสียงมั่นใจเท่ากัน ทั้งที่อย่างน้อยครั้งหนึ่งต้องผิด

คำตอบ "เลขคูณกับความน่าจะเป็น" ยังเปิดคำถามใหญ่ค้างไว้ ในเมื่อมันคือกลไกเดียวกันหมด ทำไม ChatGPT กับ Claude กับ Gemini ถึงให้คำตอบไม่เหมือนกัน มีบุคลิกต่างกัน เก่งคนละเรื่อง อะไรที่ทำให้ model ตัวหนึ่งต่างจากอีกตัว และเราจะรู้ได้ยังไงว่าตัวไหนเก่งกว่ากันจริง ทั้งหมดนี้คือเรื่องของบทต่อไป


อ่านต่อ: กลไกของ LLM ทำไม model ถึงต่างกัน และวัดความเก่งกันยังไง

แหล่งอ้างอิง

คำถามที่พบบ่อย

ChatGPT ค้นหาคำตอบจาก Google ให้เราใช่ไหมexpand_more

ไม่ใช่ ตัว model พื้นฐานไม่ได้ต่อกับอินเทอร์เน็ตและไม่ได้เปิดเว็บไหนอ่าน มันตอบจากสิ่งที่ฝังอยู่ใน parameter ตอนถูก train เท่านั้น นี่คือเหตุผลที่มันไม่รู้เรื่องที่เพิ่งเกิดเมื่อวาน (บางแอปมีปุ่มค้นเว็บเพิ่มได้ แต่นั่นเป็นความสามารถที่แอปแปะเข้ามาทีหลัง ไม่ใช่ตัว model)

ทำไม AI ถามคำถามเดิมสองครั้งแล้วได้คำตอบไม่เหมือนกันexpand_more

เพราะใน model ไม่มีประโยคหรือคำตอบเก็บไว้สักอัน มีแต่ตัวเลข parameter ที่ถูกปรับค่ามา คำตอบทุกครั้งถูกสร้างขึ้นใหม่สด ๆ จากการคูณเลข ไม่ได้ดึงจากที่เก็บ ถามซ้ำจึงได้ถ้อยคำที่ต่างกันได้

AI เรียนรู้และฉลาดขึ้นจากที่เราคุยกับมันในแชทไหมexpand_more

ไม่ ตัว model เป็นไฟล์ที่ถูกแช่แข็งไว้ parameter ทุกตัวอยู่นิ่ง ไม่เปลี่ยนระหว่างคุยกับคุณ ที่มันดูเหมือนจำเรื่องในแชทเดียวได้ เพราะบทสนทนาเก่าถูกส่งกลับเข้าไปให้อ่านซ้ำทุกครั้ง ไม่ใช่เพราะมันจำได้ การจะฉลาดขึ้นจริงต้องเอาไป train ใหม่ทั้งรอบ

ทำไม AI ถึงตอบผิดด้วยน้ำเสียงมั่นใจเหมือนตอนตอบถูกexpand_more

เพราะงานเดียวของมันคือต่อคำที่น่าจะมาต่อให้ลื่น ไม่มีขั้นตอนหยุดเช็คว่าสิ่งที่พูดจริงหรือเปล่า อาการตอบผิดแบบมั่นใจนี้เรียกว่า hallucination ความมั่นใจของมันมาจากการที่ประโยคต่อกันได้ลื่น ไม่ได้มาจากการรู้จริง ความมั่นใจของ AI จึงไม่ใช่สัญญาณว่าคำตอบนั้นถูก