Level 2 · รู้จัก Productscheduleอ่าน 14 นาทีทบทวนล่าสุด 2026-06-07

ตัว model เอง คือไฟล์ที่ถูกแช่แข็งไว้

starsTL;DR

คำว่า model ที่ทุกคนพูดถึง จริง ๆ คือไฟล์ก้อนหนึ่งที่ฝึกเสร็จแล้วถูกแช่แข็งไว้ ทำได้อย่างเดียวคือรับข้อความเข้า เดาข้อความออก ไม่มีความจำ ไม่ต่ออินเทอร์เน็ต ไม่ทำอะไรเองเลย บทนี้อธิบายว่าไฟล์นั้นคืออะไร ทำไมมันคือแค่เครื่องยนต์ ไม่ใช่ทั้งรถ และทำไม Opus กับ Haiku ถึงเป็นของตัวเดียวกันคนละขนาด

ai_system_layers_onion

เข้าใจองค์ประกอบทั้งหมดของ AI อย่าง ChatGPT หรือ Claude

ตัว Model เอง - ไฟล์หลายร้อย GB ที่มีตัวเลขต่างๆที่ได้รับการเทรนโดยบริษัทต่างๆมาก่อนแล้วเพื่อเป้าหมายและจุดประสงค์ของบริษัทเหล่านั้น
ส่วนที่คลุม Model อีกที (Harness) - เนื่องจาก Model เปล่าๆนั้นทำได้แค่ใส่ตัวอักษรและตอบออกมาเป็นตัวอักษร ดังนั้นเพื่อที่จะทำให้ตัวอักษรเหล่านี้นำไปใช้ในโลกแห่งความจริงได้ บริษัทด้าน AI จึงมีการนำสิ่งต่างๆมาครอบ Model อีกชั้นหนึ่ง ซึ่งโดยปกติผู้ใช้ทั่วไปอาจจะไม่ได้เห็นสิ่งนี้บนหน้าจอ ซึ่งในบทนี้คุณจะได้เข้าใจ Model มากขึ้น

คุณเปิด ChatGPT ขึ้นมา ตรงมุมจอมีปุ่มเล็ก ๆ ให้เลือก "model" กดดูก็เจอชื่อแปลก ๆ เรียงกัน GPT รุ่นนู้นรุ่นนี้ ฝั่ง Claude ก็มี Opus, Sonnet, Haiku คำว่า model นี้โผล่มาตรงนี้ โผล่ในข่าว โผล่เวลาคนคุยกัน บางคนพูดเหมือนมันเป็นสิ่งมีชีวิต บางคนพูดเหมือนมันเป็นเว็บที่ไปค้นข้อมูลมาให้ บางคนเรียก ChatGPT ทั้งตัวว่า model ไปเลย คำนี้ถูกใช้กว้างจนเบลอ จนหลายคนใช้ AI มาเป็นปีก็ยังไม่รู้ว่าตกลง "model" ที่กดเลือกอยู่ทุกวันนั้นคือ อะไร กันแน่

คำตอบเรียบง่ายกว่าที่คิดมาก และพอคุณเห็นชัด ๆ สักครั้ง เรื่องหลายอย่างที่เคยงงจะเข้าที่ทันที model ที่ทุกคนพูดถึง จริง ๆ แล้วคือ ไฟล์ก้อนหนึ่ง ไฟล์ที่ฝึกเสร็จแล้วถูกแช่แข็งไว้ ไม่ขยับ ไม่เปลี่ยน และมันทำได้อย่างเดียวเท่านั้น คือรับข้อความเข้าไป แล้วเดาข้อความที่น่าจะตามมาออกมา จบแค่นั้น

model คือไฟล์ ไม่ใช่โปรแกรมที่กำลังคิดอยู่

เริ่มจากภาพที่ตรงที่สุดก่อน ตอนบริษัทอย่าง Anthropic หรือ OpenAI สร้าง AI ขึ้นมา สิ่งที่เขาทำคือเอาข้อความมหาศาลจากอินเทอร์เน็ตมาให้คอมพิวเตอร์อ่านซ้ำแล้วซ้ำเล่า เป็นเวลาหลายเดือน เพื่อค่อย ๆ ปรับตัวเลขข้างในให้เดาคำถัดไปได้แม่นขึ้นเรื่อย ๆ กระบวนการนี้คือการ "ฝึก" หรือที่เรียกในวงการว่า training (รายละเอียดว่าฝึกยังไงอยู่ใน บทเรื่องการฝึก model)

พอฝึกเสร็จ ผลลัพธ์ที่ได้คือ ตัวเลข จำนวนมหาศาล ตัวเลขพวกนี้คือสิ่งที่บันทึกความสามารถทั้งหมดของ AI เอาไว้ ในวงการเรียกตัวเลขชุดนี้ว่า weights แปลตรงตัวว่า "ค่าน้ำหนัก" weights คือผลลัพธ์ของการฝึก เป็นตัวเลขเป็นพันล้านหรือเป็นล้านล้านตัว ที่ถูกเก็บรวมไว้เป็นไฟล์ก้อนเดียว

และนี่คือจุดที่คนส่วนใหญ่เข้าใจผิด พอฝึกเสร็จแล้ว ไฟล์ก้อนนี้ก็ นิ่ง ตัวเลขทุกตัวถูกล็อกค่าไว้ ไม่เปลี่ยนอีกเลย มันเหมือนหนังสือที่พิมพ์เสร็จออกจากโรงพิมพ์แล้ว ตัวอักษรทุกตัวอยู่ที่เดิมตลอดไป คุณอ่านมันได้ แต่มันไม่เขียนตัวเองเพิ่ม ไม่แก้ตัวเอง คำที่นิยมใช้กับสภาพนี้คือ model ถูก freeze หรือ "แช่แข็ง" ไว้

weights_as_connection_strength

💡 ใจความสำคัญ: สิ่งที่เรียกว่า model ไม่ใช่โปรแกรมที่กำลังคิดอยู่ตลอดเวลา มันคือไฟล์ตัวเลขก้อนหนึ่งที่ฝึกเสร็จแล้วถูกล็อกค่าไว้ นิ่งสนิท เหมือนหนังสือที่พิมพ์เสร็จแล้ว ความสามารถทั้งหมดของมันถูกแช่แข็งอยู่ในไฟล์นั้น

ความนิ่งนี้อธิบายเรื่องที่หลายคนสงสัยได้ทันที ทำไม AI ถึง "ไม่รู้ข่าววันนี้" คำตอบคือไฟล์มันถูกแช่แข็งตั้งแต่วันที่ฝึกเสร็จ มันรู้แค่สิ่งที่อยู่ในข้อมูลตอนฝึก เหตุการณ์ที่เกิดหลังจากวันนั้นไม่ได้อยู่ในไฟล์ จุดตัดของความรู้นี้มีชื่อเรียกว่า knowledge cutoff ตัวอย่างจริงคือ Claude รุ่น Opus 4.8 มีความรู้ที่เชื่อถือได้ถึงราว ๆ มกราคม 2026 เท่านั้น อะไรที่เกิดหลังจากนั้น ตัวไฟล์ไม่รู้ และจะไม่รู้เอง เพราะมันแช่แข็งไปแล้ว (ถ้ามันตอบข่าววันนี้ได้ แปลว่ามีคนไปค้นมาป้อนให้มันอ่าน ซึ่งเป็นเรื่องของบทถัด ๆ ไป)

มันทำได้อย่างเดียว คือเดาข้อความถัดไปต่อจาก TEXT-IN

ทีนี้ไฟล์ก้อนนี้ทำอะไรได้ คำตอบสั้นจนน่าตกใจ มันทำได้อย่างเดียว

คุณป้อนข้อความเข้าไปก้อนหนึ่ง มันอ่านข้อความนั้น แล้วเดาว่าคำถัดไปที่น่าจะตามมาคืออะไร เดาได้แล้วก็ต่อคำนั้นเข้าไป แล้วเดาคำถัดไปอีก ทำซ้ำไปเรื่อย ๆ จนได้คำตอบทั้งย่อหน้า นั่นคือทั้งหมดที่มันทำ รับข้อความเข้า เดาข้อความออก ในวงการเรียกคุณสมบัตินี้ว่า model เป็นแบบ text-in text-out คือมีช่องรับเข้าช่องเดียวเป็นข้อความ และช่องออกช่องเดียวเป็นข้อความ (กลไกการเดาคำถัดไปนี้อธิบายเต็ม ๆ ใน บทว่า AI คืออะไรจริง ๆ)

ฟังดูเหมือนน้อย แต่ความสามารถที่ดูฉลาดทั้งหมดของ AI โผล่ออกมาจากการเดาคำนี้แหละ เพราะการจะเดาคำถัดไปให้ถูกในทุกบริบท มันต้องจับแพตเทิร์นของภาษา เหตุผล และความรู้ไว้เยอะมาก แต่จุดที่ต้องย้ำคือ มันไม่ได้ทำอะไรนอกเหนือจากนี้เลย มันไม่เปิดเว็บ ไม่เปิดไฟล์ ไม่กดปุ่ม ไม่ส่งอีเมล ตัวไฟล์เปล่า ๆ ทำสิ่งเหล่านี้ไม่ได้สักอย่าง มันรู้แค่วิธีรับข้อความแล้วคายข้อความ

ลองนึกภาพเครื่องที่มีช่องใส่กระดาษเข้าไปช่องหนึ่ง กับช่องที่พ่นกระดาษคำตอบออกมาช่องหนึ่ง ไม่มีหน้าจอ ไม่มีปุ่ม ไม่มีสายไฟต่อออกไปไหน คุณเขียนคำถามใส่กระดาษยัดเข้าไป มันพ่นกระดาษคำตอบกลับมา จบ มันมีแค่ช่องเข้ากับช่องออก และข้างในคือไฟล์ที่แช่แข็งไว้ ตัวไฟล์ model แท้ ๆ มีหน้าตาแบบนี้เป๊ะ

และมันไม่มีความจำเลยสักนิด

มาถึงคุณสมบัติที่สำคัญที่สุดของไฟล์ก้อนนี้ และเป็นข้อที่ทำให้คนงงกับ AI มากที่สุด ตัว model ไม่มีความจำ

หมายความว่ายังไง ทุกครั้งที่คุณป้อนข้อความเข้าไป มันอ่าน เดาคำตอบออกมา แล้ว ลืมทุกอย่างทิ้ง รอบถัดไปที่ป้อนเข้าไปใหม่ มันเริ่มจากศูนย์ ไม่มีอะไรค้างอยู่จากรอบก่อนเลย เหมือนคนที่ความจำรีเซ็ตทุกครั้งที่ตอบเสร็จ มันไม่ได้จดว่าเมื่อกี้คุณถามอะไร ไม่ได้เก็บว่าคุณเป็นใคร พอจบรอบหนึ่งก็เหมือนตื่นมาเจอคุณครั้งแรกทุกครั้ง ในวงการเรียกคุณสมบัตินี้ว่า model เป็นแบบ stateless แปลคร่าว ๆ ว่า "ไม่มีสถานะค้าง" หรือพูดเป็นภาษาคนคือ "ไม่มีความจำข้ามรอบ"

ตรงนี้คนมักจะแย้งในใจทันทีว่า "เป็นไปไม่ได้ ในแชทเดียวกัน AI มันจำได้นะว่าเมื่อกี้คุยอะไรกัน" และคุณพูดถูกที่มันดูเหมือนจำได้ แต่ความจริงคือมันไม่ได้จำ สิ่งที่เกิดขึ้นจริงคือมีคนคอยเอาบทสนทนาเก่าทั้งหมดมาป้อนให้มันอ่านใหม่ทุกรอบ มันถึงตอบต่อเนื่องได้ ไม่ใช่เพราะจำ แต่เพราะได้อ่านซ้ำ กลไกเบื้องหลังเรื่องนี้คือหัวใจของอีกบทหนึ่งทั้งบท คือ เกิดอะไรขึ้นตอนคุณกด Enter ตอนนี้แค่จำไว้ว่า ตัวไฟล์ model เองไม่เก็บอะไรไว้เลยระหว่างการเรียกแต่ละครั้ง

เพราะงั้น model จึงเป็นแค่เครื่องยนต์ ไม่ใช่ทั้งรถ

ถึงตรงนี้คุณน่าจะเริ่มเอะใจ ในเมื่อตัว model ทำได้แค่เดาข้อความ ไม่ค้นเว็บ ไม่จำอะไร ไม่กดปุ่ม แล้ว ChatGPT ที่คุณใช้อยู่ทุกวัน ที่มันค้นข่าวให้ได้ จำได้ว่าคุณชอบคำตอบสั้น อ่านไฟล์ที่คุณแนบ มันทำได้ยังไง

คำตอบคือกุญแจของทั้ง section นี้ สิ่งที่คุณเปิดใช้ทุกวันที่ชื่อ ChatGPT หรือ Claude ไม่ใช่ตัว model มันคือ ผลิตภัณฑ์ ที่ถูกสร้างขึ้นมาห่อ model ไว้อีกชั้นหนึ่ง ตัว model เป็นแค่ชิ้นส่วนหนึ่งที่อยู่ข้างใน รอบ ๆ มันมีโปรแกรมอีกชั้นที่คอยจัดการให้ คอยไปค้นเว็บแทน คอยจดความจำแทน คอยเอาบทสนทนาเก่ามาป้อนซ้ำให้ ชั้นที่ห่อรอบ model นี้มีชื่อเรียกของมัน คือ harness และมันใหญ่และสำคัญพอที่จะมีบทเป็นของตัวเองทั้งบท คือ Harness ส่วนที่ไม่มีใครพูดถึง

วิธีที่ตรงที่สุดในการจำเรื่องนี้คือนึกถึงรถ ตัว model เปรียบเหมือน เครื่องยนต์ เครื่องยนต์คือหัวใจที่สร้างพลัง ในกรณีนี้คือสร้างคำ แต่เครื่องยนต์เปล่า ๆ วางอยู่บนพื้น พาคุณไปไหนไม่ได้เลย มันไม่มีพวงมาลัย ไม่มีล้อ ไม่มีหน้าปัด ไม่มีถังน้ำมัน ทั้งคัน ต่างหากที่ขับได้จริง และทั้งคันคือเครื่องยนต์บวกกับทุกอย่างที่ประกอบรอบ ๆ มัน ผลิตภัณฑ์ AI ที่คุณใช้ก็เหมือนกัน คือ model บวกกับทุกอย่างที่ห่อรอบมันไว้

การเปรียบเทียบนี้เพี้ยนตรงเดียว คือในรถจริงเครื่องยนต์ไม่ใช่ชิ้นที่คุณมองเห็น แต่ในกรณี AI ตัว model ดันเป็นชิ้นที่ผลิตคำที่คุณอ่านอยู่โดยตรง เลยทำให้เส้นแบ่งดูเบลอกว่ารถจริง แต่หลักการยังตรงเป๊ะ

💡 กฎที่ควรจำ: model คือเครื่องยนต์ ผลิตภัณฑ์อย่าง ChatGPT หรือ Claude คือทั้งคัน ความสามารถที่คุณเห็นว่า AI ค้นเว็บได้ จำได้ ทำงานต่อเนื่องได้ ส่วนใหญ่มาจากสิ่งที่ห่อรอบ model ไม่ใช่ตัว model เปล่า ๆ

พอเห็นภาพนี้ ความสับสนหลายอย่างคลายไปพร้อมกัน คำถามที่ว่า "model ไหนฉลาดที่สุด" กลายเป็นคำถามที่ยังไม่ครบ เพราะผลลัพธ์ที่คุณได้ขึ้นอยู่กับสิ่งที่ห่อรอบมันด้วย model ตัวเดียวกันเป๊ะ ๆ พอเอาไปอยู่ในสองผลิตภัณฑ์ที่ห่อต่างกัน ก็ให้ความรู้สึกคนละโลกได้ และนี่คือเหตุผลที่งานเดียวกัน บางคนทำกับ AI แล้วออกมาดี บางคนทำแล้วพัง ทั้งที่ใช้ model ตัวเดียวกัน ความต่างไม่ได้อยู่ที่เครื่องยนต์ แต่อยู่ที่วิธีขับและสิ่งที่ประกอบรอบ ๆ

แล้วชื่ออย่าง Opus, Sonnet, Haiku คืออะไร

ทีนี้มาถึงเรื่องที่หลายคนสับสนเวลาเลือกใช้งาน เวลาคุณเห็นชื่ออย่าง Claude Opus, Claude Sonnet, Claude Haiku หรือฝั่ง OpenAI ที่มีรุ่นใหญ่ รุ่น mini รุ่น nano พวกนี้คืออะไร ทำไมมีหลายชื่อ

คำตอบคือ ชื่อพวกนี้คือ ไฟล์ model คนละไฟล์ ที่บริษัทเดียวกันสร้างขึ้นในรุ่นเดียวกัน แต่ทำมาคนละขนาด มันคือการเลือกแลกระหว่างสามอย่าง คือ ความเก่ง ความเร็ว และราคา ไฟล์ที่ใหญ่กว่าเก็บความสามารถได้มากกว่า เดาเก่งกว่าในงานยาก แต่ก็หนักกว่า ทำให้ช้ากว่าและแพงกว่า ไฟล์ที่เล็กกว่าเดาได้เร็วกว่ามากและถูกกว่ามาก แลกกับว่าจะพลาดในงานที่ต้องคิดซับซ้อน

เอาตระกูล Claude เป็นตัวอย่าง ในรุ่นปัจจุบัน (กลางปี 2026) สามตัวนี้คือไฟล์คนละไฟล์ที่วางตำแหน่งต่างกันชัดเจน

Opus คือตัวที่เก่งที่สุด ทำมาสำหรับงานที่ต้องคิดซับซ้อนจริง ๆ งานเขียนโค้ดยาว ๆ งานที่ต้องวางแผนหลายขั้น แลกมากับว่าแพงสุดและตอบช้ากว่าตัวอื่นในตระกูล
Sonnet คือตัวกลาง เป็นจุดสมดุลระหว่างความเร็วกับความเก่ง เหมาะกับงานประจำวันส่วนใหญ่ เร็วกว่า Opus และถูกกว่า
Haiku คือตัวเล็กที่สุดและเร็วที่สุด ทำมาสำหรับงานง่าย ๆ ที่ต้องการความเร็วและราคาถูก ถูกที่สุดในสามตัว

ส่วนต่างของราคาไม่ใช่นิด ๆ ตัวเก่งสุดแพงกว่าตัวเล็กสุดหลายเท่าตัวต่อปริมาณงานเท่ากัน (ราคาที่ว่านี้คือราคาแบบจ่ายตามการใช้งานจริงสำหรับนักพัฒนาที่ต่อ AI เข้าโปรแกรมตัวเอง คนละอย่างกับค่าสมาชิกรายเดือนแบบเหมาจ่ายที่คุณจ่ายตอนใช้แอป ChatGPT หรือ Claude ตัวเลขเป๊ะ ๆ และวิธีคิดเงินทั้งหมดเก็บไว้ในบท จัดการ token และค่าใช้จ่าย)

จะเห็นรูปแบบชัด ๆ เก่งขึ้นแปลว่าแพงขึ้นและช้าลง ถูกลงแปลว่าเร็วขึ้นแต่เก่งน้อยลง สามตัวนี้ไม่ได้มีตัวไหน "ดีที่สุด" ลอย ๆ มันดีที่สุดคนละสถานการณ์ ฝั่ง OpenAI ก็ใช้ตรรกะเดียวกัน รุ่นใหญ่คือตัวเก่งสุดแพงสุด รุ่น mini และรุ่น nano คือตัวที่เล็กลง เร็วขึ้น ถูกลง ตามลำดับ ชื่อต่างกันแต่หลักคิดเหมือนกันเป๊ะ คือเลือกแลกระหว่างเก่ง เร็ว ถูก

วิธีคิดที่ใช้ได้จริงคือเลือกตัวให้พอดีกับงาน งานง่าย ๆ อย่างจัดรูปแบบข้อความ สรุปสั้น ๆ ตอบคำถามทั่วไป ใช้ตัวเล็กก็พอ ได้คำตอบเร็วและประหยัด ส่วนงานที่ต้องคิดหนักจริง ๆ อย่างวางแผนที่ซับซ้อน แก้โจทย์ยาก ๆ หรือเขียนโค้ดที่ต้องไม่พลาด ค่อยจ่ายแพงขึ้นใช้ตัวใหญ่ การเอาตัวใหญ่สุดมาทำงานจิ๊บจ๊อยทุกอย่างไม่ได้แปลว่าฉลาดกว่า มันแค่ช้าและแพงกว่าโดยไม่จำเป็น

ลองทำดู: เทียบตัวเล็กกับตัวใหญ่ด้วยตาตัวเอง

ถ้าเครื่องมือที่คุณใช้เลือก model ได้ (สลับระหว่างตัวเล็กกับตัวใหญ่ที่เครื่องมือของคุณมีให้เลือก) ลองทำแบบนี้ เอาคำถามง่าย ๆ หนึ่งข้อ เช่น "ช่วยแก้ประโยคนี้ให้สุภาพขึ้น" แล้วถามทั้งกับตัวเล็กและตัวใหญ่ สังเกตสองอย่าง หนึ่งคือความเร็ว ตัวเล็กจะตอบเร็วกว่าเห็นได้ชัด สองคือคุณภาพ สำหรับงานง่ายแบบนี้ คำตอบมักจะดีพอ ๆ กัน

จากนั้นเปลี่ยนเป็นคำถามที่ต้องคิดหลายขั้น เช่น "วางแผนทริปสามวันให้ครอบครัวสี่คน งบสองหมื่น ลูกเล็กสองคน เดินทางด้วยรถยนต์" คราวนี้ลองเทียบคำตอบของตัวเล็กกับตัวใหญ่ดี ๆ คุณจะเริ่มเห็นว่าตัวใหญ่จัดการเงื่อนไขที่ซ้อนกันได้รอบคอบกว่า นี่คือนาทีที่คุณเห็นกับตาว่า "เก่งกว่า ช้ากว่า แพงกว่า" ของตัวใหญ่ มันคุ้มในงานแบบไหน และเปลืองเกินจำเป็นในงานแบบไหน

ทำไมเรื่องนี้สำคัญเป็นพิเศษกับคนไทย

มีมุมหนึ่งที่คนไทยควรรู้ไว้ตั้งแต่ตรงนี้ ราคาคิดตาม token และภาษาไทยกิน token มากกว่าภาษาอังกฤษอย่างมีนัยสำคัญสำหรับเนื้อหาความยาวเท่ากัน หลายเท่าตัว (เหตุผลเชิงกลไกว่าทำไมถึงเป็นแบบนี้อยู่ใน บทเรื่องภาษาไทยกับ AI)

แปลว่าการเลือก model ให้พอดีกับงานสำคัญกับคนไทยมากเป็นพิเศษ เพราะข้อความภาษาไทยความยาวเท่ากัน เราจ่ายแพงกว่าคนที่ใช้ภาษาอังกฤษอยู่แล้ว ยิ่งถ้าเผลอเอาตัวใหญ่สุดมาทำงานง่าย ๆ ทุกอย่างด้วย ค่าใช้จ่ายยิ่งบานเร็ว ข่าวดีคือพอคุณเข้าใจว่าสามตัวนี้คือการแลกระหว่างเก่ง เร็ว ถูก คุณก็เลือกได้อย่างมีเหตุผลทันที งานไหนใช้ตัวเล็กพอ ก็ใช้ตัวเล็ก เก็บตัวใหญ่ไว้ตอนที่งานคุ้มกับมันจริง ๆ

สรุป: ไฟล์ก้อนหนึ่งที่ทำได้อย่างเดียว

เมื่อรู้ว่า model คือไฟล์ที่แช่แข็งไว้ ทำได้แค่เดาคำ ไม่มีความจำ ไม่ต่อเน็ต คุณก็มีเส้นแบ่งที่ใช้มองทุกอย่างต่อจากนี้ได้ คือเส้นระหว่างตัวเครื่องยนต์กับทั้งคันที่ห่อมันไว้ มีเส้นนี้แล้ว คำถามที่เคยตอบไม่ได้จะตอบได้ทีละข้อ ทำไม AI ตัวเดียวกันถึงให้ผลคนละโลกในสองแอป ทำไมงานเดียวกันบางคนทำแล้วดีบางคนทำแล้วพัง และเลือก model ตัวไหนกับงานแบบไหนถึงจะคุ้ม

แต่ยังเหลือคำถามที่ค้างอยู่ ในเมื่อตัว model ทำได้แค่เดาคำ แล้วความสามารถอย่างค้นเว็บ จำความ ทำงานต่อเนื่อง มันมาจากไหน คำตอบอยู่ในชั้นที่ห่อรอบเครื่องยนต์ ชั้นที่ชื่อ harness และเป็นบทต่อไป

อ่านต่อ: Harness ส่วนที่ไม่มีใครพูดถึง