Glossary · ภาคผนวกศัพท์
คลังคำศัพท์
ศัพท์เทคนิคทุกคำในตำราถูก link มาที่นี่ครั้งแรกที่ปรากฏ. ถ้าศัพท์ไหนต้องการอธิบายยาวกว่านี้ มี topic note แยกในหลักสูตร — ดู “บทเต็ม” ด้านขวาของแต่ละ entry.
37 entries
A4 terms
agent
เอเจนต์
AI ที่ไม่ได้แค่ตอบข้อความ แต่ลงมือทำงานเป็นขั้นตอนได้เอง เช่นค้นเว็บ อ่านไฟล์ เขียนไฟล์ รันคำสั่ง แล้ววนทำซ้ำจนงานเสร็จ ต่างจาก AI แบบถาม-ตอบทีละครั้งตรงที่ agent ทำหลายก้าวต่อเนื่องได้โดยคุณไม่ต้องสั่งทีละก้าวบทเต็ม →
agentic loop
วงจรการทำงานของ agent
รูปแบบการทำงานวนรอบของ agent คือ คิดว่าจะทำอะไรต่อ ลงมือทำ (เช่นเรียกเครื่องมือ) ดูผลที่ได้ แล้วคิดก้าวถัดไป วนแบบนี้ไปเรื่อย ๆ จนงานเสร็จ นี่คือกลไกที่ทำให้ AI ทำงานยาว ๆ หลายขั้นตอนได้เองบทเต็ม →
alignment
การปรับให้สอดคล้อง
งานทำให้ AI ทำตามสิ่งที่คนต้องการจริง ๆ และไม่ทำสิ่งที่เป็นอันตราย การฝึกขั้นปรับแต่งอย่าง RLHF คือเครื่องมือหนึ่งของงาน alignment เป้าหมายคือให้ model มีประโยชน์ ซื่อสัตย์ และไม่ก่อภัยบทเต็ม →
API
ช่องทางให้โปรแกรมคุยกับ AI โดยตรง ไม่ผ่านหน้าแอป คิดง่าย ๆ ว่าแอป ChatGPT คือร้านอาหารที่เสิร์ฟจานสำเร็จ ส่วน API คือการซื้อวัตถุดิบกับเตามาทำเอง คุณได้ตัว model เปล่า ๆ แล้วต้องสร้างส่วนที่เหลือเอง ยืดหยุ่นกว่ามากแต่ต้องลงแรงเอง นักพัฒนาใช้ API สร้างแอปของตัวเองที่มี AI อยู่ข้างในบทเต็ม →
C2 terms
CLI
ย่อมาจาก Command Line Interface คือการสั่งงานโปรแกรมผ่านการพิมพ์คำสั่งในหน้าต่างดำ ๆ แทนการคลิกปุ่ม Claude Code เป็นตัวอย่างของ AI ที่ทำงานผ่าน CLI สำหรับคนไม่ใช่โปรแกรมเมอร์ มันดูน่ากลัวตอนแรก แต่จริง ๆ คือแค่ช่องพิมพ์คำสั่งที่ทรงพลังกว่าหน้าแอปปกติ
context window
หน้าต่างบริบท
ปริมาณข้อความสูงสุดที่ model "มองเห็น" ได้ในรอบเดียว วัดเป็น token คิดเหมือนโต๊ะทำงานที่มีขนาดจำกัด วางกระดาษได้แค่จำนวนหนึ่ง พอเต็มก็ต้องเอาของเก่าออก ทุกอย่างที่ส่งเข้าไป ทั้งคำสั่งซ่อน บทสนทนาเก่า และข้อความใหม่ของคุณ ต้องอยู่ในหน้าต่างนี้รวมกัน นี่คือสาเหตุที่แชทยาวเกินไปแล้ว model เริ่มลืมต้นเรื่อง
D1 term
E1 term
embedding
เอ็มเบดดิง การแปลงความหมายเป็นตัวเลข
วิธีแปลงข้อความ (หรือรูป) ให้กลายเป็นชุดตัวเลข ที่ของซึ่งความหมายใกล้กันจะได้ตัวเลขใกล้กันด้วย เช่นคำว่า "หมา" กับ "สุนัข" จะได้ตัวเลขที่อยู่ใกล้กัน นี่คือกลไกเบื้องหลังการค้นหาด้วยความหมาย เช่นค้นเอกสารที่ "เกี่ยวข้อง" ได้แม้ไม่ได้ใช้คำตรงกันเป๊ะบทเต็ม →
H3 terms
hallucination
อาการหลอน
อาการที่ AI ตอบสิ่งที่ฟังดูถูกแต่ผิดสนิท ด้วยน้ำเสียงมั่นใจเหมือนรู้จริง มันไม่ได้ตั้งใจโกหก มันแค่เดาคำที่น่าจะตามมา แล้วเดาผิด ปรากฏการณ์นี้เกิดได้กับ LLM ทุกตัว และเป็นเหตุผลที่คุณต้องตรวจสอบข้อมูลสำคัญจาก AI เสมอ โดยเฉพาะชื่อคน ตัวเลข วันที่ และแหล่งอ้างอิงบทเต็ม →
harness
ตัวห่อ
โปรแกรมที่ห่อรอบ model เพื่อทำให้มันใช้งานได้จริง มันคือตัวที่คอยมัดบทสนทนาเก่าส่งให้ model อ่านใหม่ทุกรอบ ต่อเครื่องมือให้ ส่งคำสั่งซ่อนเข้าไป และจัดการทุกอย่างที่ model ตัวเปล่าทำเองไม่ได้ แอป ChatGPT, Claude, Claude Code ที่คุณเปิดใช้ แต่ละตัวคือ harness ที่ห่อ model ของตัวเองไว้คนละแบบ นี่คือเหตุผลที่แต่ละแอปให้ประสบการณ์ต่างกันมาก แม้จะทำงานบนหลักการเดียวกันบทเต็ม →
hook
ฮุก ตัวดักจังหวะ
คำสั่งที่ตั้งไว้ให้ทำงานอัตโนมัติเมื่อเกิดเหตุการณ์บางอย่าง เช่นทุกครั้งที่ AI แก้ไฟล์เสร็จ ให้รันตรวจสอบโดยอัตโนมัติ ต่างจาก skill ตรงที่ hook ทำงานเองตามจังหวะที่ตั้งไว้ ไม่ต้องรอ AI ตัดสินใจ เช่นตั้งไว้ว่าทุกครั้งที่ AI เขียนโค้ดเสร็จ ให้รันตัวจัดรูปแบบโค้ดอัตโนมัติทันที
L1 term
M3 terms
MCP
ย่อมาจาก Model Context Protocol เป็นมาตรฐานกลางที่ให้ AI ต่อเชื่อมกับเครื่องมือและข้อมูลภายนอกได้ เช่นต่อเข้ากับ Google Drive, ฐานข้อมูล, หรือระบบในบริษัท คิดเหมือนหัวปลั๊กแบบมาตรฐาน พอมีมาตรฐานเดียวกัน เครื่องมือใหม่ ๆ ก็เสียบเข้ากับ AI ได้โดยไม่ต้องสร้างตัวเชื่อมใหม่ทุกครั้ง
mechanistic interpretability
การถอดกลไกภายใน
สาขางานวิจัยที่พยายามเข้าใจว่าข้างใน model เกิดอะไรขึ้นจริง ๆ ที่ต้องมีสาขานี้เพราะแม้แต่คนสร้าง model ก็อธิบายไม่ได้เต็มที่ว่าทำไมมันตอบแบบนั้น model ไม่ได้ถูก "เขียนโปรแกรม" ทีละบรรทัด แต่ "เติบโต" ขึ้นจากการฝึก ข้างในเลยเป็นกล่องดำที่ต้องค่อย ๆ แกะบทเต็ม →
O1 term
Opus / Sonnet / Haiku
ชื่อรุ่นของ model ตระกูล Claude ของบริษัท Anthropic เรียงจากตัวใหญ่สุดไปเล็กสุด Opus ฉลาดที่สุดแต่ช้าและแพงที่สุด Haiku เร็วและถูกที่สุดแต่เก่งน้อยกว่า Sonnet อยู่ตรงกลาง การเลือกรุ่นคือการแลกกันระหว่างความฉลาด ความเร็ว และราคา งานง่ายใช้รุ่นเล็กก็พอ งานยากค่อยขยับขึ้นรุ่นใหญ่ (ฝั่ง ChatGPT ของ OpenAI ก็มีรุ่นเล็กใหญ่ในหลักการเดียวกัน)บทเต็ม →
P7 terms
PDPA
พระราชบัญญัติคุ้มครองข้อมูลส่วนบุคคลของไทย กฎหมายที่คุมว่าข้อมูลส่วนบุคคลถูกเก็บและใช้ได้แค่ไหน สำคัญมากเวลาคุณทำงานกับ AI เพราะการเอาข้อมูลลูกค้าหรือข้อมูลพนักงานไปวางในแชท AI อาจเข้าข่ายส่งข้อมูลส่วนบุคคลออกนอกองค์กรโดยไม่ได้รับอนุญาต > 💡 **เรื่องข้อมูลที่ควรรู้:** ตามเอกสารของ Anthropic การใช้งานแบบบัญชีบุคคล (Free/Pro/Max) ค่าเริ่มต้นคือข้อมูลของคุณ "ถูกนำไปฝึก" model เว้นแต่คุณจะปิดเองในการตั้งค่า ส่วนการใช้งานเชิงพาณิชย์ (Team/Enterprise/API) จะไม่ถูกนำไปฝึก model เว้นแต่ลูกค้าเลือกเข้าร่วมโครงการเอง รายละเอียดและความต่างของแต่ละแพลตฟอร์มอยู่ในบท 3.7
permission modes
โหมดสิทธิ์การทำงาน
การตั้งค่าว่า AI ที่ลงมือทำงานในเครื่องคุณ (อย่าง Claude Code) ต้องขออนุญาตคุณก่อนทำสิ่งต่าง ๆ มากแค่ไหน มีหลายโหมด เรียงจากระวังมากไประวังน้อย เช่น โหมดมาตรฐาน (default) ถามทุกครั้งที่จะใช้เครื่องมือใหม่ โหมดวางแผน (plan) ให้มันอ่านและสำรวจได้แต่ห้ามแก้ไฟล์ โหมดรับการแก้ไขอัตโนมัติ (acceptEdits) ยอมให้แก้ไฟล์เองโดยไม่ต้องถามทุกครั้ง และโหมดข้ามการถาม (bypassPermissions) ที่ข้ามการขออนุญาตเกือบทั้งหมด ควรใช้เฉพาะในสภาพแวดล้อมที่ปลอดภัยเท่านั้น
plugin
ปลั๊กอิน
ชุดของหลายอย่างที่แพ็กรวมกันเป็นก้อนเดียวให้ติดตั้งทีเดียว ภายในอาจมีทั้ง skill, slash command, และการตั้งค่าต่าง ๆ คิดเหมือนชุดเครื่องมือสำเร็จรูปที่ลงครั้งเดียวได้หลายอย่าง มักโหลดได้จากที่รวมปลั๊กอิน (marketplace)
post-training / fine-tune
การฝึกขั้นปรับแต่ง
ขั้นที่สองหลัง pretraining model ที่เพิ่งฝึกขั้นต้นเสร็จยังใช้งานไม่ได้ มันแค่เดาคำเก่ง แต่ไม่รู้จักตอบคำถามให้เป็นประโยชน์ ขั้นปรับแต่งคือการสอนเพิ่มให้มันตอบแบบเป็นผู้ช่วยที่ดี ทำตามคำสั่ง และไม่ตอบสิ่งที่เป็นอันตราย คำว่า fine-tune มักหมายถึงการฝึกปรับ model ที่มีอยู่แล้วให้เก่งเรื่องเฉพาะทางขึ้นบทเต็ม →
pretraining
การฝึกขั้นต้น
ขั้นแรกของการสร้าง model คือเอาข้อความมหาศาลจากอินเทอร์เน็ตและแหล่งอื่นมาให้ model ฝึกเดาคำถัดไปซ้ำ ๆ จนเก่ง จากกระบวนการนี้เอง model ค่อย ๆ ซึมซับความรู้เรื่องภาษา ข้อเท็จจริง และรูปแบบต่าง ๆ ของโลกเข้าไปโดยไม่มีใครป้อนความรู้ให้ตรง ๆบทเต็ม →
prompt
พรอมต์ คำสั่ง
ข้อความที่คุณพิมพ์ส่งให้ AI คือคำถาม คำสั่ง หรือสิ่งที่คุณอยากให้มันทำ คุณภาพของ prompt มีผลตรงต่อคุณภาพคำตอบมาก prompt ที่บอกบริบท ความต้องการ และตัวอย่างชัดเจน มักได้คำตอบที่ดีกว่า prompt สั้น ๆ คลุมเครือ
prompt caching
การแคชคำสั่ง
กลไกลดค่าใช้จ่าย เวลาส่งข้อความก้อนเดิมซ้ำ ๆ (เช่นคำสั่งระบบและบทสนทนาเก่าที่ถูกส่งใหม่ทุกรอบ) ระบบจำส่วนที่ซ้ำไว้ชั่วคราว แล้วคิดเงินถูกลงสำหรับส่วนนั้น สำคัญคือมันไม่ใช่ "ความจำ" ของ model เนื้อหายังถูกส่งไปครบทุกรอบเหมือนเดิม แค่จ่ายถูกลงเท่านั้น
R3 terms
RAG
ย่อมาจาก Retrieval-Augmented Generation เป็นวิธีให้ AI ตอบจากเอกสารหรือข้อมูลของคุณเองที่มันไม่เคยเห็นตอนฝึก หลักการคือพอคุณถาม ระบบจะไปค้นชิ้นข้อมูลที่เกี่ยวข้องมาก่อน แล้วแปะใส่ context ให้ model อ่านประกอบตอนตอบ นี่คือกลไกเบื้องหลังแชทบอตที่ตอบเรื่องเฉพาะของบริษัทได้ ทั้งที่ model กลางไม่เคยรู้เรื่องนั้นมาก่อน คุณจะเห็นคำนี้บ่อยในหน้าโปรดักต์และข่าวที่พูดถึงการเอา AI มาใช้กับข้อมูลภายในองค์กร
RLHF
ย่อมาจาก Reinforcement Learning from Human Feedback คือการฝึกปรับ model โดยใช้ความเห็นของคนเป็นตัวชี้ คนช่วยให้คะแนนว่าคำตอบไหนดีกว่ากัน model ก็ค่อย ๆ ปรับให้ตอบในแบบที่คนชอบมากขึ้น นี่คือเหตุผลใหญ่ที่ทำให้ ChatGPT ตอบได้สุภาพ ตรงประเด็น และเป็นประโยชน์ ไม่ใช่ตอบมั่ว ๆ แบบ model ดิบ (Anthropic มีอีกแนวหนึ่งชื่อ Constitutional AI ที่ใช้ชุดหลักการให้ AI ช่วยประเมินคำตอบของกันเองแทนที่จะพึ่งคนล้วน ๆ)บทเต็ม →
routine
รูทีน งานตั้งเวลา
งานที่ตั้งให้ AI ทำเองตามรอบเวลาที่กำหนด เช่นทุกเช้าเก้าโมงให้สรุปข่าวส่งมา โดยคุณไม่ต้องนั่งสั่งเอง เป็นหัวใจของแนวคิด "สร้างครั้งเดียว ใช้ได้เรื่อย ๆ"
S5 terms
skill
สกิล ทักษะ
ชุดคำสั่งและความรู้สำเร็จรูปที่เพิ่มความสามารถเฉพาะทางให้ AI เช่น สกิลทำสไลด์ สกิลทำเอกสาร Word พอติดตั้งไว้ AI จะหยิบมาใช้เองเมื่อเจองานที่ตรงกับสกิลนั้น มันไม่ใช่เวทมนตร์ เนื้อในคือไฟล์คำสั่งธรรมดาที่บอก AI ว่าให้ทำงานนั้นยังไง คุณดาวน์โหลดของคนอื่นมาใช้ หรือสร้างเองก็ได้
slash command
สแลชคอมมานด์ คำสั่งขึ้นต้นด้วย /
คำสั่งสำเร็จรูปที่คุณพิมพ์เรียกเองโดยขึ้นต้นด้วยเครื่องหมาย / เช่น `/clear` เพื่อล้างบทสนทนา ต่างจาก skill ตรงที่ slash command คุณเป็นคนสั่งเองตรง ๆ ส่วน skill นั้น AI เลือกหยิบมาใช้เองเมื่อเหมาะสม
stateless
ไม่มีความจำข้ามรอบ
คุณสมบัติของ model ที่ว่ามันไม่เก็บอะไรไว้เลยระหว่างการเรียกแต่ละครั้ง พอเดาคำตอบเสร็จหนึ่งรอบ มันลืมทุกอย่างทิ้ง รอบถัดไปเริ่มจากศูนย์ใหม่ เหมือนเพิ่งตื่นมาเจอคุณครั้งแรก ความ "จำได้" ที่คุณเห็นในแชท ไม่ได้มาจากความจำของ model แต่มาจากการที่บทสนทนาเก่าถูกส่งให้อ่านซ้ำทุกครั้งบทเต็ม →
sub-agent
เอเจนต์ย่อย
agent ตัวเล็กที่ agent หลักเรียกออกมาช่วยทำงานเฉพาะส่วน คิดเหมือนหัวหน้าที่แบ่งงานย่อยให้ลูกทีมไปทำ แล้วเอาผลกลับมารวม ข้อดีคือ sub-agent แต่ละตัวมีพื้นที่ความจำของตัวเอง ทำให้งานใหญ่ ๆ ไม่ไปเบียดพื้นที่ของ agent หลักจนเต็ม
T4 terms
token
โทเคน
หน่วยที่ model ใช้นับและประมวลผลข้อความ ไม่ใช่ตัวอักษร ไม่ใช่คำเต็ม แต่เป็น "ชิ้นส่วนของคำ" คำภาษาอังกฤษสั้น ๆ หนึ่งคำมักเป็นหนึ่ง token ส่วนคำยาวอาจถูกหั่นเป็นหลายชิ้น ทุกอย่างที่ส่งเข้า model และทุกอย่างที่มันตอบกลับ ถูกนับเป็น token และค่าใช้จ่ายของ AI ก็คิดตามจำนวน token นี่เองบทเต็ม →
token overhead ของภาษาไทย
ข้อเท็จจริงที่คนไทยควรรู้ ภาษาไทยกิน token มากกว่าภาษาอังกฤษหลายเท่าสำหรับเนื้อหาความหมายเท่ากัน งานวัดที่เผยแพร่ออกมาอยู่ราว 2 ถึง 4 เท่า (ขึ้นกับ tokenizer ที่ใช้) เพราะตัวนับ token ถูกฝึกมากับภาษาอังกฤษเป็นหลัก และภาษาไทยไม่มีช่องว่างระหว่างคำ บวกกับเป็นอักษรที่ไม่ใช่ละติน มันเลยถูกหั่นเป็นชิ้นเล็ก ๆ จำนวนมาก ผลคือแชทภาษาไทยถึงจุด "ช้า แพง และตอบแย่ลง" เร็วกว่าแชทภาษาอังกฤษบทเต็ม →
tool
เครื่องมือ) / tool use (การเรียกใช้เครื่องมือ
ความสามารถที่ถูกต่อเพิ่มให้ model เรียกใช้ เช่น ค้นเว็บ อ่านไฟล์ เขียนไฟล์ รันคำสั่งในเครื่อง model ตัวเปล่าทำสิ่งเหล่านี้ไม่ได้ harness ต้องบอกมันว่ามีเครื่องมืออะไรให้ใช้บ้าง แล้ว model ถึงจะ "ขอ" เรียกใช้เครื่องมือนั้นได้บทเต็ม →
W1 term
Z1 term
ZDR
ย่อมาจาก Zero Data Retention แปลว่า "ไม่เก็บข้อมูลค้างไว้" คือการตั้งค่าที่ทำให้ข้อมูลที่ส่งไปไม่ถูกเก็บไว้บนเซิร์ฟเวอร์หลังประมวลผลเสร็จ ตามเอกสารของ Anthropic ฟีเจอร์นี้มีให้เฉพาะลูกค้า API หรือลูกค้าเชิงพาณิชย์ที่ผ่านการอนุมัติ โดยต้องทำข้อตกลงแยกกับ Anthropic ไม่ใช่ฟีเจอร์ที่เปิดอัตโนมัติ แม้แต่ในแพลน Enterprise ก็ไม่ได้มีให้ทุกราย