Glossary · ภาคผนวกศัพท์

คลังคำศัพท์

ศัพท์เทคนิคทุกคำในตำราถูก link มาที่นี่ครั้งแรกที่ปรากฏ. ถ้าศัพท์ไหนต้องการอธิบายยาวกว่านี้ มี topic note แยกในหลักสูตร — ดู “บทเต็ม” ด้านขวาของแต่ละ entry.

37 entries

A4 terms

agent

เอเจนต์

AI ที่ไม่ได้แค่ตอบข้อความ แต่ลงมือทำงานเป็นขั้นตอนได้เอง เช่นค้นเว็บ อ่านไฟล์ เขียนไฟล์ รันคำสั่ง แล้ววนทำซ้ำจนงานเสร็จ ต่างจาก AI แบบถาม-ตอบทีละครั้งตรงที่ agent ทำหลายก้าวต่อเนื่องได้โดยคุณไม่ต้องสั่งทีละก้าวบทเต็ม →

บทเต็ม →

agentic loop

วงจรการทำงานของ agent

รูปแบบการทำงานวนรอบของ agent คือ คิดว่าจะทำอะไรต่อ ลงมือทำ (เช่นเรียกเครื่องมือ) ดูผลที่ได้ แล้วคิดก้าวถัดไป วนแบบนี้ไปเรื่อย ๆ จนงานเสร็จ นี่คือกลไกที่ทำให้ AI ทำงานยาว ๆ หลายขั้นตอนได้เองบทเต็ม →

บทเต็ม →

alignment

การปรับให้สอดคล้อง

งานทำให้ AI ทำตามสิ่งที่คนต้องการจริง ๆ และไม่ทำสิ่งที่เป็นอันตราย การฝึกขั้นปรับแต่งอย่าง RLHF คือเครื่องมือหนึ่งของงาน alignment เป้าหมายคือให้ model มีประโยชน์ ซื่อสัตย์ และไม่ก่อภัยบทเต็ม →

บทเต็ม →

API

ช่องทางให้โปรแกรมคุยกับ AI โดยตรง ไม่ผ่านหน้าแอป คิดง่าย ๆ ว่าแอป ChatGPT คือร้านอาหารที่เสิร์ฟจานสำเร็จ ส่วน API คือการซื้อวัตถุดิบกับเตามาทำเอง คุณได้ตัว model เปล่า ๆ แล้วต้องสร้างส่วนที่เหลือเอง ยืดหยุ่นกว่ามากแต่ต้องลงแรงเอง นักพัฒนาใช้ API สร้างแอปของตัวเองที่มี AI อยู่ข้างในบทเต็ม →

บทเต็ม →

C2 terms

CLI

ย่อมาจาก Command Line Interface คือการสั่งงานโปรแกรมผ่านการพิมพ์คำสั่งในหน้าต่างดำ ๆ แทนการคลิกปุ่ม Claude Code เป็นตัวอย่างของ AI ที่ทำงานผ่าน CLI สำหรับคนไม่ใช่โปรแกรมเมอร์ มันดูน่ากลัวตอนแรก แต่จริง ๆ คือแค่ช่องพิมพ์คำสั่งที่ทรงพลังกว่าหน้าแอปปกติบทเต็ม →

บทเต็ม →

context window

หน้าต่างบริบท

ปริมาณข้อความสูงสุดที่ model "มองเห็น" ได้ในรอบเดียว วัดเป็น token คิดเหมือนโต๊ะทำงานที่มีขนาดจำกัด วางกระดาษได้แค่จำนวนหนึ่ง พอเต็มก็ต้องเอาของเก่าออก ทุกอย่างที่ส่งเข้าไป ทั้งคำสั่งซ่อน บทสนทนาเก่า และข้อความใหม่ของคุณ ต้องอยู่ในหน้าต่างนี้รวมกัน นี่คือสาเหตุที่แชทยาวเกินไปแล้ว model เริ่มลืมต้นเรื่องบทเต็ม →

บทเต็ม →

D1 term

diffusion

ดิฟฟิวชัน

เทคนิคที่อยู่เบื้องหลัง AI สร้างภาพส่วนใหญ่ หลักการคือเริ่มจากภาพที่เป็นจุดรบกวนมั่ว ๆ ทั้งภาพ แล้วค่อย ๆ ขัดเกลาให้กลายเป็นภาพที่ชัดตามคำสั่ง ทำงานคนละแบบกับ LLM ที่เดาคำทีละคำ นี่คือเหตุผลที่การสร้างภาพเป็นคนละ model และคนละความสามารถกับการแชทบทเต็ม →

บทเต็ม →

E1 term

embedding

เอ็มเบดดิง การแปลงความหมายเป็นตัวเลข

วิธีแปลงข้อความ (หรือรูป) ให้กลายเป็นชุดตัวเลข ที่ของซึ่งความหมายใกล้กันจะได้ตัวเลขใกล้กันด้วย เช่นคำว่า "หมา" กับ "สุนัข" จะได้ตัวเลขที่อยู่ใกล้กัน นี่คือกลไกเบื้องหลังการค้นหาด้วยความหมาย เช่นค้นเอกสารที่ "เกี่ยวข้อง" ได้แม้ไม่ได้ใช้คำตรงกันเป๊ะบทเต็ม →

บทเต็ม →

H3 terms

hallucination

อาการหลอน

อาการที่ AI ตอบสิ่งที่ฟังดูถูกแต่ผิดสนิท ด้วยน้ำเสียงมั่นใจเหมือนรู้จริง มันไม่ได้ตั้งใจโกหก มันแค่เดาคำที่น่าจะตามมา แล้วเดาผิด ปรากฏการณ์นี้เกิดได้กับ LLM ทุกตัว และเป็นเหตุผลที่คุณต้องตรวจสอบข้อมูลสำคัญจาก AI เสมอ โดยเฉพาะชื่อคน ตัวเลข วันที่ และแหล่งอ้างอิงบทเต็ม →

บทเต็ม →

harness

ตัวห่อ

โปรแกรมที่ห่อรอบ model เพื่อทำให้มันใช้งานได้จริง มันคือตัวที่คอยมัดบทสนทนาเก่าส่งให้ model อ่านใหม่ทุกรอบ ต่อเครื่องมือให้ ส่งคำสั่งซ่อนเข้าไป และจัดการทุกอย่างที่ model ตัวเปล่าทำเองไม่ได้ แอป ChatGPT, Claude, Claude Code ที่คุณเปิดใช้ แต่ละตัวคือ harness ที่ห่อ model ของตัวเองไว้คนละแบบ นี่คือเหตุผลที่แต่ละแอปให้ประสบการณ์ต่างกันมาก แม้จะทำงานบนหลักการเดียวกันบทเต็ม →

บทเต็ม →

hook

ฮุก ตัวดักจังหวะ

คำสั่งที่ตั้งไว้ให้ทำงานอัตโนมัติเมื่อเกิดเหตุการณ์บางอย่าง เช่นทุกครั้งที่ AI แก้ไฟล์เสร็จ ให้รันตรวจสอบโดยอัตโนมัติ ต่างจาก skill ตรงที่ hook ทำงานเองตามจังหวะที่ตั้งไว้ ไม่ต้องรอ AI ตัดสินใจ เช่นตั้งไว้ว่าทุกครั้งที่ AI เขียนโค้ดเสร็จ ให้รันตัวจัดรูปแบบโค้ดอัตโนมัติทันทีบทเต็ม →

บทเต็ม →

L1 term

LLM

ย่อมาจาก Large Language Model แปลตรงตัวว่า "โมเดลภาษาขนาดใหญ่" คือ model ชนิดที่เก่งเรื่องภาษา ตัวที่อยู่หลัง ChatGPT, Claude, Gemini ล้วนเป็น LLM ทั้งหมด เวลาคนพูดว่า model เฉย ๆ ในบริบทแชท เขามักหมายถึง LLM นี่แหละบทเต็ม →

บทเต็ม →

M3 terms

MCP

ย่อมาจาก Model Context Protocol เป็นมาตรฐานกลางที่ให้ AI ต่อเชื่อมกับเครื่องมือและข้อมูลภายนอกได้ เช่นต่อเข้ากับ Google Drive, ฐานข้อมูล, หรือระบบในบริษัท คิดเหมือนหัวปลั๊กแบบมาตรฐาน พอมีมาตรฐานเดียวกัน เครื่องมือใหม่ ๆ ก็เสียบเข้ากับ AI ได้โดยไม่ต้องสร้างตัวเชื่อมใหม่ทุกครั้งบทเต็ม →

บทเต็ม →

mechanistic interpretability

การถอดกลไกภายใน

สาขางานวิจัยที่พยายามเข้าใจว่าข้างใน model เกิดอะไรขึ้นจริง ๆ ที่ต้องมีสาขานี้เพราะแม้แต่คนสร้าง model ก็อธิบายไม่ได้เต็มที่ว่าทำไมมันตอบแบบนั้น model ไม่ได้ถูก "เขียนโปรแกรม" ทีละบรรทัด แต่ "เติบโต" ขึ้นจากการฝึก ข้างในเลยเป็นกล่องดำที่ต้องค่อย ๆ แกะบทเต็ม →

บทเต็ม →

model

โมเดล

ตัว AI จริง ๆ ที่อยู่หลังจอ คือไฟล์ก้อนใหญ่ก้อนหนึ่งที่ทำสิ่งเดียวคือ รับข้อความเข้าไป แล้วเดาว่าคำถัดไปควรเป็นอะไร มันไม่ใช่ทั้งโปรแกรม ChatGPT มันเป็นแค่ "เครื่องยนต์" ที่อยู่ข้างใน เทียบได้กับเครื่องยนต์รถ ที่ไม่ใช่ทั้งคันบทเต็ม →

บทเต็ม →

O1 term

Opus / Sonnet / Haiku

ชื่อรุ่นของ model ตระกูล Claude ของบริษัท Anthropic เรียงจากตัวใหญ่สุดไปเล็กสุด Opus ฉลาดที่สุดแต่ช้าและแพงที่สุด Haiku เร็วและถูกที่สุดแต่เก่งน้อยกว่า Sonnet อยู่ตรงกลาง การเลือกรุ่นคือการแลกกันระหว่างความฉลาด ความเร็ว และราคา งานง่ายใช้รุ่นเล็กก็พอ งานยากค่อยขยับขึ้นรุ่นใหญ่ (ฝั่ง ChatGPT ของ OpenAI ก็มีรุ่นเล็กใหญ่ในหลักการเดียวกัน)บทเต็ม →

บทเต็ม →

P7 terms

PDPA

พระราชบัญญัติคุ้มครองข้อมูลส่วนบุคคลของไทย กฎหมายที่คุมว่าข้อมูลส่วนบุคคลถูกเก็บและใช้ได้แค่ไหน สำคัญมากเวลาคุณทำงานกับ AI เพราะการเอาข้อมูลลูกค้าหรือข้อมูลพนักงานไปวางในแชท AI อาจเข้าข่ายส่งข้อมูลส่วนบุคคลออกนอกองค์กรโดยไม่ได้รับอนุญาต > 💡 **เรื่องข้อมูลที่ควรรู้:** ตามเอกสารของ Anthropic การใช้งานแบบบัญชีบุคคล (Free/Pro/Max) ค่าเริ่มต้นคือข้อมูลของคุณ "ถูกนำไปฝึก" model เว้นแต่คุณจะปิดเองในการตั้งค่า ส่วนการใช้งานเชิงพาณิชย์ (Team/Enterprise/API) จะไม่ถูกนำไปฝึก model เว้นแต่ลูกค้าเลือกเข้าร่วมโครงการเอง รายละเอียดและความต่างของแต่ละแพลตฟอร์มอยู่ในบท 3.7บทเต็ม →

บทเต็ม →

permission modes

โหมดสิทธิ์การทำงาน

การตั้งค่าว่า AI ที่ลงมือทำงานในเครื่องคุณ (อย่าง Claude Code) ต้องขออนุญาตคุณก่อนทำสิ่งต่าง ๆ มากแค่ไหน มีหลายโหมด เรียงจากระวังมากไประวังน้อย เช่น โหมดมาตรฐาน (default) ถามทุกครั้งที่จะใช้เครื่องมือใหม่ โหมดวางแผน (plan) ให้มันอ่านและสำรวจได้แต่ห้ามแก้ไฟล์ โหมดรับการแก้ไขอัตโนมัติ (acceptEdits) ยอมให้แก้ไฟล์เองโดยไม่ต้องถามทุกครั้ง และโหมดข้ามการถาม (bypassPermissions) ที่ข้ามการขออนุญาตเกือบทั้งหมด ควรใช้เฉพาะในสภาพแวดล้อมที่ปลอดภัยเท่านั้นบทเต็ม →

บทเต็ม →

plugin

ปลั๊กอิน

ชุดของหลายอย่างที่แพ็กรวมกันเป็นก้อนเดียวให้ติดตั้งทีเดียว ภายในอาจมีทั้ง skill, slash command, และการตั้งค่าต่าง ๆ คิดเหมือนชุดเครื่องมือสำเร็จรูปที่ลงครั้งเดียวได้หลายอย่าง มักโหลดได้จากที่รวมปลั๊กอิน (marketplace)บทเต็ม →

บทเต็ม →

post-training / fine-tune

การฝึกขั้นปรับแต่ง

ขั้นที่สองหลัง pretraining model ที่เพิ่งฝึกขั้นต้นเสร็จยังใช้งานไม่ได้ มันแค่เดาคำเก่ง แต่ไม่รู้จักตอบคำถามให้เป็นประโยชน์ ขั้นปรับแต่งคือการสอนเพิ่มให้มันตอบแบบเป็นผู้ช่วยที่ดี ทำตามคำสั่ง และไม่ตอบสิ่งที่เป็นอันตราย คำว่า fine-tune มักหมายถึงการฝึกปรับ model ที่มีอยู่แล้วให้เก่งเรื่องเฉพาะทางขึ้นบทเต็ม →

บทเต็ม →

pretraining

การฝึกขั้นต้น

ขั้นแรกของการสร้าง model คือเอาข้อความมหาศาลจากอินเทอร์เน็ตและแหล่งอื่นมาให้ model ฝึกเดาคำถัดไปซ้ำ ๆ จนเก่ง จากกระบวนการนี้เอง model ค่อย ๆ ซึมซับความรู้เรื่องภาษา ข้อเท็จจริง และรูปแบบต่าง ๆ ของโลกเข้าไปโดยไม่มีใครป้อนความรู้ให้ตรง ๆบทเต็ม →

บทเต็ม →

prompt

พรอมต์ คำสั่ง

ข้อความที่คุณพิมพ์ส่งให้ AI คือคำถาม คำสั่ง หรือสิ่งที่คุณอยากให้มันทำ คุณภาพของ prompt มีผลตรงต่อคุณภาพคำตอบมาก prompt ที่บอกบริบท ความต้องการ และตัวอย่างชัดเจน มักได้คำตอบที่ดีกว่า prompt สั้น ๆ คลุมเครือบทเต็ม →

บทเต็ม →

prompt caching

การแคชคำสั่ง

กลไกลดค่าใช้จ่าย เวลาส่งข้อความก้อนเดิมซ้ำ ๆ (เช่นคำสั่งระบบและบทสนทนาเก่าที่ถูกส่งใหม่ทุกรอบ) ระบบจำส่วนที่ซ้ำไว้ชั่วคราว แล้วคิดเงินถูกลงสำหรับส่วนนั้น สำคัญคือมันไม่ใช่ "ความจำ" ของ model เนื้อหายังถูกส่งไปครบทุกรอบเหมือนเดิม แค่จ่ายถูกลงเท่านั้นบทเต็ม →

บทเต็ม →

R3 terms

RAG

ย่อมาจาก Retrieval-Augmented Generation เป็นวิธีให้ AI ตอบจากเอกสารหรือข้อมูลของคุณเองที่มันไม่เคยเห็นตอนฝึก หลักการคือพอคุณถาม ระบบจะไปค้นชิ้นข้อมูลที่เกี่ยวข้องมาก่อน แล้วแปะใส่ context ให้ model อ่านประกอบตอนตอบ นี่คือกลไกเบื้องหลังแชทบอตที่ตอบเรื่องเฉพาะของบริษัทได้ ทั้งที่ model กลางไม่เคยรู้เรื่องนั้นมาก่อน คุณจะเห็นคำนี้บ่อยในหน้าโปรดักต์และข่าวที่พูดถึงการเอา AI มาใช้กับข้อมูลภายในองค์กร

RLHF

ย่อมาจาก Reinforcement Learning from Human Feedback คือการฝึกปรับ model โดยใช้ความเห็นของคนเป็นตัวชี้ คนช่วยให้คะแนนว่าคำตอบไหนดีกว่ากัน model ก็ค่อย ๆ ปรับให้ตอบในแบบที่คนชอบมากขึ้น นี่คือเหตุผลใหญ่ที่ทำให้ ChatGPT ตอบได้สุภาพ ตรงประเด็น และเป็นประโยชน์ ไม่ใช่ตอบมั่ว ๆ แบบ model ดิบ (Anthropic มีอีกแนวหนึ่งชื่อ Constitutional AI ที่ใช้ชุดหลักการให้ AI ช่วยประเมินคำตอบของกันเองแทนที่จะพึ่งคนล้วน ๆ)บทเต็ม →

บทเต็ม →

routine

รูทีน งานตั้งเวลา

งานที่ตั้งให้ AI ทำเองตามรอบเวลาที่กำหนด เช่นทุกเช้าเก้าโมงให้สรุปข่าวส่งมา โดยคุณไม่ต้องนั่งสั่งเอง เป็นหัวใจของแนวคิด "สร้างครั้งเดียว ใช้ได้เรื่อย ๆ"บทเต็ม →

บทเต็ม →

S5 terms

skill

สกิล ทักษะ

ชุดคำสั่งและความรู้สำเร็จรูปที่เพิ่มความสามารถเฉพาะทางให้ AI เช่น สกิลทำสไลด์ สกิลทำเอกสาร Word พอติดตั้งไว้ AI จะหยิบมาใช้เองเมื่อเจองานที่ตรงกับสกิลนั้น มันไม่ใช่เวทมนตร์ เนื้อในคือไฟล์คำสั่งธรรมดาที่บอก AI ว่าให้ทำงานนั้นยังไง คุณดาวน์โหลดของคนอื่นมาใช้ หรือสร้างเองก็ได้บทเต็ม →

บทเต็ม →

slash command

สแลชคอมมานด์ คำสั่งขึ้นต้นด้วย /

คำสั่งสำเร็จรูปที่คุณพิมพ์เรียกเองโดยขึ้นต้นด้วยเครื่องหมาย / เช่น `/clear` เพื่อล้างบทสนทนา ต่างจาก skill ตรงที่ slash command คุณเป็นคนสั่งเองตรง ๆ ส่วน skill นั้น AI เลือกหยิบมาใช้เองเมื่อเหมาะสมบทเต็ม →

บทเต็ม →

stateless

ไม่มีความจำข้ามรอบ

คุณสมบัติของ model ที่ว่ามันไม่เก็บอะไรไว้เลยระหว่างการเรียกแต่ละครั้ง พอเดาคำตอบเสร็จหนึ่งรอบ มันลืมทุกอย่างทิ้ง รอบถัดไปเริ่มจากศูนย์ใหม่ เหมือนเพิ่งตื่นมาเจอคุณครั้งแรก ความ "จำได้" ที่คุณเห็นในแชท ไม่ได้มาจากความจำของ model แต่มาจากการที่บทสนทนาเก่าถูกส่งให้อ่านซ้ำทุกครั้งบทเต็ม →

บทเต็ม →

sub-agent

เอเจนต์ย่อย

agent ตัวเล็กที่ agent หลักเรียกออกมาช่วยทำงานเฉพาะส่วน คิดเหมือนหัวหน้าที่แบ่งงานย่อยให้ลูกทีมไปทำ แล้วเอาผลกลับมารวม ข้อดีคือ sub-agent แต่ละตัวมีพื้นที่ความจำของตัวเอง ทำให้งานใหญ่ ๆ ไม่ไปเบียดพื้นที่ของ agent หลักจนเต็มบทเต็ม →

บทเต็ม →

system prompt

คำสั่งระบบ

ชุดคำสั่งที่บริษัทผู้สร้างเขียนไว้ บอก model ว่าให้วางตัวยังไง ตอบด้วยน้ำเสียงแบบไหน ทำอะไรได้ทำอะไรไม่ได้ มันถูกแปะไว้ข้างบนสุดของทุกบทสนทนา ก่อนข้อความแรกของคุณด้วยซ้ำ และคุณไม่มีวันเห็นมันบนหน้าจอ system prompt อย่างเดียวก็กินหลายพัน token แล้วบทเต็ม →

บทเต็ม →

T4 terms

token

โทเคน

หน่วยที่ model ใช้นับและประมวลผลข้อความ ไม่ใช่ตัวอักษร ไม่ใช่คำเต็ม แต่เป็น "ชิ้นส่วนของคำ" คำภาษาอังกฤษสั้น ๆ หนึ่งคำมักเป็นหนึ่ง token ส่วนคำยาวอาจถูกหั่นเป็นหลายชิ้น ทุกอย่างที่ส่งเข้า model และทุกอย่างที่มันตอบกลับ ถูกนับเป็น token และค่าใช้จ่ายของ AI ก็คิดตามจำนวน token นี่เองบทเต็ม →

บทเต็ม →

token overhead ของภาษาไทย

ข้อเท็จจริงที่คนไทยควรรู้ ภาษาไทยกิน token มากกว่าภาษาอังกฤษหลายเท่าสำหรับเนื้อหาความหมายเท่ากัน งานวัดที่เผยแพร่ออกมาอยู่ราว 2 ถึง 4 เท่า (ขึ้นกับ tokenizer ที่ใช้) เพราะตัวนับ token ถูกฝึกมากับภาษาอังกฤษเป็นหลัก และภาษาไทยไม่มีช่องว่างระหว่างคำ บวกกับเป็นอักษรที่ไม่ใช่ละติน มันเลยถูกหั่นเป็นชิ้นเล็ก ๆ จำนวนมาก ผลคือแชทภาษาไทยถึงจุด "ช้า แพง และตอบแย่ลง" เร็วกว่าแชทภาษาอังกฤษบทเต็ม →

บทเต็ม →

tool

เครื่องมือ) / tool use (การเรียกใช้เครื่องมือ

ความสามารถที่ถูกต่อเพิ่มให้ model เรียกใช้ เช่น ค้นเว็บ อ่านไฟล์ เขียนไฟล์ รันคำสั่งในเครื่อง model ตัวเปล่าทำสิ่งเหล่านี้ไม่ได้ harness ต้องบอกมันว่ามีเครื่องมืออะไรให้ใช้บ้าง แล้ว model ถึงจะ "ขอ" เรียกใช้เครื่องมือนั้นได้บทเต็ม →

บทเต็ม →

turn

เทิร์น รอบ

การส่งข้อความหนึ่งครั้งแล้วรับคำตอบหนึ่งครั้ง นับเป็นหนึ่ง turn แชทยาว ๆ คือการต่อ turn กันหลายรอบ ทุก turn ใหม่ harness จะส่งบทสนทนาทั้งหมดที่ผ่านมาไปใหม่หมด ไม่ใช่ส่งแค่ข้อความล่าสุดบทเต็ม →

บทเต็ม →

W1 term

weights

น้ำหนัก

ตัวเลขจำนวนมหาศาลข้างใน model ที่เก็บ "สิ่งที่มันเรียนรู้มา" ทั้งหมด คิดง่าย ๆ ว่าเป็นค่าปรับจูนนับพันล้านค่าที่ทำให้ model เดาคำได้แม่น พอฝึกเสร็จแล้ว weights จะถูกแช่แข็งไว้เป็นไฟล์ ไม่เปลี่ยนอีก นี่คือเหตุผลที่ model ไม่ได้ "เรียนรู้จากแชทของคุณสด ๆ"บทเต็ม →

บทเต็ม →

Z1 term

ZDR

ย่อมาจาก Zero Data Retention แปลว่า "ไม่เก็บข้อมูลค้างไว้" คือการตั้งค่าที่ทำให้ข้อมูลที่ส่งไปไม่ถูกเก็บไว้บนเซิร์ฟเวอร์หลังประมวลผลเสร็จ ตามเอกสารของ Anthropic ฟีเจอร์นี้มีให้เฉพาะลูกค้า API หรือลูกค้าเชิงพาณิชย์ที่ผ่านการอนุมัติ โดยต้องทำข้อตกลงแยกกับ Anthropic ไม่ใช่ฟีเจอร์ที่เปิดอัตโนมัติ แม้แต่ในแพลน Enterprise ก็ไม่ได้มีให้ทุกรายบทเต็ม →

บทเต็ม →