Level 1 · AI คืออะไรscheduleอ่าน 31 นาที

ประวัติของ AI จากความฝัน 70 ปี สู่การใช้งานจริงปี 2026

starsTL;DR

ChatGPT ดูเหมือนเทคโนโลยีที่เพิ่งเกิดไม่กี่ปี แต่จริง ๆ มันคือผลของงานสะสม 70 ปี ที่ผ่านทั้งช่วงเฟื่องฟูและช่วงที่เงินทุนหายไปหมดสองรอบ บทนี้เล่าว่าทำไมแต่ละยุคถึงตัน ทำไม AI ถึงข้ามเส้น "เริ่มมีประโยชน์จริง" ได้ในปี 2022 ไม่ใช่ 30 ปีก่อน และตอนนี้คนไทยอยู่ตรงไหนบนเส้นนี้

ประวัติของ AI จากความฝัน 70 ปี สู่การใช้งานจริงปี 2026

ทุกครั้งที่คุณพิมพ์คำถามให้ ChatGPT แล้วได้คำตอบกลับมาในไม่กี่วินาที มันให้ความรู้สึกเหมือนเทคโนโลยีที่เพิ่งโผล่มาเมื่อสองสามปีก่อน ราวกับมีใครคิดมันขึ้นมาได้ในชั่วข้ามคืน ความจริงไม่ใช่อย่างนั้นเลย สิ่งที่อยู่หลังจอ ChatGPT คือผลของงานที่สะสมกันมา 70 ปี ผ่านช่วงที่วงการคึกคักมีเงินทุนล้นมือ และช่วงที่ทุกอย่างพังจนนักวิจัยต้องเปลี่ยนชื่อสาขาตัวเองเพราะอายที่จะบอกว่าทำงานด้าน AI มาแล้วสองรอบ

ไทม์ไลน์ประวัติศาสตร์ AI จากอดีตสู่ปัจจุบัน ตั้งแต่ McCulloch-Pitts ปี 1943 จนถึงยุค Generative AI

ความสำเร็จของ AI ในอดีตขึ้นอยู่กับปัจจัยสามอย่าง

  • วิธีคิด คือสูตรและแนวทางที่ใช้สร้าง AI วงการเรียกว่า algorithm
  • ข้อมูล คือตัวอย่างจำนวนมากที่ใช้สอนมัน วงการเรียกว่า data
  • พลังคำนวณ คือความเร็วของเครื่องที่ใช้รัน วงการเรียกว่า compute

และทุกครั้งที่ไม่สำเร็จในอดีตเพราะหนึ่งในสามปัจจัยนี้ขาดหายไป ปัจจัยเหล่านี้เป็นกรอบที่ใช้อธิบายว่าทำไม ChatGPT ถึงเกิดในปี 2022 ไม่ใช่ 1992 ถ้ามีใครถามว่า "ทำไมโครงข่ายแบบสมองที่คิดมาตั้งแต่ยุค 1980 ถึงไม่เวิร์กตอนนั้น" คำตอบทั้งหมดอยู่ในกรอบสามอย่างนี้

ความก้าวหน้าของ AI ไม่ได้มาจากงานวิจัยล้วน ๆ แต่มาจากเรื่องนอกวงการด้วย การ์ดจอที่ทำมาเพื่อเล่นเกม กลายเป็นเครื่องมือฝึก AI อินเทอร์เน็ตที่คนเข้ามาเขียนข้อความกันทั้งโลก กลายเป็นคลังข้อมูล และเงินทุนที่ไหลเข้ามาเมื่อเห็นว่าลงทุนแล้วได้ผลคุ้ม ประวัติ AI จึงเป็นทั้งประวัติวิทยาศาสตร์ ประวัติวิศวกรรม และประวัติธุรกิจในเวลาเดียวกัน

ยุคช่วงปีแนวคิดหลัก
เขียนกฎเอง (rule-based)1950–1980ความฉลาด = กฎตรรกะที่คนเขียนไว้
เรียนจากข้อมูล (machine learning)1990–2000ให้เครื่องหากฎจากข้อมูลเอง
โครงข่ายลึก (deep learning)2012–2017โครงข่ายแบบสมองหลายชั้น + การ์ดจอ
ยุค LLM และ AI สร้างสรรค์2017–ปัจจุบันTransformer + ขยายขนาดมหาศาล

ระหว่างยุคที่หนึ่งกับสอง และยุคที่สองกับสาม มีช่วงที่วงการแทบหยุดนิ่งสองครั้ง เงินทุนหายไป ความคาดหวังพัง วงการเรียกช่วงนี้ว่า AI winter หรือ "หน้าหนาวของ AI" เพราะเป็นช่วงที่ทุกอย่างหยุดเติบโตชั่วคราว รอจนสภาพแวดล้อมพร้อม

💡 ใจความสำคัญ: แนวคิดบางอย่างที่ ChatGPT ใช้อยู่ทุกวันนี้ ถูกคิดขึ้นตั้งแต่ยุค 1980 แล้ว แต่ตอนนั้นข้อมูลกับพลังคำนวณยังไม่พอ นี่คือเหตุผลที่ "มีไอเดียดีแล้ว" ยังไม่พอ ของสามอย่างต้องมาพร้อมกัน

ยุคแรก - เขียนกฎเอง (rule-based) (1950–1980)

ก่อนปี 1956 คำว่า "Artificial Intelligence" ยังไม่มีในโลกนี้ ไม่มีวงการ ไม่มีงานประชุม ไม่มีทุนวิจัยเฉพาะ มีแค่นักคณิตศาสตร์ไม่กี่คนที่ตั้งคำถามว่าเครื่องจักรคิดได้ไหม

คนแรกที่ตั้งคำถามนี้อย่างจริงจังคือ Alan Turing นักคณิตศาสตร์ชาวอังกฤษที่เป็นหนึ่งในบิดาของคอมพิวเตอร์สมัยใหม่ ในปี 1950 เขาเสนอวิธีทดสอบที่ฉลาดมาก แทนที่จะเถียงกันไม่จบว่า "คิด" แปลว่าอะไร เขาบอกว่า ถ้าคนคุยกับเครื่องจักรแล้วแยกไม่ออกว่ากำลังคุยกับคนหรือกับเครื่อง เครื่องนั้นก็ถือว่าผ่าน การทดสอบนี้เรียกว่า Turing Test และเป็นนิยามแรกของ "ความฉลาดของเครื่อง" ที่วัดได้จริง ปัจจุบันยังถกกันอยู่ว่ามันพอไหม แต่มันเปิดทางให้ AI กลายเป็นสาขาที่ศึกษาได้จริง

ปีที่ถือเป็นจุดกำเนิดอย่างเป็นทางการคือ 1956 ฤดูร้อนปีนั้น John McCarthy, Marvin Minsky, Claude Shannon และ Nathaniel Rochester จัดประชุมที่วิทยาลัย Dartmouth ในสหรัฐ McCarthy เป็นคนบัญญัติคำว่า Artificial Intelligence ขึ้นเป็นครั้งแรกในประวัติศาสตร์ ในข้อเสนอจัดงาน พวกเขาเขียนทำนองว่า เชื่อว่าทุกแง่มุมของความฉลาดน่าจะสามารถอธิบายชัดเจน พอจนเครื่องจักรสามารถเลียนแบบได้

หลังการประชุมนั้น วงการคึกคักมาก มีโปรแกรมที่ทำให้คนตื่นเต้นออกมาหลายตัว ตั้งแต่ปี 1956 Newell กับ Simon สร้าง Logic Theorist โปรแกรมที่พิสูจน์ทฤษฎีบทคณิตศาสตร์ได้เอง บางข้อมันหาวิธีพิสูจน์ที่สั้นและสวยกว่าในตำราเสียอีก ต่อมาปี 1970 Terry Winograd สร้าง SHRDLU โปรแกรมที่รับคำสั่งภาษาอังกฤษให้หยิบและวางกล่องในโลกจำลองได้ เช่นสั่งว่า "วางบล็อกแดงไว้บนบล็อกเขียว" แล้วมันทำตามได้ถูก สองตัวนี้ทำให้คนเชื่อว่าอีกไม่นานเครื่องจะเข้าใจภาษาคนได้ทั้งหมด แต่ตัวที่น่าจดจำที่สุดคือ ELIZA ในปี 1966 ของ Joseph Weizenbaum มันเป็นแชทบอตตัวแรกที่เลียนแบบนักจิตบำบัด วิธีทำงานง่ายมาก รับข้อความเข้ามา จับคำสำคัญ แล้วถามคำถามกลับ

  • ผู้ใช้พิมพ์ว่า "ฉันรู้สึกเครียดมาก"
  • ELIZA ตอบกลับว่า "เล่าให้ฟังได้ไหมว่าทำไมถึงรู้สึกเครียด"

สิ่งที่ทำให้ Weizenbaum ตกใจคือ คนจำนวนมากรู้สึกว่า ELIZA "เข้าใจ" พวกเขาจริง ๆ ทั้งที่มันแค่จับคู่คำตามแบบที่เขียนไว้ล่วงหน้า บางคนถึงขอให้เขาออกไปจากห้องเพื่อจะได้คุยกับ ELIZA เป็นการส่วนตัว นี่คือบทเรียนแรกที่ยังจริงจนถึงยุค ChatGPT ความรู้สึกว่า AI เข้าใจ กับ AI เข้าใจจริง เป็นคนละเรื่องกันโดยสิ้นเชิง

แนวคิดที่ขับเคลื่อนยุคนี้คือความเชื่อว่า ความฉลาดเกิดจากการจัดการสัญลักษณ์ตามกฎตรรกะ เหมือนโปรแกรมคณิตศาสตร์ขนาดยักษ์ ถ้าเขียนกฎไว้ครบพอ ทุกอย่างก็แก้ได้ วงการเรียกแนวทางนี้ว่า Symbolic AI หรือเรียกติดปากกันว่า GOFAI ย่อมาจาก Good Old-Fashioned AI

ในยุคเดียวกันนี้ มีอีกแนวทางหนึ่งเกิดขึ้นเงียบ ๆ ปี 1958 Frank Rosenblatt สร้าง perceptron ซึ่งเป็นโครงข่ายแบบสมองรุ่นแรกสุด แบบชั้นเดียว ความต่างจาก symbolic AI คือมันเรียนจากตัวอย่างได้จริง ไม่ต้องเขียนกฎเอง ให้มันดูรูปเยอะ ๆ แล้วบอกว่าอะไรเป็นอะไร มันก็จับ pattern ได้ คนตื่นเต้นกันมาก แต่ปี 1969 Minsky กับ Papert ยอมแพ้และตีพิมพ์หนังสือพิสูจน์ทางคณิตศาสตร์ว่า perceptron ชั้นเดียวแก้ปัญหาบางอย่างไม่ได้เลย แม้แต่ปัญหาง่าย ๆ ส่งผลให้เงินลงทุนถูกลดลงกว่า 20 ปี

ทำไมการพัฒนา AI ยุคนี้ถึงไม่สำเร็จ

ปี 1973 หน่วยงานให้ทุนวิจัยของอังกฤษมอบหมายให้ Sir James Lighthill นักคณิตศาสตร์ชื่อดัง ทำรายงานประเมินงานวิจัย AI ทั้งประเทศ ผลสรุปกระชับมาก โปรแกรม AI ทำได้ดีใน "โลกของเล่น" แต่พอเอาไปเจอโลกจริง มันพัง

ปัญหาหลักคือสิ่งที่เรียกว่า "การระเบิดของอัตราความน่าจะเป็น" ลองนึกถึงหมากรุก ตาแรกเดินได้ 20 ทาง พอเดินไปสองตาของแต่ละฝ่าย ตำแหน่งที่เป็นไปได้พุ่งไปเป็นพัน พอสามตาก็เป็นล้าน ตัวเลขความน่าจะเป็นระเบิดเร็วจนคอมพิวเตอร์ยุคนั้นตามไม่ทัน และนั่นแค่หมากรุก โลกจริงมีตัวแปรมากกว่ามหาศาล ถ้าจะเขียนกฎชัดเจนสำหรับ "วิธีตีความประโยคภาษาอังกฤษ" ลงในโปรแกรมแชทโดยตรง กฎกี่หมื่นข้อก็ไม่พอที่จะรองรับการใช้งานในโลกแห่งความจริง

การทำนายประโยคในบทสนทนาคือตัวอย่างที่แสดงให้เห็นว่าความน่าจะเป็นสูงเกินไปกว่าที่จะสามารถเขียน logic ครอบคลุมได้หมด 100% ตามสิ่งที่เป็นในโลกแห่งความจริง ตัวอย่างสามประโยคนี้

  • ประโยคแรก "ฉันเห็นผู้หญิงคนนั้นด้วยกล้องส่องทางไกล" คนถือกล้องเป็นฉันหรือเป็นผู้หญิง กฎตอบไม่ได้ ต้องรู้บริบทถึงจะเดาถูก
  • ประโยคที่สอง "ถ้วยรางวัลใส่ในกระเป๋าไม่ได้เพราะมันใหญ่เกินไป" อะไรใหญ่เกินไป คนรู้ทันทีว่าถ้วยรางวัล เพราะรู้ว่าของใหญ่ใส่ของเล็กไม่ได้ แต่ความรู้แบบนี้ไม่มีใครเขียนเป็นกฎไว้ในโปรแกรม
  • ประโยคที่สาม "ช่วยส่งเกลือให้หน่อยได้ไหม" ความหมายตามตัวอักษรคือถามว่าทำได้ไหม แต่ในโลกแห่งความจริง คนทั่วไปเข้าใจว่ามันคือคำขอให้ส่งเกลือมา ความหมายขึ้นกับสถานการณ์ ไม่ใช่ตัวคำ

สามประโยคนี้คือสิ่งที่คนเข้าใจได้ในเสี้ยววินาทีโดยไม่รู้ตัว แต่ระบบที่ทำงานด้วยกฏตายตัวทำไม่ได้เลย หน่วยงานทุนวิจัยทั้งในสหรัฐและอังกฤษตัดงบ นักวิจัย AI หางานลำบาก บรรยากาศเงียบลงชัดเจน นี่คือ หน้าหนาวของ AI ครั้งแรก ช่วงราวปี 1974 ถึง 1980 แต่วงการไม่ได้ตายทั้งหมด มันแค่เงียบลงในสายตาคนนอก นักวิจัยหลายคนยังทำงานต่อ เพียงแต่เลี่ยงไปใช้ชื่อสาขาอื่น

ยุคที่สอง เปลี่ยนจากเขียนกฎเอง (rule-based) เป็นเรียนจากข้อมูล (machine learning)(1990–2000)

วงการกลับมารอบสองด้วยไอเดียที่ดูเหมือนจะแก้ปัญหาเดิมได้ แทนที่จะสร้าง AI ที่ฉลาดสุดๆเพื่อใช้ในโลกแห่งความจริง ให้สร้าง AI ที่ฉลาดเฉพาะเรื่องแคบ ๆ แทน ถ้าจำกัดขอบเขตให้แคบพอ ปัญหาการระเบิดของความน่าจะเป็นก็เบาลง วิธีทำคือการดึงความรู้จากผู้เชี่ยวชาญในสาขานั้นมาแปลงเป็นกฎ "ถ้าเจอแบบนี้ ให้ทำแบบนี้" จำนวนมาก วงการเรียกระบบแบบนี้ว่า expert system หรือระบบผู้เชี่ยวชาญ

ตัวอย่างที่ได้ผลจริง ระบบ MYCIN ช่วยวินิจฉัยการติดเชื้อในเลือดและแนะนำยา บรรจุกฎของแพทย์ผู้เชี่ยวชาญหลายร้อยข้อ ในการทดสอบบางครั้งทำได้ดีพอ ๆ กับหมอผู้เชี่ยวชาญ อีกระบบคือ XCON ของบริษัท Digital Equipment ช่วยจัดสเปกคอมพิวเตอร์ตามคำสั่งซื้อของลูกค้า รายงานยุคแรกประเมินว่าช่วยประหยัดเงินบริษัทได้หลักสิบล้านดอลลาร์ต่อปี ตัวเลขที่อ้างกันบ่อยอยู่ราว 25 ถึง 40 ล้านดอลลาร์ ช่วงนั้นญี่ปุ่นถึงกับประกาศโครงการลงทุนระดับ 850 ล้านดอลลาร์ ตลาด expert system โตเป็นอุตสาหกรรมมูลค่าระดับพันล้านดอลลาร์ในปลายยุค 1980 ทุกคนคิดว่านี่คือทางที่ถูกแล้ว

แล้วก็ล้มอีกครั้ง

expert system พังด้วยปัญหาหลายอย่างที่เกี่ยวเนื่องกัน อย่างแรกคือมันเปราะ กฎที่เขียนตายตัวพอเจอเคสนอกกฎนิดหน่อย มันจะพังทันที ไม่รู้จักการ "เดาให้ใกล้เคียง" คนไข้มีไข้สูงปวดหัวแต่ผลเลือดไม่ตรงกฎข้อไหน ระบบบอกไม่ได้เลยว่าน่าจะเป็นอะไร ในขณะที่หมอจริงจะประเมินจากสิ่งที่ใกล้เคียงที่สุดได้ อย่างที่สองคือการดึงความรู้จากผู้เชี่ยวชาญมาเขียนเป็นกฎใช้เวลาและเงินมหาศาล เพราะผู้เชี่ยวชาญหลายอย่างทำได้ด้วย "ความรู้สึก" ที่อธิบายเป็นกฎไม่ได้ อย่างที่สามคือโลกเปลี่ยน กฎต้องตามอัปเดต ระบบที่มีกฎหลายพันข้อ แก้ทีหนึ่งก็เกิดผลข้างเคียงที่ไม่คาดคิด ซึ่งสามสาเหตุนี้ทำให้ Expert system ไม่สามารถเป็นวิธียั่งยืนในการใช้แก้ไขปัญหาในโลกแห่งความจริง

ผลคือ หน้าหนาวของ AI ครั้งที่สอง ราวปี 1987 ถึง 1993 และครั้งนี้หนักกว่าครั้งแรก เพราะบริษัทเอกชนเจ๊งจริง ไม่ใช่แค่งานวิจัยในมหาวิทยาลัยที่เงียบลง นักลงทุนสูญเงินมหาศาล ความเชื่อมั่นในการลงทุน AI หายไปนาน นักวิจัยจำนวนมากเปลี่ยนชื่อสาขาตัวเองเป็นอย่างอื่น เพราะคำว่า "AI" กลายเป็นคำต้องห้ามที่ทำให้หาทุนไม่ได้ ถ้าคุณบอกว่าทำงานด้าน AI ในปี 1993 คนจะหัวเราะ เทียบกับยุคนี้ที่บริษัท AI ระดมทุนกันได้ทีละหลายหมื่นล้านดอลลาร์ บรรยากาศต่างกันคนละขั้ว

💡 ใจความสำคัญ: expert system ไม่ได้ "โง่" มันฉลาดมากในขอบเขตที่กำหนดไว้ ปัญหาคือโลกจริงไม่มีขอบเขตตายตัว ความเปราะของมันคือปัญหาเดียวกับ symbolic AI ทั้งหมด เมื่อกฎขาดหรือขัดกันเอง ระบบไม่รู้จะทำอะไร ต่างจากคนที่ "ประมาณ" และ "เดา" ได้

แต่ในความเงียบของหน้าหนาวรอบสอง มีไอเดียใหม่ที่จะเปลี่ยนทุกอย่างค่อย ๆ ก่อตัวขึ้น แทนที่จะเขียนกฎเองเปลี่ยนเป็น ให้ระบบเรียนกฎจากข้อมูลเอง นี่คือการพลิกวิธีคิดครั้งใหญ่ที่สุดในประวัติ AI แทนที่จะบอกโปรแกรมว่า "ถ้าเห็นตาแบบนี้บวกจมูกแบบนี้คือใบหน้า" ให้โยนรูปใบหน้าหมื่นรูปกับรูปที่ไม่ใช่ใบหน้าหมื่นรูปให้มัน แล้วให้มันหากฎเอง คุณไม่ต้องรู้ว่า "กฎคืออะไร" ก่อนสร้างระบบ คุณแค่ต้องมีตัวอย่างให้พอ นั่นแปลว่าปัญหาที่คนทำได้แต่อธิบายไม่ถูกว่าทำยังไง เช่น "รู้ว่าอีเมลนี้เป็นสแปม" หรือ "รู้ว่าเสียงนี้เป็นอารมณ์อะไร" กลายเป็นสิ่งที่สามารถเรียนรู้ได้ วงการเรียกแนวทางทั้งหมดนี้ว่า machine learning

ในยุคนี้มีวิธีจริงที่ใช้ได้ดีหลายตัว decision tree ทำงานเหมือนการถามคำถามไล่เป็นทอด ๆ "เกิน 50 ไหม ถ้าใช่ไปทางนี้ ถ้าไม่ไปทางนั้น" เอาหลายต้นมารวมกันก็กลายเป็น random forest ที่แม่นขึ้นมาก ตัวอย่าง Machine learning ที่ประสบความสำเร็จในยุคนั้น

  • SVM ของ Vladimir Vapnik หาวิธีขีดเส้นแบ่งสองกลุ่มข้อมูลให้ห่างกันมากที่สุด
  • Hidden Markov model ที่เดาว่าเสียงถัดไปน่าจะเป็นอะไรจากเสียงก่อนหน้า
  • Bayesian network ใช้คำนวณความน่าจะเป็นของเหตุที่เชื่อมโยงกัน เครื่องมือเหล่านี้ขับเคลื่อนงานจริงอย่างกรองสแปมและการจดจำเสียง

สองเหตุการณ์ทำให้ยุคนี้น่าจดจำ

  1. ปี 1997 คอมพิวเตอร์ Deep Blue ของ IBM ชนะ Garry Kasparov แชมป์โลกหมากรุก แม้ Deep Blue จะไม่ใช่ machine learning สมัยใหม่ มันชนะด้วยพลังคำนวณดิบที่ไล่ดูทุกตาที่เป็นไปได้ล่วงหน้าหลายล้านตำแหน่ง แต่มันดึงความสนใจของสื่อทั่วโลกกลับมาที่ AI อีกครั้ง
  2. การใช้อินเทอร์เน็ตมากขึ้นของทั่วโลกทำให้ อินเทอร์เน็ตเริ่มสร้างข้อมูลในระดับที่ไม่เคยมีมาก่อน เป็นครั้งแรกที่นักวิจัยมีข้อมูลจริงมหาศาลให้เครื่องเรียน ปัจจัย "ข้อมูล" ซึ่งขาดมาตลอดยุค symbolic AI เริ่มเข้าที่

แต่ machine learning ยุคนี้ยังมีข้อจำกัดสำคัญ มันยังต้องให้คนคอยบอกก่อนว่า "ควรดูคุณสมบัติไหนของข้อมูล" เช่นถ้าจะสอนให้รู้จักสแปม คนต้องบอกว่าให้ดูจำนวนตัวอักษรพิมพ์ใหญ่ ดูคำว่า free หรือ win ดูจำนวนเครื่องหมายตกใจ จำเป็นต้องเรียนจากคุณสมบัติที่คนเลือกให้ ไม่ใช่จากข้อความดิบๆอะไรก็ได้ ซึ่งเป็นข้อจำกัดที่จะหายไปในยุคถัดไป

ยุคที่สาม โครงข่ายลึก (deep learning) (2012–2017)

นี่คือจุดที่หลายคนในวงการบอกว่าเป็น "บิกแบง" ของ AI สมัยใหม่ จริง ๆ ยิ่งกว่าปี 2022 เสียอีก

ย้อนกลับไป โครงข่ายแบบสมองที่ Minsky วิจารณ์ในปี 1969 ว่าทำได้แค่ชั้นเดียวนั้น ถ้าเอามาซ้อนกันหลายชั้นมันจะทรงพลังมาก ตัวความคิดเรื่องเซลล์ประสาทเทียมมีมาตั้งแต่ปี 1943 ที่ McCulloch กับ Pitts เสนอแบบจำลองเซลล์สมองแบบง่ายที่สุด แต่คำถามที่ค้างคามานานคือจะฝึกโครงข่ายหลายชั้นยังไง คำตอบมาในปี 1986 เมื่อ Rumelhart, Hinton และ Williams เผยแพร่วิธีที่เรียกว่า backpropagation ซึ่งเป็นสูตรหลักในการปรับค่าทุกชั้นย้อนกลับจากคำตอบที่ผิด ปี 1989 Yann LeCun เอาแนวคิดนี้ไปสร้างโครงข่ายที่อ่านลายมือตัวเลขบนเช็คได้จริง วงการเรียกโครงข่ายแบบหลายชั้นนี้ว่า deep learning หรือการเรียนรู้เชิงลึก คำว่า "ลึก" หมายถึงจำนวนชั้นที่ซ้อนกัน

คนที่เชื่อในแนวทางนี้มาตลอดแม้ในช่วงที่ทุกคนหันหลังให้คือ Geoffrey Hinton สถาบันในสหรัฐหลายแห่งปฏิเสธทุนงานของเขา เพราะคำว่าโครงข่ายแบบสมองยังเป็นตราบาป เขาเลยย้ายไปทำงานที่แคนาดาที่เปิดรับมากกว่า ปี 2006 Hinton เผยแพร่งานที่แสดงวิธีฝึก deep learning ให้ได้ผลเป็นครั้งแรก เป็นสัญญาณแรกที่ชัดว่าทางนี้ไปต่อได้ ก่อนที่หลักฐานชิ้นใหญ่จะมาในปี 2012

สิ่งที่ทำให้ deep learning ใช้ได้จริงในที่สุด ไม่ใช่แค่ทฤษฎีใหม่ แต่คือการที่ของสามอย่างค่อย ๆ มาเรียงกันพอดี วิธีคิดดีขึ้น มีเทคนิคใหม่ที่แก้ปัญหาเก่าซึ่งกั้นไม่ให้deep learningฝึกได้ ปัญหานั้นเรียกว่าสัญญาณการเรียนเลือนหาย ลองนึกถึงการกระซิบต่อ ๆ กันเป็นแถวยาว พอผ่านหลายคนเสียงก็เบาลงจนคนท้ายแถวแทบไม่ได้ยิน สัญญาณที่บอกว่า "ตรงนี้ปรับยังไง" ก็เป็นแบบนั้น ยิ่งdeep learning สัญญาณยิ่งจางจนชั้นต้น ๆ แทบไม่ได้เรียนอะไร ทางแก้ที่ง่ายจนน่าตกใจคือฟังก์ชันชื่อ ReLU กฎของมันมีแค่ค่าติดลบให้เป็นศูนย์ ค่าบวกปล่อยผ่านตามเดิม เรียบง่ายกว่าฟังก์ชันซับซ้อนที่เคยใช้กันมาก แต่กลับทำให้สัญญาณส่งทะลุหลายชั้นได้โดยไม่จางหาย ข้อมูลมาถึง ปี 2009 Fei-Fei Li สร้าง ImageNet ชุดข้อมูลรูปภาพ 14 ล้านรูปที่คนช่วยกันติดป้ายบอกว่าแต่ละรูปคืออะไร ใช้คนหลายพันคนทั่วโลกและเวลาหลายปี เป็นชุดข้อมูลแรกที่ใหญ่พอให้deep learningเรียนได้จริง และพลังคำนวณมาถึง การ์ดจอที่ NVIDIA ผลิตเพื่อเล่นเกม กลายเป็นเครื่องมือที่เหมาะกับงานนี้พอดีโดยบังเอิญ เพราะทั้งเกมและโครงข่ายแบบสมองใช้การคูณตัวเลขจำนวนมหาศาลเหมือนกัน การ์ดจอราคาผู้บริโภคใบละไม่กี่ร้อยดอลลาร์ ทำงานนี้ได้เร็วกว่าซีพียูธรรมดาหลายสิบเท่า

ทั้งสามอย่างมาเรียงพร้อมกันพอดีในปี 2012 ปีนั้น Krizhevsky, Sutskever และ Hinton ส่งdeep learningชื่อ AlexNet เข้าแข่งการประกวด ImageNet ซึ่งวัดว่าระบบของใครจำแนกวัตถุในรูปได้แม่นที่สุด ผลลัพธ์ทำให้วงการตกใจ AlexNet ทำอัตราพลาดได้ที่ 15.3 เปอร์เซ็นต์ ขณะที่อันดับสองทำได้ 26.2 เปอร์เซ็นต์ ห่างกันเกือบ 11 จุด ในการแข่งระดับนี้โดยปกติจะชนะกันแค่เศษเสี้ยวของหนึ่งเปอร์เซ็นต์ การนำห่างขนาดนี้จึงไม่น่าเชื่อ และจุดที่สะเทือนวงการยิ่งกว่าคือเครื่องที่ใช้ฝึก ทีมนี้ฝึก AlexNet บนการ์ดจอเล่นเกม NVIDIA GTX 580 สองใบ ใบละราว 500 ดอลลาร์ ใช้เวลาห้าถึงหกวัน ทั้งที่ก่อนหน้านั้นงานระดับนี้ต้องใช้ซุปเปรอ์คอมพิวเตอร์หรือฝึกบนซีพียูเป็นเดือน การ์ดจอที่ใครก็ซื้อได้กลายเป็นตัวเปลี่ยนเกม ภายในไม่กี่เดือน ทีมวิจัยด้านภาพแทบทุกทีมในโลกหันมาใช้ deep learning

💡 ใจความสำคัญ: ทำไมต้องรอถึงปี 2012 สูตรหลักที่ใช้ฝึก Deeplearning มีมาตั้งแต่ปี 1986 เกือบ 30 ปีก่อน AlexNet สิ่งที่ขาดคือข้อมูล (ImageNet มาปี 2009) กับพลังคำนวณ (การ์ดจอราคาเอื้อมถึงมากลางยุค 2000) นี่คือตัวอย่างที่ชัดที่สุดว่าของสามอย่างต้องมาพร้อมกัน มีไอเดียอย่างเดียวไม่พอ

หลังจากชัยชนะของ AlexNet สาขาต่าง ๆ ของ AI ถูก deep learning เข้าครอบครองอย่างรวดเร็ว ปี 2016 Google Translate เปลี่ยนระบบแปลภาษาไปใช้โครงข่ายแบบสมองในคืนเดียว คุณภาพการแปลกระโดดข้ามคืนจนคนที่ใช้ประจำรู้สึกได้ทันที ปีเดียวกัน AlphaGo ของ Google ชนะ Lee Sedol แชมป์โลกหมากล้อม กีฬาที่นักวิจัยเคยประเมินว่ายากเกินไปสำหรับ AI ไปอีกอย่างน้อย 10 ปี เพราะหมากล้อมเป็นเกมส์ที่ใช้จำนวนความน่าจะเป็นมากกว่าหมากรุกมหาศาลจนวิธีไล่ดูทุกตาแบบ Deep Blue ใช้ไม่ได้ AlphaGo เรียนจากการเล่นกับตัวเองนับล้านครั้ง จนเล่นบางตาที่คนไม่เคยเห็นมาก่อน Lee Sedol บอกหลังแพ้ว่าบางตาถ้าเป็นคนเล่นเขาจะบอกว่าผิดพลาด แต่มันกลับเป็นตาที่ชนะ

ยุคที่สี่ Transformer และการกำเนิดของ LLM (2017–2022)

ปี 2017 ทีมวิจัยจาก Google ตีพิมพ์งานชื่อ "Attention Is All You Need" ซึ่งกลายเป็นหนึ่งในชื่องานวิจัยที่โด่งดังที่สุดในประวัติศาสตร์วิทยาการคอมพิวเตอร์ จุดประสงค์ดั้งเดิมของมันคือแก้ปัญหาการแปลภาษาเท่านั้น ไม่มีใครคาดว่ามันจะกลายเป็นรากฐานของ AI ทั้งยุคถัดมา งานนี้เสนอโครงสร้างใหม่ของโครงข่ายแบบสมองที่ชื่อว่า Transformer ซึ่งเป็นโครงสร้างเดียวกับที่อยู่ใน ChatGPT, Claude และ Gemini ทุกตัวในวันนี้

Transformer มีจุดเด่นสองอย่างที่โครงสร้างก่อนหน้าทำไม่ได้ อย่างแรกคือมันประมวลผลข้อความทั้งประโยคพร้อมกันได้ในครั้งเดียว ในขณะที่โครงสร้างเก่าต้องอ่านทีละคำตามลำดับ ความสามารถนี้ทำให้ฝึกมันบนการ์ดจอจำนวนมากพร้อมกันได้ จึงฝึกบนข้อมูลมหาศาลได้ในเวลาที่รับได้ อย่างที่สองคือยิ่งขยายขนาดให้ใหญ่ขึ้น ฝึกบนข้อมูลมากขึ้น มันยิ่งเก่งขึ้นอย่างคาดเดาได้ โครงสร้างเก่ามักตันเร็ว เพิ่มขนาดแล้วไม่ได้ดีขึ้นตาม แต่ Transformer ไม่เห็นเพดานชัดในช่วงแรก

หัวใจของมันคือกลไกที่ชื่อ attention หรือการให้ความสนใจ แนวคิดคือเวลาประมวลผลแต่ละคำ โมเดลควร "สนใจ" คำอื่นในประโยคในสัดส่วนที่ต่างกัน ลองดูประโยค "แมวกินปลาเพราะมันหิว" พอประมวลคำว่า "มัน" โมเดลควรสนใจคำว่า "แมว" มากกว่า "ปลา" เพราะที่หิวคือแมว Transformer เรียนรู้ว่าคำไหนควรสนใจคำไหน จากข้อมูลเองโดยอัตโนมัติ และมันให้ทุกคำ "มองเห็น" ทุกคำในประโยคได้โดยตรง ไม่ต้องส่งต่อข้อมูลทีละทอดจนข้อมูลต้นประโยคเลือนหายไป ซึ่งเป็นปัญหาของโครงสร้างเก่า

ผลที่ตามมาภายในไม่กี่ปีคือชุดของโมเดลที่ใหญ่ขึ้นเรื่อย ๆ นึกถึงเวลาที่คุณพิมพ์อะไรก็ได้ใน ChatGPT แล้วมันตอบกลับเหมือนคนพิมพ์ ตัวที่อยู่หลังจอนั้นแหละคือสิ่งที่วงการเรียกว่า LLM ย่อมาจาก Large Language Model หรือโมเดลภาษาขนาดใหญ่ มันคือ Transformer ที่ถูกฝึกบนข้อความมหาศาลให้ทำสิ่งเดียวซ้ำ ๆ คือเดาคำถัดไป ที่มันสำคัญเพราะนี่คือตัวที่อยู่เบื้องหลัง ChatGPT, Claude และ Gemini ทุกตัวที่คุณใช้อยู่ (รายละเอียดว่ามันถูกฝึกมายังไง อยู่ในบท มันเป็นไปได้ยังไง AI ถูกเทรนมายังไง)

ช่วงปี 2018 ถึง 2019 มีสองเหตุการณ์ที่วางทางให้ยุคนี้ ปี 2018 Google ปล่อย BERT ที่ทำให้แนวทางใหม่แพร่หลาย คือฝึกโมเดลบนข้อความมหาศาลรอบเดียวให้เข้าใจภาษากว้าง ๆ ก่อน แล้วค่อยปรับให้เก่งงานเฉพาะทีหลัง ไม่ต้องฝึกใหม่ตั้งแต่ศูนย์ทุกครั้ง ปี 2019 OpenAI ทำ GPT-2 ที่มีพารามิเตอร์ 1.5 พันล้านตัว แล้วตัดสินใจไม่ปล่อยรุ่นเต็มทันที เพราะกลัวคนเอาไปปั่นข้อความปลอมจำนวนมาก เป็นครั้งแรก ๆ ที่บริษัท AI ถ่วงการปล่อยของเพราะห่วงผลกระทบ

แล้วทำไมเงินถึงไหลเข้า AI มหาศาลตั้งแต่ปี 2020 คำตอบอยู่ที่งานปี 2020 ของทีม OpenAI นำโดย Jared Kaplan ที่พบว่าความเก่งของโมเดลเพิ่มขึ้นตามขนาด ข้อมูล และพลังคำนวณอย่างเป็นสูตรที่คาดเดาได้ วงการเรียกว่า scaling laws พูดง่าย ๆ คือถ้าทุ่มเงินเพิ่มเป็นสิบเท่า จะได้ผลดีขึ้นเท่าไรกะได้ค่อนข้างแม่น นักลงทุนเห็นแบบนี้แล้วกล้าเทเงินก้อนใหญ่ เพราะมันไม่ใช่การพนันมืดอีกต่อไป ต่อมาปี 2022 DeepMind ออกงานชื่อ Chinchilla ที่แก้ความเข้าใจเดิม ว่าหลายโมเดลใหญ่เกินไปแต่ป้อนข้อมูลน้อยไป โมเดลที่เล็กลงแต่ฝึกบนข้อมูลมากขึ้นกลับเก่งกว่า งานนี้เปลี่ยนวิธีออกแบบรุ่นต่อ ๆ มาทั้งวงการ

หมุดหมายที่สำคัญที่สุดในช่วงนี้คือปี 2020 OpenAI ปล่อย GPT-3 ซึ่งมีขนาดใหญ่กว่ารุ่นก่อนหน้ามากกว่า 100 เท่า สิ่งที่ทำให้วงการตกใจคือความสามารถที่ไม่มีใครออกแบบไว้ ถ้าคุณให้ตัวอย่างมันสองสามชิ้นในข้อความ เช่น "cat คือแมว dog คือสุนัข fish คือ" มันจะตอบ "ปลา" ต่อให้ได้ ทั้งที่ไม่เคยถูกฝึกให้แปลภาษาโดยเฉพาะ การขยายขนาดอย่างเดียวทำให้เกิดความสามารถใหม่ ๆ ขึ้นมาเอง นี่คือเรื่องใหญ่ เพราะก่อนหน้านี้ถ้าอยากให้ AI ทำงานใหม่ ต้องเก็บข้อมูลใหม่ ฝึกใหม่ ติดตั้งใหม่ แต่ GPT-3 แสดงว่าถ้าโมเดลใหญ่พอ คุณแค่บอกมันในข้อความว่าต้องการอะไร มันก็ทำได้เลย นี่คือรากฐานของวิธีที่เราใช้ ChatGPT ทุกวันนี้

ก่อนถึง ChatGPT มีอีกสิ่งหนึ่งที่ทำให้คนนอกวงการสะดุดตา คือ AI สร้างภาพ รากของมันคือวิธีที่ชื่อ GAN ซึ่ง Ian Goodfellow คิดขึ้นในปี 2014 หลักการคือให้โครงข่ายสองตัวแข่งกัน ตัวหนึ่งปั้นภาพปลอม อีกตัวคอยจับผิด พอแข่งกันไปเรื่อย ๆ ภาพปลอมก็เนียนขึ้นจนแยกจากของจริงแทบไม่ออก พอถึงกลางปี 2022 เครื่องมือสร้างภาพอย่าง DALL-E 2, Midjourney และ Stable Diffusion ออกมาให้คนทั่วไปพิมพ์ข้อความแล้วได้ภาพออกมาเลย นี่เป็นครั้งแรกที่คนนอกวงการจำนวนมากรู้สึกว่า AI ทำอะไรที่แปลกใหม่จริง คำถาม "AI จะมาแทนนักออกแบบไหม" เริ่มดังขึ้นก่อน ChatGPT จะตามมาไม่กี่เดือน

ลองทำดู

เปิด ChatGPT หรือ Claude แล้วลองเลียนแบบสิ่งที่ทำให้วงการตกใจในปี 2020 พิมพ์ตัวอย่างให้มันแค่สองสามคู่ โดยไม่ต้องอธิบายว่าให้ทำอะไร เช่น

ดีใจ → 😊
เศร้า → 😢
โกรธ →

แล้วดูว่ามันเดาออกไหมว่าคุณกำลังให้มันจับคู่อารมณ์กับอีโมจิ ทั้งที่คุณไม่ได้สั่งตรง ๆ เลยสักคำ นี่คือความสามารถเดียวกับที่ GPT-3 โชว์ในปี 2020 ที่เรียกว่าการเรียนรู้จากตัวอย่างในข้อความ คุณไม่ได้ฝึกมันใหม่ คุณแค่ให้ตัวอย่างไม่กี่ชิ้นในข้อความ แล้วมันจับ pattern ต่อให้

30 พฤศจิกายน 2022 วันที่ AI ข้ามเส้นเข้าสู่ชีวิตคนทั่วไป

วันที่ 30 พฤศจิกายน 2022 OpenAI เปิดตัว ChatGPT ภายในสองเดือนมีผู้ใช้แตะ 100 ล้านคน เร็วที่สุดในประวัติศาสตร์ผลิตภัณฑ์สำหรับผู้บริโภค เทียบกับ TikTok ที่ใช้เวลา 9 เดือนกว่าจะถึงหลักนี้ และ Instagram ที่ใช้เวลาราว 2 ปีครึ่ง นักวิเคราะห์ของธนาคาร UBS ถึงกับบอกว่าในรอบ 20 ปีที่ติดตามวงการอินเทอร์เน็ตมา ไม่เคยเห็นแอปสำหรับผู้บริโภคตัวไหนโตเร็วขนาดนี้

แต่นี่คือจุดที่ Aha ของบทนี้ปรากฏชัด ในทางเทคนิค ตัวโมเดลของ ChatGPT แทบไม่ใช่ของใหม่เลย มันคือ GPT-3 รุ่นปรับปรุงบวกกับเทคนิคที่ทำให้มันตอบในแบบที่คนชอบ ความสามารถพื้นฐานของมันมีมาตั้งแต่ปี 2020 แล้ว สองปีเต็มก่อนหน้านั้น แล้วอะไรเปลี่ยนในวันที่ 30 พฤศจิกายน 2022

สิ่งที่เปลี่ยนไม่ใช่ความฉลาดของ AI แต่คือ หน้าตาการใช้งาน ก่อนหน้านั้น GPT-3 มีอยู่จริงและเก่งจริง แต่จะใช้มันได้ต้องเขียนโค้ด ต้องสมัครบัญชีนักพัฒนา ต้องรู้จักสิ่งที่เรียกว่า API ซึ่งเป็นช่องทางสำหรับโปรแกรมเมอร์ คนทั่วไปเข้าไม่ถึง ChatGPT เอาความสามารถเดิมนั้นมาใส่ในกล่องแชทธรรมดาที่เปิดในเบราว์เซอร์แล้วพิมพ์ได้เลย ไม่ต้องเขียนโค้ด ไม่ต้องรู้อะไรทั้งนั้น นักบัญชี ครู พยาบาล นักเรียน ทุกคนลองใช้ได้ในนาทีนั้น (ความต่างระหว่างตัว model กับตัวผลิตภัณฑ์ที่ห่อมัน เป็นหัวใจของ section ถัดไป เริ่มที่บท ตัว model เอง)

💡 ใจความสำคัญ: ChatGPT ไม่ได้ทำให้ AI ฉลาดขึ้น มันทำให้ AI ที่ฉลาดอยู่แล้วตั้งแต่ปี 2020 เข้าถึงได้โดยคนทั่วไปเป็นครั้งแรก หน้าตาการใช้งานที่ดีเปลี่ยนโลกได้พอ ๆ กับความสามารถของตัวโมเดลเอง นี่คือเหตุผลที่ AI "ดูเหมือน" เพิ่งเกิดในปี 2022 ทั้งที่จริงมันข้ามเส้นไปก่อนหน้านั้นแล้ว

หลัง ChatGPT การแข่งขันระดับโลกและยุค Agent (2023–2026)

หลัง ChatGPT ทุกอย่างเปลี่ยนเร็วมากและเปลี่ยนพร้อมกันหลายทาง มีนาคม 2023 OpenAI ปล่อย GPT-4 ที่รับทั้งรูปและข้อความ ความสามารถกระโดดอีกชั้น สอบผ่านข้อสอบเนติบัณฑิตได้ แม้ภายหลังจะมีการตรวจสอบว่าคะแนนจริงต่ำกว่าที่ OpenAI อ้างตอนเปิดตัวพอสมควร ปีเดียวกัน Anthropic ปล่อย Claude, Google ปล่อย Gemini และ Meta ปล่อย Llama แบบที่ใครก็โหลดไปรันบนเครื่องตัวเองได้ฟรี เหมือนเป็น Linux ของวงการ AI การแข่งขันระดับโลกเริ่มขึ้นเต็มตัว

จากนั้นมาถึงสิ่งที่นิยามยุคปัจจุบัน ในยุคแรก AI แค่ตอบคำถาม แต่ช่วงปี 2023 ถึง 2024 มันเริ่มทำงานเป็นขั้นตอนต่อเนื่องได้เอง เรียกใช้เครื่องมือ ค้นเว็บ เขียนโค้ดแล้วรันดูผล ทำงานหลายขั้นโดยไม่ต้องสั่งทีละขั้น วงการเรียก AI แบบที่ลงมือทำงานได้เองนี้ว่า agent ลองสังเกตว่าประวัติศาสตร์วนกลับมาแต่ไม่เหมือนเดิม ถ้า expert system ยุค 1980 คือ AI ที่ฉลาดในเรื่องเดียว ตายตัว ต้องเขียนกฎเอง agent ยุคนี้คือขั้วตรงข้ามเลย ยืดหยุ่นสูง ทำงานข้ามเรื่องได้ และตัดสินใจเองว่าจะหยิบเครื่องมือไหนมาใช้

อีกจุดเปลี่ยนที่หลายคนมองข้ามคือเดือนกันยายน 2024 OpenAI ปล่อยโมเดลที่ชื่อ o1 ซึ่งทำสิ่งใหม่ แทนที่จะตอบทันที มันถูกออกแบบให้ "คิดยาว" ก่อนตอบ จำลองการคิดเป็นขั้น ๆ ในใจก่อนค่อยพ่นคำตอบออกมา เหมือนคนที่ร่างคำตอบหลายแบบในหัวก่อนตัดสินใจพูด ผลคือมันเก่งขึ้นชัดเจนในงานที่ต้องใช้เหตุผลอย่างคณิตศาสตร์และการเขียนโค้ด สิ่งที่มันแสดงให้เห็นคือ พลังคำนวณไม่ได้สำคัญแค่ตอนฝึกโมเดล แต่พลังคำนวณตอนที่มันกำลังตอบก็เพิ่มความเก่งได้เหมือนกัน

มาถึงปี 2025 ถึง 2026 โมเดลที่ "คิดก่อนตอบ" กลายเป็นมาตรฐาน วงการเรียกช่วงนี้ว่ายุคของการให้เหตุผล และ agent เริ่มทำงานจริงในงานหลายสาย ทำงานต่อเนื่องได้หลายชั่วโมงต่องานหนึ่งในบางเรื่อง คำที่ได้ยินบ่อยขึ้นเรื่อย ๆ คือ "AI เป็นเพื่อนร่วมงาน" ไม่ใช่แค่เครื่องมือตอบคำถาม

##ตอนนี้คนไทยอยู่ตรงไหน

ถ้าวาดเส้นการใช้งานจริงตั้งแต่ปี 2022 ถึง 2026 มันไล่เป็นขั้นชัดเจน เริ่มจากแชทสำหรับผู้บริโภค (ปี 2022 คนเปิด ChatGPT มาถามตอบเล่น) ขยับเป็นผู้ช่วยในงาน (ปี 2023 ถึง 2024 AI ฝังอยู่ในโปรแกรมที่คนใช้ทำงานอยู่แล้ว) มาเป็น agent ที่ลงมือทำงานเองได้ (ปี 2024 เป็นต้นมา) และกำลังขยับไปสู่ภาพ "AI เป็นเพื่อนร่วมงาน" ที่รับงานทั้งชิ้นไปทำ

แล้วคนไทยอยู่ตรงไหนบนเส้นนี้ คำตอบน่าสนใจกว่าที่คิด ในแง่การ "ลองใช้" คนไทยไม่ได้ตามหลังโลกเลย ในไทย ChatGPT ครองส่วนแบ่งการใช้งานแชทบอตแบบทิ้งห่างคู่แข่ง ข้อมูลทราฟฟิกจาก StatCounter ช่วงต้นปี 2025 ให้ส่วนแบ่ง ChatGPT ราว 84 เปอร์เซ็นต์ (ตัวเลขนี้วัดจากทราฟฟิกที่ส่งต่อไปเว็บ ไม่ใช่ผลสำรวจผู้ใช้ และขยับขึ้นลงตามเวลา กลางปี 2026 อยู่ราว 70 เปอร์เซ็นต์ต้น ๆ) แต่ทิศทางชัด คือ ChatGPT นำขาดในไทย และคนกลุ่มที่ใช้หนักที่สุดคือคนรุ่นใหม่ การใช้แชทกับ AI กลายเป็นเรื่องปกติในชีวิตประจำวันไปแล้วสำหรับคนกลุ่มหนึ่ง

แต่ในแง่ "องค์กรเอาไปใช้ทำงานจริงอย่างเป็นระบบ" ภาพต่างออกไป รายงานของ PwC ปี 2025 ระบุว่าธุรกิจไทยที่นำ AI มาใช้จริงยังอยู่ในระดับหลักสิบเปอร์เซ็นต์ต้น ๆ เพิ่มขึ้นจากปีก่อนหน้าแต่ยังถือว่าช่วงเริ่มต้น โดยมีอีกจำนวนมากที่ "วางแผนจะใช้" แต่ยังไม่ลงมือ ช่องว่างนี้มีกลไกอยู่เบื้องหลัง การพิมพ์ถามแชทเป็นเรื่องที่คนคนเดียวลองได้เลย แต่การเอา AI ไปฝังในงานจริงต้องแก้ของหลายอย่างพร้อมกัน ข้อมูลภายในองค์กรที่กระจัดกระจาย ความกังวลเรื่องข้อมูลรั่ว และการที่ยังไม่มีคนในองค์กรเข้าใจมันลึกพอจะออกแบบให้มันทำงานได้ ผลคือคนไทยอยู่ในจุดที่ลองใช้แชทกันแพร่หลายแล้ว แต่ยังไม่ค่อยขยับไปถึงขั้น agent ทำงานแทนในองค์กร ซึ่งเป็นช่วงที่มูลค่าจริงอยู่

ความหมายที่ใช้ได้จริงสำหรับคุณคือ ช่องว่างนี้ไม่ได้ปิดด้วยการลองใช้แชทให้มากขึ้น แต่ปิดด้วยความเข้าใจว่ามันทำงานยังไง เพราะนั่นคือสิ่งที่ทำให้คนคนหนึ่งออกแบบงานให้ AI รับไปทำได้ ไม่ใช่แค่ถามตอบเล่น

💡 ใจความสำคัญ: คนไทยไม่ได้ตามหลังโลกเรื่องการ "ลองใช้" แชท AI แต่ตามหลังเรื่องการเอาไปใช้ทำงานจริงในระดับองค์กร และช่องว่างนั้นปิดด้วยความเข้าใจกลไก ไม่ใช่ปริมาณการลองใช้

ลองทำดู

เปิด ChatGPT หรือ Claude แล้วลองถามว่า

ยุคของ AI ในปัจจุบัน (ปี 2026) ถ้ามองย้อนกลับมาจากอีก 50 ปีข้างหน้า
น่าจะถูกจัดว่าเป็นยุคอะไร ขอ 3 แบบ ทั้งแบบมองโลกในแง่ดี
แบบกลาง ๆ และแบบมองโลกในแง่ร้าย

อ่านคำตอบของมัน แล้วสังเกตสองอย่าง หนึ่งคือเนื้อหาที่มันตอบ สองคือจุดที่มันบอกว่ามันไม่แน่ใจ ทั้งสองอย่างบอกอะไรเกี่ยวกับสถานะของ AI ในปัจจุบันได้ดีกว่าคำตอบสำเร็จรูปจากที่ไหน เพราะมันคือ AI ที่กำลังพยายามอธิบายยุคของตัวเอง

4 ความเข้าใจผิดที่ควรรู้

ความเข้าใจผิดแรก AI เพิ่งเกิดในปี 2022 ChatGPT คือจุดที่ AI กระโดดเข้าสู่สาธารณชน แต่ความก้าวหน้าหลักทั้งหมดเกิดก่อนหน้านั้น deep learning ปี 2012 Transformer ปี 2017 GPT-3 ปี 2020 วงการ AI มีอายุ 70 ปี ChatGPT เป็นแค่วันที่คนนอกวงการเริ่มสังเกตเห็น ไม่ใช่วันเริ่มต้น

ความเข้าใจผิดที่สอง deep learning เป็นไอเดียใหม่ โครงข่ายแบบสมองถูกคิดมาตั้งแต่ทศวรรษ 1940 สูตรหลักที่ใช้ฝึกมันมาตั้งแต่ปี 1986 สิ่งที่ใหม่ในยุค 2012 ไม่ใช่ทฤษฎี แต่คือข้อมูลกับพลังคำนวณที่ทำให้ทฤษฎีเดิมซึ่งรอมาเกือบ 30 ปี ทำงานได้จริงเป็นครั้งแรก เปรียบเหมือนสูตรทำเค้กที่มีมาตั้งแต่รุ่นปู่ย่า แต่เตาอบและส่วนผสมเพิ่งหาซื้อได้ในราคาที่จ่ายไหวในยุคนี้ สูตรไม่ใช่สิ่งที่เปลี่ยน โครงสร้างพื้นฐานรอบ ๆ ต่างหากที่เปลี่ยน (การเปรียบเทียบนี้ใช้ได้แค่จุดนี้ เพราะสูตรฝึก AI ซับซ้อนกว่าสูตรเค้กมาก แต่หลักการเรื่องโครงสร้างพื้นฐานเหมือนกัน)

ความเข้าใจผิดที่สาม หน้าหนาวของ AI เกิดเพราะนักวิจัยไม่เก่งพอ หน้าหนาวทั้งสองครั้งเกิดเพราะความคาดหวังของผู้ให้ทุนสูงเกินกว่าที่ข้อมูลและพลังคำนวณตอนนั้นจะรองรับได้ ไม่ใช่ความล้มเหลวของนักวิจัย นักวิจัยยุค 1980 ฉลาดและพยายามเต็มที่ ถ้าคุณพยายามวิ่งในน้ำ ปัญหาไม่ได้อยู่ที่ขาคุณ แต่อยู่ที่สภาพแวดล้อม

ความเข้าใจผิดที่สี่ Transformer ถูกออกแบบมาเพื่อสร้าง LLM ไม่ใช่เลย ตอนทีม Google คิด Transformer ขึ้นในปี 2017 เป้าหมายของเขาคือแก้ปัญหาการแปลภาษาให้ดีขึ้นเท่านั้น ความสามารถที่กว้างกว่านั้นจนกลายเป็นรากฐานของ ChatGPT เป็นสิ่งที่คนค้นพบทีหลังว่ามันทำได้ ไม่ใช่สิ่งที่ตั้งใจออกแบบไว้แต่แรก ประวัติ AI เต็มไปด้วยการค้นพบโดยบังเอิญแบบนี้ ของที่สร้างมาเพื่ออย่างหนึ่งกลับเปลี่ยนโลกในอีกทางที่ไม่มีใครคาดถึง

คำถามที่หลายคนถามอยู่ตอนนี้คือ หน้าหนาวของ AI ครั้งที่สามจะมาไหม ถ้าความคาดหวังสูงเกินจริงอีกครั้ง ถ้า LLM ชนเพดานก่อนทำสิ่งที่สัญญาไว้ได้ ประวัติศาสตร์บอกว่ามีโอกาส ทุกยุคในอดีตล้วนมีเพดานของมัน symbolic AI ชนกำแพงเรื่องการระเบิดของความเป็นไปได้ expert system ชนกำแพงเรื่องการดึงความรู้มาเขียนเป็นกฎ คำถามคือ LLM จะชนกำแพงอะไรและตอนไหน แต่ ณ ตอนนี้ ของสามอย่างยังผลักดันกันอยู่ และยังไม่มีสัญญาณชัดว่าเพดานอยู่ตรงไหน


อ่านต่อ: มันเป็นไปได้ยังไง AI ถูกเทรนมายังไง

แหล่งอ้างอิง

คำถามที่พบบ่อย

AI เพิ่งเกิดขึ้นตอน ChatGPT ออกในปี 2022 ใช่ไหมexpand_more

ไม่ใช่ วงการ AI มีอายุราว 70 ปี ก้าวหน้าหลัก ๆ เกิดก่อน ChatGPT ทั้งหมด เช่น deep learning ปี 2012 Transformer ปี 2017 และ GPT-3 ปี 2020 ChatGPT คือวันที่คนนอกวงการเริ่มสังเกตเห็น ไม่ใช่วันเริ่มต้นของ AI

ทำไม ChatGPT ถึงเพิ่งเกิดได้ในปี 2022 ไม่ใช่ตั้งแต่ยุค 1990expand_more

เพราะความสำเร็จของ AI ต้องมีของสามอย่างพร้อมกัน คือวิธีคิด (algorithm) ข้อมูล (data) และพลังคำนวณ (compute) แนวคิดบางอย่างมีมาตั้งแต่ยุค 1980 แต่ข้อมูลมหาศาลกับการ์ดจอราคาเอื้อมถึงเพิ่งมาพร้อมกันในยุคหลัง มีไอเดียดีอย่างเดียวยังไม่พอ

AI winter หรือหน้าหนาวของ AI คืออะไรexpand_more

คือช่วงที่วงการ AI แทบหยุดนิ่ง เงินทุนหายไปและความคาดหวังพัง เกิดขึ้นสองครั้ง ราวปี 1974 ถึง 1980 และราวปี 1987 ถึง 1993 สาเหตุคือความคาดหวังสูงเกินกว่าที่ข้อมูลและพลังคำนวณตอนนั้นจะรองรับได้ ไม่ใช่เพราะนักวิจัยไม่เก่ง

ถ้า ChatGPT ใช้ GPT-3 ที่มีมาตั้งแต่ปี 2020 แล้วอะไรเปลี่ยนในวันที่เปิดตัวexpand_more

สิ่งที่เปลี่ยนไม่ใช่ความฉลาดของ AI แต่คือหน้าตาการใช้งาน ก่อนหน้านั้นต้องเขียนโค้ดและใช้ API ถึงจะเข้าถึง GPT-3 ได้ ChatGPT เอาความสามารถเดิมมาใส่ในกล่องแชทที่เปิดในเบราว์เซอร์แล้วพิมพ์ได้เลย ทำให้คนทั่วไปเข้าถึงได้เป็นครั้งแรก ภายในสองเดือนมีผู้ใช้แตะ 100 ล้านคน