หน้าตาทั้งหลายของ AI ตัวเดียวกัน
คุณคุ้นกับ AI ในกล่องแชทบนเว็บ แต่ model ตัวเดียวกันนั้นโผล่ได้อีกหลายที่ ทั้งในแอปมือถือ ในโปรแกรมเขียนโค้ด ในเบราว์เซอร์ ใน Slack หรือรันทิ้งไว้บนคลาวด์ บทนี้พาดูว่าแต่ละที่ทำอะไรได้ เข้าถึงอะไรได้ และทำไมมันถึงเป็น engine เดียวกันแต่พลังต่างกัน
หน้าตาทั้งหลายของ AI ตัวเดียวกัน
คุณเปิด ChatGPT บนเบราว์เซอร์ พิมพ์ถาม รับคำตอบ จบ นั่นคือทั้งหมดที่ AI หมายความว่าในหัวคนส่วนใหญ่ คือกล่องแชทบนเว็บกล่องเดียว ในหัวคุณ "ChatGPT" หรือ "Claude" ก็คือเว็บนั้นเว็บเดียว เหมือนร้านที่มีหน้าร้านอยู่ตรงนั้นที่เดียว
แต่ความจริงคือ AI ตัวเดียวกันนั้นโผล่ได้อีกหลายที่ มันอยู่ในแอปบนมือถือ อยู่ในโปรแกรมเขียนโค้ด อยู่ในเบราว์เซอร์ที่ช่วยกดปุ่มกรอกฟอร์มให้คุณ อยู่ใน Slack ที่บอกว่า "ช่วยแก้บั๊กนี้ที" แล้วได้โค้ดที่แก้แล้วกลับมา หรือรันทิ้งไว้บนคลาวด์ทำงานยาว ๆ ทั้งที่คุณปิดเครื่องไปแล้ว
ที่น่าสนใจคือ ทุกที่เหล่านี้ต่อเข้ากับเครื่องยนต์เดียวกัน ความต่างไม่ได้อยู่ที่ "สมอง" แต่อยู่ที่ "มือ" คือแต่ละที่เอื้อมไปแตะอะไรได้บ้าง บทนี้พาคุณไปดูว่ามีหน้าตาอะไรบ้าง แต่ละอันทำเพื่อใคร ทำอะไรได้ และเข้าถึงอะไรได้-ไม่ได้
คำว่า "หน้าตา" ในที่นี้หมายถึงอะไร
เวลาคุณใช้ AI คุณไม่ได้แตะ model ตรง ๆ คุณแตะ ที่ที่มันโผล่มาให้คุณใช้ เช่นหน้าเว็บแชท หรือแอปบนมือถือ จุดที่คุณเข้าไปใช้งานแบบนี้แหละ ในวงการเรียกว่า surface แปลตรงตัวว่า "พื้นผิว" แต่เข้าใจง่ายกว่าถ้าเรียกว่า "หน้าตา" หรือ "ช่องทางเข้าใช้งาน" คือจุดสัมผัสที่คุณเจอ AI
ทำไมหน้าตาถึงสำคัญ ย้อนกลับไปสองบทก่อน เราเล่าว่า model เป็นแค่เครื่องยนต์ที่ทำสิ่งเดียวคือเดาคำต่อไป (model คือเครื่องยนต์ ไม่ใช่ทั้งรถ) แล้วมีโปรแกรมห่อรอบ ๆ มันชื่อ harness เป็นตัวที่ทำให้เครื่องยนต์นั้นใช้งานได้จริง คอยป้อนข้อความ เรียกเครื่องมือ ส่งผลกลับ (ส่วนที่ไม่มีใครพูดถึง) แต่ละหน้าตาก็คือ harness คนละแบบที่ห่อ model ตัวเดียวกัน หน้าตาต่างกันแปลว่า harness ต่างกัน และ harness ต่างกันแปลว่ามันเอื้อมไปทำอะไรได้ต่างกัน
ลองคิดถึงรถเข็นส้มตำเจ้าเดียว สูตรกับฝีมือเป็นของเจ้าเดียวกัน แต่ไปตั้งคนละที่ บางวันตั้งในตลาดนัดตอนเย็น คนเดินผ่านสั่งกลับบ้าน บางวันเข้าไปตั้งในโรงอาหารออฟฟิศ ลูกค้านั่งกินตรงนั้น บางวันไปอยู่ในฟู้ดคอร์ตห้าง คนสั่งเยอะกว่า ส้มตำครกเดียวกัน แต่ประสบการณ์และสิ่งที่ทำได้ในแต่ละที่ไม่เหมือนกัน หน้าตาของ AI ก็แบบนั้น จุดที่การเปรียบเทียบนี้ใช้ไม่ได้คือ ที่ตั้งรถเข็นต่างกันแค่ทำเล แต่หน้าตาของ AI ต่างกันที่ อำนาจ คือบางหน้าตาแตะได้แค่ข้อความ บางหน้าตาแตะไฟล์ในเครื่องคุณได้ บางหน้าตากดปุ่มในเว็บแทนคุณได้ นั่นคือความต่างที่สำคัญจริง ๆ
💡 ใจความสำคัญ: หน้าตา (surface) คือจุดที่คุณเข้าไปใช้ AI ทุกหน้าตาต่อเข้า model ตัวเดียวกัน สิ่งที่ต่างคือ harness ที่ห่ออยู่ ซึ่งกำหนดว่าหน้าตานั้นเอื้อมไปทำอะไรได้บ้าง
Surfaces
ไล่จากที่คนใช้บ่อยที่สุดไปหาที่เฉพาะทางขึ้น แต่ละหน้าตาให้สังเกตสามเรื่อง ไว้ทำอะไร เหมาะกับใคร และเอื้อมไปแตะอะไรได้บ้าง
แชทบนเว็บและแอปบนคอม
อันนี้คือที่ที่เกือบทุกคนเริ่ม เปิดเบราว์เซอร์ไปที่หน้าเว็บอย่าง ChatGPT หรือ Claude พิมพ์คุยได้เลย ไม่ต้องติดตั้งอะไร นอกจากบนเว็บแล้วยังมีแอปติดตั้งลงเครื่องคอมได้ด้วย หน้าตาคล้ายกัน แต่เปิดเร็วกว่าและมีลูกเล่นเพิ่ม เช่นดูผลลัพธ์เทียบกันแบบเห็นภาพ
เหมาะกับทุกคน เป็นประตูบานแรก เอื้อมแตะอะไรได้บ้าง โดยพื้นฐานมันแตะได้แค่ ข้อความที่คุณพิมพ์หรือแนบเข้าไป มันไม่เห็นไฟล์ในเครื่องคุณเองเว้นแต่คุณลากแนบให้ และต่ออินเทอร์เน็ตได้ถ้าเปิดฟังก์ชันค้นเว็บไว้ พูดง่าย ๆ คือมันเป็นคู่สนทนาที่ฉลาด แต่ไม่มีมือไปหยิบจับอะไรในเครื่องคุณเอง
แอปบนมือถือ
หน้าตาเดียวกับแชทบนเว็บ แต่ย่อลงมาอยู่ในมือถือ คุยระหว่างเดินทาง ถ่ายรูปถามได้ พิมพ์หรือพูดใส่ก็ได้
เหมาะกับการใช้งานนอกโต๊ะ ถามไว ๆ ระหว่างวัน เรื่องที่เอื้อมแตะได้ก็คล้ายเว็บ คือข้อความและไฟล์ที่คุณส่งให้ บวกกับสิ่งที่มือถือมีให้ เช่นกล้องกับไมค์ แต่มือถือยังมีบทบาทพิเศษอีกอย่างที่เราจะพูดถึงท้ายบท คือเป็น "รีโมต" ไว้คุมงานที่รันอยู่บนเครื่องคอมของคุณจากระยะไกล
ในโปรแกรมเขียนโค้ด (IDE)
ตรงนี้เริ่มต่างจากแชทธรรมดาชัดเจน
โปรแกรมที่นักพัฒนาใช้เขียนโค้ด เรียกรวม ๆ ว่า IDE (ย่อจาก Integrated Development Environment คือ "โปรแกรมสำหรับเขียนและจัดการโค้ด") ที่ดังคือ VS Code, Cursor และตระกูล JetBrains อย่าง IntelliJ, PyCharm, WebStorm, PhpStorm, GoLand, Android Studio AI ติดเข้าไปในโปรแกรมพวกนี้ได้ในรูปส่วนเสริม กลายเป็นผู้ช่วยที่ นั่งอยู่ข้าง ๆ ไฟล์งานจริง ของคุณ
ความต่างอยู่ตรงที่มันเห็นบริบทของงานคุณตรง ๆ ไฟล์ที่คุณเปิดอยู่ ข้อความที่คุณเลือกไว้ และข้อผิดพลาดที่โปรแกรมขึ้นเตือน ทั้งหมดถูกส่งให้ AI เห็นโดยที่คุณไม่ต้องคัดลอกไปแปะ พอมันแก้โค้ดให้ มันแสดงผลแบบเทียบของเก่ากับของใหม่ให้ในโปรแกรมเลย
เหมาะกับคนที่ทำงานกับไฟล์โค้ดเป็นประจำ เอื้อมแตะอะไรได้ ตรงนี้คือจุดสำคัญ มันแตะ ไฟล์ในโปรเจกต์ของคุณ ได้ ทั้งอ่านและแก้ ไม่ใช่แค่ข้อความที่คุณพิมพ์ มืออันนี้ยาวกว่าแชทธรรมดาเยอะ
ในเทอร์มินัล (CLI)
อีกหน้าตาหนึ่งสำหรับสายเขียนโปรแกรมคือผ่านหน้าจอดำ ๆ ที่พิมพ์คำสั่ง เรียกว่า terminal หรือ CLI (ย่อจาก Command Line Interface คือ "การสั่งงานด้วยการพิมพ์คำสั่งทีละบรรทัด" แทนการกดปุ่มบนหน้าจอ)
หน้าตานี้ฟังดูดิบ แต่จริง ๆ แล้วเป็นแบบที่ ครบที่สุดในกลุ่มสายเทอร์มินัล คือทำได้แทบทุกอย่างที่ engine รองรับ มันอ่านและแก้ไฟล์ในเครื่องได้ รันคำสั่งได้ ทำงานต่อกันเป็นทอด ๆ จนจบงานได้เอง นี่คือที่ที่กลไก agentic loop จากบท harness ทำงานเต็มกำลัง คือ model เสนอว่าจะทำอะไร harness ลงมือทำให้ แล้วป้อนผลกลับ วนไปจนเสร็จ
เหมาะกับนักพัฒนาและคนที่ทำงานบนเซิร์ฟเวอร์ระยะไกล มืออันนี้ยาวที่สุด แตะไฟล์ รันคำสั่ง ต่อเครื่องมือภายนอกได้หมด แต่ก็เป็นหน้าตาที่ต้องระวังที่สุดด้วย เพราะอำนาจมากก็แปลว่าพลาดได้แรง เรื่องการคุมไม่ให้มันทำเกินขอบเขตอยู่ในบทเรื่อง วิจารณญาณ ความเชื่อใจ และความปลอดภัย
ผ่าน API ต่อ engine ดิบ ๆ เข้าโปรแกรมของตัวเอง
หน้าตาทุกแบบที่เล่ามาเป็นของสำเร็จรูปที่คนเปิดใช้ได้เลย แต่มีอีกทางหนึ่งที่ดิบกว่านั้น คือ API ช่องทางให้โปรแกรมหนึ่งเรียกใช้ model ของอีกเจ้าโดยตรง ไม่ผ่านหน้าจอแชทเลย นักพัฒนาเอา API ไปต่อเข้าแอปหรือระบบของตัวเอง เช่นทำบอตตอบลูกค้าในเว็บร้านตัวเอง
ต่างจากหน้าตาอื่นตรงที่ API ยื่นแค่ engine เปล่า ๆ ให้ ไม่มี harness สำเร็จรูปห่อมาให้ คนที่เรียกใช้ต้องประกอบส่วนที่เหลือเอง ความต่างระหว่าง "ต่อ engine ดิบ" กับ "ใช้แอปสำเร็จรูป" นี้สำคัญพอจะมีบทของมันเอง อ่านได้ในบท ต่อ API เองหรือใช้แอปสำเร็จรูป
บนคลาวด์ รันทิ้งไว้ได้
ทีนี้มาถึงหน้าตาที่เปลี่ยนวิธีคิดไปเลย
ปกติเวลาคุณคุยกับ AI คุณต้องนั่งรออยู่หน้าจอ ปิดแท็บไปงานก็หยุด แต่มีหน้าตาแบบหนึ่งที่ AI ไปรันอยู่บนเครื่องของผู้ให้บริการแทนเครื่องคุณ คุณสั่งงานแล้วปิดเบราว์เซอร์ไปได้เลย มันทำงานต่อจนเสร็จ แล้วค่อยกลับมาดูผลทีหลัง สำหรับ Claude หน้าตานี้คือ Claude Code บนเว็บ เข้าใช้ได้ที่ claude.ai/code มันรันอยู่บนคลาวด์ที่ Anthropic ดูแล งานทำต่อแม้คุณปิดเบราว์เซอร์ และเปิดดูจากแอปมือถือได้ ตอนนี้ยังเป็นฟีเจอร์ช่วงทดลอง (research preview) เปิดให้ผู้ใช้แพ็กเกจ Pro, Max และ Team
เหมาะกับงานยาว ๆ ที่ไม่ต้องคอยป้อน เช่นปล่อยให้มันไล่แก้โปรเจกต์ใหญ่ หรือทำหลายงานขนานกัน เอื้อมแตะอะไรได้ ตรงนี้ต่างจาก IDE และเทอร์มินัลในเครื่องคุณ เพราะมันไม่ได้อยู่บนเครื่องคุณ มันทำงานในกล่องแยกบนคลาวด์ ฉะนั้นมันแตะไฟล์ในเครื่องคุณโดยตรงไม่ได้ แต่ดึงโค้ดจากที่เก็บโค้ดออนไลน์ คือที่ที่ทีมเก็บไฟล์โปรเจกต์ไว้กลางบนเน็ตให้ทุกคนดึงไปทำงานได้ ที่ดังที่สุดชื่อ GitHub มาทำงานแทน
💡 ใจความสำคัญ: หน้าตาแบบคลาวด์ต่างจากแบบในเครื่องคุณตรงที่ "ใครรัน" แบบในเครื่องคุณ AI ทำงานบนคอมของคุณ แตะไฟล์คุณได้ตรง ๆ ส่วนแบบคลาวด์ AI ทำงานบนเครื่องของผู้ให้บริการ คุณปิดเครื่องไปมันก็ยังทำต่อ แต่แลกกับการที่มันไม่เห็นไฟล์ในเครื่องคุณเอง
ในเบราว์เซอร์ ช่วยกดเว็บแทนคุณ
หน้าตานี้แปลกตา AI เชื่อมเข้ากับเบราว์เซอร์ Chrome ของคุณ แล้ว ลงมือกดปุ่ม กรอกฟอร์ม อ่านหน้าเว็บ แทนคุณได้จริง ๆ ในหน้าต่างที่คุณเห็นเคลื่อนไหวอยู่ตรงหน้า
จุดที่ทรงพลังคือ มันใช้สถานะล็อกอินของเบราว์เซอร์คุณเอง แปลว่าเว็บไหนที่คุณล็อกอินค้างไว้ มันเข้าถึงได้เหมือนเป็นคุณ เช่นเปิดอีเมล เปิดเอกสารออนไลน์ ที่เจอบ่อยคือนักพัฒนาใช้ debug เว็บแอปจริง ให้มันเปิดหน้าเว็บที่เพิ่งแก้ ลองกดใช้งาน อ่านข้อความ error ที่เด้งขึ้น แล้วบอกว่าพังตรงไหน ถ้ามันเจอหน้าให้ล็อกอินหรือ CAPTCHA มันจะหยุดให้คุณทำเอง
เหมาะกับการทดสอบเว็บ งานกรอกข้อมูลซ้ำ ๆ และดึงข้อมูลจากหน้าเว็บ เอื้อมแตะอะไรได้ มันแตะเบราว์เซอร์ของคุณและทุกเว็บที่คุณล็อกอินไว้ นั่นทั้งมีประโยชน์มากและต้องระวังมากในเวลาเดียวกัน เพราะมันกดแทนคุณได้จริงในบัญชีจริงของคุณ
ใน Slack ส่งบั๊กไป ได้โค้ดที่แก้แล้วกลับมา
ถ้าทีมคุณคุยงานกันใน Slack อยู่แล้ว หน้าตานี้น่าสนใจมาก
Slack คือแอปแชทที่ทีมงานใช้คุยกัน เมื่อติดตั้งส่วนเสริมของ Claude แล้ว เวลามีใครพิมพ์ทักหา @Claude พร้อมงานเขียนโค้ด เช่น "ช่วยดูบั๊กนี้หน่อย" มันจะรู้เองว่านี่เป็นงานโค้ด แล้วไปเปิดงานบน Claude Code บนเว็บให้ ทำงานเสร็จแล้วกลับมาสรุปใน Slack พร้อมปุ่มให้กด เช่นปุ่ม Create PR เพื่อเปิดคำขอรวมโค้ดที่แก้แล้วเข้าโปรเจกต์ พูดง่าย ๆ คือส่งบั๊กในแชททีม แล้วได้โค้ดที่แก้แล้วกลับมาเป็นคำขอให้ตรวจ
เหมาะกับทีมที่อยากสั่งงานจากที่คุยกันอยู่แล้ว โดยไม่ต้องสลับไปเปิดอีกหน้าจอ และอยากให้ทั้งทีมเห็นความคืบหน้าไปพร้อมกัน เอื้อมแตะอะไรได้ ในเชิงกลไกมันก็คือหน้าตาคลาวด์ที่เล่าไปข้างต้นนั่นเอง ดึงโค้ดจาก GitHub มาทำ ไม่ได้แตะเครื่องคุณ ข้อจำกัดที่ควรรู้ตอนนี้คือรองรับเฉพาะโปรเจกต์บน GitHub และทำได้ทีละหนึ่งคำขอรวมโค้ดต่อหนึ่งงาน
มีจุดที่ต้องระวังอย่างหนึ่ง เวลาทักหา @Claude ในแชท มันจะอ่านบทสนทนาในห้องนั้นเป็นบริบทด้วย ซึ่งแปลว่ามันอาจทำตามข้อความของคนอื่นในห้องไปด้วย เพราะฉะนั้นควรใช้ในห้องที่ไว้ใจคนในห้องได้เท่านั้น
รีโมต เริ่มงานบนคอม คุมต่อจากมือถือ
คุณเริ่มงานกับ AI ไว้บนเครื่องคอมที่โต๊ะทำงาน งานยังรันอยู่ แต่ถึงเวลาต้องลุกไปประชุม คุณหยิบมือถือขึ้นมาแล้วคุมงานเดิมที่ค้างบนคอมต่อได้เลย หรือเปิดต่อจากเบราว์เซอร์เครื่องอื่นก็ได้ หน้าตาสุดท้ายนี้ไม่ใช่ที่ใหม่ แต่เป็นวิธี เชื่อม หลายเครื่องเข้าด้วยกัน เรียกว่า Remote Control
บทสนทนาจะ sync ตรงกันทุกเครื่องที่ต่ออยู่ คุณพิมพ์จากมือถือ จากเบราว์เซอร์ หรือจากเทอร์มินัลสลับกันได้
จุดที่ต้องแยกให้ชัด อย่าสับสนกับหน้าตาคลาวด์ที่เล่าไปก่อนหน้า ต่างกันตรง "งานรันอยู่ที่ไหน" แบบคลาวด์ งานรันบนเครื่องของผู้ให้บริการ ส่วน Remote Control งาน ยังรันอยู่บนเครื่องคอมของคุณตลอด ไม่ได้ย้ายขึ้นคลาวด์ มือถือกับเบราว์เซอร์เป็นแค่หน้าต่างมองเข้าไปดูงานที่รันบนเครื่องคุณ ฉะนั้นไฟล์ในเครื่องคุณ เครื่องมือที่ต่อไว้ การตั้งค่าโปรเจกต์ ทุกอย่างยังอยู่ครบ เพราะงานไม่ได้ไปไหนเลย
เหมาะกับเวลาคุณกำลังทำงานในเครื่องอยู่แล้วอยากคุมต่อจากที่อื่น เอื้อมแตะอะไรได้ เท่ากับเครื่องคอมต้นทางของคุณทุกอย่าง เพราะมันคือเครื่องเดิม แค่คุณบังคับจากระยะไกล
ลองทำดู: สังเกตว่า "มือ" ของแต่ละหน้าตายาวไม่เท่ากัน
ถ้าคุณยังไม่เคยลองหน้าตาอื่นนอกจากเว็บ ลองอันนี้กับเว็บที่คุณมีอยู่แล้วก็พอ
เปิดแชทบนเว็บแล้วถามมันตรง ๆ ว่า "ตอนนี้คุณอ่านไฟล์ในคอมของฉันได้ไหม รันคำสั่งในเครื่องฉันได้ไหม เปิดเว็บแล้วกดปุ่มแทนฉันได้ไหม" สังเกตคำตอบ ส่วนใหญ่มันจะบอกว่าทำไม่ได้ เพราะหน้าตาแชทบนเว็บแตะได้แค่ข้อความที่คุณส่งให้ มือมันสั้น
จากนั้นลองนึกเทียบในหัวว่า ถ้าเป็นหน้าตาในโปรแกรมเขียนโค้ด คำตอบเรื่อง "อ่านไฟล์ได้ไหม" จะกลายเป็นได้ทันที หรือถ้าเป็นหน้าตาในเบราว์เซอร์ คำตอบเรื่อง "กดปุ่มแทนได้ไหม" ก็จะกลายเป็นได้ คุณเพิ่งเห็นด้วยตัวเองว่า model ตอบจากความสามารถเดิม แต่ "มือ" ที่มันมีนั้นมาจากหน้าตา ไม่ได้มาจากตัว model
เส้นเลือดเดียวที่ร้อยทุกหน้าตาเข้าด้วยกัน
หน้าตามีเยอะ แต่ใจความจริง ๆ มีอยู่ประโยคเดียว
model ตัวเดียวกัน harness ต่างกัน พลังต่างกัน
ทุกหน้าตาที่เดินผ่านมาทั้งหมด ต่อเข้าเครื่องยนต์เดียวกัน ความฉลาดในการเข้าใจภาษาและให้เหตุผลมาจากที่เดียว สิ่งที่ทำให้แต่ละหน้าตารู้สึกคนละโลกคือ harness ที่ห่ออยู่ ว่ายื่นเครื่องมืออะไรให้ model บ้าง แชทบนเว็บยื่นให้แค่ข้อความ หน้าตาในเทอร์มินัลยื่นให้ทั้งไฟล์และคำสั่ง หน้าตาในเบราว์เซอร์ยื่นปุ่มกับฟอร์มให้ ความต่างของพลังทั้งหมดอยู่ตรงนี้ ไม่ใช่ที่ตัว model
ผลที่ตามมาซึ่งมีประโยชน์จริงในชีวิตคือ เมื่อมันคือ engine เดียวกัน สิ่งที่คุณตั้งค่าไว้ก็ใช้ข้ามหน้าตาได้ในกลุ่มที่รันบนเครื่องคุณ ไฟล์บันทึกบริบทอย่าง CLAUDE.md ที่คุณเขียนไว้ การตั้งค่าต่าง ๆ และเครื่องมือภายนอกที่คุณต่อไว้ (เรียกว่า MCP ซึ่งจะเจาะลึกในบท Connectors) ของพวกนี้ใช้ร่วมกันได้ในหน้าตาที่รันบนเครื่องคุณ ตั้งครั้งเดียวแล้วไม่ว่าจะเปิดในโปรแกรมเขียนโค้ดหรือในเทอร์มินัล มันก็อ่านการตั้งค่าชุดเดียวกัน ไฟล์ CLAUDE.md คืออะไรและควรใส่อะไร อ่านได้ในบท ไฟล์คือ context
ข้อยกเว้นที่ควรพูดให้ตรง หน้าตาแบบคลาวด์ที่รันบนเครื่องของผู้ให้บริการ ไม่ได้เห็นการตั้งค่าในเครื่องคุณโดยอัตโนมัติเหมือนหน้าตาในเครื่อง เพราะมันคนละเครื่องกัน คุณต้องตั้งสภาพแวดล้อมฝั่งคลาวด์แยก ฉะนั้นประโยค "ตั้งครั้งเดียวใช้ได้ทุกที่" จริงเต็มที่กับกลุ่มหน้าตาที่รันบนเครื่องคุณ ส่วนฝั่งคลาวด์มีขั้นตอนตั้งค่าของมันเอง
ลองทำดู: เลือกหน้าตาให้ตรงกับงาน
ครั้งหน้าที่คุณจะใช้ AI ลองหยุดคิดสิบวินาทีก่อนว่า งานนี้ต้องให้มัน แตะ อะไร แล้วเลือกหน้าตาให้ตรง
ถ้าแค่ถาม สรุป ร่างข้อความ ไม่ต้องแตะอะไรในเครื่อง แชทบนเว็บหรือมือถือพอ ถ้าต้องให้มันอ่านหรือแก้ไฟล์งานในเครื่องจริง ต้องเป็นหน้าตาในโปรแกรมเขียนโค้ดหรือเทอร์มินัล ถ้าต้องให้มันลองกดใช้งานเว็บจริง ต้องเป็นหน้าตาในเบราว์เซอร์ ถ้าเป็นงานยาวที่อยากปล่อยทิ้งไว้ คลาวด์เหมาะกว่า การถามตัวเองว่า "งานนี้ต้องการมือยาวแค่ไหน" คือวิธีเลือกหน้าตาที่ง่ายที่สุด และทำให้คุณเลิกพยายามยัดทุกงานลงในกล่องแชทบนเว็บกล่องเดียว
สรุป: หน้าตาเยอะ แต่หัวใจมีดวงเดียว
model ตัวเดียวกันโผล่ได้หลายหน้าตา ทั้งในเว็บ ในมือถือ ในโปรแกรมเขียนโค้ด ในเทอร์มินัล ผ่าน API บนคลาวด์ ในเบราว์เซอร์ ใน Slack และคุมข้ามเครื่องด้วย Remote Control แต่สมองมาจากที่เดียวกันหมด สิ่งเดียวที่ต่างคือ harness ที่ห่ออยู่ ว่ายื่นมือให้มันเอื้อมไปแตะอะไรได้ พอจับหลักนี้ได้ คุณก็เลือกถูกว่างานไหนควรเปิดที่ไหน
ทีนี้พอรู้แล้วว่าหน้าตาคือ harness คนละแบบบน engine เดียวกัน คำถามต่อไปก็คือ แล้วถ้าเอา product จริง ๆ ที่คนใช้กันมาเทียบกันล่ะ Claude Chat กับ Claude Code ต่างกันยังไงในเชิงกลไก ทำไมการสร้างภาพถึงเป็นคนละสายพันธุ์กับการตอบข้อความ ทั้งหมดนี้ร้อยด้วยกรอบเดียว คือ model บวก harness บวกสิ่งที่มันเอื้อมถึง เท่ากับ product ที่คุณใช้ และนั่นคือบทต่อไป
อ่านต่อ: เทียบ product ยอดนิยมเชิงกลไก
แหล่งอ้างอิง
- https://code.claude.com/docs/en/platforms
- https://code.claude.com/docs/en/claude-code-on-the-web
- https://code.claude.com/docs/en/chrome
- https://code.claude.com/docs/en/slack
- https://code.claude.com/docs/en/remote-control
- https://code.claude.com/docs/en/jetbrains
- https://code.claude.com/docs/en/vs-code
คำถามที่พบบ่อย
surface หรือหน้าตาของ AI คืออะไรexpand_more
surface คือจุดที่คุณเข้าไปใช้ AI เช่นหน้าเว็บแชท แอปบนมือถือ โปรแกรมเขียนโค้ด หรือเทอร์มินัล ทุกหน้าตาต่อเข้า model ตัวเดียวกัน สิ่งที่ต่างคือ harness ที่ห่ออยู่ ซึ่งกำหนดว่าหน้าตานั้นเอื้อมไปทำอะไรได้บ้าง
ทำไมแชทบนเว็บถึงอ่านไฟล์ในเครื่องไม่ได้ แต่ AI ในโปรแกรมเขียนโค้ดทำได้expand_more
เพราะมือของแต่ละหน้าตายาวไม่เท่ากัน แชทบนเว็บแตะได้แค่ข้อความที่คุณพิมพ์หรือแนบเข้าไป ส่วนหน้าตาในโปรแกรมเขียนโค้ดหรือเทอร์มินัลแตะไฟล์ในเครื่องและรันคำสั่งได้ ความต่างนี้มาจาก harness ไม่ใช่ตัว model
หน้าตาแบบคลาวด์ต่างจากแบบในเครื่องเราตรงไหนexpand_more
ต่างกันที่ใครรัน หน้าตาในเครื่องคุณ AI ทำงานบนคอมของคุณและแตะไฟล์คุณได้ตรง ๆ ส่วนแบบคลาวด์ AI ทำงานบนเครื่องของผู้ให้บริการ คุณปิดเครื่องไปมันก็ทำต่อ แต่แลกกับการที่มันไม่เห็นไฟล์ในเครื่องคุณ ต้องดึงโค้ดจากที่เก็บออนไลน์อย่าง GitHub มาแทน
ตั้งค่าครั้งเดียวใช้ได้ทุกหน้าตาเลยไหมexpand_more
ใช้ร่วมกันได้ในกลุ่มหน้าตาที่รันบนเครื่องคุณ ไฟล์อย่าง CLAUDE.md การตั้งค่า และเครื่องมือภายนอกที่ต่อไว้ ตั้งครั้งเดียวแล้วเปิดในโปรแกรมเขียนโค้ดหรือเทอร์มินัลก็อ่านชุดเดียวกัน แต่หน้าตาแบบคลาวด์เป็นคนละเครื่อง ต้องตั้งค่าแยกของมันเอง