Sid Bidasaria วิศวกรผู้ก่อตั้งทีม Claude Code ที่ Anthropic ขึ้นเวทีพูดในหัวข้อ "Stop babysitting your agents" ซึ่งช่อง Claude อย่างเป็นทางการเผยแพร่บน YouTube เมื่อวันที่ 20 พฤษภาคม 2026 เป้าหมายของ talk นี้คือการตอบคำถามที่หลายคนเริ่มรู้สึกเหมือนกัน: ทำไมเมื่อโมเดล AI ฉลาดขึ้น นักพัฒนากลับใช้เวลาส่วนใหญ่ไปกับการนั่งจ้องจอรอ agent ทำงานเสร็จ หรือกลายเป็น QA tester ให้ AI แทนที่จะปล่อยให้มันทำงานเองได้จริง
Sid เรียก talk นี้ว่า "Claude Code 301" เป็นคลาสระดับสูงต่อจากการใช้งานพื้นฐาน เนื้อหามี 3 ชั้นเทคนิคที่ต่อยอดกัน คือ verification (สอน AI ตรวจงานตัวเอง), multi-Claude (รัน agent หลายตัวพร้อมกัน) และ background loop (ปล่อย AI ทำงานในเบื้องหลังโดยไม่ต้องนั่งเฝ้า) บทความนี้สรุปสาระสำคัญของ talk ดังกล่าว และแปลให้อยู่ในบริบทของนักพัฒนาไทยที่ใช้ Claude Code หรือเครื่องมือ AI agent อื่น ที่มาฉบับเต็มดูได้จาก Stop babysitting your agents โดยช่อง Claude บน YouTube
1. ปัญหาที่ Sid ชี้: keyboard กลายเป็นคอขวด ไม่ใช่ AI
ในคลิป Sid อธิบายว่า เมื่อโมเดลฉลาดขึ้นเรื่อย ๆ ภาระงานของนักพัฒนากลับเลื่อนจาก "เขียนโค้ดเอง" ไปสู่ "นั่งดู agent เขียนโค้ดแล้วคอยตรวจทุก diff" การใช้เวลาแบบนี้ไม่มีประสิทธิภาพ เพราะมือคนกลายเป็นคอขวดของระบบ ไม่ใช่ความสามารถของ AI อีกต่อไป
Sid ตั้งคำถามไว้ในคลิปว่า ถ้า agent ใช้เครื่องมือชุดเดียวกับมนุษย์ได้ (compiler, linter, type checker, browser) ทำไมยังต้องให้คนยืนคุมทุกขั้น คำตอบของเขาคือ เครื่องมือส่วนใหญ่ที่วงการสร้างมาตลอด 30 ปีออกแบบมาสำหรับมนุษย์เป็นผู้ใช้ปลายทาง ไม่ได้เผื่อให้ AI agent ใช้แทน ดังนั้นเมื่อ agent เริ่มเขียนโค้ดมากขึ้น การออกแบบ workflow และเครื่องมือใหม่จึงจำเป็น ตลอดทั้ง talk Sid จึงชวนผู้ฟังคิดว่า agent ต้องการอะไรจาก codebase ที่มนุษย์เคยมองข้าม
2. สามอย่างที่ต้องมีก่อน (table stakes)
Sid ระบุว่าก่อนจะเข้าเทคนิคขั้นสูง ผู้ใช้ Claude Code ทุกคนควรเตรียมพื้นฐาน 3 อย่างนี้ไว้ก่อน เพราะเป็นค่าเริ่มต้นที่ทำให้เทคนิคในส่วนหลังของ talk ใช้งานได้จริง
หนึ่ง CLAUDE.md คุณภาพสูง Sid บอกตรง ๆ ว่านี่คือ "สิ่งเดียวที่ leverage มากที่สุด" ในการยกระดับประสบการณ์การใช้ Claude Code ไฟล์นี้คือเอกสารบริบทประจำโปรเจกต์ที่ Claude อ่านอัตโนมัติทุกครั้งที่เปิด session Sid เปิดโพลกับผู้ฟังในห้องและพบว่าคนเกือบทั้งหมดใช้ Claude Code ทุกวัน แต่มีเพียงราวครึ่งหนึ่งที่ทำ CLAUDE.md ครบแล้ว ตัวเลขนี้สะท้อนว่าหลายทีมข้ามขั้นนี้ไป
สอง การเชื่อม tool ภายนอกผ่าน MCP Sid ให้ rule of thumb แบบจำง่ายว่า "ถ้า tool ไหนมีประโยชน์กับมนุษย์ในชีวิตประจำวัน tool นั้นก็จะมีประโยชน์กับ Claude ด้วย" ตัวอย่างที่เขายกขึ้นมาคือ Slack, Asana, Linear, DataDog และ BigQuery tool เหล่านี้ช่วยให้ Claude ดึงบริบทจากระบบที่ทีมใช้งานจริงมาประกอบการตัดสินใจ ทำให้ผลลัพธ์แม่นยำขึ้นกว่าการให้ Claude เดาจาก codebase อย่างเดียว
สาม Claude Code Web เป็น sandbox compute ที่รัน Claude Code บน cloud ของ Anthropic ไม่ใช่บนเครื่อง laptop ของผู้ใช้ Sid อธิบายว่าเมื่อแยก compute ออกจากเครื่อง ผู้ใช้จึงปิด laptop ได้ แม้เครื่องดับหรือทำน้ำหกใส่ laptop session ของ Claude Code ก็ยังทำงานต่อในระบบได้อยู่ สิ่งนี้กลายเป็นรากฐานของเทคนิค background loop ที่จะพูดถึงในตอนท้าย

3. Verification: สอน AI ให้ตรวจงานตัวเอง
Sid ยืนยันใน talk ว่า slide เรื่อง verification loop คือ slide ที่สำคัญที่สุดในการบรรยายทั้งหมด แนวคิดหลักคือการให้ Claude ทำงานในวงจรปิดที่ตรวจสอบผลงานตัวเองได้แบบ deterministic ไม่ใช่ปล่อยให้คนอ่าน diff ทุกบรรทัด
Sid ชี้ว่านักพัฒนามนุษย์ตรวจงานของตัวเองด้วยขั้นตอนซ้ำ ๆ ที่สรุปได้คือ เขียนโค้ด → build → รัน executable → ตรวจ side effect (เปิด browser ดู UI, อ่าน log, query database) → รัน unit test → deploy staging แล้วค่อย production Claude ใช้ขั้นตอนเดียวกันนี้ได้ทันที ถ้าได้รับ tool และคำสั่งที่ถูกต้อง
ตัวอย่างจริงจาก Sid เขาเล่าว่าเว็บไซต์ส่วนตัวมีปัญหาปุ่ม signup กดไม่ทำงาน เขาสั่ง Claude ว่า "ทำให้ปุ่ม signup ใช้ได้" Claude จึงเขียนโค้ดบางส่วน build แอป เปิด browser แล้วคลิกปุ่ม signup ด้วยตัวเอง เมื่อเห็นว่าไม่มีอะไรเกิดขึ้น มันก็ไปอ่าน log จนพบสาเหตุของบั๊ก จากนั้นแก้โค้ด โหลดแอปใหม่ ทดสอบ และทำซ้ำในลูปจนได้สถานะที่ใช้งานได้จริง สุดท้ายส่ง PR ที่พิสูจน์มาแล้วว่าทำงานได้
หลักการของ verification loop ตามที่ Sid อธิบายมี 4 องค์ประกอบหลัก คือ (1) สั่ง Claude รันแอปได้ เช่น npm run start (2) ให้ Claude ขับ browser ผ่าน MCP เช่น chrome-mcp หรือ Playwright (3) ให้ Claude พิสูจน์ผลก่อนและหลังการแก้ไข เช่น screenshot เปรียบเทียบ และ (4) เคลียร์ blocker ที่ทำให้ Claude เข้าไปใช้แอปไม่ได้ เรื่องที่พบบ่อยคือ auth (ต้องสร้าง identity ให้ Claude login เข้าระบบเองได้) และ state (ต้องมี script สำหรับ seed ข้อมูลเริ่มต้น เช่น สินค้าใน inventory)
Tip: Sid แนะนำให้บรรจุ verification loop ทั้งหมดลงใน Skill file ของ Claude Code (
skill.md) แล้วเขียนคำสั่งให้ skill ปรับปรุงตัวเองทุกครั้งที่ Claude เจอ blocker ใหม่ วิธีนี้ทำให้ skill กลายเป็นเอกสารแบบ self-improving ทีม Claude Code ที่ Anthropic เองก็ใช้ skill เดียวร่วมกันทั้งทีม เมื่อสมาชิกคนใดเจอปัญหาใหม่ skill จะอัปเดตตัวเองให้ทุกคนใช้ต่อได้เลย
ใน talk Sid สาธิตสด ๆ บน monkeytype.com ซึ่งเป็นแอป full-stack TypeScript จริง (express + MongoDB + Redis) เขาบอก Claude ให้สร้าง verification loop สำหรับแอปนี้ จากนั้นสั่งต่อให้ Claude เพิ่ม feature ใหม่: ทุกครั้งที่ผู้ใช้พิมพ์ผิดในแอป ให้แสดง confetti animation พร้อมใช้ verification skill ที่เพิ่งสร้างขึ้นเพื่อตรวจงาน ผลคือ Claude เขียน feature เสร็จ พบ lint error 2 ตัว แก้ด้วยตัวเอง ทดสอบซ้ำในลูป และส่งโค้ดที่พร้อมใช้งานออกมา Sid เน้นว่าทั้งหมดนี้เกิดขึ้นโดยเขาเพียงพิมพ์คำสั่งเดียว แล้วปล่อยให้ระบบทำงานต่อเอง
ประเด็นสำคัญที่ Sid ย้ำคือ ถ้าไม่มี verification ที่เชื่อถือได้ก่อน เทคนิคในหัวข้อถัดไป (multi-Claude และ background loop) จะกลายเป็นเรื่องอันตราย เพราะการรัน agent หลายตัวพร้อมกันโดยไม่มีกลไกตรวจสอบจะทำให้เกิด PR เสียจำนวนมาก คนจึงต้องมานั่งไล่แก้ ซึ่งสวนทางกับเป้าหมายของการลดงานคน
4. Multi-Claude: รัน agent หลายตัวพร้อมกันโดยไม่เสียสมาธิ
เมื่อ verification เชื่อถือได้แล้ว Sid อธิบายต่อว่าขั้นถัดไปคือการรัน Claude หลาย session พร้อมกัน เพื่อให้งานหลายเรื่องเดินไปด้วยกัน ปัญหาจริงคือ "attention" ของผู้ใช้มีจำกัด Sid เล่าจากประสบการณ์ตัวเองว่าเปิด session เกิน 4-5 ตัวพร้อมกันก็เริ่มสมองโอเวอร์โหลด จึงต้องมีเครื่องมือมาช่วยจัดการ
Sid แนะนำ 4 ทางเลือกสำหรับการ multi-Claude คือ
Claude Code desktop app เป็น GUI ที่มี sidebar รวม session ทั้งหมดจากทุก surface ทั้ง terminal บนเครื่อง, session บน cloud และ session ที่กระจายอยู่ตาม Git repository หลายแห่ง ผู้ใช้สามารถ pin session, ตั้งชื่อใหม่ และใส่สีให้แต่ละ session เพื่อให้กลับมาแล้วรู้ทันทีว่าตัวไหนทำอะไรอยู่
Claude Agents view ใน terminal สำหรับคนที่ชอบทำงานใน terminal มากกว่า GUI ฟีเจอร์นี้เพิ่งเปิดตัวก่อน talk นี้ราว 1 สัปดาห์ เรียกใช้ด้วยคำสั่ง claude agents แทน claude ปกติ แล้วจะได้หน้ารวม session ทั้งหมดบนเครื่อง โดยจัดเรียงตามระดับที่ต้องการ attention session ที่ติด permission prompt หรือรอ input จะถูกดันขึ้นบนสุด ส่วน session ที่กำลังรันหรือเสร็จแล้วจะอยู่ลำดับล่าง ๆ ก่อนหน้านี้ Sid เล่าว่าเขาเองเคยใช้ Tmux + git worktree ทำเองมาก่อน ใช้ได้ แต่จัดการยุ่งยาก
Claude Code Web อย่างที่กล่าวไว้ในส่วน table stakes คือการรัน session บน cloud ของ Anthropic ทำให้ผู้ใช้เดินจากประชุมไปประชุมโดยไม่ต้องเปิด laptop ได้ หรือแม้แต่ปล่อยให้ session ทำงานต่อระหว่างขับรถกลับบ้านก็ทำได้ เข้าใช้งานได้ที่ claude.ai/code
Remote control ผ่านมือถือ เป็นฟีเจอร์ที่ Sid ยกให้เป็นฟีเจอร์โปรดของเขา วิธีใช้คือพิมพ์ /remote-control ใน session ที่เปิดอยู่ แล้ว session นั้นจะปรากฏบน Claude mobile app พร้อมส่ง notification เมื่อ Claude ต้องการ input หรือเจอ blocker ผู้ใช้ตอบกลับจากมือถือได้แม้กำลังเดินทาง ทำให้ session ที่เปิดทิ้งไว้ไม่ติดค้างเพราะเจ้าของไม่อยู่หน้าเครื่อง
หลักการรวมของทั้ง 4 เครื่องมือนี้คือ "ปกป้องสมาธิของผู้ใช้" ไม่ใช่แค่เพิ่มจำนวน session ที่รันได้ Sid ย้ำว่าการเปิด 10 session โดยไม่มีระบบ priority ที่ดี จะทำให้ผู้ใช้เหนื่อยกว่าเปิด 3 session ที่จัดการเป็นระเบียบ
5. Background loop: ถอด keyboard ออกจากเส้นทางวิกฤต
ขั้นที่ 3 ของ talk คือสิ่งที่ Sid บอกว่าเป็น "เป้าหมายสูงสุด": ทำให้ keyboard ของผู้ใช้ไม่ใช่ bottleneck อีกต่อไป ปัญหาที่เขายกขึ้นมาคือ งานวิศวกรซอฟต์แวร์ไม่ได้มีแค่การเขียน feature ใหม่ แต่ยังมี "งานบ้าน" จำนวนมากที่ต้องทำซ้ำทุกวัน เช่น การ babysit PR ที่เปิดค้างไว้ (ตอบ review comment, เคลียร์ merge conflict, แก้ CI ที่ fail) การอัปเดตเอกสาร การ triage feedback และการดูแล CI ให้เขียวอยู่ตลอด ถ้ามี PR สะสมหลายสิบตัว งานเหล่านี้อาจกินเวลารวมหลายชั่วโมงต่อวัน
Sid แนะนำ 2 กลไกที่ช่วยจัดการเรื่องเหล่านี้แบบ background
คำสั่ง /loop สั่งให้ Claude Code รัน prompt ซ้ำตามช่วงเวลาที่กำหนด ตัวอย่างที่ Sid ยกคือ /loop 10m babysit my open PRs หมายความว่า session จะตื่นทุก 10 นาที แล้วรัน prompt นั้นใหม่ ถ้า CLAUDE.md และ tool setup ไว้ดีพอ Claude จะรู้เองว่าต้องทำอะไรกับ PR ที่ค้างอยู่
Routines คือเวอร์ชัน remote ของ /loop ที่ทำงานบน Claude Code Web container แทน โดย setup ผ่าน tab "Routines" บน web app หรือ desktop app สามารถตั้ง trigger ได้ทั้งแบบ time-based (เช่น ทุกเช้า 9 โมง) และ event-based (เช่น เมื่อมี PR เปิดใหม่) แต่ละ trigger จะเปิด session ใหม่พร้อม prompt ที่กำหนดไว้
Sid ยกตัวอย่างที่ทีม Claude Code ใช้จริง คือ routine ที่อัปเดตเอกสารของทีมทุกวัน และ routine ที่ตรวจ issue กับ feedback ที่เข้ามาแล้วโพสต์สรุปลง Slack ทุก 6 ชั่วโมง งานเหล่านี้ไม่จำเป็นต้องมีคนทำเลย ปล่อยให้ AI ทำเองได้ทั้งหมด
Note: เมื่อรวม 3 ชั้นเทคนิคนี้เข้าด้วยกัน Sid ชี้ว่าจะได้ระบบที่ทำงานจำนวนมากได้โดยมนุษย์ไม่ต้องอยู่หน้า keyboard ปลายทางคือผู้ใช้สามารถใช้เวลาและสมาธิกับงานที่สำคัญจริง ส่วนงาน routine delegate ให้ AI ทำเองด้วยความเชื่อถือได้ในระดับที่ verification loop รับประกัน
6. เริ่มอย่างไรในสัปดาห์หน้า: 4 ก้าวสำหรับนักพัฒนาไทย
สำหรับนักพัฒนาที่ใช้ Claude Code หรือเครื่องมือ AI agent อื่นในไทย เนื้อหาที่ Sid นำเสนอแปลเป็นแผนปฏิบัติจริงได้ดังนี้
ก้าวแรก ลงทุนกับ CLAUDE.md ของโปรเจกต์ ไฟล์นี้จะกำหนดคุณภาพของทุก session ในอนาคต ควรระบุภาษาที่ใช้ในโปรเจกต์ structure ของ code, command ที่ใช้ build/test/lint และ convention เฉพาะของทีม ใช้เวลาทำให้ดีตั้งแต่แรกจะคุ้มมากในระยะยาว
ก้าวที่สอง สร้าง verification loop ก่อน multi-Claude Sid ย้ำตลอด talk ว่าลำดับสำคัญมาก ห้ามข้าม ถ้ายัง verify ไม่ได้ การเปิดหลาย session พร้อมกันจะทำให้เกิด PR เสียจำนวนมากที่คนต้องตามแก้ ในขั้นแรกควรเลือกฟีเจอร์เล็ก ๆ ในแอปจริง สร้าง loop ที่เปิด browser ขับเอง ทดสอบ และวน fix จนผ่าน เมื่อทำได้แล้ว จึงค่อยบรรจุเป็น skill ไว้ใช้กับฟีเจอร์อื่น
ก้าวที่สาม เชื่อม tool ที่ทีมใช้จริงผ่าน MCP เช่น Slack, Notion, Linear, GitHub, BigQuery หรือ tool ภายในของบริษัท ยิ่ง Claude เข้าถึงบริบทเดียวกับที่ทีมใช้งานจริงได้มากเท่าไร ผลลัพธ์ก็จะแม่นยำขึ้นเท่านั้น สำหรับองค์กรไทยที่กังวลเรื่องความปลอดภัยของข้อมูล อาจเริ่มจาก tool ภายในที่ไม่ใช่ข้อมูล sensitive ก่อนได้
ก้าวที่สี่ เริ่มต้น background loop ด้วยงานที่ failure-cost ต่ำ เช่น อัปเดต doc ภายในทีม, สรุป issue จาก GitHub ลง Slack, หรือ triage feedback จากลูกค้า อย่าเพิ่งให้ background loop ตัดสินใจในเรื่องที่ผิดพลาดแล้วเสียหายหนัก เช่น deploy production หรือลบข้อมูลจริง รอจน verification loop พิสูจน์ตัวเองได้แล้ว จึงค่อยขยับไปสู่งานที่ stake สูงขึ้น
ภาพรวมของ talk นี้คือการเปลี่ยน mindset จาก "ใช้ AI เป็นเครื่องมือต่อจากมือ" ไปสู่ "ออกแบบระบบให้ AI ทำงานเองได้แบบเชื่อถือได้" ซึ่ง Sid เรียกว่าเป็นรูปแบบการทำงานที่มนุษย์ไม่เคยทำได้มาก่อน ในยุคที่ keyboard ไม่ต้องเป็นคอขวดอีกต่อไป
Warning: เทคนิคทั้ง 3 ชั้นนี้สร้างต่อกันแบบมีลำดับ ห้ามข้ามขั้น การปล่อย background loop โดยไม่มี verification ที่แข็งแรงเป็นสูตรของหายนะระดับ production การรัน multi-Claude โดยไม่มี verification ก็เช่นกัน Sid ระบุชัดในคลิปว่า verification คือพื้นฐานที่ทำให้สองชั้นบนเป็นไปได้
ที่มา: Stop babysitting your agents โดย Sid Bidasaria ช่อง Claude บน YouTube





ความคิดเห็น
ยังไม่มีความคิดเห็น เป็นคนแรกที่แสดงความเห็น!