เมื่อ Claude Code คุมจอคอมได้เอง: อวสานการเขียน Test Script หรือแค่ของเล่นใหม่ราคาแพง?

วงการ Developer สั่นสะเทือนอีกครั้งเมื่อวันที่ 31 มีนาคม 2026 ที่ผ่านมา หลัง Anthropic ประกาศปล่อยฟีเจอร์ Computer Use ให้กับผู้ใช้ Claude Code ระดับ Pro และ Max อย่างเป็นทางการ ความสามารถนี้ไม่ได้เป็นแค่การเขียนโค้ดโต้ตอบกันใน Terminal อีกต่อไป แต่มันคือการที่ Claude สามารถสแกนหน้าจอ ขยับเมาส์ คลิกปุ่ม พิมพ์ข้อความ และไถจอแทนเราได้บน macOS
กระแสใน Twitter/X และชุมชน Dev ไทยเริ่มมีการตั้งคำถามที่น่าสนใจว่า “นี่คือจุดจบของ Playwright หรือเปล่า?” ในเมื่อเราสามารถบอก Claude สั้นๆ ว่า “ช่วยไปเทสหน้าลงทะเบียนให้หน่อย” แล้วมันก็ทำได้เองโดยไม่ต้องเขียนโค้ดสักบรรทัดเดียว ทำไมเรายังต้องมานั่งงมหา selector หรือเขียนสคริปต์ยาวเหยียดกันอยู่อีก
ผมลองขุดข้อมูลและอ่านรีพอร์ตเชิงลึกจากหลายสำนัก สรุปสั้นๆ ให้คุณก่อนเลยว่า Computer Use คือนวัตกรรมที่เปลี่ยนโลกจริง แต่ถ้าคิดจะเอามาแทน Playwright ในงานระดับ Production วันนี้… คุณอาจจะกำลังขี่ช้างจับตั๊กแตนที่มีราคาแพงมหาศาลครับ
Claude Code Computer Use: เมื่อ AI มีตาและมือเป็นของตัวเอง
หลักการทำงานของ Computer Use ที่ Anthropic ระบุไว้คือการทำงานแบบ Perception-Action Loop ครับ อธิบายง่ายๆ คือ Claude จะทำการแคปหน้าจอ (Screenshot) แล้วส่งรูปนั้นกลับไปให้โมเดลประมวลผลด้วย Vision พอโมเดลเข้าใจว่าอะไรอยู่ตรงไหน มันจะตัดสินใจว่าจะทำอะไรต่อ แล้วส่งคำสั่งกลับมาคลิกหรือพิมพ์บนเครื่องเรา วนลูปแบบนี้ไปเรื่อยๆ จนกว่างานจะเสร็จ
ถ้ามองในแง่ของงานเทส UI นี่คือสวรรค์เลยครับ เพราะคุณไม่ต้องปวดหัวกับเรื่องการหา ID, Class หรือ XPath อีกต่อไป Claude มองหน้าจอเหมือนที่มนุษย์มอง ถ้าเห็นปุ่มสีฟ้าเขียนว่า “Submit” มันก็แค่เลื่อนเมาส์ไปคลิกตรงนั้น ความยืดหยุ่นระดับนี้คือสิ่งที่เครื่องมือ Automation ยุคเก่าทำไม่ได้
"Screen control is reserved for things nothing else can reach: native apps, simulators, and tools without an API."
— Claude Code Official Docs
แม้แต่เอกสารทางการของ Anthropic เองยังยอมรับครับว่า Computer Use คือเครื่องมือที่ครอบคลุมที่สุดแต่ก็ “ช้าที่สุด” เช่นกัน โดยมันจะถูกเลือกใช้เป็นลำดับสุดท้ายหลังจากที่ลองใช้ MCP server, Bash หรือ Claude in Chrome แล้วไม่สำเร็จเท่านั้น นั่นแปลว่าในสายตาของคนสร้าง เขารู้ดีว่าความแรงของมันต้องแลกมาด้วยอะไรบางอย่าง
ความเร็วที่ต่างกันคนละโลก: นักสืบสายตรวจ vs นักวิจารณ์อาหาร
ถ้าผมเปรียบเทียบ Playwright เหมือน “นักสืบสายตรวจ” ที่เดินเข้าในร้านอาหารพร้อมเช็คลิสต์ว่า ถังดับเพลิงมีไหม? สบู่ในห้องน้ำเต็มไหม? เขาเดินตรวจได้เร็วมาก เพราะเขารู้ตำแหน่งทุกอย่างอยู่แล้ว ข้อมูลจาก TestDino ระบุว่า Playwright ใช้เวลาเพียง 290ms ต่อหนึ่งการกระทำ (action) และสามารถรันเทสได้ถึง 1,240 ครั้งต่อชั่วโมง
ในขณะที่ Computer Use เป็นเหมือน “นักวิจารณ์อาหาร” ที่เพิ่งเคยเข้าร้านนี้ครั้งแรก เขาต้องกวาดตามองรอบร้าน (Screenshot) คิดวิเคราะห์ว่าจะเดินไปทางไหน (Vision Processing) แล้วค่อยๆ ขยับตัวไป (API Call) การกรอกฟอร์มง่ายๆ ที่ Playwright ทำเสร็จในเสี้ยววินาที Claude อาจต้องใช้เวลาถึง 30-60 วินาที และถ้าเป็น workflow ซับซ้อนก็อาจลากยาวไปหลายนาทีเลยทีเดียว
ประเด็นต่อมาคือความแม่นยำครับ การทำงานผ่านสายตา (Vision-based) มีความเสี่ยงที่ Claude จะระบุตำแหน่งผิดพลาด โดยเฉพาะในหน้าจอที่องค์ประกอบเยอะๆ หรือซับซ้อน ต่างจาก Playwright ที่คุยกับโครงสร้างหน้าจอโดยตรง ทำให้มีความเป็น Deterministic หรือคาดเดาผลลัพธ์ได้แม่นยำกว่ามาก
กำแพงที่มองไม่เห็น: CI/CD และค่าตัวราคาแพง
นี่คือจุดตายสำคัญที่ทำให้ Computer Use ยังแทนที่ Playwright ไม่ได้ในระบบงานจริงครับ ข้อกำหนดของ Computer Use ใน Claude Code ระบุชัดเจนว่าต้องรันในโหมด Interactive เท่านั้น (ห้ามใส่ flag -p) ซึ่งหมายความว่ามันต้องการ “คน” มานั่งอนุมัติการเข้าถึงแอปในแต่ละเซสชั่น
แล้วลองคิดดูครับ ถ้าเราต้องการรันเทส 100 ครั้งต่อวันบน CI/CD pipeline เพื่อเช็คว่าโค้ดที่เพิ่ง push ขึ้นไปทำระบบพังไหม? Computer Use ทำไม่ได้ทันทีครับ เพราะมันไม่มีหน้าจอให้แคป และไม่มีคนไปกด Allow ให้มันทำงาน แม้จะมีวิธี workaround อย่างการใช้ Xvfb หรือหน้าจอจำลอง แต่นั่นก็เพิ่มความซับซ้อนและค่าใช้จ่ายขึ้นไปอีก $1,800-$4,800 ต่อปี
"การสร้างระบบเทสด้วย Claude ในระดับ Production อาจมีค่าใช้จ่ายสูงถึง $89,120-$147,200 ในปีแรก เมื่อคำนวณรวมค่า API และค่าดูแลรักษาระบบ"
— DevAssure Analysis
แค่ค่า API ของ Claude สำหรับการรัน 100 เทสต่อวัน ก็อาจตกเดือนละเกือบแสนบาทแล้วครับ (ประมาณ $2,250-$3,300) ในขณะที่การรัน Playwright บนเซิร์ฟเวอร์ตัวเองแทบจะไม่มีต้นทุนส่วนนี้เลย นี่คือเหตุผลว่าทำไมองค์กรใหญ่ถึงยังไม่ยอมย้ายบ้านไปหา AI Agent แบบเต็มตัว
Playwright ไม่ได้อยู่เฉย: เมื่อเครื่องมือเก่าได้รับการฉีดวัคซีน AI
อย่าเข้าใจผิดว่า Playwright คือไดโนเสาร์นะครับ ในปี 2026 นี้ Playwright เองก็มี Ecosystem ที่ใส่ AI เข้าไปข้างในจนฉลาดขึ้นมาก เรามีสิ่งที่เรียกว่า “Healer Agent” ที่ข้อมูลจาก Microsoft บอกว่ามันสามารถซ่อมแซมตัวเองได้สำเร็จกว่า 75% เมื่อเกิดปัญหาเรื่อง selector พัง
วิธีการของ Playwright คือการใช้ “Accessibility Tree” หรือโครงสร้างหน้าจอสำหรับผู้พิการมาเป็นข้อมูลให้ AI วิเคราะห์ ซึ่งข้อมูลชุดนี้มีขนาดเล็กและแม่นยำกว่าการส่งรูปภาพทั้งหน้าจอไปให้ Vision model มาก ทำให้ประหยัด token ได้ถึง 4-10 เท่า และทำงานได้เร็วกว่า Computer Use มหาศาล
ที่น่าสนใจกว่านั้นคือ ปัจจุบัน GitHub Copilot หรือ AI Coding Agent ต่างๆ เริ่มใช้ Playwright MCP (Model Context Protocol) เพื่อให้ AI สามารถรันเทสตรวจสอบโค้ดที่มันเพิ่งเขียนได้เองใน Browser จริงๆ ก่อนจะส่ง Pull Request มาให้เราด้วยซ้ำ มันคือการเอาสมองของ AI มาบวกกับความเร็วของ Playwright นั่นเองครับ
สรุป: เลือกดาบให้เหมาะกับศัตรู
ถ้าถามผมว่าวันนี้คุณควรเลิกเขียน Playwright แล้วไปพึ่ง Claude Code หรือเปล่า? คำตอบของผมชัดเจนคือ “ไม่ใช่” ครับ
Claude Code Computer Use เหมาะมากสำหรับการทำ Exploratory Testing หรือการ “ลองเทสแบบสุ่ม” เพื่อหาบั๊กแปลกๆ, เทส Native App บน Mac ที่ไม่มี API ให้คุยด้วย หรือแม้แต่การ Debug ปัญหาเรื่อง Layout ที่ต้องใช้ตาดูจริงๆ เท่านั้น มันคือเครื่องมือที่เหมาะกับ Solo Developer หรือทีมที่รันเทสน้อยกว่า 20 ครั้งต่อวัน
แต่สำหรับระบบที่ต้องรันเทสทุกวันใน Pipeline, ต้องรองรับหลาย Platform, และต้องการความเสถียรระดับที่ฝากชีวิตไว้ได้ Playwright ยังเป็นราชาอยู่ครับ เพียงแต่คุณต้องเริ่มใช้ AI เข้ามาช่วยเขียนและช่วยซ่อม (Heal) สคริปต์เหล่านั้นแทนการนั่งเขียนเองทั้งหมด
"อนาคตไม่ใช่การเลือกระหว่าง AI หรือสคริปต์ แต่คือการใช้ AI มาเขียนสคริปต์ให้เราต่างหาก"
สุดท้ายแล้ว เรื่องที่ทุกคนรู้แต่ไม่มีใครพูดคือ “ความยืดหยุ่นต้องแลกมาด้วยต้นทุน” เสมอ ถ้าคุณอยากได้ความง่ายแบบ Computer Use คุณต้องพร้อมจ่ายค่า API และรอเวลาเทสที่นานขึ้น แต่ถ้าคุณอยากได้ความเร็วและความประหยัด Playwright คือคำตอบที่ยังไม่มีใครฆ่าตายในปี 2026 นี้ครับ
แหล่งอ้างอิง
- Let Claude use your computer from the CLI - Claude Code Docs (Official)
- Using Claude to Build a Testing Agent is Brilliant — Until It Isn't - DevAssure
- Playwright AI Ecosystem 2026: MCP, Agents & Self-Healing Tests - TestDino
- What Is Claude Code Computer Use? - MindStudio
- 6 Most Popular Playwright MCP Servers for AI Testing in 2026 - Bug0
- Performance Benchmarks of Playwright, Cypress, and Selenium in 2026 - TestDino
บทความที่เกี่ยวข้อง

บทเรียนจากการปิดตัวของ Sora เมื่อเดโมระดับโลกพ่ายแพ้ให้กับโลกธุรกิจจริง
ถอดรหัสเบื้องหลังการปิดตัวแอป Sora เมื่อเทคโนโลยีสุดล้ำต้องพ่ายแพ้ให้ต้นทุนมหาศาล คู่แข่งที่ดุดัน และพฤติกรรมผู้บริโภค


AI สายสปอยล์: ทำไมแชตบอตชอบโกหกให้เราสบายใจ และผลกระทบที่ซ่อนอยู่
งานวิจัยล่าสุดจาก Stanford ชี้ชัด AI มักจะเห็นด้วยกับเรามากกว่ามนุษย์ปกติ และความเอาใจนี้กำลังทำให้เรากล้าที่จะขอโทษน้อยลงในชีวิตจริง


ความคิดเห็น
ยังไม่มีความคิดเห็น เป็นคนแรกที่แสดงความเห็น!