ช่อง Bijan Bowen ทดสอบ Grok Build เวอร์ชัน early beta เป็น coding agent บนเทอร์มินัลที่ xAI ออกแบบมาให้ชนกับ Claude Code และ Codex โดยทดสอบควบคู่กับโมเดล Grok 4.3 ที่เพิ่งออกจากสถานะ beta เมื่อเดือนเมษายน 2026 คลิปยาวราว 44 นาที จุดที่ผู้รีวิวเน้นตั้งแต่ต้นคือเครื่องมือนี้ยังเปิดเฉพาะผู้สมัครแพ็กเกจ SuperGrok Heavy ราคา $300 ต่อเดือน ซึ่งแพงที่สุดในบรรดา Frontier Labs ฝั่งสหรัฐที่มีค่าสมาชิก แม้จะมีข่าวดีลที่ทำให้จ่ายราว $99 ต่อเดือนหมุนเวียนอยู่บ้าง ในเซสชันที่ทดสอบ ระบบแสดง context length รวม 512k และ Grok Build จัดการการใช้งานทั้งหมดผ่านบัญชี SuperGrok Heavy ของผู้รีวิว สำหรับนักพัฒนาที่ติดตาม AI coding agent อยู่แล้ว บทความนี้สรุปสิ่งที่ Bijan Bowen เจอจริงในคลิป ทั้งฟีเจอร์ที่เดินดูทีละตัวและผลงานที่รันสด เพื่อให้เห็นภาพรวมโดยไม่ต้องดูคลิปเต็มทั้ง 44 นาที (Bijan Bowen, YouTube)
1. Grok Build คืออะไร และวางตัวชน Claude Code กับ Codex ตรงไหน
ในคลิป Bijan Bowen อธิบายว่า Grok Build เป็นเครื่องมือเขียนโค้ดที่ออกแบบมาแข่งกับ Claude Code หรือ Codex โดยเฉพาะในฝั่งเทอร์มินัล เพราะตัวมันใช้ส่วนติดต่อแบบ terminal user interface เป็นหลัก จุดที่ผู้รีวิวสังเกตและชอบคือมันผสมเทอร์มินัลล้วนกับ IDE เข้าด้วยกัน แม้จะพิมพ์คำสั่งผ่านเทอร์มินัล แต่ยังคลิกปุ่มบางอย่างด้วยเมาส์ได้ เช่นตอนอนุมัติแผนงานจะมีหน้าต่างเด้งขึ้นมาให้กด approve, revise หรือ abandon ได้ ต่างจากภาพจำของ coding agent บนเทอร์มินัลทั่วไป
ตามที่ผู้รีวิวสาธิต การติดตั้งเริ่มจากรันคำสั่งติดตั้ง จากนั้นล็อกอินผ่านหน้าต่างเบราว์เซอร์เพื่อยืนยันตัวตนกับบัญชี xAI แล้วเปิดเทอร์มินัลพิมพ์คำว่า grok เพื่อเข้าเซสชัน เมื่อ Bijan Bowen ถามระบบว่าเป็นโมเดลอะไร ระบบตอบว่าเป็น Grok 4.3 ที่ xAI ปล่อยในเดือนเมษายน 2026 ผู้รีวิวยังพบรายละเอียดน่าสนใจว่าเครื่องมือ web search ภายในใช้โมเดลอีกตัว ชื่อ Grok 4.20 multi-agent ส่วน chain of thought ของโมเดลก็แสดงค่อนข้างเด่นบนหน้าจอ ทำให้ติดตามได้ว่าระบบกำลังคิดอะไรอยู่
Note: Grok 4.3 เป็นโมเดลที่ Bijan Bowen เคยทดสอบมาแล้วตอนยังเป็น beta และระบุว่าตอนนั้นดีขึ้นจาก Grok รุ่นก่อนหน้าอย่างมีนัยสำคัญ คลิปนี้จึงเป็นการทดสอบ Grok 4.3 ที่ออกจาก beta แล้วควบคู่กับการทดสอบ Grok Build

2. ฟีเจอร์ที่ผู้รีวิวเดินดูทีละตัวในคลิป
จากหน้าเอกสารที่ Bijan Bowen เปิดดูและสาธิตจริง Grok Build มีชุดฟีเจอร์ค่อนข้างครบสำหรับ coding agent ยุคนี้ ผู้รีวิวเน้นว่าเพราะคลิปนี้ทดสอบเครื่องมือควบกับโมเดล จึงอาจไม่ได้ลองทุกคำสั่งครบ และอาจพลาดบางอย่างที่เห็นชัดเมื่อกลับมาดูคลิป
Plan mode เป็นโหมดที่บล็อกเครื่องมือเขียนไฟล์ทั้งหมดยกเว้นไฟล์แผนงานของเซสชัน เมื่อสั่งงาน ระบบจะร่างโครงว่าจะลงมือทำฟีเจอร์หรือบิลด์นั้นอย่างไร โดยยังไม่แก้อะไรจริง ช่วงแรกของการทดสอบ Bijan Bowen เปิด plan mode ไม่สำเร็จหลายครั้ง จนภายหลังพบว่าวิธีสลับโหมดคือกด shift tab ซึ่งใช้สลับ always approve mode ได้ด้วย จุดที่ผู้รีวิวประทับใจคือเมื่อเข้า plan mode กับโปรเจกต์เกมสเก็ตบอร์ด C++ ระบบไม่เพียงเปิดโหมด แต่สำรวจ repository เอง ระบุว่ามีไฟล์ instructions อยู่หนึ่งไฟล์ แล้ววางแผนการ implement เกมทั้งหมดด้วยตัวเอง
Always approve หรือ full-access เป็นแฟล็กที่ผู้รีวิวเทียบว่าน่าจะคล้ายกับแฟล็ก dangerously skip permissions ใน Claude Code หรือดร็อปดาวน์ full access ใน Codex คือปล่อยให้ระบบทำงานต่อเนื่องโดยไม่ต้องขออนุญาตทุกขั้นตอน ในคลิป Bijan Bowen ใช้โหมดนี้กับงานที่ต้องการให้ระบบทำงานยาวเอง เช่นตอนให้ clone repo อัลกอริทึมของ X แล้วบิลด์ต่อ ผลคือระบบไม่ถามยืนยันซ้ำ
Sub-agents Grok Build สามารถ spawn sub-agent เพื่อทำงานเฉพาะอย่างได้ ผู้รีวิวระบุว่าเป็นความสามารถที่เห็นทั่วไปมากขึ้นแล้ว และยกตัวอย่างว่า Kimi K2.6 ก็มีฟีเจอร์ agent swarm ลักษณะคล้ายกัน จุดที่ผู้รีวิวเห็นว่าน่าสนใจคือการได้เห็นความสามารถนี้ทำงานจากภายในส่วนติดต่อแบบเทอร์มินัล โดยในงานทดสอบอัลกอริทึม X ผู้รีวิวสังเกตเห็นว่าระบบ spawn sub-agent ขึ้นมาจริง
Skills, plugins และ marketplace จากเอกสารที่ผู้รีวิวเปิดดู Grok Build รองรับ skills, plugins และมีแท็บ marketplace สำหรับเรียกดูและติดตั้ง plugin จากแหล่งที่ตั้งค่าไว้ รูปแบบนี้คล้ายระบบนิเวศส่วนขยายของ coding agent ตัวอื่น
Memory และคำสั่ง dream ที่ท้ายหน้าเอกสาร Bijan Bowen พบแนวคิด shell provided commands มีทั้งคำสั่ง dream สำหรับทริกเกอร์รอบ offline memory consolidation, คำสั่ง memory สำหรับค้นหาและแก้ entry หน่วยความจำถาวร และคำสั่ง flush เพื่อเขียนหน่วยความจำลงดิสก์ ในทางปฏิบัติผู้รีวิวสังเกตว่าระบบจำบริบทได้จริง เพราะตอนสั่งแก้งานชิ้นหนึ่ง ระบบอ้างถึงคำขู่ที่ผู้รีวิวพิมพ์ไว้ก่อนหน้านี้ ทั้งที่ไม่ได้พูดซ้ำในข้อความใหม่ สะท้อนว่ามี memory ของบริบทเดิมเก็บไว้
สร้างภาพและวิดีโอในเทอร์มินัล Bijan Bowen ระบุว่าหนึ่งในฟีเจอร์ที่น่าสนใจที่สุดคือการทริกเกอร์ทั้ง image generation และ video generation ได้จากในเทอร์มินัลโดยตรง เมื่อพิมพ์คำว่า imagine ตามด้วย prompt ระบบจะสร้างภาพและบันทึกไว้ในโฟลเดอร์ Grok sessions ผู้รีวิวนำภาพที่สร้างนี้ไปใช้เป็น reference เพื่อให้ระบบบิลด์งานต่อ
รองรับ custom model ผู้รีวิวชี้ว่า Grok Build รองรับ custom model จึงไม่จำกัดให้ใช้เฉพาะกับ subscription ของ Grok เท่านั้น และเสริมว่าน่าจะต่อ local AI เข้ามาใช้ได้ด้วยถ้าต้องการ
ด่านการเข้าถึงราคา $300 ต่อเดือน ฟีเจอร์ทั้งหมดข้างต้นยังล็อกไว้หลังแพ็กเกจ SuperGrok Heavy ราคา $300 ต่อเดือน ซึ่ง Bijan Bowen ระบุว่าแพงที่สุดในบรรดา Frontier Labs ฝั่งสหรัฐที่เก็บค่าสมาชิก แม้จะมีข่าวดีลให้จ่ายราว $99 ต่อเดือน แต่ผู้รีวิวคาดว่าเมื่อเวลาผ่านไป การเข้าถึงน่าจะเปิดกว้างขึ้นและลงมาอยู่ในแพ็กเกจที่ราคาต่ำลง
3. ผลงานจริง 6 ชิ้นที่รันสดในคลิป
หัวใจของคลิปคือการให้ Grok Build ลงมือทำงานจริงหลายชิ้น Bijan Bowen รันสดและให้ความเห็นแบบตรงไปตรงมา
Browser OS เวอร์ชัน 3D ผู้รีวิวเริ่มจากการวาง prompt ชุด browser OS V2.5 ที่ต้องมีทั้งเกม GTA clone แบบ 3D เกม 3D อีกตัว ฟีเจอร์พิเศษที่ระบบคิดเอง ความสามารถเปลี่ยน wallpaper และแอปย่อยอีกหลายตัว สิ่งแรกที่ Bijan Bowen เน้นคือความเร็วที่สูงมาก ทั้งที่ใช้โหมดเริ่มต้นและไม่ได้เร่งอะไรเป็นพิเศษ ผลงานที่ได้มีรายละเอียดน่าสนใจ เช่นนาฬิกาที่คลิกแล้วมีอะไรเด้งขึ้น เมนู start ช่องค้นหา file explorer ที่เปิดเกมได้ คลิกขวาได้ และฟีเจอร์พิเศษชื่อ Nexus เป็นสภาพแวดล้อม 3D multi-tasking ที่จัดหน้าต่างเป็นแผงโฮโลแกรม สำหรับเกม GTA clone ผู้รีวิวสรุปว่ามีศักยภาพ มียานพาหนะ มีคนเดินจำนวนมาก ตึกมีหน้าต่าง และเก็บเหรียญแล้วยอดเงินขึ้นจริง แต่ยังเจอบั๊กตรรกะที่รถตำรวจสแน็ปมาที่พิกัดผู้เล่นเป๊ะโดยไม่เว้นระยะ ผู้รีวิวบอกว่าเป็นปัญหาที่เจอได้กับโมเดลที่ยังไม่ใช่ระดับ frontier โดยรวมประเมินว่าไม่ถึงกับดีมาก แต่เป็นผลที่รับได้สำหรับการทดสอบในเบราว์เซอร์
เกมสเก็ตบอร์ด C++ Bijan Bowen สร้างโฟลเดอร์เฉพาะแล้วใส่ instructions สำหรับเกมสเก็ตบอร์ด C++ แบบ self-contained ในธีม retro California boardwalk จุดที่ผู้รีวิวประทับใจคือ Grok Build วางแผนสถาปัตยกรรมมาให้ดู มีทั้ง architecture tradeoff matrix เป้าหมายโค้ดราว 2,000 ถึง 3,000 บรรทัด ระบุ non-goals และตั้ง success metric ว่าผู้เล่นต้องเล่นสเก็ตได้ราว 3 ถึง 5 นาทีโดยไม่มีบั๊กชัดเจน เมื่อรันครั้งแรก สีงานยังออกมาเหมือนทรายกลืนกันไปหมด ผู้รีวิวจึงส่ง screenshot ของปัญหากลับเข้าไปให้ระบบดู เพราะระบบนี้รองรับ multimodal ผลคือระบบปรับปรุงงานได้ชัดเจนจากภาพหน้าจอเพียงภาพเดียว แม้กลไกกระโดดและท่าทริกยังไม่สมบูรณ์ แต่จุดที่ Bijan Bowen ระบุว่าประทับใจที่สุดของชิ้นนี้คือภาพรวมของงานดีขึ้นมากหลังป้อนภาพปัญหาเข้าไป
Demo จาก repo อัลกอริทึมของ X ผู้รีวิวให้ระบบ clone repository อัลกอริทึมของ X ที่เปิดเผยซอร์สบางส่วนบน GitHub แล้วสร้างเดโมเว็บให้ผู้ใช้กรอกข้อความและดูว่าอัลกอริทึมจะให้คะแนนอย่างไร จุดที่ Bijan Bowen ชมคือระบบไม่ได้มั่วขึ้นมาเอง แต่ระบุชัดว่า repo ไม่มี trained model weights, hash embedding tables หรือข้อมูล user history จริง จึงเลือกทำเป็น educational simulator ที่ซื่อตรงต่อข้อจำกัด แทนการพยายามรัน inference service จริง ผลงานที่ได้ใช้เวลา turn completed ราว 6 นาที มีทั้ง seven-stage stepper, filter ที่แสดงเป็นการ์ด pass-fail พร้อมอ้างอิงไฟล์จริง ตาราง weighted scorer ที่แก้น้ำหนักแล้วคำนวณใหม่ทันที และระบุชัดว่า scoring engine เป็น heuristic แบบ seeded ไม่ใช่ของจริง เพราะของจริงไม่อยู่ใน repo ผู้รีวิวยอมรับว่าตัวเองไม่เข้าใจอัลกอริทึมนี้ทั้งหมด แต่ประเมินว่า front end ที่ได้ดูดีและทำมาดี เป็นงานซับซ้อนที่ทำออกมาได้เก่ง
เกมบินโพลีต่ำ Bijan Bowen ทดสอบ multimodal coding เพิ่มโดยให้ระบบสร้างงานจากภาพ reference ที่ระบบสร้างเอง ผลออกมาเป็นเกมขับเครื่องบิน F-16 โพลีต่ำเหนือภูมิประเทศแบบ stylized จุดที่ผู้รีวิวระบุว่าเหนือความคาดหมายคือโมเดลเครื่องบิน เมฆ และฉาก ซึ่งเป็นหนึ่งในงานที่ดีที่สุดที่เคยเห็นจากการทดสอบลักษณะนี้ ผู้รีวิวเน้นว่าทั้งหมดมาจากความสามารถสร้างภาพในเทอร์มินัลแล้วเอาภาพนั้นมาเป็นฐานบิลด์ต่อ และยังไม่มีโมเดลที่มีอยู่ตอนนี้ตัวไหนสร้างภาพแบบนั้นออกมาในช็อตเดียวได้
แปลง UI mockup เป็นหน้าเว็บ ผู้รีวิวป้อนภาพดีไซน์เว็บแนวการ์ดของขวัญสำหรับบริษัท AI แล้วสั่งให้ทำซ้ำแบบ pixel perfect ผลที่ได้คือเว็บ Token Sphere ที่มีโลโก้บริษัทอย่าง Mistral, Google, Anthropic จุดที่ Bijan Bowen เห็นว่าตลกและน่าสนใจคือระบบตีความคำว่า pixel perfect ตรงตัว จนวาดองค์ประกอบของหน้าต่างเบราว์เซอร์ในภาพต้นฉบับมาด้วย เช่นปุ่มปิดและช่องกรอก URL แต่แดชบอร์ดในหน้านี้ทำงานไม่สมบูรณ์ ทำให้การใช้หน่วยความจำของเว็บพุ่งจนเครื่องทดสอบ out of memory จึงไม่ได้ดูผลส่วนนั้นต่อ
ชุดกลอง virtual drum kit งานชิ้นสุดท้ายคือ virtual drum kit ที่มีกลอง 4 แทร็กพร้อมฟีเจอร์ auto play ผู้รีวิวเริ่มใน plan mode แล้วให้บิลด์ในโหมด always approve เขาประเมินว่าการจัดวางองค์ประกอบยังไม่ค่อยดี แต่โมเดล 3D ของชุดกลองทำออกมาดูดี ใช้งานได้จริงทั้งปรับ BPM, auto play และ reset view ส่วนเสียงที่ได้ ผู้รีวิวระบุว่า overdrive หนักมากจนผิดปกติ โดยตรวจสอบแล้วว่าไม่ใช่ปัญหาที่ลำโพง
4. จุดแข็ง จุดอ่อน และบทสรุปของผู้รีวิว
ในช่วงสรุป Bijan Bowen ให้ความเห็นแบบสมดุล สิ่งที่ผู้รีวิวเน้นซ้ำมากที่สุดคือความเร็ว เขาระบุว่าเร็วมากและทำงานเสร็จไวมากในทุกงานทดสอบ จุดแข็งที่สองคือความสามารถด้าน multimodal ที่ผู้รีวิวประเมินว่าน่าประทับใจ ทั้งกรณีป้อน screenshot ปัญหาแล้วระบบรีสกินงานให้ดีขึ้นชัดเจน และกรณีสร้างภาพในเทอร์มินัลแล้วเอาภาพมาบิลด์เป็นเกมบินที่ฉากออกมาดี นอกจากนี้ผู้รีวิวยังชอบส่วนติดต่อแบบ terminal ที่ยังคลิกปุ่มได้ตอนอนุมัติแผน และชมงานออกแบบ UI ของ xAI ว่าทำมาดีมาตลอดหลายรุ่น ส่วนงานทดสอบ repo อัลกอริทึม X ผู้รีวิวยกว่าเป็นงาน front end ที่ซับซ้อนและทำได้ดีเกินคาด
ด้านจุดอ่อน Bijan Bowen ระบุว่าผลงานเว็บหลายชิ้นยังคอมไพล์ออกมาพร้อม error ในตอนแรก ซึ่งน่าหงุดหงิด เขาจึงอยากเห็นระบบทดสอบงานเองด้วย headless browser ได้ดีขึ้นกว่านี้ เพราะบางครั้ง headless ก็ไม่โชว์ปัญหาทั้งหมดที่เห็นตอนทดสอบจริงบนกล้อง นอกจากนี้ผู้รีวิวสังเกตพฤติกรรมแปลก เช่นระบบย้ายไฟล์ executable ของเกมสเก็ตออกจากโฟลเดอร์โดยไม่ได้ตั้งใจให้ทำ และมีหลายครั้งที่ระบบยึดติดกับ user query เดิม เช่นคำสั่ง enable plan mode จนทำงานเกินกว่าที่สั่ง รวมถึงบางครั้งไปอ่านไฟล์เกมจากการทดสอบก่อนหน้า ทั้งที่เปิดในโฟลเดอร์ว่างใหม่ จุดอ่อนเชิงคุณภาพที่เห็นชัดคืองานหลายชิ้นยังมีบั๊ก เช่นกลไกกระโดดและทริกในเกมสเก็ตที่ไม่สมบูรณ์ การจัดวางชุดกลองที่ไม่ลงตัว เสียงกลองที่ overdrive ผิดปกติ และเว็บที่ทำให้เครื่อง out of memory
โดยสรุปจากสิ่งที่ Bijan Bowen นำเสนอ Grok Build ในสถานะ early beta คู่กับ Grok 4.3 ที่ออกจาก beta แล้ว ถือเป็นการเข้าสนามที่น่าสนใจของ xAI จุดที่ผู้รีวิวย้ำและติดตาคือความเร็วกับความสามารถ multimodal แต่ภาพรวมยังเป็นเครื่องมือระยะแรกที่คุณภาพงานไม่สม่ำเสมอ ผู้รีวิวจึงจัดให้เป็นสิ่งที่ควรจับตาดูต่อ ไม่ใช่ข้อสรุปสุดท้ายว่าดีกว่าหรือด้อยกว่า Claude Code หรือ Codex
ที่มา: Bijan Bowen — "Grok Build + Grok 4.3 FULL Test – xAI's Claude Code & Codex Competitor!" (YouTube, 15 พฤษภาคม 2026) บทความนี้สรุปและเรียบเรียงเนื้อหาจากคลิปทดสอบดังกล่าวเป็นแหล่งเดียว





ความคิดเห็น
ยังไม่มีความคิดเห็น เป็นคนแรกที่แสดงความเห็น!