David Ondrej ครีเอเตอร์สาย AI agent อธิบายในคลิปว่า Hermes agent กำลังกลายเป็น AI agent ที่เติบโตเร็วและได้รับความนิยมมากที่สุดในโลก โดยชี้ว่ามันเป็น project ที่ขึ้นถึง 100,000 ดาวบน GitHub เร็วที่สุดในประวัติศาสตร์ของแพลตฟอร์ม จุดที่ทำให้คลิปใช้คำว่า insane ไม่ใช่แค่ตัวเลขดาว แต่เป็นเพราะมันเป็น agent ที่เขียน skill ของตัวเองและซ่อมตัวเองได้กลางงาน เมื่อจับคู่กับเครื่องมือใหม่ชื่อ browser harness จึงทำงานบน browser ได้ใกล้เคียงมนุษย์ บทความนี้สรุปเนื้อหาจากคลิปดังกล่าวเพียงแหล่งเดียว ครอบคลุมทั้งบริบทเรื่องความเร็วของ project การสาธิตสด 2 งานที่ใช้พิสูจน์ความสามารถ และข้อสรุปปิดท้ายของ David Ondrej ที่ว่ามีข้อโต้แย้งหนักแน่นว่า Hermes agent แรงกว่าคนทั่วไปที่จ้างมาทำงานไปแล้ว เพื่อให้ผู้สนใจสาย AI agent และนักพัฒนาเห็นภาพว่าทำไม project นี้จึงถูกพูดถึงมากขนาดนี้
Note: ทุกข้อเท็จจริง ตัวเลข และคำอธิบายในบทความนี้มาจากคลิปของ David Ondrej เพียงแหล่งเดียว ไม่ได้เพิ่มข้อมูลภายนอกที่คลิปไม่ได้กล่าวถึง ชื่อที่ใช้เรียกตลอดบทความคือ "Hermes agent" ตามที่ผู้สร้างคลิปเรียก โดย repo open-source ต้นทางที่คลิปอ้างถึงคือ
agent0ai/agent-zero
1. Hermes agent คืออะไร และทำไมคลิปถึงบอกว่า insane
ในคลิป David Ondrej อธิบายว่า Hermes agent คือ AI agent ที่จุดเด่นหลักไม่ได้อยู่ที่การตอบคำถามเก่ง แต่อยู่ที่ความสามารถ self-improving หรือการที่ agent สร้าง skill ใหม่ของตัวเองได้ และ self-healing หรือการวิเคราะห์ต้นเหตุพร้อมแก้ปัญหาให้ตัวเองได้ทันทีระหว่างทำงาน David Ondrej ระบุว่านี่คือสิ่งที่ OpenClaw ทำไม่ได้ เพราะ OpenClaw ไม่มีความสามารถสร้าง skill ด้วยตัวเอง จุดนี้จึงเป็นเหตุผลหลักที่ทำให้ project ได้รับความนิยมเร็วขนาดนี้
ตัวเลขที่คลิปยกมาคือ Hermes agent เป็น project ที่ไปถึง 100,000 ดาวบน GitHub เร็วที่สุดในประวัติศาสตร์ทั้งหมดของ GitHub โดย David Ondrej อธิบายว่าสาเหตุหลักมาจากความเร็วในการอัปเดตที่สูงมาก พร้อมยกข้อมูลว่ามีการปล่อยรุ่นใหญ่ถึง 5 รุ่นภายใน 20 วันที่ผ่านมา และ merge PR มากกว่า 741 ครั้ง หรือคิดเป็นราว 37 pull request ต่อวัน
นอกจากนี้ คลิปยังเปรียบเทียบเทรนด์ผ่าน Google Trends ของคำค้นสองคำในช่วง 3 เดือนล่าสุดทั่วโลก โดย David Ondrej ชี้ว่าความสนใจในคำว่า Hermes agent เติบโตเร็วขึ้นเรื่อย ๆ ส่วนความสนใจใน OpenClaw ขึ้นถึงจุดสูงสุดในช่วงปลายเดือนมีนาคมแล้วค่อย ๆ ลดลง คลิปจึงใช้คำว่า project นี้อาจเป็น "OpenClaw killer" โดยระบุว่าไม่ใช่แค่ความเห็นส่วนตัว แต่อ้างอิงจากข้อมูลเทรนด์ดังกล่าว ทั้งนี้ คลิปยังยกตัวอย่างการใช้งานจากชุมชนประกอบสั้น ๆ เช่น มีผู้ใช้ Hermes agent ร่วมกับ skill เดียวจัดการ jailbreak โมเดลหนึ่งได้ด้วย prompt จากมนุษย์เพียงไม่กี่ครั้ง และมีผู้ใช้สั่งให้สร้างวิดีโอแนวตั้งภาษาจีนพร้อมเสียงพากย์ออกมาเป็นไฟล์ MP4 ได้ทั้งไฟล์

2. browser harness กับประโยคที่ว่า Hermes คือสมอง Browser Use คือมือ
David Ondrej อธิบายในคลิปว่ากุญแจที่ทำให้ Hermes agent ขยับเข้าใกล้ระดับที่เขาเรียกว่า near-AGI คือเครื่องมือใหม่ใน GitHub repo ชื่อ browser harness ซึ่งเป็นผลงานของทีมเดียวกับ Browser Use คลิปนิยามว่ามันคือ harness ที่บางที่สุด เรียบที่สุด และซ่อมตัวเองได้ เปิดทางให้โมเดล AI ทำงานบน browser ได้อย่างอิสระ จุดสำคัญที่ David Ondrej ย้ำคือถ้า agent ทำงานนั้นด้วยไลบรารีพื้นฐานไม่ได้ มันจะสร้างฟังก์ชันใหม่และเขียน skill ใหม่ขึ้นมา เพื่อทำงานชนิดนั้นบนอินเทอร์เน็ตให้สำเร็จ
ในคลิป David Ondrej สรุปความสัมพันธ์ของสองส่วนนี้เป็นประโยคที่ชัดว่า Hermes คือสมอง ส่วน Browser Use คือมือ โดยอธิบายว่า Browser Use คือเครื่องมือที่ทำให้ agent มองเห็น คลิก และพิมพ์บนเว็บไซต์ไหนก็ได้เหมือนมนุษย์ เมื่อรวมกับ browser harness ที่ซ่อมตัวเองได้ จึงกลายเป็น agent ที่ self-improving ทำงานคู่กับเครื่องมือควบคุม browser ที่ self-improving เช่นกัน คลิประบุว่านี่คือชุดเครื่องมือที่ดีที่สุดในตอนนี้สำหรับให้ agent ลงมือทำงานจริงบนเว็บ ไม่ใช่แค่เปิดดูหน้าเว็บเฉย ๆ
David Ondrej ยกตัวอย่างประเภทงานที่สั่งได้ เช่น ให้ไปโพสต์ทวีตบน Twitter ซื้อของบน Amazon ดึงข้อมูลข่าวล่าสุดจาก Hacker News หรือหา lead จาก LinkedIn โดยสรุปว่างานใดก็ตามที่มนุษย์ทำเองบนคอมพิวเตอร์ ตอนนี้มอบหมายให้ agent ทำแทนได้ และด้วย browser harness มันก็ทำงานเหล่านั้นได้จริง ทั้งนี้ ทีมผู้สร้าง browser harness มั่นใจถึงขั้นประกาศในคลิปว่า ใครเจองานที่ browser harness ทำไม่ได้เป็นคนแรกจะได้ Mac Mini เครื่องใหม่ไปเลย
3. เดโม 1 ดึง 15 อันดับ Hacker News ออกมาเป็นไฟล์ JSON
เพื่อพิสูจน์ความสามารถ self-improving David Ondrej สาธิตสดในคลิปด้วยการสั่งให้ Hermes agent ไปที่ Hacker News แล้วดึงโพสต์ 15 อันดับแรก เก็บข้อมูลหัวข้อ คะแนน ผู้โพสต์ จำนวนคอมเมนต์ และลิงก์ URL ของแต่ละโพสต์ จากนั้นบันทึกเป็นไฟล์ JSON พร้อมสั่งเพิ่มว่าก่อนจบงานให้ contribute สิ่งที่เรียนรู้เกี่ยวกับการ scrape เว็บข่าวกลับเข้าระบบด้วย คลิปย้ำว่างานนี้ไม่ใช่แค่เปิดเว็บ แต่เป็นการ scrape คลิกเข้าหลายโพสต์ และเซฟเป็นไฟล์ JSON ซึ่งถ้าทำเองด้วยมือ คลิปประเมินว่าใช้เวลาอย่างน้อย 20 ถึง 30 นาที
ผลที่ David Ondrej แสดงในคลิปคือ agent ทำงานสำเร็จและสร้างไฟล์ JSON ที่มีโพสต์ 15 อันดับครบตามที่ขอ จุดที่คลิปชี้ว่าน่าสนใจคือ agent ทำได้แม้ไม่ได้พิมพ์สั่งให้ใช้ browser harness ตรง ๆ เพราะมันรู้เองว่ามี skill นี้อยู่และเลือกใช้เอง อีกทั้งยังเจอ skill เดิมในโฟลเดอร์ domain-skills ของ Browser Use ซึ่งเป็น skill สำหรับ scrape Hacker News โดยเฉพาะ จึงหยิบมาใช้ต่อแทนการเริ่มใหม่ทั้งหมด
ในคลิป David Ondrej เปิดไฟล์ skill ที่เขียนกลับให้ดู โดยระบุว่า agent พบ gotcha หรือกับดักที่อาจพลาดได้ถึง 4 จุดเมื่อทำงานบน Hacker News เช่น เรื่อง prefix ของ relative URL โพสต์ที่เป็น self post ปม anchor ของโพสต์ที่ไม่มีคอมเมนต์ และการแบ่งหน้าที่ไม่ตรงกับขอบ คลิปชี้ว่า agent ไม่ได้แค่ทำซ้ำสิ่งที่มีอยู่ แต่อ้างอิงไฟล์ skill เดิมแล้วต่อยอดบนความรู้เดิม พร้อมแนบบล็อกโค้ด Python ที่ใช้งานได้จริงเป็น recipe สำหรับครั้งหน้า เพื่อให้ไม่ต้องเขียนโค้ดใหม่อีก จุดที่ David Ondrej บอกว่าน่าทึ่งที่สุดคือย่อหน้าสุดท้ายที่ agent สังเกตเห็นคำสั่งลักษณะคล้ายกัน แล้วจดบันทึกไว้เผื่อ AI agent ตัวอื่นในอนาคต ซึ่งคลิปเรียกว่าเป็นการสร้างองค์ความรู้เชิงรุก
4. เดโม 2 ดึง 12 คลิป YouTube ล่าสุดมาทำเป็นกริด PNG 4x3
งานที่สองที่ David Ondrej สาธิตในคลิปยากกว่าเดิม คือสั่งให้ Hermes agent เข้าไปที่ช่อง YouTube ของเขา ดึงวิดีโอ 12 คลิปล่าสุดพร้อมชื่อคลิป แล้วบันทึกเป็นไฟล์ PNG ที่จัดเรียงเป็นกริดเดียว คลิประบุว่างานลักษณะนี้คนทั่วไปส่วนใหญ่อาจทำไม่ได้ด้วยซ้ำ เพราะต้องนำทางใน YouTube ดึง thumbnail แล้วประกอบเป็นกริดให้ครบ
David Ondrej ชี้ว่าเดโมนี้คือเดโมที่ดีที่สุดในคลิป เพราะมีจุดสำคัญหลายอย่าง จุดแรกคือช่วงที่เกิด self-healing แบบสด ๆ เมื่อ browser harness พยายามเชื่อมต่อกับ Chrome ในเครื่องแล้วล้มเหลว Hermes agent จึงวิเคราะห์ต้นเหตุของปัญหานั้น และแก้ทางด้วยการสั่งเปิด remote daemon ผ่านสคริปต์ที่เกี่ยวกับ YouTube เพื่อข้ามอุปสรรคได้แบบเรียลไทม์ระหว่างทำงานจริง
จุดที่สองที่คลิปเน้นคือการค้นพบที่ฉลาด โดย agent พบว่า YouTube ฝังข้อมูลชื่อ ytInitialData ซึ่งเป็น JSON ก้อนใหญ่ขนาดราว 1 เมกะไบต์ไว้ในตัว HTML ของหน้าเว็บอยู่แล้ว agent จึงดึงข้อมูลวิดีโอ 30 รายการจากก้อนนั้นโดยตรง ไม่ต้องเลื่อนหน้าหรือไล่คลิกใน DOM แล้วเลือก 12 คลิปล่าสุดมาสร้างเป็นกริด PNG ขนาด 4x3 จุดที่สามคือก่อนนำเสนอ agent ตรวจซ้ำงานของตัวเองว่าได้กริดที่สะอาดจริงไหม แล้วจึง contribute skill ใหม่ความยาว 147 บรรทัดกลับเข้าระบบ คลิประบุว่า skill นี้เก็บทั้งรูปแบบ URL เส้นทางของ JSON ที่ถูกต้อง สนิปเปต JavaScript ที่ใช้ดึงข้อมูลได้จริง และ gotcha ที่เจอ เพื่อให้คนถัดไปที่ใช้ Hermes agent scrape ช่อง YouTube ไม่ต้องเจอปัญหาเดิมอีก
Tip: ในคลิป David Ondrej เปรียบเทียบว่าเดโมนี้สะท้อนว่า agent ไม่ได้แค่ทำงานเสร็จ แต่จดวิธีแก้ปัญหาใหม่ ๆ ออกมาเป็น playbook ที่คนอื่นใช้ต่อได้ ซึ่งเขาตั้งคำถามว่าในบริษัททั่วไปมีพนักงานกี่คนที่ทำแบบนี้ได้จริง
5. ข้อสรุปของคลิป และสิ่งที่ต้องมีถ้าจะรันเอง
ในช่วงปิดท้าย David Ondrej สรุปแก่นของคลิปว่า งานใดก็ตามที่มนุษย์ทำได้บน browser ตอนนี้ Hermes agent ก็ทำได้ และที่มากกว่านั้นคือมันจดวิธีแก้ปัญหาใหม่ ๆ ออกมาเป็น SOP หรือ playbook ที่นำกลับมาใช้ซ้ำได้ คลิปตั้งข้อสังเกตว่าพนักงานจำนวนมากในองค์กรไม่เคยสร้างกระบวนการหรือระบบใหม่ และไม่ได้ถนัดแก้ปัญหาที่ไม่เคยเจอ แต่ Hermes agent ที่ทำงานคู่กับ browser harness ทำสิ่งเหล่านั้นได้ David Ondrej จึงสรุปว่ามีข้อโต้แย้งหนักแน่นว่า Hermes agent แรงกว่าคนทั่วไปที่จ้างมาทำงานในบริษัทไปแล้ว และย้ำว่า project นี้เพิ่งเปิดตัวได้ราวสองเดือน
สำหรับเรื่องการนำไปใช้งานจริง คลิปอธิบายขั้นตอนติดตั้งไว้ละเอียด ในเชิงภาพรวมที่เป็นประโยชน์ต่อความเข้าใจคือ การรัน agent ให้ทำงานต่อเนื่องจำเป็นต้องมีเซิร์ฟเวอร์หรือ VPS สำหรับรันตลอดเวลา ต้องมี API key ของ OpenRouter เพื่อเรียกใช้โมเดล และต้องเลือกโมเดลที่แรงพอ ในคลิป David Ondrej เลือกใช้ Opus 4.7 เป็นโมเดลหลัก ส่วน browser harness สามารถรันผ่าน Browser Use cloud หรือรันแบบ headless บนเครื่องเองก็ได้ตามที่คลิปสาธิตทั้งสองทาง ทั้งนี้ รายละเอียดผู้ให้บริการเฉพาะรายและขั้นตอนเชิงลึกอยู่ในคลิปต้นฉบับ บทความนี้สรุปเฉพาะส่วนที่ช่วยให้ผู้อ่านเห็นภาพรวมว่าต้องมีอะไรบ้างจึงจะรันเองได้
โดยสรุป สิ่งที่ทำให้ Hermes agent ถูกพูดถึงตามที่ David Ondrej นำเสนอ ไม่ใช่ตัวเลข 100,000 ดาวเพียงอย่างเดียว แต่เป็นการที่มันเขียน skill ของตัวเอง ซ่อมตัวเองได้กลางงาน และสะสมความรู้ให้ตัวเองเก่งขึ้นทุกครั้งที่ใช้งาน เดโมสดทั้งสองงานในคลิปคือหลักฐานที่ทำให้เห็นภาพนั้นชัดที่สุด
ที่มา: David Ondrej: Hermes Agent is insane… 100,000+ github stars (YouTube, 20 เมษายน 2026) บทความนี้สรุปและเล่าเนื้อหาจากคลิปดังกล่าวเพียงแหล่งเดียว





ความคิดเห็น
ยังไม่มีความคิดเห็น เป็นคนแรกที่แสดงความเห็น!