workweave/router · ตั้งครั้งเดียว ลดบิลค่าโมเดล AI 40–70% โดยไม่ต้องคอยสลับรุ่นเอง
workweave/router คือเครื่องมือโอเพนซอร์สที่คั่นกลางระหว่างเครื่องมือ AI coding กับ API ของโมเดล แล้วช่วยเลือกให้อัตโนมัติว่างานไหนควรใช้รุ่นไหน แค่เปลี่ยน endpoint ครั้งเดียว งานง่ายส่งรุ่นถูก งานยากส่งรุ่นเก่ง เจ้าของ repo บอกว่าลดบิลได้ 40–70%

workweave/router คือเครื่องมือโอเพนซอร์สที่คั่นกลางระหว่างเครื่องมือ AI coding อย่าง Claude Code, Codex หรือ Cursor กับ API ของโมเดลแต่ละเจ้า หน้าที่ของมันคือดูว่า prompt แต่ละอันควรส่งไปให้โมเดลตัวไหน งานง่ายส่งรุ่นถูก งานยากค่อยส่งรุ่นเก่ง โดยเราไม่ต้องนั่งสลับรุ่นเอง ทีมผู้สร้างเพิ่งเอาไปโชว์บนเวที Show HN ที่เหล่านักพัฒนาเอาของใหม่มาอวดกัน โดยเปิด repo ชื่อ workweave/router บน GitHub ตอนนี้ยังใหม่มากจนแทบไม่มีใครพูดถึงเป็นภาษาไทย
จุดขายของมันมีแค่ประโยคเดียว คือแค่เปลี่ยน endpoint หรือที่อยู่ปลายทางที่เครื่องมือใช้ส่งคำสั่งไปหาโมเดล แล้วบิลค่าโมเดลจะลดลง 40–70% ฟังดูเกินจริง แต่กลไกเบื้องหลังตรงไปตรงมากว่าที่คิด และนี่คือเรื่องที่สาย AI coding ที่ต้องจ่ายค่า token เองทุกเดือน น่าจะอยากรู้มากที่สุด
งานจิ๊บจ๊อย แต่จ่ายเรตรุ่นท็อป
เวลาใช้ Claude Code หรือ Cursor ทำงานจริง คำสั่งที่เราพิมพ์มีตั้งแต่เรื่องเล็กอย่างเปลี่ยนชื่อตัวแปร เติม comment หรือเขียนฟังก์ชันสั้นๆ ไปจนถึงเรื่องใหญ่อย่างออกแบบโครงสร้างทั้งระบบหรือไล่หา bug ที่ซ่อนลึก แต่เครื่องมือกลับส่งทุกคำสั่งไปหาโมเดลตัวเดียวกัน ส่วนใหญ่ก็เป็นรุ่นเก่งสุดและแพงสุดที่เราตั้งค่าไว้
ปัญหาคือแม้งานเล็กๆ จะเป็นงานที่รุ่นถูกกว่าทำได้สบาย แต่เราก็ยังจ่ายเรตรุ่นท็อปอยู่ดีทุกครั้ง ค่าใช้จ่ายส่วนเกินตรงนี้สะสมเงียบๆ จนกลายเป็นบิลก้อนโต โดยเฉพาะคนที่สั่งงานวันละหลายร้อยครั้ง
จริงอยู่ว่าเราสลับรุ่นเองได้ แต่ในทางปฏิบัติแทบไม่มีใครทำ เพราะต้องมานั่งคิดก่อนทุก prompt ว่างานนี้ควรใช้รุ่นไหน มันกวนจังหวะการทำงานเกินไป สุดท้ายเลยปล่อยให้รุ่นแพงรับงานหมดทั้งงานยากและงานง่าย นี่คือช่องว่างที่ตัวจัดเส้นทางอย่าง router เข้ามาอุดพอดี
ตัวช่วยเลือกโมเดลที่ตัดสินใจให้ในเสี้ยววินาที

router ทำหน้าที่เป็น proxy หรือตัวกลางที่รับคำสั่งจากเครื่องมือของเราก่อน แล้วค่อยส่งต่อไปยังโมเดลปลายทาง จุดสำคัญทั้งหมดอยู่ที่ขั้นตอนตรงกลางนี้
หลายคนคงคิดว่ามันต้องเอา prompt ไปถามโมเดลใหญ่ก่อนว่างานนี้ควรใช้รุ่นไหน แต่แบบนั้นจะช้าและเปลือง token เพิ่มอีกรอบ router เลยใช้วิธีอื่น คือให้โมเดลเล็กๆ ที่รันอยู่บนเครื่องเรา (เรียกว่า embedder) อ่าน prompt แล้วจัดกลุ่มงาน จากนั้นตัวให้คะแนนจะเลือกโมเดลที่เหมาะกับงานกลุ่มนั้นที่สุด ขั้นตอนทั้งหมดเกิดขึ้นบนเครื่องเราและใช้เวลาไม่ถึง 50 มิลลิวินาทีต่อหนึ่งคำสั่ง เร็วจนแทบไม่รู้สึกว่ามีอะไรมาคั่นกลาง
วิธีจับคู่งานกับรุ่นนี้ไม่ได้คิดขึ้นมาลอยๆ แต่ต่อยอดมาจากงานวิจัยชื่อ Avengers-Pro จึงมีหลักการรองรับ ไม่ใช่แค่เดาสุ่ม
ส่วนเรื่องว่ามันต่อกับโมเดลอะไรได้บ้าง router รองรับรูปแบบ API หลักครบสามแบบ ทั้ง Anthropic Messages, OpenAI Chat Completions และ Gemini แบบ native พร้อมฟีเจอร์อย่าง streaming, การเรียกใช้ tools และการอ่านภาพ ถ้าอยากใช้โมเดลโอเพนซอร์สเพื่อกดราคาให้ต่ำลงไปอีก ก็ต่อผ่าน OpenRouter ได้ OpenRouter เป็นบริการที่รวมโมเดลจากหลายเจ้าไว้ให้เรียกใช้จากที่เดียว ครอบคลุมรุ่นยอดนิยมอย่าง DeepSeek, Kimi, GLM, Qwen, Llama และ Mistral
แล้วลดได้ 40–70% จริงไหม
ตรงนี้ต้องพูดให้ตรง ตัวเลข 40–70% และความเร็วที่ต่ำกว่า 50 มิลลิวินาที มาจากหน้าแนะนำของ repo เอง ไม่ใช่ผลทดสอบจากคนนอกที่เป็นกลาง เพราะฉะนั้นควรมองมันเป็นกรอบที่ "เป็นไปได้" มากกว่าตัวเลขที่การันตีว่าทุกคนจะได้เท่านี้
แต่เหตุผลที่มันลดได้ก็สมเหตุสมผล ถ้างานในแต่ละวันของเราส่วนใหญ่เป็นงานเล็ก แล้ว router ส่งงานพวกนี้ให้รุ่นถูกแทนที่จะใช้รุ่นท็อปทุกครั้ง ส่วนต่างของราคาต่อ token จะสะสมเร็วมาก ยิ่งงานง่ายมีสัดส่วนมาก ก็ยิ่งเห็นผลชัด ในทางกลับกัน ถ้าแทบทุกคำสั่งเป็นงานหนักจริง ส่วนลดที่ได้ก็จะน้อยลง เพราะ router ยังต้องส่งงานให้รุ่นเก่งอยู่ดี
เริ่มจริงได้ในคำสั่งเดียว
ทางที่เร็วที่สุดคือใช้บริการสำเร็จรูปที่ทีมผู้สร้างรันเซิร์ฟเวอร์ไว้ให้แล้ว (แบบที่เรียกว่า hosted) แบบนี้ไม่ต้องโหลดซอร์สโค้ดทั้งชุดมาตั้งเอง และไม่ต้องลงระบบเสริมอย่าง Docker หรือฐานข้อมูล Postgres ขอแค่เครื่องมีโปรแกรม Node เวอร์ชัน 18 ขึ้นไป (ตัวที่ใช้รันเครื่องมือสาย JavaScript จำนวนมาก) จากนั้นเปิด terminal หรือหน้าต่างพิมพ์คำสั่งขึ้นมา แล้วพิมพ์คำสั่งนี้
npx @workweave/router
ตัวติดตั้งจะถามสองคำถาม คือจะต่อกับเครื่องมือไหน (Claude Code, Codex หรือ opencode) และจะตั้งค่าระดับทั้งเครื่อง (user) หรือเฉพาะโปรเจกต์นี้ (project) ตอบเสร็จมันจะดึง router key มาให้และแก้ไฟล์ config ให้อัตโนมัติ เท่านี้คำสั่งหลังจากนั้นก็จะเริ่มส่งผ่าน router แล้ว
ถ้าอยากข้ามคำถามแล้วต่อกับ Claude Code ไปเลย ใส่ flag ตรงๆ ได้
npx @workweave/router --claude
ต่อกับเครื่องมือที่ใช้อยู่
แต่ละเครื่องมือมีวิธีต่อต่างกันนิดหน่อย เลือกแถวที่ตรงกับตัวที่เราใช้อยู่ได้เลย
| เครื่องมือ | วิธีต่อ |
|---|---|
| Claude Code | npx @workweave/router --claude เร็วสุดเพราะใช้บริการสำเร็จรูป |
| Codex | npx @workweave/router --codex แล้วมันจะไปแก้ไฟล์ตั้งค่า ~/.codex/config.toml ให้ |
| opencode | npx @workweave/router --opencode |
| Cursor | ยังเป็นรุ่นทดลองช่วงแรก ต้องตั้งเอง เข้า Settings → Models แล้วเปลี่ยนช่อง base URL ของ OpenAI ให้ชี้มาที่ที่อยู่ของ router พร้อมวาง router key (rk_...) เป็น API key |
เลือกแบบไหนดี ถ้าแค่อยากลองให้เห็นผลเร็วๆ ใช้บริการสำเร็จรูปผ่าน npx ตามตารางนี้ก็พอ แต่ถ้าเป็นทีมที่อยากเก็บทุกอย่างไว้ในระบบตัวเอง ค่อยขยับไปแบบติดตั้งบนเครื่องตัวเอง (self-hosted) ที่ต้องมีฐานข้อมูล Postgres และสั่งรันด้วย make full-setup เอง
ข้อดีอีกอย่างคือเปิด-ปิด routing ได้โดยไม่ต้องลบ config ทิ้ง ถ้าวันไหนอยากกลับไปใช้รุ่นเดิมตรงๆ ให้สั่ง npx @workweave/router off --claude แล้วค่อยสั่ง on เมื่ออยากเปิดใหม่ ใน Claude Code ยังมีคำสั่งลัดอย่าง /router-on, /router-off และ /router-status ไว้สลับและเช็คสถานะได้ทันทีระหว่างทำงาน
ข้อดีที่ต้องชั่งกับข้อที่ต้องระวัง

ฝั่งที่น่าสนใจคือเรื่องความเป็นส่วนตัว router ใช้แนวคิด BYOK หรือเอา key ของเราเองมาใส่ key ของผู้ให้บริการโมเดลจะอยู่บนเครื่องเรา และระบบจะเข้ารหัสตอนเก็บ ไม่ได้ฝากไว้กับใคร ถ้าอยากรู้ว่ามันเลือกรุ่นตรงใจไหม ก็เรียก endpoint ตรวจสอบอย่าง /v1/route เพื่อดูว่ามันจะเลือกรุ่นไหนก่อนส่งคำสั่งจริงไปยังโมเดลปลายทาง
แต่มีจุดที่ต้องระวังเหมือนกัน อย่างแรกคือ key มีสองแบบที่หน้าตาคล้ายกันจนสับสนได้ คือ key ของผู้ให้บริการที่ขึ้นต้นด้วย sk- ซึ่งเก็บไว้ในไฟล์ .env.local กับ router key ที่ขึ้นต้นด้วย rk_ ซึ่งส่งเป็น token เวลาเรียกใช้ อย่าสลับสองตัวนี้กัน อย่างที่สองคือ README หรือหน้าแนะนำของโปรเจกต์ยังไม่ได้บอกราคาของบริการสำเร็จรูปไว้ชัดๆ ว่าฟรีหรือมีแพ็กเกจแบบเสียเงิน ควรตามดูก่อนพึ่งพาระยะยาว อย่างสุดท้าย การต่อกับ Cursor ยังเป็นรุ่นทดลองช่วงแรกที่เจ้าของบอกเองว่าประสิทธิภาพอาจยังไม่ดีที่สุด ใครใช้ Cursor เป็นหลักอาจต้องรอให้นิ่งกว่านี้ก่อน
เครื่องมือแบบนี้ชี้ให้เห็นเรื่องที่มักถูกมองข้าม คือต้นทุน AI ที่แพงขึ้นเรื่อยๆ ไม่ได้แก้ด้วยการใช้ให้น้อยลง แต่แก้ด้วยการเลือกให้ตรงว่างานไหนคู่กับรุ่นไหน
ที่มา: โปรเจกต์ workweave/router บน GitHub (Show HN)



