$ loading

$ loading ~/vibecoding

$ cat blog/model-router.md

workweave/router · ตั้งครั้งเดียว ลดบิลค่าโมเดล AI 40–70% โดยไม่ต้องคอยสลับรุ่นเอง

workweave/router คือเครื่องมือโอเพนซอร์สที่คั่นกลางระหว่างเครื่องมือ AI coding กับ API ของโมเดล แล้วช่วยเลือกให้อัตโนมัติว่างานไหนควรใช้รุ่นไหน แค่เปลี่ยน endpoint ครั้งเดียว งานง่ายส่งรุ่นถูก งานยากส่งรุ่นเก่ง เจ้าของ repo บอกว่าลดบิลได้ 40–70%

28 มิถุนายน 2569 · 8 นาที

workweave/router · ตั้งครั้งเดียว ลดบิลค่าโมเดล AI 40–70% โดยไม่ต้องคอยสลับรุ่นเอง — workweave/router · ตัวเลือกโมเดลอัตโนมัติที่เสียบเข้ากับเครื่องมือ AI coding แล้วช่วยลดบิลค่าโมเดลให้

workweave/router คือเครื่องมือโอเพนซอร์สที่คั่นกลางระหว่างเครื่องมือ AI coding อย่าง Claude Code, Codex หรือ Cursor กับ API ของโมเดลแต่ละเจ้า หน้าที่ของมันคือดูว่า prompt แต่ละอันควรส่งไปให้โมเดลตัวไหน งานง่ายส่งรุ่นถูก งานยากค่อยส่งรุ่นเก่ง โดยเราไม่ต้องนั่งสลับรุ่นเอง ทีมผู้สร้างเพิ่งเอาไปโชว์บนเวที Show HN ที่เหล่านักพัฒนาเอาของใหม่มาอวดกัน โดยเปิด repo ชื่อ workweave/router บน GitHub ตอนนี้ยังใหม่มากจนแทบไม่มีใครพูดถึงเป็นภาษาไทย

จุดขายของมันมีแค่ประโยคเดียว คือแค่เปลี่ยน endpoint หรือที่อยู่ปลายทางที่เครื่องมือใช้ส่งคำสั่งไปหาโมเดล แล้วบิลค่าโมเดลจะลดลง 40–70% ฟังดูเกินจริง แต่กลไกเบื้องหลังตรงไปตรงมากว่าที่คิด และนี่คือเรื่องที่สาย AI coding ที่ต้องจ่ายค่า token เองทุกเดือน น่าจะอยากรู้มากที่สุด

งานจิ๊บจ๊อย แต่จ่ายเรตรุ่นท็อป

เวลาใช้ Claude Code หรือ Cursor ทำงานจริง คำสั่งที่เราพิมพ์มีตั้งแต่เรื่องเล็กอย่างเปลี่ยนชื่อตัวแปร เติม comment หรือเขียนฟังก์ชันสั้นๆ ไปจนถึงเรื่องใหญ่อย่างออกแบบโครงสร้างทั้งระบบหรือไล่หา bug ที่ซ่อนลึก แต่เครื่องมือกลับส่งทุกคำสั่งไปหาโมเดลตัวเดียวกัน ส่วนใหญ่ก็เป็นรุ่นเก่งสุดและแพงสุดที่เราตั้งค่าไว้

ปัญหาคือแม้งานเล็กๆ จะเป็นงานที่รุ่นถูกกว่าทำได้สบาย แต่เราก็ยังจ่ายเรตรุ่นท็อปอยู่ดีทุกครั้ง ค่าใช้จ่ายส่วนเกินตรงนี้สะสมเงียบๆ จนกลายเป็นบิลก้อนโต โดยเฉพาะคนที่สั่งงานวันละหลายร้อยครั้ง

จริงอยู่ว่าเราสลับรุ่นเองได้ แต่ในทางปฏิบัติแทบไม่มีใครทำ เพราะต้องมานั่งคิดก่อนทุก prompt ว่างานนี้ควรใช้รุ่นไหน มันกวนจังหวะการทำงานเกินไป สุดท้ายเลยปล่อยให้รุ่นแพงรับงานหมดทั้งงานยากและงานง่าย นี่คือช่องว่างที่ตัวจัดเส้นทางอย่าง router เข้ามาอุดพอดี

ตัวช่วยเลือกโมเดลที่ตัดสินใจให้ในเสี้ยววินาที

แผนภาพ router ที่อยู่คั่นกลางระหว่างเครื่องมือ AI coding กับโมเดล อ่าน prompt บนเครื่องแล้วแยกส่งงานง่ายไปรุ่นถูก งานยากไปรุ่นเก่ง — แค่เปลี่ยน endpoint ครั้งเดียว router ก็อ่านทุก prompt แล้วแยกส่งงานง่ายไปรุ่นถูก งานยากไปรุ่นเก่งให้เอง ส่วนต่างราคาตรงนี้ทำให้บิลลดลง

router ทำหน้าที่เป็น proxy หรือตัวกลางที่รับคำสั่งจากเครื่องมือของเราก่อน แล้วค่อยส่งต่อไปยังโมเดลปลายทาง จุดสำคัญทั้งหมดอยู่ที่ขั้นตอนตรงกลางนี้

หลายคนคงคิดว่ามันต้องเอา prompt ไปถามโมเดลใหญ่ก่อนว่างานนี้ควรใช้รุ่นไหน แต่แบบนั้นจะช้าและเปลือง token เพิ่มอีกรอบ router เลยใช้วิธีอื่น คือให้โมเดลเล็กๆ ที่รันอยู่บนเครื่องเรา (เรียกว่า embedder) อ่าน prompt แล้วจัดกลุ่มงาน จากนั้นตัวให้คะแนนจะเลือกโมเดลที่เหมาะกับงานกลุ่มนั้นที่สุด ขั้นตอนทั้งหมดเกิดขึ้นบนเครื่องเราและใช้เวลาไม่ถึง 50 มิลลิวินาทีต่อหนึ่งคำสั่ง เร็วจนแทบไม่รู้สึกว่ามีอะไรมาคั่นกลาง

วิธีจับคู่งานกับรุ่นนี้ไม่ได้คิดขึ้นมาลอยๆ แต่ต่อยอดมาจากงานวิจัยชื่อ Avengers-Pro จึงมีหลักการรองรับ ไม่ใช่แค่เดาสุ่ม

ส่วนเรื่องว่ามันต่อกับโมเดลอะไรได้บ้าง router รองรับรูปแบบ API หลักครบสามแบบ ทั้ง Anthropic Messages, OpenAI Chat Completions และ Gemini แบบ native พร้อมฟีเจอร์อย่าง streaming, การเรียกใช้ tools และการอ่านภาพ ถ้าอยากใช้โมเดลโอเพนซอร์สเพื่อกดราคาให้ต่ำลงไปอีก ก็ต่อผ่าน OpenRouter ได้ OpenRouter เป็นบริการที่รวมโมเดลจากหลายเจ้าไว้ให้เรียกใช้จากที่เดียว ครอบคลุมรุ่นยอดนิยมอย่าง DeepSeek, Kimi, GLM, Qwen, Llama และ Mistral

แล้วลดได้ 40–70% จริงไหม

ตรงนี้ต้องพูดให้ตรง ตัวเลข 40–70% และความเร็วที่ต่ำกว่า 50 มิลลิวินาที มาจากหน้าแนะนำของ repo เอง ไม่ใช่ผลทดสอบจากคนนอกที่เป็นกลาง เพราะฉะนั้นควรมองมันเป็นกรอบที่ "เป็นไปได้" มากกว่าตัวเลขที่การันตีว่าทุกคนจะได้เท่านี้

แต่เหตุผลที่มันลดได้ก็สมเหตุสมผล ถ้างานในแต่ละวันของเราส่วนใหญ่เป็นงานเล็ก แล้ว router ส่งงานพวกนี้ให้รุ่นถูกแทนที่จะใช้รุ่นท็อปทุกครั้ง ส่วนต่างของราคาต่อ token จะสะสมเร็วมาก ยิ่งงานง่ายมีสัดส่วนมาก ก็ยิ่งเห็นผลชัด ในทางกลับกัน ถ้าแทบทุกคำสั่งเป็นงานหนักจริง ส่วนลดที่ได้ก็จะน้อยลง เพราะ router ยังต้องส่งงานให้รุ่นเก่งอยู่ดี

เริ่มจริงได้ในคำสั่งเดียว

ทางที่เร็วที่สุดคือใช้บริการสำเร็จรูปที่ทีมผู้สร้างรันเซิร์ฟเวอร์ไว้ให้แล้ว (แบบที่เรียกว่า hosted) แบบนี้ไม่ต้องโหลดซอร์สโค้ดทั้งชุดมาตั้งเอง และไม่ต้องลงระบบเสริมอย่าง Docker หรือฐานข้อมูล Postgres ขอแค่เครื่องมีโปรแกรม Node เวอร์ชัน 18 ขึ้นไป (ตัวที่ใช้รันเครื่องมือสาย JavaScript จำนวนมาก) จากนั้นเปิด terminal หรือหน้าต่างพิมพ์คำสั่งขึ้นมา แล้วพิมพ์คำสั่งนี้

npx @workweave/router

ตัวติดตั้งจะถามสองคำถาม คือจะต่อกับเครื่องมือไหน (Claude Code, Codex หรือ opencode) และจะตั้งค่าระดับทั้งเครื่อง (user) หรือเฉพาะโปรเจกต์นี้ (project) ตอบเสร็จมันจะดึง router key มาให้และแก้ไฟล์ config ให้อัตโนมัติ เท่านี้คำสั่งหลังจากนั้นก็จะเริ่มส่งผ่าน router แล้ว

ถ้าอยากข้ามคำถามแล้วต่อกับ Claude Code ไปเลย ใส่ flag ตรงๆ ได้

npx @workweave/router --claude

ต่อกับเครื่องมือที่ใช้อยู่

แต่ละเครื่องมือมีวิธีต่อต่างกันนิดหน่อย เลือกแถวที่ตรงกับตัวที่เราใช้อยู่ได้เลย

เครื่องมือ	วิธีต่อ
Claude Code	`npx @workweave/router --claude` เร็วสุดเพราะใช้บริการสำเร็จรูป
Codex	`npx @workweave/router --codex` แล้วมันจะไปแก้ไฟล์ตั้งค่า `~/.codex/config.toml` ให้
opencode	`npx @workweave/router --opencode`
Cursor	ยังเป็นรุ่นทดลองช่วงแรก ต้องตั้งเอง เข้า Settings → Models แล้วเปลี่ยนช่อง base URL ของ OpenAI ให้ชี้มาที่ที่อยู่ของ router พร้อมวาง router key (rk_...) เป็น API key

เลือกแบบไหนดี ถ้าแค่อยากลองให้เห็นผลเร็วๆ ใช้บริการสำเร็จรูปผ่าน npx ตามตารางนี้ก็พอ แต่ถ้าเป็นทีมที่อยากเก็บทุกอย่างไว้ในระบบตัวเอง ค่อยขยับไปแบบติดตั้งบนเครื่องตัวเอง (self-hosted) ที่ต้องมีฐานข้อมูล Postgres และสั่งรันด้วย make full-setup เอง

ข้อดีอีกอย่างคือเปิด-ปิด routing ได้โดยไม่ต้องลบ config ทิ้ง ถ้าวันไหนอยากกลับไปใช้รุ่นเดิมตรงๆ ให้สั่ง npx @workweave/router off --claude แล้วค่อยสั่ง on เมื่ออยากเปิดใหม่ ใน Claude Code ยังมีคำสั่งลัดอย่าง /router-on, /router-off และ /router-status ไว้สลับและเช็คสถานะได้ทันทีระหว่างทำงาน

ข้อดีที่ต้องชั่งกับข้อที่ต้องระวัง

ตารางเทียบสองฝั่ง ฝั่งซ้ายคือข้อดีของ router ฝั่งขวาคือข้อที่ต้องระวังก่อนตัดสินใจใช้ — ข้อดีเรื่องความเป็นส่วนตัวและการเช็กรุ่นก่อนใช้มีจริง แต่ก่อนจะพึ่งพาระยะยาว ต้องชั่งน้ำหนักเทียบกับค่าบริการที่ยังไม่ประกาศและการต่อ Cursor ที่ยังไม่นิ่ง

ฝั่งที่น่าสนใจคือเรื่องความเป็นส่วนตัว router ใช้แนวคิด BYOK หรือเอา key ของเราเองมาใส่ key ของผู้ให้บริการโมเดลจะอยู่บนเครื่องเรา และระบบจะเข้ารหัสตอนเก็บ ไม่ได้ฝากไว้กับใคร ถ้าอยากรู้ว่ามันเลือกรุ่นตรงใจไหม ก็เรียก endpoint ตรวจสอบอย่าง /v1/route เพื่อดูว่ามันจะเลือกรุ่นไหนก่อนส่งคำสั่งจริงไปยังโมเดลปลายทาง

แต่มีจุดที่ต้องระวังเหมือนกัน อย่างแรกคือ key มีสองแบบที่หน้าตาคล้ายกันจนสับสนได้ คือ key ของผู้ให้บริการที่ขึ้นต้นด้วย sk- ซึ่งเก็บไว้ในไฟล์ .env.local กับ router key ที่ขึ้นต้นด้วย rk_ ซึ่งส่งเป็น token เวลาเรียกใช้ อย่าสลับสองตัวนี้กัน อย่างที่สองคือ README หรือหน้าแนะนำของโปรเจกต์ยังไม่ได้บอกราคาของบริการสำเร็จรูปไว้ชัดๆ ว่าฟรีหรือมีแพ็กเกจแบบเสียเงิน ควรตามดูก่อนพึ่งพาระยะยาว อย่างสุดท้าย การต่อกับ Cursor ยังเป็นรุ่นทดลองช่วงแรกที่เจ้าของบอกเองว่าประสิทธิภาพอาจยังไม่ดีที่สุด ใครใช้ Cursor เป็นหลักอาจต้องรอให้นิ่งกว่านี้ก่อน

เครื่องมือแบบนี้ชี้ให้เห็นเรื่องที่มักถูกมองข้าม คือต้นทุน AI ที่แพงขึ้นเรื่อยๆ ไม่ได้แก้ด้วยการใช้ให้น้อยลง แต่แก้ด้วยการเลือกให้ตรงว่างานไหนคู่กับรุ่นไหน

ที่มา: โปรเจกต์ workweave/router บน GitHub (Show HN)

tools

ทีมผู้เขียน Vibe Coding Thailandvibecodingth

สอนใช้ AI กับงานจริงเป็นภาษาไทย ผ่านบทความ คอร์ส และเครื่องมือที่สร้างด้วย AI

หนังสือแนะนำ

Claude Cowork · The Business Playbook

฿1,400฿2,500ลด 44%

สั่งซื้อหนังสือ

$ tail -f journal.log

อ่านต่อจากเรื่องนี้

TOOLS

ShipGenAI รีโปโอเพนซอร์สที่แจกโครงแอป AI SaaS พร้อมขาย 50 ตัว เอาไป rebrand แล้วเก็บรายได้ 100%

28 มิ.ย. 2569 · 8 นาที

คุยกันต่อในกลุ่ม

ถาม-ตอบเรื่องการใช้ AI กับงานจริง กันทุกวัน · เข้าฟรี

เข้ากลุ่ม Facebook

Claude Cowork

฿1,400฿2,500

ซื้อหนังสือ

$ cat blog/[slug].md

$ cat blog/model-router.md

workweave/router · ตั้งครั้งเดียว ลดบิลค่าโมเดล AI 40–70% โดยไม่ต้องคอยสลับรุ่นเอง

28 มิถุนายน 2569 · 8 นาที

งานจิ๊บจ๊อย แต่จ่ายเรตรุ่นท็อป

ตัวช่วยเลือกโมเดลที่ตัดสินใจให้ในเสี้ยววินาที

แล้วลดได้ 40–70% จริงไหม

เริ่มจริงได้ในคำสั่งเดียว

npx @workweave/router

ถ้าอยากข้ามคำถามแล้วต่อกับ Claude Code ไปเลย ใส่ flag ตรงๆ ได้

npx @workweave/router --claude

ต่อกับเครื่องมือที่ใช้อยู่

เครื่องมือ	วิธีต่อ
Claude Code	`npx @workweave/router --claude` เร็วสุดเพราะใช้บริการสำเร็จรูป
Codex	`npx @workweave/router --codex` แล้วมันจะไปแก้ไฟล์ตั้งค่า `~/.codex/config.toml` ให้
opencode	`npx @workweave/router --opencode`
Cursor	ยังเป็นรุ่นทดลองช่วงแรก ต้องตั้งเอง เข้า Settings → Models แล้วเปลี่ยนช่อง base URL ของ OpenAI ให้ชี้มาที่ที่อยู่ของ router พร้อมวาง router key (rk_...) เป็น API key

ข้อดีที่ต้องชั่งกับข้อที่ต้องระวัง

ที่มา: โปรเจกต์ workweave/router บน GitHub (Show HN)

tools

ทีมผู้เขียน Vibe Coding Thailandvibecodingth

หนังสือแนะนำ

Claude Cowork · The Business Playbook

฿1,400฿2,500ลด 44%

สั่งซื้อหนังสือ

$ tail -f journal.log

อ่านต่อจากเรื่องนี้

TOOLS

28 มิ.ย. 2569 · 8 นาที

คุยกันต่อในกลุ่ม

ถาม-ตอบเรื่องการใช้ AI กับงานจริง กันทุกวัน · เข้าฟรี

เข้ากลุ่ม Facebook

Claude Cowork

฿1,400฿2,500

ซื้อหนังสือ

workweave/router · ตั้งครั้งเดียว ลดบิลค่าโมเดล AI 40–70% โดยไม่ต้องคอยสลับรุ่นเอง

งานจิ๊บจ๊อย แต่จ่ายเรตรุ่นท็อป

ตัวช่วยเลือกโมเดลที่ตัดสินใจให้ในเสี้ยววินาที

แล้วลดได้ 40–70% จริงไหม

เริ่มจริงได้ในคำสั่งเดียว

ต่อกับเครื่องมือที่ใช้อยู่

ข้อดีที่ต้องชั่งกับข้อที่ต้องระวัง

Claude Cowork · The Business Playbook

อ่านต่อจากเรื่องนี้

ShipGenAI รีโปโอเพนซอร์สที่แจกโครงแอป AI SaaS พร้อมขาย 50 ตัว เอาไป rebrand แล้วเก็บรายได้ 100%

ต่อ Claude Code เข้ากับ GLM-5.2 ผ่าน hf-claude · ใช้โมเดลโอเพนซอร์สฟรีบน Hugging Face แทนการจ่ายค่าโมเดล

HALO เครื่องมือฟรีที่เปิดดูข้างใน AI agent ว่าพังตรงไหน รันบนเครื่องตัวเอง

คุยกันต่อในกลุ่ม

workweave/router · ตั้งครั้งเดียว ลดบิลค่าโมเดล AI 40–70% โดยไม่ต้องคอยสลับรุ่นเอง

งานจิ๊บจ๊อย แต่จ่ายเรตรุ่นท็อป

ตัวช่วยเลือกโมเดลที่ตัดสินใจให้ในเสี้ยววินาที

แล้วลดได้ 40–70% จริงไหม

เริ่มจริงได้ในคำสั่งเดียว

ต่อกับเครื่องมือที่ใช้อยู่

ข้อดีที่ต้องชั่งกับข้อที่ต้องระวัง

Claude Cowork · The Business Playbook

อ่านต่อจากเรื่องนี้

ShipGenAI รีโปโอเพนซอร์สที่แจกโครงแอป AI SaaS พร้อมขาย 50 ตัว เอาไป rebrand แล้วเก็บรายได้ 100%

ต่อ Claude Code เข้ากับ GLM-5.2 ผ่าน hf-claude · ใช้โมเดลโอเพนซอร์สฟรีบน Hugging Face แทนการจ่ายค่าโมเดล

HALO เครื่องมือฟรีที่เปิดดูข้างใน AI agent ว่าพังตรงไหน รันบนเครื่องตัวเอง

คุยกันต่อในกลุ่ม