Sakana Fugu — เรียก AI ตัวเดียว แต่ได้ทั้งทีมโมเดลผู้เชี่ยวชาญ ไม่ต้องเลือกเอง
Sakana Fugu คือระบบ AI ตัวใหม่จากญี่ปุ่นที่ภายนอกดูเหมือนเรียกใช้โมเดลเดียว แต่เบื้องหลังจัดทีมโมเดลผู้เชี่ยวชาญหลายตัวมาทำงานให้ จุดที่น่าสนใจคือเราไม่ต้องนั่งเลือกเองอีกต่อไปว่างานนี้ควรใช้โมเดลตัวไหน

Sakana Fugu คือระบบ AI ตัวใหม่จาก Sakana AI บริษัทสัญชาติญี่ปุ่น ที่เพิ่งเปิดให้ใช้งานทั่วไปวันนี้ ความน่าสนใจคือเวลาเรียกใช้ เราจะรู้สึกเหมือนคุยกับโมเดลตัวเดียว แต่เบื้องหลังเป็นทีมโมเดลผู้เชี่ยวชาญหลายตัวที่ระบบจัดมาทำงานร่วมกัน
ลองนึกถึงเวลาเรามีงานสักชิ้น แล้วต้องมานั่งคิดว่าควรเปิดโมเดลตัวไหนดี งานเขียนโค้ดใช้ตัวหนึ่ง งานคิดวิเคราะห์ใช้อีกตัว งานสรุปยาวๆ ก็อีกแบบ พอโมเดลเก่งๆ มีเยอะขึ้นเรื่อยๆ การเลือกเองให้ถูกกลับกลายเป็นภาระ Fugu เกิดมาเพื่อตัดขั้นตอนนั้นทิ้ง เราส่งงานไปที่เดียว แล้วระบบจัดทีมให้เอง
ตัวที่รับงานไม่ใช่ตัวที่ตอบ

หัวใจที่ทำให้ Fugu ต่างจากการแชตกับ AI ทั่วไป อยู่ที่ว่า Fugu ไม่ได้ทำหน้าที่ตอบคำถามของเราโดยตรง มันเป็น LLM ที่ฝึกมาเพื่อ ประสานงาน โดยเฉพาะ หน้าที่ของมันคือรับงานเข้ามาแล้วตัดสินใจว่าจะจัดการต่ออย่างไร
ถ้างานง่าย Fugu ตอบเองจบ แต่ถ้างานยากและหลายขั้นตอน มันจะเลือกโมเดลผู้เชี่ยวชาญในพูลมารับช่วงต่อ มอบงานให้ ตรวจคำตอบที่ได้กลับมา แล้วรวมผลเป็นคำตอบเดียวส่งให้เรา ที่น่าสนใจกว่านั้นคือมันเรียกตัวเองซ้ำได้ด้วย เหมือนหัวหน้าทีมที่ลงมือทำบางส่วนเอง แล้วกระจายส่วนที่ยากให้ลูกทีมที่ถนัดกว่า
คำว่า "orchestration" หรือ "multi-agent" ที่ได้ยินกันบ่อยช่วงนี้ก็คือเรื่องนี้ แทนที่จะมี AI ตัวเดียวพยายามทำทุกอย่างเอง เราให้ AI หลายตัวที่ถนัดคนละด้านมาทำงานเป็นทีม โดยมีตัวกลางคอยจัดสรรงาน สิ่งที่ Fugu ทำให้ต่างคือตัวกลางตัวนี้ไม่ใช่ชุดกฎที่คนเขียนไว้ตายตัว แต่เป็นโมเดลที่เรียนรู้วิธีประสานงานมาจากการฝึก
เรียกผ่าน API เดียว ไม่ต้องรื้อโค้ดเดิม
สำหรับนักพัฒนา จุดที่ทำให้เริ่มได้ง่ายคือ Fugu เปิดให้เรียกผ่าน API ที่เข้ากับ API ของ OpenAI ได้ พูดง่ายๆ คือถ้าใครเขียนโค้ดที่เรียก OpenAI อยู่แล้ว แค่ชี้ปลายทางมาที่ endpoint ของ Fugu ก็ใช้ได้เลย ไม่ต้องเปลี่ยน SDK ไม่ต้องเรียนรู้รูปแบบใหม่
ความซับซ้อนทั้งหมด ทั้งการเลือกโมเดล การมอบหมายงาน การตรวจสอบ และการรวมคำตอบ ซ่อนอยู่ข้างใน ไม่ต้องโผล่มาในโค้ดของเรา เราเห็นแค่คำตอบเดียวที่ออกมา เหมือนคุยกับโมเดลตัวเดียว ใครอยากลองดูของจริงเข้าไปดูได้ที่หน้า Sakana Fugu หรือเริ่มใช้งานผ่าน Sakana Console
สองรุ่น เลือกตามงานที่ทำ

Fugu มาพร้อมกันสองรุ่นตั้งแต่เปิดตัว แต่ละรุ่นวางไว้คนละจุด
- Fugu รุ่นเร็วและสมดุล เหมาะกับงานประจำวันที่ต้องการความไว เช่น เขียนโค้ดและรีวิวโค้ด งานแชตบอต งานที่ทำซ้ำๆ ทุกวัน
- Fugu Ultra รุ่นที่ประสานงานหลายชั้นกว่า เน้นคุณภาพของงานยากที่มีหลายขั้นตอน แลกมาด้วยความช้ากว่า เหมาะกับงานวิจัย AI การทำซ้ำผลการทดลองจากเปเปอร์ การวิเคราะห์สิทธิบัตร และงานด้านความปลอดภัยไซเบอร์
เลือกตัวไหนเมื่อไหร่ก็ดูที่ลักษณะงานเป็นหลัก งานที่ต้องการคำตอบเร็วและทำบ่อยๆ ใช้ Fugu ส่วนงานที่ยอมรอได้เพื่อแลกกับคำตอบที่ผ่านการคิดหลายชั้น ใช้ Fugu Ultra
ตัวเลขที่ผู้สร้างโชว์ และข้อที่ต้องอ่านอย่างระวัง
Sakana AI เคลมว่า Fugu Ultra ทำผลงานเทียบชั้นโมเดลแถวหน้าอย่าง Fable 5 และ Mythos Preview ในชุดทดสอบด้านวิศวกรรม วิทยาศาสตร์ และการให้เหตุผล และในหลายงานยังทำได้ดีกว่า Gemini 3.1 Pro, Opus 4.8 และ GPT 5.5 ที่เปิดโหมดแรงสุด
ตรงนี้ต้องอ่านแบบตรงไปตรงมา ตัวเลขเหล่านี้เป็นผลที่ Sakana AI วัดเอง ไม่ใช่ผลจากผู้ทดสอบอิสระ ส่วนคะแนนของโมเดลคู่เทียบก็มาจากที่แต่ละเจ้ารายงานไว้เอง ที่น่าสังเกตอีกอย่างคือ Fable 5 และ Mythos Preview ที่เอามาเทียบนั้นไม่ได้อยู่ในพูลของ Fugu เพราะยังเข้าถึงไม่ได้สำหรับคนทั่วไป
ตัวอย่างผลทดสอบที่เห็นภาพคืองานจำลองการเทรดหุ้น Fugu Ultra ได้ผลตอบแทนเฉลี่ย +19.43% ขณะที่โมเดลอื่นทุกตัวต่ำกว่า +15%
นอกจากตัวเลขแล้ว ยังมีเสียงจากผู้ทดสอบช่วง beta ราว 500 ราย คนหนึ่งที่ใช้ทำรีวิวโค้ดเล่าว่า Fugu Ultra เจอจุดที่เป็นปัญหาเกิน 20 รายการ ขณะที่เครื่องมืออื่นเจอราวสามรายการ ข้อนี้เป็นคำบอกเล่าจากผู้ใช้ ไม่ใช่ผลทดสอบอย่างเป็นทางการ จึงควรฟังไว้เป็นมุมหนึ่ง ไม่ใช่ข้อสรุป
ทำไมญี่ปุ่นถึงมองว่าเรื่องนี้สำคัญ
เบื้องหลังแนวคิดของ Fugu มีเหตุผลที่ไปไกลกว่าความสะดวก Sakana AI มองว่าการประสานงานหลายโมเดลเกี่ยวข้องกับการพึ่งพาตัวเองด้วย การฝากงานสำคัญทั้งหมดไว้กับผู้ให้บริการรายเดียวมีความเสี่ยง เพราะถ้าวันหนึ่งโมเดลนั้นถูกจำกัดการเข้าถึง งานก็สะดุดทันที
Fugu จึงออกแบบให้พูลของโมเดลสับเปลี่ยนได้ ถ้าโมเดลตัวหนึ่งถูกจำกัด ระบบก็หมุนไปเรียกตัวอื่นแทนได้ทันที พื้นฐานของแนวคิดนี้มาจากงานวิจัยของ Sakana AI เองสองชิ้น คือ Trinity และ Conductor ที่จะนำเสนอในงาน ICLR 2026
อยากลองต้องรู้อะไรก่อน
ก่อนจะกระโดดไปลอง มีสองสามเรื่องที่ต้องเข้าใจให้ตรง
เรื่องแรก Fugu เป็นบริการแบบเสียเงินที่เรียกใช้ผ่าน console ของ Sakana AI ไม่ใช่โมเดลโอเพนซอร์สที่โหลดมารันบนเครื่องตัวเองได้ มีทั้งแบบสมัครสมาชิกและแบบจ่ายตามการใช้งานสำหรับองค์กร ส่วนราคาที่แน่นอน แหล่งข้อมูลที่อ้างถึงในบทความนี้ไม่ได้ระบุไว้ ใครสนใจต้องไปดูจากหน้า console โดยตรง
เรื่องที่สอง การเปิดให้ใช้งานในแต่ละประเทศอาจไม่เท่ากัน แหล่งข้อมูลที่อ้างถึงไม่ได้ระบุเงื่อนไขการใช้งานในไทยไว้ชัดเจน ดังนั้นก่อนวางแผนเอาไปใช้จริง ควรเช็กที่หน้า console ก่อนว่าพื้นที่ของเราเปิดให้ใช้หรือยัง อย่าเพิ่งเหมาว่าใช้ได้
สำหรับคนที่อยากเริ่มแบบเป็นรูปธรรม ลำดับง่ายที่สุดคือเข้าไปที่ console ของ Sakana AI ก่อน เพื่อดูว่าพื้นที่ของเราเปิดให้ใช้หรือยังและราคาเป็นเท่าไร จากนั้นถ้าจะต่อกับโค้ดที่มีอยู่ ให้ชี้ base URL ของ client ที่เรียก OpenAI เดิมมาที่ endpoint ของ Fugu แล้วเลือกชื่อรุ่นเป็น fugu สำหรับงานเร็ว หรือ fugu-ultra สำหรับงานยาก เท่านี้ก็เริ่มยิงงานเข้าไปได้
ของจริงต้องรอคนนอกพิสูจน์
สิ่งที่ Fugu เปลี่ยนไม่ใช่ตัวโมเดลที่เก่งขึ้น แต่เป็นการย้ายภาระการเลือกออกจากมือเรา จากเดิมที่ต้องรู้ว่าโมเดลไหนเก่งอะไรแล้วเลือกเอง กลายเป็นเรียกตัวเดียวแล้วให้ระบบจัดทีมที่เหมาะสมมาให้ ยิ่งโลกมีโมเดลเก่งๆ ให้เลือกมากขึ้นเท่าไร ตัวช่วยที่เลือกแทนเราก็ยิ่งมีค่ามากขึ้นเท่านั้น
แต่ตรงนี้แหละที่ต้องใจเย็น ตัวเลขสวยๆ ทั้งหมดยังเป็นผลที่ผู้สร้างวัดเอง บทพิสูจน์ที่แท้จริงจะมาถึงเมื่อคนนอกได้ลองใช้กับงานจริงของตัวเอง แล้วผลออกมาตรงกับที่เคลมไว้หรือไม่ จนกว่าจะถึงวันนั้น คำว่า "เรียกตัวเดียว ได้ทั้งทีม" ยังเป็นไอเดียที่น่าจับตา มากกว่าจะเป็นข้อสรุปที่ฟันธงได้
ที่มา:
- บทความ Sakana AI (Fugu release announcement) จาก Sakana AI
- บทความ Sakana Fugu — Multi-agent System as A Model จาก Sakana AI



