LongCat-2.0 โมเดลโอเพนซอร์สจากจีน 1.6 ล้านล้านพารามิเตอร์ ใช้ฟรีภายใต้ไลเซนส์ MIT และเทรนทั้งตัวโดยไม่ใช้การ์ด Nvidia
LongCat-2.0 คือโมเดลภาษาโอเพนขนาด 1.6 ล้านล้านพารามิเตอร์จาก Meituan บริษัทส่งอาหารของจีน เปิดให้ใช้ฟรีภายใต้ไลเซนส์ MIT ส่วนจุดที่คนทั้งวงการจับตาคือการเทรนโมเดลทั้งตัวบนชิป AI ของ Meituan เอง โดยไม่ใช้การ์ด Nvidia เลย

LongCat-2.0 คือโมเดลภาษาโอเพนตัวใหม่จาก Meituan บริษัทส่งอาหารเจ้าใหญ่ของจีน ตัวโมเดลใหญ่ถึง 1.6 ล้านล้านพารามิเตอร์ และเปิดให้โหลดไปใช้ได้ฟรีภายใต้ไลเซนส์ MIT ตั้งแต่วันที่ 30 มิถุนายน 2026 ที่ผ่านมา
แต่จุดที่ทำให้คนทั้งวงการหันมามอง ไม่ใช่แค่ขนาดหรือคำว่าฟรี เพราะในบล็อกเปิดตัว Meituan ระบุว่าทั้งการเทรนและการรันจริงในสเกลใหญ่ ใช้ชิป AI ที่บริษัทออกแบบขึ้นเอง ไม่ได้พึ่งการ์ดของ Nvidia เลย เรื่องนี้สะเทือนกว่าตัวเลขพารามิเตอร์ เพราะทุกวันนี้การเทรนโมเดลระดับแนวหน้าเกือบทุกตัวบนโลกยังผูกอยู่กับการ์ด Nvidia
ใหญ่ 1.6 ล้านล้าน แต่ทำงานทีละ 4.8 หมื่นล้าน

ตัวเลข 1.6 ล้านล้านพารามิเตอร์ฟังดูมหาศาล แต่มีรายละเอียดสำคัญที่ต้องเข้าใจก่อน เพราะ LongCat-2.0 เป็นโมเดลแบบ MoE (Mixture-of-Experts คือโมเดลที่ประกอบด้วยผู้เชี่ยวชาญย่อยจำนวนมาก) ไม่ได้เรียกใช้พารามิเตอร์ทั้ง 1.6 ล้านล้านมาคำนวณพร้อมกันทุกครั้ง
พูดให้เห็นภาพคือ ในแต่ละโทเคน (หน่วยย่อยของข้อความที่โมเดลประมวลผลทีละชิ้น) โมเดลจะเรียกใช้ผู้เชี่ยวชาญแค่บางส่วน รวมแล้วราว 4.8 หมื่นล้านพารามิเตอร์เท่านั้น เหมือนมีทีมผู้เชี่ยวชาญเต็มออฟฟิศ แต่แต่ละคำถามเรียกมาช่วยแค่ไม่กี่คนที่เกี่ยวข้อง วิธีนี้ทำให้โมเดลครอบคลุมความรู้ได้กว้างเท่าโมเดลขนาดใหญ่มาก แต่ต้นทุนการรันต่อคำตอบถูกกว่าการเรียกใช้ทั้ง 1.6 ล้านล้านพร้อมกันมาก จำตรงนี้ไว้ก่อน เพราะนี่คือกุญแจของเรื่อง "ฟรี" ที่จะพูดถึงตอนท้าย
นอกจากขนาด LongCat-2.0 ยังมาพร้อม context (ปริมาณข้อความที่โมเดลรับและจำได้ในคราวเดียว) ยาวถึง 1 ล้านโทเคน หมายความว่ามันอ่านและจำเนื้อหายาว ๆ อย่างโค้ดทั้งโปรเจกต์หรือเอกสารเป็นปึกได้ในคราวเดียว อีกจุดสำคัญคือมันปล่อยภายใต้ไลเซนส์ MIT ซึ่งเป็นไลเซนส์โอเพนซอร์สที่ให้อิสระกว้างที่สุดแบบหนึ่ง ใครจะเอา weights (ค่าพารามิเตอร์ที่เทรนเสร็จแล้วของโมเดล) ไปใช้ ดัดแปลง หรือต่อยอดเชิงพาณิชย์ก็ได้ ตราบใดที่ไม่ไปแตะเครื่องหมายการค้าหรือสิทธิบัตรของ Meituan
เรื่องที่สะเทือนจริงคือชิป
จุดที่ทำให้ข่าวนี้พิเศษกว่าการปล่อยโมเดลใหญ่ทั่วไปคือฮาร์ดแวร์ที่ใช้เทรน โดย Meituan บอกว่าเทรน LongCat-2.0 ทั้งตัวบนชิป AI แบบ ASIC (ชิปที่ออกแบบมาเพื่องานเฉพาะทาง) ที่บริษัททำขึ้นเอง แล้วจัดเรียงต่อกันเป็นกลุ่มเครื่องขนาดใหญ่ที่เรียกว่า superpod ไม่ได้ใช้การ์ด GPU ของ Nvidia ที่เป็นมาตรฐานของวงการ
การเทรนรอบนี้ใช้ข้อมูลกว่า 35 ล้านล้านโทเคน และใช้ตัวเร่งความเร็ว (accelerator) กว่า 50,000 ตัว จุดที่ Meituan เน้นเป็นพิเศษคือทั้งกระบวนการไม่มีการ rollback หรืออาการล้มจนต้องย้อนกลับไปเริ่มใหม่จากจุดเซฟ ซึ่งเป็นฝันร้ายที่พบบ่อยเวลาเทรนโมเดลขนาดนี้ การเทรนที่จบได้โดยไม่สะดุดบนฮาร์ดแวร์ที่ไม่ใช่ Nvidia จึงเหมือนเป็นหลักฐานว่าการเทรนโมเดลระดับแนวหน้าไม่จำเป็นต้องผูกกับการ์ดค่ายเดียวอีกต่อไป
ทำมาให้ลงมือทำงานเอง
LongCat-2.0 ไม่ได้ออกแบบมาให้เป็นแชตบอตตอบคำถามทั่วไป แต่เล็งไปที่งานสายเขียนโค้ดและงาน agent (งานที่โมเดลลงมือทำเองหลายขั้นตอนจนจบ) เป็นหลัก
สิ่งที่ทำให้รองรับ context ยาว 1 ล้านโทเคนได้คือเทคนิคชื่อ LongCat Sparse Attention (LSA) แนวคิดของมันคือให้โมเดลโฟกัสเฉพาะส่วนสำคัญของข้อความยาว ๆ แทนการให้ความสำคัญเท่ากันทุกคำ จึงประมวลผลได้เร็วขึ้นโดยคุณภาพไม่ตก เทคนิคนี้พัฒนาต่อจากแนวทางเดียวกันของ DeepSeek ส่วนในขั้น post-train (การฝึกต่อหลังเทรนหลัก) ทีมงานแยกผู้เชี่ยวชาญออกเป็นสามกลุ่มตามหน้าที่ คือกลุ่มทำงาน agent กลุ่มคิดเชิงเหตุผล และกลุ่มโต้ตอบสนทนา เพื่อให้แต่ละกลุ่มเชี่ยวชาญหน้าที่ของตัวเอง
ที่จับต้องได้สำหรับนักพัฒนาคือ LongCat-2.0 เชื่อมกับ harness สายเขียนโค้ด (เครื่องมือที่ให้โมเดลเข้าไปลงมือแก้โค้ดในโปรเจกต์จริง) ยอดนิยมได้ตรง ๆ ทั้ง Claude Code, OpenClaw และ Hermes เท่ากับว่าใครที่ใช้ Claude Code แก้โค้ดทั้ง repo (ที่เก็บโค้ดทั้งโปรเจกต์) อยู่แล้ว ก็เปลี่ยนโมเดลเบื้องหลังมาเป็น LongCat-2.0 ได้
เก่งแค่ไหน ต้องดูก่อนว่าใครเป็นคนวัด
แล้ว LongCat-2.0 เก่งพอไล่บี้ ChatGPT หรือ Claude ไหม คำตอบตรงนี้ต้องอ่านอย่างระวัง Meituan รายงานว่าโมเดลทำคะแนนได้สูสีหรือดีกว่าโมเดลแบบปิดระดับท็อปในหลาย benchmark (ชุดทดสอบมาตรฐานสำหรับวัดความสามารถของโมเดล) สายโค้ดและ agent เช่น Terminal-Bench 2.1, SWE-bench Pro, SWE-bench Multilingual และ BrowseComp
แต่ประเด็นสำคัญคือตัวเลขเกือบทั้งหมดนี้เป็นผลที่ Meituan LongCat วัดเองในบล็อกเปิดตัว ด้วยชุดทดสอบของตัวเอง ยังไม่มีหน่วยงานอิสระภายนอกมายืนยันซ้ำ ตราบใดที่ยังเป็นตัวเลขของผู้สร้าง มันบอกเราได้แค่ว่า "น่าสนใจแต่รอพิสูจน์" ไม่ใช่ "ชนะไปแล้ว"
ฟรีจริง แต่ไม่ใช่ฟรีแบบเปิดในโน้ตบุ๊ก

คำว่า "ฟรี" ในข่าวนี้ต้องเข้าใจให้ตรง เพราะมันฟรีจริง แต่ไม่ได้แปลว่าโหลดมารันบนเครื่องที่บ้านได้
ฟรีในที่นี้คือมี weights ให้ดาวน์โหลดจาก Hugging Face ได้ภายใต้ไลเซนส์ MIT ทั้งเวอร์ชัน INT8 และ FP8 ที่บีบขนาดลงมาแล้ว แต่ 1.6 ล้านล้านพารามิเตอร์ยังใหญ่เกินกว่าพีซีหรือการ์ดจอเกมมิ่งตัวเดียวจะรับไหว ในหน้าโมเดลการ์ด (หน้าข้อมูลของโมเดลบน Hugging Face) Meituan แนะนำเองว่าถ้าจะรันบน GPU ควรใช้การ์ดระดับ H20 ถึง 16 ใบ ซึ่งเป็นฮาร์ดแวร์ระดับเซิร์ฟเวอร์ ไม่ใช่โน้ตบุ๊ก
น่าสนใจว่า H20 ที่ว่านี้เป็นการ์ดของ Nvidia เท่ากับว่า Meituan เทรนโมเดลบนชิปตัวเอง แต่เปิดทางให้คนนอกเลือกเอาไปรันบน GPU ของ Nvidia หรือบน NPU (ชิปประมวลผล AI อีกแบบหนึ่ง) ก็ได้ตามสะดวก
ฟรีให้เอาไปต่อยอด ไม่ได้แปลว่าฟรีให้รันบนโน้ตบุ๊ก
สำหรับคนทั่วไปที่แค่อยากลองสัมผัส ไม่ต้องยุ่งกับเซิร์ฟเวอร์เลย เข้าไปคุยกับมันได้ที่เว็บแชตอย่างเป็นทางการ longcat.ai ส่วนใครที่คิดจะเอาไปต่อยอดจริงจัง weights ตัวเต็มอยู่ที่หน้า Hugging Face ของ LongCat-2.0 พร้อมคำแนะนำการ deploy (การติดตั้งโมเดลให้รันใช้งานจริง) ทั้งสาย GPU และ NPU
อีกหนึ่งสัญญาณจากฝั่งโมเดลโอเพนของจีน
ถ้ามองภาพใหญ่ LongCat-2.0 คืออีกหนึ่งตัวอย่างของเทรนด์ที่ชัดขึ้นเรื่อย ๆ ตลอดปีที่ผ่านมา นั่นคือโมเดลโอเพนจากฝั่งจีนกำลังไล่จี้โมเดลแบบปิดระดับแนวหน้าอย่างต่อเนื่อง ก่อนหน้านี้มี GLM, DeepSeek และ Qwen ที่คนทั่วโลกหยิบไปใช้จริง และตอนนี้ก็มี LongCat เข้ามาสมทบอีกตัว
สิ่งที่ทำให้ตัวนี้ต่างออกไปคือมันไม่ได้แค่เปิดฟรี แต่ยังเทรนสำเร็จบนชิปที่ไม่ใช่ Nvidia ในจังหวะที่การเข้าถึงการ์ด Nvidia กลายเป็นเรื่องการเมืองระหว่างประเทศ การมีทางเลือกฮาร์ดแวร์ที่พิสูจน์แล้วว่าเทรนโมเดลใหญ่ได้จริง จึงเป็นสัญญาณที่คนทั้งวงการต้องจับตา
ท้ายที่สุด ตัวเลขที่น่าจับตาที่สุดในข่าวนี้ อาจไม่ใช่ 1.6 ล้านล้านพารามิเตอร์ แต่เป็นเลขศูนย์ นั่นคือจำนวนการ์ด Nvidia ที่ Meituan ใช้เทรนมันขึ้นมาทั้งตัว
ที่มา:
- บทความ Introducing LongCat-2.0 จาก Meituan LongCat
- โมเดลการ์ด meituan-longcat/LongCat-2.0-INT8 จาก Hugging Face



