LongCat-2.0 โมเดลโอเพนซอร์สจากจีน 1.6 ล้านล้านพารามิเตอร์ ใช้ฟรีภายใต้ไลเซนส์ MIT และเทรนทั้งตัวโดยไม่ใช้การ์ด Nvidia

LongCat-2.0 คือโมเดลภาษาโอเพนขนาด 1.6 ล้านล้านพารามิเตอร์จาก Meituan บริษัทส่งอาหารของจีน เปิดให้ใช้ฟรีภายใต้ไลเซนส์ MIT ส่วนจุดที่คนทั้งวงการจับตาคือการเทรนโมเดลทั้งตัวบนชิป AI ของ Meituan เอง โดยไม่ใช้การ์ด Nvidia เลย

5 กรกฎาคม 2569 · 8 นาที

LongCat-2.0 โมเดลโอเพนซอร์สจากจีน 1.6 ล้านล้านพารามิเตอร์ ใช้ฟรีภายใต้ไลเซนส์ MIT และเทรนทั้งตัวโดยไม่ใช้การ์ด Nvidia — LongCat-2.0 · โมเดลโอเพน 1.6 ล้านล้านพารามิเตอร์จาก Meituan

LongCat-2.0 คือโมเดลภาษาโอเพนตัวใหม่จาก Meituan บริษัทส่งอาหารเจ้าใหญ่ของจีน ตัวโมเดลใหญ่ถึง 1.6 ล้านล้านพารามิเตอร์ และเปิดให้โหลดไปใช้ได้ฟรีภายใต้ไลเซนส์ MIT ตั้งแต่วันที่ 30 มิถุนายน 2026 ที่ผ่านมา

แต่จุดที่ทำให้คนทั้งวงการหันมามอง ไม่ใช่แค่ขนาดหรือคำว่าฟรี เพราะในบล็อกเปิดตัว Meituan ระบุว่าทั้งการเทรนและการรันจริงในสเกลใหญ่ ใช้ชิป AI ที่บริษัทออกแบบขึ้นเอง ไม่ได้พึ่งการ์ดของ Nvidia เลย เรื่องนี้สะเทือนกว่าตัวเลขพารามิเตอร์ เพราะทุกวันนี้การเทรนโมเดลระดับแนวหน้าเกือบทุกตัวบนโลกยังผูกอยู่กับการ์ด Nvidia

ใหญ่ 1.6 ล้านล้าน แต่ทำงานทีละ 4.8 หมื่นล้าน

แผนภาพเทียบสัดส่วนพารามิเตอร์รวม 1.6 ล้านล้านกับส่วนที่โมเดลเรียกใช้จริงต่อโทเคนราว 4.8 หมื่นล้าน ด้วยแถบวัดสองแถบที่ยาวต่างกันชัดเจน — แม้จะโฆษณาว่ามี 1.6 ล้านล้านพารามิเตอร์ แต่เวลาใช้งานจริง โมเดลเรียกใช้เพียงราว 4.8 หมื่นล้าน ต้นทุนรันต่อคำตอบจึงถูกกว่าที่ตัวเลขรวมชวนให้เข้าใจ

ตัวเลข 1.6 ล้านล้านพารามิเตอร์ฟังดูมหาศาล แต่มีรายละเอียดสำคัญที่ต้องเข้าใจก่อน เพราะ LongCat-2.0 เป็นโมเดลแบบ MoE (Mixture-of-Experts คือโมเดลที่ประกอบด้วยผู้เชี่ยวชาญย่อยจำนวนมาก) ไม่ได้เรียกใช้พารามิเตอร์ทั้ง 1.6 ล้านล้านมาคำนวณพร้อมกันทุกครั้ง

พูดให้เห็นภาพคือ ในแต่ละโทเคน (หน่วยย่อยของข้อความที่โมเดลประมวลผลทีละชิ้น) โมเดลจะเรียกใช้ผู้เชี่ยวชาญแค่บางส่วน รวมแล้วราว 4.8 หมื่นล้านพารามิเตอร์เท่านั้น เหมือนมีทีมผู้เชี่ยวชาญเต็มออฟฟิศ แต่แต่ละคำถามเรียกมาช่วยแค่ไม่กี่คนที่เกี่ยวข้อง วิธีนี้ทำให้โมเดลครอบคลุมความรู้ได้กว้างเท่าโมเดลขนาดใหญ่มาก แต่ต้นทุนการรันต่อคำตอบถูกกว่าการเรียกใช้ทั้ง 1.6 ล้านล้านพร้อมกันมาก จำตรงนี้ไว้ก่อน เพราะนี่คือกุญแจของเรื่อง "ฟรี" ที่จะพูดถึงตอนท้าย

นอกจากขนาด LongCat-2.0 ยังมาพร้อม context (ปริมาณข้อความที่โมเดลรับและจำได้ในคราวเดียว) ยาวถึง 1 ล้านโทเคน หมายความว่ามันอ่านและจำเนื้อหายาว ๆ อย่างโค้ดทั้งโปรเจกต์หรือเอกสารเป็นปึกได้ในคราวเดียว อีกจุดสำคัญคือมันปล่อยภายใต้ไลเซนส์ MIT ซึ่งเป็นไลเซนส์โอเพนซอร์สที่ให้อิสระกว้างที่สุดแบบหนึ่ง ใครจะเอา weights (ค่าพารามิเตอร์ที่เทรนเสร็จแล้วของโมเดล) ไปใช้ ดัดแปลง หรือต่อยอดเชิงพาณิชย์ก็ได้ ตราบใดที่ไม่ไปแตะเครื่องหมายการค้าหรือสิทธิบัตรของ Meituan

เรื่องที่สะเทือนจริงคือชิป

จุดที่ทำให้ข่าวนี้พิเศษกว่าการปล่อยโมเดลใหญ่ทั่วไปคือฮาร์ดแวร์ที่ใช้เทรน โดย Meituan บอกว่าเทรน LongCat-2.0 ทั้งตัวบนชิป AI แบบ ASIC (ชิปที่ออกแบบมาเพื่องานเฉพาะทาง) ที่บริษัททำขึ้นเอง แล้วจัดเรียงต่อกันเป็นกลุ่มเครื่องขนาดใหญ่ที่เรียกว่า superpod ไม่ได้ใช้การ์ด GPU ของ Nvidia ที่เป็นมาตรฐานของวงการ

การเทรนรอบนี้ใช้ข้อมูลกว่า 35 ล้านล้านโทเคน และใช้ตัวเร่งความเร็ว (accelerator) กว่า 50,000 ตัว จุดที่ Meituan เน้นเป็นพิเศษคือทั้งกระบวนการไม่มีการ rollback หรืออาการล้มจนต้องย้อนกลับไปเริ่มใหม่จากจุดเซฟ ซึ่งเป็นฝันร้ายที่พบบ่อยเวลาเทรนโมเดลขนาดนี้ การเทรนที่จบได้โดยไม่สะดุดบนฮาร์ดแวร์ที่ไม่ใช่ Nvidia จึงเหมือนเป็นหลักฐานว่าการเทรนโมเดลระดับแนวหน้าไม่จำเป็นต้องผูกกับการ์ดค่ายเดียวอีกต่อไป

ทำมาให้ลงมือทำงานเอง

LongCat-2.0 ไม่ได้ออกแบบมาให้เป็นแชตบอตตอบคำถามทั่วไป แต่เล็งไปที่งานสายเขียนโค้ดและงาน agent (งานที่โมเดลลงมือทำเองหลายขั้นตอนจนจบ) เป็นหลัก

สิ่งที่ทำให้รองรับ context ยาว 1 ล้านโทเคนได้คือเทคนิคชื่อ LongCat Sparse Attention (LSA) แนวคิดของมันคือให้โมเดลโฟกัสเฉพาะส่วนสำคัญของข้อความยาว ๆ แทนการให้ความสำคัญเท่ากันทุกคำ จึงประมวลผลได้เร็วขึ้นโดยคุณภาพไม่ตก เทคนิคนี้พัฒนาต่อจากแนวทางเดียวกันของ DeepSeek ส่วนในขั้น post-train (การฝึกต่อหลังเทรนหลัก) ทีมงานแยกผู้เชี่ยวชาญออกเป็นสามกลุ่มตามหน้าที่ คือกลุ่มทำงาน agent กลุ่มคิดเชิงเหตุผล และกลุ่มโต้ตอบสนทนา เพื่อให้แต่ละกลุ่มเชี่ยวชาญหน้าที่ของตัวเอง

ที่จับต้องได้สำหรับนักพัฒนาคือ LongCat-2.0 เชื่อมกับ harness สายเขียนโค้ด (เครื่องมือที่ให้โมเดลเข้าไปลงมือแก้โค้ดในโปรเจกต์จริง) ยอดนิยมได้ตรง ๆ ทั้ง Claude Code, OpenClaw และ Hermes เท่ากับว่าใครที่ใช้ Claude Code แก้โค้ดทั้ง repo (ที่เก็บโค้ดทั้งโปรเจกต์) อยู่แล้ว ก็เปลี่ยนโมเดลเบื้องหลังมาเป็น LongCat-2.0 ได้

เก่งแค่ไหน ต้องดูก่อนว่าใครเป็นคนวัด

แล้ว LongCat-2.0 เก่งพอไล่บี้ ChatGPT หรือ Claude ไหม คำตอบตรงนี้ต้องอ่านอย่างระวัง Meituan รายงานว่าโมเดลทำคะแนนได้สูสีหรือดีกว่าโมเดลแบบปิดระดับท็อปในหลาย benchmark (ชุดทดสอบมาตรฐานสำหรับวัดความสามารถของโมเดล) สายโค้ดและ agent เช่น Terminal-Bench 2.1, SWE-bench Pro, SWE-bench Multilingual และ BrowseComp

แต่ประเด็นสำคัญคือตัวเลขเกือบทั้งหมดนี้เป็นผลที่ Meituan LongCat วัดเองในบล็อกเปิดตัว ด้วยชุดทดสอบของตัวเอง ยังไม่มีหน่วยงานอิสระภายนอกมายืนยันซ้ำ ตราบใดที่ยังเป็นตัวเลขของผู้สร้าง มันบอกเราได้แค่ว่า "น่าสนใจแต่รอพิสูจน์" ไม่ใช่ "ชนะไปแล้ว"

ฟรีจริง แต่ไม่ใช่ฟรีแบบเปิดในโน้ตบุ๊ก

ตารางสองคอลัมน์เทียบสิ่งที่ได้จริงจากคำว่า "ฟรี" กับสิ่งที่คำว่า "ฟรี" ไม่ได้แปลว่าทำได้ โดยใช้เครื่องหมายถูกและกากบาทแยกสองฝั่ง — คำว่าฟรีในข่าวนี้หมายถึงโหลด weights ไปต่อยอดได้อย่างอิสระ ไม่ได้แปลว่าเปิดรันบนโน้ตบุ๊กที่บ้านได้ เพราะยังต้องพึ่งเครื่องระดับเซิร์ฟเวอร์

คำว่า "ฟรี" ในข่าวนี้ต้องเข้าใจให้ตรง เพราะมันฟรีจริง แต่ไม่ได้แปลว่าโหลดมารันบนเครื่องที่บ้านได้

ฟรีในที่นี้คือมี weights ให้ดาวน์โหลดจาก Hugging Face ได้ภายใต้ไลเซนส์ MIT ทั้งเวอร์ชัน INT8 และ FP8 ที่บีบขนาดลงมาแล้ว แต่ 1.6 ล้านล้านพารามิเตอร์ยังใหญ่เกินกว่าพีซีหรือการ์ดจอเกมมิ่งตัวเดียวจะรับไหว ในหน้าโมเดลการ์ด (หน้าข้อมูลของโมเดลบน Hugging Face) Meituan แนะนำเองว่าถ้าจะรันบน GPU ควรใช้การ์ดระดับ H20 ถึง 16 ใบ ซึ่งเป็นฮาร์ดแวร์ระดับเซิร์ฟเวอร์ ไม่ใช่โน้ตบุ๊ก

น่าสนใจว่า H20 ที่ว่านี้เป็นการ์ดของ Nvidia เท่ากับว่า Meituan เทรนโมเดลบนชิปตัวเอง แต่เปิดทางให้คนนอกเลือกเอาไปรันบน GPU ของ Nvidia หรือบน NPU (ชิปประมวลผล AI อีกแบบหนึ่ง) ก็ได้ตามสะดวก

ฟรีให้เอาไปต่อยอด ไม่ได้แปลว่าฟรีให้รันบนโน้ตบุ๊ก

สำหรับคนทั่วไปที่แค่อยากลองสัมผัส ไม่ต้องยุ่งกับเซิร์ฟเวอร์เลย เข้าไปคุยกับมันได้ที่เว็บแชตอย่างเป็นทางการ longcat.ai ส่วนใครที่คิดจะเอาไปต่อยอดจริงจัง weights ตัวเต็มอยู่ที่หน้า Hugging Face ของ LongCat-2.0 พร้อมคำแนะนำการ deploy (การติดตั้งโมเดลให้รันใช้งานจริง) ทั้งสาย GPU และ NPU

อีกหนึ่งสัญญาณจากฝั่งโมเดลโอเพนของจีน

ถ้ามองภาพใหญ่ LongCat-2.0 คืออีกหนึ่งตัวอย่างของเทรนด์ที่ชัดขึ้นเรื่อย ๆ ตลอดปีที่ผ่านมา นั่นคือโมเดลโอเพนจากฝั่งจีนกำลังไล่จี้โมเดลแบบปิดระดับแนวหน้าอย่างต่อเนื่อง ก่อนหน้านี้มี GLM, DeepSeek และ Qwen ที่คนทั่วโลกหยิบไปใช้จริง และตอนนี้ก็มี LongCat เข้ามาสมทบอีกตัว

สิ่งที่ทำให้ตัวนี้ต่างออกไปคือมันไม่ได้แค่เปิดฟรี แต่ยังเทรนสำเร็จบนชิปที่ไม่ใช่ Nvidia ในจังหวะที่การเข้าถึงการ์ด Nvidia กลายเป็นเรื่องการเมืองระหว่างประเทศ การมีทางเลือกฮาร์ดแวร์ที่พิสูจน์แล้วว่าเทรนโมเดลใหญ่ได้จริง จึงเป็นสัญญาณที่คนทั้งวงการต้องจับตา

คำเตือนก่อนจะตื่นเต้นเกินไป

ตัวเลข benchmark ทั้งหมดเป็นของ Meituan เอง ยังไม่มีผลทดสอบอิสระ · การรันเองต้องใช้ฮาร์ดแวร์ระดับเซิร์ฟเวอร์ ไม่ใช่แค่โหลดมาเปิด · เป็นโมเดลที่เพิ่งออกมาสด ๆ ยอดดาวน์โหลดบน Hugging Face ยังอยู่หลักสิบ · ควรอ่านโมเดลการ์ดเรื่องขอบเขตการใช้งานและไลเซนส์ให้ครบก่อนเอาไปใช้จริง

ท้ายที่สุด ตัวเลขที่น่าจับตาที่สุดในข่าวนี้ อาจไม่ใช่ 1.6 ล้านล้านพารามิเตอร์ แต่เป็นเลขศูนย์ นั่นคือจำนวนการ์ด Nvidia ที่ Meituan ใช้เทรนมันขึ้นมาทั้งตัว

ที่มา: