GLM-5.2 โมเดลเขียนโค้ดโอเพนเวตจาก Z.ai ที่ไล่จี้ Opus ได้ · แถมรันเองได้ฟรีภายใต้ MIT license
GLM-5.2 คือโมเดลเขียนโค้ดแบบเปิดน้ำหนัก (open-weight) จาก Z.ai ที่ทำคะแนนงานเขียนโค้ดตามหลัง Claude Opus 4.8 อยู่แค่ราว 1% แต่ปล่อยใต้ MIT license ให้โหลดไปรันเองได้ฟรี บทความนี้สรุปว่าทำไมการเปิดน้ำหนักครั้งนี้ถึงสำคัญ และจะเริ่มใช้วันนี้ได้ยังไง

GLM-5.2 คือโมเดลเขียนโค้ดตัวใหม่จาก Z.ai (ZhipuAI) ที่ปล่อยน้ำหนักให้โหลดไปใช้เองได้ฟรี จุดที่ทำให้คนในวงการสะดุดคือคะแนนบนงานเขียนโค้ดสาย FrontierSWE เพราะตามหลัง Claude Opus 4.8 อยู่แค่ราว 1% (74.4 ต่อ 75.1) ทั้งที่ Opus เป็นโมเดลปิดราคาแพง ส่วน GLM-5.2 เปิดน้ำหนักใต้ MIT license โดยไม่จำกัดภูมิภาคและไม่กั้นการใช้งาน
พูดให้เข้าใจง่ายคือ ก่อนหน้านี้ถ้าอยากได้ผู้ช่วยเขียนโค้ดระดับท็อป ทางเลือกแทบทั้งหมดคือจ่ายค่าโมเดลปิดแพง ๆ เป็นรายเดือน แต่ตอนนี้มีโมเดลที่คะแนนใกล้กันให้โหลดไปรันบนเครื่องตัวเอง หรือเสียบเข้าเครื่องมืออย่าง Claude Code ได้ทันที บทความนี้จะไม่พาไล่ดูสถาปัตยกรรมหรือเบนช์มาร์กทุกตัว แต่จะตอบแค่สองเรื่อง: ทำไมการเปิดน้ำหนักครั้งนี้ถึงเป็นเรื่องใหญ่ และคนที่อยากลองจะเริ่มได้ยังไงวันนี้
ตัวเลขที่ทำให้คนหันมามอง

GLM-5.2 วางตัวเองเป็นโมเดลสาย long-horizon coding สำหรับงานเขียนโค้ดที่ต้องคิดยาวหลายขั้น ไม่ใช่แค่เติมโค้ดทีละบรรทัด ตัวเลขบนเบนช์มาร์กงานเขียนโค้ดก็หนุนเรื่องนี้ชัดเจน
- Terminal-Bench 2.1 ได้ 81.0 ขณะที่ GLM-5.1 รุ่นก่อนหน้าได้ 63.5 เท่ากับกระโดดขึ้นเกือบยี่สิบแต้มในรุ่นเดียว ที่น่าสนใจกว่านั้นคือเมื่อจับคู่กับ harness ที่ดีที่สุดและรันผ่าน Claude Code ตัว GLM-5.2 ทำได้ 82.7 แซง Claude Opus 4.8 (78.9) และเฉียด GPT-5.5 (83.4)
- SWE-bench Pro ได้ 62.1 นำ GPT-5.5 (58.6) และ Gemini 3.1 Pro (54.2) แม้จะยังตามหลัง Opus 4.8 (69.2) อยู่
- เป็นโมเดลโอเพนซอร์สที่คะแนนสูงสุด ในกลุ่มของตัวเองทั้งบน Terminal-Bench 2.1, FrontierSWE, PostTrainBench และ SWE-Marathon
ชุดตัวเลขนี้ไม่ได้แปลว่า GLM-5.2 "เก่งที่สุดในโลก" เพราะโมเดลปิดอย่าง Opus ยังนำอยู่ในหลายด้าน แต่แปลว่าช่องว่างระหว่างของฟรีที่รันเองได้กับของเสียเงินแคบลงมาก จนหลายงานจริงแทบไม่รู้สึกถึงความต่าง
ทำไม "เปิดน้ำหนัก" ถึงเปลี่ยนเกม
ส่วนที่สำคัญกว่าคะแนนคือคำสองคำ: MIT license ตรงนี้แหละที่ทำให้ GLM-5.2 ต่างจากการประกาศโมเดลเก่งทั่วไป
โมเดลปิดต่อให้เก่งแค่ไหน คนทั่วไปก็ได้แค่ "เช่า" ผ่าน API ของเจ้าของ ข้อมูลต้องวิ่งออกนอกเครื่อง ราคาขึ้นกับเจ้าของ และถ้าวันหนึ่งเขาปิดบริการหรือขึ้นราคา ผู้ใช้ก็ทำได้แค่ยอมตาม แต่ MIT license หมายความว่าเราโหลดน้ำหนักของโมเดลมาไว้เองได้จริง แก้ ต่อยอด หรือเอาไปใช้ในงานเชิงพาณิชย์ได้โดยไม่ต้องขออนุญาต และไม่มีข้อจำกัดรายภูมิภาค
น้ำหนักของ GLM-5.2 เปิดให้โหลดบน Hugging Face ในชื่อ zai-org/GLM-5.2 จุดนี้ทำให้ทีมเล็กหรือเจ้าของธุรกิจที่อยากคุมต้นทุนได้ประโยชน์มากที่สุด เพราะได้ผู้ช่วยเขียนโค้ดระดับใกล้เคียงโมเดลราคาแพง โดยไม่ต้องผูกกับค่าโมเดลปิดรายเดือน
1M context ที่ตั้งใจทำให้นิ่ง ไม่ใช่แค่ตัวเลข
GLM-5.2 รองรับ context window ขนาด 1M token ซึ่งใหญ่พอจะป้อนโค้ดทั้งโปรเจกต์เข้าไปให้โมเดลเห็นพร้อมกันได้ แต่ทีม Z.ai ไม่ได้เน้นแค่ตัวเลขนี้ตรง ๆ
ทีมเขียนไว้ตรง ๆ ว่าการอ้างว่ารับ 1M token เป็นเรื่องง่าย แต่การทำให้โมเดลยังเชื่อถือได้เมื่อเจองานวิศวกรรมจริงยากกว่ามาก พูดอีกแบบคือ โมเดลหลายตัว "รับ" token ยาว ๆ ได้ก็จริง แต่พอข้อมูลยาวขึ้นคุณภาพคำตอบกลับร่วง GLM-5.2 จึงวางเรื่องนี้เป็นเรื่องคุณภาพ ไม่ใช่แค่ตัวเลขโชว์สเปก
เบื้องหลังที่ทำให้ context ยาวยังเร็วคือเทคนิคชื่อ IndexShare ซึ่งใช้ตัวชี้ตำแหน่งร่วมกันข้ามทุก 4 ชั้นของ sparse attention จึงลดภาระการคำนวณต่อ token ได้ถึง 2.9 เท่าเมื่อทำงานที่ระดับ 1M context รายละเอียดเชิงเทคนิคไม่จำเป็นต้องเข้าใจทั้งหมด แต่ใจความคือ context ยาวนี้ใช้ได้จริงโดยไม่ช้าเป็นเต่า
เริ่มใช้วันนี้ เลือกทางที่ตรงกับตัวเอง

ข่าวดีคือไม่ต้องรอ เพราะ GLM-5.2 พร้อมให้ใช้แล้วตั้งแต่วันเปิดตัว และมีหลายทางให้เลือกตามรูปแบบการใช้งาน
ถ้าใช้ Claude Code อยู่แล้ว นี่คือทางที่เร็วที่สุด แค่ตั้งชื่อโมเดลเป็น GLM-5.2 หรือใส่ GLM-5.2[1m] เพื่อเปิด context ขนาด 1M แล้วเลือกระดับ effort เป็น High หรือ Max สำหรับงานยาก เท่านี้ก็ใช้โมเดลใหม่บน workflow เดิมที่คุ้นอยู่แล้วได้ทันที วิธีเชื่อมต่อแบบละเอียดอยู่ใน เอกสารนักพัฒนาของ Z.ai
ถ้าอยากรันเองบนเครื่องตัวเอง เพื่อความเป็นส่วนตัวหรือคุมต้นทุนระยะยาว GLM-5.2 รองรับเฟรมเวิร์กยอดนิยมหลายตัว ทางที่เริ่มง่ายสุดสองทางคือ
# ผ่าน vLLM
pip install vllm
vllm serve "zai-org/GLM-5.2"# ผ่าน SGLang
pip install sglang
python3 -m sglang.launch_server --model-path "zai-org/GLM-5.2" --host 0.0.0.0 --port 30000เลือกทางไหนดี: ถ้าแค่อยากลองว่าโมเดลทำงานเป็นยังไงและมี Claude Code อยู่แล้ว ให้เริ่มจากการตั้งชื่อโมเดลผ่าน API เพราะไม่ต้องเตรียมเครื่องเอง แต่ถ้าจริงจังเรื่องความเป็นส่วนตัวของโค้ด หรืออยากตัดค่าใช้จ่ายต่อการเรียกใช้ในระยะยาว ค่อย self-host ด้วย vLLM หรือ SGLang โดยมีเงื่อนไขว่าต้องมีเครื่องที่แรงพอ
ของที่ยังต้องชั่งใจ
ถ้าจะพูดให้ยุติธรรม GLM-5.2 ไม่ใช่คำตอบที่ดีที่สุดในทุกด้าน
สำหรับงานที่ต้องใช้เครื่องมือต่อเนื่องหลายชั้น (agentic) อย่าง Tool-Decathlon ตัว GLM-5.2 ได้ 48.2 ขณะที่ Opus 4.8 ได้ 59.9 ซึ่งห่างกันพอสมควร เช่นเดียวกับ SWE-bench Pro ที่ยังตามโมเดลปิดอยู่ แปลว่าถ้างานต้องประสานเครื่องมือซับซ้อนแบบสุดทาง โมเดลปิดตัวท็อปอาจยังให้ผลที่นิ่งกว่า
อีกข้อที่พูดตั้งแต่ต้นคือ การรันเองต้องมีเครื่องที่รองรับโมเดลขนาดนี้ ซึ่งไม่ใช่โน้ตบุ๊กทั่วไป คนที่ไม่มีฮาร์ดแวร์พร้อมอาจคุ้มกว่าถ้าเรียกผ่าน API ไปก่อน
แต่ถ้ามองภาพรวม เรื่องที่น่าจับตาไม่ใช่ว่า GLM-5.2 ชนะใครในตารางไหน แต่คือของฟรีที่โหลดมาไว้เองได้ไล่มาใกล้ของเสียเงินจนแทบจะหายใจรดต้นคอ และเมื่อช่องว่างแคบลงทุกครั้งที่มีรุ่นใหม่ออก คำถามก็ค่อย ๆ เปลี่ยนจาก "โมเดลไหนเก่งสุด" ไปเป็น "ทำไมยังต้องจ่ายแพงอยู่"
ที่มา:
- บทความ GLM-5.2 จาก Z.ai
- โมเดล zai-org/GLM-5.2 · Hugging Face จาก Hugging Face



