GLM 5.2 เสียบเข้า Claude Code แทน Opus ได้ตรงๆ ถูกกว่าราว 5 เท่า แต่ยังเร็วและฉลาดพอใช้งานจริง
GLM 5.2 เป็นโมเดล open-source ที่เสียบเข้า Claude Code แทน Opus ได้โดยตรง แค่เปลี่ยน config ไม่กี่บรรทัด ค่า token ถูกกว่าราว 5 เท่า และรับงานความรู้ทั่วไปได้ใกล้เคียง · บทความนี้สรุปว่ามันคุ้มตรงไหน และยังสู้ Opus ไม่ได้ตรงไหน

GLM 5.2 คือโมเดลภาษา open-source ขนาด 756 พันล้านพารามิเตอร์ ที่เสียบเข้า Claude Code · เครื่องมือเขียนโค้ดบน command line ของ Anthropic · ได้โดยตรงโดยไม่ต้องเปลี่ยนเครื่องมือ จุดที่น่าสนใจไม่ได้อยู่ที่ความใหม่ของโมเดล แต่อยู่ที่การใช้มันแทน Claude Opus · โมเดล AI ตัวท็อปและแพงที่สุดของ Anthropic · ได้ด้วยค่า token ที่ถูกกว่าราว 5 เท่า
วิธีคิดที่ทำให้เรื่องนี้เข้าใจง่ายขึ้นคือมองว่า Claude Code เป็นตัวรถ ส่วนโมเดล AI ที่อยู่ข้างในเป็นเครื่องยนต์ ที่ผ่านมาเครื่องยนต์ตัวเดียวที่รถคันนี้ใช้คือโมเดลตระกูล Claude เอง แต่พอมีช่องให้ชี้ปลายทางของ API ไปที่อื่นได้ การถอดเครื่องยนต์เดิมออกแล้วใส่ GLM 5.2 เข้าไปแทน จึงกลายเป็นเรื่องของการแก้ไฟล์ตั้งค่าไม่กี่บรรทัด รถยังเป็นคันเดิม นิสัยการใช้งานยังเหมือนเดิม แต่ค่าใช้จ่ายต่อรอบลดลงชัดเจน
รถคันเดิม แค่เปลี่ยนเครื่องยนต์

สิ่งที่ทำให้การสลับนี้ไม่สะดุดคือ GLM 5.2 ยังเล่นตามกติกาของ Claude Code ทุกอย่าง
มันอ่านไฟล์ CLAUDE.md ที่เราเขียนกำกับโปรเจกต์ได้ · เรียกใช้ skills ที่เราตั้งไว้ได้ · และรับคำสั่งอย่าง /goal ได้เหมือนเดิม พูดอีกแบบคือพฤติกรรมและการตั้งค่าทุกอย่างที่เคยใช้กับ Claude Code ยังใช้ต่อได้ทันที ไม่ต้องเรียนรู้เครื่องมือใหม่ ไม่ต้องย้ายงานไปไหน
ตัวโมเดลเองก็มีของให้ใช้พอตัว context window อยู่ที่ 1 ล้าน token แปลว่าโยนเอกสารหรือโค้ดก้อนใหญ่เข้าไปให้มันอ่านทีเดียวได้เยอะ และเพราะเป็น open-source มันจึงไม่ได้ผูกอยู่กับบริษัทเดียว ต่างจากโมเดลแบบ closed-source อย่าง Claude หรือ ChatGPT ที่เราเข้าถึงได้ทางเดียวคือผ่านเจ้าของมันเท่านั้น
ตัวเลขที่ทำให้คนหันมามอง
จุดที่คนพูดถึงมากที่สุดคือราคา
เมื่อเรียกใช้ GLM 5.2 ผ่านผู้ให้บริการ Z.ai ค่า input อยู่ที่ราว 1.40 ดอลลาร์ต่อหนึ่งล้าน token และ output ราว 4.40 ดอลลาร์ ขณะที่ Claude Opus 4.8 อยู่ที่ input 5 ดอลลาร์ และ output 25 ดอลลาร์ คิดออกมาแล้วถูกกว่าราว 5 เท่าในงานเดียวกัน
ส่วนความเร็วก็เห็นภาพชัดจากงานออกแบบหน้าเว็บครั้งหนึ่ง GLM 5.2 ทำเสร็จใน 3 นาที 59 วินาที ส่วน Opus ใช้เวลา 14 นาที 59 วินาที งานสายออกแบบ งานหาข้อมูลมาเรียบเรียง และงานความรู้ทั่วไป GLM 5.2 ทำได้คล่องและไหลลื่น
ของจริงคือต้องรู้ว่ามันแพ้ตรงไหน

แต่ถูกกว่าและเร็วกว่าไม่ได้แปลว่าดีกว่าในทุกด้าน
GLM 5.2 ยังสู้ Opus ไม่ได้ในงานที่ต้องคิดหลายชั้นและเก็บรายละเอียดให้ครบ ตัวอย่างที่เห็นชัดคือการไล่เทียบข้อมูลที่ซ้ำกัน เช่น ค่าหนึ่งเขียนเป็น true อีกค่าเขียนเป็น 1 และอีกค่าเป็น 1.0 ทั้งสามอย่างนี้หมายถึงสิ่งเดียวกัน แต่ต้องคิดละเอียดถึงจะเห็นว่าเป็นค่าเดียวกัน งานแบบนี้ Opus ยังทำได้แม่นกว่า
ที่ตลกร้ายคือพอเจองานที่ต้องคิดหนัก GLM 5.2 กลับช้าลง ในงานสร้างหน้าเว็บเชิงสร้างสรรค์ครั้งหนึ่ง GLM ใช้เวลา 35 นาที ส่วน Opus ใช้แค่ 11 นาที กลายเป็นคนละภาพกับงานออกแบบทั่วไปที่ GLM เร็วกว่าชัดเจน บทเรียนตรงนี้คือเลือกใช้ให้ถูกงาน อย่าคาดหวังว่าโมเดลถูกกว่าจะแทนได้ทุกอย่าง
ลองเชื่อมจริงใน 3 ขั้นตอนแรก
การเสียบ GLM 5.2 เข้า Claude Code ทำได้ผ่านการตั้งค่าระดับโปรเจกต์ และเริ่มได้จากสามขั้นตอนแรกนี้
- ไปสมัครที่ Z.ai แล้วเลือกแพ็กเกจ มีให้เลือกทั้งแบบจ่ายตาม token และแบบเหมารายเดือนที่ 16 · 64 · 144 ดอลลาร์
- เข้าไปที่หน้า API keys แล้วกดสร้าง key ใหม่ขึ้นมาหนึ่งอัน
- เปิดไฟล์
.claude/settings.local.jsonในโฟลเดอร์โปรเจกต์ แล้ววางค่าตั้งต้นลงไป โดยแทนที่ค่า token ด้วย key ที่เพิ่งสร้าง
ค่าหลักสำหรับการสลับมีสองส่วน ส่วนแรกคือ ANTHROPIC_BASE_URL ที่ชี้ปลายทางไปที่ https://api.z.ai/api/anthropic แทนที่จะเป็นเซิร์ฟเวอร์ของ Anthropic และส่วนที่สองคือกลุ่มค่าที่กำหนดให้โมเดลทุกช่อง ทั้ง opus · sonnet · haiku ใช้ glm-5.2 ทั้งหมด
"env": {
"ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
"ANTHROPIC_AUTH_TOKEN": "your-z-ai-api-key",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-5.2"
}พอเปิด Claude Code ในโฟลเดอร์นั้น มันจะขึ้นบอกว่ากำลังใช้ GLM 5.2 พร้อม context 1 ล้าน token เป็นที่เรียบร้อย
สลับไปมาได้ ไม่ต้องเลือกข้าง
ข้อดีอีกอย่างคือเราไม่ต้องตัดสินใจครั้งเดียวแล้วผูกตัวเองไว้
เพราะการตั้งค่าเป็นแบบราย directory โฟลเดอร์ไหนที่วางไฟล์ settings.local.json ไว้ก็จะใช้ GLM 5.2 ส่วนโฟลเดอร์ที่ไม่มีไฟล์นี้ก็กลับไปใช้ Opus ตามปกติ เท่ากับว่างานที่ต้องการความเร็วและประหยัดก็ส่งให้ GLM รับไป ส่วนงานที่ต้องคิดหนักจริงๆ ก็ดึง Opus มาทำในอีกโฟลเดอร์ ไม่ต้องเลือกว่าจะอยู่กับเจ้าไหนเจ้าเดียว
ภาพรวมการใช้งานจริงพอเห็นได้จากการทดสอบแบบใช้งานหนักครั้งหนึ่งบนแพ็กเกจระดับกลาง ใช้งานต่อเนื่องราว 4 ถึง 5 ชั่วโมง กิน quota ไปประมาณครึ่งหนึ่งของรอบ 5 ชั่วโมง และราว 10% ของรอบรายสัปดาห์ ไม่ได้ใช้ฟรีไม่อั้น แต่ก็ยังเหลือเพดานให้ทำงานได้อีกพอควร
ทำไมการมีทางเลือกถึงสำคัญ
นอกจากเรื่องราคาและความเร็ว สิ่งที่เรื่องนี้ชี้ให้เห็นคือคุณค่าของการไม่ผูกตัวเองไว้กับเจ้าเดียว
โมเดลแบบ closed-source ที่เราจ่ายเงินใช้อยู่ทุกวันนี้ บริษัทเจ้าของหลายรายยังขาดทุนจากการให้บริการ เมื่อถึงวันที่ต้องปรับราคาหรือเปลี่ยนเงื่อนไข เราในฐานะผู้ใช้แทบไม่มีทางเลือกอื่นนอกจากต้องยอมรับ การมีโมเดล open-source ที่เสียบเข้าเครื่องมือเดิมได้ จึงเป็นเหมือนประตูสำรองที่เปิดทิ้งไว้ ถ้าวันหนึ่งทางหลักแพงขึ้นหรือปิดลง ก็ยังมีทางเดินต่อ
บทเรียนจากการทดสอบจริงกว่าชั่วโมง ที่ Nate Herk เจ้าของช่องสรุปไว้ คือคำถามที่ควรถามไม่ใช่ว่าโมเดลไหนเก่งที่สุด แต่คือโมเดลไหนเก่งพอสำหรับงานตรงหน้า เมื่อ 80% ของงานไม่ต้องใช้ตัวที่แพงที่สุด การจ่ายเต็มราคากับทุกงานจึงเป็นการจ่ายเกินจำเป็น
ยิ่งโมเดลมีให้เลือกมากเท่าไร ทักษะที่มีค่ามากขึ้นจึงไม่ใช่การใช้โมเดลตัวใดตัวหนึ่งให้คล่อง แต่คือการรู้ว่างานชิ้นไหนควรส่งให้เครื่องยนต์ตัวไหน
ที่มา: คลิป GLM 5.2 in Claude Code is Blowing My Mind จากช่อง Nate Herk



