ต่อ Claude Code เข้ากับ GLM-5.2 ผ่าน hf-claude · ใช้โมเดลโอเพนซอร์สฟรีบน Hugging Face แทนการจ่ายค่าโมเดล
hf-claude คือ extension ของ Hugging Face ที่ทำให้ Claude Code ใช้โมเดลโอเพนซอร์สบน HF Inference ได้ ตัวอย่างที่เพิ่งมีคนเทสต์แล้วเข้ากันดีคือ GLM-5.2 โมเดล MIT ฟรี · เป็นทางเลือกให้คนที่ชอบ Claude Code แต่ติดเรื่องค่าโมเดล ได้ใช้เครื่องมือเดิมโดยไม่ต้องผูกกับค่ายเดียว

hf-claude คือ extension ตัวเล็ก ๆ ของ Hugging Face เว็บรวมโมเดล AI สำหรับดาวน์โหลดและเรียกใช้ สิ่งที่มันทำคือเปิดทางให้ Claude Code เครื่องมือ AI สำหรับเขียนโค้ดและรันงานในเทอร์มินัล ไปคุยกับโมเดลโอเพนซอร์สบน Hugging Face แทนที่จะผูกอยู่กับโมเดลของ Anthropic บริษัทเจ้าของ Claude อย่างเดียว ติดตั้งด้วยคำสั่งเดียว แล้วชี้ Claude Code ไปที่โมเดลฟรีตัวที่ต้องการได้เลย
ตัวอย่างที่เพิ่งมีคนเทสต์แล้วบอกว่าเข้ากันดีคือ GLM-5.2 โมเดลโอเพนซอร์สสัญชาติจีนที่ใช้ license MIT คือใช้ฟรี ดาวน์โหลดได้ ไม่ติดข้อจำกัดตามภูมิภาค จุดที่น่าสนใจไม่ใช่แค่ "มีโมเดลใหม่" แต่อยู่ที่แนวคิดเบื้องหลังมัน · เครื่องมือ AI กับตัวโมเดลเป็นคนละชั้นกัน และแยกออกจากกันได้ ถ้าชอบหน้าตาและการทำงานของ Claude Code อยู่แล้ว แต่ไม่อยากจ่ายค่าโมเดลทุกครั้งที่เรียกใช้ การต่อมันเข้ากับโมเดลฟรีบน Hugging Face คือทางเลือกที่เพิ่งเปิดขึ้นมา
เครื่องมือ AI กับโมเดล ไม่ใช่ของชิ้นเดียวกัน

คนส่วนใหญ่เข้าใจว่า Claude Code มาคู่กับโมเดลของ Anthropic เป็นแพ็กเดียวแยกไม่ได้ · ความจริงคือมันคนละส่วนกัน
Claude Code คือ "เครื่องมือ" ที่นั่งอยู่ในเทอร์มินัล คอยรับคำสั่งภาษาคน แล้วลงมือเขียนไฟล์ แก้โค้ด รันคำสั่งให้ ส่วน "โมเดล" คือสมองที่อยู่เบื้องหลังคอยคิดคำตอบ · ปกติเครื่องมือนี้จะส่งงานไปให้โมเดลของ Anthropic คิด แล้วคิดเงินตามจำนวนที่เรียกใช้
hf-claude เข้ามาเสียบตรงรอยต่อนี้ · มันบอก Claude Code ว่า "ไม่ต้องส่งไปที่เดิม ส่งมาทางนี้แทน" แล้วเปลี่ยนเส้นทางไปที่ HF Inference ซึ่งเป็นบริการรันโมเดลของ Hugging Face · ผลคือยังใช้เครื่องมือเดิมและวิธีทำงานแบบเดิม แต่โมเดลเบื้องหลังเปลี่ยนเป็นโอเพนซอร์สที่เราเลือกเองได้ พอเข้าใจว่าสองชั้นนี้แยกกันได้ คำถามก็เปลี่ยนจาก "ต้องจ่ายเท่าไรถึงจะใช้ได้" เป็น "อยากให้สมองตัวไหนทำงานให้"
GLM-5.2 คือโมเดลฟรีแบบไหน
GLM-5.2 เป็นโมเดลตัวเรือธงของทีม zai-org ที่ออกแบบมาเพื่องานสาย agent ที่ต้องทำต่อเนื่องยาว ๆ โดยเฉพาะงานเขียนโค้ดและงานในเทอร์มินัล จุดที่ทำให้มันน่าลองมีไม่กี่ข้อแต่ชัด
- License MIT · ใช้ฟรี เอาไปต่อยอดได้ ไม่มีเงื่อนไขกั้นตามภูมิภาค
- Context window 1M tokens · รับข้อมูลเข้าได้ทีละมาก เหมาะกับงานที่ต้องอ่านโค้ดทั้งโปรเจกต์
- ออกแบบมาเพื่องาน long-horizon · งานที่ต้องคิดหลายขั้นแล้วทำต่อเนื่องจนจบ ไม่ใช่ตอบคำถามสั้น ๆ ทีละครั้ง
เดือนล่าสุดมีคนดาวน์โหลดไป 57,186 ครั้ง และมี Spaces บน Hugging Face ที่หยิบมันไปใช้แล้วราว 40 ตัว · ตัวเลขนี้บอกว่าไม่ใช่ของที่เพิ่งโผล่มาแล้วไม่มีใครแตะ แต่มีคนเอาไปลองจริงพอสมควร ถ้าอยากชิมก่อนตัดสินใจ ลองคุยกับมันผ่านหน้าเว็บได้เลยที่ HuggingChat โดยไม่ต้องติดตั้งอะไร
เก่งจริงแค่ไหน เทียบกับตัวท็อป

ตรงนี้ต้องพูดให้ตรง · GLM-5.2 ไม่ได้ชนะทุกกระดาน แต่บางสนามมันยืนแถวหน้าได้จริง
ในด้านคณิตศาสตร์ระดับยาก AIME 2026 มันทำได้ 99.2 ซึ่งสูงสุดในตาราง แซงทั้ง GPT-5.5 ที่ 98.3 และ Claude Opus 4.8 ที่ 95.7 · ส่วนงานในเทอร์มินัลซึ่งเกี่ยวกับการใช้งานร่วมกับ Claude Code โดยตรง Terminal Bench 2.1 มันทำได้ 81.0 ตามหลัง Claude Opus 4.8 ที่ 85 อยู่นิดหน่อย
แต่พอเป็นงานแก้บั๊กในโปรเจกต์จริงอย่าง SWE-bench Pro มันได้ 62.1 ตามหลัง Claude Opus 4.8 ที่ 69.2 อยู่พอควร · แปลว่าถ้าเอามาทำงานเขียนโค้ดหนัก ๆ ในโปรเจกต์ใหญ่ ฝีมือมันยังเป็นรอง ภาพรวมคือโมเดลที่ทำได้ดีในหลายด้าน คุ้มกับคำว่าฟรี แต่ยังไม่ใช่ตัวที่จะมาแทนโมเดลเสียเงินระดับท็อปได้ทุกงาน
เริ่มใช้จริงต้องทำอะไรบ้าง
ขั้นแรกที่ชัดเจนคือติดตั้ง extension · เปิดเทอร์มินัลแล้วพิมพ์คำสั่งเดียว
hf extensions install hf-claudeหลังจากนั้นให้ชี้ Claude Code ไปที่โมเดล zai-org/GLM-5.2 บน HF Inference · ตรงนี้ต้องพูดให้ตรงอีกครั้ง · ขั้นตอนตั้งค่าแบบละเอียด เช่น ต้องแก้ค่าไหน รองรับ Claude Code เวอร์ชันใด มีข้อจำกัดอะไร แหล่งข้อมูลที่ใช้ยังบอกไว้ไม่ครบ จึงควรเปิดดูหน้าเอกสารทางการของ extension ก่อนลงมือ ดีกว่าทำตามที่จำ ๆ มา
ส่วนใครที่อยากรันโมเดลเองบนเครื่องหรือบนเซิร์ฟเวอร์ของตัวเอง GLM-5.2 ทำได้หลายทาง · รันผ่าน Transformers ได้ตรง ๆ หรือถ้าอยากได้ความเร็วพอสำหรับให้บริการจริงก็มี vLLM กับ SGLang ให้เลือก · แต่สำหรับคนที่เป้าหมายแค่ "ลดค่าโมเดลของ Claude Code" ไม่จำเป็นต้องไปถึงขั้นตั้งเซิร์ฟเวอร์เอง แค่ต่อผ่าน HF Inference ก็พอ
"ฟรี" ตรงนี้หมายถึงอะไรกันแน่
คำว่าฟรีในเรื่องนี้มีสองชั้น และต้องแยกให้ออกก่อนคาดหวัง
ชั้นแรกคือตัวโมเดล · GLM-5.2 เป็นโอเพนซอร์ส MIT จริง ดาวน์โหลดมารันเองได้ ไม่มีค่าลิขสิทธิ์ ชั้นนี้ฟรีแน่นอน
ชั้นที่สองคือบริการที่รันโมเดลให้ · ถ้าใช้ผ่าน HF Inference แทนที่จะรันเครื่องตัวเอง ส่วนนี้เป็นบริการของ Hugging Face ซึ่งโดยทั่วไปมีโควตาการใช้งาน · แหล่งที่หยิบมาไม่ได้ระบุเงื่อนไขโควตาไว้ชัด จึงไม่ควรเหมาว่าจะใช้ได้ไม่จำกัด · พูดแบบเผื่อไว้ก่อนคือมันช่วย "ลด" ค่าโมเดลลงได้จริงเมื่อเทียบกับการจ่ายเต็มทุกการเรียกใช้ แต่จะถึงขั้น "ฟรีตลอด" หรือไม่ ขึ้นกับโควตาที่ต้องไปอ่านเงื่อนไขจริงอีกที
แยกเครื่องมือออกจากโมเดล แล้วบิลจะอยู่ในมือเรา
ตัวเรื่องจริง ๆ สั้นมาก · @_akhaliq บน X เป็นคนแรก ๆ ที่ออกมาบอกว่า hf-claude ทำงานกับ GLM-5.2 ได้ดี พร้อมคำสั่งติดตั้งบรรทัดเดียว · เท่านั้นเอง แต่สิ่งที่ซ่อนอยู่หลังบรรทัดเดียวนั้นคือการเปลี่ยนวิธีคิด
ตราบใดที่เรามองเครื่องมือ AI กับโมเดลเป็นของชุดเดียวกัน เราก็ต้องจ่ายตามราคาที่เจ้าของชุดนั้นตั้งไว้ · แต่พอแยกสองชั้นนี้ออกจากกันได้ การเลือกโมเดลก็กลายเป็นเรื่องที่เราคุมเองได้ ทั้งเรื่องค่าใช้จ่ายและเรื่องว่าจะให้สมองตัวไหนทำงานให้ · งานเขียนโค้ดในวันนี้ คนที่ได้เปรียบไม่ใช่คนที่จ่ายแพงที่สุด แต่เป็นคนที่รู้ว่าตรงไหนสลับมาใช้ตัวเลือกที่ถูกกว่าได้โดยที่งานยังเดิน
ที่มา: · โพสต์ AK (@_akhaliq) on X จาก @_akhaliq บน X · model card zai-org/GLM-5.2 · Hugging Face จาก Hugging Face



