$ loading

$ loading ~/vibecoding

$ cat blog/hf-claude-glm.md

ต่อ Claude Code เข้ากับ GLM-5.2 ผ่าน hf-claude · ใช้โมเดลโอเพนซอร์สฟรีบน Hugging Face แทนการจ่ายค่าโมเดล

hf-claude คือ extension ของ Hugging Face ที่ทำให้ Claude Code ใช้โมเดลโอเพนซอร์สบน HF Inference ได้ ตัวอย่างที่เพิ่งมีคนเทสต์แล้วเข้ากันดีคือ GLM-5.2 โมเดล MIT ฟรี · เป็นทางเลือกให้คนที่ชอบ Claude Code แต่ติดเรื่องค่าโมเดล ได้ใช้เครื่องมือเดิมโดยไม่ต้องผูกกับค่ายเดียว

25 มิถุนายน 2569 · 7 นาที

ต่อ Claude Code เข้ากับ GLM-5.2 ผ่าน hf-claude · ใช้โมเดลโอเพนซอร์สฟรีบน Hugging Face แทนการจ่ายค่าโมเดล — hf-claude ต่อ Claude Code เข้ากับ GLM-5.2 บน Hugging Face

hf-claude คือ extension ตัวเล็ก ๆ ของ Hugging Face เว็บรวมโมเดล AI สำหรับดาวน์โหลดและเรียกใช้ สิ่งที่มันทำคือเปิดทางให้ Claude Code เครื่องมือ AI สำหรับเขียนโค้ดและรันงานในเทอร์มินัล ไปคุยกับโมเดลโอเพนซอร์สบน Hugging Face แทนที่จะผูกอยู่กับโมเดลของ Anthropic บริษัทเจ้าของ Claude อย่างเดียว ติดตั้งด้วยคำสั่งเดียว แล้วชี้ Claude Code ไปที่โมเดลฟรีตัวที่ต้องการได้เลย

ตัวอย่างที่เพิ่งมีคนเทสต์แล้วบอกว่าเข้ากันดีคือ GLM-5.2 โมเดลโอเพนซอร์สสัญชาติจีนที่ใช้ license MIT คือใช้ฟรี ดาวน์โหลดได้ ไม่ติดข้อจำกัดตามภูมิภาค จุดที่น่าสนใจไม่ใช่แค่ "มีโมเดลใหม่" แต่อยู่ที่แนวคิดเบื้องหลังมัน · เครื่องมือ AI กับตัวโมเดลเป็นคนละชั้นกัน และแยกออกจากกันได้ ถ้าชอบหน้าตาและการทำงานของ Claude Code อยู่แล้ว แต่ไม่อยากจ่ายค่าโมเดลทุกครั้งที่เรียกใช้ การต่อมันเข้ากับโมเดลฟรีบน Hugging Face คือทางเลือกที่เพิ่งเปิดขึ้นมา

เครื่องมือ AI กับโมเดล ไม่ใช่ของชิ้นเดียวกัน

แผนภาพการต่อ Claude Code ผ่าน hf-claude แล้วแยกเป็นสองทาง · ทางเดิมคือโมเดลของ Anthropic แบบจ่ายเงิน และทางใหม่คือ HF Inference ที่รัน GLM-5.2 ฟรี — hf-claude อยู่ตรงรอยต่อ · สลับสมองเบื้องหลังจากโมเดลของ Anthropic ไปเป็นโมเดลฟรีบน Hugging Face โดยเครื่องมือยังเป็นตัวเดิม

คนส่วนใหญ่เข้าใจว่า Claude Code มาคู่กับโมเดลของ Anthropic เป็นแพ็กเดียวแยกไม่ได้ · ความจริงคือมันคนละส่วนกัน

Claude Code คือ "เครื่องมือ" ที่นั่งอยู่ในเทอร์มินัล คอยรับคำสั่งภาษาคน แล้วลงมือเขียนไฟล์ แก้โค้ด รันคำสั่งให้ ส่วน "โมเดล" คือสมองที่อยู่เบื้องหลังคอยคิดคำตอบ · ปกติเครื่องมือนี้จะส่งงานไปให้โมเดลของ Anthropic คิด แล้วคิดเงินตามจำนวนที่เรียกใช้

hf-claude เข้ามาเสียบตรงรอยต่อนี้ · มันบอก Claude Code ว่า "ไม่ต้องส่งไปที่เดิม ส่งมาทางนี้แทน" แล้วเปลี่ยนเส้นทางไปที่ HF Inference ซึ่งเป็นบริการรันโมเดลของ Hugging Face · ผลคือยังใช้เครื่องมือเดิมและวิธีทำงานแบบเดิม แต่โมเดลเบื้องหลังเปลี่ยนเป็นโอเพนซอร์สที่เราเลือกเองได้ พอเข้าใจว่าสองชั้นนี้แยกกันได้ คำถามก็เปลี่ยนจาก "ต้องจ่ายเท่าไรถึงจะใช้ได้" เป็น "อยากให้สมองตัวไหนทำงานให้"

GLM-5.2 คือโมเดลฟรีแบบไหน

GLM-5.2 เป็นโมเดลตัวเรือธงของทีม zai-org ที่ออกแบบมาเพื่องานสาย agent ที่ต้องทำต่อเนื่องยาว ๆ โดยเฉพาะงานเขียนโค้ดและงานในเทอร์มินัล จุดที่ทำให้มันน่าลองมีไม่กี่ข้อแต่ชัด

License MIT · ใช้ฟรี เอาไปต่อยอดได้ ไม่มีเงื่อนไขกั้นตามภูมิภาค
Context window 1M tokens · รับข้อมูลเข้าได้ทีละมาก เหมาะกับงานที่ต้องอ่านโค้ดทั้งโปรเจกต์
ออกแบบมาเพื่องาน long-horizon · งานที่ต้องคิดหลายขั้นแล้วทำต่อเนื่องจนจบ ไม่ใช่ตอบคำถามสั้น ๆ ทีละครั้ง

เดือนล่าสุดมีคนดาวน์โหลดไป 57,186 ครั้ง และมี Spaces บน Hugging Face ที่หยิบมันไปใช้แล้วราว 40 ตัว · ตัวเลขนี้บอกว่าไม่ใช่ของที่เพิ่งโผล่มาแล้วไม่มีใครแตะ แต่มีคนเอาไปลองจริงพอสมควร ถ้าอยากชิมก่อนตัดสินใจ ลองคุยกับมันผ่านหน้าเว็บได้เลยที่ HuggingChat โดยไม่ต้องติดตั้งอะไร

เก่งจริงแค่ไหน เทียบกับตัวท็อป

ตารางเทียบคะแนนเบนช์มาร์กของ GLM-5.2 กับ Claude Opus 4.8 ใน 3 สนาม คือ AIME 2026 · Terminal Bench 2.1 · SWE-bench Pro — GLM-5.2 นำด้านคณิตศาสตร์ · สูสีงานเทอร์มินัล · ยังเป็นรองงานแก้บั๊กโปรเจกต์ใหญ่ · คุ้มสำหรับของฟรี แต่ยังแทนตัวท็อปไม่ได้ทุกงาน

ตรงนี้ต้องพูดให้ตรง · GLM-5.2 ไม่ได้ชนะทุกกระดาน แต่บางสนามมันยืนแถวหน้าได้จริง

ในด้านคณิตศาสตร์ระดับยาก AIME 2026 มันทำได้ 99.2 ซึ่งสูงสุดในตาราง แซงทั้ง GPT-5.5 ที่ 98.3 และ Claude Opus 4.8 ที่ 95.7 · ส่วนงานในเทอร์มินัลซึ่งเกี่ยวกับการใช้งานร่วมกับ Claude Code โดยตรง Terminal Bench 2.1 มันทำได้ 81.0 ตามหลัง Claude Opus 4.8 ที่ 85 อยู่นิดหน่อย

แต่พอเป็นงานแก้บั๊กในโปรเจกต์จริงอย่าง SWE-bench Pro มันได้ 62.1 ตามหลัง Claude Opus 4.8 ที่ 69.2 อยู่พอควร · แปลว่าถ้าเอามาทำงานเขียนโค้ดหนัก ๆ ในโปรเจกต์ใหญ่ ฝีมือมันยังเป็นรอง ภาพรวมคือโมเดลที่ทำได้ดีในหลายด้าน คุ้มกับคำว่าฟรี แต่ยังไม่ใช่ตัวที่จะมาแทนโมเดลเสียเงินระดับท็อปได้ทุกงาน

เริ่มใช้จริงต้องทำอะไรบ้าง

ขั้นแรกที่ชัดเจนคือติดตั้ง extension · เปิดเทอร์มินัลแล้วพิมพ์คำสั่งเดียว

hf extensions install hf-claude

หลังจากนั้นให้ชี้ Claude Code ไปที่โมเดล zai-org/GLM-5.2 บน HF Inference · ตรงนี้ต้องพูดให้ตรงอีกครั้ง · ขั้นตอนตั้งค่าแบบละเอียด เช่น ต้องแก้ค่าไหน รองรับ Claude Code เวอร์ชันใด มีข้อจำกัดอะไร แหล่งข้อมูลที่ใช้ยังบอกไว้ไม่ครบ จึงควรเปิดดูหน้าเอกสารทางการของ extension ก่อนลงมือ ดีกว่าทำตามที่จำ ๆ มา

ส่วนใครที่อยากรันโมเดลเองบนเครื่องหรือบนเซิร์ฟเวอร์ของตัวเอง GLM-5.2 ทำได้หลายทาง · รันผ่าน Transformers ได้ตรง ๆ หรือถ้าอยากได้ความเร็วพอสำหรับให้บริการจริงก็มี vLLM กับ SGLang ให้เลือก · แต่สำหรับคนที่เป้าหมายแค่ "ลดค่าโมเดลของ Claude Code" ไม่จำเป็นต้องไปถึงขั้นตั้งเซิร์ฟเวอร์เอง แค่ต่อผ่าน HF Inference ก็พอ

"ฟรี" ตรงนี้หมายถึงอะไรกันแน่

คำว่าฟรีในเรื่องนี้มีสองชั้น และต้องแยกให้ออกก่อนคาดหวัง

ชั้นแรกคือตัวโมเดล · GLM-5.2 เป็นโอเพนซอร์ส MIT จริง ดาวน์โหลดมารันเองได้ ไม่มีค่าลิขสิทธิ์ ชั้นนี้ฟรีแน่นอน

ชั้นที่สองคือบริการที่รันโมเดลให้ · ถ้าใช้ผ่าน HF Inference แทนที่จะรันเครื่องตัวเอง ส่วนนี้เป็นบริการของ Hugging Face ซึ่งโดยทั่วไปมีโควตาการใช้งาน · แหล่งที่หยิบมาไม่ได้ระบุเงื่อนไขโควตาไว้ชัด จึงไม่ควรเหมาว่าจะใช้ได้ไม่จำกัด · พูดแบบเผื่อไว้ก่อนคือมันช่วย "ลด" ค่าโมเดลลงได้จริงเมื่อเทียบกับการจ่ายเต็มทุกการเรียกใช้ แต่จะถึงขั้น "ฟรีตลอด" หรือไม่ ขึ้นกับโควตาที่ต้องไปอ่านเงื่อนไขจริงอีกที

แยกเครื่องมือออกจากโมเดล แล้วบิลจะอยู่ในมือเรา

ตัวเรื่องจริง ๆ สั้นมาก · @_akhaliq บน X เป็นคนแรก ๆ ที่ออกมาบอกว่า hf-claude ทำงานกับ GLM-5.2 ได้ดี พร้อมคำสั่งติดตั้งบรรทัดเดียว · เท่านั้นเอง แต่สิ่งที่ซ่อนอยู่หลังบรรทัดเดียวนั้นคือการเปลี่ยนวิธีคิด

ตราบใดที่เรามองเครื่องมือ AI กับโมเดลเป็นของชุดเดียวกัน เราก็ต้องจ่ายตามราคาที่เจ้าของชุดนั้นตั้งไว้ · แต่พอแยกสองชั้นนี้ออกจากกันได้ การเลือกโมเดลก็กลายเป็นเรื่องที่เราคุมเองได้ ทั้งเรื่องค่าใช้จ่ายและเรื่องว่าจะให้สมองตัวไหนทำงานให้ · งานเขียนโค้ดในวันนี้ คนที่ได้เปรียบไม่ใช่คนที่จ่ายแพงที่สุด แต่เป็นคนที่รู้ว่าตรงไหนสลับมาใช้ตัวเลือกที่ถูกกว่าได้โดยที่งานยังเดิน

ที่มา: · โพสต์ AK (@_akhaliq) on X จาก @_akhaliq บน X · model card zai-org/GLM-5.2 · Hugging Face จาก Hugging Face

tutorialsclaude-code

ทีมผู้เขียน Vibe Coding Thailandvibecodingth

สอนใช้ AI กับงานจริงเป็นภาษาไทย ผ่านบทความ คอร์ส และเครื่องมือที่สร้างด้วย AI

หนังสือแนะนำ

Vibecoding · The Developer's Playbook

Vibecoding with Claude Code: The Developer's Playbook

฿1,200฿2,500ลด 52%

สั่งซื้อหนังสือ

$ tail -f journal.log

อ่านต่อจากเรื่องนี้

TUTORIALS

HALO เครื่องมือฟรีที่เปิดดูข้างใน AI agent ว่าพังตรงไหน รันบนเครื่องตัวเอง

25 มิ.ย. 2569 · 8 นาที

คุยกันต่อในกลุ่ม

ถาม-ตอบเรื่องการใช้ AI กับงานจริง กันทุกวัน · เข้าฟรี

เข้ากลุ่ม Facebook

Vibecoding

฿1,200฿2,500

ซื้อหนังสือ

$ cat blog/[slug].md

$ cat blog/hf-claude-glm.md

ต่อ Claude Code เข้ากับ GLM-5.2 ผ่าน hf-claude · ใช้โมเดลโอเพนซอร์สฟรีบน Hugging Face แทนการจ่ายค่าโมเดล

25 มิถุนายน 2569 · 7 นาที

เครื่องมือ AI กับโมเดล ไม่ใช่ของชิ้นเดียวกัน

GLM-5.2 คือโมเดลฟรีแบบไหน

License MIT · ใช้ฟรี เอาไปต่อยอดได้ ไม่มีเงื่อนไขกั้นตามภูมิภาค
Context window 1M tokens · รับข้อมูลเข้าได้ทีละมาก เหมาะกับงานที่ต้องอ่านโค้ดทั้งโปรเจกต์
ออกแบบมาเพื่องาน long-horizon · งานที่ต้องคิดหลายขั้นแล้วทำต่อเนื่องจนจบ ไม่ใช่ตอบคำถามสั้น ๆ ทีละครั้ง

เก่งจริงแค่ไหน เทียบกับตัวท็อป

เริ่มใช้จริงต้องทำอะไรบ้าง

ขั้นแรกที่ชัดเจนคือติดตั้ง extension · เปิดเทอร์มินัลแล้วพิมพ์คำสั่งเดียว

hf extensions install hf-claude

"ฟรี" ตรงนี้หมายถึงอะไรกันแน่

คำว่าฟรีในเรื่องนี้มีสองชั้น และต้องแยกให้ออกก่อนคาดหวัง

แยกเครื่องมือออกจากโมเดล แล้วบิลจะอยู่ในมือเรา

ที่มา: · โพสต์ AK (@_akhaliq) on X จาก @_akhaliq บน X · model card zai-org/GLM-5.2 · Hugging Face จาก Hugging Face

tutorialsclaude-code

ทีมผู้เขียน Vibe Coding Thailandvibecodingth

หนังสือแนะนำ

Vibecoding · The Developer's Playbook

฿1,200฿2,500ลด 52%

สั่งซื้อหนังสือ

$ tail -f journal.log

อ่านต่อจากเรื่องนี้

TUTORIALS

25 มิ.ย. 2569 · 8 นาที

คุยกันต่อในกลุ่ม

ถาม-ตอบเรื่องการใช้ AI กับงานจริง กันทุกวัน · เข้าฟรี

เข้ากลุ่ม Facebook

Vibecoding

฿1,200฿2,500

ซื้อหนังสือ

ต่อ Claude Code เข้ากับ GLM-5.2 ผ่าน hf-claude · ใช้โมเดลโอเพนซอร์สฟรีบน Hugging Face แทนการจ่ายค่าโมเดล

เครื่องมือ AI กับโมเดล ไม่ใช่ของชิ้นเดียวกัน

GLM-5.2 คือโมเดลฟรีแบบไหน

เก่งจริงแค่ไหน เทียบกับตัวท็อป

เริ่มใช้จริงต้องทำอะไรบ้าง

"ฟรี" ตรงนี้หมายถึงอะไรกันแน่

แยกเครื่องมือออกจากโมเดล แล้วบิลจะอยู่ในมือเรา

Vibecoding · The Developer's Playbook

อ่านต่อจากเรื่องนี้

HALO เครื่องมือฟรีที่เปิดดูข้างใน AI agent ว่าพังตรงไหน รันบนเครื่องตัวเอง

3 โมดูลลับใน Python ที่ติดมาให้แล้ว · collections · itertools · functools เขียนโค้ดสั้นลงโดยไม่ต้อง pip install

Sipcode จัด context ของ Claude Code ให้สะอาด ช่วยลด token ลง 62.6% และทำให้คำตอบแม่นขึ้น

คุยกันต่อในกลุ่ม

ต่อ Claude Code เข้ากับ GLM-5.2 ผ่าน hf-claude · ใช้โมเดลโอเพนซอร์สฟรีบน Hugging Face แทนการจ่ายค่าโมเดล

เครื่องมือ AI กับโมเดล ไม่ใช่ของชิ้นเดียวกัน

GLM-5.2 คือโมเดลฟรีแบบไหน

เก่งจริงแค่ไหน เทียบกับตัวท็อป

เริ่มใช้จริงต้องทำอะไรบ้าง

"ฟรี" ตรงนี้หมายถึงอะไรกันแน่

แยกเครื่องมือออกจากโมเดล แล้วบิลจะอยู่ในมือเรา

Vibecoding · The Developer's Playbook

อ่านต่อจากเรื่องนี้

HALO เครื่องมือฟรีที่เปิดดูข้างใน AI agent ว่าพังตรงไหน รันบนเครื่องตัวเอง

3 โมดูลลับใน Python ที่ติดมาให้แล้ว · collections · itertools · functools เขียนโค้ดสั้นลงโดยไม่ต้อง pip install

Sipcode จัด context ของ Claude Code ให้สะอาด ช่วยลด token ลง 62.6% และทำให้คำตอบแม่นขึ้น

คุยกันต่อในกลุ่ม