xAI เปิดตัว Voice Agent Builder · สร้าง AI รับสายเสียงเหมือนคนได้เอง ไม่ต้องเขียนโค้ด นาทีละ $0.05
xAI เปิดตัว Voice Agent Builder แพลตฟอร์มสำหรับสร้าง AI รับสายเสียงเหมือนคน โดยไม่ต้องเขียนโค้ดสักบรรทัด ค่าบริการนาทีละ $0.05 แถมเบอร์โทรฟรี แต่ธุรกิจไทยยังต้องทดสอบเสียงภาษาไทยเองก่อนใช้จริง

xAI เพิ่งเปิดตัว Voice Agent Builder แพลตฟอร์มที่ให้เราสร้าง AI เสียงเหมือนคนจริงไว้เป็น "พนักงานรับสาย" ได้เอง โดยไม่ต้องเขียนโค้ดสักบรรทัด เบื้องหลังเสียงคือ Grok Voice ระบบสนทนาด้วยเสียงของ xAI เอง ส่วนค่าบริการอยู่ที่แค่นาทีละ $0.05 (ราว 1.7-1.8 บาท)
จุดที่น่าสนใจคือ มันไม่ได้ทำมาเพื่อทีมพัฒนา แต่ทำมาเพื่อเจ้าของธุรกิจ ร้านเล็ก คลินิก ร้านอาหาร หรือใครก็ตามที่มีลูกค้าโทรเข้ามาแล้วรับไม่ทัน ตัวระบบตั้งค่าได้ด้วยการลากวางบนเว็บ และสมัครเสร็จจะได้เบอร์โทรฟรี 1 เบอร์ไว้เริ่มต้น บัญชีทางการ @xai ทวีตเปิดตัวสั้นๆ ว่านี่คือแพลตฟอร์มไม่ต้องเขียนโค้ดสำหรับสร้าง voice agent เสียงเหมือนคน ใช้ได้ตั้งแต่วันนี้ที่ $0.05 ต่อนาที ส่วนหน้าเว็บยังอ้างว่าตั้งค่าจนใช้งานได้จริงใช้เวลาไม่ถึง 2 นาที
สายที่รับไม่ทัน คือลูกค้าที่หลุดมือ
ร้านเล็กเจอปัญหาเดียวกันแทบทุกที่ ลูกค้าโทรมาตอนปิดร้าน หรือโทรมาช่วงที่ยุ่งจนไม่มีใครว่างรับ สายก็หลุดไปเงียบๆ ทุกสายที่พลาดมักหมายถึงออเดอร์หรือยอดจองที่หายไปด้วย
ทางแก้แบบเดิมคือจ้างคนมานั่งรับสาย หรือใช้บริการคอลเซ็นเตอร์ ซึ่งต้นทุนสูงและไม่คุ้มถ้าไม่ได้มีสายเข้าเยอะทุกวัน ที่ผ่านมาหลายคนคิดว่าถ้าจะทำ AI มารับสายแทน ต้องมีทีมพัฒนาเขียนระบบเอง พอคิดแบบนั้นก็เลยไม่ได้เริ่มสักที
จุดที่ Voice Agent Builder เข้ามาเปลี่ยนคือ คนที่ไม่ใช่โปรแกรมเมอร์ก็สร้างเองได้โดยไม่ต้องแตะโค้ด งานที่เคยต้องให้ทีมพัฒนาทำ จึงกลายเป็นงานที่เจ้าของร้านนั่งทำเองในเว็บได้
ต่างจากวิธีทำ AI ที่คุยด้วยเสียงแบบเดิมยังไง

ปกติถ้าจะทำ AI ที่คุยกับลูกค้าด้วยเสียง ต้องเอาสามระบบมาต่อกัน หนึ่งคือระบบแปลงเสียงพูดเป็นข้อความ (speech-to-text) สองคือโมเดลภาษาที่คิดคำตอบ (LLM) และสามคือระบบแปลงข้อความกลับเป็นเสียงพูด (text-to-speech)
ปัญหาคือแต่ละชิ้นมักมาจากคนละเจ้า ต้องเชื่อมระบบเข้าด้วยกันเอง และเมื่อข้อมูลต้องผ่านหลายระบบกว่าจะได้คำตอบ ผลก็คือตอบช้า ทำให้สายเงียบไปชั่วขณะก่อนที่บอทจะเริ่มพูด
Voice Agent Builder รวมสามอย่างนี้ไว้ในชุดเดียว จึงไม่ต้องเชื่อมต่อระบบเองมากเท่าเดิมและช่วยลดความหน่วง xAI อ้างว่าตอบกลับได้ภายในไม่ถึง 1 วินาที และไม่ต้องลดความฉลาดเพื่อแลกกับความเร็วเหมือนบอทเสียงทั่วไป ส่วนจุดที่เขาเน้นคือ เวลาคุยโทรศัพท์จริง ลูกค้ามักพูดไม่เป็นลำดับ ทั้งพูดแทรก จำเลขออเดอร์ได้ครึ่งๆ กลางๆ หรือนึกอะไรได้ก็โพล่งขึ้นมาอีกเรื่อง ตัว agent จึงควรรับมือกับสถานการณ์แบบนี้ได้ ไม่ใช่พังทันทีที่ลูกค้าออกนอกสคริปต์
รวมทุกอย่างที่ต้องใช้มาให้แล้ว
แทนที่จะต้องไปหาระบบทีละชิ้นมาเชื่อมต่อกัน ตัว builder รวบรวมสิ่งที่จำเป็นต้องใช้มาไว้ในที่เดียว แต่ละอย่างมีหน้าที่ชัดเจนในการรับสายลูกค้า
| สิ่งที่ได้มา | ช่วยอะไรเวลารับสายลูกค้า |
|---|---|
| ระบบโทรศัพท์ในตัว | รับสายเข้าและโทรออกได้จริง ไม่ต้องหาระบบโทรศัพท์มาต่อแยกเอง |
| เบอร์โทรฟรี 1 เบอร์ | เริ่มใช้ได้ทันทีโดยไม่ต้องหาเบอร์ หรือจะใช้เบอร์เดิมของร้านที่มีอยู่แล้วก็ได้ |
| Knowledge base | อัปโหลดเอกสารที่มีอยู่แล้ว (ไฟล์ข้อความ Markdown PDF) ให้ AI ดึงไปตอบตามข้อมูลจริงของธุรกิจ |
| เชื่อมต่อเครื่องมือ | ต่อกับ Gmail, Google Calendar, Notion และเชื่อมเข้ากับระบบภายในหรือฐานข้อมูลลูกค้าของร้าน เพื่อให้ AI ลงมือทำงานได้ เช่น เช็กคิว จองเวลา หรือส่งต่อสายให้คนจริง |
| Guardrails | กำหนดขอบเขตที่ AI ห้ามข้าม เพื่อคุมไม่ให้หลุดสคริปต์หรือทำเรื่องเสี่ยง |
| คลังเสียง | เลือกเสียงสำเร็จรูปกว่า 80 เสียง หรือโคลนเสียงแบรนด์ตัวเองจากคลิปเสียงยาวแค่ 2 นาที |
ถ้าเพิ่งเริ่ม ใช้เบอร์ฟรีกับเสียงสำเร็จรูปก็เพียงพอแล้ว ค่อยขยับไปใช้เบอร์เดิมของร้านและโคลนเสียงแบรนด์เมื่อต้องการใช้งานจริงจัง
เรื่อง guardrails น่าจะเป็นสิ่งที่เจ้าของธุรกิจต้องใส่ใจที่สุด บนหน้าเว็บยกตัวอย่างว่า ถ้าลูกค้าถามว่า "ช่วยอ่านเลขบัตรที่บันทึกไว้ให้หน่อย" ตัว agent จะไม่อ่านกลับให้ แต่จะขอยืนยันตัวตนด้วยวิธีอื่นแทน ระบบทำแบบนี้เพราะถือว่านี่เป็นข้อมูลส่วนตัวของลูกค้าที่ห้ามเปิดเผย นอกจากนี้ยังมีมาตรฐานอย่าง SOC 2, HIPAA eligible และ GDPR ช่วยให้ธุรกิจที่ต้องดูแลข้อมูลอ่อนไหว เช่น คลินิก สบายใจขึ้นได้ระดับหนึ่ง
ใครควรใช้ตัวนี้
กลุ่มแรกคือเจ้าของธุรกิจและ SME ที่มีสายเข้าเยอะแต่คนรับไม่พอ use case ที่หน้าเว็บระบุไว้ตรงๆ เป็นงานที่ร้านเจอทุกวัน ทั้งรับสายซัพพอร์ต ปิดการขาย คัดกรองลูกค้าเบื้องต้น รับสายหน้าร้าน และจองคิว ถ้าเป็นงานซ้ำๆ ที่กินเวลาคนทำงาน ก็ให้ agent รับสายเบื้องต้นแทนได้
กลุ่มที่สองคือนักพัฒนาที่อยากได้ voice agent ที่ใช้งานจริงได้เร็วๆ โดยไม่ต้องนั่งต่อสามระบบเข้าด้วยกันเอง สร้างโครงจากตัว builder ก่อน แล้วค่อยต่อ API และ custom MCP เข้าระบบหลังบ้าน รายละเอียดฝั่งนักพัฒนาดูได้ที่ xAI Docs
จุดขายร่วมกันของทั้งสองกลุ่มคือไม่ต้องเขียนโค้ด ทำให้คนที่ไม่ได้เขียนโปรแกรมก็สร้างเองได้ ส่วนคนที่เขียนได้ก็ประหยัดเวลาไปเยอะ
เริ่มสร้างเองได้ในไม่กี่นาที
ถ้าอยากลองด้วยตัวเอง ขั้นตอนคร่าวๆ เป็นแบบนี้ เริ่มจากกดปุ่ม Try It Free บนหน้าเว็บ แล้วสมัครหรือล็อกอินบัญชี xAI เพราะตอนนี้ต้องมีบัญชีก่อนถึงจะเข้าไปสร้างได้จริง
จากนั้นระบบจะถามว่าเราอยากสร้าง agent ไว้ทำอะไร ให้คุณเลือก preset ที่ใกล้กับงานของร้าน ไม่ว่าจะเป็น Customer Support, Sales Associate, Personal Assistant หรือ Custom เพื่อเริ่มจากโครงตั้งต้น
หัวใจของการตั้งค่าอยู่ที่การเขียน playbook ซึ่งก็คือลำดับการคุยที่เขียนเป็นหัวข้อให้ agent ทำตามทุกครั้งที่รับสาย เขียนได้ประมาณนี้
## Greeting
ทักทายลูกค้า ถามว่าโทรมาเรื่องอะไร
## Resolve
ตอบจากข้อมูลใน knowledge base
ถ้าเป็นการจอง ให้เช็คปฏิทินแล้วเสนอเวลาที่ว่าง
## Wrap up
สรุปสิ่งที่จัดการให้ แล้วถามว่ามีอะไรให้ช่วยอีกไหม
พอวางลำดับการคุยเสร็จ ให้อัปโหลดเอกสารของร้านที่มีอยู่แล้วเข้า knowledge base เช่น เมนู ราคา หรือเงื่อนไขบริการ จากนั้นเชื่อมเครื่องมือที่ต้องใช้ แล้วกด Try it live เพื่อคุยทดสอบในเบราว์เซอร์ได้เลย แก้ตรงไหนก็ฟังผลลัพธ์ได้ทันที เมื่อพอใจแล้วค่อยรับเบอร์ฟรีหรือใช้เบอร์เดิม แล้วเปิดใช้งาน
กับดักที่ต้องรู้ก่อนปล่อยให้รับสายลูกค้าจริง

ค่าบริการนาทีละ $0.05 ฟังดูถูก แต่มันสะสมตามปริมาณสาย ลองคิดเล่นๆ ว่าถ้ามี 50 สายต่อวัน สายละ 4 นาที ก็เท่ากับ 200 นาที หรือราว $10 ต่อวัน (ประมาณ 350 บาท) ตกเดือนละหลักหมื่นต้นๆ ยิ่งสายเยอะ ตัวเลขยิ่งพุ่ง ก่อนตัดสินใจควรลองคูณกับปริมาณสายจริงของร้าน แล้วเทียบกับต้นทุนพนักงานดูก่อน
เรื่องภาษาไทยคือจุดที่ธุรกิจไทยต้องระวังที่สุด หน้าเว็บบอกแค่ว่ารองรับ "25+ ภาษา" แต่ไม่ได้ระบุว่ามีภาษาไทย และไม่มีการยืนยันเรื่องนี้ตรงๆ ดังนั้นต้องทดสอบคุณภาพเสียงและความเข้าใจภาษาไทยด้วยตัวเองก่อน อย่าเพิ่งวางใจว่าพูดไทยได้ลื่นจนปล่อยไปคุยกับลูกค้าจริง
อีกอย่างคือมันเพิ่งเปิดตัวและยังอยู่ในช่วง Beta งานที่สำคัญหรือละเอียดอ่อนควรทดสอบให้พอก่อนปล่อยให้ agent รับหน้าที่นี้ ส่วนหน้า x.ai/voice กับตัว builder ต้องล็อกอินบัญชี xAI ก่อนถึงจะเข้าไปลองสร้างได้ ไม่ใช่กดเข้าไปเล่นได้เลยทันที
กำแพงเดิมพังไปแล้ว เหลือแค่ความไว้ใจ
สิ่งที่เคยกั้นไม่ให้ร้านเล็กมีระบบ AI รับสายของตัวเองคือโค้ด และตอนนี้กำแพงนั้นหายไปแล้ว คำถามที่เหลือไม่ใช่ "ทำเป็นไหม" อีกต่อไป แต่เป็น "ทดสอบมามากพอจนกล้าให้มันรับสายแรกจากลูกค้าจริงหรือยัง"
ที่มา:
- หน้าโปรดักต์ Voice Agent Builder จาก x.ai
- ทวีตประกาศเปิดตัวจาก @xai



