ลองนึกภาพเช้าวันจันทร์ ตื่นมาเปิดมือถือแล้วเจอเมลค้างเป็นสิบฉบับ บางอันต้องตอบด่วน บางอันแค่อ่านผ่าน บางอันชนกับนัดในปฏิทินที่ลืมไปแล้ว กว่าจะนั่งไล่ทีละฉบับ เวลาตอนเช้าก็หมดไปครึ่งหนึ่ง

คำถามที่น่าคิดคือ ถ้ามีผู้ช่วยจัดเมลให้เสร็จก่อนตื่น บอกว่าฉบับไหนควรตอบ ฉบับไหนทิ้งได้ ร่างคำตอบรอไว้ให้ แล้วแก้ปฏิทินที่ชนกันให้เรียบร้อย จะเป็นยังไง นี่คือสิ่งที่ Google เพิ่งปล่อยออกมาในชื่อ Gemini Spark เป็น agent (ผู้ช่วยอัตโนมัติที่ทำงานเองได้) ที่ฝังอยู่ใน Gemini จุดที่ทำให้มันน่าสนใจสำหรับคนทำงานทั่วไป ไม่ใช่แค่สายเขียนโปรแกรม คือเปิดใช้ง่ายเหมือนเปิดสวิตช์ ไม่ต้องตั้งค่าซับซ้อนแบบที่ AI agent ส่วนใหญ่เคยเป็น

ความต่างข้อเดียวที่ทำให้มันเป็นเอเจนต์ ไม่ใช่แชตบอต

ถ้าจะเข้าใจ Spark ให้ลึกจริง ต้องเริ่มจากความต่างข้อเดียวก่อน เพราะมันเป็นแกนของทุกอย่างที่ตามมา

ในหน้าแชตปกติของ Gemini สิ่งที่เกิดขึ้นคือ "การสนทนา" ที่รอให้คนถามก่อนเสมอ พิมพ์คำถามเข้าไป มันตอบกลับมา จบที่ตรงนั้น นี่คือลักษณะของแชตบอต ตอบเก่ง แต่รอคำสั่งทีละครั้ง

ส่วนใน Spark สิ่งที่เกิดขึ้นเรียกว่า "งาน" หรือ task มันลงมือจัดการให้เองแบบหลายขั้นตอน ไม่ได้แค่ตอบคำถาม แต่ทำงานข้ามแอปที่เชื่อมไว้ทั้งหมด ทั้ง Gmail, Google Calendar, Google Drive ไปจนถึง Google Search นี่แหละคือสิ่งที่ทำให้มันเป็น AI agent ไม่ใช่แชตบอตธรรมดา

เปรียบเทียบให้เห็นภาพง่ายที่สุด แชตบอตเหมือนเพื่อนร่วมงานที่พูดต่อเมื่อถาม ถามอะไรก็ตอบ แต่ไม่ถามก็ไม่ขยับ ส่วนเอเจนต์เหมือนผู้ช่วยที่รับงานไปทำ มอบงานให้ชิ้นหนึ่งแล้วมันไปจัดการเอง กลับมาบอกตอนเสร็จ ความต่างไม่ได้อยู่ที่ว่าตัวไหนฉลาดกว่า แต่อยู่ที่บทบาท ตัวหนึ่งรอตอบ อีกตัวหนึ่งรับไปทำ

เปรียบเทียบแชตบอตที่รอเราถามกับเอเจนต์ที่รับงานไปทำเองข้ามแอป

สามชิ้นส่วนที่ต้องรู้ก่อนเริ่มใช้จริง

พอเข้าใจว่ามันคืออะไรแล้ว สิ่งที่ทำให้ Spark ใช้งานได้จริงมีอยู่สามชิ้นส่วน ถ้าจับสามตัวนี้ได้ ก็ใช้เป็นเกือบทั้งหมด

ชิ้นแรกคือ Tasks หรือ "งาน" ที่สั่งให้ Spark ทำ เช่น สั่งว่า "ไล่ดูเมลที่เข้ามาใน 12 ชั่วโมงที่ผ่านมา บอกหน่อยว่าฉบับไหนต้องตอบ ฉบับไหนข้ามได้ ถ้ามีอะไรชนปฏิทินก็จัดให้ และถ้าฉบับไหนต้องตอบ ช่วยร่างคำตอบไว้ให้ด้วย" สั่งครั้งเดียวแบบนี้ มันจะเริ่มทำงานเป็นขั้น ๆ จุดที่ดีคือ ระหว่างที่มันทำงาน คนสั่งจะเห็นทุกขั้นตอนแบบเรียลไทม์ ตั้งแต่ไล่หาช่วงเวลา เปิดดู Gmail ไปจนถึงเช็กปฏิทิน ไม่ใช่กล่องดำที่ทำอะไรอยู่ก็ไม่รู้

ชิ้นที่สองคือ Skills ตรงนี้หมายถึง "workflow ที่เซฟไว้" สมมติว่างานจัดเมลตอนเช้าเป็นงานที่ต้องทำซ้ำทุกวัน แทนที่จะพิมพ์คำสั่งยาว ๆ อธิบายใหม่ทุกครั้ง ก็เซฟมันไว้เป็น skill หนึ่งอัน คราวหน้าแค่บอกว่า "จัดเมลให้หน่อย" มันก็ทำตาม workflow เดิมทันที วิธีสร้าง skill มีสามทาง ทางแรกคืออัปโหลดไฟล์ข้อความที่เขียนคำสั่งไว้ ทางที่สองคือตั้งค่าเองทีละขั้น ทางที่ง่ายที่สุดคือบอก Gemini ตรง ๆ ว่า "เปลี่ยนงานนี้ให้เป็น skill ที่จะรันทุกครั้งที่สั่งให้จัดเมล" ไม่กี่วินาทีมันก็สร้าง skill ให้เสร็จ เช่น ตั้งชื่อว่า inbox manager เวลาจะเรียกใช้ก็แค่เปิดงานใหม่แล้วพิมพ์ / รายชื่อ skill ที่เซฟไว้ก็จะขึ้นมาให้เลือก

ชิ้นที่สามคือ Schedules หรือ "ตัวตั้งเวลา/ทริกเกอร์" สำหรับให้ skill ทำงานเองโดยไม่ต้องสั่ง ตั้งได้สองแบบ แบบตามเวลา เช่น "ทุกวันตอนตีห้าให้จัดเมลให้" หรือแบบตามเหตุการณ์ เช่น "พอมีเมลเข้ามาให้จัดเลย" ผลคือ พอตื่นมาตอนเช้า เมลก็จัดเรียบร้อยรอไว้แล้ว โดยไม่ต้องไปสั่งอะไรเลย

จะเห็นว่าสามชิ้นนี้ต่อกันเป็นบันได งานที่ทำครั้งเดียว (Tasks) เซฟไว้ใช้ซ้ำได้ (Skills) แล้วตั้งให้ทำเองอัตโนมัติ (Schedules) ยิ่งขึ้นบันไดไปทีละขั้น กระบวนการก็ยิ่งอัตโนมัติมากขึ้น

สามชิ้นส่วนของ Gemini Spark ไล่จาก Tasks ไป Skills ไป Schedules

มันไม่ได้ลงมือเองมั่ว ๆ ทำอะไรสำคัญก็ขออนุญาตก่อน

ตรงนี้คือจุดที่คนไทยหลายคนน่าจะกังวลที่สุด การให้ AI เข้าถึงเมลกับปฏิทินของตัวเอง แล้วถ้ามันลบนัดสำคัญทิ้ง หรือส่งเมลผิดออกไปล่ะ จะทำยังไง

Spark ออกแบบมาให้คนยังคุมอยู่ตลอด ก่อนที่มันจะทำอะไรที่มีผลจริง เช่น ลบนัดในปฏิทิน เพิ่มนัดใหม่ หรือส่งคำตอบออกไป มันจะหยุดขออนุญาตก่อนเสมอ ยกตัวอย่างจากงานจัดเมล ถ้ามันเจอว่ามีคนยกเลิกนัดที่อยู่ในปฏิทิน มันจะไม่ลบเองทันที แต่จะถามก่อนว่า "จะให้ลบนัดนี้ไหม" รอให้กดยืนยันแล้วค่อยลบ เช่นเดียวกับการเพิ่มนัดใหม่ที่อีกฝ่ายเสนอเวลามา มันก็ถามก่อนว่าจะให้ใส่ลงปฏิทินไหม

ที่สำคัญคือ คำตอบเมลที่มันร่างให้เป็นแค่ "ร่าง" ไม่ใช่ส่งออกไปเอง คนยังต้องอ่านก่อน ถ้าพอใจค่อยกดส่ง พูดง่าย ๆ คือจะไม่เกิดเรื่องที่ย้อนกลับไม่ได้ โดยที่เจ้าของไม่ได้กดอนุญาต กลไกนี้เองที่ทำให้การมอบงานละเอียดอ่อนอย่างเมลกับปฏิทินให้ AI ทำ ยังรู้สึกปลอดภัยพอจะลองใช้จริง

จุดนี้ก็เป็นข้อที่ต้องเข้าใจให้ตรงด้วย Spark ไม่ใช่ระบบที่ทำงานเองทั้งหมดแบบปล่อยมือร้อยเปอร์เซ็นต์ ในงานส่วนที่กระทบของจริง มันยังต้องการให้คนกดอนุมัติเป็นจังหวะ ซึ่งมองอีกมุมก็เป็นข้อดี เพราะคนยังเป็นคนตัดสินใจขั้นสุดท้าย ไม่ใช่ปล่อยให้ AI ตัดสินใจแทนทั้งหมด

ยิ่งใช้ ยิ่งรู้จักเรา

อีกชิ้นที่ทำให้ Spark ต่างจากเครื่องมือทั่วไป คือมันจำเรื่องของเราได้ ในหน้าตั้งค่ามีตัวเลือกชื่อ Memory ถ้าเปิดไว้ Gemini จะเรียนรู้จากบทสนทนาเก่าๆ เพื่อทำความเข้าใจเจ้าของมากขึ้น ยิ่งใช้บ่อย มันก็ยิ่งรู้จักเรามากขึ้นเรื่อยๆ

ตัวอย่างหนึ่งที่เห็นภาพชัดคือ งานที่สั่งให้ Spark จัดแผนเที่ยวหนึ่งวัน มันใส่รายละเอียดมื้ออาหารมาให้ โดยรู้ว่าเจ้าของกินมังสวิรัติแบบกินปลาได้ (pescatarian) ทั้งที่ไม่เคยบอกเรื่องนี้กับ Spark ตรง ๆ เลย มันรู้จากบทสนทนาก่อนหน้าใน Gemini นี่คือสิ่งที่ Memory ทำได้ มันไม่ได้เริ่มจากศูนย์ทุกครั้ง แต่สะสมความเข้าใจเกี่ยวกับเจ้าของไว้ แล้วเอามาใช้ให้ผลลัพธ์ตรงกับตัวเรามากขึ้น

เปิดใช้จริง แค่สามสวิตช์

ข่าวดีสำหรับคนที่กลัวเรื่องการตั้งค่า คือ Spark เปิดใช้ง่ายกว่าที่คิดมาก ทั้งหมดมีแค่สามสวิตช์

ขั้นตอนเปิดใช้: กดไอคอนรูปเฟือง (Settings) ตรงมุมล่างซ้าย แล้วเข้าไปที่ Personal Intelligence จากนั้นทำสามอย่าง: หนึ่ง เปิด Memory ให้เป็น ON สอง เข้าไปที่ Connected apps สาม เปิด Google Workspace ให้เป็น ON เท่านี้ก็พร้อมใช้งานแล้ว

เบื้องหลังยังมีกลไกทำงานอีกเยอะ แต่คนใช้ไม่ต้องยุ่งกับมัน Spark ทำงานบน cloud ทั้งหมด เปิดสวิตช์แล้วก็พร้อมใช้ได้เลย และเพราะรันบน cloud จึงไม่จำเป็นต้องเปิดคอมพิวเตอร์ค้างไว้ Spark ก็ทำงานต่อได้ นอกจากนี้ยังเรียกใช้ผ่านแอป Gemini บนมือถือได้ด้วย จะเริ่มงานใหม่หรือดูสถานะงานที่สั่งไว้ระหว่างเดินทางก็ได้ ไม่ต้องนั่งอยู่หน้าโน้ตบุ๊ก

เอาไปใช้กับงานจริงได้แบบไหน

เข้าใจกลไกแล้ว คำถามต่อไปที่ยากกว่าคือ จะเอา Spark ไปใช้กับงานอะไรดี ลองดูสามแบบที่จับต้องได้สำหรับคนทำงานทั่วไป

แบบแรกคือจัดเมลตอนเช้า สั่งทีเดียวให้มันไล่เมลที่เข้ามา จัดลำดับความสำคัญ ร่างคำตอบให้ฉบับที่ต้องตอบ และจัดปฏิทินที่ชนกันให้เรียบร้อย ถ้าตั้งเป็น schedule ไว้ตอนตีห้า เช้ามาเมลก็พร้อมแล้ว เหมาะกับคนที่เปิดกล่องเมลตอนเช้าแล้วเจอเมลท่วมทุกวัน

แบบที่สองคือรวมข้อมูลที่กระจัดกระจายให้เป็นชิ้นเดียว สมมติว่ามีไอเดียจดไว้ใน Google Doc หลายจุด มีเมลที่เกี่ยวกับเรื่องเดียวกันอีกฉบับ และมีเว็บไซต์อ้างอิงอีกหนึ่งลิงก์ สั่งให้ Spark รวบรวมทั้งหมดมาเรียบเรียงเป็นแผนหนึ่งวันได้ มันจะไล่ดึงข้อมูลจาก Drive จาก Gmail แล้วประกอบออกมาเป็นแผนเดียวที่ใช้ได้จริง งานแบบนี้ปกติต้องเปิดหลายแท็บแล้วไล่ก๊อปทีละอัน

แบบที่สามคืองานหลายขั้นที่จบในคำสั่งเดียว เช่น สั่งให้ไปค้นข้อมูล เขียนเป็นรายงาน สร้าง Google Slides แล้วร่างเมลส่งสไลด์นั้นให้อีกบัญชีหนึ่ง ทั้งค้นคว้า ดึงข้อมูลจาก Drive สร้างชิ้นงานใหม่ แล้วร่างเมลส่งต่อ ทุกอย่างอยู่ในงานเดียว นี่แหละคือสิ่งที่แยกเอเจนต์ออกจากแชตบอตทั่วไปอย่างชัดเจน เพราะทำได้หลายขั้นต่อเนื่องโดยไม่ต้องคอยป้อนทีละขั้นตอน

สิ่งที่เปลี่ยนไป

จุดที่น่าคิดที่สุดของ Gemini Spark อาจไม่ใช่ว่ามันทำอะไรได้บ้าง แต่อยู่ที่ว่าใครใช้มันได้ ที่ผ่านมาคำว่า AI agent เป็นเรื่องของสายเขียนโปรแกรมที่ต้องตั้งค่ายุ่งยาก แต่พอมันกลายเป็นสวิตช์สามตัวที่เปิดได้ในหน้าตั้งค่า คนทำงานออฟฟิศ ครีเอเตอร์ เจ้าของธุรกิจ หรือมือใหม่ที่ไม่เคยแตะโค้ดเลย ก็มอบงานจุกจิกประจำวันให้มันทำแทนได้ โดยยังกดอนุมัติทุกอย่างที่สำคัญด้วยตัวเอง สิ่งที่เปลี่ยนคือ agent ไม่ใช่ศัพท์ของ dev อีกต่อไป แต่กลายเป็นเครื่องมือที่คนทั่วไปเปิดใช้ได้แล้ว