Claude Mythos ทะลวงระบบองค์กร 32 ขั้นตอนสำเร็จ 30% แต่อย่าเพิ่งตื่นตระหนก

ทุกคนบอกว่า AI เป็นแค่ผู้ช่วยเขียนโค้ด แต่รายงานล่าสุดจากรัฐบาลอังกฤษทำเอาผมแปลกใจมาก เพราะเขาปล่อยให้ AI ตัวใหม่ของ Anthropic ชื่อ Claude Mythos ลองเจาะระบบเครือข่ายองค์กรแบบอัตโนมัติ ผลคือมันทะลวงผ่านด่านทดสอบ 32 ขั้นตอนสำเร็จรวดเดียวจบถึง 3 ใน 10 ครั้ง
เรื่องนี้ไม่ใช่การทดสอบเล่นๆ แต่เป็นการประเมินความเสี่ยงระดับชาติโดย UK AI Safety Institute (AISI) ที่เพิ่งเผยแพร่ข้อมูลออกมาเมื่อวันที่ 13 เมษายน 2026 ลองคิดดูสิว่างานแฮกระดับนี้ ปกติผู้เชี่ยวชาญที่เป็นคนจริงๆ ต้องนั่งหน้าจอกดคำสั่งกันราวๆ 20 ชั่วโมง แต่นี่ AI นั่งรันรวดเดียวจนจบ
เจาะลึกบททดสอบ 32 ขั้นตอน ที่ทิ้งห่างรุ่นเก่าไม่เห็นฝุ่น
บททดสอบที่ AISI เอามาใช้เรียกว่า "The Last Ones" หรือ TLO มันคือการจำลองเครือข่ายองค์กรขนาดใหญ่ที่ตั้งใจทำจุดอ่อนซ่อนไว้ งานของ AI คือต้องเริ่มตั้งแต่สแกนหาช่องโหว่ เจาะเข้ามา ฝังตัว แอบขโมยข้อมูล และยึดสิทธิ์ผู้ดูแลระบบของทั้งเครือข่ายรวม 32 ขั้นตอน
โมเดลรุ่นท็อปก่อนหน้านี้อย่าง Claude Opus 4.6 ทำได้เฉลี่ยแค่ 16 ขั้นตอนก็ไปต่อไม่เป็นแล้ว แต่ Mythos ไปได้ไกลถึง 22 ขั้นตอนโดยเฉลี่ย และที่น่าตกใจคือมี 3 ครั้งที่มันไปจนสุดทางได้สำเร็จ ผมเห็นตัวเลข 73% สำหรับความสำเร็จในด่าน Capture-the-Flag ระดับผู้เชี่ยวชาญแล้วงงมาก เพราะย้อนไปก่อนเดือนเมษายน 2025 ยังไม่มีโมเดลไหนเลยที่ผ่านด่านระดับนี้ได้แม้แต่ครั้งเดียว
ส่วนฝั่ง Anthropic เองก็มีบล็อก Red Team ที่ออกมารายงานผลการทดสอบตัวเองด้วย ตัวเลขที่ทำเอาผมโคตรอึ้งคือสถิติการเจาะระบบ JavaScript ของ Firefox ในขณะที่ Opus 4.6 เจาะสำเร็จแค่ 2 ครั้งจากหลายร้อยความพยายาม Mythos กลับเจาะทะลุไปถึง 181 ครั้ง เรียกว่ามันเก่งกระโดดข้ามรุ่นไปไกลมาก
ระบบที่ให้เจาะไม่มีคนเฝ้านะ
อ่านมาถึงตรงนี้หลายคนอาจจะเริ่มกังวลแล้วใช่ไหม ใจเย็นก่อนครับ เพราะ AISI เขาเขียนหมายเหตุไว้ชัดเจนเลยว่า สภาพแวดล้อมที่ใช้ทดสอบนี้ไม่มีระบบป้องกันที่โลกความจริงเขามีกัน
เปรียบเทียบง่ายๆ คือเหมือนเราสร้างหุ่นยนต์นักสะเดาะกุญแจที่เก่งมากๆ ขึ้นมาตัวหนึ่ง แล้วเอาไปทดสอบกับบ้านที่ไม่ได้ล็อกหน้าต่าง ไม่มีกล้องวงจรปิด และไม่มีรปภ.เดินตรวจ แน่นอนว่าหุ่นยนต์มันก็เดินเข้าออกสบายใจ ในการทดสอบนี้ไม่มีระบบตรวจจับความผิดปกติ ไม่มีทีมความปลอดภัยคอยบล็อก IP และไม่มีการลงโทษถ้า AI ทำพลาดแล้วเกิดเสียงแจ้งเตือนดังขึ้นมา
อีกเรื่องคือ AISI เอาไปทดสอบกับระบบหอทำความเย็นที่เป็นระบบควบคุมเครื่องจักรทางกายภาพด้วย ปรากฏว่า Mythos ไปไม่รอดครับ แต่มันไม่ได้ตกม้าตายเพราะเจาะเครื่องจักรไม่ได้นะ มันไปติดตรงด่านเครือข่ายไอทีธรรมดา สรุปก็คือ Mythos เก่งมากในการหาวิธีเจาะระบบที่อ่อนแอและไม่มีคนเฝ้า แต่เรายังไม่รู้เลยว่าถ้าไปเจอระบบที่มีคนคอยมอนิเตอร์ตลอดเวลา มันจะเอาตัวรอดได้ไหม
ขุดเจอบั๊กอายุ 27 ปีในซอฟต์แวร์ระดับโลก
ถึงแม้จะเจาะระบบที่มีคนเฝ้าไม่ได้ แต่ความสามารถในการอ่านโค้ดของ Mythos คือของจริง การทดสอบแบบ Fuzzing ซึ่งเป็นการรัวส่งข้อมูลมั่วๆ เข้าไปในโปรแกรมเพื่อดูว่ามันจะพังไหม Mythos ทำระบบล่มไปถึง 595 ครั้ง แซงหน้ารุ่นพี่ที่ทำได้แค่หลักหน่วย
ที่ผมประทับใจคือมันไปขุดเจอบั๊กที่ซ่อนอยู่ใน OpenBSD มานานถึง 27 ปี และบั๊กในระบบวิดีโอ FFmpeg ที่ซ่อนอยู่ 16 ปี บั๊กพวกนี้รอดสายตาโปรแกรมเมอร์ทั่วโลกมาเป็นสิบปี การรัน AI ทดสอบ OpenBSD จนเจอบั๊กนี้ Anthropic จ่ายค่ารันโมเดลไปไม่ถึง 20,000 ดอลลาร์ ซึ่งถูกกว่าจ้างทีมความปลอดภัยมานั่งไล่ดูโค้ดเป็นเดือนๆ เยอะมาก
เรื่องนี้คนในวงการเขายืนยันกันเพียบ คุณ Greg Kroah-Hartman คนดูแล Linux kernel บอกว่าจู่ๆ ก็มีรายงานช่องโหว่ของจริงส่งเข้ามาเต็มไปหมด ส่วนคุณ Daniel Stenberg คนทำโปรแกรม curl ก็บอกว่าจากแต่ก่อนที่คนใช้ AI ส่งรายงานขยะมาให้ปวดหัว ตอนนี้กลายเป็นคลื่นยักษ์แห่งรายงานช่องโหว่ที่ใช้งานได้จริงไปแล้ว ซึ่ง Simon Willison ก็เขียนวิเคราะห์เรื่องนี้ไว้ครบถ้วนมาก
แจกเครดิต 100 ล้านดอลลาร์ ให้ฝั่งป้องกันตั้งตัว
Anthropic รู้ดีว่าถ้าปล่อย Mythos ออกมาให้ใช้งานสาธารณะ โลกไซเบอร์คงวุ่นวายแน่ๆ เลย เขาจึงตัดสินใจไม่เปิดให้ใช้งานทั่วไป แต่เลือกทำแคมเปญชื่อ Project Glasswing แทน
ไอเดียนี้สมเหตุสมผลดีเนอะ คือแทนที่จะเอาเครื่องมือไปวางขายให้ทุกคน เขาเลือกที่จะมอบเครดิตใช้งานมูลค่า 100 ล้านดอลลาร์ และเงินสดอีก 4 ล้านดอลลาร์ ให้องค์กรโอเพนซอร์สและพาร์ตเนอร์อย่าง AWS, Apple, Microsoft, Google และ Linux Foundation เพื่อให้ยักษ์ใหญ่เหล่านี้เอา AI ไปสแกนหาช่องโหว่ในระบบตัวเอง แล้วจัดการแพตช์ปิดรูรั่วก่อนที่แฮกเกอร์จะมีของแบบเดียวกันใช้
คุณ Thomas Ptacek นักวิจัยด้านความปลอดภัยถึงกับบอกว่าวงการค้นหาช่องโหว่มันจบเกมแล้ว เพราะ AI ทำได้เร็วกว่าคนมหาศาล ส่วนคุณ Nicholas Carlini ก็บอกว่าช่วงไม่กี่สัปดาห์ที่ผ่านมา เขาเจอบั๊กเยอะกว่าที่เคยหามาทั้งชีวิตรวมกันเสียอีก
สิ่งที่เราต้องปรับตัวตั้งแต่วันนี้
สำหรับนักพัฒนาและคนทำงานสายไอที เรื่องนี้เตือนสติเราว่าการปล่อยให้ระบบมีช่องโหว่เดิมๆ ค้างไว้เป็นเรื่องอันตรายสุดๆ เพราะ AI มันสแกนเจอเร็วกว่าคนมาก
สิ่งที่เราต้องทำคือกลับไปทำพื้นฐานให้แน่นตามที่ AISI แนะนำ ไม่ว่าจะเป็นการอัปเดตระบบสม่ำเสมอ จัดการสิทธิ์การเข้าถึงให้ดี และที่สำคัญคือต้องเก็บ log ให้ละเอียด เพราะต่อให้ AI เจาะเข้ามาได้ ถ้าเรามีระบบตรวจจับที่ดี มันก็ยังทำงานได้ยากอยู่ดี
ยุคนี้ไม่ได้แข่งกันว่าใครหาช่องโหว่เก่งกว่ากันแล้วล่ะ แต่แข่งกันว่าใครจะแพตช์ระบบได้ไวกว่ากันต่างหาก
แหล่งอ้างอิง
บทความที่เกี่ยวข้อง

Claude Code Desktop ยกเครื่องใหม่หมด: Multi-session, Preview, Diff Review และอีกเพียบ
Claude Code เพิ่งยกเครื่อง Desktop app ครั้งใหญ่ที่สุดตั้งแต่เปิดตัวมา จากเดิมที่เป็นแค่ terminal ใน GUI wrapper ตอนนี้มันกลายเป็น IDE เต็มตัวที่ออกแบบมาให้คนเขียนโค้ดกับ AI ได้แบบไม่ต้องสลับหน้าจอไปมาอีกแล้ว ผมใช้ Claude Code มาตั้งแต่ยังเป็น CLI อย่างเดียว พอเห็นอัพเดทรอบนี้แล้วต้องบอกว่ามันเปลี่ยนไปเยอะจริงๆ ทั้ง multi-session, terminal ในตัว, preview หน้าเว็บได้เลย, diff review แบบ visual, ไปจนถึงสั่งงานจากมือถือ วันนี้ผมจะพาไล่ดูว่ามีอะไรใหม่บ้างและมันเปลี่ยนวิธีทำงานของเรายังไง จาก term



ความคิดเห็น
ยังไม่มีความคิดเห็น เป็นคนแรกที่แสดงความเห็น!