Riley Brown ผู้ทำคอนเทนต์สาย AI agent ปล่อยคลิปชื่อ "Learn 95% of Codex in 30 minutes" สรุป OpenAI Codex เป็น 7 ความสามารถหลัก พร้อมตัวอย่างใช้งานจริงครบทุกข้อในเวลาประมาณ 28 นาที 49 วินาที Riley อธิบายว่า Codex ไม่ใช่แค่ chat interface เหมือน ChatGPT หรือ Claude เพราะไฟล์ทุกอย่างที่ผู้ใช้อัปโหลดเข้าไปหรือให้ Codex สร้าง จะเก็บอยู่บนเครื่องของผู้ใช้เอง ไม่ใช่บน cloud จึงเปิดทางให้ agent ทำงานระดับ "knowledge work + coding" ได้ ตั้งแต่จัดใบเสร็จในโฟลเดอร์ Downloads ไปจนถึงสั่งให้คุมเมาส์เปิด Canva แล้วสร้าง presentation ให้
ในคลิป Riley Brown ระบุว่า Codex ทำหน้าที่เป็น "AI agent super app" ที่ครอบคลุมงานหลากหลาย ตั้งแต่สร้าง motion graphics, landing page, mobile app, desktop app, สเปรดชีต Excel ที่มีหลายชาร์ต, Word doc และ presentation ที่ส่งออกไป Canva ได้ ทั้งหมดทำผ่าน interface เดียวกัน บทความนี้สรุปทั้ง 7 ความสามารถเรียงตามลำดับที่ Riley นำเสนอ พร้อมโบนัสฟีเจอร์ที่ Riley เรียกว่า Chronicle

Codex คืออะไร และต่างจาก ChatGPT อย่างไร
ตามที่ Riley Brown อธิบายในคลิป Codex คือ clean interface สำหรับ AI agent ที่ควบคุมคอมพิวเตอร์ของผู้ใช้ได้เต็มที่ หน้าตาดูคล้าย ChatGPT หรือ Claude เพราะเปิด chat ได้เหมือนกัน แต่จุดต่างสำคัญอยู่ที่ "ตำแหน่งของไฟล์" ChatGPT และ Claude เก็บไฟล์ทั้งหมดไว้บน cloud ส่วน Codex เก็บไฟล์ทุกอย่างที่ผู้ใช้อัปโหลดเข้าไปหรือไฟล์ที่ agent สร้างขึ้นไว้บนเครื่องของผู้ใช้เอง ทำให้ agent มีสิทธิ์เข้าถึง file system จริง ไม่ใช่แค่ sandbox
Riley ยกตัวอย่างงานที่ Codex ทำได้ภายในไม่กี่ prompt เช่น สร้าง motion graphics video, landing page พร้อม image ที่ generate ในตัว, game และ 3D simulation, mobile app ที่มีทั้ง front-end + back-end พร้อม professional design, desktop app, สเปรดชีต Excel หลัง research อย่างหนัก, Word doc ที่มีหลายชาร์ต และ presentation ที่ export ไป Canva ได้ จุดเด่นที่ Riley เน้นซ้ำคือ Codex ควบคุมได้ทั้งคอมพิวเตอร์ทั้งเครื่องและ browser จึงกลายเป็น super app สำหรับงานสาย knowledge work หรือ coding ในที่เดียว
ความสามารถที่ 1: Full file access
ความสามารถข้อแรกที่ Riley Brown สาธิตคือ full file access โดย agent ของ Codex มีสิทธิ์เข้าถึงไฟล์ทุกไฟล์บนเครื่องของผู้ใช้ ตัวอย่างที่ Riley ใช้คือโฟลเดอร์ชื่อ receipts to process ในโฟลเดอร์ Downloads ที่มีรูปใบเสร็จราว 60 ใบ Riley พิมพ์ prompt สั้นๆ ให้ Codex หาโฟลเดอร์นี้, OCR ใบเสร็จ, จัดหมวดธุรกรรม และสร้างไฟล์ Excel พร้อม chart ที่ช่วยให้เห็น pattern การใช้จ่าย โดยเลือก model เป็น GPT 5.5 high
หลังใช้เวลาประมาณ 7 นาที agent หา target folder ที่ path users/Riley Brown/downloads/receipts to process และพบใบเสร็จที่ใช้งานได้จริง 53 ใบ จากนั้นสร้างไฟล์ Excel workbook ที่มี dashboard แสดง total spend 25,982 ดอลลาร์ พร้อม category summary, payment summary, monthly trends และ spend by payment method Riley ระบุในคลิปว่าไฟล์ Excel นี้อยู่บนเครื่องจริง ผู้ใช้กดปุ่มดรอปดาวน์แล้วเลือก open in folder เพื่อดูตำแหน่งไฟล์ได้ทันที
Riley แนะนำเพิ่มเติมว่า วิธีจัดระเบียบที่ดีที่สุดสำหรับ Codex คือการ "ทำงานเป็น project" โดยสร้าง project จาก start at existing folder แล้วใช้โฟลเดอร์ Documents เป็นที่อยู่กลาง Riley สาธิตด้วยการสร้าง project ชื่อ seven capabilities ทุก document ที่ agent สร้างใน chat ของ project นั้นจะเก็บลงในโฟลเดอร์ project โดยอัตโนมัติ Riley ชี้เพิ่มว่า Codex อนุญาตให้รัน chat หลายอันพร้อมกันเพื่อ multitask ได้ และผู้ใช้ใช้ syntax @ mention เพื่ออ้างถึงไฟล์ใน project ได้ตรงๆ เช่น @learn เพื่อหยิบ Word doc มาเปลี่ยนเป็น landing page
ความสามารถที่ 2: Persistent memory
ในคลิป Riley Brown ระบุว่า Codex มี memory 2 ประเภท ได้แก่ manual memory และ auto memory โดย manual memory คือเมื่อผู้ใช้บอก agent ให้จำสิ่งใดสิ่งหนึ่งไว้สำหรับอนาคต Riley สาธิตด้วยการปรับ landing page ให้มี left sidebar กับ table of contents จากนั้นบอก agent ว่า "From now on ใช้ format นี้กับ landing page ที่ผู้ใช้สั่งโดยไม่ระบุ style และถ้ามี text content เยอะให้ใช้ table of contents" agent จะเขียนข้อมูลนี้ลงในไฟล์ agents.md Riley อธิบายว่าไฟล์นี้เป็น living document ที่ update ตลอดเวลา และทำหน้าที่เป็น manual memory ของระบบ
ส่วน auto memory เป็น feature ที่ Codex update ให้เอง โดยเก็บไว้ในโฟลเดอร์ Codex/memories Riley ระบุว่าผู้ใช้ "ไม่ควรแตะ" ไฟล์กลุ่มนี้ เพราะ agent มี skill เฉพาะที่คอย update memory เหล่านี้ให้ดีขึ้นเรื่อยๆ สิ่งที่ผู้ใช้ทำได้คือเปิดดูเฉยๆ ทุก 2-3 สัปดาห์ เพื่อรู้ว่า agent สังเกตอะไรเกี่ยวกับผู้ใช้บ้าง และอาจเอาไปสรุปเป็น workflow ของคนอื่นได้ ส่วน manual memory ใน agents.md ผู้ใช้อัปเดตเองได้ทั้งโดยตรงหรือสั่ง agent ให้เขียนให้

ความสามารถที่ 3: Plugins
Riley Brown อธิบายว่า plugin ใน Codex คือ "Codex connections" ที่ทำหน้าที่เป็น bundle เชื่อม agent ของ Codex เข้ากับ external tool, app และ workflow ที่ผู้ใช้ใช้อยู่ ตามที่ Riley นำเสนอ ขณะถ่ายคลิปมี plugin ให้เลือกมากกว่า 100 ตัว และผู้ใช้เพิ่ม Slack กับ Gmail ได้ด้วยการคลิก 2 ครั้ง Gmail plugin มาพร้อม skill ในตัวสองตัวคือ Gmail skill และ inbox triage skill
ตัวอย่างที่ Riley สาธิตคือสร้าง project ชื่อ brand deals แล้วสั่ง agent ให้ดู email ในช่วง 2 สัปดาห์ที่ผ่านมา หาแบรนด์ที่เสนอ paid promotion จากนั้น research ทั้งหมดและจัดลงเป็นตารางพร้อมโน้ตที่เกี่ยวข้อง โดยพิมพ์ @Gmail ใน prompt เพื่ออ้างถึง plugin ผลที่ได้คือ markdown file ที่ไล่รายชื่อบริษัทที่เสนอ sponsor พร้อม research note และข้อสังเกตว่าแต่ละแบรนด์ขออะไรบ้าง Riley ระบุเพิ่มว่า agent ส่ง email กลับจาก account ของผู้ใช้ได้ด้วยวิธีเดียวกับที่อ่าน email เข้ามา
Riley ยังสาธิต Notion plugin ด้วย โดยเปิด chat อีกงานหนึ่งเพื่อเขียน script วิดีโอเรื่อง CLI และ MCP บน Codex เขาสั่งให้ agent ดู Notion ของตัวเอง หา long-form script คุณภาพสูง แล้วเขียน script ใหม่ในหัวข้อนี้พร้อมใช้ Excalidraw diagram skill Riley พบว่าผลลัพธ์ออกมาในสไตล์การเขียนของตัวเอง เพราะ agent อ่าน script เดิมทั้งหมดของ Riley ผ่าน plugin ก่อนเขียนใหม่
ความสามารถที่ 4: Skills
Skill ใน Codex ตามคำอธิบายของ Riley Brown คือ "reusable workflow recipes หรือ SOPs" ที่ agent หยิบไปใช้ซ้ำได้หลายครั้ง โดย skill ทั้งหมดเก็บอยู่ใต้โฟลเดอร์ plugin ใน subfolder ชื่อ skills ความต่างระหว่าง plugin และ skill ในแง่ interaction คือ plugin เรียกผ่าน @ ส่วน skill เรียกผ่าน / (slash)
Riley แนะนำว่ามี 2 วิธีหลักในการสร้าง skill ได้แก่ prompt-to-skill กับ manual workflow + reverse engineer วิธีแรกคือพิมพ์ prompt ตรงๆ ว่า "I want you to create a skill called that does " แล้ว agent จะสร้างไฟล์ instruction ให้ทันที แต่ Riley ชี้ว่าวิธีนี้ยังไม่ดีเท่าวิธีที่สอง
วิธีที่ดีกว่าตามที่ Riley นำเสนอคือทำ manual workflow ก่อน แล้วค่อย reverse engineer โดยให้ agent ทำงานบางอย่างและ iterate ปรับ output ไปมาจน Riley พอใจ จากนั้นจึงพิมพ์ว่า "I'm happy with this output. Turn this into a skill that I can use." agent จะอ่าน workflow ทั้งหมดและสร้างไฟล์ skill.md ที่มีคำสั่งใช้งานครบ ในตัวอย่าง Riley หยิบงาน analyze Gmail หา brand sponsorship มาแปลงเป็น skill ชื่อ brand deal researcher skill.md ที่เก็บคำสั่งใช้ Gmail plugin ไว้ในตัว ทำให้ skill หนึ่ง encapsulate การเรียก plugin หลายตัวได้
Riley เสริมว่า skill เก่าที่ใช้อยู่ก็ปรับให้ดีขึ้นได้ตลอดเวลา เช่น หลังลองใช้ Excalidraw diagram skill แล้วชอบ formatting แบบ container ที่ agent เลือกในรอบนั้น ก็พิมพ์ไปตรงๆ ได้ว่าจากนี้ให้ใช้ format แบบนี้ทุกครั้ง แล้ว agent จะ update skill ให้เอง

ความสามารถที่ 5: Built-in image generation (GPT-image-2)
Codex มี image generation ในตัวที่ใช้ model GPT-image-2 ซึ่ง Riley Brown อธิบายว่าเป็น "image model ที่ดีที่สุดในโลก" ตอนที่ทำคลิป ฟีเจอร์นี้มาในรูปแบบ skill ชื่อ image gen ที่ Codex เปิดไว้เป็น default ผู้ใช้ไม่ต้องกดเปิดเอง
ในการสาธิต Riley สร้าง project ชื่อ content แล้วบอก agent ให้ generate product photo สำหรับบริษัทเสื้อสเวตเตอร์ที่กำลังเริ่มต้น เขาแนบรูปเสื้อสเวตเตอร์ที่ทำเอง และขอ 5 รูปที่มีนางแบบนายแบบหลากหลายเชื้อชาติ แบ่งเป็น 3 รูปที่มีคน 1 คน, 1 รูปที่มี 3 คน และอีก 1 รูปที่มี 5 คน รูปทั้งหมดที่ agent สร้างขึ้นเก็บไว้ในโฟลเดอร์ content ของ project ตามหลัก full file access เดียวกัน
Riley ชี้จุดสำคัญว่า ในแท็บ skills ของ Codex มี skill หลายตัวที่ built-in มาให้เลย ผู้ใช้ไม่ต้องเปิดเอง และ image gen เป็นหนึ่งใน skill เหล่านั้น
ความสามารถที่ 6: Browser use และ Computer use
ความสามารถที่ 6 ที่ Riley Brown สาธิตคือการให้ Codex คุม browser และคอมพิวเตอร์ของผู้ใช้โดยตรง ทั้งสองอย่างเป็น plugin ที่เรียกผ่าน @computeruse และ @browseruse ตามลำดับ
ตัวอย่างที่ Riley ใช้สำหรับ @computeruse คือสั่ง Codex ให้เปิดแอป Canva บนเครื่อง สร้าง presentation ใหม่ แล้วเอารูป product photo 5 ใบที่ generate ในขั้นก่อนหน้ามาวางใส่ slide ละ 1 รูป รวม 5 slide Codex รันคำสั่ง list Mac apps, มองหา Canva, เปิดแอป แล้วเริ่มคลิกใน UI ของ Canva Riley ระบุว่าเห็นเมาส์ของ computer use เลื่อนเองในจอ และไม่ต้องแตะ trackpad ของตัวเองเลย ผลที่ได้คือ presentation 5 slide ที่มีรูปทั้งหมดวางพร้อมแล้ว
สำหรับ @browseruse Riley สาธิตโดยหยิบไฟล์ index.html ที่เป็นแอป quiz มาเปิดใน browser ในตัว Codex แล้วสั่ง agent ว่า "turn this into an app, then test the interface and make sure the buttons and navigation work using @browseruse" จากนั้น agent ควบคุม browser เพื่อคลิก start button, ทดสอบความสมบูรณ์ของ quiz, mark คำตอบที่ถูก, ทดสอบ side panel และไล่ทั้งแอปจนถึงด้านล่าง Riley ระบุเพิ่มว่า อะไรก็ตามที่เปิดใน browser ได้ ก็สั่งให้ @browseruse test ตรงๆ ใน Codex ได้

ความสามารถที่ 7: Automations
ความสามารถข้อที่ 7 ที่ Riley Brown นำเสนอคือ automation ซึ่งสร้างได้ด้วยการคุยกับ Codex โดยตรง Riley หยิบตัวอย่างจาก project brand deals ที่สร้างสเปรดชีต research paid promo brand deals ขึ้นมาแล้วใน workflow ก่อนหน้า และแปลงเป็น skill ไว้แล้วด้วย
จากนั้น Riley พิมพ์คำสั่งว่า "Please do this every single Friday at 9:00 a.m., please, and update this sheet" Codex สร้าง automation ให้ทันที พร้อม UI ที่แสดงว่า automation ใหม่ชื่อ "weekly brand deal sheet updated" จะรันทุกวันศุกร์ตอน 9:00 a.m. โดยใช้ skill ชื่อ brand deal researcher เพื่อสแกน Gmail หา paid promotion sponsorship ที่เข้ามา ผู้ใช้ดูรายละเอียดตารางเวลา, status active, last run และแก้ไข automation จาก UI ได้
Riley ระบุว่า automation เป็นการต่อยอด workflow ใดก็ได้ที่ผู้ใช้สร้างผ่าน skill ให้กลายเป็น recurring task เช่น รายวัน รายชั่วโมง รายสัปดาห์ หรือรายเดือน Codex จึงไม่ใช่แค่ chat tool แบบ on-demand แต่กลายเป็น scheduler ของ agent ในตัว
Bonus: Chronicle ที่เป็น feature ที่อ่าน screen ตลอดเวลา
นอกจาก 7 ความสามารถหลัก Riley Brown ยังกล่าวถึงฟีเจอร์โบนัสชื่อ Chronicle ซึ่ง Riley ระบุว่าเป็น brand new feature ใน Codex ขณะถ่ายคลิป ผู้ใช้เข้าถึงได้ผ่าน settings → personalization แล้วเลื่อนลงเพื่อเปิด Chronicle research preview Riley อธิบายเองว่าฟีเจอร์นี้ "may seem a little bit invasive" เพราะระบบจะบันทึก screen ของผู้ใช้ตลอดเวลา เพื่อให้ Codex มี context ว่ากำลังทำอะไรอยู่
Riley สาธิตโดยพิมพ์คำสั่ง "Use Chronicle. Tell me what I should add to my Codex visual presentation" Codex รัน Chronicle skill เพื่อตรวจสถานะ screen ปัจจุบัน แล้วดึง screenshot ของ screen ในช่วงก่อนหน้าขึ้นมา Codex แนะนำให้เพิ่มในงาน presentation ได้แก่ Codex super app map, full control loop diagram for prompt files, Chronicle demo slide, reusable skills slide และ slide เปรียบเทียบว่าทำไมเลือก Codex เหนือเครื่องมืออื่น Riley ชี้ว่า Codex ทำสิ่งนี้ได้โดยไม่ต้อง upload รูปหรือเอกสารใดๆ เพิ่มเติม เพราะ Chronicle จับภาพ screen ของผู้ใช้อยู่แล้วในเบื้องหลัง
สรุปจุดที่ Codex แตกต่าง ตามที่ Riley Brown ปิดท้าย
ตอนสรุปท้ายคลิป Riley Brown ไล่ทั้ง 7 ความสามารถอีกครั้ง พร้อม framing ว่า Codex มี full file control ที่อนุญาตให้สร้าง, แก้ และลบไฟล์ใดก็ได้ มี persistent memory ทั้งฝั่ง auto และ manual ผ่าน agents.md, plugins ที่เชื่อมไปยังเครื่องมือภายนอกได้ทั้งหมด, skills ที่หยิบงานใดก็แปลงเป็น recipe ใช้ซ้ำได้, image generation ผ่าน GPT-image-2 ที่ built-in มาในตัว, browser/computer use ที่อนุญาตให้ agent คุม "human interface" คือ keyboard, mouse, screen และ automations ที่ตั้งเวลารัน task ใด task หนึ่งได้แบบ recurring บวกกับ Chronicle ที่เป็น bonus
ในมุมที่ Riley นำเสนอ Codex จึงไม่ใช่ chat interface ธรรมดา แต่เป็น super app ที่เปิดพื้นที่ให้ agent ใช้ตั้งแต่ file system, external tool, image model, screen ของผู้ใช้ ไปจนถึง scheduler ของตัวเอง Riley ปิดคลิปด้วยข้อสังเกตว่า "human interface" ที่ agent ใช้กำลังพัฒนาอย่างต่อเนื่อง และผู้สนใจติดตามคอนเทนต์ทำนองนี้รายสัปดาห์ได้จากช่องของเขา
ที่มา: Riley Brown: Learn 95% of Codex in 30 minutes (YouTube, 29 เม.ย. 2026)





ความคิดเห็น
ยังไม่มีความคิดเห็น เป็นคนแรกที่แสดงความเห็น!