Brendan Jowett creator สาย AI บน YouTube โพสต์คลิป "How I Fully Automated My Video Editing (Claude Code)" ที่มียอดดูทะลุหลักแสนภายในเดือนแรก เพื่อเปิดเบื้องหลัง pipeline ที่ใช้ตัดต่อวิดีโอ YouTube ของตัวเองแบบเกือบไม่ต้องแตะ timeline เลย จากที่เขาอธิบายในคลิป เดิมทีการตัดคลิปยาวหนึ่งวิดีโอใช้เวลาประมาณ 3 ถึง 6 ชั่วโมง หรือต้องจ้าง editor หลักร้อยดอลลาร์ต่อคลิป ปัจจุบันเขาส่งงานทั้งหมดให้ Claude Code จัดการผ่าน workflow ที่เชื่อม Descript, FFmpeg, OpenAI Whisper และ Remotion เข้าด้วยกัน ทำให้ creator คนเดียวปั่นวิดีโอคุณภาพและสไตล์เดิมได้สม่ำเสมอ โดยไม่ต้องสร้าง edit ใหม่ตั้งแต่ศูนย์ทุกครั้ง
ประเด็นที่ทำให้คลิปนี้น่าสนใจสำหรับคนทำคอนเทนต์ไทยและสาย dev คือ มันไม่ใช่แค่การโชว์ feature สวยๆ แต่เปิด stack การทำงานจริงที่ใช้กับวิดีโอหลายคลิปติดต่อกัน นั่นหมายความว่าทุกชิ้นส่วนใน pipeline นี้ทำงานร่วมกันได้จริงในสภาพ production ไม่ใช่ demo โชว์ครั้งเดียว
ปัญหาเดิมของการตัดวิดีโอ YouTube ที่ creator ทุกคนเจอ
ก่อนจะเข้าใจว่า pipeline ของ Brendan Jowett ช่วยอะไร ต้องรู้ก่อนว่า workflow ตัดวิดีโอ YouTube แบบดั้งเดิมเสียเวลาตรงไหน Brendan Jowett เล่าในคลิปว่า งานตัดต่อหนึ่งคลิปมักใช้เวลา 3 ถึง 6 ชั่วโมง ส่วนใหญ่หมดไปกับการ scrub timeline เพื่อหาช่วงที่พูดผิด ช่วงเงียบที่ต้องตัดออก และงานซ้ำๆ ที่เคยทำไปแล้วในคลิปก่อนหน้า โดยเฉพาะ animation, text overlay และ transition ที่เป็นเอกลักษณ์ของช่อง
ปัญหาที่ลึกกว่านั้นคือสไตล์ไม่สม่ำเสมอ ทุกครั้งที่ creator เริ่มตัดคลิปใหม่ ต้องจำให้ได้ว่า "ครั้งที่แล้วใช้ font ไหน สีอะไร transition แบบไหน" หรือกลับไปเปิดไฟล์เก่าดู สไตล์ของช่องจึงค่อยๆ เพี้ยนไปตามวัน ตามอารมณ์ หรือเปลี่ยนทันทีเมื่อเปลี่ยน editor ทางออกของ creator ส่วนใหญ่คือจ้าง freelance editor หลักร้อยดอลลาร์ต่อคลิป ซึ่ง Brendan Jowett ระบุว่าเป็นค่าใช้จ่ายที่กินกำไรของช่องอย่างหนัก ระยะยาวจึงกลายเป็นคอขวดที่ทำให้ output ของช่องโตช้ากว่าที่ควร
Note: ตัวเลข 3 ถึง 6 ชั่วโมงต่อคลิปสอดคล้องกับค่ามาตรฐานของ creator สาย long-form ทั่วไป ดังนั้น pipeline ที่ตัดเวลาส่วนนี้ออกได้จึงเป็นข้อได้เปรียบเชิงเศรษฐศาสตร์ที่ชัดเจน ไม่ใช่แค่ความสะดวก
ภาพรวม pipeline ที่ Brendan Jowett ออกแบบ
ในคลิป Brendan Jowett ขอให้ Claude Code อธิบายโครงสร้างทั้งหมดของระบบที่เขาเซ็ตไว้ให้ออกมาเป็น stack ที่อ่านง่าย ผลลัพธ์คือ pipeline 5 ขั้นที่ใช้ Claude Code เป็นศูนย์กลางสั่งเครื่องมือแต่ละชิ้นต่อเนื่องกัน ขั้นแรกคือบันทึก raw footage จากกล้อง จากนั้นส่งไฟล์ MP4 เข้า Descript เพื่อทำความสะอาดเบื้องต้น แล้วส่งต่อให้ Claude Code เรียก FFmpeg แยกเสียงออกจากภาพ ต่อจากนั้น Claude Code ส่งเสียงให้ OpenAI Whisper API ทำ transcript พร้อม timestamp และใช้ transcript นั้นเป็น input ให้ Remotion สร้างกราฟิก, animation และข้อความประกอบในตำแหน่งที่ถูกต้องของวิดีโอ
ขั้นสุดท้ายคือ Remotion Studio ที่เปิด timeline ให้ creator preview ผลลัพธ์ทั้งคลิปก่อน render ไฟล์ MP4 สุดท้ายลงเครื่อง Brendan Jowett ชี้ว่าจุดสำคัญของ pipeline นี้ไม่ใช่เครื่องมือชิ้นใดชิ้นหนึ่ง แต่อยู่ที่ Claude Code สั่งทุกเครื่องมือผ่าน command line ได้ creator จึงพิมพ์แค่ประโยคเดียวว่า "นี่คือคลิปยาวอันใหม่ ช่วยตัดให้หน่อย" แล้วระบบจะวางแผนงานเอง สร้าง graphics เอง และส่งกลับมาเป็นไฟล์พร้อมเผยแพร่

แต่ละชั้นใน stack ทำหน้าที่อะไร
เพื่อให้คนที่ยังไม่เคยใช้เครื่องมือเหล่านี้เข้าใจว่า pipeline นี้ทำงานยังไง Brendan Jowett พาทัวร์เครื่องมือทีละตัวอย่างละเอียดในคลิป เริ่มจาก Descript ซึ่งเป็นเครื่องมือเดียวที่อยู่นอก Claude Code ในระบบนี้ Descript ทำงานบนคลาวด์และใช้คล้ายการแก้ Word document กล่าวคือ creator ไม่ต้องตัด timeline เอง แต่แก้ที่ transcript บนหน้าจอ ลบประโยคไหน วิดีโอตรงนั้นก็ตัดออกตามอัตโนมัติ Brendan Jowett สร้าง template ส่วนตัวบน Descript ที่มีคำสั่งเรียบง่ายว่า "ลบประโยคที่ซ้ำกันออก โดยเก็บประโยคสุดท้ายที่มักเป็น take ที่ถูกต้อง" และใช้ feature shorten word gaps เพื่อบีบช่องว่างที่ยาวกว่า 0.2 วินาทีให้สั้นลง ทำให้คลิปยาว 20 นาทีกลายเป็น 12 นาทีในขั้นนี้
หลังจากคลิปผ่าน Descript และส่งออกเป็น MP4 ก็ส่งต่อให้ Claude Code ทันที Claude Code เรียก command line tool อย่าง FFmpeg เพื่อแยก track เสียงออกจากภาพ เพราะขั้นต่อไปต้องใช้ transcript ที่มี timestamp ละเอียดกว่าที่ Descript ให้มา OpenAI Whisper API ทำหน้าที่ถอดเสียงเป็นข้อความพร้อม timestamp ของทุกคำ และ timestamp นี้คือกุญแจที่ทำให้ Remotion วาง graphics ทับตรงคำที่สอดคล้องกับเนื้อหาได้พอดี ไม่ต้องเดาจังหวะวาง animation ด้วยมือ ตามที่ Brendan Jowett อธิบายในคลิป Claude Code จะอ่าน transcript ทั้งก้อนแล้วตัดสินใจว่าช่วงไหนของวิดีโอควรมีกราฟิกอะไร ช่วงไหนควรมีข้อความขึ้นหน้าจอ และช่วงไหนควรมี comparison chart แทรกเข้ามา
Remotion คือกุญแจที่ทำให้ทั้งระบบนี้เป็นไปได้
ในบรรดาเครื่องมือทั้งหมด Brendan Jowett เน้นย้ำว่า Remotion คือชิ้นส่วนที่ทำให้ workflow นี้ทำงานได้จริง เพราะ Remotion เป็น framework ที่สร้างวิดีโอด้วย React และ TypeScript กล่าวคือทุก animation, text overlay, comparison chart และกราฟิกประกอบในวิดีโอเขียนเป็น code component ไม่ใช่ keyframe ที่ลากบน timeline จุดสำคัญคือ Claude Code เก่งเรื่องเขียน code อยู่แล้ว เมื่อแปลง graphic เป็น code Claude Code ก็สร้างกราฟิกใหม่ ปรับสไตล์ และจัดวาง animation ได้เหมือนงาน programming ทั่วไป
นอกจากนี้ Remotion ยังมาพร้อม Remotion Studio ที่ทำหน้าที่เหมือน timeline preview ของ video editor ทั่วไป creator สามารถดู block สีฟ้าที่เป็นกราฟิกแต่ละชิ้น เลื่อนตามลำดับเวลา และ play ดูผลลัพธ์จริงก่อน render เป็นไฟล์ MP4 Brendan Jowett ระบุในคลิปว่า Remotion ประกาศ support สำหรับ Claude Code อย่างเป็นทางการ และ use case ที่หน้าเว็บ Remotion โชว์อันดับต้นๆ คือ "prompt a video" สิ่งนี้สะท้อนว่าการต่อ Remotion เข้ากับ Claude Code ไม่ใช่ workaround แต่เป็นเส้นทางที่ทีม Remotion ตั้งใจสนับสนุน การติดตั้งจึงทำได้โดยสั่ง Claude Code ตรงๆ ว่าให้ติดตั้ง Remotion ให้ ระบบจะรัน install command ทั้งหมดเอง ผู้ใช้ที่ไม่ใช่ technical จึงไม่จำเป็นต้องรู้คำสั่ง terminal ล่วงหน้า
การที่ Claude "จำสไตล์" ของช่องทำงานอย่างไร
จุดที่หลายคนข้ามไป แต่เป็นหัวใจของ workflow นี้ คือสิ่งที่ Brendan Jowett เรียกว่า "Claude already knows how your videos should look" หมายความว่าทุกครั้งที่มีคลิปใหม่เข้ามา ระบบไม่ได้สร้าง edit จากศูนย์ แต่ใช้ context จาก project folder เดียวกัน ซึ่งสะสมคำสั่งและตัวอย่างจากคลิปก่อนหน้าไว้แล้ว ในคลิป Brendan Jowett เปิดให้เห็นว่า folder ที่ใช้กับ Claude Code มี history การสนทนายาวเหยียด Claude จึงย้อนดูได้ว่าคลิปที่แล้วใช้สไตล์ animation แบบไหน, font อะไร, สีโทนไหน และนำมาใช้กับคลิปใหม่ได้ทันทีโดยไม่ต้องบอกซ้ำ
นี่คือเหตุผลที่ Brendan Jowett ย้ำว่า "you're not rebuilding the edit from scratch every time" ผลคือทุกคลิปของช่องมีคุณภาพและสไตล์เดียวกัน ไม่ใช่เพราะ creator จำได้ทุกครั้ง แต่เพราะระบบจำให้แทน และยิ่งช่องผลิตคอนเทนต์ต่อเนื่อง Claude ก็ยิ่งสะสม pattern มากขึ้น ทำให้ออกแบบกราฟิกที่เข้ากับเอกลักษณ์ช่องได้แม่นยำขึ้นเรื่อยๆ ในเชิงเทคนิค นี่คือการใช้ project folder ของ Claude Code เป็น persistent memory ของ workflow แทนการให้ creator ต้องเขียน style guide เป็นเอกสารแยก
Tip: หลักการ "ระบบจำสไตล์แทนคน" นี้ใช้ได้กับงาน creative อื่นนอกเหนือจากวิดีโอ เช่น การเขียน blog ที่ต้องคงโทนเดียวกัน, การออกแบบ thumbnail series, หรือการเขียนสคริปต์ที่มีโครงเดิม ขอเพียง output ของงานนั้นแปลงเป็น code หรือ text ที่ AI agent อ่านซ้ำได้
บทเรียนที่คนทำคอนเทนต์ไทยและสาย dev เอาไปใช้ได้ทันที
จาก pipeline ที่ Brendan Jowett เปิดในคลิป มีหลักการอย่างน้อย 4 ข้อที่ creator ไทยและ indie dev ดึงไปประยุกต์ได้ แม้จะไม่ได้ทำวิดีโอแบบเดียวกัน ข้อแรกคือแบ่งงานระหว่าง "งานที่มนุษย์ตัดสินใจ" กับ "งานที่ AI ทำซ้ำ" Brendan Jowett ระบุว่า Descript ยังจำเป็น เพราะมีบางช่วงที่ AI ตัดผิด เช่น ประโยคซ้ำที่ความหมายต่างกัน ดังนั้นแทนที่จะให้ AI ทำ 100% creator จึงคงอำนาจตัดสินใจไว้ที่ขั้น cleanup และปล่อยให้ AI จัดการขั้นที่ต้องทำซ้ำเหมือนกันทุกคลิป หลักการนี้ใช้ได้กับงาน production อื่น เช่น การเขียนบทความที่คนเขียน outline แล้วให้ AI ขยายเนื้อหา
ข้อสองคือเลือก tool ที่แปลง output เป็น code ได้ ในกรณีนี้คือ Remotion ที่เปลี่ยน animation เป็น React component ทำให้ Claude Code เข้ามาแก้ได้เหมือนแก้ code ทั่วไป Brendan Jowett อธิบายว่า ถ้า tool ของงานปัจจุบันยังเป็น GUI-only ที่ AI agent เข้าไม่ถึง ก็คุ้มที่จะมองหา alternative ที่มี code interface แม้ learning curve จะสูงกว่าในช่วงเริ่มต้น
ข้อสามคือใช้ project folder เป็น memory ของ workflow แทนการเขียนเอกสาร style guide แยก ในคลิป Brendan Jowett โชว์ว่า folder เดียวที่สะสม history ของ session ก่อนหน้า ทำให้ Claude เข้าใจ context ของช่องโดยไม่ต้อง brief ใหม่ หลักการนี้สอดคล้องกับวิธี vibe coding ที่ใช้ project memory เป็นแหล่งความรู้ระยะยาวของ agent
ข้อสี่คือระบบยังเปิด preview ให้คนตรวจก่อน publish ในคลิป Brendan Jowett ระบุชัดว่ายังกดดู Remotion Studio ทุกครั้งและ "double check" ก่อน upload ขึ้น YouTube สะท้อนว่า workflow ที่ออกแบบดีไม่ได้แปลว่าตัดมนุษย์ออกจากวงจรทั้งหมด แต่ตัดเฉพาะส่วนที่มนุษย์ไม่ได้สร้างคุณค่าเพิ่ม ส่วนการประเมินผลลัพธ์สุดท้ายยังต้องอาศัยตามนุษย์ นี่เป็นหลักการสำคัญสำหรับ creator ไทยที่อยากใช้ AI agent ในงาน production จริงโดยไม่เสียคุณภาพ

ที่มา: เนื้อหาทั้งหมดในบทความนี้สรุปจากคลิป "How I Fully Automated My Video Editing (Claude Code)" ของช่อง Brendan Jowett ผู้สนใจ workflow รายละเอียดรับชมคลิปต้นฉบับได้ที่ลิงก์ดังกล่าว





ความคิดเห็น
ยังไม่มีความคิดเห็น เป็นคนแรกที่แสดงความเห็น!