이 글은 "대기업 임부장의 AI 이야기" 블로그 연재 시리즈입니다. AI를 업무와 일상에서 활용하는 이야기를 나눕니다.
유튜브 롱폼 영상을 만들기로 마음먹었습니다. 대본은 AI가 도와주고, 이미지도 AI가 그려주는 시대입니다. 그런데 막상 편집 단계에 오면 벽에 부딪힙니다. 프리미어 프로? 다빈치 리졸브? 전문가용 도구들은 진입장벽이 너무 높습니다.
그래서 캡컷(CapCut) 데스크탑을 선택했습니다. 무료 버전으로도 충분히 시작할 수 있고, 프로 버전(월 19,000원)을 쓰면 워터마크 제거, AI 기능 무제한, 수천 개의 프리미엄 에셋까지 — 작업 시간을 절반으로 줄여주는 확실한 레버리지를 얻습니다.
30장의 슬라이드로 정리한 캡컷 데스크탑 마스터클래스, 이 글 하나로 초보자도 유튜브 롱폼 편집의 전 과정을 이해할 수 있도록 구성했습니다.
PART 1. 작업 환경 세팅 — 요리 전에 주방부터 정리하라
4분할 작업 공간의 이해
캡컷 데스크탑을 처음 열면 화면이 4개 영역으로 나뉩니다. 이 구조를 이해하는 것이 편집의 첫걸음입니다.
① 미디어 탭 — 재료의 보관소. 영상, 이미지, 오디오 파일을 가져오고 관리합니다.
② 모니터 — 시각적 도마. 편집 결과를 실시간으로 확인하는 미리보기 화면입니다.
③ 컨트롤 패널 — 디테일 조절. 선택한 클립의 위치, 크기, 이펙트를 정밀하게 조정합니다.
④ 타임라인 — 조리 공간. 실제 컷 편집과 레이어링이 이루어지는 곳입니다.
미디어 관리: 프로의 폴더링 기술
편집을 시작하기 전에 반드시 해야 할 일이 있습니다. 미디어 탭에서 우클릭 → 새 폴더를 최소 4개 만드세요.
Main (A-roll) — 카메라 앞에서 말하는 주 영상
B-roll — 인서트 컷 (제품, 풍경 등 화면 전환용)
Audio — BGM 및 효과음 (마우스 클릭, 글리치 등)
Still — 정지된 이미지 (JPG, PNG 스크린샷)
💡 프로 팁: 정리가 안 된 미디어는 편집 시간을 갉아먹는 가장 큰 원인입니다.
타임라인: 영상을 요리하는 '도마'
파일을 빈 공간으로 드래그하면 메인 트랙으로 자석처럼 찰칵 붙습니다. 메인 트랙이 모든 편집의 기준점이 되고, 자막·오디오·B롤은 메인 트랙 위/아래에 층층이 쌓입니다(Layering).
타임라인에서 인디케이터를 좌우로 스크러빙하면 모니터에 즉각 반영됩니다. 단축키 Shift + Z를 누르면 타임라인을 화면 크기에 딱 맞게 한눈에 정렬합니다(Zoom to Fit).
컨트롤 패널: 공간과 디테일의 완성
Scale(확대/축소)로 화면 크기를 % 단위로 미세 조정하고, Position X/Y(위치)로 가로·세로 이동을 제어하며, 이미지가 틀어졌을 때는 Reset(초기화) 버튼 하나로 즉시 0, 0 정중앙으로 복귀시킵니다.
PART 2. 편집 속도를 지배하는 4가지 타임라인 토글
타임라인 우측 상단에 있는 4개의 버튼은 편집 프로그램의 성격 자체를 바꿔놓습니다.
토글 1: 메인 트랙 마그넷 (빈틈 자동 메우기)
마그넷이 OFF면 클립을 삭제해도 빈 공간이 그대로 남아서 수동으로 뒤의 클립을 당겨와야 합니다. ON으로 켜두면 자동으로 착 붙어 빈틈을 메웁니다.
🧲 권장 설정: 초보자는 무조건 ON 상태로 작업하세요.
토글 2: 자동 스냅 (오차 없는 완벽한 밀착)
눈으로 대충 맞추면 1~2프레임의 미세한 어긋남이 반드시 존재합니다. 자동 스냅을 ON으로 켜두면 클립 이동 시 파란색 가이드 실선이 생기며 자석처럼 완벽 밀착됩니다.
토글 3: 연결 설정 (레이어 동기화)
연결이 OFF면 메인 영상을 이동할 때 종속된 텍스트나 오디오 레이어가 제자리에 남아 싱크가 어긋납니다. ON으로 켜두면 체인으로 연결되어 모든 소스가 한 몸처럼 같이 이동합니다.
🔗 설정 팁: 옵션에서 '모두 선택'으로 체크해 두는 것을 권장합니다.
토글 4: 미리보기 모드 (리소스 최적화)
동영상만 미리보기 모드로 전환하면 오디오를 무음 처리하여 스크러빙 속도가 훨씬 빠르고 쾌적해집니다. 동영상과 오디오를 동시에 미리보기하면 리소스 과다 소모로 끊김이 발생할 수 있습니다.
PART 3. 컷 편집의 기초 — 면도날과 단축키
Ctrl + B, 이 하나만 기억하세요
클립을 자르는 프로의 방식은 단축키 Ctrl + B (Mac: Cmd + B)입니다. 단축키를 누르면 마우스를 따라다니는 서브 인디케이터(노란 줄) 위치가 즉시 잘립니다.
워크플로우는 A(선택 툴)와 B(면도날 툴)를 오가며 빠르게 자르고, Backspace로 삭제하는 것입니다.
오디오 파형으로 편집하기 (눈으로 하는 컷 편집)
오디오 파형의 높은 부분은 대사가 있는 구간이고, 평평한 구간은 데드 스페이스(숨 고르기, 헛기침)입니다. 이 평평한 구간의 시작과 끝을 잘라서 삭제하면, 말을 쉬지 않고 유창하게 하는 것처럼 보이는 '편집의 마법'이 완성됩니다.
프로의 워크플로우: 1차 가편집 렌더링
원본 파일이 10GB 이상일 때, 무거운 원본을 계속 안고 편집하지 마세요. 가편집 타임라인에서 공백을 제거한 뒤 1차 렌더링으로 내보내기(1GB로 압축)하고, 원본을 삭제한 후 2차 디테일 편집을 시작합니다.
⚠️ 프로 팁: 불필요한 컷만 잘라내어 1차 렌더링 후 원본을 지우면 테라바이트급 하드 용량을 절약할 수 있습니다.
PART 4. 텍스트와 모션 — 영상에 생명을 불어넣기
기본 텍스트와 상업용 무료 폰트
텍스트 → 기본 텍스트를 타임라인에 드래그 앤 드롭하면 됩니다. 캡컷 내부에 탑재된 폰트(다이아몬드 마크 포함 유료 폰트)는 유튜브 등 플랫폼에서 저작권 위배 없이 상업적 사용이 가능합니다. 우측 컨트롤 패널에서 폰트 사이즈, 볼드체, 윤곽선, 그림자 등을 조절하여 가독성을 극대화합니다.
심도 만들기: 블러와 노출 트릭 (시네마틱 자막)
프로급 자막의 비결은 심도(Depth)에 있습니다.
1. 원본 클립을 Alt+드래그로 위 트랙에 복제
2. 복제된 영상에만 흐림 효과(Blur) 적용
3. 노출 -50, 하이라이트 -50으로 배경 톤다운
4. 그 위에 텍스트를 올리면 → 극적인 심도와 모션 그래픽 룩 완성
키프레임(Keyframe)의 이해: 움직임의 시작과 끝
시작할 위치에 인디케이터를 두고 우측 패널의 마름모(◆) 아이콘을 클릭하여 첫 키프레임을 생성합니다. 인디케이터를 끝날 위치로 이동한 뒤 화면 비율을 150%로 변경하면 자동으로 두 번째 키프레임이 생성됩니다.
결과: 두 지점 사이를 지나는 동안 화면이 부드럽게 줌인됩니다.
가변 속도와 큐빅 아웃 (프로의 모션)
기본 선형 키프레임은 로봇처럼 어색합니다. 클립 우클릭 → '가변 속도 애니메이션 표시'를 선택하고, 키프레임 선택 후 '사전 설정 곡선' → 큐빅 아웃(Cubic Out)을 적용합니다.
✨ 효과: 빠르게 시작했다가 목적지에 도달할수록 부드럽게 감속하는 프로페셔널한 모션 완성.
텍스트 애니메이션과 즐겨찾기
In(진입)은 텍스트가 화면에 나타날 때의 모션(밀기 위로, 타자기 등)이고, Out(퇴장)은 사라질 때의 모션입니다. 마음에 드는 애니메이션 옆의 ⭐ 별표 아이콘을 클릭해 즐겨찾기 탭에 저장하세요. 매번 수백 개의 효과를 뒤질 필요 없이 즉시 적용할 수 있습니다.
PART 5. 오디오 마스터링 — 소리가 영상의 절반이다
오디오 믹싱의 법칙: 목소리와 BGM의 균형
핵심 법칙: 한쪽 소리를 잘 들리게 하려면 다른 쪽 소리를 키우는 게 아니라, 반대쪽 소리를 죽여야 합니다.
메인 음성은 0dB 기준(클리핑이 발생하지 않는 최대치)으로 유지하고, BGM은 -22dB ~ -25dB로 설정합니다. 이 레벨이 목소리를 간섭하지 않으면서 무의식적 리듬감을 부여하는 최적의 구간입니다.
오디오 페이드 인/아웃 교차 편집
오디오 클립 가장자리의 하얀색 원형 노드를 마우스로 드래그하면 페이드 라인이 생성됩니다. BGM을 교체할 때는 크로스페이드(Crossfade) 기법을 사용합니다. 끝나는 BGM은 서서히 줄어들고(Fade Out), 새로운 BGM은 서서히 커지게(Fade In) 교차시킵니다.
음악이 갑자기 뚝 끊기는 시청자의 불쾌감을 방지하고 부드러운 전환을 형성합니다.
PART 6. AI 기능과 마감 — 클릭 한 번의 마법
AI 누끼 따기: 클릭 한 번의 피사체 분리
인물 영상을 Alt+드래그로 위 트랙에 복제한 뒤, 복제 클립을 선택하고 동영상 → 배경 제거 → 자동 삭제를 클릭하면 1초 만에 인물이 분리됩니다.
하단의 원본 배경 클립의 노출과 채도를 대폭 낮춰 어둡게 세팅하면, 인물만 밝게 조명 받고 배경은 시네마틱하게 어두워져 시선 집중 효과가 극대화됩니다.
AI 자동 자막과 템플릿
캡컷의 AI 음성 인식은 텍스트 → 캡션 → 자동 생성 순서로 작동합니다. 타임라인에 자막 레이어가 자동으로 완성되면, 템플릿을 일괄 적용하여 유튜브 쇼츠나 인스타그램 릴스에서 보던 다이내믹한 애니메이션 자막을 수작업 없이 클릭 몇 번으로 전체 영상에 적용할 수 있습니다.
AI 뷰티: 틱톡 스타일 페이스 리터칭
우측 컨트롤 패널의 '보정(Retouch)' 탭에서 원클릭 프리셋인 '차이 뷰티' 필터를 적용하면 인플루언서 룩이 즉시 완성됩니다. 피부 매끄럽게, 다크서클 제거, 팔자 주름 완화, 페이스 리프팅까지 수동 미세 조절도 가능합니다. AI가 픽셀 단위로 얼굴 형태를 추적하여 자연스러운 보정을 유지합니다.
트랜지션의 미학: 글리치 비주얼과 사운드
시각 이펙트는 편집 효과 → 글리치 검색 후, 전환 부위에 아주 짧게(0.5초 이내) 배치합니다. 사운드 이펙트는 오디오 → 사운드 효과 → 글리치 검색 후 비주얼 길이와 완벽히 동기화합니다.
🎬 프로 팁: 강렬한 시각적 트랜지션은 반드시 동일한 질감의 효과음(SFX)이 동반되어야 완벽한 임팩트를 생성합니다.
필름 에스테틱: 힙합/레트로 룩 만들기
캡컷의 편집 효과를 겹겹이 쌓으면 텍스처가 깊어집니다. Layer 0(원본 비디오) 위에 Layer 1(빈티지 색감/프레임 드랍), Layer 2(정적 노이즈/필름 그레인), Layer 3(비네트/가장자리 다크닝)을 순서대로 올립니다. 효과를 처음부터 끝까지 길게 걸면 렌더링 오류처럼 보일 수 있으므로, 비트에 맞춰 짧게 끊어서 배치하는 것이 트렌디한 룩의 핵심입니다.
색보정(Color Grading)의 기초와 주의점
온도(Temp)로 쿨톤/웜톤을, 색조(Tint)로 마젠타/그린 밸런스를 조정합니다.
⚠️ 채도의 함정 주의: 캡컷 엔진 특성상 채도 슬라이더를 무리하게 높이면 픽셀 색상이 뭉개지고 깨집니다. 원색을 살리고 싶다면 채도 조절 대신 조명과 노출(대비) 밸런스를 먼저 맞추세요.
최적의 내보내기(Export) 세팅
✅ 해상도: 4K — 촬영 원본이 4K일 경우 픽셀 유실 방지
✅ 코덱: H.264 — 유튜브 및 모든 플랫폼에서 가장 호환성이 높은 범용 코덱
✅ 프레임 속도: 원본과 동일하게 매칭 (24fps 또는 30fps)
✅ SRT 내보내기: 자막을 별도 파일로 추출하여 유튜브 스튜디오의 CC 자막으로 완벽 활용
"편집은 덜어내는 예술입니다."
가장 훌륭한 편집은 화려한 트랜지션이 아니라,
시청자를 지루하게 만드는 1초의 데드 스페이스를
가차 없이 잘라내는 것에서 시작됩니다.
단축키 Ctrl + B를 손에 익히고, 당신만의 첫 컷을 잘라보세요.
편집의 세계에 한 번 발을 들이면, 영상을 보는 눈 자체가 달라집니다. 모든 유튜브 영상에서 편집점이 보이기 시작하고, 그때부터 진짜 성장이 시작됩니다.
다음 글에서는 이 캡컷 워크플로우를 실제 유튜브 롱폼에 적용한 결과를 공유하겠습니다.
#캡컷 #CapCut #캡컷데스크탑 #영상편집 #유튜브편집 #롱폼 #컷편집 #키프레임 #AI자막 #AI누끼 #오디오믹싱 #색보정 #크로스페이드 #글리치 #편집워크플로우 #대기업임부장의AI이야기