📄 원문: Sora 2: Prompting Guide
- 출처: Sora 2: Prompting Guide
- 저자: OpenAI
- 원문 발행일: 2025년 1월 15일
- 라이선스: MIT License
- 번역일: 2025년 10월 7일
- 번역 및 감수: Claude and 공부하우
⚖️ 저작권 안내
이 번역문은 교육 및 정보 제공 목적으로 작성되었습니다. 원문의 저작권은 OpenAI에 있으며, 이 번역은 OpenAI의 공식 번역이 아닙니다.
본 번역은 다음과 같은 교육적 공정 사용(Fair Use) 원칙에 따라 제공됩니다:
- 비영리 교육 목적
- 원문 출처의 명확한 표시
- 한국어 사용자의 기술 이해 증진을 위한 변형적 사용
- 원저작물의 시장 가치에 부정적 영향을 미치지 않음
저작권 관련 문제가 제기될 경우, 즉시 적절한 조치를 취하겠습니다. 상업적 사용이나 재배포 전에 원저작권자의 허가를 받으시기 바랍니다.
문의사항이나 우려사항이 있으시면 오른쪽 템플릿 복사를 클릭 하신 뒤, 연락 페이지를 통해 알려 주시기 바랍니다.
Sora 2: 프롬프트 작성 가이드
성공적인 비디오 프롬프트 만들기
프롬프트 작성 전 알아두기
이 문서에서는 핵심 용어를 한국어(English)로 함께 표기합니다. 예: 프롬프트(prompt), 샷(shot), 카메라 프레이밍(framing), 피사계 심도(depth of field, DOF), 색 보정/그레이딩(color grading), 사운드스케이프(soundscape), 디제틱(diegetic).
프롬프트(prompt) 작성은 스토리보드를 본 적 없는 촬영 감독에게 브리핑하는 것과 비슷합니다. 디테일을 빠뜨리면 즉흥적으로 메우게 되고, 당신이 상상한 것과 다른 결과로 이어질 수 있습니다. "샷(shot)"이 무엇을 달성해야 하는지 구체적으로 밝혀두면 모델에 더 많은 제어권과 일관성을 부여할 수 있습니다.
하지만 일부 디테일을 열어두는 것도 똑같이 강력합니다. 모델에 창작 자유를 주면 놀라운 바리에이션과 예상치 못한, 아름다운 해석이 나올 수 있습니다. 두 접근 방식 모두 유효합니다. 상세한 프롬프트는 제어와 일관성을, 가벼운 프롬프트는 창의적 결과의 여지를 제공합니다. 올바른 균형은 목표와 기대 결과에 달려 있습니다. 프롬프트는 계약서가 아니라 창작 위시리스트로 다루세요. ChatGPT처럼, 같은 프롬프트를 여러 번 사용하면 결과가 달라집니다 — 버그가 아니라 기능입니다. 각 생성은 새로운 해석이며, 때로는 두 번째나 세 번째 시도가 더 좋습니다.
가장 중요한 건 반복을 염두에 두는 것입니다. 카메라(camera), 조명(lighting), 동작(action)의 작은 변화가 결과를 크게 바꿉니다. 당신이 방향을 제시하고, 모델이 창의적 변주를 내놓는 협업이라고 생각하세요.
이는 정확한 과학이 아닙니다. 아래 가이드는 모델과 작업하며 얻은 유용한 제안으로 이해하세요.
API 파라미터 (API Parameters)
프롬프트는 비디오의 콘텐츠를 제어하지만, 특정 속성은 API 파라미터로만 제어됩니다. 산문(prose)으로 요청할 수 없으며, API 호출에서 명시적으로 설정해야 합니다:
- model:
sora-2
또는sora-2-pro
- size:
{width}x{height}
형식의 문자열. 지원되는 해상도(resolution)는 모델 선택에 따라 다릅니다:sora-2
: 1280x720, 720x1280sora-2-pro
: 1280x720, 720x1280, 1024x1792, 1792x1024
- seconds: 클립 길이(duration), 지원되는 값: "4", "8", "12". 기본값은 "4"
이러한 파라미터는 비디오의 컨테이너(container)입니다 – 해상도(resolution), 지속 시간(duration), 품질(quality)은 "더 길게 만들어줘"와 같은 산문으로 변경되지 않습니다. API에서 명시적으로 설정하고, 프롬프트는 나머지(피사체, 움직임/motion, 조명/lighting, 스타일/style)를 제어합니다.
비디오 해상도 (Video Resolution)
비디오 해상도는 Sora의 시각적 충실도(visual fidelity)와 움직임 일관성(motion consistency)에 직접적인 영향을 줍니다. 더 높은 해상도는 디테일, 텍스처(texture), 조명 전환을 더 정확하게 재현하고, 더 낮은 해상도는 시각 정보를 압축해 부드러움이나 아티팩트(artifacts)를 유발할 수 있습니다.
비디오 길이 (Video Length)
모델은 대체로 짧은 클립에서 지시를 더 안정적으로 따릅니다. 최상의 결과를 위해 간결한 샷을 노리세요. 가능하다면 8초 한 편 대신 4초 클립 두 개를 만들어 편집에서 이어 붙이는 편이 더 좋은 결과를 줄 수 있습니다.
효과적인 프롬프트 구조 (Prompt Anatomy)
명확한 프롬프트는 스토리보드에 스케치하듯 샷을 설명합니다. 카메라 프레이밍(framing)을 명시하고, 피사계 심도(depth of field, DOF)를 기록하고, 동작(action)을 비트(beats) 단위로 설명하고, 조명과 팔레트(palette)를 설정하세요. 피사체를 몇 가지 특징으로 고정하면 인식 가능성이 높아지고, 단일하고 그럴듯한 동작은 샷의 가독성을 높입니다.
단일 프롬프트에서 여러 샷을 설명하는 것도 시퀀스를 다뤄야 할 때 유효합니다. 이렇게 할 때는 각 샷 블록을 구별되게 유지하세요: 한 번에 하나의 카메라 설정, 하나의 피사체 액션, 하나의 조명 레시피. 이를 통해 프로젝트에 따라 짧은 독립 실행형 클립을 생성하거나 더 긴 연속적인 순간을 생성할 수 있는 유연성을 얻습니다. 각 샷을 창작 단위로 취급하면 편집에서 함께 연결하거나 한 번에 시퀀스로 재생할 수 있습니다.
- 짧은 프롬프트는 모델에 더 많은 창작 자유를 줍니다. 놀라운 결과를 기대하세요.
- 긴/상세 프롬프트는 모델의 창의성을 제한합니다. 지침을 따르려 노력하지만 항상 완벽히 일치하진 않을 수 있습니다.
짧은 프롬프트의 예 (Short prompt):
(한글)
90년대 다큐멘터리 스타일의 인터뷰에서, 나이 든 한국 남자가 서재에 앉아 “젊었을 때를 아직도 기억해.”라고 말한다.
(영어)
In a 90s documentary-style interview, an old Swedish man sits in a study and says, "I still remember when I was young."
이 프롬프트가 잘 작동할 가능성이 높은 이유:
(한글)
- 90년대 다큐멘터리는 비디오의 스타일을 설정합니다. 모델은 카메라 렌즈(lens), 조명(lighting), 색상 그레이딩(color grading) 같은 변수를 그에 맞춰 선택합니다.
- 나이 든 스웨덴 남자가 서재에 앉아는 피사체와 설정을 적절한 디테일로 설명해, 인물과 공간의 비주얼에 모델이 창의적으로 해석할 여지를 남깁니다.
- “젊었을 때를 아직도 기억해.”라고 말한다는 대사를 명시합니다. Sora는 이를 비교적 정확히 따릅니다.
(영어)
- 90s documentary sets the style of the video. The model will choose variables like camera lens, lighting, and color grade accordingly.
- an old Swedish man sits in a study describes subject and setting in minor detail, leaving room for creative interpretation of the person and environment.
- and says, "I still remember when I was young." specifies the dialogue, which Sora can likely follow closely.
이 프롬프트는 위 요건에 부합하는 영상을 비교적 안정적으로 생성합니다. 다만 여러 디테일이 열려 있어 정확한 비전과 다를 수 있습니다. 예컨대 시간대, 날씨, 의상, 톤, 인물의 외모/나이, 카메라 앵글, 컷, 세트 디자인 등은 명시되지 않았습니다. 이런 부분은 Sora가 임의로 채웁니다.
초상세 프롬프트 작성하기 (Going Ultra-Detailed)
복잡하고 영화적인 샷이라면 표준 프롬프트를 넘어 외관(look), 카메라 설정, 그레이딩(color grading), 사운드스케이프(soundscape), 심지어 샷의 의도까지 전문 용어로 명시할 수 있습니다. 이는 감독이 카메라 크루나 VFX 팀에 브리핑하는 방식과 유사합니다. 렌즈/필터, 조명, 그레이딩, 움직임(motion)에 대한 상세 큐는 모델이 매우 특정한 미학에 고정되도록 돕습니다.
예컨대 처음 보이길 원하는 포인트, 카메라 플랫폼과 렌즈, 조명 방향, 색상 팔레트(palette), 텍스처(texture) 성질, 디제틱(diegetic) 사운드, 샷 타이밍을 지정하세요. 실제 촬영 스타일(예: IMAX 항공 촬영, 35mm 핸드헬드, 빈티지 16mm 다큐)을 매칭하거나 샷 전반의 강한 연속성을 유지하고자 할 때 유리합니다.
예시 (한글 · 한 번에 복사)
포맷 & 외관
지속 시간 4초; 180° 셔터; 65mm 광화학 대비를 에뮬레이트하는 디지털 캡처; 미세 입자(fine grain); 스페큘러 하이라이트에 미묘한 할레이션(halation); 게이트 웨이브(gate weave) 없음.
렌즈 & 필터링
32mm / 50mm 구면 프라임; Black Pro-Mist 1/4; 기차 창문 반사를 줄이기 위한 CPL(원형 편광 필터) 미세 회전.
그레이드 / 팔레트
- 하이라이트: 앰버 리프트가 있는 깨끗한 아침 햇빛
- 중간: 그림자에 약간의 틸 캐스트가 있는 균형 잡힌 중립
- 블랙: 헤이즈 유지를 위한 마일드 리프트가 있는 부드럽고 중립적인 블랙
조명 & 분위기
카메라 왼쪽에서 오는 자연광, 낮은 각도(오전 7시 30분).
바운스: 선로 옆에서 4×4 울트라바운스 실버.
반대편 벽에서 네거티브 필.
프랙티컬: 희미한 페이드의 나트륨 플랫폼 조명.
분위기: 부드러운 안개; 광선을 통과하는 기차 배기가스 드리프트.
위치 & 프레이밍
도시 통근 플랫폼, 새벽.
전경: 노란색 안전선, 벤치 위 커피 컵.
중경: 안개 속 실루엣으로 기다리는 승객들.
배경: 정지하기 위해 제동하는 도착하는 기차.
간판이나 기업 브랜딩 피하기.
의상 / 소품 / 엑스트라
주요 피사체: 30대 중반 여행자, 네이비 코트, 한쪽 어깨에 메인 백팩, 옆구리에 느슨하게 들고 있는 전화.
엑스트라: 음소거된 톤의 통근자들; 자전거를 밀고 있는 한 사이클리스트.
소품: 종이 커피 컵, 롤링 수하물, LED 출발 게시판(일반 목적지).
사운드
디제틱(diegetic)만: 희미한 철도 끽끽거림, 기차 브레이크의 히스, 먼 안내 방송(‑20 LUFS), 낮은 앰비언스.
발소리와 종이 바스락거림; 악보나 추가 폴리 없음.
최적화된 샷 리스트 (2샷 / 총 4초)
0.00–2.40 — "도착 드리프트" (32mm, 어깨 장착 느린 돌리 왼쪽)
카메라가 플랫폼 간판 가장자리를 지나 슬라이드; 얕은 초점이 선로를 내려다보는 중간 프레임 여행자를 드러냄. 아침 빛이 렌즈를 가로질러 피어남; 기차 헤드라이트가 안개를 통해 부드럽게 플레어. 목적: 설정과 톤 확립, 기대감 암시.
2.40–4.00 — "돌아보고 멈춤" (50mm, 느린 아크 인)
기차가 정지할 때 더 타이트한 오버 숄더 아크로 컷; 여행자가 카메라 쪽으로 약간 돌아서며 뺨과 전화 화면 반사를 가로지르는 햇빛 림을 잡음. 눈이 보이지 않는 무언가를 향해 올라감. 목적: 최소한의 모션으로 인간적인 초점 순간 생성.
카메라 노트 (읽히는 이유)
친밀감을 위해 시선을 렌즈 축에 낮고 가깝게 유지.
미적 텍스처로 기차 유리에서 미세 플레어 허용.
사실감을 위해 미묘한 핸드헬드 불완전함 보존.
과노출된 플레어로 실루엣 선명도를 깨지 않기; 피부 하이라이트 롤오프 유지.
마무리
사실감을 위한 마일드 크로마 노이즈가 있는 미세 입자 오버레이; 프랙티컬에 억제된 할레이션; 아침 스플릿 톤을 위한 웜-쿨 LUT.
믹스: 발소리 트랜지언트보다 기차와 주변 디테일 우선.
포스터 프레임: 회전 중인 여행자, 황금 림 라이트, 배경 안개에 소프트 포커스 도착하는 기차.
(영어 · Copy all at once)
Format & Look
Duration 4s; 180° shutter; digital capture emulating 65 mm photochemical contrast; fine grain; subtle halation on speculars; no gate weave.
Lenses & Filtration
32 mm / 50 mm spherical primes; Black Pro-Mist 1/4; slight CPL rotation to manage glass reflections on train windows.
Grade / Palette
- Highlights: clean morning sunlight with amber lift.
- Mids: balanced neutrals with slight teal cast in shadows.
- Blacks: soft, neutral with mild lift for haze retention.
Lighting & Atmosphere
Natural sunlight from camera left, low angle (07:30 AM).
Bounce: 4×4 ultrabounce silver from trackside.
Negative fill from opposite wall.
Practical: sodium platform lights on dim fade.
Atmos: gentle mist; train exhaust drift through light beam.
Location & Framing
Urban commuter platform, dawn.
Foreground: yellow safety line, coffee cup on bench.
Midground: waiting passengers silhouetted in haze.
Background: arriving train braking to a stop.
Avoid signage or corporate branding.
Wardrobe / Props / Extras
Main subject: mid-30s traveler, navy coat, backpack slung on one shoulder, holding phone loosely at side.
Extras: commuters in muted tones; one cyclist pushing bike.
Props: paper coffee cup, rolling luggage, LED departure board (generic destinations).
Sound
Diegetic only: faint rail screech, train brakes hiss, distant announcement muffled (-20 LUFS), low ambient hum.
Footsteps and paper rustle; no score or added foley.
Optimized Shot List (2 shots / 4 s total)
0.00–2.40 — “Arrival Drift” (32 mm, shoulder-mounted slow dolly left)
Camera slides past platform signage edge; shallow focus reveals traveler mid-frame looking down tracks. Morning light blooms across lens; train headlights flare softly through mist. Purpose: establish setting and tone, hint anticipation.
2.40–4.00 — “Turn and Pause” (50 mm, slow arc in)
Cut to tighter over-shoulder arc as train halts; traveler turns slightly toward camera, catching sunlight rim across cheek and phone screen reflection. Eyes flick up toward something unseen. Purpose: create human focal moment with minimal motion.
Camera Notes (Why It Reads)
Keep eyeline low and close to lens axis for intimacy.
Allow micro flares from train glass as aesthetic texture.
Preserve subtle handheld imperfection for realism.
Do not break silhouette clarity with overexposed flare; retain skin highlight roll-off.
Finishing
Fine-grain overlay with mild chroma noise for realism; restrained halation on practicals; warm-cool LUT for morning split tone.
Mix: prioritize train and ambient detail over footstep transients.
Poster frame: traveler mid-turn, golden rim light, arriving train soft-focus in background haze.
외관을 조정하는 시각적 큐
프롬프트를 작성할 때, 스타일은 모델을 원하는 결과로 안내하는 가장 강력한 레버 중 하나입니다. 전반적인 미학을 설명하는 것 – 예를 들어, "1970년대 필름," "서사적, IMAX 규모 장면," 또는 "16mm 흑백 필름" – 은 다른 모든 선택을 프레이밍하는 시각적 톤을 설정합니다. 모델이 일관되게 전달할 수 있도록 이 스타일을 일찍 확립하세요.
같은 디테일도 당신이 세련된 할리우드 드라마, 핸드헬드 스마트폰 클립, 또는 그레이니 빈티지 광고를 요청하느냐에 따라 매우 다르게 읽힐 것입니다. 톤이 설정되면 샷, 액션, 라이트로 구체적인 것들을 레이어링하세요.
명확성이 승리합니다. "아름다운 거리"와 같은 모호한 큐 대신 "젖은 아스팔트, 횡단보도, 웅덩이에 반사되는 네온 사인"을 쓰세요. "빠르게 움직인다" 대신 "횡단보도에서 세 걸음 조깅하고 멈춘다"를 명시하세요. 가시적인 결과를 가리키는 동사와 명사는 항상 더 명확하고 일관된 출력을 제공합니다.
약한 프롬프트 | 강한 프롬프트 |
---|---|
"밤의 아름다운 거리" (A beautiful street at night) | "젖은 아스팔트, 횡단보도, 웅덩이에 반사되는 네온 사인" (Wet asphalt, zebra crosswalk, neon signs reflecting in puddles) |
"사람이 빠르게 움직임" (Person moves quickly) | "사이클리스트가 세 번 페달을 밟고, 브레이크를 걸고, 횡단보도에서 멈춤" (Cyclist pedals three times, brakes, and stops at crosswalk) |
"영화적인 외관" (Cinematic look) | "아나모픽 2.0x 렌즈, 얕은 DOF, 볼륨메트릭 라이트" (Anamorphic 2.0x lens, shallow DOF, volumetric light) |
카메라 방향과 프레이밍은 샷의 느낌을 형성합니다. 위에서 본 와이드 샷은 공간과 컨텍스트를 강조하는 반면, 눈높이에서의 클로즈업은 감정에 주의를 집중시킵니다. 피사계 심도는 또 다른 레이어를 추가합니다: 얕은 초점은 피사체가 흐릿한 배경에 대해 돋보이도록 만들 수 있고, 깊은 초점은 전경과 배경 모두를 선명하게 유지합니다. 조명은 톤을 똑같이 강하게 설정합니다. 부드럽고 따뜻한 키는 초대하는 무언가를 만들고, 차가운 가장자리가 있는 단일 하드 라이트는 드라마를 향해 밀어냅니다.
캐릭터를 소개할 때는 어느 정도의 예측 불가능성을 기대하세요 – 표현의 작은 변화가 정체성, 포즈, 또는 장면 자체의 초점을 바꿀 수 있습니다. 샷 전반에 걸쳐 설명을 일관되게 유지하고, 연속성을 위해 표현을 재사용하고, 경쟁할 수 있는 특성을 혼합하지 마세요.
약함
(한글)
카메라 샷: 영화적인 외관
(영어)
Camera shot: cinematic look
강함
(한글)
카메라 샷: 와이드 샷, 로우 앵글
피사계 심도: 얕음 (피사체 선명, 배경 흐림)
조명 + 팔레트: 따뜻한 백라이트, 부드러운 림
(영어)
Camera shot: wide shot, low angle
Depth of field: shallow (sharp on subject, blurred background)
Lighting + palette: warm backlight with soft rim
좋은 프레이밍 지침의 몇 가지 예:
(한글)
- 와이드 설정 샷, 눈높이
- 와이드 샷, 왼쪽에서 오른쪽 트래킹
- 공중 와이드 샷, 약간의 하이 앵글
- 미디엄 클로즈업, 뒤에서 약간의 앵글
(영어)
- wide establishing shot, eye level
- wide shot, tracking left to right
- aerial wide shot, slight high angle
- medium close-up, slight angle from behind
좋은 카메라 모션 지침의 몇 가지 예:
(한글)
- 천천히 틸트하는 카메라
- 핸드헬드 ENG 카메라
(영어)
- slowly tilting camera
- handheld ENG camera
모션과 타이밍 제어
움직임은 종종 올바르게 하기 가장 어려운 부분이므로 간단하게 유지하세요. 각 샷은 하나의 명확한 카메라 무브와 하나의 명확한 피사체 액션을 가져야 합니다. 액션은 비트나 카운트 단위로 설명할 때 가장 잘 작동합니다 – 작은 단계, 제스처, 또는 멈춤 – 따라서 시간에 근거를 둔 느낌이 듭니다.
"배우가 방을 가로질러 걷는다"는 신호는 구체성이 부족합니다. "배우가 창문까지 네 걸음 걷고, 잠시 멈춘 뒤 마지막 1초에 커튼을 젖힌다"처럼 타이밍을 비트로 쪼개 주세요.
약함
(한글)
배우가 방을 가로질러 걷는다.
(영어)
Actor walks across the room.
강함
(한글)
배우가 창문까지 네 걸음을 걷고, 멈추고, 마지막 초에 커튼을 당긴다.
(영어)
Actor takes four steps to the window, pauses, and pulls the curtain in the final second.
조명과 색상 일관성
빛은 액션이나 설정만큼 분위기를 결정합니다. 프레임 전체에 확산된 빛은 차분하고 중립적인 느낌이고, 단일 강한 소스는 선명한 대비와 긴장감을 만듭니다. 여러 클립을 함께 컷하고 싶을 때, 조명 논리를 일관되게 유지하는 것이 편집을 매끄럽게 만드는 것입니다.
빛의 품질과 그것을 강화하는 색상 앵커(color anchors) 모두를 설명하세요. "밝게 조명된 방" 같은 광범위한 노트 대신, 소스와 톤의 혼합을 지정하세요: "따뜻한 램프 필(lamp fill)과 복도에서 오는 차가운 림(rim)이 있는 부드러운 창문빛." 3–5가지 색을 앵커로 명시하면 샷 전반의 팔레트가 안정됩니다.
약함
(한글)
조명 + 팔레트: 밝게 조명된 방
(영어)
Lighting + palette: brightly lit room
강함
(한글)
조명 + 팔레트: 부드러운 창문빛 + 따뜻한 램프 필, 복도에서 오는 차가운 림
팔레트 앵커: 앰버, 크림, 월넛 브라운
(영어)
Lighting + palette: soft window light with warm lamp fill, cool rim from hallway
Palette anchors: amber, cream, walnut brown
더 많은 제어를 위한 이미지 입력 사용
샷의 구성과 스타일에 대한 더욱 세밀한 제어를 위해 이미지 입력을 시각적 참조로 사용할 수 있습니다. 사진, 디지털 아트워크 또는 AI 생성 비주얼을 사용할 수 있습니다. 이는 캐릭터 디자인, 의상, 세트 드레싱 또는 전반적인 미학과 같은 요소를 고정합니다. 모델은 이미지를 첫 번째 프레임의 앵커로 사용하는 반면, 텍스트 프롬프트는 다음에 일어날 일을 정의합니다.
사용 방법 (How to use it)
POST /videos
요청에서 input_reference
파라미터로 이미지 파일을 포함하세요.
- 이미지는 타겟 비디오의 해상도(
size
)와 일치해야 합니다. - 지원되는 파일 형식:
image/jpeg
,image/png
,image/webp
실험 팁 (Experimentation tip)
시각적 참조가 아직 없다면, OpenAI의 이미지 생성 모델이 그것들을 만드는 강력한 방법입니다. 환경과 장면 디자인을 빠르게 제작한 다음 Sora에 참조로 전달할 수 있습니다. 이는 미학을 테스트하고 비디오를 위한 아름다운 시작점을 생성하는 좋은 방법입니다.
대화와 오디오 (Dialogue and Audio)
대화는 프롬프트에서 직접 설명해야 합니다. 모델이 시각적 설명과 음성 라인을 명확히 구별할 수 있도록 산문 설명 아래 블록에 배치하세요. 라인을 간결하고 자연스럽게 유지하고, 타이밍이 클립 길이와 일치할 수 있도록 몇 문장으로 제한하세요. 다중 캐릭터 장면의 경우, 화자를 일관되게 레이블링하고 교대 턴을 사용하세요; 이는 모델이 각 라인을 올바른 캐릭터의 제스처 및 표현과 연관시키는 데 도움이 됩니다.
리듬과 타이밍에 대해서도 생각해야 합니다: 4초 샷은 보통 한두 개의 짧은 교환을 수용하는 반면, 8초 클립은 몇 개 더 지원할 수 있습니다. 길고 복잡한 연설은 잘 동기화되지 않을 가능성이 높으며 페이싱을 깨뜨릴 수 있습니다.
샷이 무음이라면, "먼 교통의 히스(hiss)"나 "또렷한 스냅(snap)" 같은 작은 효과음 하나로도 페이싱을 제안할 수 있습니다. 이를 전체 사운드트랙이 아닌 리듬 큐로 보세요.
대화가 있는 프롬프트 예시:
(한글)
낡은 재 색상의 벽이 있는 비좁고 창문 없는 방. 천장에서 매달린 단일 나전구가 중앙의 상처 난 금속 테이블 위로 빛을 쏟아냅니다. 두 개의 의자가 그것을 가로질러 서로 마주보고 있습니다. 한쪽에는 탐정이 앉아 있고, 트렌치 코트가 그의 의자 뒤에 걸쳐 있으며, 날카롭고 깜박이지 않는 눈. 그를 가로질러, 용의자가 구부정하게 앉아 있고, 담배 연기가 천장을 향해 천천히 휘어집니다. 침묵이 압박하며, 머리 위 조명의 희미한 윙윙거림에 의해서만 깨집니다.
대화:
- 탐정: "당신은 거짓말하고 있어요. 당신의 침묵에서 들을 수 있어요."
- 용의자: "또는 아마도 나는 그냥 말하는 것에 지쳤어요."
- 탐정: "어느 쪽이든, 당신은 밤이 끝나기 전에 말할 거예요."
(영어)
A cramped, windowless room with walls the color of old ash. A single bare bulb dangles from the ceiling, its light pooling onto the scarred metal table at the center. Two chairs face each other across it. On one side sits the Detective, trench coat draped across the back of his chair, eyes sharp and unblinking. Across from him, the Suspect slouches, cigarette smoke curling lazily toward the ceiling. The silence presses in, broken only by the faint hum of the overhead light.
Dialogue:
- Detective: "You’re lying. I can hear it in your silence."
- Suspect: "Or maybe I’m just tired of talking."
- Detective: "Either way, you’ll talk before the night’s over."
배경 사운드 설명 예시:
(한글)
에스프레소 머신의 윙윙거림과 목소리의 웅성거림이 배경을 형성합니다.
(영어)
The hum of espresso machines and the murmur of voices form the background.
리믹스 기능으로 반복하기 (Iterate with Remix)
리믹스(Remix)는 조정을 위한 것이지 도박이 아닙니다. 한 번에 하나씩, 무엇을 바꾸는지 명확히 쓰세요: "같은 샷, 85mm로 전환" 또는 "같은 조명, 새 팔레트: 틸·샌드·러스트". 결과가 마음에 가까워지면 해당 결과를 참조로 고정(pin)하고 바꾸는 항목만 지시하세요. 이미 잘 작동하는 요소는 고정(lock)됩니다.
샷이 계속 빗나가면 되돌아가 단순화하세요: 카메라를 고정하고, 동작을 줄이고, 배경을 정리합니다. 작동하기 시작하면 단계적으로 복잡도를 쌓으세요.
프롬프트 템플릿과 예시
프롬프트 구조 (Prompt Structure)
프롬프트를 작성하는 효과적인 방법 중 하나는 모델이 사용하기를 원하는 다양한 종류의 정보를 분리하는 것입니다. 이것은 성공을 위한 만능 레시피는 아니지만 명확한 프레임워크를 제공하고 일관성을 유지하는 것을 더 쉽게 만듭니다. 모든 디테일을 포함할 필요는 없습니다 – 샷에 중요하지 않은 것이 있다면 빠뜨릴 수 있습니다.
실제로 특정 요소를 열어두면 모델이 더 창의적이 되도록 장려할 것입니다. 모든 시각적 선택을 덜 엄격하게 지정할수록 모델이 해석하고 예상치 못하지만 종종 아름다운 변형으로 놀라게 할 수 있는 공간이 더 많습니다. 매우 설명적인 프롬프트는 더 일관되고 제어된 결과를 산출하는 반면, 더 가벼운 프롬프트는 신선하고 상상력이 풍부한 느낌의 다양한 결과를 잠금 해제할 수 있습니다.
설명적 프롬프트 템플릿 (Descriptive Prompt Template):
(한글)
[평범한 언어로 산문 장면 설명. 캐릭터, 의상, 풍경, 날씨 및 기타 디테일을 설명하세요. 비전과 일치하는 비디오를 생성하기 위해 최대한 설명적이세요.]
촬영 기법:
카메라 샷: [프레이밍과 앵글, 예: 와이드 설정 샷, 눈높이]
분위기: [전반적인 톤, 예: 영화적이고 긴장감 있는, 장난스럽고 서스펜스 있는, 호화로운 기대]
액션:
- [액션 1: 명확하고 구체적인 비트 또는 제스처]
- [액션 2: 클립 내 또 다른 구별되는 비트]
- [액션 3: 또 다른 액션 또는 대화 라인]
대화:
[샷에 대화가 있다면, 여기 또는 액션 목록의 일부로 짧은 자연스러운 라인을 추가하세요. 클립 길이와 일치하도록 간결하게 유지하세요.]
(영어)
[Prose scene description in plain language. Describe characters, costumes, scenery, weather, and other details. Be as descriptive as needed to match your vision.]
Cinematography:
Camera shot: [framing and angle, e.g. wide establishing shot, eye level]
Mood: [overall tone, e.g. cinematic and tense, playful and suspenseful, luxurious anticipation]
Actions:
- [Action 1: a clear, specific beat or gesture]
- [Action 2: another distinct beat within the clip]
- [Action 3: another action or dialogue line]
Dialogue:
[If the shot has dialogue, add short natural lines here or as part of the actions list. Keep them brief so they match the clip length.]
프롬프트 예시 (Prompt Examples)
예시 1
(한글 · 한 번에 복사)
스타일: 부드러운 브러시 텍스처, 따뜻한 텅스텐 조명, 촉각적이고 스톱모션 감성이 있는 손그림 2D/3D 하이브리드 애니메이션. 2000년대 중반 스토리북 애니메이션의 분위기 — 아늑하고, 불완전하며, 기계적 매력이 살아 있습니다. 은은한 수채화 워시와 회화적 텍스처; 그레이드의 웜–쿨 밸런스; 사실감을 위한 필름식 모션 블러.
어수선한 작업장. 선반은 기어, 볼트, 누렇게 바랜 청사진으로 가득합니다. 가운데 작은 둥근 로봇이 나무 벤치에 앉아 있고, 찌그러진 몸체에는 어울리지 않는 패널과 오래된 페인트층이 덧대어져 있습니다. 큰 눈이 옅은 파란빛으로 깜빡이고, 윙윙 소리를 내는 전구를 초조하게 만지작거립니다. 공기에는 잔잔한 기계음이 흐르고, 창문엔 비가 톡톡, 배경에선 시계 초침이 또박또박.
촬영 기법:
- 카메라: 미디엄 클로즈업, 걸려 있는 도구들로 인한 부드러운 패럴랙스(parallax)와 함께 느린 푸시 인(push-in)
- 렌즈: 35mm 가상 렌즈; 배경의 어수선함을 부드럽게 날리는 얕은 DOF
- 조명: 머리 위 프랙티컬(practical)에서 따뜻한 키(key); 대비를 위한 창문발 차가운 스필(spill)
- 분위기: 부드럽고 기발하며, 약간의 서스펜스
액션:
- 로봇이 전구를 살짝 두드림; 스파크가 찌직.
- 움찔하며 전구를 놓치고, 눈이 동그래짐.
- 전구가 슬로모로 텀블; 간신히 낚아챔.
- 가슴에서 김이 푹— 안도와 작은 자부심.
- 로봇(소근): "거의 놓칠 뻔… 그래도 잡았다!"
배경 사운드:
비, 시계 초침, 부드러운 기계적 험(hum), 희미한 전구 지글.
(영어 · Copy all at once)
Style: Hand-painted 2D/3D hybrid animation with soft brush textures, warm tungsten lighting, and a tactile, stop-motion feel. The aesthetic evokes mid-2000s storybook animation — cozy, imperfect, full of mechanical charm. Subtle watercolor wash and painterly textures; warm–cool balance in grade; filmic motion blur for animated realism.
Inside a cluttered workshop, shelves overflow with gears, bolts, and yellowing blueprints. At the center, a small round robot sits on a wooden bench, its dented body patched with mismatched plates and old paint layers. Its large glowing eyes flicker pale blue as it fiddles nervously with a humming light bulb. The air hums with quiet mechanical whirs, rain patters on the window, and the clock ticks steadily in the background.
Cinematography:
- Camera: medium close-up, slow push-in with gentle parallax from hanging tools
- Lens: 35 mm virtual lens; shallow depth of field to soften background clutter
- Lighting: warm key from overhead practical; cool spill from window for contrast
- Mood: gentle, whimsical, a touch of suspense
Actions:
- The robot taps the bulb; sparks crackle.
- It flinches, dropping the bulb, eyes widening.
- The bulb tumbles in slow motion; it catches it just in time.
- A puff of steam escapes its chest — relief and pride.
- Robot says quietly: "Almost lost it… but I got it!"
Background Sound:
Rain, ticking clock, soft mechanical hum, faint bulb sizzle.
(한글)
스타일: 부드러운 브러시 텍스처, 따뜻한 텅스텐 조명, 촉각적이고 스톱모션 감성이 있는 손그림 2D/3D 하이브리드 애니메이션. 2000년대 중반 스토리북 애니메이션의 분위기 — 아늑하고, 불완전하며, 기계적 매력이 살아 있습니다. 은은한 수채화 워시와 회화적 텍스처; 그레이드의 웜–쿨 밸런스; 사실감을 위한 필름식 모션 블러.
어수선한 작업장. 선반은 기어, 볼트, 누렇게 바랜 청사진으로 가득합니다. 가운데 작은 둥근 로봇이 나무 벤치에 앉아 있고, 찌그러진 몸체에는 어울리지 않는 패널과 오래된 페인트층이 덧대어져 있습니다. 큰 눈이 옅은 파란빛으로 깜빡이고, 윙윙 소리를 내는 전구를 초조하게 만지작거립니다. 공기에는 잔잔한 기계음이 흐르고, 창문엔 비가 톡톡, 배경에선 시계 초침이 또박또박.
촬영 기법: (한글)
- 카메라: 미디엄 클로즈업, 걸려 있는 도구들로 인한 부드러운 패럴랙스(parallax)와 함께 느린 푸시 인(push-in)
- 렌즈: 35mm 가상 렌즈; 배경의 어수선함을 부드럽게 날리는 얕은 DOF
- 조명: 머리 위 프랙티컬(practical)에서 따뜻한 키(key); 대비를 위한 창문발 차가운 스필(spill)
- 분위기: 부드럽고 기발하며, 약간의 서스펜스
(영어)
- Camera: medium close-up, slow push-in with gentle parallax from hanging tools
- Lens: 35 mm virtual lens; shallow depth of field to soften background clutter
- Lighting: warm key from overhead practical; cool spill from window for contrast
- Mood: gentle, whimsical, a touch of suspense
액션: (한글)
- 로봇이 전구를 살짝 두드림; 스파크가 찌직.
- 움찔하며 전구를 놓치고, 눈이 동그래짐.
- 전구가 슬로모로 텀블; 간신히 낚아챔.
- 가슴에서 김이 푹— 안도와 작은 자부심.
- 로봇(소근): "거의 놓칠 뻔… 그래도 잡았다!"
배경 사운드: (한글)
비, 시계 초침, 부드러운 기계적 험(hum), 희미한 전구 지글.
(영어)
Rain, ticking clock, soft mechanical hum, faint bulb sizzle.
예시 2
(한글 · 한 번에 복사)
스타일: 자연스러운 플레어, 소프트 포커스, 따뜻한 할레이션이 살아 있는 35mm 필름 룩의 1970년대 로맨틱 드라마. 약한 게이트 웨이브와 핸드헬드 마이크로셰이크가 빈티지한 친밀감을 더합니다. 코닥 감성의 따뜻한 그레이드; 전구의 은은한 할레이션; 시대감을 위한 필름 그레인과 부드러운 비네트.
골든 아워. 벽돌 공동주택 옥상이 작은 무대로 바뀝니다. 하얀 시트가 걸린 빨래줄이 바람에 흔들리며 마지막 햇살을 받습니다. 제각각의 페어리 라이트가 머리 위에서 희미하게 빛납니다. 붉은 실크 드레스를 입은 젊은 여성이 맨발로 춤을 추고, 사라져가는 빛 속에서 곱슬머리가 반짝입니다. 파트너는 소매를 걷고 멜빵을 느슨히 한 채 박수를 치며 넉살 좋은 미소를 짓습니다. 아래 도시는 경적, 지하철의 미세한 진동, 먼 곳의 웃음으로 살아 있습니다.
촬영 기법:
- 카메라: 미디엄 와이드, 눈높이에서 느린 돌리 인(dolly-in)
- 렌즈: 40mm 구면; 스카이라인으로부터 커플을 분리하는 얕은 DOF
- 조명: 황금색 자연 키 + 텅스텐 바운스; 페어리 라이트의 엣지(edge)
- 분위기: 향수 어린, 다정한, 영화적
액션:
- 그녀가 스핀; 드레스가 햇빛을 받으며 활짝 퍼짐.
- 여자(웃으며): "봐? 오늘은 도시도 우리와 춤추네."
- 그가 다가와 손을 잡고, 그녀를 그림자 속으로 살짝 딥.
- 남자(미소): "네가 이끌었잖아."
- 시트가 프레임을 스치며 스카이라인을 잠깐 가렸다가 다시 걷힘.
배경 사운드:
자연 앰비언스만: 희미한 바람, 천 펄럭임, 거리 소음, 음소거된 음악. 추가 악보 없음.
(영어 · Copy all at once)
Style: 1970s romantic drama, shot on 35 mm film with natural flares, soft focus, and warm halation. Slight gate weave and handheld micro-shake evoke vintage intimacy. Warm Kodak-inspired grade; light halation on bulbs; film grain and soft vignette for period authenticity.
At golden hour, a brick tenement rooftop transforms into a small stage. Laundry lines strung with white sheets sway in the wind, catching the last rays of sunlight. Strings of mismatched fairy bulbs hum faintly overhead. A young woman in a flowing red silk dress dances barefoot, curls glowing in the fading light. Her partner — sleeves rolled, suspenders loose — claps along, his smile wide and unguarded. Below, the city hums with car horns, subway tremors, and distant laughter.
Cinematography:
- Camera: medium-wide shot, slow dolly-in from eye level
- Lens: 40 mm spherical; shallow focus to isolate the couple from skyline
- Lighting: golden natural key with tungsten bounce; edge from fairy bulbs
- Mood: nostalgic, tender, cinematic
Actions:
- She spins; her dress flares, catching sunlight.
- Woman (laughing): "See? Even the city dances with us tonight."
- He steps in, catches her hand, and dips her into shadow.
- Man (smiling): "Only because you lead."
- Sheets drift across frame, briefly veiling the skyline before parting again.
Background Sound:
Natural ambience only: faint wind, fabric flutter, street noise, muffled music. No added score.
(한글)
스타일: 자연스러운 플레어, 소프트 포커스, 따뜻한 할레이션이 살아 있는 35mm 필름 룩의 1970년대 로맨틱 드라마. 약한 게이트 웨이브와 핸드헬드 마이크로셰이크가 빈티지한 친밀감을 더합니다. 코닥 감성의 따뜻한 그레이드; 전구의 은은한 할레이션; 시대감을 위한 필름 그레인과 부드러운 비네트.
골든 아워. 벽돌 공동주택 옥상이 작은 무대로 바뀝니다. 하얀 시트가 걸린 빨래줄이 바람에 흔들리며 마지막 햇살을 받습니다. 제각각의 페어리 라이트가 머리 위에서 희미하게 빛납니다. 붉은 실크 드레스를 입은 젊은 여성이 맨발로 춤을 추고, 사라져가는 빛 속에서 곱슬머리가 반짝입니다. 파트너는 소매를 걷고 멜빵을 느슨히 한 채 박수를 치며 넉살 좋은 미소를 짓습니다. 아래 도시는 경적, 지하철의 미세한 진동, 먼 곳의 웃음으로 살아 있습니다.
촬영 기법: (한글)
- 카메라: 미디엄 와이드, 눈높이에서 느린 돌리 인(dolly-in)
- 렌즈: 40mm 구면; 스카이라인으로부터 커플을 분리하는 얕은 DOF
- 조명: 황금색 자연 키 + 텅스텐 바운스; 페어리 라이트의 엣지(edge)
- 분위기: 향수 어린, 다정한, 영화적
(영어)
- Camera: medium-wide shot, slow dolly-in from eye level
- Lens: 40 mm spherical; shallow focus to isolate the couple from skyline
- Lighting: golden natural key with tungsten bounce; edge from fairy bulbs
- Mood: nostalgic, tender, cinematic
액션: (한글)
- 그녀가 스핀; 드레스가 햇빛을 받으며 활짝 퍼짐.
- 여자(웃으며): "봐? 오늘은 도시도 우리와 춤추네."
- 그가 다가와 손을 잡고, 그녀를 그림자 속으로 살짝 딥.
- 남자(미소): "네가 이끌었잖아."
- 시트가 프레임을 스치며 스카이라인을 잠깐 가렸다가 다시 걷힘.
배경 사운드: (한글)
자연 앰비언스만: 희미한 바람, 천 펄럭임, 거리 소음, 음소거된 음악. 추가 악보 없음.
(영어)
Natural ambience only: faint wind, fabric flutter, street noise, muffled music. No added score.
이 번역문은 교육 및 정보 제공 목적으로 작성되었습니다. 원문의 저작권은 Anthropic에 있으며, 이 번역은 Anthropic의 공식 번역이 아닙니다.
본 번역은 다음과 같은 교육적 공정 사용(Fair Use) 원칙에 따라 제공됩니다:
- 비영리 교육 목적
- 원문 출처의 명확한 표시
- 한국어 사용자의 기술 이해 증진을 위한 변형적 사용
- 원저작물의 시장 가치에 부정적 영향을 미치지 않음
저작권 관련 문제가 제기될 경우, 즉시 적절한 조치를 취하겠습니다. 상업적 사용이나 재배포 전에 원저작권자의 허가를 받으시기 바랍니다.
문의사항이나 우려사항이 있으시면 연락 주시기 바랍니다.