Google Veo 3를 테스트한 솔직한 리뷰

Manus에서 콘텐츠 작가로 일하면서 새로운 AI 도구를 테스트하는 것은 기본적으로 직무 설명의 일부입니다. Google Veo 3가 출시되었을 때, 인터넷은 데모를 보고 집단적으로 열광했습니다. 현실적인 말하는 얼굴, 동기화된 오디오, 영화 같은 비주얼, 이 모든 것이 단 하나의 텍스트 프롬프트에서 나왔습니다. 저는 AI 과대광고 사이클을 충분히 보아왔기 때문에 데모는 큐레이션된 것이며 실제 결과는 완전히 다르다는 것을 알고 있습니다.
그래서 저는 실제로 Google Veo 3를 사용해 보기로 했습니다. 네 가지 독특한 프롬프트를 통해 한계를 시험하고 모든 것을 솔직하게 문서화했습니다.
이것은 Google의 마케팅 자료 요약이 아닙니다. 이것은 제가 실제로 경험한 바를 바탕으로 한 Google Veo 3 리뷰입니다. 저를 감동시킨 부분, 저를 좌절하게 만든 부분, 그리고 전혀 작동하지 않았던 부분을 포함합니다. 이 기사를 끝까지 읽으면 Veo 3가 잘하는 점, 부족한 점, 가격 대비 가치가 있는지, 그리고 경쟁 제품과 어떻게 비교되는지 정확히 알게 될 것입니다.
Google Veo 3란 무엇인가요? (Veo 3.1의 새로운 점은?)
Google Veo 3는 단일 텍스트 프롬프트에서 고품질 비디오 클립을 생성하는 고급 AI 비디오 생성 모델입니다. 동기화된 대화, 주변 음향 효과, 배경 음악을 모두 하나의 프롬프트에서 지원하며, 가장 현실적인 AI 생성 말하는 얼굴 영상을 제작하는 것으로 빠르게 명성을 얻었습니다.
Veo 3는 2025년 중반 Google I/O에서 처음 발표되었으며, 그 해 가장 많이 언급된 AI 비디오 생성기 중 하나가 되었습니다. 가장 최근 업데이트인 Veo 3.1은 의미 있는 개선 사항을 가져왔습니다: 더 나은 안정성, 더 정확한 립싱크, 더 일관된 캐릭터 생성, 1080p 및 4K로 업스케일링. 이는 몇 가지 Google 제품을 통해 접근할 수 있습니다 — Google Flow, 더 길고 복잡한 장면을 편집하고 시퀀싱하기 위해 제작된 전문급 영화 제작 도구, 그리고 Google Whisk, 빠른 이미지-비디오 생성 및 짧은 클립에 초점을 맞춘 실험적 도구. 이 리뷰를 위해 저는 Gemini 앱을 통해 테스트했으며, 단순히 "비디오 생성" 도구를 선택하고 네 가지 프롬프트를 모두 실행했습니다.
나의 실제 테스트 과정
이것을 제대로 테스트하기 위해 단순한 프롬프트를 던지고 끝내고 싶지 않았습니다. 저는 Manus에 도움을 요청하여 대화 및 립싱크, 영화적 분위기, 제품 일관성, 빠른 동작을 평가하기 위한 네 가지 특정 프롬프트를 설계했습니다. 실제로 그 과정이 어떻게 진행되었는지 알려드리겠습니다.
접근 방법 (그리고 여러분도 접근할 수 있는 방법)
Veo 3에 접근하는 것은 처음에는 솔직히 약간 혼란스러웠으며, 이는 공통적인 문제점이기 때문에 설명할 가치가 있다고 생각합니다.

저는 무료 계정으로 시작했습니다. 인터페이스는 다른 AI 도구와 유사한 프롬프트 박스와 몇 가지 도구 옵션이 있는 꽤 일반적인 모습이었습니다. 어디에도 비디오 생성 옵션이 보이지 않았습니다. 그래도 첫 번째 프롬프트를 입력해 보았습니다. 무슨 일이 일어날지 보기 위해서요.

제가 받은 것은 비디오가 아닌 이미지였습니다. 이미지는 실제로 인상적이었고 프롬프트와 잘 맞았지만, 분명히 제가 요청한 것은 아니었습니다. 그래서 저는 Gemini에게 비디오를 만들어 달라고 명시적으로 요청해 보았습니다. 아마도 제 의도를 잘못 읽었을 수도 있다고 생각했기 때문입니다. 제가 받은 응답은 다음과 같았습니다: "오늘 구독을 업그레이드하면 해당 비디오를 생성할 수 있습니다."

그래서 유료 플랜을 살펴보았습니다.
다음은 각 플랜이 비디오 생성에 대해 제공하는 현재 요약입니다:
플랜 | 월 가격 | AI 크레딧 | Veo 3.1 접근 |
무료 | $0 | 하루 50 크레딧 | Flow, Animate 및 이미지 생성에 제한적 접근 |
Google AI Plus | $7.99/월 | 월 200 크레딧 | Flow 및 Whisk에서 이미지-비디오 생성에 더 많은 접근 |
Google AI Pro | $19.99/월 | 월 1,000 크레딧 | Flow 및 Whisk에서 더 높은 접근 |
Google AI Ultra | $249.99/월 | 월 25,000 크레딧 | Flow 및 Whisk에서 가장 높은 접근 |
플랜에 대한 설명이 모호합니다. Google AI Plus는 "Veo 3를 사용한 이미지-비디오 생성에 더 많은 접근"을 제공한다고 하고, Google AI Pro는 "더 높은 접근"을 제공한다고 합니다. 실제로 무엇을 얻을 수 있는지 명확하지 않습니다. 저는 다음 단계로 올라가는 플랜인 Google AI Plus를 선택했습니다. 유료로 구독하고 시작했습니다! Plus 플랜에서는 이전에 무료 플랜에서 사용할 수 없었던 "비디오 생성" 옵션이 추가로 보였습니다.

Veo 3의 한계를 테스트하기 위해 사용한 4가지 프롬프트
다음은 Veo 3의 기능을 테스트하기 위해 준비한 네 가지 프롬프트입니다:
1.대화 및 립싱크 테스트 — 동기화된 대화 기능의 핵심을 평가하기 위해.
2.영화적 및 분위기 테스트 — 복잡한 시각적 스타일과 카메라 방향을 얼마나 잘 처리하는지 평가하기 위해.
3.제품 및 객체 일관성 테스트 — 깨끗하고 전문적인 제품 비디오를 생성할 수 있는지 확인하기 위해.
4.액션 및 동작 테스트 — 빠른 움직임, 동적 카메라 작업, 레이어드 오디오를 얼마나 잘 처리하는지 확인하기 위해.
결과: Veo 3 비디오 예제 4가지 (좋은 점, 나쁜 점, 그리고 글리치)
프롬프트 #1: 대화 및 립싱크 테스트
사용된 프롬프트: "따뜻하게 조명이 비치는 도서관에 앉아 있는 안경을 쓴 40대 여성 역사가의 중간 클로즈업 샷. 그녀는 카메라를 직접 바라보며 사려 깊고 매력적인 톤으로 말합니다. 그녀는 '대부분의 사람들이 로마 제국에 대해 알지 못하는 것은 그 붕괴가 단일 사건이 아니라 수 세기에 걸친 느리고 복잡한 붕괴 과정이었다는 것입니다.'라고 말합니다. 주변 소음: 책장을 넘기는 조용한 소리와 도서관 에어컨의 부드러운 소음. 스타일: 다큐멘터리 인터뷰, 고품질 디지털 카메라로 촬영."
내 경험: 솔직히 이건 정말 놀라웠습니다. 프로세스는 매끄럽게 진행되었고, 비디오는 몇 분 만에 준비되었습니다. 진짜 이야기: 생성 중에 다른 작업을 하기 위해 탭을 전환했습니다. 다시 돌아와서 결과물을 보았을 때, 화면에 무작위 광고가 뜬 줄 알았습니다. 그만큼 현실적으로 보였습니다. 역사가, 조명, 톤… 모든 것이 완벽했습니다. 그녀는 자연스러운 억양, 멈춤, 강조로 말했습니다. 그녀의 표정과 손 제스처? 완벽했습니다. 진짜 다큐멘터리 인터뷰에 어울릴 정도였습니다.
햇빛 속 먼지 입자가 약간 산만하게 느껴졌다는 점을 제외하면 모든 것이 훌륭했습니다. 그리고 제가 요청한 주변 도서관 소음 대신 모델은 미묘한 배경 음악 트랙을 제공했습니다. 하지만 솔직히? 그것은 현명한 결정이었습니다. 음악은 다큐멘터리 스타일에 완벽하게 어울렸습니다. 아마도 제가 요청한 것보다 더 나았을 것입니다. 정말 좋은 시작이었습니다!
내가 좋아한 점 | 내가 싫어한 점 |
믿을 수 없을 정도로 현실적이고 자연스러운 캐릭터 | 햇빛 속 먼지 입자가 약간 산만했음 |
자연스러운 말투와 완벽한 립싱크 | 특정 주변 소음 요청을 무시했음 (하지만 좋은 선택이었음) |
다큐멘터리 인터뷰 스타일을 완벽하게 캡처 | |
프롬프트 #2: 영화적 및 분위기 테스트
사용된 프롬프트: "뒤로 천천히 움직이는 돌리 샷, 화성의 분화구 능선에 서 있는 외로운 우주비행사를 드러냅니다. 하늘은 먼지로 덮인 붉은 오렌지색이며 두 개의 작은 달이 보입니다. 황량하고 조용합니다. 스타일: 서사적인 공상과학, 4K, 광각 렌즈, 매우 상세하고 경외감을 불러일으키며 우울한 분위기."
내 경험: 이것은… 혼합된 결과였습니다. 처음 눈에 띈 것은 우주비행사 헬멧에 비친 반사였습니다. 저는 지구의 희미한 반사를 요청했지만, 받은 것은 이상하고 왜곡된 남자의 얼굴 조각이었습니다. 그것은 완전히 잘못된 것처럼 보였으며, 투명성과 차원의 레이어가 모두 잘못된 이상한 글리치처럼 보였습니다. 그것이 우주비행사의 얼굴이어야 했는지 누가 알겠습니까! 그냥 붙여 넣은 것처럼 보였습니다.
나머지는 나쁘지 않았습니다. 슈트, 분화구, 카메라 움직임, 모두 괜찮았습니다. 먼지와 모래 안개 디테일은 실제로 매우 현실적이었습니다. 하지만 프롬프트는 두 개의 작은 달을 요청했는데, 하늘에는 세 개의 다른 크기의 행성이 보였습니다. 글리치된 얼굴이 없었다면 인상적이었을 것입니다. AI 비디오 생성에서는 이길 때도 있고 질 때도 있습니다. 모델은 태양, 별, 움직이는 안개를 추가했는데, 이는 괜찮았습니다. 추가된 얼굴과 행성? 별로였습니다.
내가 좋아한 점 | 내가 싫어한 점 |
돌리 카메라 움직임의 좋은 실행 | 헬멧 반사에서 왜곡된 얼굴의 주요 글리치 |
현실적인 먼지와 모래 안개 디테일 | "두 개의 달" 지시를 따르지 않음 |
황량하고 서사적인 공상과학 분위기를 잘 캡처 | 우주비행사 슈트의 세부 사항 부족 |
프롬프트 #3: 제품 및 객체 일관성 테스트
사용된 프롬프트: "고급스럽고 아름답게 디자인된 세라믹 티포트의 턴테이블 샷. 티포트는 미니멀리스트 매트 화이트로, 평범한 연회색 표면 위에 놓여 있습니다. 카메라는 티포트를 중심으로 360도 천천히 회전합니다. 스타일: 깨끗한 제품 광고, 스튜디오 조명, 부드러운 그림자, 매크로 렌즈, 매우 선명한 초점, 배경 방해 요소 없음."
내 경험: 이것은 그냥… 괜찮았습니다. 특히 인상적이지 않았습니다. 모델은 프롬프트의 가장 기본적이고 문자 그대로의 해석을 제공했습니다. 저는 "고급스럽고 아름답게 디자인된" 티포트를 요청했지만, 받은 것은 평범하고 전통적인 세라믹 포트였습니다. 카메라 각도는 맞았지만, 표면은 제가 지정한 연회색 대신 흰색이었습니다. 이렇게 간단한 프롬프트에서 어떻게 잘못될 수 있을까요?
정말로 거슬렸던 것은 초점이었습니다. 저는 "매우 선명한 초점"을 명시적으로 요청했지만, 티포트는 흐릿하고, 가장자리가 깨끗하지 않아 배경의 일부처럼 보였습니다. 제품 광고에서는 말이 안 됩니다. 더 나쁜 것은, 티포트가 회전할 때 손잡이가 프레임에서 잘려 나갔다는 것입니다. 모델은 유일한 객체를 샷에서 완전히 보이게 유지할 수도 없었습니다. 제품 데모로서는 큰 실패입니다.
내가 좋아한 점 | 내가 싫어한 점 |
올바른 카메라 각도와 회전 움직임 | 티포트 디자인이 평범하고 영감을 주지 못함 |
배경 및 조명 설정이 대부분 올바름 | 비디오가 흐릿하고 초점이 맞지 않음 |
360도 회전이 부드러움 | 회전 중 제품이 잘림 |
프롬프트 #4: 액션 및 동작 테스트
사용된 프롬프트: "방콕의 붐비고 활기찬 야시장 속을 달리는 사람의 핸드헬드 POV 샷. 카메라는 사람들이나 음식 가판대를 피해 지그재그로 움직이며 흔들립니다. 웍에서 김이 올라오고, 머리 위로 다채로운 등이 걸려 있습니다. SFX: 시장 소음의 혼합 — 사람들의 대화, 음식이 지글거리는 소리, 멀리서 들리는 음악. 주자는 가끔 어깨 너머로 뒤를 돌아보며 숨을 헐떡입니다. 스타일: 거친 액션 영화, 현실적, 몰입감 있는, 약간 흐릿한 동작."
내 경험: 이것은 전혀 예상치 못한 결과였으며, 좋은 의미로는 전혀 아니었습니다. 비디오는 "길을 비켜!"라고 외치는 캐릭터와 무작위 펀치 사운드 효과로 시작되었으며, 이는 제가 전혀 요청하지 않은 공격적인 탈출 장면으로 즉시 바뀌었습니다. 시장은 붐볐지만, 뭔가 매우 이상했습니다. 모든 사람이 완벽히 직선으로 서 있었고, 아무도 움직이지 않았습니다. 붐비는 시장이 그렇게 보인 적이 있나요? 완전히 부자연스러웠습니다.
주자는 제가 요청한 특정 행동인 어깨 너머로 뒤를 돌아보는 행동을 한 번도 하지 않았습니다. 오디오도 엉망이었습니다. 유일하게 맞았던 소리는 주자의 숨소리였습니다. 나머지 시장 소음은 너무 멀고 조용했으며, 가까이에서 몰입감 있는 혼합이어야 했습니다. 표지판은 태국어와 중국어가 혼합되어 있어 특정 방콕이 아니라 일반적인 "아시아 시장"처럼 느껴졌습니다. 이것은 AI 생성임을 외치는 결과물이었습니다.
내가 좋아한 점 | 내가 싫어한 점 |
주자의 숨소리가 현실적이었음 | 원치 않는 대화 및 사운드 효과가 추가됨 |
핸드헬드 카메라 느낌이 어느 정도 있었음 | 군중이 정적이고 완전히 비현실적이었음 |
시장의 조명과 색상이 생동감 있었음 | 설정이 방콕에 특정되지 않고 일반적이었음 |
모든 것을 바꾸는 기능: 네이티브 오디오 및 립싱크
네 가지 테스트에서 일관되지 않은 결과에도 불구하고, 프롬프트 #1의 성공은 Veo 3가 왜 그렇게 많은 주목을 받고 있는지를 강조합니다. 립싱크 품질은 정말로 돋보이는 부분입니다. 작동할 때, 제 역사가 테스트에서처럼, 결과는 실제 영상으로 착각할 정도로 설득력이 있습니다. 모델은 단순히 입 움직임을 단어에 맞추는 것이 아니라, 억양, 멈춤, 강조가 있는 자연스러운 말 패턴을 생성합니다. 또한 배경 소음 대신 장면에 더 적합할 때 배경 음악을 선택하는 것과 같은 오디오에 대한 창의적인 결정을 내립니다. 이러한 맥락적 오디오 지능은 AI 생성으로 보이는 클립과 실제로 견딜 수 있는 클립의 차이를 만듭니다.
짜증나는 부분: 일일 제한, 느린 렌더링, 이상한 글리치
여기서 솔직히 말하자면, 몇 가지 좌절스러운 점이 있었습니다.
일일 생성 제한은 실제로 문제가 되었습니다. Google AI Plus 플랜에서 단 두 개의 비디오를 생성한 후, 저는 한계에 도달했습니다. 다음 메시지가 나타났습니다.

이것은 플랜 페이지의 모호한 "더 많은 접근" 및 "더 높은 접근" 언어가 실제 문제가 되는 부분입니다. 테스트를 계속하기 위해 다시 Google AI Pro로 업그레이드해야 했습니다. 네 가지 프롬프트를 실행하기 위해 두 번의 유료 업그레이드가 필요했습니다.
그리고 글리치도 있습니다. 우주비행사 헬멧 반사에서 왜곡된 얼굴, 하늘의 추가 행성, 방콕 시장 장면에서 추가된 대화. 이러한 시각적 및 오디오 아티팩트는 현실적이기를 원하는 경우 완전히 사용할 수 없게 만들 수 있습니다. Veo 3의 이러한 제한 사항은 유료 플랜을 구독하기 전에 염두에 두어야 합니다.
Google Veo 3는 가격 대비 가치가 있을까요? 솔직한 판단
이 테스트를 거친 후, Google Veo 3가 가치가 있는지에 대한 제 결론은 다음과 같습니다.
대화 중심 콘텐츠, 특히 말하는 얼굴 비디오, 다큐멘터리 스타일 인터뷰, 또는 캐릭터가 카메라를 직접 바라보며 말하는 모든 장면의 경우, Veo 3는 현재 사용 가능한 최고의 도구 중 하나입니다. 립싱크 품질과 자연스러운 말 생성은 정말로 인상적이며 따라가기 어렵습니다. 이것이 주요 사용 사례라면, 월 $19.99의 Google AI Pro 플랜은 합리적인 투자입니다.
그 외의 경우에는 더 많은 도박입니다. 제품 데모 테스트는 실망스러웠고, 액션 시퀀스는 엉망이었으며, 영화적 테스트는 출력물을 사용할 수 없게 만든 글리치가 있었습니다. 낮은 등급 플랜에서 일일 제한은 좌절감을 주며, 렌더링 시간은 작업을 느리게 만듭니다. AI 비디오를 실험하는 개인 창작자라면 시도해 볼 가치가 있습니다. 일관되고 신뢰할 수 있는 결과를 대규모로 필요로 하는 에이전시나 제작 팀이라면, 제한 사항이 현재로서는 이점을 능가할 수 있습니다.
결론: Veo 3는 적절한 조건에서 정말로 인상적이지만, 데모가 암시하는 신뢰할 수 있는 만능 비디오 생성기는 아직 아닙니다. 특정 강점을 가진 강력한 도구이며, 구독하기 전에 그 강점을 아는 것이 많은 좌절을 줄일 것입니다.
Manus가 AI 비디오 워크플로를 강화할 수 있는 방법
클립 생성은 프로세스의 일부일 뿐입니다. 완성된 비디오 프로젝트는 아이디어를 브레인스토밍하고, 스크립트와 프롬프트를 작성하며, 자산을 구성하고, 블로그 게시물, 소셜 캡션, 비디오 설명 등 콘텐츠를 실제로 볼 수 있도록 만드는 주변 콘텐츠를 생성해야 합니다. 여기서 Manus가 등장합니다.
저는 이 리뷰 과정에서 Manus를 사용했습니다: 테스트 접근 방식을 계획하고, 네 가지 프롬프트를 구조화하며, 메모와 결과를 정리하여 작성 전에 일관된 내용을 만들었습니다. 페이지에 단어를 쓰기 전에 생각을 정리하는 데 도움이 되는 도구를 갖추는 것은 여러 테스트 출력물을 처리하고 공정하게 비교하려고 할 때 큰 차이를 만듭니다. 비디오 콘텐츠 워크플로를 구축하고 있다면, 주변 작업을 위해 AI 에이전트를 사용하는 것이 가치가 있습니다. manus.im에서 무료로 Manus를 체험해 보세요.
자주 묻는 질문
Google Veo 3에 접근하려면 어떻게 해야 하나요?
Google의 유료 AI 플랜 중 하나를 구독하여 Gemini 앱을 통해 Google Veo 3에 접근할 수 있습니다. Google AI Plus 플랜($7.99/월)은 제한된 접근을 제공하며, Google AI Pro 플랜($19.99/월)은 Veo 3.1 Fast를 사용한 비디오 생성을 잠금 해제합니다. 가장 높은 제한으로 전체 접근은 Google AI Ultra 플랜($249.99/월)에서 가능합니다.
Google Veo 3의 무료 버전이 있나요?
Veo 3의 전용 무료 버전은 없습니다. 무료 Google AI 플랜은 매우 제한된 접근을 제공하며, Gemini 앱을 통한 직접 비디오 생성을 지원하지 않습니다. 무료 사용자는 Google Flow를 통해 제한된 접근을 가질 수 있지만, 실질적인 비디오 생성을 위해서는 유료 플랜이 필요합니다.
Google Veo 3의 제한 사항은 무엇인가요?
Veo 3의 주요 제한 사항은 일일 생성 제한(유료 플랜에서도), 클립당 약 3-5분의 느린 렌더링 시간, 최대 비디오 길이 8초, 가끔 발생하는 시각적 글리치 및 불일치, 복잡한 다중 요소 장면에서의 어려움 등을 포함합니다. 제품 샷에서의 객체 일관성과 액션 시퀀스에서의 캐릭터 행동도 부족한 영역입니다.
Google Veo 3는 8초 이상의 비디오를 생성할 수 있나요?
아니요, 현재 버전의 Google Veo 3는 최대 8초 길이의 클립을 생성합니다. 더 긴 콘텐츠의 경우, 여러 클립을 생성하고 Google Flow 또는 표준 비디오 편집 도구에서 함께 편집해야 합니다.
Google Veo 3는 OpenAI의 Sora보다 더 나은가요?
필요한 것에 따라 다릅니다. Veo 3는 대화 및 립싱크 현실감에서 명확한 이점을 가지고 있어, 말하는 얼굴이나 인터뷰 스타일 콘텐츠에 더 나은 선택입니다. Sora 2는 일반적으로 더 긴 내러티브 장면에서 더 잘 작동하며, 복잡한 프롬프트에서 캐릭터 행동이 더 일관됩니다. 대부분의 창작자에게 선택은 주요 사용 사례에 따라 달라집니다.