Google Veo 3를 테스트했고 여기 제 솔직한 리뷰가 있습니다

Manus의 콘텐츠 작가로서, 새로운 AI 도구를 테스트하는 것은 사실상 업무의 일부입니다. Google Veo 3가 출시되었을 때, 인터넷은 데모에 열광했습니다. 사실적인 토킹 헤드, 동기화된 오디오, 영화 같은 비주얼, 이 모든 것이 단 하나의 텍스트 프롬프트에서 나왔습니다. 저는 충분히 많은 AI 과대광고 사이클을 봐왔기 때문에 데모는 엄선된 것이고 실제 결과는 완전히 다른 이야기라는 것을 알고 있습니다.\n\n그래서 저는 실제로 Google Veo 3를 사용하는 데 시간을 좀 들여보기로 했습니다. 한계를 시험하기 위해 설계된 네 가지 서로 다른 프롬프트를 통해 실행하고, 모든 것을 솔직하게 기록했습니다.\n\n이는 Google의 마케팅 자료를 요약한 것이 아닙니다. 이는 저의 실제 경험을 바탕으로 한 Google Veo 3에 대한 직접 체험 리뷰이며, 인상적이었던 부분, 답답했던 부분, 그리고 그냥 노골적으로 작동하지 않았던 부분을 모두 포함합니다. 이 글이 끝날 때쯤이면 Veo 3가 무엇을 잘하는지, 어디서 부족한지, 가격만큼의 가치가 있는지, 그리고 경쟁 제품들과 어떻게 비교되는지 정확히 알게 될 것입니다.\n\n---\n\n## Google Veo 3란 무엇인가? (그리고 Veo 3.1의 새로운 점은?)\n\nGoogle Veo 3는 단일 텍스트 프롬프트에서 고품질 비디오 클립을 생성하는 고급 AI 비디오 생성 모델입니다. 동기화된 대화, 주변 음향 효과, 배경 음악을 모두 하나의 프롬프트로 지원하며, 현재 시중에 나와 있는 가장 사실적인 AI 생성 토킹 헤드 영상을 만들어내는 것으로 빠르게 명성을 얻었습니다.\n\nVeo 3는 2025년 중반 무렵 Google I/O에서 처음 발표되었고, 곧바로 그 해 가장 화제가 된 AI 비디오 생성기 중 하나가 되었습니다. 가장 최근 업데이트인 Veo 3.1에서는 의미 있는 개선이 이루어졌습니다: 더 나은 안정성, 더 정확한 립싱크, 더 일관된 캐릭터 생성, 그리고 1080p 및 4K로의 업스케일링. 이는 몇몇 Google 제품을 통해 접근할 수 있습니다 — 더 길고 복잡한 장면을 편집하고 시퀀싱하기 위해 만들어진 전문가용 영상 제작 도구인 Google Flow, 그리고 빠른 이미지-비디오 변환 생성과 짧은 클립에 초점을 맞춘 실험적 도구인 Google Whisk. 이번 리뷰에서는 Gemini 앱을 통해 테스트했으며, "Create video" 도구 알약을 선택하고 거기서 네 가지 프롬프트를 모두 실행했습니다.\n\n---\n\n## 제 직접 테스트 과정\n\n제대로 테스트하기 위해, 단순한 프롬프트를 던지고 끝내고 싶지 않았습니다. 저는 Manus에게 다양한 기능을 평가하기 위한 네 가지 구체적인 프롬프트를 설계하는 데 도움을 요청했습니다: 대화와 립싱크, 영화적 분위기, 제품 일관성, 그리고 빠른 액션. 그 과정이 실제로 어떻게 진행되었는지 다음과 같습니다.\n\n### 어떻게 액세스를 얻었는지 (그리고 여러분도 어떻게 얻을 수 있는지)\n\nVeo 3에 액세스하는 것은 처음에는 솔직히 좀 혼란스럽고, 흔한 골칫거리이기 때문에 짚고 넘어갈 가치가 있다고 생각합니다.\n\n
﻿
\n\n저는 무료 계정에서 시작했습니다. 인터페이스는 다른 AI 도구들과 비슷하게 꽤 평범했고, 프롬프트 입력창과 선택할 수 있는 몇 가지 도구 알약이 있었습니다. 비디오 생성 옵션은 어디에서도 보이지 않았습니다. 어쨌든 첫 번째 프롬프트를 입력해서 무슨 일이 일어나는지 보려고 했습니다.\n\n
﻿
\n\n제가 받은 것은 비디오가 아니라 이미지였습니다. 그 이미지는 사실 인상적이었고 프롬프트와 잘 맞았지만, 제가 요청한 것은 분명히 아니었습니다. 그런 다음 Gemini가 제 의도를 잘못 읽었을 수도 있다고 생각하고, 명시적으로 비디오를 만들어 달라고 요청했습니다. 받은 응답은 다음과 같았습니다: "구독을 업그레이드하시면 오늘 그 비디오를 만들어드릴 수 있습니다."\n\n
﻿
\n\n그래서 유료 플랜을 살펴보러 갔습니다.\n\n다음은 각 플랜이 비디오 생성을 위해 제공하는 현재 내역입니다:\n\n| 플랜 | 월 가격 | AI 적분 | Veo 3.1 액세스 |\n| :--- | :--- | :--- | :--- |\n| Free | $0 | 일일 50 적분 | Flow에 제한적 액세스, 애니메이트 및 이미지 생성 |\n| Google AI Plus | $7.99/월 | 월 200 적분 | Flow 및 Whisk의 이미지-비디오 변환 생성에 더 많은 액세스 |\n| Google AI Pro | $19.99/월 | 월 1,000 적분 | Flow 및 Whisk에 더 높은 액세스 |\n| Google AI Ultra | $249.99/월 | 월 25,000 적분 | Flow 및 Whisk에 최상위 액세스 |\n\n플랜에 대한 표현이 모호합니다. Google AI Plus는 "Veo 3로 이미지-비디오 변환 생성에 더 많은 액세스"라고 하고 Google AI Pro는 "더 높은 액세스"라고 합니다. 실제로 무엇을 얻는지 그다지 명확하지 않습니다. 저는 먼저 Google AI Plus를 선택했는데, 다음 단계의 등급이었고 효과가 있을 것 같았기 때문입니다. 결제하고, 구독하고, 시작! Plus 플랜에서는 무료 플랜에서는 이전에 사용할 수 없었던 "Create Video" 옵션이 추가된 것을 볼 수 있었습니다.\n\n
﻿
\n\n---\n\n## Veo 3의 한계를 테스트하기 위해 사용한 4가지 프롬프트\n\n다음은 Veo 3 기능의 다양한 측면을 테스트하기 위해 만든 네 가지 프롬프트입니다:\n\n1. 대화 및 립싱크 테스트 — 동기화된 대화로 핵심 네이티브 오디오 기능을 평가하기 위해.\n2. 영화적 및 분위기 테스트 — 복잡한 시각적 스타일과 카메라 연출을 얼마나 잘 처리하는지 평가하기 위해.\n3. 제품 및 객체 일관성 테스트 — 깔끔하고 전문적인 제품 비디오를 만들 수 있는지 확인하기 위해.\n4. 액션 및 모션 테스트 — 빠른 움직임, 역동적인 카메라 작업, 그리고 레이어된 오디오를 어떻게 처리하는지 보기 위해.\n\n---\n\n## 결과: 4가지 Veo 3 비디오 예시 (좋은 점, 나쁜 점, 그리고 결함이 있는 점)\n\n### 프롬프트 #1: 대화 및 립싱크 테스트\n\n사용한 프롬프트: "Medium close-up shot of a female historian in her 40s, with glasses, sitting in a warmly lit library. She looks directly at the camera, speaking with a thoughtful and engaging tone. She says, 'What most people don't realize about the Roman Empire is that its collapse wasn't a single event, but a slow, complex unraveling over centuries.' Ambient noise: the quiet rustle of turning pages and the soft hum of library air conditioning. Style: Documentary interview, shot on a high-quality digital camera."\n\n
﻿
\n\n제 경험: 좋아요, 저는 이것에 진심으로 깜짝 놀랐습니다. 과정은 매끄러웠고, 비디오는 몇 분 만에 준비되었습니다. 진짜 이야기인데: 생성되는 동안 다른 일을 하기 위해 탭을 전환했습니다. 다시 돌아와서 결과물을 봤을 때, 화면에 무작위 광고가 떴다고 실제로 생각했습니다. 그 정도로 사실적으로 보였습니다. 역사학자, 조명, 톤… 모든 것이 완벽했습니다. 그녀는 자연스러운 억양, 멈춤, 강조와 함께 말했습니다. 표정과 손짓도? 정확했습니다. 정말로 다큐멘터리 인터뷰에 어울릴 만한 수준이었습니다.\n\n유일하게 좀 어색하게 느껴졌던 것은 햇빛 속에 떠다니는 다소 강렬한 먼지 입자들이었는데, 약간 산만했습니다. 그리고 도서관 주변 소리를 요청했지만, 모델은 대신 미묘한 배경 음악 트랙을 제공했습니다. 하지만 솔직히? 그건 똑똑한 결정이었습니다. 음악이 다큐멘터리 스타일에 완벽하게 어울렸고, 어쩌면 제가 요청한 것보다 더 나았을지도 모릅니다. 정말 멋진 시작이었어요!\n\n| 좋았던 점 | 아쉬웠던 점 |\n| :--- | :--- |\n| 믿을 수 없을 정도로 사실적이고 자연스러운 캐릭터 | 햇빛 속 먼지 입자가 약간 산만했음 |\n| 자연스러운 말의 억양과 함께 완벽한 립싱크 | 특정 주변 소리 요청을 무시함 (그러나 좋은 판단을 내림) |\n| 다큐멘터리 인터뷰 스타일을 완벽하게 포착함 | |\n\n---\n\n### 프롬프트 #2: 영화적 및 분위기 테스트\n\n사용한 프롬프트: "Dolly shot moving slowly backwards, revealing a lone astronaut standing on the ridge of a crater on Mars. The sky is a dusty, reddish-orange with two small moons visible. The desolate and silent. Style: Epic science fiction, 4K, wide-angle lens, extremely detailed, awe-inspiring and melancholic mood."\n\n
﻿
\n\n제 경험: 이건 좀… 복합적이었습니다. 가장 먼저 눈에 띈 것은 우주비행사의 헬멧에 비친 반사였습니다. 저는 지구의 희미한 반사를 요청했지만, 받은 것은 한 남자 얼굴의 이상하고 왜곡된 조각이었습니다. 마치 투명도와 차원의 레이어들이 모두 잘못된 기괴한 결함처럼 완전히 어색해 보였습니다. 그것이 우주비행사 자신의 얼굴이었어야 했나요? 누가 알겠어요! 그냥 붙여놓은 것처럼 보였습니다.\n\n나머지는 나쁘지 않았습니다. 우주복, 분화구, 카메라 움직임, 모두 견고했습니다. 먼지와 모래 안개의 디테일은 사실 매우 사실적이었습니다. 하지만 프롬프트는 작은 달 두 개를 요청했는데, 하늘에는 크기가 다른 행성 세 개로 보이는 것이 나타났습니다. 결함이 있는 얼굴이 아쉬웠는데, 그것 없이는 인상적이었을 것입니다. AI 비디오 생성에서는 얻는 것도 있고 잃는 것도 있습니다. 모델은 태양, 별, 그리고 움직이는 안개를 추가했는데, 그것들은 잘 작동했습니다. 추가된 얼굴과 행성? 그렇지 않았습니다.\n\n| 좋았던 점 | 아쉬웠던 점 |\n| :--- | :--- |\n| 돌리 카메라 움직임의 좋은 실행 | 헬멧 반사의 왜곡된 얼굴이 큰 결함 |\n| 사실적인 먼지와 모래 안개 디테일 | "두 개의 달" 지시를 따르지 않음 |\n| 황량하고 서사적인 SF 분위기를 잘 포착함 | 우주비행사의 우주복이 일부 세부 디테일이 부족함 |\n\n---\n\n### 프롬프트 #3: 제품 및 객체 일관성 테스트\n\n사용한 프롬프트: "Turntable shot of a high-end, beautifully designed ceramic teapot. The teapot is a minimalist matte white, sitting on a plain, light grey surface. The camera slowly rotates 360 degrees around the teapot. Style: Clean product commercial, studio lighting, soft shadows, macro lens, extremely sharp focus, no background distractions."\n\n
﻿
\n\n제 경험: 이건 그냥… 그런대로였습니다. 특별히 인상적이지는 않았습니다. 모델은 프롬프트에 대한 가장 기본적이고 문자 그대로의 해석을 제공했습니다. 저는 "고급스럽고 아름답게 디자인된" 찻주전자를 요청했는데, 평범하고 전통적으로 보이는 도자기 주전자를 받았습니다. 카메라 각도는 맞았지만, 표면은 제가 지정한 옅은 회색 대신 흰색이었습니다. 그렇게 간단한 프롬프트에서 어떻게 그게 잘못될 수 있죠?\n\n정말 신경 쓰였던 것은 초점이었습니다. 저는 명확히 "매우 선명한 초점"을 요청했지만, 찻주전자는 흐릿했고, 가장자리가 깔끔하지 않아 마치 배경의 일부인 것처럼 보였습니다. 제품 광고로는 말이 되지 않습니다. 설상가상으로, 찻주전자가 회전할 때 손잡이가 프레임에서 잘려 나갔습니다. 모델은 샷에 있는 단 하나의 객체조차 완전히 보이게 유지하지 못했습니다. 제품 데모로는 큰 실패입니다.\n\n| 좋았던 점 | 아쉬웠던 점 |\n| :--- | :--- |\n| 정확한 카메라 각도와 회전 움직임 | 찻주전자 디자인이 평범하고 영감이 없음 |\n| 배경과 조명 설정은 대체로 정확함 | 비디오가 흐릿하고 초점이 맞지 않음 |\n| 360도 회전이 부드러웠음 | 회전 중에 제품이 잘려나감 |\n\n---\n\n### 프롬프트 #4: 액션 및 모션 테스트\n\n사용한 프롬프트: "Handheld POV shot of someone running through a crowded, vibrant night market in Bangkok. The camera is shaky as they weave between people and food stalls. Steam rises from woks, and colorful lanterns hang overhead. SFX: a cacophony of market sounds — people talking, food sizzling, distant music. The runner occasionally glances over their shoulder, breathing heavily. Style: Gritty action movie, realistic, immersive, slightly blurred motion."\n\n
﻿
\n\n제 경험: 이것은 제가 예상한 것이 아니었고, 좋은 의미에서 전혀 아니었습니다. 비디오는 한 캐릭터가 "비켜!"라고 외치는 것과 무작위 펀치 효과음으로 시작되었고, 즉시 제가 요청하지 않은 공격적인 도주 장면으로 바뀌었습니다. 시장은 붐볐지만, 무언가 매우 어색했습니다. 모두가 완벽하게 똑바로 정돈된 줄에 서 있었고, 아무도 움직이지 않았습니다. 그렇게 보이는 붐비는 시장을 본 적이 있나요? 완전히 부자연스러웠습니다.\n\n러너는 제가 요청한 특정 동작인 어깨 너머를 한 번도 돌아보지 않았습니다. 오디오도 엉망이었습니다. 유일하게 맞았던 소리는 러너의 거친 호흡뿐이었습니다. 나머지 시장 소리들은 너무 멀고 조용했는데, 가깝고 몰입감 있는 불협화음이어야 했습니다. 표지판들은 태국어와 중국어가 섞여 있어서, 구체적으로 방콕이 아니라 일반적인 "아시아 시장"처럼 느껴졌습니다. 이것은 그냥 "AI가 생성한" 티가 났습니다.\n\n| 좋았던 점 | 아쉬웠던 점 |\n| :--- | :--- |\n| 러너의 호흡 소리는 사실적이었음 | 원치 않는 대화와 음향 효과가 추가됨 |\n| 핸드헬드 카메라 느낌이 다소 있었음 | 군중이 정적이고 완전히 비현실적이었음 |\n| 시장의 조명과 색상이 활기참 | 설정이 방콕에 특정되지 않고 일반적으로 느껴짐 |\n\n---\n\n## 모든 것을 바꾸는 기능: 네이티브 오디오 및 립싱크\n\n제 네 가지 테스트에서의 일관되지 않은 결과에도 불구하고, 프롬프트 #1의 성공은 Veo 3가 왜 그렇게 많은 주목을 받고 있는지를 정말로 보여줍니다. 립싱크 품질이 진정으로 빛나는 부분입니다. 제 역사학자 테스트에서처럼 작동할 때, 그 결과는 실제 영상과 착각할 정도로 설득력이 있습니다. 모델은 단순히 입 모양을 단어에 맞추는 것이 아니라, 억양, 멈춤, 강조와 함께 자연스러운 말투를 생성합니다. 또한 장면에 더 잘 어울릴 때 주변 소음 대신 배경 음악을 선택하는 등, 오디오에 대한 창의적인 결정을 내립니다. 그런 종류의 맥락적 오디오 지능이 AI가 생성한 것처럼 보이는 클립과 실제로 견딜 만한 클립의 차이를 만듭니다.\n\n---\n\n## 짜증나는 부분들: 일일 한도, 느린 렌더링, 그리고 이상한 결함들\n\n여기서는 답답함에 대해 솔직히 말해야겠습니다. 왜냐하면 여러 가지가 있었기 때문입니다.\n\n일일 생성 한도가 정말 문제였습니다. Google AI Plus 플랜에서 단 두 개의 비디오를 생성한 후, 벽에 부딪혔습니다. 이 메시지가 나타났습니다.\n\n
﻿
\n\n여기서 플랜 페이지의 모호한 "더 많은 액세스" 및 "더 높은 액세스" 표현이 진짜 문제가 됩니다. 테스트를 계속하기 위해 Google AI Pro로 다시 업그레이드해야 했습니다. 단 네 가지 프롬프트를 실행하기 위해 두 번의 유료 업그레이드가 필요했던 것입니다.\n\n그리고 결함들이 있습니다. 우주비행사 헬멧 반사의 왜곡된 얼굴, 하늘의 추가 행성, 방콕 시장 장면의 추가된 대화. 이것들은 사실적인 결과를 원했다면 그 외에는 인상적인 결과물을 완전히 사용할 수 없게 만들 수 있는 종류의 시각 및 오디오 아티팩트입니다. 유료 플랜에 가입하기 전에 이러한 Veo 3 한계점들을 염두에 두는 것이 좋습니다.\n\n---\n\n## Google Veo 3는 가격만큼의 가치가 있는가? 제 솔직한 평결\n\n이러한 테스트 라운드 후, Google Veo 3가 가치가 있는지에 대해 제가 도달한 결론은 다음과 같습니다.\n\n대화 중심의 콘텐츠, 특히 토킹 헤드 비디오, 다큐멘터리 스타일 인터뷰, 또는 캐릭터가 카메라를 향해 직접 말하는 장면의 경우, Veo 3는 현재 사용 가능한 최고의 도구 중 하나입니다. 립싱크 품질과 자연스러운 음성 생성은 진정으로 인상적이며 따라잡기 어렵습니다. 그것이 주된 사용 사례라면, 월 $19.99의 Google AI Pro 플랜은 합리적인 투자입니다.\n\n그 외 모든 것에 대해서는, 더 도박에 가깝습니다. 제품 데모 테스트는 실망스러웠고, 액션 시퀀스는 엉망이었으며, 영화적 테스트에는 결과물을 사용할 수 없게 만든 결함이 있었습니다. 일일 한도는 답답하며, 특히 하위 등급 플랜에서 그렇고, 렌더링 시간이 작업을 늦춥니다. AI 비디오를 실험하는 1인 크리에이터라면 시도해 볼 가치가 있습니다. 대규모로 일관되고 신뢰할 수 있는 결과가 필요한 에이전시나 제작팀이라면, 한계점들이 현재로서는 이점을 능가할 수 있습니다.\n\n결론: Veo 3는 적절한 조건에서 진정으로 인상적이지만, 데모가 시사하는 신뢰할 수 있는 만능 비디오 생성기는 아직 아닙니다. 이는 특정한 강점 영역을 가진 강력한 도구이며, 구독하기 전에 그 강점 영역을 아는 것이 많은 답답함을 줄여줄 것입니다.\n\n---\n\n## Manus가 AI 비디오 워크플로우를 어떻게 강화할 수 있는가\n\n클립 생성은 과정의 한 부분일 뿐입니다. 완성된 비디오 프로젝트에는 아이디어 브레인스토밍, 스크립트 및 프롬프트 작성, 자산 정리, 그리고 주변 콘텐츠 — 실제로 콘텐츠가 보이게 하는 블로그 게시물, 소셜 캡션, 비디오 설명 — 작성이 필요합니다. 그것이 바로 Manus가 등장하는 지점입니다.\n\n저는 이 리뷰 과정 전반에 걸쳐 Manus를 사용했습니다: 테스트 접근 방식을 계획하고, 네 가지 프롬프트를 구조화하고, 작성하기 전에 제 메모와 발견 사항을 일관성 있는 것으로 통합하기 위해서요. 페이지에 단어를 쓰기 전에 생각을 정리하는 데 도움을 주는 도구를 갖는 것은 정말 차이를 만듭니다. 특히 여러 테스트 결과를 다루며 공정하게 비교하려고 할 때 그렇습니다. 비디오 콘텐츠 워크플로우를 구축하고 있다면, 주변 작업을 위해 AI agent를 곁에 두는 것이 좋습니다. manus.im에서 무료로 Manus를 사용해 볼 수 있습니다.\n\n---\n\n## 자주 묻는 질문\n\n### Google Veo 3에 어떻게 액세스할 수 있나요?\n\nGoogle의 유료 AI 플랜 중 하나에 구독하여 Gemini 앱을 통해 Google Veo 3에 액세스할 수 있습니다. Google AI Plus 플랜($7.99/월)은 제한된 액세스를 제공하며, Google AI Pro 플랜($19.99/월)은 Veo 3.1 Fast로 비디오 생성을 잠금 해제합니다. 가장 높은 한도로 완전히 액세스하려면 Google AI Ultra 플랜($249.99/월)에서 사용할 수 있습니다.\n\n### Google Veo 3의 무료 버전이 있나요?\n\nVeo 3 전용 무료 버전은 없습니다. 무료 Google AI 플랜은 매우 제한된 액세스를 가지며 Gemini 앱을 통한 직접 비디오 생성을 지원하지 않습니다. 무료 사용자는 Google Flow를 통해 제한된 액세스를 가질 수 있지만, 실용적인 비디오 생성에는 유료 플랜이 필요합니다.\n\n### Google Veo 3의 한계점은 무엇인가요?\n\n주요 Veo 3 한계점에는 일일 생성 한도(유료 플랜에서도), 클립당 약 3-5분의 느린 렌더링 시간, 최대 8초의 비디오 길이, 가끔씩 발생하는 시각적 결함과 비일관성, 그리고 복잡한 다중 요소 장면의 어려움이 포함됩니다. 제품 샷에서의 객체 일관성과 액션 시퀀스에서의 캐릭터 동작도 부족할 수 있는 영역입니다.\n\n### Google Veo 3는 8초보다 긴 비디오를 만들 수 있나요?\n\n아니요, Google Veo 3의 현재 버전은 최대 8초 길이의 클립을 생성합니다. 더 긴 콘텐츠의 경우, 여러 클립을 생성하여 Google Flow나 표준 비디오 편집기 같은 도구에서 함께 편집해야 합니다.\n\n### Google Veo 3가 OpenAI의 Sora보다 나은가요?\n\n무엇이 필요한지에 따라 다릅니다. Veo 3는 대화 및 립싱크 사실성에서 분명한 우위를 가지고 있어 토킹 헤드나 인터뷰 스타일 콘텐츠에 더 나은 선택입니다. Sora 2는 일반적으로 더 긴 내러티브 장면에서 더 나은 성능을 보이며 복잡한 프롬프트 전반에 걸쳐 더 일관된 캐릭터 동작을 가집니다. 대부분의 크리에이터에게 선택은 주된 사용 사례에 달려 있습니다.