Por Que os Vídeos São Tão Grandes
O tamanho do arquivo de vídeo é determinado por uma fórmula simples: taxa de bits × duração. Um vídeo codificado a 8 Mbps (megabits por segundo) produz 60 MB por minuto — ou seja, 1 MB por segundo de metragem. Em resolução 4K com codecs modernos, as taxas de bits sobem ainda mais, e os arquivos ficam enormes rapidamente.
Para colocar isso em perspectiva, aqui está o que diferentes cenários de gravação produzem:
| Fonte | Resolução | Codec | Tamanho por Minuto |
|---|---|---|---|
| iPhone (Most Compatible) | 1080p 30fps | H.264 | ~130 MB |
| iPhone (High Efficiency) | 4K 30fps | HEVC | ~170 MB |
| iPhone (4K 60fps) | 4K 60fps | HEVC | ~375 MB |
| iPhone Pro (ProRes) | 4K 30fps | ProRes 422 | ~6.000 MB |
| GoPro HERO | 4K 60fps | HEVC | ~450 MB |
| Gravação de tela (1080p) | 1080p 30fps | H.264 | ~40–80 MB |
Um vídeo iPhone 4K 60fps de 10 minutos com 375 MB por minuto pesa 3,75 GB — muito grande para email (limite de 25 MB), maioria dos aplicativos de mensagens (tipicamente 100–200 MB), e lento para fazer upload em mídias sociais. Os cinco métodos abaixo podem reduzir esse arquivo de 3,75 GB para menos de 500 MB mantendo a qualidade visualmente indistinguível do original.
Método 1 — Controle de Qualidade CRF
CRF (Constant Rate Factor) é a configuração mais importante para controlar o tamanho do arquivo de vídeo. Em vez de especificar uma taxa de bits alvo, CRF diz ao codificador qual qualidade você deseja. O codificador então automaticamente decide quantos bits cada quadro precisa — cenas complexas com muito movimento ganham mais bits, enquanto cenas estáticas ganham menos.
A escala CRF para H.264 (libx264) varia de 0 (sem perda, arquivos enormes) a 51 (pior qualidade, arquivos diminutos). Na prática, você só usará o intervalo 18–28:
| Valor CRF | Nível de Qualidade | Tamanho Aprox. (1 min 1080p) | Caso de Uso |
|---|---|---|---|
| 18 | Visualmente sem perda | ~120 MB | Arquivamento, cópias mestras |
| 23 | Excelente (padrão) | ~60 MB | Uso geral, compartilhamento |
| 26 | Bom | ~35 MB | Vídeos web, tutoriais |
| 28 | Aceitável | ~25 MB | Mídia social, email |
| 32 | Baixo | ~12 MB | Visualizações, miniaturas |
O comando FFmpeg para converter com controle CRF:
ffmpeg -i input.mov -c:v libx264 -crf 23 -preset medium -c:a aac -b:a 192k -movflags +faststart output.mp4
Altere -crf 23 para qualquer valor na tabela acima. Números mais baixos significam melhor qualidade e arquivos maiores. A relação entre CRF e tamanho de arquivo é aproximadamente exponencial: cada incremento de +6 reduz aproximadamente à metade o tamanho do arquivo.
Regra rápida: +6 CRF ≈ reduz à metade o tamanho do arquivo. Diminuir resolução um passo (4K → 1080p) reduz ~75%. Combinando ambos pode reduzir um arquivo em 90% ou mais.
Método 2 — Preset de Codificação Mais Lento
O preset do codificador controla quanto tempo FFmpeg dedica a otimizar cada quadro. Presets mais lentos encontram maneiras mais eficientes de comprimir a mesma qualidade visual, produzindo arquivos menores no mesmo valor CRF. O compromisso é o tempo de codificação — mas o resultado é sempre um arquivo menor com qualidade visual idêntica.
FFmpeg oferece presets de ultrafast a veryslow. Veja como eles se comparam:
| Preset | Velocidade de Codificação | Tamanho do Arquivo (relativo) | Quando Usar |
|---|---|---|---|
ultrafast | 10x | +80% | Apenas transmissão ao vivo |
fast | 4x | +15% | Trabalhos em lote rápidos |
medium | 2x | linha de base | Padrão — bom equilíbrio |
slow | 1x | -15% | Melhor qualidade por byte |
veryslow | 0.5x | -20% | Renderizações finais, trabalhos noturnos |
O preset slow é o ponto ideal. Produz arquivos que são 10–20% menores que o preset medium no mesmo valor CRF, sem alteração na qualidade visual. O único custo é o tempo de codificação — aproximadamente 2x mais longo que medium. Para um vídeo de 5 minutos, isso significa 3 minutos de codificação em vez de 1,5 minuto em hardware típico.
ffmpeg -i input.mov -c:v libx264 -crf 23 -preset slow -c:a aac -b:a 192k -movflags +faststart output.mp4
O preset veryslow consegue uma redução adicional de 5% mas leva o dobro do tempo do slow. Para a maioria das pessoas, os retornos decrescentes tornam veryslow não vale a pena esperar. O preset slow captura a maioria dos ganhos de compressão.
Método 3 — Reduzir Resolução
Reduzir a resolução é a forma singular mais eficaz de reduzir o tamanho do arquivo porque reduz diretamente o número de pixels que o codificador deve processar. Cada passo de resolução segue aproximadamente uma relação 4x na contagem de pixels:
| Resolução | Contagem de Pixels | Tamanho Relativo | Redução de 4K |
|---|---|---|---|
| 4K (3840×2160) | 8,3 milhões | 100% | — |
| 1080p (1920×1080) | 2,1 milhões | ~25% | -75% |
| 720p (1280×720) | 0,9 milhões | ~12% | -88% |
| 480p (854×480) | 0,4 milhões | ~5% | -95% |
Fazer downscale de 4K para 1080p reduz o tamanho do arquivo em aproximadamente 75%. Em uma tela de smartphone, a diferença entre 4K e 1080p é praticamente invisível porque a densidade de pixels das telas modernas já supera 1080p em distâncias de visualização normais. Mesmo em um monitor de desktop de 27 polegadas, a diferença é mínima a menos que você esteja vasculhando pixels.
O comando FFmpeg para fazer downscale para 1080p:
ffmpeg -i input.mov -c:v libx264 -crf 23 -preset slow -vf "scale=1920:-2" -c:a aac -b:a 192k -movflags +faststart output.mp4
O filtro scale=1920:-2 define a largura como 1920 pixels e calcula a altura automaticamente para manter a proporção de aspecto. O -2 garante que a altura seja divisível por 2 (necessário por H.264). Para 720p, use scale=1280:-2.
Ir de 1080p para 720p reduz mais 50% do tamanho do arquivo. Em telefones, 720p versus 1080p é mal perceptível para a maioria do conteúdo. Isso torna 720p uma escolha excelente quando o tamanho do arquivo é a preocupação principal — anexos de email, aplicativos de mensagens, ou cenários com largura de banda limitada.
Método 4 — Reduzir Taxa de Quadros
A taxa de quadros determina quantas imagens por segundo compõem o vídeo. Reduzir de 60fps para 30fps reduz à metade os dados temporais, o que se traduz em uma redução significativa do tamanho do arquivo. A economia real depende da complexidade do conteúdo, mas você pode tipicamente esperar uma redução de 30–40% (não uma redução completa de 50% porque a codificação CRF já aloca menos bits para quadros redundantes).
ffmpeg -i input.mov -c:v libx264 -crf 23 -preset slow -r 30 -c:a aac -b:a 192k -movflags +faststart output.mp4
A bandeira -r 30 força a saída para 30 quadros por segundo. Quando é seguro reduzir a taxa de quadros?
- Vídeos com cabeça falante, tutoriais, apresentações: 24fps ou 30fps é perfeitamente fino. Esses tipos de conteúdo têm movimento mínimo, e os espectadores não notarão a diferença.
- Vlogs, vídeos de viagem, metragem geral: 30fps parece natural e suave. A maioria dos programas de TV e filmes usa 24fps, então 30fps na verdade excede o que as audiências estão acostumadas.
- Jogos, esportes, ação rápida: Mantenha 60fps. A taxa de quadros mais alta é necessária para movimento suave em conteúdo de ritmo acelerado. Reduzir para 30fps introduzirá gagueira visível durante movimentos rápidos de câmera ou objetos em movimento rápido.
Se sua fonte foi gravada a 30fps, não há benefício em reduzir ainda mais para 24fps — a economia seria mínima (cerca de 20%) e você arriscaria introduzir artefatos de temporização de quadro desigual chamados judder.
Método 5 — Usar um Codec Moderno
H.265 (também conhecido como HEVC) oferece aproximadamente 50% melhor compressão que H.264 na mesma qualidade visual. Isso significa que um arquivo que seria 60 MB com H.264 se torna aproximadamente 30 MB com H.265, sem diferença de qualidade perceptível.
ffmpeg -i input.mov -c:v libx265 -crf 28 -preset slow -tag:v hvc1 -c:a aac -b:a 192k -movflags +faststart output.mp4
Observe que a escala CRF é diferente para H.265. CRF 28 em H.265 produz aproximadamente a mesma qualidade visual que CRF 23 em H.264. A bandeira -tag:v hvc1 é crítica — sem ela, dispositivos Apple (Safari, iPhone, iPad, Mac) não reproduzirão o arquivo. Esta etiqueta marca a stream como HEVC da maneira que o software Apple espera.
| Recurso | H.264 (x264) | H.265 (x265) |
|---|---|---|
| Eficiência de compressão | Linha de base | 40–50% menor |
| Velocidade de codificação | Rápido | 5–10x mais lento |
| Suporte de reprodução | Universal (99%+) | Dispositivos modernos (pós-2017) |
| Compatibilidade do navegador | Todos os navegadores | Safari, Edge, Chrome (parcial) |
| Mídia social | Todas as plataformas | Todas as plataformas aceitam |
| Qualidade CRF equivalente | CRF 23 | CRF 28 |
O compromisso é claro: H.265 produz arquivos dramaticamente menores, mas a codificação leva 5–10x mais longo e a compatibilidade de reprodução é mais limitada. Para conteúdo que será reproduzido em dispositivos modernos ou carregado em mídia social (onde a plataforma recodifica de qualquer forma), H.265 é uma escolha excelente. Para conteúdo que deve ser reproduzido em qualquer dispositivo, incluindo TVs inteligentes antigas, projetores ou reprodutores incorporados, mantenha o H.264.
Há também AV1, um codec ainda mais novo que iguala ou supera a eficiência de compressão de H.265 enquanto sendo isento de royalties. No entanto, a codificação AV1 é atualmente extremamente lenta (20–50x mais lenta que H.264), tornando-a impraticável para a maioria dos usuários. À medida que a codificação AV1 de hardware se torna disponível em GPUs mais novas, isso mudará.
Tabela de Estimativa Rápida de Tamanho
A tabela a seguir mostra tamanhos de arquivo estimados para 1 minuto de vídeo em diferentes configurações. Use-a para estimar qual será o tamanho do seu arquivo de saída antes de começar a codificação. Estas são aproximações — os tamanhos reais variam dependendo da complexidade do conteúdo (metragem de ação é maior que cabeças falantes).
| Resolução | CRF | Codec | FPS | Tamanho Est. / min |
|---|---|---|---|---|
| 4K (3840×2160) | 18 | H.264 | 30 | ~500 MB |
| 4K (3840×2160) | 23 | H.264 | 30 | ~200 MB |
| 4K (3840×2160) | 28 | H.265 | 30 | ~60 MB |
| 1080p (1920×1080) | 18 | H.264 | 30 | ~120 MB |
| 1080p (1920×1080) | 23 | H.264 | 30 | ~60 MB |
| 1080p (1920×1080) | 28 | H.264 | 30 | ~25 MB |
| 1080p (1920×1080) | 28 | H.265 | 30 | ~15 MB |
| 720p (1280×720) | 23 | H.264 | 30 | ~30 MB |
| 720p (1280×720) | 28 | H.264 | 30 | ~15 MB |
| 720p (1280×720) | 28 | H.265 | 30 | ~8 MB |
| 480p (854×480) | 28 | H.264 | 30 | ~7 MB |
A linha destacada (1080p, CRF 23, H.264, 30fps) é a configuração padrão de CleverUtils — produz o melhor equilíbrio de qualidade e tamanho de arquivo para a grande maioria dos casos de uso. Para uploads de mídia social, você pode usar CRF 28 em 1080p já que a plataforma recodificará seu vídeo de qualquer forma.
Compressão de Áudio
O tamanho do arquivo de vídeo recebe toda a atenção, mas o áudio também contribui. Em um vídeo 1080p típico, o áudio representa 5–15% do tamanho total do arquivo. Embora isso pareça menor, as economias se acumulam em vídeos mais longos e podem fazer a diferença entre cumprir ou não um limite de tamanho de arquivo.
| Configuração de Áudio | Taxa de Bits | Tamanho por Minuto | Qualidade |
|---|---|---|---|
| AAC Estéreo | 192 kbps | 1,44 MB | Transparente (seguro para música) |
| AAC Estéreo | 128 kbps | 0,96 MB | Bom para fala & ambiente |
| AAC Mono | 64 kbps | 0,48 MB | Aceitável para voz apenas |
Sem áudio (-an) | 0 kbps | 0 MB | Vídeo silencioso |
Mudar de 192 kbps para 128 kbps economiza 480 KB por minuto (aproximadamente 29 MB por hora). Para vídeos de tutoriais e gravação de tela onde o áudio é principalmente fala, 128 kbps AAC é mais que suficiente — a fala não se beneficia de taxas de bits acima de 96 kbps.
Se o vídeo não precisa de áudio (substituições de GIF animado, loops de fundo, B-roll silencioso), remova-o completamente:
ffmpeg -i input.mov -c:v libx264 -crf 23 -preset slow -an -movflags +faststart output.mp4
A bandeira -an remove todas as streams de áudio, economizando a taxa de bits de áudio completa do arquivo de saída.
Combinando Métodos para Máxima Redução
Os cinco métodos acima não são mutuamente exclusivos. Você pode combiná-los em um único comando FFmpeg para reduções dramáticas de tamanho de arquivo. Aqui está um exemplo do mundo real que aplica todos os cinco métodos simultaneamente:
ffmpeg -i input.mov -c:v libx265 -crf 28 -preset slow -tag:v hvc1 -vf "scale=1920:-2" -r 30 -c:a aac -b:a 128k -movflags +faststart output.mp4
Este comando pega um arquivo MOV ProRes 4K 60fps e produz um MP4 H.265 em 1080p 30fps com CRF 28 e áudio 128 kbps. O resultado é um arquivo que é 95–98% menor que o ProRes original enquanto parece excelente em qualquer tela. Um arquivo ProRes de 6 GB por minuto se torna aproximadamente 15–20 MB por minuto.
Para o cenário mais comum — um vídeo iPhone 4K HEVC que você deseja fazer menor para compartilhar — este comando único funciona bem:
ffmpeg -i iPhone_video.MOV -c:v libx264 -crf 26 -preset slow -vf "scale=1920:-2" -c:a aac -b:a 128k -movflags +faststart output.mp4
Isso faz downscale para 1080p, usa H.264 para máxima compatibilidade, define CRF 26 para uma boa relação qualidade-tamanho, e usa áudio 128 kbps. Um vídeo iPhone 4K HEVC típico de 1 minuto (~170 MB) se torna aproximadamente 25–35 MB — pequeno o suficiente para email, aplicativos de mensagens, e uploads rápidos.