Pourquoi les Vidéos Sont Si Volumineuses
La taille d'un fichier vidéo est déterminée par une formule simple : débit × durée. Une vidéo encodée à 8 Mbps (mégabits par seconde) produit 60 Mo par minute — c'est-à-dire 1 Mo par seconde de séquence. À résolution 4K avec les codecs modernes, les débits augmentent encore plus, et les fichiers deviennent énormes très rapidement.
Pour mieux comprendre, voici ce que produisent différents scénarios d'enregistrement :
| Source | Résolution | Codec | Taille par Minute |
|---|---|---|---|
| iPhone (Plus Compatible) | 1080p 30fps | H.264 | ~130 Mo |
| iPhone (Haute Efficacité) | 4K 30fps | HEVC | ~170 Mo |
| iPhone (4K 60fps) | 4K 60fps | HEVC | ~375 Mo |
| iPhone Pro (ProRes) | 4K 30fps | ProRes 422 | ~6 000 Mo |
| GoPro HERO | 4K 60fps | HEVC | ~450 Mo |
| Enregistrement écran (1080p) | 1080p 30fps | H.264 | ~40–80 Mo |
Une vidéo iPhone 4K 60fps de 10 minutes à 375 Mo par minute pèse 3,75 Go — trop volumineuse pour l'email (limite 25 Mo), la plupart des applications de messagerie (généralement 100–200 Mo), et lente à télécharger sur les réseaux sociaux. Les cinq méthodes ci-dessous peuvent réduire ce fichier de 3,75 Go à moins de 500 Mo tout en maintenant une qualité visuellement indistinguible de l'original.
Méthode 1 — Contrôle de la Qualité CRF
CRF (Constant Rate Factor) est le paramètre le plus important pour contrôler la taille des fichiers vidéo. Au lieu de spécifier un débit cible, CRF indique à l'encodeur quelle qualité vous souhaitez. L'encodeur décide alors automatiquement du nombre de bits dont chaque image a besoin — les scènes complexes avec beaucoup de mouvement obtiennent plus de bits, tandis que les scènes statiques en reçoivent moins.
L'échelle CRF pour H.264 (libx264) varie de 0 (sans perte, fichiers énormes) à 51 (pire qualité, fichiers minuscules). En pratique, vous ne utiliserez que la plage 18–28 :
| Valeur CRF | Niveau de Qualité | Taille Approx. (1 min 1080p) | Cas d'Usage |
|---|---|---|---|
| 18 | Visuellement sans perte | ~120 Mo | Archivage, copies maîtres |
| 23 | Excellent (défaut) | ~60 Mo | Usage général, partage |
| 26 | Bon | ~35 Mo | Vidéos web, tutoriels |
| 28 | Acceptable | ~25 Mo | Réseaux sociaux, email |
| 32 | Faible | ~12 Mo | Aperçus, miniatures |
La commande FFmpeg pour convertir avec contrôle CRF :
ffmpeg -i input.mov -c:v libx264 -crf 23 -preset medium -c:a aac -b:a 192k -movflags +faststart output.mp4
Modifiez -crf 23 en n'importe quelle valeur du tableau ci-dessus. Les nombres plus bas signifient une meilleure qualité et des fichiers plus volumineux. La relation entre CRF et taille de fichier est à peu près exponentielle : chaque incrément de +6 réduit environ de moitié la taille du fichier.
Règle rapide : +6 CRF ≈ réduit de moitié la taille du fichier. Baisser la résolution d'un cran (4K → 1080p) réduit de ~75%. Combiner les deux peut réduire un fichier de 90 % ou plus.
Méthode 2 — Préset d'Encodage Plus Lent
Le préset de l'encodeur contrôle le temps que FFmpeg consacre à l'optimisation de chaque image. Les présets plus lents trouvent des moyens plus efficaces de compresser la même qualité visuelle, produisant des fichiers plus petits à la même valeur CRF. Le compromis est le temps d'encodage — mais le résultat est toujours un fichier plus petit avec une qualité visuelle identique.
FFmpeg propose des présets allant de ultrafast à veryslow. Voici comment ils se comparent :
| Préset | Vitesse d'Encodage | Taille du Fichier (relative) | Quand l'Utiliser |
|---|---|---|---|
ultrafast | 10x | +80% | Diffusion en direct uniquement |
fast | 4x | +15% | Tâches de traitement par lots rapides |
medium | 2x | référence | Défaut — bon équilibre |
slow | 1x | -15% | Meilleure qualité par octet |
veryslow | 0.5x | -20% | Rendus finaux, tâches nocturnes |
Le préset slow est le bon équilibre. Il produit des fichiers 10–20 % plus petits que le préset medium à la même valeur CRF, sans modification de la qualité visuelle. Le seul coût est le temps d'encodage — environ 2x plus long que medium. Pour une vidéo de 5 minutes, cela signifie 3 minutes d'encodage au lieu de 1,5 minute sur du matériel typique.
ffmpeg -i input.mov -c:v libx264 -crf 23 -preset slow -c:a aac -b:a 192k -movflags +faststart output.mp4
Le préset veryslow gagne une réduction supplémentaire de 5 % mais prend deux fois plus de temps que slow. Pour la plupart des gens, les rendements décroissants rendent veryslow non rentable. Le préset slow capture la majorité des gains de compression.
Méthode 3 — Réduire la Résolution
Réduire la résolution est le moyen le plus efficace de réduire la taille des fichiers car cela réduit directement le nombre de pixels que l'encodeur doit traiter. Chaque étape de résolution suit à peu près une relation 4x en nombre de pixels :
| Résolution | Nombre de Pixels | Taille Relative | Réduction de 4K |
|---|---|---|---|
| 4K (3840×2160) | 8,3 millions | 100% | — |
| 1080p (1920×1080) | 2,1 millions | ~25 % | -75 % |
| 720p (1280×720) | 0,9 million | ~12 % | -88 % |
| 480p (854×480) | 0,4 million | ~5 % | -95 % |
Réduire 4K à 1080p réduit la taille du fichier d'environ 75 %. Sur l'écran d'un smartphone, la différence entre 4K et 1080p est pratiquement invisible car la densité de pixels des écrans modernes dépasse déjà 1080p aux distances de visualisation normales. Même sur un moniteur de bureau de 27 pouces, la différence est minime à moins que vous ne scruter les pixels.
La commande FFmpeg pour réduire à 1080p :
ffmpeg -i input.mov -c:v libx264 -crf 23 -preset slow -vf "scale=1920:-2" -c:a aac -b:a 192k -movflags +faststart output.mp4
Le filtre scale=1920:-2 fixe la largeur à 1920 pixels et calcule automatiquement la hauteur pour maintenir le rapport d'aspect. Le -2 garantit que la hauteur est divisible par 2 (requis par H.264). Pour 720p, utilisez scale=1280:-2.
Passer de 1080p à 720p réduit un autre 50 % de la taille du fichier. Sur les téléphones, 720p par rapport à 1080p est à peine perceptible pour la plupart du contenu. Cela fait de 720p un excellent choix quand la taille du fichier est la préoccupation principale — pièces jointes email, applications de messagerie, ou scénarios avec bande passante limitée.
Méthode 4 — Réduire la Fréquence d'Images
La fréquence d'images détermine le nombre d'images par seconde qui composent la vidéo. Réduire de 60 fps à 30 fps réduit de moitié les données temporelles, ce qui se traduit par une réduction significative de la taille du fichier. Les économies réelles dépendent de la complexité du contenu, mais vous pouvez généralement vous attendre à une réduction de 30–40 % (pas une réduction complète de 50 % car l'encodage CRF alloue déjà moins de bits aux images redondantes).
ffmpeg -i input.mov -c:v libx264 -crf 23 -preset slow -r 30 -c:a aac -b:a 192k -movflags +faststart output.mp4
Le flag -r 30 force la sortie à 30 images par seconde. Quand est-il sûr de réduire la fréquence d'images ?
- Vidéos de présentation, tutoriels, présentations : 24fps ou 30fps est parfait. Ces types de contenu ont un mouvement minimal, et les spectateurs ne remarqueront pas la différence.
- Vlogs, vidéos de voyage, séquences générales : 30fps a un aspect naturel et fluide. La plupart des émissions télévisées et du cinéma utilisent 24fps, donc 30fps dépasse en fait ce à quoi les audiences sont habituées.
- Jeux, sports, action rapide : Gardez 60fps. La fréquence d'images plus élevée est nécessaire pour un mouvement fluide dans le contenu en rythme rapide. Réduire à 30fps introduira du scintillement visible lors des mouvements rapides de caméra ou d'objets en mouvement rapide.
Si votre source a été enregistrée à 30fps, il n'y a aucun avantage à réduire davantage à 24fps — les économies seraient minimes (environ 20 %) et vous risquez d'introduire des artefacts de synchronisation inégale appelés saccades.
Méthode 5 — Utiliser un Codec Moderne
H.265 (également connu sous le nom de HEVC) offre environ 50 % de meilleure compression que H.264 à la même qualité visuelle. Cela signifie qu'un fichier qui serait de 60 Mo avec H.264 devient environ 30 Mo avec H.265, sans différence de qualité perceptible.
ffmpeg -i input.mov -c:v libx265 -crf 28 -preset slow -tag:v hvc1 -c:a aac -b:a 192k -movflags +faststart output.mp4
Notez que l'échelle CRF est différente pour H.265. CRF 28 en H.265 produit à peu près la même qualité visuelle que CRF 23 en H.264. Le flag -tag:v hvc1 est critique — sans lui, les appareils Apple (Safari, iPhone, iPad, Mac) ne joueront pas le fichier. Cette balise marque le flux comme HEVC de la manière qu'Apple attend.
| Fonctionnalité | H.264 (x264) | H.265 (x265) |
|---|---|---|
| Efficacité de compression | Référence | 40–50 % plus petit |
| Vitesse d'encodage | Rapide | 5–10x plus lent |
| Compatibilité de lecture | Universelle (99 %+) | Appareils modernes (post-2017) |
| Compatibilité des navigateurs | Tous les navigateurs | Safari, Edge, Chrome (partiel) |
| Réseaux sociaux | Toutes les plates-formes | Toutes les plates-formes l'acceptent |
| Qualité équivalente CRF | CRF 23 | CRF 28 |
Le compromis est clair : H.265 produit des fichiers dramatiquement plus petits, mais l'encodage prend 5–10x plus longtemps et la compatibilité de lecture est plus limitée. Pour le contenu qui sera lu sur des appareils modernes ou téléchargé sur les réseaux sociaux (où la plate-forme réencode de toute façon), H.265 est un excellent choix. Pour le contenu qui doit lire sur n'importe quel appareil, y compris les anciens téléviseurs intelligents, projecteurs ou lecteurs intégrés, restez avec H.264.
Il y a aussi AV1, un codec encore plus récent qui égale ou dépasse l'efficacité de compression de H.265 tout en étant libre de droits. Cependant, l'encodage AV1 est actuellement extrêmement lent (20–50x plus lent que H.264), ce qui le rend impractique pour la plupart des utilisateurs. À mesure que l'encodage AV1 matériel devient disponible dans les GPUs plus récents, cela changera.
Tableau d'Estimation Rapide de la Taille
Le tableau suivant montre les tailles de fichier estimées pour 1 minute de vidéo selon différents paramètres. Utilisez-le pour estimer la taille de votre fichier de sortie avant de commencer l'encodage. Ce sont des approximations — les tailles réelles varient en fonction de la complexité du contenu (les séquences d'action sont plus volumineuses que les discours).
| Résolution | CRF | Codec | IPS | Taille Est. / min |
|---|---|---|---|---|
| 4K (3840×2160) | 18 | H.264 | 30 | ~500 Mo |
| 4K (3840×2160) | 23 | H.264 | 30 | ~200 Mo |
| 4K (3840×2160) | 28 | H.265 | 30 | ~60 Mo |
| 1080p (1920×1080) | 18 | H.264 | 30 | ~120 Mo |
| 1080p (1920×1080) | 23 | H.264 | 30 | ~60 Mo |
| 1080p (1920×1080) | 28 | H.264 | 30 | ~25 Mo |
| 1080p (1920×1080) | 28 | H.265 | 30 | ~15 Mo |
| 720p (1280×720) | 23 | H.264 | 30 | ~30 Mo |
| 720p (1280×720) | 28 | H.264 | 30 | ~15 Mo |
| 720p (1280×720) | 28 | H.265 | 30 | ~8 Mo |
| 480p (854×480) | 28 | H.264 | 30 | ~7 Mo |
La ligne en surbrillance (1080p, CRF 23, H.264, 30fps) est le paramètre par défaut de CleverUtils — il produit le meilleur équilibre entre qualité et taille de fichier pour la grande majorité des cas d'utilisation. Pour les uploads sur les réseaux sociaux, vous pouvez utiliser CRF 28 à 1080p puisque la plate-forme réencodera de toute façon votre vidéo.
Compression Audio
La taille des fichiers vidéo reçoit toute l'attention, mais l'audio contribue aussi. Dans une vidéo 1080p typique, l'audio représente 5–15 % de la taille totale du fichier. Bien que cela semble mineur, les économies s'accumulent sur les vidéos plus longues et peuvent faire la différence entre respecter une limite de taille de fichier ou non.
| Paramètre Audio | Débit | Taille par Minute | Qualité |
|---|---|---|---|
| AAC Stéréo | 192 kbps | 1,44 Mo | Transparent (sûr pour la musique) |
| AAC Stéréo | 128 kbps | 0,96 Mo | Bon pour la parole & ambiant |
| AAC Mono | 64 kbps | 0,48 Mo | Acceptable pour la voix uniquement |
Pas d'audio (-an) | 0 kbps | 0 Mo | Vidéo muette |
Passer de 192 kbps à 128 kbps économise 480 Ko par minute (environ 29 Mo par heure). Pour les vidéos de tutoriels et d'enregistrements d'écran où l'audio est principalement de la parole, 128 kbps AAC est plus que suffisant — la parole ne bénéficie pas de débits supérieurs à 96 kbps.
Si la vidéo n'a pas besoin d'audio du tout (remplaçants GIF animés, boucles de fond, B-roll muet), supprimez-le entièrement :
ffmpeg -i input.mov -c:v libx264 -crf 23 -preset slow -an -movflags +faststart output.mp4
Le flag -an supprime tous les flux audio, économisant l'intégralité du débit audio du fichier de sortie.
Combiner les Méthodes pour une Réduction Maximale
Les cinq méthodes ci-dessus ne s'excluent pas mutuellement. Vous pouvez les combiner dans une seule commande FFmpeg pour des réductions de taille de fichier dramatiques. Voici un exemple du monde réel qui applique les cinq méthodes simultanément :
ffmpeg -i input.mov -c:v libx265 -crf 28 -preset slow -tag:v hvc1 -vf "scale=1920:-2" -r 30 -c:a aac -b:a 128k -movflags +faststart output.mp4
Cette commande prend un fichier MOV ProRes 4K 60fps et produit un MP4 H.265 à 1080p 30fps avec CRF 28 et audio 128 kbps. Le résultat est un fichier qui est 95–98 % plus petit que le ProRes original tout en ayant excellent sur n'importe quel écran. Un fichier ProRes de 6 Go par minute devient environ 15–20 Mo par minute.
Pour le scénario le plus courant — une vidéo iPhone 4K HEVC que vous voulez rendre plus petite pour partager — cette commande unique fonctionne bien :
ffmpeg -i iPhone_video.MOV -c:v libx264 -crf 26 -preset slow -vf "scale=1920:-2" -c:a aac -b:a 128k -movflags +faststart output.mp4
Cela réduit à 1080p, utilise H.264 pour la compatibilité maximale, définit CRF 26 pour un bon rapport qualité-taille, et utilise l'audio 128 kbps. Une vidéo iPhone 4K HEVC typique d'une minute (~170 Mo) devient environ 25–35 Mo — assez petite pour l'email, les applications de messagerie, et les uploads rapides.