Tous les formats de musique. Description des principaux formats audio

Dans le monde de la musique, il existe un grand nombre de formats musicaux, leurs modifications et versions, créés par des géants de l'industrie musicale et de petites entreprises qui ont acquis une reconnaissance publique dans le monde électronique.

A ces fins, diverses méthodes physiques de stockage de données audio ont été développées, par exemple : disques vinyles, bandes magnétiques, CD, DAT, MD (minidisc), DVD ou conversion de notes en formats musicaux (MIDI), de la même manière de nombreux des méthodes informatiques ont vu le jour pour le stockage de données audio – numériques : formats OGG, Mp3, Flac, Wav.

Il est impossible de passer en revue et de discuter de tous les formats audio, codecs, de leurs avantages et inconvénients. Dans mon article, je vais donc essayer de parler des extensions de fichiers audio les plus populaires que vous rencontrez.

Pourquoi ne pouvons-nous pas utiliser de format d’encodage de fichier audio universel ? Parce que pour implémenter diverses fonctions, vous avez besoin de votre propre format. Par exemple : pour lire un CD dans un lecteur de CD, pour enregistrer de la musique ou des effets sonores dans des jeux vidéo, pour enregistrer une piste de film ou un clip vidéo, pour lire sur un téléphone portable ou pour transférer des fichiers sur Internet, il existe en outre un certain nombre de des systèmes d'exploitation les plus répandus dans le monde . Il s'agit notamment des Amiga, Macintosh, NEXT et des ordinateurs personnels équipés du système d'exploitation Windows.

De plus, le travail d’un dj, d’un ingénieur du son, d’un cj, d’un ingénieur vidéo ou d’un simple mélomane est de nature bien différente. Cela peut nécessiter que vos données audio soient enregistrées à votre manière. Par exemple, l'audio d'un CD doit être stocké sur 16 bits et une fréquence d'échantillonnage de 44,1 kHz. Cependant, pour télécharger de l'audio sur Internet, il est préférable d'utiliser une profondeur de bits et un taux d'échantillonnage différents, car chaque minute d'audio 16 bits et 44 kilohertz occupe environ 10 Mo, c'est-à-dire une piste moyenne d'une durée de 5 minutes fera 50 "mètres" - c'est trop de données pour l'utilisateur moyen. Cet article fournit de brèves informations sur les formats musicaux les plus populaires.

Les AA(Fichier de livre audio audio) – le format est fermé, développé par Audible. Il est utilisé pour enregistrer des livres audio vendus via Audible et iTunes. Il est possible de ralentir ou d'accélérer la vitesse d'écoute des fichiers - pitch numérique, possibilité de laisser des signets lors de l'écoute de livres audio, protection des fichiers lors de la diffusion d'enregistrements sonores via Internet.

A.A.C.(Codage audio avancé) – un format de fichier audio avec moins de perte de qualité lors de l’encodage que le Mp3 de mêmes tailles. Encodage de musique sans perte de qualité originale à l'aide du profil ALAC. AAC est une famille d'algorithmes de codage audio MPEG4. Contrairement à la banque de filtres mp3 hybrides, AAC utilise la technologie MDST (transformation cosinus modifiée) - cela signifie que l'auditeur reçoit une meilleure qualité sonore que l'encodage MP3 avec un débit binaire identique ou inférieur. Extensions de fichier AAC possibles : [.m4a], [ .m4b ], [ .m4p ] .

AAC est également un algorithme de codage audio à large bande qui utilise deux principes de codage de base pour réduire considérablement la quantité de données requise pour transmettre un son numérique de haute qualité. Ce format est de la plus haute qualité, utilisant une compression avec perte, pris en charge par la plupart des équipements modernes, y compris les portables.

Depuis 2009, il est beaucoup moins répandu que le MP3 et d'autres solutions alternatives. AAC (Advanced Audio Coding) a été créé à l'origine pour succéder au MP3 avec une qualité d'encodage améliorée. Le format AAC, officiellement connu sous le nom d'ISO/IEC 13818-7, a été lancé en 1997 en tant que septième nouveau membre de la famille MPEG-2. Il existe également un format AAC appelé MPEG-4 Part 3.

Avantages de l'AAC par rapport au MP3 :

– jusqu'à 48 canaux audio ;

– une plus grande efficacité de codage à débit binaire constant et variable;

– fréquences d'échantillonnage de 8 Hz à 96 kHz (MP3 : 8 Hz - 48 kHz) ;

– Mode stéréo commun plus flexible.

ADXest un format propriétaire de compression et de stockage audio avec perte basé sur ADPCM développé par CRI Middleware spécifiquement pour une utilisation dans les jeux vidéo. La caractéristique la plus caractéristique est la possibilité de mettre en boucle un enregistrement sonore, ce qui rend le format pratique à utiliser comme musique de fond dans divers jeux prenant en charge ce conteneur multimédia. Il est pris en charge par de nombreux jeux SEGA Dreamcast et certains jeux PlayStation 2 et GameCube.

Contrairement au MP3, il n'utilise pas le modèle psychoacoustique de réduction du volume des données sonores (réduction de leur complexité). Au lieu de cela, le modèle ADPCM utilise un enregistrement de données d'erreur de prédiction relative pour stocker les échantillons, ce qui signifie une plus grande préservation du signal d'origine après le codage ; Essentiellement, la compression ADPCM, plutôt que d'utiliser des échantillons entièrement redimensionnés de l'enregistrement audio, fournit des échantillons de l'écart du signal par rapport à la valeur précédente qui sont beaucoup plus petits, généralement 4 bits. Pour l’oreille humaine, cet écart se situe au niveau du bruit, ce qui rend la perte de qualité à peine perceptible.

AIFFest un format de fichier standard pour enregistrer des données audio sur la plate-forme Macintosh. Si jamais vous avez besoin de transférer des fichiers audio entre un ordinateur personnel et un ordinateur Macintosh, utilisez ce format. Il prend en charge les données audio mono et stéréo 8 et 16 bits. Les fichiers dans ce format peuvent contenir ou non un en-tête Mac-Binary. Si un fichier de ce type ne contient pas d'en-tête Mac-Binary, il a très probablement une extension aif. Si un fichier de ce type contient un en-tête Mac-Binary, Sound Forge l'ouvrira mais l'identifiera comme fichier de ressources Macintosh (voir la section suivante). Dans ce cas, le fichier porte très probablement l’extension snd. Remarque Lorsque des fichiers sont enregistrés sur des ordinateurs Macintosh, un en-tête Mac-Binary leur est ajouté. Il s'agit d'une petite information écrite au début d'un fichier qui identifie le type de fichier du système d'exploitation Mac OS et d'autres applications. C'est une façon pour les ordinateurs Macintosh de vous indiquer ce que contient un fichier : du texte, des graphiques ou des données audio, par exemple.

RAM(Multi-taux adaptatif) [ . amr] - codage adaptatif à débit variable. Norme de codage de fichiers audio spécialement conçue pour la compression du signal dans la gamme de fréquences vocales. Normalisé par l'ETSI (European Telecommunications Standards Institute). L'utilisation de l'AMR permet de fournir une capacité de réseau élevée avec simultanément une transmission vocale de haute qualité. AMR dispose d'une large gamme de vitesses d'encodage/décodage vocal et vous permet de basculer de manière flexible entre différents modes en fonction des conditions environnementales ou de la charge du réseau, garantissant une transmission vocale d'une clarté cristalline dans toutes les conditions.

SINGE.– (Audio du singe) [ . singe] – développeur Matthew T. Ashland – format audio numérique sans perte ( sans perte ). Le codec Monkey's Audio est disponible uniquement pour la plate-forme Microsoft Windows, bien qu'il existe un certain nombre de codecs non officiels pour MacOS, Linux et BeOS. Les fichiers audio de Monkey utilisent les extensions suivantes : .ape pour stocker l'audio et .apl pour stocker les métadonnées. Ce format n'est pas gratuit, car sa licence restreint sérieusement la distribution.

PommeSans perte[. m4 un] – est un codec audio développé par Apple Inc pour compresser la musique numérique sans perte de données. Les données Apple Lossless sont stockées dans un conteneur MP4 avec l'extension .m4a. Bien qu'Apple Lossless ait la même extension de fichier qu'AAC, ce n'est pas AAC, le codec est similaire à d'autres codecs Lossless tels que FLAC, etc. Un iPod doté d'un connecteur dock (pas de lecture aléatoire) et du dernier firmware peut lire des fichiers dans Apple. Format sans perte. Il n'utilise aucune gestion des droits numériques (DRM), mais étant donné la nature du conteneur, on pense que le DRM peut s'appliquer à l'ALAC.

Des tests ont montré que les fichiers compressés par ALAC représentent environ 40 à 60 % de la taille des originaux, selon le type de musique, comme les autres formats sans perte. De plus, la vitesse à laquelle il peut être décodé le rend utile pour les appareils aux performances limitées tels que l'iPod.

Apple Lossless Encoder a été introduit en tant que composant de QuickTime 6.5.1 le 28 avril 2004 et en tant que fonctionnalité d'iTunes 4.5. Le codec est également utilisé dans AirPort Express dans l'implémentation AirTunes.

Un décodeur pour le format Apple Lossless est désormais disponible dans la bibliothèque open source libavcodec. Cela signifie que tout lecteur multimédia basé sur cette bibliothèque, y compris les médias VLC et MPlayer, peut lire les fichiers Apple Lossless.

CDDA(Audio numérique sur disque compact) - disque compact audio, une norme internationale pour le stockage de l'audio numérisé sur des disques compacts, introduite par Philips et Sony. Les informations audio sont présentées en modulation d'impulsions codées avec une fréquence d'échantillonnage de 44,1 kHz et un débit binaire de 1411,2 kbit/s, stéréo 16 bits.

AVECSpécification audio du Livre rouge :

– la durée maximale de tous les enregistrements est de 79,8 minutes ;

– temps de piste minimum - 4 secondes (y compris une pause de 2 secondes) ;

– nombre maximum de pistes - 99 ;

– nombre maximum de points de référence (tronçons de voie) - 99 sans restriction de temps ;

- presence obligatoire Code d'enregistrement standard international (ISRC).

ETD– (Digital Theater System), essentiellement du Dolby Digital , ou plutôt son concurrent. Format ETD utilise un niveau de compression minimal que Dolby , donc en fait ça sonne mieux, ce qui est prouvé en pratique DVD disques sur lesquels les pistes sont enregistrées Format DTS ou DD.

ETD Il s'agit d'un système de cinéma numérique - une famille de systèmes d'enregistrement sonore multicanaux numériques créés par la société Digital Theater System pour présenter des bandes sonores numériques dans les cinémas de manière synchrone avec des copies de films en location. En plus des copies de films d'accompagnement, les deux systèmes ( DTS et Dolby Digital ) sous une forme simplifiée sont utilisés sur les disques vidéo optiques destinés au visionnage à domicile. ETD utilise moins de compression que Dolby , mais aucun des systèmes n’a une supériorité absolue. Débat sur les avantages DTS ou Dolby Digital ne se sont pas arrêtés à ce jour. Format Stéréo DTS presque identique Dolby Surround. ETD Prend en charge les options audio 5.1 canaux et 7.1 canaux. ETD dans les cinémas maison, il permet un débit binaire complet (1 509,75 kbps).

FLAC(codec gratuit du projet Ogg)[.flac] – (Anglais Free Lossless Audio Codec - codec audio gratuit sans perte) - un codec gratuit populaire pour la compression audio. Contrairement aux codecs avec perte Ogg Vorbis, MP3 et AAC, FLAC ne supprime aucune information du flux audio et convient à la fois à l'écoute de musique sur un équipement de reproduction sonore de haute qualité et à l'archivage d'une collection audio. Aujourd'hui, le format FLAC est pris en charge par de nombreuses applications audio. Pour stocker les types de métadonnées de base, le décodeur de base utilise des balises ID 3 contre 1 et ID 3 contre 2, afin qu’ils puissent être librement ajoutés et modifiés.

MIDI(Interface numérique pour instruments de musique) – interface numérique des instruments de musique. Il s'agit d'une norme d'enregistrement audio numérique pour le format d'échange de données entre instruments de musique électroniques.

L'interface vous permet d'encoder uniformément sous forme numérique des données telles que les frappes au clavier, le réglage du volume et d'autres paramètres acoustiques, le choix du timbre, du tempo, de la tonalité, etc., avec un timing précis. Le système de codage contient de nombreuses commandes gratuites que les fabricants, programmeurs et utilisateurs peuvent utiliser à leur discrétion. Ainsi, l'interface MIDI permet, en plus de jouer de la musique, de synchroniser le contrôle d'autres équipements, par exemple l'éclairage, la pyrotechnie, etc.

Une séquence de commandes MIDI peut être enregistrée sur n'importe quel support numérique sous forme de fichier et transmise via tous canaux de communication. L'appareil ou le programme de lecture est appelé synthétiseur MIDI (séquenceur) et est en fait un instrument de musique automatique.

Député2 (MPEG-1 Audio Layer II ou Musicam) [ . député2 ] – l'un des trois formats (niveau 2) de compression audio avec perte définis dans la norme MPEG-1. Utilisé dans la diffusion numérique DAB et dans l'ancienne norme Vidéo CD, utilisée pour distribuer des films sur disques compacts optiques dans les années 1990 et qui existait avant que les DVD ne se généralisent.

L'encodeur MPEG-1 Audio Layer 2 a évolué à partir du codec audio MUSICAM (Masking pattern adapter Universal Subband Integrated Coding And Multiplexing) développé par le CCETT, Philips et l'IRT en 1989 dans le cadre des études EUREKA de 147 développements intergouvernementaux européens pour les systèmes de radiodiffusion numérique. pour appareils de réception fixes, portables et mobiles. Les principaux paramètres de MPEG-1 Audio ont été hérités de MUSICAM, notamment la banque de filtres, le traitement du domaine temporel, la taille de l'image audio, etc. Cependant, après de nouvelles améliorations, l'algorithme MUSICAM n'a pas été utilisé dans la version finale de la norme MPEG-1 Layer II.

Député3 (MPEG couche 3) [ . député3 ] – le troisième format d'encodage de piste audio, MPEG, est un format de fichier sous licence pour stocker des informations audio. À l'heure actuelle, MP3 est le plus célèbre et le plus populaire des formats d'encodage numérique avec perte courants pour les informations audio. Il est largement utilisé dans les réseaux de partage de fichiers pour l'évaluation de la musique. Le format peut être lu dans presque tous les systèmes d'exploitation populaires, sur presque tous les lecteurs audio portables, et est également pris en charge par tous les modèles modernes de systèmes stéréo et de lecteurs DVD.

Le format MP3 utilise un algorithme de compression avec perte conçu pour réduire considérablement la taille des données nécessaires à la lecture d'un enregistrement et fournir une qualité de lecture très proche de l'original (selon la plupart des auditeurs), bien que les audiophiles signalent une différence notable. Lors de la création d'un MP3 à un débit moyen de 128 kbps, le fichier résultant fait environ 1/10 de la taille du fichier CD audio original. Les fichiers MP3 peuvent être créés avec un débit binaire élevé ou faible, ce qui affecte la qualité du fichier résultant. Le principe de la compression consiste à réduire la précision de certaines parties du flux audio, le rendant pratiquement inaudible pour la plupart des gens. Cette méthode est appelée codage perceptuel. Dans ce cas, dans un premier temps, un diagramme sonore est construit sous la forme d'une séquence de courtes périodes de temps, puis les informations non perceptibles à l'oreille humaine en sont supprimées et les informations restantes sont stockées dans un format compact. formulaire. Cette approche est similaire à la méthode de compression utilisée lors de la compression d'images au format JPEG. De nombreux gourmets de la musique préfèrent compresser la musique avec une qualité maximale – 320 kbps , ou passez à d'autres formats, par exemple FLAC , où le débit binaire moyen est d'environ 1 000 kbps.

MusePack[. mpc] – format de fichier sans licence pour stocker des informations audio, distribué sur Licence publique générale GNU.

Musepack utilise des bandes de fréquences, il appartient donc aux codecs dits de sous-bandes. La principale caractéristique est le réglage précis de la psychoacoustique, qui vous permet de travailler avec un encodage VBR pur (encodage à débit binaire variable). L'objectif principal de Musepack est la transparence du son de la musique encodée.

Dans les formats modernes, tels que MP3, Vorbis, AAC, AC3, WMA, une deuxième conversion dct est effectuée, ce qui leur permet d'obtenir une meilleure qualité à des débits moyens et faibles, mais ne leur permet pas d'obtenir de bons résultats à des débits plus élevés. MusePack n'effectue pas de seconde conversion DCT, ce qui vous permet d'obtenir une qualité inégalée à des débits supérieurs à 180.

Tout comme en AAC et dans certains autres formats modernes, Musepack associe les canaux par bandes de fréquences, ce qui a un léger impact sur la qualité, mais vous permet d'économiser beaucoup sur la taille. En MP3, les canaux ne sont pas appariés par bandes de fréquences, mais pour la bande entière, divisant le signal en sous-bandes de fréquences, puis décomposant le signal en une série de cosinus (MDCT - un cas particulier de la transformée de Fourier) et enregistrant l'arrondi (quantifié ) valeurs des coefficients obtenus après la conversion (la quantification s'effectue conformément à l'analyse psychoacoustique effectuée). MPC, après avoir divisé le signal en sous-bandes de fréquence, requantifie simplement (sur la base de la psychoacoustique) le signal d'amplitude dans chaque sous-bande et écrit les valeurs arrondies (quantifiées) résultantes dans le flux de sortie. Le même fait explique la vitesse élevée de compression et de décompression du MPC.

MODÈLE– format développé pour la plateforme Amiga. Chaque fichier MOD contient des enregistrements numérisés des sons réels des instruments, appelés échantillons, quelque peu similaires à la structure MIDI. Un Cj ou un compositeur écrivant au format MOD utilise un programme appelé tracker, dans lequel il indique quel instrument doit sonner à quelle heure, dans quelle note et octave - cette séquence de notes est enregistrée dans une liste - une piste, et plusieurs parallèles les pistes sonores forment un bloc, appelé motif. Un ensemble de modèles forme un module - un fichier au format MOD avec l'extension .mod. Une ligne de tracker correspond à un canal réel dans lequel le cj peut jouer ou éditer des notes numérotées. Les notes peuvent se voir attribuer divers « ornements » - par exemple : trémolo, glissando, etc.

OGG [.ogv], [.oga], [.ogx], [.ogg] – un format de conteneur multimédia standard ouvert, qui est le principal format de fichier et de streaming pour les codecs multimédia de la Fondation Xiph.Org, ainsi que le nom du projet développant ce format et ses codecs. Comme toutes les technologies développées sous les auspices de Xiph.Org, le format Ogg est un standard ouvert et libre, sans restrictions de brevet ou de licence.

Ogg n'est qu'un conteneur. La musique ou la vidéo est compressée par des codecs et le résultat du traitement est stocké dans des conteneurs similaires. Les conteneurs Ogg peuvent stocker des flux codés avec plusieurs codecs. Par exemple, un fichier contenant de la vidéo et de l'audio peut contenir des données codées avec des codecs audio et vidéo.

Le conteneur Ogg peut stocker de l'audio et de la vidéo dans différents formats (tels que MPEG-4, Dirac, MP3 et autres).

Audio réel[. ra],[. RAM] – Prop standard pour le streaming et le format de fichier multimédia appartenant à " Produits et services RealNetworks." Audio réel introduit pour la première fois dans le cadre du package Audio réel 10, codec pour la compression audio sans perte de qualité.

Parmi les avantages de ce codec figurent la prise en charge du streaming et un décodage très rapide. Les inconvénients incluent un code fermé et le manque de fonctionnalités multicanaux. Disponible pour Microsoft Windows, Macintosh et GNU/Linux.

RKAU[.rka] – Parmi tous les codecs audio, RKAU occupe une place très particulière. Premièrement, c’est l’encodeur le plus petit (seulement 25 Ko !) et le plus rapide. Deuxièmement, outre le fait qu'il s'agit d'un programme de compression audio sans perte, il propose des modes de compression avec perte qui offrent un plus grand degré de compression que tous les algorithmes sans perte connus. Cependant, en raison des particularités de l'algorithme sous-jacent à rkau, les distorsions introduites par le codec ne se situent pas dans la région spectrale (comme dans le cas des modèles psychoacoustiques de MP3, MP+, AAC et autres encodeurs), mais dans la région réelle. Autrement dit, ils ont, en gros, une nature non linéaire, comme les distorsions de la plupart des chemins. Dans ce cas, il n'y a pas de perte de petits détails et de microplans du phonogramme. Cependant, si vous en faites « trop » à cet égard, le son peut devenir complètement indigeste : des artefacts semblables à du bruit dur apparaîtront dans le son et le son lui-même acquerra une coloration prononcée.

Dans la hiérarchie des codecs audio, le programme rkau se démarque complètement. Il est si original qu'il n'a pas d'analogue parmi les autres algorithmes de compression de données audio. La petite taille du programme d'encodeur (25 Ko) et la vitesse de fonctionnement élevée avec des taux de compression similaires à d'autres algorithmes sans perte font de rkau un leader incontesté. Et bien qu'OptimFROG, évoqué dans la partie précédente de l'article, puisse être considéré comme l'encodeur sans perte le plus efficace, rkau n'est que légèrement en retard en termes d'efficacité. Cependant, lorsque le mode de compression « avec perte » est activé, rkau, même dans le mode de qualité la plus élevée, laisse loin derrière tous les algorithmes sans perte, se rapprochant en efficacité des programmes basés sur le modèle psychoacoustique (MP3, MP+, AAC, VQF et autres). Dans ce cas, la perte de microplans et de nuances du matériel audio original, caractéristique des algorithmes de type MPEG, ne se produit pas, et les artefacts qui surviennent inévitablement ne peuvent être remarqués que sur des équipements de très haute qualité avec une écoute comparative répétée.

Raccourcir[.shn] – est un format utilisé pour compresser les données audio. Cette forme de compression de fichiers est utilisée pour la compression de qualité CD, tp gjnthm fichiers audio (44,1 kHz, 16 bits, stéréo PCM ). Ce format est encore utilisé par certaines personnes car il est légal de vendre des enregistrements de concerts dans lesquels sont codés comme Raccourcissez les fichiers.

Spex [. spx] est un codec de compression vocale libre qui peut être utilisé dans les applications de voix sur Internet ( VoIP ). Il est fort probable qu'il n'ait aucune restriction en matière de brevet et qu'il soit sous licence sous la dernière version de la licence. BSD (sans le troisième article). Codec compressé Spex les données peuvent être stockées soit au format de stockage de données audio Ogg , ou transmettre directement à l'aide de paquets UDP/RTP.

Les développeurs contrastent leur développement avec d'autres codecs ouverts, par exemple le codec Vorbis , prétendant que c'est le codec Spex mieux adapté à la voix sur un réseau où la livraison des paquets de données n'est pas fiable. Dans le même temps, les auteurs du développement soulignent spécifiquement que le codec est adapté à une utilisation dans des réseaux avec une transmission de paquets peu fiable, c'est-à-dire que le paquet est arrivé ou non.

Spex appartient à la classe des soi-disant Prédiction linéaire excitée par code (CELP) )-codecs, c'est-à-dire des codecs construits sur la base du soi-disant codage prédictif linéaire LPK. LPK utilise un filtre numérique avec uniquement des connexions de rétroaction (appelé « filtre autorégressif ») pour se rapprocher d'un segment d'un signal vocal. Les coefficients de ce filtre sont « ajustés » au segment de signal selon la procédure de Levinson (dans la littérature occidentale - Levinson-Durbin). CELP - la modification du LPK prévoit la présence de ce qu'on appelle. « livre de codes », qui contient des ensembles prédéfinis d'impulsions uniques excitant le filtre LPC.

Signal vocal dans le codec Spex est divisé en segments non chevauchants d'une durée de 20 ms (160 échantillons à 8 KHz). Dans ce cas, pour évaluer l’ensemble excitateur, le segment ci-dessus est divisé en quatre sous-segments d’une durée de 5 ms, respectivement. Sur chacun des sous-segments, des ensembles d'impulsions excitantes sont recherchés à la fois pour le sous-segment actuel (à partir du livre de codes) et pour les deux sous-segments précédents. Contrairement aux autres codecs, afin d'éviter les restrictions liées aux brevets, Spex n'utilise pas de codage algébrique, mais uniquement un codage vectoriel. Les excitations des deux sous-sections précédentes sont ajoutées avec des poids variables, contrairement à un certain nombre d'autres codecs qui utilisent des positions temporelles variables.

Selon les développeurs, Spex optimisé pour une parole de haute qualité à basse vitesse. Codec Spex permet également une compression variable du signal et prend en charge les signaux avec différentes bandes passantes : ultra-large bande (taux d'échantillonnage de 32 kHz), large bande (16 kHz) et bande étroite (8 kHz).

DONC(Audio Kompressor sans perte de Tom) [ . donc] – Codec audio et format de compression audio numérique sans perte. Il a un taux de compression et une vitesse d'encodage et de décodage élevés. Distribué gratuitement avec un ensemble de logiciels d'encodage et de lecture, ainsi que des plug-ins pour les lecteurs populaires : Winamp, foobar2000, etc. Développé par Thomas Becker, Allemagne. Codec relativement nouveau. La première version finale 1.0 a été publiée le 26 janvier 2007.

Le format continue d'être activement développé (dernière version 1.1.1) et est actuellement, selon une enquête sur le forum Hydrogenaudio.org, l'un des trois formats de compression audio sans perte les plus populaires (après FLAC et WavPack).

TTA(Vrai audio) – un codec audio gratuit qui compresse les fichiers musicaux sans perte en temps réel. Le codec est basé sur des filtres prédictifs adaptatifs et possède toutes les caractéristiques améliorées de la plupart des encodeurs modernes. La taille du fichier compressé sera de 30 à 70 % plus petite que celle du fichier musical original. Le format TTA prend en charge les balises ID3v1 et ID3v2. Grâce au codec True Audio, vous pouvez placer jusqu'à 20 CD audio sur un disque DVD-R.

TwinVQ(Transformation – quanisation vectorielle d'entrelacement pondérée de domaine) - quantification vectorielle avec domaines de transformation et entrelacement pondéré), développée au Japon au laboratoire Laboratoires d'interface humaine NTT.

Les fichiers VQF sont environ 30 à 35 % plus petits que les MP3 avec la même qualité sonore. Un flux de 128 Kbps pour les fichiers MP3 correspond à un flux de 80 Kbps pour les fichiers VQF. Ces avantages ont aussi un inconvénient. Le décodage utilise également 30 % de CPU en plus que le décodage MP3. Cela détermine des exigences accrues pour l'ordinateur sur lequel vous envisagez de lire ces fichiers.

Les tests montrent la supériorité du VQF à tous égards aux basses fréquences et avec beaucoup moins de distorsion de la forme d'onde avec une large plage dynamique (vraie musique). Cependant, en termes d'atténuation des fréquences supérieures du spectre audio, le VQF est inférieur de 2 à 3 dB au MP3 aux fréquences supérieures à 15 kHz. Ceci, cependant, est facilement compensé en ajustant l’égaliseur du lecteur, ce qui place objectivement VQF au-dessus de la qualité sonore par rapport au MP3.

VQF(Quantisation vectorielle entrelacée)– développé au Japon et basé sur la technologie TwinVQ. Si l'on compare VQF et MP3, alors le premier format sera 30 à 50 % plus compact, avec la même qualité sonore. Cela donne à VQF un avantage significatif par rapport au format MP3. Mais le processus d'encodage, de décodage (décodeur) VQF, nécessite environ 30 % de ressources de processeur PC en plus que l'audio Mp3.

Les tests montrent la supériorité du TwinVQ à tous égards aux basses fréquences et avec beaucoup moins de distorsion de la forme d'onde avec une large plage dynamique (vraie musique). Cependant, en termes d'atténuation des fréquences supérieures du spectre sonore, TwinVQ est inférieur de 2 à 3 dB au MP3 aux fréquences supérieures à 15 kHz. Ceci, cependant, est facilement compensé en ajustant l’égaliseur du lecteur, ce qui place objectivement TwinVQ au-dessus de la qualité sonore par rapport au MP3.

Vorbis [. ogg] est un format de compression audio gratuit avec perte qui est officiellement apparu à l'été 2002. En termes de fonctionnalité et de qualité, il est similaire aux codecs tels que AAC, AC3 et VQF, qui sont supérieurs au MP3. Le modèle psychoacoustique utilisé dans Vorbis est similaire dans ses principes de fonctionnement à celui du MP3 et autres, mais le traitement mathématique et la mise en œuvre pratique de ce modèle sont sensiblement différents, ce qui a permis aux auteurs de déclarer leur format complètement indépendant de tous ses prédécesseurs.

Ogg Vorbis utilise par défaut un débit binaire variable, mais ce dernier n'est limité à aucune valeur fixe et peut varier même de 1 kbps. Il convient de noter que le débit binaire maximum n'est pas strictement limité par le format et qu'avec les paramètres d'encodage maximum, il peut varier de 500 à 1 000 kbps. La fréquence d'échantillonnage a la même flexibilité, offrant aux utilisateurs le choix entre 2 et 192 kHz.

Vorbis a été développé par la communauté Xiphophorus pour remplacer tous les formats audio propriétaires payants. Bien qu'il s'agisse du format le plus récent de tous les concurrents MP3, Ogg Vorbis est entièrement pris en charge sur toutes les plates-formes populaires (Microsoft Windows, Linux, Apple Mac OS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS, etc.) et Il existe également un grand nombre d'implémentations matérielles. Cependant, malgré tous ses avantages par rapport à ses concurrents, la popularité de ce format reste faible.

WAV(Format audio de forme d'onde) [ . wav], [. vague] – développé conjointement avec IBM . Format d'enregistrement audio non compressé (stéréo ou mono). Ainsi, une seule minute d'enregistrement sonore stéréo réalisé en qualité CD (fréquence d'échantillonnage 44,1 KHz) contient 60 s x 44 100 Hz x 2 canaux = 5 292 000 échantillons. Chaque échantillon peut avoir 8 ou 16 bits. Ainsi, dans la version 8 bits par échantillon, une minute de son prendra 42 336 000 bits = 5 292 000 octets (environ 5 Mo) en mémoire.

WavPack[.wv], [.wvс] – Codec audio gratuit et open source pour la compression audio sans perte de qualité. Conçu par David Briant.

Le format WavPack vous permet de compresser (et décompresser) des fichiers audio 8, 16, 24 et 32 bits au format .WAV. Il prend également en charge la diffusion de son surround et des taux d'échantillonnage élevés. Comme les autres méthodes de compression sans perte, l'efficacité de la compression dépend des données sources, mais elle se situe généralement entre 30 % et 70 % pour la musique populaire générale, légèrement plus élevée pour la musique classique et d'autres sources avec une plage dynamique plus large.

WavPack comprend également un mode « hybride » unique qui offre tous les avantages de la compression sans perte avec le bonus supplémentaire : au lieu de créer un seul fichier, ce mode crée une qualité avec perte de haute qualité (plus précisément, spécifiée lors de l'encodage) relativement faible (. WV) qui peut être lu seul, ainsi qu'un fichier de « correction » (.WVC) qui (en combinaison avec le précédent .WV) vous permet de restaurer complètement l'original. Pour certains utilisateurs, cela signifie qu’ils n’auront jamais à choisir entre une compression sans perte et avec perte.

WMA(Windows Media Audio) [ . wma] – un format de fichier sous licence développé par Microsoft pour stocker et diffuser des informations audio. Initialement, le format WMA se positionnait comme une alternative au MP3, mais aujourd'hui Microsoft l'oppose au format AAC (utilisé dans le populaire magasin de musique en ligne iTunes).

Nominalement, le format WMA possède de bonnes capacités de compression, ce qui lui permet de « contourner » le format MP3 et de rivaliser en termes de paramètres avec les formats Ogg Vorbis et AAC. Mais comme l'ont montré des tests indépendants ainsi que des évaluations subjectives, la qualité des formats n'est toujours pas clairement équivalente et l'avantage même sur le MP3 est évident, comme le prétend Microsoft. Il convient particulièrement de noter que les premières versions du format (ou sa mise en œuvre) rencontraient des problèmes à faible débit. De plus, de nombreux mélomanes et propriétaires de lecteurs numériques n'aiment pas le format WMA en raison de sa faible résistance aux erreurs. Si lors de l'encodage/du transfert d'un fichier WMA, une partie de celui-ci est endommagée, la lecture du fichier devient alors impossible, à la fois après le point d'endommagement et plusieurs dizaines de secondes avant. (À titre de comparaison, si un fichier MP3 est endommagé, vous pouvez toujours le lire du début jusqu'au point même de l'endommagement, puis sauter quelques secondes et le lire jusqu'à la fin ; parfois des erreurs de quelques octets dans un fichier MP3 sont subtil ou pas perceptible du tout. ) Cependant, ce format évolue constamment, on peut donc supposer que la qualité sera optimisée.

La plupart des lecteurs audio portables prennent en charge le format WMA ainsi que le MP3. Ce format est très mal supporté sur les plateformes alternatives (en raison de son caractère fermé).

Microsoft a inclus la prise en charge de la gestion des droits numériques (DRM) (système de protection) dans WMA. Sa principale conséquence est l’impossibilité d’écouter des compositions protégées sur des ordinateurs autres que celui sur lequel la composition a été téléchargée depuis le magasin de musique.

Les dernières versions du format, à commencer par Windows Media Audio 9.1, permettent un encodage sans perte de qualité anglaise. Encodage du son surround multicanal sans perte et encodage vocal.

J'ai récemment reçu la lettre suivante :

Bonjour site, MP3 est le format audio le plus populaire, mais il y en a tellement d'autres comme AAC, FLAC, OGG et WMA que je ne sais pas vraiment lequel utiliser. Quelle est la différence entre eux et lequel dois-je utiliser pour stocker ma musique ?

La question est assez populaire, je vais essayer d'y répondre simplement mais clairement.

Nous avons déjà parlé de la différence entre sans perte et avec perte, mais en bref, il existe deux types de qualité audio :

sans perte : FLAC, ALAC, WAV ;
avec perte : MP3, AAC, OGG, WMA.

Le format sans perte préserve la qualité audio complète, dans la plupart des cas au niveau du CD, tandis que le format avec perte compresse les fichiers pour économiser de l'espace (bien sûr, la qualité audio est dégradée).

Formats de stockage de données non compressées : FLAC, ALAC, WAV et autres

WAV et AIFF: WAV et AIFF stockent l'audio non compressé, ce qui signifie qu'ils sont des copies exactes de l'audio original. Les deux formats sont essentiellement de même qualité ; Ils stockent simplement les données un peu différemment. AIFF est fabriqué par Apple, vous pouvez donc le voir plus souvent dans les produits Apple, tandis que WAV est quasiment universel. Cependant, comme ils ne sont pas compressés, ils occupent beaucoup d’espace inutile. Si vous ne modifiez pas l'audio, vous n'avez pas besoin de stocker l'audio dans ces formats.
FLAC: Free Lossless Audio Codec (FLAC) est le format de stockage audio sans perte le plus populaire, ce qui en fait un bon choix. Contrairement à WAV et AIFF, il compresse légèrement les données et prend donc moins de place. Cependant, il est considéré comme un format qui stocke l'audio sans perte, la qualité de la musique reste la même que celle de la source originale, il est donc plus efficace à utiliser que WAV et AIFF. C'est gratuit et open source.
Pomme sans perte: Également connu sous le nom d'ALAC, Apple Lossless est similaire à FLAC. Il s'agit d'un format légèrement compressé, cependant, la musique sera conservée sans perte de qualité. Sa compression n'est pas aussi efficace que FLAC, vos fichiers peuvent donc être un peu plus volumineux, mais elle est entièrement prise en charge par iTunes et iOS (contrairement à FLAC). Ainsi, si vous utilisez iTunes et iOS comme logiciel principal pour écouter de la musique, vous devrez utiliser ce format.
SINGE.: APE - possède l'algorithme de compression le plus agressif pour le stockage de musique sans perte, c'est-à-dire que vous obtiendrez un maximum d'économies d'espace. Sa qualité sonore est la même que celle du FLAC, ALAC, mais il y a souvent des problèmes de compatibilité. De plus, la lecture de ce format impose une charge beaucoup plus élevée au processeur pour le décoder, car les données sont fortement compressées. En général, je ne recommanderais pas d'utiliser ce format, sauf si vous êtes limité en termes de mémoire disponible et avez des problèmes de compatibilité logicielle.

Formats de stockage audio compressés : MP3, AAC, OGG et autres

Si vous souhaitez simplement écouter de la musique ici et maintenant, il est probable que vous utiliserez un format avec perte. Ils économisent une tonne de mémoire, vous laissant plus de place pour les chansons sur votre lecteur portable, et s'ils sont suffisamment élevés, ils seront impossibles à distinguer de la source originale. Voici les formats que vous êtes susceptibles de rencontrer :

MP3: MPEG Audio Layer III, ou MP3, est le format de stockage audio avec perte le plus courant. À tel point qu’il est devenu synonyme de musique téléchargeable. Le MP3 n'est pas le format le plus efficace de tous, mais c'est certainement le mieux pris en charge, ce qui en fait le meilleur choix pour le stockage audio compressé.
A.A.C.: Advanced Audio Coding, également connu sous le nom d'AAC, est similaire au MP3, bien qu'il soit légèrement plus efficace. Cela signifie que vous pouvez avoir des fichiers qui occupent moins d'espace mais qui ont la même qualité sonore que le MP3. Le meilleur évangéliste du format aujourd'hui est iTunes d'Apple, qui a rendu l'AAC si populaire qu'il est devenu presque aussi connu que le MP3. Je n'ai eu qu'un seul appareil depuis très longtemps qui ne pouvait pas lire l'AAC, et c'était il y a quelques années, vous pouvez donc utiliser ce format en toute sécurité pour stocker votre musique.
Ogg Vorbis: Le format Vorbis, connu sous le nom d'Ogg Vorbis en raison de son utilisation d'un conteneur Ogg, est une alternative gratuite au MP3 et AAC. Sa principale caractéristique est qu'il n'est pas limité par les brevets, mais que vous, en tant qu'utilisateur final, n'êtes pas du tout affecté. En fait, malgré son ouverture et sa qualité similaire, il est beaucoup moins populaire que MP3 et AAC, ce qui signifie que moins de programmes le prennent en charge. Ainsi, nous vous déconseillons de l’utiliser pour éviter les problèmes de compatibilité logicielle.
WMA: Windows Media Audio est le format propriétaire de Microsoft, similaire au MP3 ou AAC. Il n'offre aucun avantage par rapport aux autres formats et n'est pas non plus très bien pris en charge en dehors de la plate-forme Windows. Nous vous déconseillons d'extraire des CD dans ce format, sauf si vous êtes sûr que toute la musique sera lue sur la plateforme Windows ou sur des lecteurs compatibles avec ce format.

Alors que devriez-vous utiliser ?

Maintenant que vous comprenez la différence entre chaque format, lequel devriez-vous utiliser pour extraire ou télécharger de la musique ? En général, nous recommandons d'utiliser MP3 ou AAC. Ils sont compatibles avec presque tous les lecteurs, et les deux ne se distinguent pas de l'original, si . Sauf si vous avez des besoins particuliers qui en dictent autrement, les formats MP3 et AAC sont votre meilleur choix.

Cependant, il y a quelque chose à dire sur le stockage de votre musique dans un format sans perte comme FLAC. Même si vous ne remarquerez probablement pas une qualité supérieure, le mode sans perte est idéal pour stocker de la musique si vous envisagez de la convertir ultérieurement dans d'autres formats, car la conversion d'un format avec perte en un autre format avec perte (comme AAC en MP3) entraînera l'apparition de fichiers. ils semblent être de qualité nettement inférieure. Par conséquent, à des fins d'archivage, nous recommandons FLAC. Cependant, vous pouvez utiliser n'importe quel format sans perte, car vous pouvez convertir entre des formats sans perte sans modifier la qualité du fichier.

En règle générale, le terme « audio » désigne aujourd'hui tout ce qui touche au son, qu'il s'agisse de la lecture, du traitement, du mixage, du mastering ou de l'écoute d'enregistrements. Mais peu de gens savent que les formats audio ont constamment subi de nombreux changements importants depuis leur création, que ce soit pour le meilleur ou pour le pire. Le problème est que, par rapport aux formats initiaux, les créateurs des nouveaux formats ont essayé d'améliorer la qualité sonore, ce qui a invariablement affecté la taille du fichier lu. Au contraire, réduire la taille entraînait une perte de qualité. Mais ce ne fut pas toujours ainsi.

Le premier format audio dans les jeux informatiques

La toute première mention du son informatique est venue de la création de jeux, primitifs à l'époque, dans lesquels le son était reproduit via le haut-parleur du système. Mais quels que soient les efforts déployés par les développeurs de tels logiciels (logiciels), ils n'ont pas pu atteindre la qualité requise, compatible avec les enregistreurs ou les enregistrements à bobine ou à cassette.

C'est pourquoi de nombreux fabricants ont commencé à chercher une solution pour changer le format audio afin que le son soit naturel. Franchement, cela a conduit à une concurrence plus forte que celle que nous connaissons actuellement. Cela s'applique non seulement au matériel reproduit, mais aussi au son en studio, aux performances live, à la qualité ou au réglage des paramètres de base en termes de connaissances en physique, en acoustique, etc.

L'émergence du format WAV

On pense que la première qualité à part entière des formats audio a été associée à l'avènement du standard et de l'extension de fichier .wav (cette abréviation est dérivée du mot anglais « wave » ou wave). C'est précisément lui qui est devenu le premier-né à pouvoir être traité dans des programmes informatiques à un niveau professionnel.

De tels fichiers avaient déjà leurs propres caractéristiques : fréquence d'échantillonnage, profondeur sonore, débit binaire et bien plus encore. Ce son était compatible même avec ce qui pouvait être obtenu après le traitement d'un CD audio ordinaire à l'aide de certains outils tels qu'un égaliseur conventionnel. Mais la taille était clairement injustifiée. Par exemple, une piste de trois minutes peut prendre entre 20 et 50 Mo.

CD

Le format CD audio, plus précisément l'extension .cda, apparaît presque au même moment.

Contrairement aux fichiers « wave » enregistrés sur le disque dur, il ne peut pas être modifié. Aujourd'hui, vous pouvez l'ouvrir dans un programme de traitement audio, modifier le format par transcodage audio et l'enregistrer ailleurs qu'un CD.

Codec MP3

Avec l'avènement du codec LAME MP3 Encoder, l'industrie musicale a connu un véritable choc, car de tels fichiers « pesaient » des dizaines de fois moins que le même fichier WAV. Même une composition de cinq minutes avec une compression maximale dépasse rarement la taille de 5 à 7 Mo. D'accord, une avancée significative, sans oublier, a permis non seulement d'ajuster les caractéristiques ci-dessus, mais également certains paramètres supplémentaires sous la forme de balises ID3, qui contenaient des informations, par exemple, sur l'artiste, le nom de l'album et les morceaux. , et la date de sortie.

Ce type est devenu le plus populaire. Regardez, presque tout Internet est rempli de ce format universel. De manière générale, on peut dire que le format audio MP3 est devenu une véritable révolution sonore. Il reste à ce jour l’un des plus populaires et des plus demandés, malgré le fait qu’il soit remplacé par d’autres types d’audio. Mais plus là-dessus plus tard.

Fichiers AIFF

Les formats audio ont une autre variété. Le format dit .aiff a été créé à l'origine pour être utilisé sur les systèmes informatiques Macintosh.

Ce n'est que bien plus tard qu'une transformation s'est produite, qui a prédéterminé la compatibilité des formats sonores avec leur utilisation sur des plates-formes dotées de systèmes d'exploitation différents.

Format OGG

La musique au format audio.ogg est également assez courante. Cette norme a été développée par Vorbis. Cependant, il convient de noter qu’il présente un certain nombre d’inconvénients importants. Premièrement, il s’agit d’une charge injustifiée sur les ressources système de l’ordinateur, malgré sa taille minimale. Deuxièmement, l'utilisation de vos propres codecs et décodeurs, que le système peut ne pas installer automatiquement. Par exemple, lorsque vous travailliez dans FL Studio Producer Edition (ou XXL) dans les versions inférieures à 9.x.x, il y avait un dossier avec un fichier d'installation au format .inf, qui devait être activé pour l'installation après avoir installé manuellement l'application principale (sinon les préréglages dans ce format, ils ne seraient tout simplement pas perdus).

Néanmoins, des formats audio de ce type sont désormais disponibles et le son en lui-même est très bon.

Norme RAM

Quant à ce format, il est peut-être l'un des plus bas de gamme. Son origine est associée à l'avènement des premiers téléphones portables maladroits, qui ne pouvaient toujours pas régler les sonneries au format .mp3.

A cette époque, l’AMR pouvait encore remplacer le son naturel avec une certaine perte de qualité. Mais cette qualité n’est pas comparable à ce que proposent des formats plus « avancés ».

MIDI

Curieusement, le MIDI peut également être classé dans ce que l’on appelle communément « formats audio ». Bien qu'il soit généralement admis (et beaucoup le pensent encore) que le système MIDI n'est qu'un ensemble de commandes, on peut contester ce point. L'abréviation MIDI est en fait un système permettant d'enregistrer et d'éditer certaines frappes, hauteur, tempo, tonalité, effets, etc.

Cependant, il existe des fichiers avec l'extension .mid ou .midi qui peuvent être facilement lus dans des séquenceurs modernes ou des programmes d'enregistrement en studio en utilisant un ensemble standard de sons au format GM (General MIDI), GS (qui est le même) de Roland, ou XG (Extended MIDI) de Yamaha Corporation. Les deux premiers sets contiennent 128 sons standards, sans compter les effets, le troisième en contient presque trois fois plus.

FLAC

Nous arrivons maintenant à l’un des formats les plus modernes et uniques de notre époque. La musique au format audio FLAC est de plus en plus courante aujourd'hui. Cela est dû à la qualité à laquelle les vrais mélomanes prêtent avant tout attention.

Si vous le regardez, ce format a été créé sur la base du MP3 déjà connu. Mais si auparavant on utilisait la répartition en pistes séparées, ce n'est pas le cas dans ce format (pour l'instant). La structure se compose d'un ou deux fichiers, dont l'un est informatif. Seuls les lecteurs audio logiciels spécialisés peuvent reproduire ce format. Le plus connu peut être appelé AIMP. Ce n'est que lorsque le fichier principal est ouvert qu'une liste des pistes enregistrées dans le conteneur principal apparaît. Dans un tel lecteur, la commutation entre les pistes s'effectue de la même manière que dans n'importe quel autre. Mais il n'y a aucune chance de supprimer accidentellement une composition particulière (comme déjà mentionné, les informations les concernant sont contenues dans un seul fichier).

Compatibilité des formats

Naturellement, tous les formats audio actuels sont compatibles entre eux. En d’autres termes, n’importe quel lecteur DVD de salon ou lecteur logiciel standard gérera cela sans difficulté. La même chose s'applique aux programmes de traitement audio. Les programmes semi-professionnels et professionnels reconnaissent tous les formats connus aujourd'hui (même malgré les spécificités des systèmes d'exploitation). Les éditeurs audio, séquenceurs, modules supplémentaires tels que VST, RTAS (pour les systèmes Windows) ou AU (pour Mac OS X) sont capables de travailler avec de tels formats dans le mode dit multiplateforme.

Conversion de formats

Il existe plusieurs façons de modifier l'audio. Par exemple, vous pouvez ouvrir un format « natif » et enregistrer le fichier dans un autre. Vous pouvez le faire encore plus simplement. Il existe des convertisseurs spéciaux pour cela. Dans ceux-ci, vous pouvez simplement charger le fichier souhaité du format initial dans la liste, puis simplement sélectionner le fichier final. Comme on dit, rien du tout.

Traitement de la qualité audio

C'est une autre affaire lorsqu'il s'agit de changer certaines fréquences du fichier source. Vous ne pouvez pas faire cela sans progiciels spécialisés. C'est avec leur aide que vous pouvez modifier la qualité des fichiers audio. Dans ce cas, vous pouvez non seulement modifier la fréquence d'échantillonnage standard de 44 100 Hz, en l'augmentant, par exemple, à 96 000 Hz, mais également ajuster la profondeur des mêmes 16 à 24 ou 32 bits. Et nous ne parlons même pas du fait que vous pouvez également configurer le débit, c'est-à-dire la bande passante reproductible exprimée en kilobits par seconde. La valeur standard est de 128 kbit/s. Le débit binaire peut être modifié à votre discrétion, mais la meilleure qualité sonore est obtenue à environ 320 kbps. Bien entendu, tout le monde n’est pas capable de percevoir la différence entre le son standard et les caractéristiques maximales. Cependant, cela vaut la peine d'essayer une fois de lire une piste audio avec des données différentes sur un bon équipement. Ici, la différence ne se fera pas attendre.

De plus, en plus de tous ces paramètres, vous pouvez en éditer bien plus. Il suffit de regarder l'utilisation d'égaliseurs logiciels, de limiteurs, de compresseurs, de crossovers, de normalisateurs, de de-essers, etc., etc. Chacun de ces modules vous permet de personnaliser le son, comme on dit, « pour vous-même ». Et absolument tous les formats connus aujourd'hui peuvent être traités par des programmes de ce type.

Comparaison finale

Essayons de faire une comparaison entre les formats utilisés (même si ce n'est pas tout ce qu'il y a dans le monde du son).

Donc! Le format WAV, bien que « lourd », peut toujours être utilisé comme fichier intermédiaire lors d'une conversion ultérieure dans certains réacteurs audio. Ces types de formats de fichiers audio sont le plus souvent présents lors de la sauvegarde de projets ouverts ou lors de l'enregistrement d'instruments live en studio. Il est clair que le séquenceur va alors traiter les informations entrantes sous la forme d'un flux audio. Et puis vous pouvez modifier le format du fichier audio ou l'enregistrer en tant que préréglage ou piste à votre guise.

Les formats tels que les CD audio ne sont plus pertinents aujourd’hui. Si l'on prend en compte AIFF ou OGG, ils sont mieux utilisés dans les studios virtuels. Il n'est pas du tout nécessaire de parler du format AMR. Le MIDI n'est utile qu'aux musiciens qui en savent beaucoup.

On pense que le meilleur format audio aujourd’hui reste FLAC. Selon de nombreux experts et musiciens, il s’agit non seulement du plus « avancé », mais même révolutionnaire par rapport à ce qui existait ou existe aujourd’hui.

Cependant, il convient de noter que le MP3 ne peut pas être ignoré, car presque tout l'audio encodé sur les DVD ou les fichiers MKV est dans ce format. La seule différence réside dans la version du codec et du décodeur. Mais l’industrie audio et vidéo ne reste pas immobile dans son développement. Il est très probable que nous verrons bientôt quelque chose de nouveau.

Aujourd'hui, il existe environ trois douzaines de formats audio numériques courants. Pourquoi il était nécessaire de créer autant de types de fichiers audio pour stocker un type de contenu et comment gérer tout cela, vous l'apprendrez grâce à ce matériel.

Introduction

De nombreux utilisateurs préfèrent sûrement utiliser leur ordinateur personnel non seulement comme outil de travail, mais également comme centre multimédia sur lequel ils peuvent regarder des films ou des photos de famille, ainsi qu'écouter leur musique préférée. Même si les lecteurs numériques compacts ou les téléphones portables sont certainement plus adaptés à l'écoute de musique, contrairement à eux, un ordinateur peut faire plus que simplement lire de la musique.

Quelle que soit la quantité de mémoire intégrée de votre lecteur de musique, il ne sera probablement pas possible d'y stocker l'intégralité de votre bibliothèque musicale. De plus, vous pouvez créer, éditer, organiser et rechercher de la musique à l'aide de votre PC. N'oubliez pas non plus qu'il existe aujourd'hui environ trois douzaines de formats audio numériques courants, et que la plupart des lecteurs sont loin d'être omnivores et ne sont capables d'en lire que certains.

Alors pourquoi était-il nécessaire de créer autant de formats musicaux pour stocker un seul type de contenu ? Le fait est que le son dans la grande majorité des cas est stocké sous forme « compressée », puisqu'une minute d'une composition non compressée occupe environ 10 Mo sur le disque dur. D'une part, cela ne semble pas grand-chose, mais d'autre part, si vous êtes mélomane et que votre collection se compose de plusieurs centaines, voire milliers de chansons, alors il devient clair que le son doit être compressé pour pour réduire l'espace qu'il occupe sur les supports de stockage électroniques.

Pour compresser les fichiers musicaux, divers algorithmes spéciaux sont utilisés, qui déterminent ensuite la structure et les caractéristiques de la présentation des données audio, ou ce qu'on appelle formats audio numériques des dossiers. Tous les formats audio peuvent être divisés en trois groupes : les formats audio sans compression, avec compression sans perte et avec compression avec perte.

Sans compression

L'un des formats les plus courants de ce type peut être considéré comme le fameux WAV. Le son des fichiers portant cette extension est stocké sans aucune compression ni modification. Certes, beaucoup plus d'espace de stockage est nécessaire pour les fichiers non compressés et, par conséquent, WAV n'est plus largement utilisé que dans les applications audio et vidéo professionnelles, où le son avant traitement ne doit pas subir de perte de qualité. Stocker des compositions musicales ordinaires sous cette forme est un gaspillage injustifié.

Pour lire des fichiers WAV, vous n'avez besoin d'aucun logiciel spécial, puisque ce format est compris par tous les lecteurs multimédias, y compris le lecteur audio Windows Media standard intégré au système Windows.

Un autre format à mentionner utilisé pour stocker l'audio non compressé est celui développé par Apple appelé AIFF (Audio Interchange File Format). Comme vous l'avez peut-être deviné, il est le plus souvent utilisé sur les ordinateurs Macintosh exécutant des systèmes Mac OS X.

Compression sans perte (sans perte)

Les algorithmes qui compressent les fichiers audio sans perte fonctionnent sur le principe des archiveurs classiques. N'offrant pas le niveau de compression le plus élevé (de 40 à 60 %), ils n'ont pratiquement aucun effet sur la qualité sonore. Il convient également de noter que dans ce cas, les données codées peuvent être complètement restaurées dans leur forme d'origine. Par conséquent, l'utilisation de la compression sans perte est le plus souvent utilisée dans les cas où il est important de préserver l'identité des données compressées par rapport à l'original.

Les formats audio les plus populaires de ce groupe sont FLAC (Free Lossless Audio Codec), APE (Monkey's Audio), WMA (Windows Media Lossless) et ALAC (Apple Lossless Audio Codec). Chacun d’eux a ses propres avantages et inconvénients. Par exemple, le codec APE offre des gains de compression légèrement supérieurs, tandis que FLAC est plus courant. En général, tous les vrais mélomanes stockent leurs collections musicales dans des formats sans perte, car ils ne suppriment aucune donnée du flux audio et les fichiers créés à l'aide de ces codecs peuvent être écoutés même sur un équipement audio de haute qualité.

Pour lire les formats compressés sans perte, en règle générale, des lecteurs tiers (à l'exception de WMA) sont utilisés, tels que MPlayer, foobar, AIMP, Winamp, VLC et autres, car tous les codecs nécessaires y sont déjà intégrés. Une autre option consiste à installer séparément un package de codecs supplémentaires (par exemple, K-Lite), après quoi l'écoute de fichiers au format sans perte devient disponible à partir de presque tous les lecteurs audio.

La compression avec perte

Il s'agit du groupe d'algorithmes le plus populaire qui fournit le degré de compression audio maximum (jusqu'à 10 fois, voire plus). Certes, contrairement aux formats précédents, le fichier audio perd ici en qualité, et dans quelle mesure cela dépend directement du degré de compression.

Pour déterminer la qualité du son numérisé, l'indicateur le plus couramment utilisé est débit- la vitesse du flux sonore obtenu après compression et mesurée en kilobits par seconde (kbps). Comme nous l'avons déjà dit, en moyenne, une minute d'audio non compressé occupe environ 10 Mo, ce qui correspond à un flux audio d'environ 1 400 kbps. Après un codage avec perte, son débit peut chuter jusqu'à 56 kbps. Dans le même temps, il convient de considérer que pour conserver un son naturel, le débit doit être d'au moins 192 ou 256 kbit/s. Si le débit binaire du flux est de 320 kbit/s ou plus, la différence de son pour la plupart des gens entre l'audio compressé et non compressé disparaît pratiquement.

Le format le plus populaire ici est sans aucun doute le célèbre et apprécié MP3, développé par les spécialistes du célèbre MPEG (Moving Picture Experts Group). Il est le plus largement utilisé pour encoder des fichiers audio publiés sur Internet et divers services d'hébergement de fichiers en raison de sa capacité à réduire considérablement la taille des données transférées, ce qui est important lorsque la vitesse de connexion réseau est faible.

Les autres formats bien connus de cette série sont AAC (Advanced Audio Coding) et OGG Vorbis. En même temps, étant moins populaires, leurs algorithmes de compression sont plus avancés que ceux de leur principal concurrent. Ainsi, avec la même taille de fichier, ils offrent une meilleure qualité audio par rapport au MP3. Un autre avantage sérieux de ces formats est la possibilité d'encoder jusqu'à 48 canaux audio pour AAC et 255 pour OGG, contre seulement deux pour MP3.

Il convient de noter que le format WMA, propriété de Microsoft, a été créé à l'origine pour stocker et diffuser des informations audio sous forme compressée avec perte, et qu'un codage sans perte y a été ajouté il n'y a pas si longtemps, à partir de Windows Media Audio 9.1. Le format offre nominalement de meilleurs taux de compression que le MP3, donnant aux développeurs la possibilité de le comparer comme alternative aux algorithmes AAC et OGG concurrents. Certes, l'utilisation généralisée de WMA est entravée par sa nature fermée et son utilisation limitée sur de nombreuses plates-formes (systèmes d'exploitation). Et la prise en charge intégrée de la gestion des droits numériques (DRM) n'ajoute rien à la popularité de l'idée originale de Microsoft.

Bien que le MP3 soit inférieur à ses concurrents, tant en termes d'efficacité de compression que de qualité sonore, il reste le format audio le plus populaire. Le secret d'un tel succès peut probablement être qualifié d'inertie banale de la pensée, car au fil des années, la plupart des utilisateurs, des fabricants de matériel et des développeurs de logiciels s'y sont habitués. C'est pourquoi les fichiers MP3 peuvent être écoutés sur tout appareil capable de lire du son numérique - qu'il s'agisse d'un téléphone portable, d'un ordinateur personnel doté de n'importe quel système d'exploitation courant, d'un lecteur audio portable, d'un centre musical moderne ou d'un lecteur DVD.

Et même si d'autres formats ne peuvent pas encore se vanter d'un tel support, les choses ne vont pas si mal pour eux non plus. AAC a donc trouvé un large soutien auprès d'Apple, qui utilise ses algorithmes pour stocker des livres audio, des podcasts, de la musique dans l'iTunes Store et des sonneries. Ainsi pour les fans d’ordinateurs Macintosh, de tablettes iPad, de smartphones iPhone et de lecteurs iPod, ce format peut être considéré comme « natif ».

Les fichiers WMA peuvent être facilement lus sur n'importe quel PC exécutant le système d'exploitation Windows, qui est le système d'exploitation le plus utilisé au monde. Cependant, de nombreux fabricants de lecteurs audio portables et de lecteurs de disques optiques fixes prennent également en charge ce format. Mais pour écouter des fichiers aux formats OGG Vorbis ou AAC sur les systèmes Windows, vous devrez installer des codecs spéciaux. Ce n'est cependant pas un problème. L'installation du K-Lite Codek Pack gratuit mentionné ci-dessus vous permettra de lire presque tous les fichiers audio sur votre ordinateur à l'aide de votre lecteur préféré.

Conclusion

En conclusion, examinons de quel ensemble de logiciels vous aurez besoin pour transformer votre ordinateur personnel en un outil universel pour travailler avec des fichiers audio. Pour plus de commodité, nous diviserons toutes les applications en plusieurs groupes principaux.

Joueurs - servent à la lecture directe de fichiers sonores et sont également souvent utilisés pour cataloguer et organiser des collections musicales. Leur nombre est si énorme qu’il est impossible de les compter. Mais quand même, pour faciliter un peu votre choix, voici, selon nous, les douze plus populaires : Windows Media Player (intégré au système), Winamp, KMPlayer, iTunes, GOM Player, jetAudio, VLC Media Player (VideoLAN) , AIMP, BSPlayer, Real Player, WinDVD et Foobar2000.

Convertisseurs - des applications capables de convertir d'un format à un autre. À cette fin, vous pouvez utiliser les lecteurs les plus populaires sans recourir à des programmes spéciaux. Bien que dans certains cas, cela ne puisse être évité.

Rippers (attrapeurs) - vous permettent d'extraire des informations audio numériques à partir de supports optiques (Audio-CD, DVD) et de les enregistrer dans différents formats. Malgré la grande variété de grabbers, l'application EAC (Exact Audio Copy) a gagné en popularité dans ce domaine, vous permettant de réaliser les copies de disques les plus précises. D'autres extracteurs populaires incluent : Audiograbber, Reaper, Easy CD-DA Extractor et autres.

Éditeurs - des programmes conçus pour créer, enregistrer et éditer des données audio. Dans ce groupe, il existe à la fois des programmes assez simples qui permettent d'effectuer des opérations de base avec un fichier audio (couper, recadrer, fusionner, normaliser, etc.), et de vrais monstres pour un travail professionnel avec le son. Parmi les petits éditeurs, on peut souligner l'application Nero WaveEditor, pour sa taille modeste et en même temps ses fonctionnalités assez élevées. Les solutions de traitement audio professionnelles les plus populaires incluent : Adobe Audition, Sound Forge, Cubase, Sony Vegas Pro et autres.

Bien sûr, en théorie purement, un seul programme peut combiner toutes ces fonctions nécessaires, mais en pratique, utiliser une seule application pour toutes les tâches n'est pas toujours pratique. Et il est presque impossible d'obtenir une exécution de haute qualité de toutes les tâches à partir d'un seul programme.

Dans tous les cas, il est beaucoup plus pratique de disposer de plusieurs applications spécialisées, qui prennent moins de place et accomplissent mieux leurs tâches individuelles.

Réservons tout de suite que l'article ne parle QUE de caractéristiques générales et n'inclura pas certains détails. À l’avenir, Lifehacker mènera ses propres recherches impartiales. Et aujourd'hui, nous allons essayer de généraliser l'expérience déjà connue.

Il y a l'analogique et le numérique.

L'analogique est une bonne chose, mais de courte durée et peu pratique. Par conséquent, les médias analogiques, malgré les ventes élevées de vinyles, ne reviendront pas.

L'audio numérique peut être de trois types principaux :

dans un format qui n'utilise pas de compression ;
dans un format utilisant une compression sans perte ;
dans un format qui utilise une compression avec perte.

Les graphiques montrent un bon AudioCD, OGG compressé avec un débit variable de 350 kbps et MP3 utilisant Lame. Plus le graphique est bas, plus le son est proche de l'original. Il s'avère que c'est une image très intéressante. Malgré le fait que le MP3 a clairement coupé les hautes fréquences, contrairement à l'OGG, qui présente une atténuation en dessous de 2 kHz.

La distribution temps-fréquence du son révèle des choses tout aussi intéressantes. Avec un débit binaire constant de 320 kbps, le MP3 est presque identique à l'enregistrement original. Il semble que tout se mette en place maintenant. Mais... En fait, tout devient encore plus confus.

Pourquoi utiliser avec perte alors que le sans perte est disponible ?

Bon sens.

Le fait est que la plupart des enregistrements analogiques ne contiennent pas la quantité d’informations qui auraient besoin d’être stockées dans des formats de haute qualité. N'oubliez pas que la fréquence d'échantillonnage native du CD est de 44,1 kHz, la quantification n'est que de 16 bits.

Les graphiques précédents démontrent bien la haute fidélité de la transmission MP3. Mais pour une cassette audio ou une bande magnétique (à moins bien sûr qu'il s'agisse d'une bande master), les caractéristiques de l'AudioCD sont inaccessibles. Et pour les équipements de studio de masse, la possibilité d'enregistrer un son analogique correspondant à un AudioCD est apparue relativement récemment. Cela ne sert à rien de numériser en FLAC (et surtout en WAV) un enregistrement de concert ou un enregistrement de l’ère pré-numérique, notamment ceux réalisés à partir de supports magnétiques. Ils ne contiennent pas les spectres ni la quantité d’informations que les conteneurs peuvent stocker sans compression.

Ce qui a changé aujourd'hui

Il s’agit d’un rare ingénieur du son qui réalise un enregistrement master numérique (qui est ensuite reproduit sur support physique), en utilisant au maximum les technologies modernes. Par conséquent, la probabilité qu’une piste de 24 bits ne soit en réalité que de 16 bits est extrêmement élevée.

L'enregistrement analogique de haute qualité sur un équipement de haute qualité est encore plus difficile à trouver aujourd'hui - sauf parmi les fans d'un tel son. Il s'agit par exemple de Jack White, ex-leader des White Stripes. En même temps, certains de ses enregistrements appartiennent à des variations lo-fi, et y rechercher les caractéristiques sonores transcendantales d'un morceau devient une sorte de plaisir pour les gourmets.

Si vous imaginez une source idéale, seule une oreille exercée ou une écoute sur un équipement audio de haute qualité sera en mesure de trouver le fichier compressé. Et sur cette base (et), il convient de tirer la conclusion suivante :

Nécessaire et suffisant pour les équipements milieu de gamme est l'AAC, en l'absence duquel (et en l'absence de sources pouvant être encodées en AAC) - MP3 avec un débit constant de 320 kbps, créé à l'aide du codec Lame 3.93 (clés de décodage recommandées : -cbr -b320 -q0 -k -ms).

L'exception concerne les enregistrements initialement capturés en haute qualité, tels que ceux enregistrés sur DVD-Audio, SACD ou les enregistrements initialement compilés en DSD (ou un format similaire) à un débit binaire élevé.

Bien que le mode sans perte présente certaines fonctionnalités. Et nous vous en parlerons la prochaine fois.

Site sur l'informatique