Formats de fichiers sonores et leurs caractéristiques comparatives. Examen des codecs audio les plus courants

Il existe de nombreux formats audio différents. Les formats les plus couramment utilisés sont MP3 (MPEG-2 Audio Layer III) et WAV. Le type de format est généralement déterminé par l'extension du fichier (ce qui vient après le point dans le nom du fichier.mp3, .wav, .ogg, .wma)

Codec est un algorithme spécifique pour encoder et compresser les données au format audio. Pour certains types de fichiers, le codec est défini de manière unique. Par exemple, le format mp3 utilise toujours le codec MPEG Layer-3, tandis que le format mp4 peut utiliser différents codecs.

Souvent, les notions de codec et de format sont utilisées dans le même sens. Surtout quand le format utilise toujours le même codec. Mais il est parfois important de distinguer les notions de formats et de codecs. Pour plus de commodité, on peut considérer le format comme une sorte de conteneur dans lequel un signal audio ou vidéo peut être enregistré à l'aide d'un codec spécifique.

Certains formats, comme le mp4 ou le flv, peuvent contenir à la fois des flux audio et vidéo.

Si vous ne savez pas quel programme ouvrir un format audio particulier, nous vous recommandons d'utiliser notre convertisseur audio. Il prend en charge presque tous les formats.

Les codecs sont divisés en deux types, selon le type de compression :

Sans perte de qualité sonore (sans perte)

Ce groupe de formats enregistre et encode le son de manière à ce qu'il puisse être restitué avec précision lors du décodage.

Les formats les plus populaires qui encodent le son sans perte de qualité :

  • FLAC (codec audio gratuit sans perte)
  • APE (Audio du singe)
  • ALAC (codec audio sans perte Apple)

Avec perte de qualité sonore (avec perte)

La compression avec perte modifie le son. Par exemple, les fréquences inaudibles à l’oreille humaine en sont supprimées. Le fichier décodé différera de l'original en termes d'informations qui y sont enregistrées, mais sonnera à peu près de la même manière.

Formats avec perte populaires :

En savoir plus sur les formats audio populaires

WAV- l'un des premiers formats audio. Généralement utilisé pour stocker des enregistrements audio non compressés (PCM) dont la qualité sonore est identique aux enregistrements sur disques compacts (CD audio). En moyenne, une minute d'audio au format wav prend environ 10 mégaoctets. Souvent, les CD audio y sont copiés, puis convertis en mp3 à l'aide d'un convertisseur audio.

MP3(MPEG Layer-3) est le format audio le plus répandu au monde. Le MP3, comme beaucoup d'autres formats avec perte, coupe l'audio qui n'est pas audible à l'oreille humaine, réduisant ainsi la taille du fichier. À l'heure actuelle, le mp3 n'est pas le meilleur format en termes de rapport taille de fichier/qualité sonore, mais en raison de sa prévalence et de sa prise en charge sur la plupart des appareils, de nombreuses personnes y stockent leurs enregistrements.

WMA(Windows Media Audio) est un format appartenant à Microsoft. Initialement, ce format était présenté comme un remplacement du MP3 qui, selon Microsoft, présente des caractéristiques de compression plus élevées. Mais ce fait a été remis en question par certains tests indépendants. Le format WMA prend également en charge la protection des données via DRM.

OGG- un format ouvert qui prend en charge l'encodage audio avec différents codecs. Le codec le plus couramment utilisé dans ogg est Vorbis. En termes de qualité de compression, le format est comparable au MP3, mais il est moins courant en termes de prise en charge dans les lecteurs et lecteurs audio.

A.A.C.- un format audio breveté qui a de plus grandes capacités (nombre de canaux, taux d'échantillonnage) par rapport au mp3 et offre un son légèrement meilleur avec la même taille de fichier. Sur ce moment aac est l’un des algorithmes de codage audio avec perte de la plus haute qualité. Le format est pris en charge par la plupart des appareils. Un fichier de ce format peut avoir des extensions aac, mp4, m4a, m4b, m4p, m4r.

FLAC- un format de compression sans perte populaire. Il n'apporte aucune modification au flux audio et le son codé avec celui-ci est identique à l'original. Souvent utilisé pour écouter du son sur des systèmes audio haut de gamme. Il a une prise en charge limitée par les appareils et les lecteurs, donc généralement pour écouter Flac dans un lecteur, il est d'abord converti.

Dans le monde de la musique, il existe un grand nombre de formats musicaux, leurs modifications et versions, créés par des géants de l'industrie musicale et de petites entreprises qui ont acquis une reconnaissance publique dans le monde électronique.

A ces fins, diverses méthodes physiques de stockage de données audio ont été développées, par exemple : disques vinyles, bandes magnétiques, CD, DAT, MD (minidisc), DVD ou conversion de notes en formats musicaux (MIDI), de la même manière de nombreux des méthodes informatiques ont vu le jour pour le stockage de données audio – numériques : formats OGG, Mp3, Flac, Wav.

Il est impossible de passer en revue et de discuter de tous les formats audio, codecs, de leurs avantages et inconvénients. Dans mon article, je vais donc essayer de parler des extensions de fichiers audio les plus populaires que vous rencontrez.

Pourquoi ne pouvons-nous pas utiliser de format d’encodage de fichier audio universel ? Parce que pour implémenter diverses fonctions, vous avez besoin de votre propre format. Par exemple : pour lire un CD dans un lecteur de CD, pour enregistrer de la musique ou des effets sonores dans des jeux vidéo, pour enregistrer une piste de film ou un clip vidéo, pour lire sur un téléphone portable ou pour transférer des fichiers sur Internet, il existe en outre un certain nombre de des systèmes d'exploitation les plus répandus dans le monde . Il s'agit notamment des Amiga, Macintosh, NEXT et des ordinateurs personnels équipés du système d'exploitation Windows.

De plus, le travail d’un dj, d’un ingénieur du son, d’un cj, d’un ingénieur vidéo ou d’un simple mélomane est de nature bien différente. Cela peut nécessiter que vos données audio soient enregistrées à votre manière. Par exemple, l'audio d'un CD doit être stocké sur 16 bits et une fréquence d'échantillonnage de 44,1 kHz. Cependant, pour télécharger de l'audio sur Internet, il est préférable d'utiliser une profondeur de bits et un taux d'échantillonnage différents, car chaque minute d'audio 16 bits et 44 kilohertz occupe environ 10 Mo, c'est-à-dire une piste moyenne d'une durée de 5 minutes fera 50 "mètres" - c'est trop de données pour l'utilisateur moyen. Cet article fournit de brèves informations sur les formats musicaux les plus populaires.

Les AA(Fichier de livre audio audio) – le format est fermé, développé par Audible. Il est utilisé pour enregistrer des livres audio vendus via Audible et iTunes. Il est possible de ralentir ou d'accélérer la vitesse d'écoute des fichiers - pitch numérique, possibilité de laisser des signets lors de l'écoute de livres audio, protection des fichiers lors de la diffusion d'enregistrements sonores via Internet.

A.A.C.(Codage audio avancé) – un format de fichier audio avec moins de perte de qualité lors de l'encodage que le Mp3 lorsque mêmes tailles. Encodage de musique sans perte de qualité originale à l'aide du profil ALAC. AAC est une famille d'algorithmes de codage audio MPEG4. Contrairement à la banque de filtres mp3 hybrides, AAC utilise la technologie MDST (transformation cosinus modifiée) - cela signifie que l'auditeur reçoit une meilleure qualité sonore que l'encodage MP3 avec un débit binaire identique ou inférieur. Extensions possibles Fichiers AAC : [.m4a], [ .m4b ], [ .m4p ] .

AAC est également un algorithme de codage audio à large bande qui utilise deux principes de codage de base pour réduire considérablement la quantité de données requise pour transmettre un son numérique de haute qualité. Ce format est de la plus haute qualité, utilisant une compression avec perte, pris en charge par la plupart des équipements modernes, y compris les portables.

Depuis 2009, il est beaucoup moins répandu que le MP3 et autres Solutions alternatives. AAC (Advanced Audio Coding) a été créé à l'origine pour succéder au MP3 avec une qualité d'encodage améliorée. Le format AAC, officiellement connu sous le nom d'ISO/IEC 13818-7, a été lancé en 1997 en tant que septième nouveau membre de la famille MPEG-2. Il existe également un format AAC appelé MPEG-4 Part 3.

Avantages de l'AAC par rapport au MP3 :

– jusqu'à 48 canaux audio ;

– une plus grande efficacité de codage à débit binaire constant et variable;

– fréquences d'échantillonnage de 8 Hz à 96 kHz (MP3 : 8 Hz - 48 kHz) ;

– Mode stéréo commun plus flexible.

ADXest un format propriétaire de compression et de stockage audio avec perte basé sur ADPCM développé par CRI Middleware spécifiquement pour une utilisation dans les jeux vidéo. La caractéristique la plus caractéristique est la possibilité de mettre en boucle un enregistrement sonore, ce qui rend le format pratique à utiliser comme musique de fond dans divers jeux prenant en charge ce conteneur multimédia. Il est pris en charge par de nombreux jeux SEGA Dreamcast et certains jeux PlayStation 2 et GameCube.

Contrairement au MP3, il n'utilise pas le modèle psychoacoustique de réduction du volume des données sonores (réduction de leur complexité). Au lieu de cela, le modèle ADPCM utilise un enregistrement de données d'erreur de prédiction relative pour stocker les échantillons, ce qui signifie une plus grande préservation du signal d'origine après le codage ; Essentiellement, la compression ADPCM, plutôt que d'utiliser des échantillons entièrement redimensionnés de l'enregistrement audio, fournit des échantillons de l'écart du signal par rapport à la valeur précédente qui sont beaucoup plus petits, généralement 4 bits. Pour l’oreille humaine, cet écart se situe au niveau du bruit, ce qui rend la perte de qualité à peine perceptible.

AIFFest un format de fichier standard pour enregistrer des données audio sur la plate-forme Macintosh. Si jamais vous avez besoin de transférer des fichiers audio entre ordinateur personnel et les ordinateurs Macintosh, utilisez ce format. Il prend en charge les données audio mono et stéréo 8 et 16 bits. Les fichiers dans ce format peuvent contenir ou non un en-tête Mac-Binary. Si un fichier de ce type ne contient pas d'en-tête Mac-Binary, il a très probablement une extension aif. Si un fichier de ce type contient un en-tête Mac-Binary, Sound Forge l'ouvrira mais l'identifiera comme fichier de ressources Macintosh (voir la section suivante). Dans ce cas, le fichier porte très probablement l’extension snd. Remarque Lorsque des fichiers sont enregistrés sur des ordinateurs Macintosh, un en-tête Mac-Binary leur est ajouté. Il s'agit d'une petite information écrite au début d'un fichier qui identifie le type de fichier du système d'exploitation Mac OS et d'autres applications. C'est une façon pour les ordinateurs Macintosh de vous indiquer ce que contient un fichier : du texte, des graphiques ou des données audio, par exemple.

RAM(Multi-taux adaptatif) [ . amr] - codage adaptatif à débit variable. Norme de codage de fichiers audio spécialement conçue pour la compression du signal dans la gamme de fréquences vocales. Normalisé par l'ETSI (European Telecommunications Standards Institute). L'utilisation de l'AMR permet de fournir une capacité de réseau élevée avec simultanément une transmission vocale de haute qualité. AMR dispose d'une large gamme de vitesses d'encodage/décodage vocal et vous permet de basculer de manière flexible entre différents modes en fonction des conditions environnementales ou de la charge du réseau, garantissant une transmission vocale d'une clarté cristalline dans toutes les conditions.

SINGE.– (Audio du singe) [ . singe] – développeur Matthew T. Ashland – format audio numérique sans perte de qualité ( sans perte ). Le codec Audio de Monkey est disponible uniquement pour la plateforme Microsoft Windows, bien qu'il existe un certain nombre de codecs non officiels pour MacOS, Linux, BeOS. Les fichiers audio de Monkey utilisent les extensions suivantes : .ape pour stocker l'audio et .apl pour stocker les métadonnées. Ce format n'est pas gratuit, car sa licence restreint sérieusement la distribution.

PommeSans perte[. m4 un] est un codec audio développé par Apple Inc pour compresser la musique numérique sans perte de données. Les données Apple Lossless sont stockées dans un conteneur MP4 avec l'extension .m4a. Bien qu'Apple Lossless ait la même extension de fichier qu'AAC, ce n'est pas AAC, le codec est similaire à d'autres codecs Lossless tels que FLAC, etc. Un iPod doté d'un connecteur dock (pas de lecture aléatoire) et du dernier firmware peut lire des fichiers dans Apple. Format sans perte. Il n'utilise aucune gestion des droits numériques (DRM), mais étant donné la nature du conteneur, on pense que le DRM peut s'appliquer à l'ALAC.

Des tests ont montré que les fichiers compressés par ALAC représentent environ 40 à 60 % de la taille des originaux, selon le type de musique, comme les autres formats sans perte. De plus, la vitesse à laquelle il peut être décodé le rend utile pour les appareils aux performances limitées tels que l'iPod.

Apple Lossless Encoder a été introduit en tant que composant de QuickTime 6.5.1 le 28 avril 2004 et en tant que fonctionnalité d'iTunes 4.5. Le codec est également utilisé dans AirPort Express dans l'implémentation AirTunes.

Un décodeur pour le format Apple Lossless est désormais disponible dans la bibliothèque open source libavcodec. Cela signifie que tout lecteur multimédia basé sur cette bibliothèque, y compris les médias VLC et MPlayer, peut lire les fichiers Apple Lossless.

CDDA(Audio numérique sur disque compact) - disque compact audio, une norme internationale pour le stockage de l'audio numérisé sur des disques compacts, introduite par Philips et Sony. Les informations audio sont présentées en modulation d'impulsions codées avec une fréquence d'échantillonnage de 44,1 kHz et un débit binaire de 1411,2 kbit/s, stéréo 16 bits.

AVECSpécification audio du Livre rouge :

– la durée maximale de tous les enregistrements est de 79,8 minutes ;

– temps de piste minimum - 4 secondes (y compris une pause de 2 secondes) ;

– nombre maximum de pistes - 99 ;

– nombre maximum de points de référence (tronçons de voie) - 99 sans restriction de temps ;

- presence obligatoire Code d'enregistrement standard international (ISRC).

ETD– (Digital Theater System), essentiellement du Dolby Digital , ou plutôt son concurrent. Format ETD utilise un niveau de compression minimal que Dolby , donc en fait ça sonne mieux, ce qui est prouvé en pratique DVD disques sur lesquels les pistes sont enregistrées Format DTS ou DD.

ETD Il s'agit d'un système de cinéma numérique - une famille de systèmes d'enregistrement sonore multicanaux numériques créés par la société Digital Theater System pour présenter des bandes sonores numériques dans les cinémas de manière synchrone avec des copies de films en location. En plus des copies de films d'accompagnement, les deux systèmes ( DTS et Dolby Digital ) sous une forme simplifiée sont utilisés sur les disques vidéo optiques destinés au visionnage à domicile. ETD utilise moins de compression que Dolby , mais aucun des systèmes n’a une supériorité absolue. Débat sur les avantages DTS ou Dolby Digital ne se sont pas arrêtés à ce jour. Format Stéréo DTS presque identique Dolby Surround. ETD Prend en charge les options audio 5.1 canaux et 7.1 canaux. ETD dans les cinémas maison, il permet un débit binaire complet (1 509,75 kbps).

FLAC(codec gratuit du projet Ogg)[.flac] – (Anglais Free Lossless Audio Codec - codec audio gratuit sans perte) - un codec gratuit populaire pour la compression audio. Contrairement aux codecs avec perte Ogg Vorbis, MP3 et AAC, FLAC ne supprime aucune information du flux audio et convient à la fois à l'écoute de musique sur un équipement de reproduction sonore de haute qualité et à l'archivage d'une collection audio. Pour aujourd'hui Format FLAC Pris en charge par de nombreuses applications audio. Pour stocker les types de métadonnées de base, le décodeur de base utilise des balises ID 3 contre 1 et ID 3 contre 2, afin qu’ils puissent être librement ajoutés et modifiés.

MIDI(Interface numérique pour instruments de musique) interface numérique instruments de musique. Il s'agit d'une norme d'enregistrement audio numérique pour le format d'échange de données entre instruments de musique électroniques.

L'interface vous permet d'encoder uniformément sous forme numérique des données telles que les frappes au clavier, le réglage du volume et d'autres paramètres acoustiques, le choix du timbre, du tempo, de la tonalité, etc., avec un timing précis. Le système de codage contient de nombreuses commandes gratuites que les fabricants, programmeurs et utilisateurs peuvent utiliser à leur discrétion. Ainsi, l'interface MIDI permet, en plus de jouer de la musique, de synchroniser le contrôle d'autres équipements, par exemple l'éclairage, la pyrotechnie, etc.

Une séquence de commandes MIDI peut être enregistrée sur n'importe quel support numérique sous forme de fichier et transmise via tous canaux de communication. L'appareil ou le programme de lecture est appelé synthétiseur MIDI (séquenceur) et est en fait un instrument de musique automatique.

Député2 (MPEG-1 Audio Layer II ou Musicam) [ . député2 ] – l'un des trois formats (niveau 2) de compression audio avec perte définis dans la norme MPEG-1. Utilisé dans la diffusion numérique DAB et dans l'ancien standard Vidéo CD, utilisé dans les années 90 pour distribuer des films sur disques compacts optiques et existait avant que les DVD ne se généralisent.

L'encodeur MPEG-1 Audio Layer 2 a évolué à partir du codec audio MUSICAM (Masking pattern adapter Universal Subband Integrated Coding And Multiplexing) développé par le CCETT, Philips et l'IRT en 1989 dans le cadre des études EUREKA de 147 développements intergouvernementaux européens pour les systèmes de radiodiffusion numérique. pour appareils de réception fixes, portables et mobiles. Les principaux paramètres de MPEG-1 Audio ont été hérités de MUSICAM, notamment la banque de filtres, le traitement du domaine temporel, la taille de l'image audio, etc. Cependant, après de nouvelles améliorations, l'algorithme MUSICAM n'a pas été utilisé dans la version finale de la norme MPEG-1 Layer II.

Député3 (MPEG couche 3) [ . député3 ] le troisième format d'encodage de piste audio, MPEG, est un format de fichier sous licence pour stocker des informations audio. À l'heure actuelle, MP3 est le plus célèbre et le plus populaire des formats d'encodage numérique avec perte courants pour les informations audio. Il est largement utilisé dans les réseaux de partage de fichiers pour l'évaluation de la musique. Le format peut être lu sur presque tous les systèmes d'exploitation populaires, sur presque tous les lecteurs audio portables, et est également pris en charge par tous. modèles modernes centres de musique et lecteurs DVD.

Le format MP3 utilise un algorithme de compression avec perte conçu pour réduire considérablement la taille des données nécessaires à la lecture d'un enregistrement et fournir une qualité de lecture très proche de l'original (selon la plupart des auditeurs), bien que les audiophiles signalent une différence notable. Lors de la création d'un MP3 avec un débit moyen de 128 kbps, le fichier résultant fait environ 1/10 de la taille de fichier originalà partir d'un CD audio. Les fichiers MP3 peuvent être créés avec un débit binaire élevé ou faible, ce qui affecte la qualité du fichier résultant. Le principe de la compression consiste à réduire la précision de certaines parties du flux audio, le rendant pratiquement inaudible pour la plupart des gens. Cette méthode appelé codage perceptuel. Dans ce cas, dans un premier temps, un diagramme sonore est construit sous la forme d'une séquence de courtes périodes de temps, puis les informations non perceptibles à l'oreille humaine en sont supprimées et les informations restantes sont stockées dans un format compact. formulaire. Cette approche similaire à la méthode de compression utilisée lors de la compression des images dans Format JPEG. De nombreux gourmets de la musique préfèrent compresser la musique avec une qualité maximale – 320 kbps , ou passez à d'autres formats, par exemple FLAC , où le débit binaire moyen est d'environ 1 000 kbps.

MusePack[. mpc] format de fichier sans licence pour stocker des informations audio, distribué sur Licence publique générale GNU.

Musepack utilise des bandes de fréquences, il appartient donc aux codecs dits de sous-bandes. La principale caractéristique est le réglage précis de la psychoacoustique, qui vous permet de travailler avec un encodage VBR pur (encodage à débit binaire variable). L'objectif principal de Musepack est la transparence du son de la musique encodée.

Dans les formats modernes tels que : MP3, Vorbis, AAC, AC3, WMA, une deuxième conversion dct est effectuée, ce qui leur permet d'obtenir meilleure qualitéà des débits moyens et faibles, mais ne permet pas d'obtenir de bons résultats à des débits plus élevés. MusePack n'effectue pas de seconde conversion DCT, ce qui vous permet d'obtenir une qualité inégalée à des débits supérieurs à 180.

Tout comme en AAC et dans certains autres formats modernes, Musepack associe les canaux par bandes de fréquences, ce qui a un léger impact sur la qualité, mais vous permet d'économiser beaucoup sur la taille. En MP3, les canaux ne sont pas appariés par bandes de fréquences, mais pour la bande entière, divisant le signal en sous-bandes de fréquences, puis décomposant le signal en une série de cosinus (MDCT - un cas particulier de la transformée de Fourier) et enregistrant l'arrondi (quantifié ) valeurs des coefficients obtenus après la conversion (la quantification s'effectue conformément à l'analyse psychoacoustique effectuée). MPC, après avoir divisé le signal en sous-bandes de fréquence, requantifie simplement (sur la base de la psychoacoustique) le signal d'amplitude dans chaque sous-bande et écrit les valeurs arrondies (quantifiées) résultantes dans le flux de sortie. Le même fait explique la vitesse élevée de compression et de décompression du MPC.

MODÈLE– format développé pour la plateforme Amiga. Chaque fichier MOD contient des enregistrements numérisés des sons réels des instruments, appelés échantillons, quelque peu similaires à la structure MIDI. Un Cj ou un compositeur écrivant au format MOD utilise un programme appelé tracker, dans lequel il indique quel instrument doit sonner à quelle heure, dans quelle note et octave - cette séquence de notes est enregistrée dans une liste - une piste, et plusieurs parallèles les pistes sonores forment un bloc, appelé motif. Un ensemble de modèles forme un module - un fichier au format MOD avec l'extension .mod. Une ligne de suivi correspond à une vraie chaîne, dans lequel cj peut jouer ou éditer les notes numérotées. Les notes peuvent se voir attribuer divers « ornements » - par exemple : trémolo, glissando, etc.

OGG [.ogv], [.oga], [.ogx], [.ogg] – un format de conteneur multimédia standard ouvert, qui est le principal format de fichier et de streaming pour les codecs multimédia de la Fondation Xiph.Org, ainsi que le nom du projet développant ce format et ses codecs. Comme toutes les technologies développées sous les auspices de Xiph.Org, le format Ogg est un standard ouvert et libre, sans restrictions de brevet ou de licence.

Ogg n'est qu'un conteneur. La musique ou la vidéo est compressée par des codecs et le résultat du traitement est stocké dans des conteneurs similaires. Les conteneurs Ogg peuvent stocker des flux codés avec plusieurs codecs. Par exemple, un fichier contenant de la vidéo et de l'audio peut contenir des données codées avec des codecs audio et vidéo.

Le conteneur Ogg peut stocker de l'audio et de la vidéo dans différents formats (tels que MPEG-4, Dirac, MP3 et autres).

Audio réel[. ra],[. RAM] Prop standard pour le streaming et le format de fichier multimédia appartenant à " Produits et services RealNetworks." Audio réel introduit pour la première fois dans le cadre du package Audio réel 10, codec pour la compression audio sans perte de qualité.

Parmi les avantages de ce codec figurent la prise en charge du streaming et un décodage très rapide. Les inconvénients incluent un code fermé et le manque de fonctionnalités multicanaux. Disponible pour Microsoft Windows, Macintosh et GNU/Linux.

RKAU[.rka] Parmi tous les codecs audio, RKAU occupe une place très particulière. Premièrement, c’est l’encodeur le plus petit (seulement 25 Ko !) et le plus rapide. Deuxièmement, outre le fait qu'il s'agit d'un programme de compression audio sans perte, il propose des modes de compression avec perte qui offrent un plus grand degré de compression que tous les algorithmes sans perte connus. Cependant, en raison des particularités de l'algorithme sous-jacent à rkau, les distorsions introduites par le codec ne se situent pas dans la région spectrale (comme dans le cas des modèles psychoacoustiques de MP3, MP+, AAC et autres encodeurs), mais dans la région réelle. Autrement dit, ils ont, en gros, une nature non linéaire, comme les distorsions de la plupart des chemins. Dans ce cas, il n'y a pas de perte de petits détails et de microplans du phonogramme. Cependant, si vous en faites « trop » à cet égard, le son peut devenir complètement indigeste : des artefacts semblables à du bruit dur apparaîtront dans le son et le son lui-même acquerra une coloration prononcée.

Dans la hiérarchie des codecs audio, le programme rkau se démarque complètement. Il est si original qu'il n'a pas d'analogue parmi les autres algorithmes de compression de données audio. La petite taille du programme d'encodeur (25 Ko) et la vitesse de fonctionnement élevée avec des taux de compression similaires à d'autres algorithmes sans perte font de rkau un leader incontesté. Et bien qu'OptimFROG, évoqué dans la partie précédente de l'article, puisse être considéré comme l'encodeur sans perte le plus efficace, rkau n'est que légèrement en retard en termes d'efficacité. Cependant, lorsque le mode de compression « avec perte » est activé, rkau, même dans le mode de qualité la plus élevée, laisse loin derrière tous les algorithmes sans perte, se rapprochant en efficacité des programmes basés sur le modèle psychoacoustique (MP3, MP+, AAC, VQF et autres). Dans ce cas, la perte de microplans et de nuances du matériel audio original, caractéristique des algorithmes de type MPEG, ne se produit pas, et les artefacts qui surviennent inévitablement ne peuvent être remarqués que sur des équipements de très haute qualité avec une écoute comparative répétée.

Raccourcir[.shn] – est un format utilisé pour compresser les données audio. Cette forme de compression de fichiers est utilisée pour la compression de qualité CD, tp gjnthm fichiers audio (44,1 kHz, 16 bits, stéréo PCM ). Ce format est encore utilisé par certaines personnes car il est légal de vendre des enregistrements de concerts dans lesquels sont codés comme Raccourcissez les fichiers.

Spex [. spx] est un codec de compression vocale libre qui peut être utilisé dans les applications de voix sur Internet ( VoIP ). Il est fort probable qu'il n'ait aucune restriction en matière de brevet et qu'il soit sous licence sous la dernière version de la licence. BSD (sans le troisième article). Codec compressé Spex les données peuvent être stockées soit au format de stockage de données audio Ogg , ou transmettre directement à l'aide de paquets UDP/RTP.

Les développeurs contrastent leur développement avec d'autres codecs ouverts, par exemple le codec Vorbis , prétendant que c'est le codec Spex mieux adapté à la voix sur un réseau où la livraison des paquets de données n'est pas fiable. Dans le même temps, les auteurs du développement soulignent spécifiquement que le codec est adapté à une utilisation dans des réseaux avec une transmission de paquets peu fiable, c'est-à-dire que le paquet est arrivé ou non.

Spex appartient à la classe des soi-disant Prédiction linéaire excitée par code (CELP) )-codecs, c'est-à-dire des codecs construits sur la base du soi-disant codage prédictif linéaire LPK. LPK utilise un filtre numérique avec uniquement des connexions de rétroaction (appelé « filtre autorégressif ») pour se rapprocher d'un segment d'un signal vocal. Les coefficients de ce filtre sont « ajustés » au segment de signal selon la procédure de Levinson (dans la littérature occidentale - Levinson-Durbin). CELP - la modification du LPK prévoit la présence de ce qu'on appelle. « livre de codes », qui contient des ensembles prédéfinis d'impulsions uniques excitant le filtre LPC.

Signal vocal dans le codec Spex est divisé en segments non chevauchants d'une durée de 20 ms (160 échantillons à 8 KHz). Dans ce cas, pour évaluer l’ensemble excitateur, le segment ci-dessus est divisé en quatre sous-segments d’une durée de 5 ms, respectivement. Sur chacun des sous-segments, des ensembles d'impulsions excitantes sont recherchés à la fois pour le sous-segment actuel (à partir du livre de codes) et pour les deux sous-segments précédents. Contrairement aux autres codecs, afin d'éviter les restrictions liées aux brevets, Spex n'utilise pas de codage algébrique, mais uniquement un codage vectoriel. Les excitations des deux sous-sections précédentes sont ajoutées avec des poids variables, contrairement à un certain nombre d'autres codecs qui utilisent des positions temporelles variables.

Selon les développeurs, Spex optimisé pour une parole de haute qualité à basse vitesse. Codec Spex permet également une compression variable du signal et prend en charge les signaux avec différentes bandes passantes : ultra-large bande (taux d'échantillonnage de 32 kHz), large bande (16 kHz) et bande étroite (8 kHz).

DONC(Audio Kompressor sans perte de Tom) [ . donc] Codec audio et format de compression audio numérique sans perte. Il a un taux de compression et une vitesse d'encodage et de décodage élevés. Distribué gratuitement avec un ensemble de logiciels d'encodage et de lecture, ainsi que des plug-ins pour les lecteurs populaires : Winamp, foobar2000, etc. Développé par Thomas Becker, Allemagne. Codec relativement nouveau. La première version finale 1.0 a été publiée le 26 janvier 2007.

Le format continue d'être activement développé (dernière version 1.1.1) et est actuellement, selon une enquête sur le forum Hydrogenaudio.org, l'un des trois formats de compression audio sans perte les plus populaires (après FLAC et WavPack).

TTA(Vrai audio) – un codec audio gratuit qui compresse les fichiers musicaux sans perte en temps réel. Le codec est basé sur des filtres prédictifs adaptatifs et possède toutes les caractéristiques améliorées de la plupart des encodeurs modernes. Taille compressée Il y aura 30 à 70 % de fichiers en moins que le fichier musical original. Le format TTA prend en charge les balises ID3v1 et ID3v2. Grâce au codec True Audio, vous pouvez placer jusqu'à 20 CD audio sur un disque DVD-R.

TwinVQ(Transformation – quanisation vectorielle d'entrelacement pondérée de domaine) - quantification vectorielle avec domaines de transformation et entrelacement pondéré), développée au Japon au laboratoire Laboratoires d'interface humaine NTT.

Les fichiers VQF sont environ 30 à 35 % plus petits que les MP3 avec la même qualité sonore. Un flux de 128 Kbps pour les fichiers MP3 correspond à un flux de 80 Kbps pour les fichiers VQF. Ces avantages ont également face arrière. Le décodage utilise également 30 % de CPU en plus que le décodage MP3. Cela détermine des exigences accrues pour l'ordinateur sur lequel vous envisagez de lire ces fichiers.

Les tests montrent la supériorité du VQF à tous égards aux basses fréquences et avec beaucoup moins de distorsion de la forme d'onde avec une large plage dynamique (vraie musique). Cependant, en termes d'atténuation des fréquences supérieures du spectre audio, le VQF est inférieur de 2 à 3 dB au MP3 aux fréquences supérieures à 15 kHz. Ceci, cependant, est facilement compensé en ajustant l’égaliseur du lecteur, ce qui place objectivement VQF au-dessus de la qualité sonore par rapport au MP3.

VQF(Quantisation vectorielle entrelacée)– développé au Japon et basé sur la technologie TwinVQ. Si l'on compare VQF et MP3, alors le premier format sera 30 à 50 % plus compact, avec la même qualité sonore. Cela donne à VQF un avantage significatif par rapport au format MP3. Mais le processus d'encodage, de décodage (décodeur) VQF, nécessite environ 30 % de ressources de processeur PC en plus que l'audio Mp3.

Les tests montrent la supériorité du TwinVQ à tous égards aux basses fréquences et avec beaucoup moins de distorsion de la forme d'onde avec une large plage dynamique (vraie musique). Cependant, en termes d'atténuation des fréquences supérieures du spectre sonore, TwinVQ est inférieur de 2 à 3 dB au MP3 aux fréquences supérieures à 15 kHz. Ceci, cependant, est facilement compensé en ajustant l’égaliseur du lecteur, ce qui place objectivement TwinVQ au-dessus de la qualité sonore par rapport au MP3.

Vorbis [. ogg] est un format de compression audio gratuit avec perte qui est officiellement apparu à l'été 2002. En termes de fonctionnalité et de qualité, il est similaire aux codecs tels que AAC, AC3 et VQF, qui sont supérieurs au MP3. Le modèle psychoacoustique utilisé dans Vorbis est similaire dans ses principes de fonctionnement à celui du MP3 et autres, mais le traitement mathématique et la mise en œuvre pratique de ce modèle sont sensiblement différents, ce qui a permis aux auteurs de déclarer leur format complètement indépendant de tous ses prédécesseurs.

Ogg Vorbis utilise par défaut un débit binaire variable, mais ce dernier n'est limité à aucune valeur fixe et peut varier même de 1 kbps. Il convient de noter que le débit binaire maximum n'est pas strictement limité par le format, et quand paramètres maximaux le codage peut varier de 500 à 1000 kbit/s. La fréquence d'échantillonnage a la même flexibilité, offrant aux utilisateurs le choix entre 2 et 192 kHz.

Vorbis a été développé par la communauté Xiphophorus pour remplacer tous les formats audio propriétaires payants. Bien qu'il s'agisse du format le plus récent de tous les concurrents MP3, Ogg Vorbis est entièrement pris en charge sur toutes les plates-formes populaires (Microsoft Windows, Linux, Apple Mac OS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS, etc.) et Il existe également un grand nombre d'implémentations matérielles. Cependant, malgré tous ses avantages par rapport à ses concurrents, la popularité de ce format reste faible.

WAV(Format audio de forme d'onde) [ . wav], [. vague] – développé conjointement avec IBM . Format d'enregistrement audio non compressé (stéréo ou mono). Ainsi, une seule minute d'enregistrement sonore stéréo réalisé en qualité CD (fréquence d'échantillonnage 44,1 KHz) contient 60 s x 44 100 Hz x 2 canaux = 5 292 000 échantillons. Chaque échantillon peut avoir 8 ou 16 bits. Ainsi, dans la version 8 bits par échantillon, une minute de son prendra 42 336 000 bits = 5 292 000 octets (environ 5 Mo) en mémoire.

WavPack[.wv], [.wvс] – Codec audio gratuit et open source pour la compression audio sans perte de qualité. Conçu par David Briant.

Le format WavPack vous permet de compresser (et décompresser) des fichiers audio 8, 16, 24 et 32 ​​bits au format .WAV. Il prend également en charge la diffusion de son surround et des taux d'échantillonnage élevés. Comme les autres méthodes de compression sans perte, l'efficacité de la compression dépend des données sources, mais elle se situe généralement entre 30 % et 70 % pour la musique populaire générale, légèrement plus élevée pour la musique classique et d'autres sources avec une plage dynamique plus large.

WavPack comprend également un mode « hybride » unique qui offre tous les avantages de la compression sans perte avec le bonus supplémentaire : au lieu de créer un seul fichier, ce mode crée une qualité avec perte de haute qualité (plus précisément, spécifiée lors de l'encodage) relativement faible (. WV) qui peut être lu seul, ainsi qu'un fichier de « correction » (.WVC) qui (en combinaison avec le précédent .WV) vous permet de restaurer complètement l'original. Pour certains utilisateurs, cela signifie qu’ils n’auront jamais à choisir entre une compression sans perte et avec perte.

WMA(Windows Media Audio) [ . wma] un format de fichier sous licence développé par Microsoft pour stocker et diffuser des informations audio. Initialement, le format WMA se positionnait comme une alternative au MP3, mais aujourd'hui Microsoft l'oppose au format AAC (utilisé dans le populaire magasin de musique en ligne iTunes).

Nominalement, le format WMA possède de bonnes capacités de compression, ce qui lui permet de « contourner » le format MP3 et de rivaliser en termes de paramètres avec les formats Ogg Vorbis et AAC. Mais comme l'ont montré des tests indépendants ainsi que des évaluations subjectives, la qualité des formats n'est toujours pas clairement équivalente et l'avantage même sur le MP3 est évident, comme le prétend Microsoft. Il est particulièrement intéressant de noter que premières versions Le format (ou sa mise en œuvre) rencontrait des problèmes à faible débit. De plus, de nombreux mélomanes et propriétaires de lecteurs numériques n'aiment pas le format WMA en raison de sa faible résistance aux erreurs. Si lors de l'encodage/du transfert d'un fichier WMA, une partie de celui-ci est endommagée, la lecture du fichier devient alors impossible, à la fois après le point d'endommagement et plusieurs dizaines de secondes avant. (À titre de comparaison, si un fichier MP3 est endommagé, vous pouvez toujours le lire du début jusqu'au point même de l'endommagement, puis sauter quelques secondes et le lire jusqu'à la fin ; parfois des erreurs de quelques octets dans un fichier MP3 sont subtil ou pas perceptible du tout. ) Cependant, ce format évolue constamment, on peut donc supposer que la qualité sera optimisée.

La plupart des lecteurs audio portables prennent en charge le format WMA ainsi que le MP3. Ce format est très mal supporté sur les plateformes alternatives (en raison de son caractère fermé).

Microsoft a inclus la prise en charge de la gestion des droits numériques (DRM) (système de protection) dans WMA. Sa principale conséquence est l’impossibilité d’écouter des compositions protégées sur des ordinateurs autres que celui sur lequel la composition a été téléchargée depuis le magasin de musique.

Les dernières versions du format, à commencer par Windows Media Audio 9.1, permettent un encodage sans perte de qualité anglaise. Encodage du son surround multicanal sans perte et encodage vocal.

Avant de commencer notre examen des codecs audio les plus courants, expliquons ce qu'ils sont et quel est leur objectif. Un codec, ou, en d'autres termes, un encodeur, est un logiciel ou matériel pour encoder et décoder des informations (dans notre cas, des informations audio) selon un algorithme spécifique. Il existe un grand nombre de codecs sur le marché, mais nous n'en considérerons que quelques-uns - les plus populaires et les plus demandés.

Le codage, ou compression, peut être de deux types : avec pertes d'informations et sans pertes. Pour chaque type d’encodage, il existe différents types de codecs audio. En quoi le codage des informations sans perte diffère-t-il du codage des informations avec perte ?

Lors du codage des informations sans perte, la compression des données n'entraîne pas de perte d'informations et le fichier audio décodé est donc absolument identique à l'original. Lors du codage à l'aide de cette méthode, la réduction de la quantité initiale d'informations atteint 20 à 50 %. De plus en plus, non seulement les audiophiles recourent à cette méthode, mais aussi utilisateurs ordinaires. À mesure que l’espace disque augmente et que les prix du stockage diminuent, de plus en plus d’utilisateurs choisissent de stocker des données audio codées de cette manière. Aujourd'hui, il existe de nombreux algorithmes qui permettent d'effectuer cette opération, mais les plus populaires sont ceux implémentés dans les codecs FLAC, Monkey's Audio, WavPack et TTA.

La compression des données avec perte est utilisée pour obtenir le fichier taille minimale. Avec un tel encodage, il n'y a plus de correspondance complète entre l'original et sa copie convertie, et possibilité de restauration informations perdues manque également. Pour atteindre une taille de fichier minimale, divers algorithmes d'encodage sont utilisés : depuis les algorithmes de compression mathématiques, dans lesquels la qualité de la piste n'en souffre pas, jusqu'au modèle dit psychoacoustique, qui consiste à supprimer les sons « inutiles » de l'original et à restreindre la taille du fichier. gamme de fréquences. En raison des particularités de la perception sonore par l'oreille humaine, les sons « inutiles » peuvent être appelés conditionnellement les détails de la piste audio dont la suppression ne sera pas très perceptible. Le processus de suppression des sons « inutiles » est appelé quantification. Lors du codage de données avec pertes, la taille de l'original peut être réduite plusieurs fois (généralement de 3 à 12 fois), et plus le taux de compression est élevé, moins il y a de correspondance entre l'original et le fichier audio résultant.

Il existe de nombreuses méthodes de compression avec perte, les plus connues d'entre elles sont MPEG-1 Layer 3, MPEG-2/4 AAC, Ogg Vorbis, Windows Media Audio, MusePask, etc.

Compression sans perte

FLAC

L'un des formats les plus populaires pour la compression audio sans perte est le codec FLAC. Les principaux avantages de ce codec audio sont sa mise à jour constante et, bien sûr, sa multiplateforme : FLAC se compile sur de nombreuses plateformes : Unix (Linux, BSD, Solaris, OS X), Windows, BeOS et OS/2. Une telle prise en charge complète des systèmes d'exploitation contribue à l'utilisation généralisée de cet encodeur audio.

Un autre avantage du codec audio FLAC est la présence (en plus de l'encodeur et du décodeur de base sous forme de bibliothèques incluses dans l'installateur) d'un shell graphique qui permet de simplifier le processus d'encodage, ainsi que modules externes(plugins) pour différents lecteurs (dont Winamp de différentes versions, Foobar2000, etc.). Le kit comprend également un utilitaire de ligne de commande qui compresse et décompresse les fichiers, ainsi qu'un utilitaire permettant de modifier les métadonnées des fichiers.

Intéressant trait distinctif FLAC est qu'il vous permet de faire une copie d'archive d'un disque audio, enregistré dans un seul fichier. À l'avenir, une telle copie pourra être facilement écrite sur le disque si le disque d'origine est perdu ou endommagé. FLAC utilise huit niveaux de compression. Comme pour tout encodeur, la vitesse d'encodage et la taille du fichier résultant dépendent du degré de compression. Les balises ID3v1 et ID3v2 peuvent être ajoutées à un flux FLAC. Ces données n'appartiennent pas au format, mais le décodeur peut les ignorer.

L'audio du singe

Le codec sans perte le plus populaire actuellement disponible est Monkey’s Audio. Cela est principalement dû au caractère gratuit de ce codec et à la compression d'assez bonne qualité du flux audio qu'il fournit. Le seul facteur limitant son champ d’application est le manque de support multiplateforme : le codec Monkey’s Audio n’est disponible que sur la plateforme Windows. Néanmoins, le support de ce format est implémenté dans un certain nombre de lecteurs et, par exemple, le plug-in pour le lecteur Winamp est fourni avec Monkey's Audio. De plus, il est possible d'installer des filtres DirectShow pour d'autres lecteurs compatibles. Le plugin de lecture prend en charge toutes les fonctions courantes et balises ID3.

Le codec Audio du Monkey sera certainement apprécié par ceux qui ont besoin d'un son de la plus haute qualité. Le codec fournit une compression d'environ 40 à 50 %. Lors du codage des données, plusieurs niveaux de compression différents sont disponibles, d'une option offrant un codage rapide à une option offrant une compression de meilleure qualité avec plus de temps CPU. Notons encore une fois que lors de l'utilisation de la compression avec le taux de compression le plus élevé, l'utilisateur doit tenir compte du fait que lors de la lecture d'un tel fichier avec un lecteur logiciel, il faudra plus de temps processeur pour le décoder.

Selon le développeur, Monkey's Audio vous permet d'encoder des fichiers WAV à n'importe quelle fréquence d'échantillonnage, avec une plage dynamique de 8, 16 ou 24 bits, en modes mono ou stéréo.

Après avoir installé la distribution Monkey's Audio, l'utilisateur a la possibilité d'encoder les fichiers audio non seulement au format interne Monkey's Audio (*.ape), mais également dans d'autres formats qui effectuent une compression des données avec perte. Tous ces codecs sont pris en charge via coque graphique programmes. Notez cependant que la livraison ne comprend que des codecs qui effectuent une compression sans perte de qualité, et l'utilisateur devra installer tout le reste dans le système de manière indépendante.

Comme déjà souligné, malgré tous ses avantages, Monkey’s Audio reste absolument gratuit, et en plus, son code source est ouvert, ce qui permet aux développeurs d’inclure le support des codecs dans leurs programmes.

WavPack

Codec ouvert WavPack pour la plateforme Windows. Lorsque ce format a été développé, on supposait qu'il serait utilisé pour la compression d'informations sans perte, et ce n'est que plus tard que des fonctions de codage avec perte y ont été ajoutées. Le codec est gratuit, ce qui le rend plus attractif. Il dispose également de plugins pour les lecteurs plus courants, qui sont installés manuellement par l'utilisateur.

La principale caractéristique de WavPack est la possibilité de créer deux fichiers à la fois, l'un étant un fichier obtenu avec une perte de qualité et l'autre correctif : avec son aide, vous pouvez restaurer le fichier principal à son état d'origine.

TTA

Codec audio multiplateforme gratuit TTA (True Audio) pour la compression sans perte de fichiers audio WAV 8, 16 ou 24 bits. Il a été créé par des développeurs russes. Le codec TTA offre une compression jusqu'à 30 % et est capable de fonctionner en temps réel. L'un des avantages de ce codec est le fait que le package TTA contient des codecs DirectShow (compresseur, décompresseur, splitter), qui permettent à d'autres applications de travailler facilement avec les flux True Audio. C est correct codecs installés l'utilisateur peut lire des fichiers au format TTA sur des lecteurs tels que RealOne, RadLight, Windows Media et d'autres lecteurs compatibles DirectShow.

La compression avec perte

MPEG-1 Layer 3 ou MP3

L'histoire du format MPEG remonte à 1988, lorsque le comité Moving Pictures Expert Group a été fondé. La même année, le développement du format MPEG-1, qui est un format de compression vidéo, a commencé. L'achèvement des travaux sur le format et sa normalisation a eu lieu un peu plus tard. Au moment où le format MPEG-1 a finalement été standardisé, trois encodeurs audio de cette famille avaient été créés : MPEG-1 Layer I, Layer II et Layer 3. Ce dernier est actuellement le format de compression audio numérique le plus populaire. Le format MPEG-1 Layer 3 (plus communément appelé MP3) a été développé par l'allemand Fraunhofer IIS en collaboration avec l'Université d'Erlangen. Les travaux ont commencé en 1987, mais ce n'est qu'en 1992 que le format a acquis un statut officiel et est devenu partie intégrante du MPEG-1.

L'évolution du format MP3 a été plutôt lente, ce qui s'explique par deux raisons : le format est payant et le manque de lecteurs de musique pour ce format (à l'exception du lecteur de Fraunhofer IIS).

Le format MP3 a été développé spécifiquement pour la transmission du son sur un réseau, et le fichier codé devait être de petite taille avec un son de haute qualité. Ce sont ces paramètres (petite taille de fichier avec un débit de 128 Kbps et suffisamment son de haute qualité par rapport à l'original) ont finalement été les principaux facteurs de succès du format.

De nombreux utilisateurs se sont déjà rendu compte que ce format ne répond plus aux besoins de l’époque. Le MP3 est remplacé par de nouveaux formats améliorés, mais il compte encore de nombreux adeptes et son extinction, à notre avis, n'arrivera pas de sitôt. Il existe également une explication simple à cela : si auparavant les fichiers MP3 ne pouvaient être écoutés que sur un ordinateur, de plus en plus de périphériques matériels différents apparaissent désormais pour les écouter ; le format est pris en charge par les lecteurs de DVD domestiques, les autoradios et les appareils modernes. téléphones portables, ordinateurs de poche etc.

MPEG-2/4 AAC

En 1994, la nouvelle norme MPEG-2 a été approuvée, qui a été poursuivie sous la forme de l'un des codecs audio bien connus, MPEG-2 AAC (MPEG-2 Advanced Audio Coding). Un peu plus tard, après qu'Apple ait obtenu la licence MPEG-4, le format est devenu connu sous le nom de MPEG-4 AAC. Le développeur original du format MPEG-2 AAC est le même Fraunhofer IIS Institute, qui, avec AT&T, Sony, NEC et Dolby, a introduit ce format au début de 1998.

C'est aujourd'hui l'un des principaux concurrents du format MP3. Comme le MP3, l’algorithme AAC repose sur un modèle d’encodage psychoacoustique. Cependant, le MPEG-4 AAC présente de nombreux avantages par rapport au MP3. Tout d'abord, il s'agit de la prise en charge de l'audio multicanal et d'un grand nombre d'améliorations visant à améliorer la qualité du signal audio de sortie.

Le format serait sans aucun doute devenu populaire sans une circonstance qui a quelque peu retardé son développement. Après avoir terminé leurs travaux sur MPEG-2 AAC, certaines des sociétés cofondatrices ont pris codes sources normes et créé leurs propres formats basés sur celles-ci. Les formats résultants ne sont pas compatibles entre eux, et en plus, ils sont commerciaux. Il existe actuellement plusieurs codecs AAC, parmi lesquels le plus connu est AAC LC, utilisé dans la technologie Apple QuickTime. Nero AAC est également courant, utilisé dans le package Nero Burning Rom.

L'avantage du codec MPEG-2 AAC est qu'il est pris en charge par des lecteurs matériels, dont l'un des principaux représentants est le lecteur populaire Apple-iPod. De plus, des fichiers de ce format sont disponibles à l'achat via la boutique en ligne Pomme. Une telle prise en charge de ce format par une entreprise renommée, ainsi que son utilisation à l'échelle industrielle, donnent confiance aux utilisateurs dans ce codec audio.

Ogg Vorbis (OGG)

Le codec audio Ogg Vorbis est sorti en 2000. Il est open source et sa distribution est gratuite. L'algorithme Ogg Vorbis est conçu pour compresser les données à tous les débits possibles sans restrictions, c'est-à-dire de 8 à 512 Kbps, mais uniquement en mode débit binaire variable (VBR). L'algorithme consiste à stocker des commentaires détaillés sur l'artiste et le titre de la composition dans les fichiers. L'algorithme offre la possibilité d'encoder plusieurs canaux audio, ainsi que de modifier le contenu des fichiers. Le codec prend en charge la lecture en streaming. Pour stocker les données, nous utilisons notre propre format universel, conçu pour stocker toute information multimédia du système Ogg Squish.

Le codec audio fonctionne mieux à des débits faibles allant jusqu'à 128 Kbps qu'à des débits élevés. Pour cette raison, il existe un codec alternatif qui améliore les performances du codec Ogg Vorbis à des débits binaires plus élevés.

Un argument peut être avancé en faveur du format Ogg Vorbis, qui a déjà été évoqué lors de la description du format MP3 : une large prise en charge matérielle du format. Son inconvénient est l'incapacité de traiter l'audio multicanal.

Windows Media Audio (WMA)

Le codec audio désormais connu sous le nom de Windows Media Audio (WMA) a été développé par Voxware et s'appelait alors Voxware Audio Codec. Par la suite, l'entreprise a abandonné le développement de ce produit et Microsoft l'a racheté et amélioré. En conséquence, le nom du codec a été changé pour Windows Media Audio et il est devenu gratuit.

Récemment, le codec WMA a gagné en popularité depuis que Microsoft l'a intégré à ses systèmes d'exploitation Windows 2000 et Windows XP.

Il existe désormais plusieurs versions de WMA, qui diffèrent les unes des autres à la fois par la prise en charge de différents débits binaires et par la qualité d'encodage.

Pour le moment, WMA9 est la dernière version du codec et une suite logique de WMA8. Le codec WMA9 est pratiquement impossible à distinguer de ancienne version, sauf qu'il prend désormais en charge le débit binaire variable (VBR) et utilise la technologie Fast Streaming, conçue pour réduire le temps de mise en mémoire tampon du contenu WMA transmis à l'utilisateur final. Les développeurs revendiquent également une augmentation notable de la qualité d'encodage par rapport au WMA8.

A noter cependant que le kit comprend désormais deux codecs, l'un effectuant une compression avec perte de qualité, et l'autre sans.

Parmi les principaux avantages du format, il faut mentionner sa distribution assez large, la possibilité de jouer sur n'importe quel système Windows et le support matériel de la plupart des lecteurs modernes. Mais il existe également de nombreuses lacunes qui empêchent les utilisateurs d'utiliser ce format. Citons-en quelques-uns : le format est fermé et a été développé à des fins commerciales ; Le codec dispose d'un système de protection contre la copie (DRM) et de diverses versions incompatibles ; a un faible taux d'encodage et ajoute automatiquement une légère section de silence à la fin de la piste audio pour éviter les clics.

MusePack (MPC)

Le codec MusePack (appelé à l'origine Mpeg Plus) est basé sur MPEG-1 Layer II, d'où l'accent mis sur l'encodage principalement à des débits binaires plus élevés que le MP3. Ce codec audio prend uniquement en charge l'encodage à débit binaire variable (VBR). La vitesse de compression et de décompression au format est nettement supérieure à la vitesse d'exécution de ces opérations concernant les fichiers MP3. En moyenne, la qualité d'encodage du MPC à haut débit est nettement supérieure à celle fournie par le MP3, ce qui est principalement dû aux différences dans les mécanismes d'encodage. L'inconvénient du codec est le manque de prise en charge de l'audio multicanal et du matériel.

Dans MusePack, vous pouvez ajuster la qualité d'encodage, implémentée sous la forme de plusieurs paramètres intégrés (préréglages), chacun étant conçu pour une plage spécifique. Une autre caractéristique intéressante de MusePack est qu'il vous permet d'utiliser non seulement des fichiers WAV comme matériel source, mais également des fichiers encodés avec les codecs les plus populaires qui effectuent une compression sans perte de qualité.

Réservons tout de suite que l'article ne parle QUE de caractéristiques générales et n'inclura pas certains détails. À l’avenir, Lifehacker mènera ses propres recherches impartiales. Et aujourd'hui, nous allons essayer de généraliser l'expérience déjà connue.

Il y a l'analogique et le numérique.

L'analogique est une bonne chose, mais de courte durée et peu pratique. Par conséquent, les médias analogiques, malgré ventes élevées vinyle, ne reviendra pas.

L'audio numérique peut être de trois types principaux :

  • dans un format qui n'utilise pas de compression ;
  • dans un format utilisant une compression sans perte ;
  • dans un format qui utilise une compression avec perte.

Les graphiques montrent un bon AudioCD, OGG compressé avec un débit variable de 350 kbps et MP3 utilisant Lame. Plus le graphique est bas, plus le son est proche de l'original. Il s'avère que c'est une image très intéressante. Malgré le fait que le MP3 a clairement coupé les hautes fréquences, contrairement à l'OGG, qui présente une atténuation en dessous de 2 kHz.

La distribution temps-fréquence du son révèle des choses tout aussi intéressantes. Avec un débit binaire constant de 320 kbps, le MP3 est presque identique à l'enregistrement original. Il semble que tout se mette en place maintenant. Mais... En fait, tout devient encore plus confus.

Pourquoi utiliser avec perte alors que le sans perte est disponible ?

Bon sens.

Le fait est que la plupart des enregistrements analogiques ne contiennent pas la quantité d’informations qui auraient besoin d’être stockées dans des formats de haute qualité. N'oubliez pas que la fréquence d'échantillonnage native du CD est de 44,1 kHz, la quantification n'est que de 16 bits.

Les graphiques précédents le démontrent assez bien haute précision Transmission MP3. Mais pour une cassette audio ou une bande magnétique (à moins bien sûr qu'il s'agisse d'une bande master), les caractéristiques de l'AudioCD sont inaccessibles. Et pour les équipements de studio de masse, la possibilité d'enregistrer un son analogique correspondant à un AudioCD est apparue relativement récemment. Cela ne sert à rien de numériser en FLAC (et surtout en WAV) un enregistrement de concert ou un enregistrement de l’ère pré-numérique, notamment ceux réalisés à partir de supports magnétiques. Ils ne contiennent pas les spectres ni la quantité d’informations que les conteneurs peuvent stocker sans compression.

Ce qui a changé aujourd'hui

C'est un ingénieur du son rare qui réalise un enregistrement master numérique (qui est ensuite reproduit sur support physique), en utilisant technologies modernes au maximum. Par conséquent, la probabilité qu’une piste de 24 bits ne soit en réalité que de 16 bits est extrêmement élevée.

L'enregistrement analogique de haute qualité sur un équipement de haute qualité est encore plus difficile à trouver aujourd'hui - sauf parmi les fans d'un tel son. Il s'agit par exemple de Jack White, ex-leader des White Stripes. En même temps, certains de ses enregistrements appartiennent à des variations lo-fi, et y rechercher les caractéristiques sonores transcendantales d'un morceau devient une sorte de plaisir pour les gourmets.

Si vous imaginez une source idéale, seule une oreille exercée ou une écoute sur un équipement audio de haute qualité sera en mesure de trouver le fichier compressé. Et sur cette base (et), il convient de tirer la conclusion suivante :

Nécessaire et suffisant pour les équipements milieu de gamme est l'AAC, en l'absence duquel (et en l'absence de sources pouvant être encodées en AAC) - MP3 avec un débit constant de 320 kbps, créé à l'aide du codec Lame 3.93 (clés de décodage recommandées : -cbr -b320 -q0 -k -ms).

L'exception concerne les documents initialement reçus dans haute qualité, par exemple, enregistrés sur DVD-Audio, SACD ou enregistrements initialement compilés en DSD (ou format similaire) à un débit binaire élevé.

Bien que le mode sans perte présente certaines fonctionnalités. Et nous vous en parlerons la prochaine fois.

Souvent une mesure de la qualité d’une piste. Il y a beaucoup de débats sur le meilleur format musical. L'autre jour, j'ai été témoin d'une dispute similaire. Pas virtuel, mais réel. En général, j'ai décidé d'écrire un article sur les formats audio et d'essayer d'expliquer en langage humain quel est le meilleur format audio. J'essaierai d'éviter les termes abscons et les descriptions de caractéristiques, afin de ne pas blesser à nouveau le cerveau des lecteurs.

J’avoue tout de suite que je ne chanterai pas d’éloges en l’honneur d’un format audio particulier, tout comme je ne vais « rabaisser personne ». Laissez chacun décider par lui-même. Je n’entrerai pas dans le « wiss » et passerai en revue les formats de musique de haute qualité les plus connus.

Je crois que ces débats sont menés par des gens, c'est le moins qu'on puisse dire, qui ne connaissent pas ce sujet. Parce que les professionnels (c’est-à-dire les gens qui savent ce qu’ils font et pourquoi ils le font) ne feront pas ce genre de choses. Avec l’abondance actuelle de formats audio, toute personne dans le besoin trouvera ce dont elle a besoin. D'accord, il semblerait stupide de discuter entre un conducteur de tracteur et un autre conducteur pour savoir lequel est le meilleur : un tracteur ou une voiture. Pour certains usages - un tracteur, pour d'autres - une voiture. C'est la même chose ici.

WAV– est à juste titre considéré comme le format musical de la plus haute qualité. Ce format audio est non compressé et sans perte. Utilisé lors de l'enregistrement et du traitement du son, il s'agit de la plus haute qualité sonore, car l'enregistrement au format WAV s'effectue sans compression. Encodé dans tout autre format audio. Eh bien, en conséquence, il « pèse » beaucoup, il est donc principalement utilisé pour l'enregistrement sonore.

Compression audio avec perte

Je vais commencer par le format bien connu et universellement utilisé (bien que pas toujours apprécié) MP3. Ce format audio est activement utilisé partout où cela est nécessaire et là où ce n'est pas nécessaire. Mais cela ne veut pas dire qu’il est indigne de la place qu’il occupe dans sa niche. Très digne en effet. Bien qu'il soit « assis » dans sa niche depuis environ deux décennies, personne ne l'a encore « expulsé » de là. Et il y avait beaucoup de gens qui voulaient dire quelque chose. Et le principal favori d'entre eux WMA(Windows Media), conçu par Microsoft comme alternative au MP3. Il s’agit donc d’une alternative, malgré les efforts des développeurs. Caractère suivant - OGG. Malgré des opportunités plus grandes que MP3, par exemple, n’a jamais été largement reconnu. Bien qu'il soit pris en charge par de nombreux systèmes d'exploitation. Il convient peut-être de mentionner le format audio AAC, censé remplacer . Il a amélioré la qualité d’encodage et réduit les pertes de compression. Mais hélas.

Le principal avantage de ces formats est leur petite taille. L'inconvénient est la perte de qualité.

Compression audio sans perte

FLAC– peut-être le codec d’encodage et le format audio sans perte le plus populaire. Les mélomanes se tournent progressivement vers ce format. WavPack lui donne une digne concurrence, mais n'est pas si populaire. C'est la même histoire avec Pomme sans perte, dans lequel la taille est compressée à 60 %.

Ici, l'histoire est exactement le contraire : la qualité est meilleure et la taille est plus grande.

Les sceptiques affirment qu'il est presque impossible de distinguer à l'oreille MP3(320 kbit/s) de Sans perte. « S’il n’y a pas de différence, pourquoi payer plus ? » En effet, il est assez difficile de ressentir la différence entre les formats audio avec du matériel classique, même pour les mélomanes. Mais il y a aussi ceux qui ressentent immédiatement cette différence (j'étais personnellement présent à l'expérience). Mais lorsqu’on écoute sur un bon appareil, la différence est énorme. Le problème est que tout le monde ne peut pas se permettre un bon appareil.