音声圧縮技術の音質評価基準11

音声圧縮技術の調整について
アナログオーディオの分野 調整といえば 必ずしも原音に忠実でなければ行けないが、楽しむことができる音作りをすると同じ意味で使われる場合がある。
だが、このような考えで音声圧縮技術の設定を理解しようとするのは間違いである。
そんなふうに誤解している人たちは、最近のLAMEの調整はかなり硬度で、2004年の128kbpsで公開オーディション試験では、LAME MP3の方がWMA9 StdとATRAC3よりも良かったとう意見に対し
調整による音づくりには味があって、調整方法は、再生環境にも合わせる事が必須のため、その結果は、無意味であるのように言う。

だが、この考えは間違っている。
音声圧縮技術の基礎的な目標は、「人は、圧縮する前の音と鑑別することができない音をより小さなビットレートにする」である。
人の聴覚は非常に鋭く、驚くべきことに、小さな音の違いを認識してしまう。
だが、他の一面には、簡単にだまされてしまう特性もある。
音の波形が大きく変質していても、人の差が全然理解不能な場合が多い。

音声圧縮技術は、これを活用して、高い圧縮率を達成している。
そのため、他の圧縮技術の比較にの、基本的な基準は、「人が圧縮する前の音と鑑別することができない音をどのように達成しているかどうか」でなければならない。
この基準は、頻繁に透明性と言われている。
音源に応じて結果が異なり、差の聞き分けは、個人差もあるため、多くの音源を利用して、複数の人に圧縮技術を評価してもらう必要がある。
音声圧縮技術の調整ももちろん透明性の基準に基づいて行われる。

このような意味での調整は、アナログ音楽をを楽しむことができる音作りとは全然違う。
前に説明したとおり、圧縮する前の音と圧縮された音の大幅な差は、音の汚染の有無の形で生まれ。
一度汚染が発生するとある程度の性能を持つどんな再生機器でも汚れは消せず、圧縮する前と圧縮された音を簡単に鑑別することができてしまう。
その場合、その音源の圧縮技術の評価は悪くなるだろう。
これらの評価を、多くの音源を多くの人に聴いてもらい、その結果を合わせた圧縮技術と評価になる。

要約:音の重厚さや楽しむ音づくりのような観点から、圧縮技術の音質を言う人は何も理解していない。
音声圧縮技術の音質は音の汚染の有無や透明性の基準で評評定すべき。
音声圧縮技術の調整が基準に基づいて実行されている。
しかし、実際には128kbpsと64kbpsでHi-Fiと呼ぶには無理がある。
そして、世の中には評価を自動的に行うソフトがあるが、そのソフトによる判定がどこまで信頼できるかについては、十分な検査が不可欠である。

多分、人の主観による判定とソフトによる機械的な判定を一致させることはかなり困難になるだろう。
だが、そのような方向の研究では、科学的に大切であると考えられる。
具体的にどのようなコーデックでリスニングテストをしたのかはわからないが、音の仕事を持つ専門家も256kbps以上で原音との違いがわからないになっているのが面白い。
この点も320kbps MP3ファイルの音とCDの音の差を、いつでも簡単に認識することができると言うする人が信頼することができないかどうかを、知ることができるだろう。
LAMEのジョイントステレオに問題があるか?

以下のように信じている人はなかなか多いようだ。
ジョイントステレオを使用すると、ステレオイメージの再現性が全般的に劣化する。
ステレオイメージに敏感な人は、単純なステレオを使用するのがいいかもしれない。
だが、単純なステレオ楽器とボーカルの音を低下させる。
味と楽曲によってジョイントステレオと簡単なステレオを鑑別して使用する。

だが、そんな主張をする人がABXテストでは、ジョイントステレオの問題を確認することを見たことがなく、第三者に検証を受けるための音源を公開していることも見たことがない。
実際には、たとえ320kbpsにもジョイントステレオだけを使用する。
LAMEの場合は、オプションを指定しない場合、自動的にジョイントステレオを使用することになる。
すなわち、不必要なオプションを付無いけでいい。