音声圧縮技術の音質評価基準1

音声圧縮技術には可逆圧縮と非可逆圧縮がある。
ここでは容易な非可逆オーディオ圧搾専門的のみを取り扱う。
一般的な圧縮技術の基本目的は、高い圧縮率。
できるだけ圧縮する前のように聞こえる音質を実現することである。

なので、圧縮技術の音質を評価するには以下のことが大切だ。
・どれくらい圧縮する前の音に聞こえているか?
・同等の音に聞こえないときは、圧縮する前から圧縮した後る音の変化はどうか?
という基準(透明性の基準)に従わなければならない。
音声圧縮技術に関しては、他の基準による音質評価は全部間違っている。

一般的な音声圧縮技術の目標は、「自分の好きな音」というものは含まれていない。
もし「音の味」が必須な場合は、別のツール(イコライザー、コンプレッサー、エフェクター)等を使用する。
仮に全部の音声圧縮技術が無断に音に味付けに実行していた場合、好みに応じた音質に調整した非圧縮オーディオファイルを作成したとしても、同等に聞こえる圧縮された音声ファイルを作成することができなくなってしまう。
しかし、透明性を目指した圧縮技術を使用すると、必要に応じて調整された音質を圧縮してもほぼ今と同じまま楽しむことができる。
こんなことがあるので、汎用圧縮技術は、透明性だけを目的として

「音の味つけ」は、他のツールに任せるのが理想的である。
多くの人がお好みの音質で音楽を楽しむことができる環境を技術的に整備するためには、汎用の音声圧縮技術は、可能な限り透明性を求めなければならない。
当然、ある種の圧搾専門的における圧搾前から圧搾後への音の変化を「お好みの音の調味料」と思うのは勝手である。
だが、それは個人的なもの止めなるべきだ。
例えば、一般的な損失音声圧縮技術の音質を公に批判するとき、「お好みの音の味」をしているかどうかを基づいて評価することは間違いである。

たとえば、iTunesでMP3エンコーダの音質は少し悪いことが認知されている。
標準音質(128kbps)に圧縮すると、コーラスの女性のサ行がかなり劣化し、サの発音が「チサ」のようになってしまうことがある。
こんな音の変化は、ほとんどの人にとって不愉快であり「MP3に圧縮するほうが「ムード」が出てくるのが好きだ」と安易に言うこと辞めた方がいい。
もっと極端な場合は、MP3で圧縮したために大きなノイズが入ることがある。

fatboyはそんなサンプル音源である。
Fatboy SlimのKaliforniaのトラックを好んで聞くためには、繰り返し「California is druggy、druggy、druggy、druggy」というフレーズが最大限に「そのパチパチ音変質」のまま聞こえるのが嬉しい。
ここで、少し脱線。私の経験では音声圧縮で音質が劣化するサンプル音源をクラシックで見つけにくい。
人工的な音を多く使う他のジャンルのものが危険なサンプル音源を見つけやすい。

クラシックをよく聞く人よりもそれ以外のジャンルを聞く人の方が、音声ファイルの圧縮方法に注意を払わなければいけないかもしれない。
クラシック音楽が格式の高い音楽であることを明らかにしたまま音声圧縮の音質について語ることは、多分間違ってある。
少なくとも社会的地位の高さと音質を維持しながら、圧縮の難しさは関係がない。
しかし、クラシックもハープシコードなど、特に困難な音がかなり内包されているため、十分な警戒が必須である。
また、脱線してしまうが、中古CDショップでたまたま出会っジャコッテのハープシコード独奏CDが大好きだ。
だが、これはあくまで私の好みであるので他の人にも絶対に当てはまるとは言えないのだ。