dapの特徴、ハイレゾ音源対応を生かすアップコンバートとは何ですか

携帯音楽プレーヤーの登場によって好きな楽曲を場所を選ばず聴く事が出来るようになりました。
今では音楽プレーヤーがなくてもスマホの音楽アプリを利用して更に簡単に楽しめるようになりました。
扱いの簡単なスマホアプリに対して音楽プレーヤーの利点はなんといってもその音質です。
特にdapにはスマホアプリや同じ携帯プレーヤーのmp3プレーヤーと異なりハイレゾ音源を再生できる利点があります。
でもハイレゾ音源を持ってない人には関係ない、いいえそんな人でもアップコンバート技術を使えば大丈夫です。
でもアップコンバート技術とは何でしょうか。
dapの特徴
dapは正式な名称Digital Audio Playerを略したもので小型の携帯型音楽プレーヤーの事を意味します。
特徴としては音楽を内蔵のメモリまたは本体に挿入して使うmicroSDカードなどにデジタル化した音楽データを記録する事で非常に多数の楽曲を保存しておくことが出来る点です。
これ以前のプレーヤーはカセットやMD、CDなどのメディアに楽曲が記録されそれらを再生するものでした。
再生できる曲数はこれらのメディアに記録できる数に限られていました。
デジタル音楽プレーヤー
dapという言葉が登場する前からすでにデジタル音楽プレーヤーは存在していました。
それがmp3プレーヤーです。
デジタルプレーヤーが再生する音楽ファイルには様々な形式がありますが元々mp3プレーヤーはその名の通りmp3形式のファイルを再生するためのプレーヤーでした。
ただしその後は様々なファイル形式に対応が可能になりました。
それではdapとmp3プレーヤーの違いは何かというと現在ではハイレゾ音源に対応していればdapで、そうでなければmp3プレーヤーと分類されています。
ただしこの区分はあまり厳密なものではありません。
例えばApple社のiPodはハイレゾ対応していないのでmp3プレーヤーになるはずですが、dapとして扱われる事が多いです。
デジタル音楽プレーヤーの仕組み
携帯音楽プレーヤーで音楽を楽しむだけならスマホやmp3プレーヤーを使うという手があります。
スマホなら新しいプレーヤーを買う必要はなく費用面で有利ですしmp3プレーヤーでも音質の面でそれほどdapに劣るとは思えません。
dapがこれらと異なる最大の特徴はハイレゾ音源に対応していることです。
ハイレゾ音源やアップコンバート・アップスケーリングを説明するために、そもそも現在の音楽(デジタル)プレーヤーはどのように音楽を記録再生しているかについて考えます。
音声のデジタル化の方法
昔の音楽プレーヤーではカセットテープが音楽の記録・再生に使われていました。
カセットテープには磁性体という一種の磁石が塗ってあります。
これに音の強弱を直接磁力の強弱として記録して逆に聴くときにはそれを音の強弱に戻すという方法でした。
より低い周波数や高い周波数の音まで記録・再生を可能にするために各メーカーは磁性体にどんな材料を使うか工夫を凝らしていましたが記録原理はこのアナログ式でした。
一方現在では(mp3もdapもスマホの音楽アプリも)音をデジタル化しています。
音は空気が縮められたりそれに対して反発して広がったりして伝わっていく空気の振動です。
これを表すのに横方向に時間、縦方向に(ある地点での音の)大きさを記録した図が使われます。
縦方向は空気が全く伸び縮みしていない時を0にして伸び縮みの大きさを縮んだらマイナス、伸びたらプラスで表すようにします。
この図は時間とともに音の大きさが上下に変化する波の形になります。
この連続的な変化をそのまま(他の何か、例えば磁気テープの場合なら磁力の変化にして)記録していたのが以前のアナログ式の記録でした。
これに対して時間と音の強弱を一定の間隔に区切って区切られた地点のみを記録するというのがデジタル式です。
時間は一秒間に何等分するかで表し単位はヘルツでこれをサンプリング周波数とよびます。
例えば100等分の場合なら0.01秒ごとに音を記録する事を意味してこれを100ヘルツでサンプリングしたと言います。
音の強弱を区切る方は量子ビット化と呼ばれ例えば8段階に分けて記録する場合なら3ビット(=2の3乗=2×2×2)で記録したといいます。
サンプリング周波数が大きいほどより高い周波数の音まで、量子ビット化数が大きいほどより微小な音まで記録する事ができ元もとの音声に近くなります。
音声データの圧縮
サンプリング周波数とビット数は大きい方が良いのですがこれらが大きい程記録データは大きくなり必要な記録容量が大きくなります。
そこであまり高い周波数や低い周波数の音は人間の耳に聞こえないからそれらの音は必要ないなどを考慮し記録できる容量との兼ね合いも考えて記録する周波数やビット数が決定されます。
デジタル化された音声は通常更に「データの圧縮」をおこなってデータ量を減らしてから記録されます。
データ量を減らすには、単純に人には聞こえない周波数帯の音やあまりに小さすぎて聞こえない音などを落としてしまう他に人間の耳の特性から聞こえにくい音を落とす作業などを行います。
一例としてマスキング効果に基づく処理を説明します。
これは大きな音の周波数に近い周波数を持つ小さな音が聞こえにくいという耳の特性の事で、音声の聞こえ方はほとんど変わらないからそのような音はカットする処理です。
以上のように元データを人の聴感上は変わらない範囲で減らした上でデータの数学的な圧縮処理を行います。
音声のファイル形式としてmp3やAAC、WMAなど多数の種類がありますがこれはこの圧縮に用いられる手法の違いによるものです。
圧縮率が高い程たくさん記録が出来ますが一般的に圧縮率が高い程データの欠損は大きくなり圧縮前と同等の品質に戻すのが難しくなります。
音楽を再生する時にはこの圧縮されたデータを「解凍」して圧縮前のデータを再現して使います。
この圧縮の手法は可逆圧縮と非可逆圧縮に分けられます。
可逆とは元に戻せるという事で、可逆圧縮は圧縮前と完全に同じデータに戻す事が出来ますが非可逆圧縮は元と全く同じにはなりません。
データを圧縮する過程で不要なデータを削除しますが、削除方法を工夫したのが可逆圧縮です。
といっても可逆圧縮の場合もデジタル化する過程で元の(アナログの)音声データを欠損しているのでどちらにしても完全に元の楽曲が再現できるわけではありません。
アップコンバート技術とは何か
CD音源はサンプリング周波数と量子ビット数が44.1kHz・16ビットで記録されています。
これよりも高い周波数・ビット数で記録された音源の事をハイレゾ音源と呼びます。
実際にハイレゾ音源として使われている物はサンプリング周波数が96kHzまたは192kHzで量子ビット数が24ビットの物が使われています。
このハイレゾ音源では人間の可聴域をはるかに越えた周波数帯まで再現しています。
dapがハイレゾ音源対応といっても、この観点からそこまで再現して(はたして違いがわかるのか)意味があるのかとの疑問もありますがそもそもハイレゾ音源がないので自分には無関係・意味がないと考える方も多いでしょう。
ところが非ハイレゾ音源をハイレゾ相当に変換する技術があります。
それがアップコンバートとかアップスケーリングと呼ばれるものです。
アップコンバートの仕組み
非ハイレゾ音源のデータからサンプリング周波数と量子ビット数を増やす事でアップコンバートを行います。
もちろんコンバートする前のデータには、それらの拡張する部分のデータがありません。
このような欠損部分を数学的にすでにあるデータから推測して再現する手法があるので、まずそれらを用いて欠損データの再生を行うのですが各メーカーが開発したアップコンバート技術はそれだけではありません。
各メーカーは多数の楽曲データを解析する事で曲の種類やその前後の音の関係など様々な要因から欠損データを推測する方法を開発して数学的なデータ補間とこれらを組み合わせる事でより精度の高い欠損データ修復をおこないます。
各社のアップスケーリング技術
非ハイレゾ音源をハイレゾ音源にアップスケーリングする技術で有名なのはソニーのDSEE-HXですが他にも同様な技術が各社で開発されています。
KENWOODのK2 Technology、 Pioneerのマスターサウンドリバイブ、DENONのAdvanced AL32 Processing などです。
さらにMacintosh用のXLDやWindows用のUpconvなどのフリーソフトでアップコンバートが可能なソフトなどがあります。
先に述べたようにアップコンバートする際には欠損データを補間して再現するのですが、ここをどう再現するかの方法や推測に使うために蓄積されたデータが各社で異なっているので曲の性質や種類によってどの方式がもっとも適しているのかは変わってくると思われます。
どの技術がおすすめかは、実際自分の好きなジャンルの楽曲を再生して聴き比べるしかないでしょう。
まとめ
dapはハイレゾ音源対応という点で他の携帯プレーヤーやスマホアプリにない特徴があります。
しかしハイレゾ音源を持っていなければこれはあまり意味を持ちません。
ですがdapにはアップコンバート技術で非ハイレゾ音源をハイレゾ相当の音質に変える事ができるものがあります。
これは元の楽曲から欠損したデータを補間して再現するというものです。
いくつかの会社がこの補間方法に工夫を凝らした技術を開発しています。
それぞれの技術と相性の良い楽曲・悪い楽曲があるでしょうから、その効果は実際に試してみるしかないでしょう。