マッチングの数学 – パート1

音楽のストリーミングは、権利者(特に出版社、協会、作曲家、著作者グループ)に2つの大きな課題を残す。 まず、アップル、スポティファイ、アマゾン、タイダル、ディーザー、パンドラなどのデジタル・サービス・プロバイダー(DSP)は、毎月の利用報告で150万から500万曲のさまざまなトラックを送信することができる。 毎月膨大な量の楽曲が使用され、報告されるため、あっという間に圧倒されてしまった。   レコードやCDの「ライナーノーツ」から得られる情報は、オンラインではめったに得られない。 作曲家名や作者名は、メジャー盤であっても、しばしば欠落していたり、間違っていたりする。 

このため、デジタル著作権管理者にとって、膨大な量のデータを(「ロングテールを切り捨てる」ことなく)処理し、すべてのトラックと対応する作品を照合するために、欠陥のある/あいまいなメタデータを正確に三角測量できることが非常に重要なのである。 実際、デジタル著作権管理者の能力は、権利者がサービスに対する支払いを少なくして、より多くの損失を被らないようにするためには、両方の側面を使いこなすことが鍵となる。

以下では、DSPから報告される膨大な利用データを扱う上での課題と、それが権利者のコレクションにどのような影響を与えるかについて見ていきたい。 後の記事では、欠陥のあるメタデータの蔓延と、それがペイアウトに及ぼす影響に焦点を当てる。

ボリュームの削減は損失を意味する

CD販売のピークだった2000年には、米国で9億4,250万枚のCDが出荷された。 例として、各リリースが平均1,000枚売れたと仮定しよう。 各リリースが10曲だとすると、2000年だけで942万5000曲のユニークトラックを扱っていることになる。

この数字は高いように見えるかもしれないが、1つのDSPから1つの製品ティアに対して毎月1、2件の利用報告があることを大まかに表しているに過ぎない! 要するに、かつては数年(  )、数十年とまではいかなくても、数十年分の利用データがデジタル音楽業界では毎月報告されるようになったのだ! 実際、私は以前、北欧地域のオンライン音楽データ量が、2000年のインデックス100から2013年にはインデックス112,500に増加したと計算したことがある!

では、業界はこの増加にどのように対処したのだろうか?

90-95%の価値が最初の20-40%の中古トラック(上記の30万-160万トラックの間を参照)に見いだせるのであれば、残り5-10%の価値を求めて残りの120万-240万トラックを分析しないのは、昔も今も「簡単」なことだ。 特に、権利者/管理者がデータを分析するには、単純に費用がかかりすぎる、あるいは時間がかかりすぎるようになったからだ。 それゆえ、データを処理する際に「ロングテールを切り離し」、「ヒット」セクションの儲かる部分だけに集中することが、業界標準のソリューションとなった。

このソリューションにより、作業負荷の60~80%を軽減することができたが、これは同時に、権利所有者が、そうでなければ同等のシナリオにおいて、収益の5~10%に別れを告げることを意味した! それでも、残りの20~40%のデータがすべて処理されたわけではなく、常に処理されているわけでもないことがわかっている。

誰一人欠けることなく – MPACによる救済

ミュサークが世界有数のデジタル著作権管理事業者になるために航海を始めたとき、私たちはバックエンドがすべてのデータ量に対応できなければならないという目標を設定しました。 私たちは、誰もが正しく報酬を得るべきだと考えているだけでなく、顧客とその権利所有者は、自分の作品がマッチングされたにもかかわらず、配信を正当化するほどの(十分な)収益が得られなかった場合、それを知る権利があると信じています。 テクノロジー部門の責任者であるコリン・ホワイトが言うように、”私たちはヒーローだけでなくゼロも背負わなければならない”。

だからそうしたんだ。 今日では、当社独自のスケーラブルなクラウドインフラストラクチャであるMPAC(Muserk Primary Automation Cortex)によって、多数のワークフローを同時に処理することができる。 これにより、ミュセルクは数千万行の報告書を1時間以内に処理することができる。 2000年のCDの例で言えば、ミュサークは1年分のデータを1時間足らずで処理する。 わずか1日足らずで20年分のデータだ! ミュゼルクでは、すべてのレポートライン、すべてのトラック、すべてのビットを見て、顧客のレパートリーに合わせることができる。 そして実体験から、私たちはそれが顧客とその収益に違いをもたらすことを実感している。

使ったお金は稼いだお金

「これが私のコレクションにどのような影響を及ぼすのか? 平均的な手数料率が10%から20%であるこの業界では、ロングテールの5%から10%の価値を見つけることが、サービスの実際の価値を計算する際に大きな違いを生む。 実際、低額のサービス料を支払うことで、最終的にお金を少なくすることは非常に簡単である。

例えば、権利管理者Aは11%の手数料を取るが、尻尾を切り落とし、90%の価値しか見出せない。 これでは、著作権の価値の約80%が残ってしまい、ロングテールが見えない。 したがって、どの作品があなたの権利の価値の10%を占めているのか、どのように使用されているのか、誰に使用されているのか、どこから使用されているのか、まったくわからない。 逆に、権利管理者Bは19%を徴収するが、ロングテールをカットしない。 これで、著作権価値の81%に加え、すべての利用状況を完全に把握できるようになった! つまり、デジタル著作権管理者の真の価値は、その価格以上のものなのだ。 量だけを見ればそうだが、精度を含めればなおさらだ。

詳細は後日

次回のブログポストでは、オンライン業界の欠陥だらけのメタデータを正確に三角測量する能力が、上記の価格と価値に関する例をさらに補強していることを見てみたい。  続報をお楽しみに! それまでは、ミュゼルクの他のブログ記事もご覧ください。