アマゾンは「一冊売れたらそれをランキング一位にする」、という簡単なアルゴリズム~部分の変動が全体構造を把握可能とするという実例
Amazonランキングの謎を解く: 確率的な順位付けが教える売上の構造 (DOJIN選書)
服部氏は確率論、数理物理学の研究家。2011年刊。
チャート:y軸の最小目盛りは順位1位、最大は順位80万位を現す。
ある本が売れたらランキングを1位にする
根幹は単純も単純、「最後に売れた順に並べる」という規則である。・・・アマゾン書店がいったん離れて少しだけ一般的な形に読み替える。「最後にとった順に並べる」という規則は、「整理せずにならべておく(積み上げておく)」ということである。ヒトという生物のものぐさな性質に合っているらしく、(実際には整理していないのに)古くから文献には「整理法」として登場する。(32ページ)
数学的に表現すると
「時間経過も意識した先頭に跳ぶ規則」はあまりに長いので、この先、確率順位付け模型確率(確率ランキング模型)と呼ばせていただきたい。(43ページ)
アマゾンのランキングを簡単にまとめると
「注文された本がランキング上位にいる確率が高い」という前提で、売れたら先頭に跳ばし、それを1時間ごとにランキングに反映させる、とシンプルに要約できる。そしてベストセラーではない本をサンプルに、1年間のランキング変動と理論曲線を比較すると一致する事が明確にされる。
ランキングは全体を反映する
特定の本を選んでそのランキングを追跡した結果得られる「ヨットの帆」の部分、すなわちランキングの時間軸変化に曲線の形が示すのは選んだ本の人気度ではなく、(アマゾン)書店が抱える書籍総点数についての情報だ、という事である。・・・ここには、ある本のランキングは、その本の順位だけでなく、すべての本の全体像を反映するという発想の転換がある。(74ページ)
ランキングは全体を反映する、の意味
「確率順位付け模型による分析で、ロングテールからの売上への貢献度合いや、昼夜における人びとのネット活動の様子を大胆に予測し、限られたデータから現実の社会現象を鮮やかに照らし出す。」(本書扉より)ランキングの変動、「ヨットの帆」を分析する事によりランキングと売上規模との関係、時間分布などが見えてくる。著者は常識に反してアマゾンの売上に占めるロングテールの比率は高くなく、ベストセラーの比率が高い事と分析すする。そしてアマゾンのユーザーは午後10-11時に最も活発になる。ある1冊の本のランキングをみるだけで全体が推測できている。
アマゾンが本の種類を用意しなければいけない理由
ロングテールの商品は売上に貢献しないが、ベストセラーも含めた書籍のランキング変動が出版されている書籍の分母と近づく事により、ランキングの正当性と精度を高める事に貢献していると理解した。一冊のランキング情報の変動は書籍全体に沈んでいくソナー発信機の様なものである。本書は1冊のランキングを例に、ある意味哲学的とも言える情報を抽出した。
蛇足
1冊の本の動きW全体を明らかにする。
こちらもどうぞ
アマゾンの予測出荷と蝶ネクタイ構造 - 毎日1冊、こちょ!の書評ブログ