ソーシャルブックマークネットワークのセグメント化

ソーシャルブックマークの偏りを強める方法のもうひとつ*1
まずはとにかく大量の人間をソーシャルブックマークのユーザにしてしまう。んで、ブックマークしたサイトの共通性で、ユーザの類似度を出す。「似た話題に興味を示した人間はやっぱり似た人間である」という仮定に基づき、似たユーザをおとなりブックマークとか名前をつけて公開する。
次に、「似たユーザが注目する内容はやっぱり似た内容である」という前提に基づいて、エントリの類似度を出す。amazonのように、このエントリを読んだ人はこんなものも読んでいます機能を搭載する。上手く使えばタグ付けすら不要に!やったね!もしくはタグ情報も類似度算出に使ってもいいけど。
で、各ユーザごとに、各エントリにスコアをつける。スコアにはエントリの類似度とかそこを読んでるほかのユーザの類似度とかブックマークされた回数を使う。
で、エントリの、今はブックマークユーザ数が表示されてるところをこのスコアに置き換えて、ついでに高スコアで未チェックのものをお勧めエントリ一覧として表示する。
ユーザの類似度とエントリの類似度には相関がある。偏りを無くすなんて景気の悪い事は言わないで、むしろ以上のルーチンを再起的にループさせてより強力に相関させる。

*1:というか研究室入ったらやろうとか思ってた内容。既出だったら泣く。というかここで書いたら既出になるじゃん!ヤベェ俺!