「藤岡弘@知り合いのブログ」モデルを考える

GREE上の複数の知己(うち一人は、「友達」という表現を使うと失礼だが、「知り合い」というのもよそよそしい感じなので)が3日ほどの間に同一の芸能人をブログで取り上げるという興味深い現象が発生した。
芸能人の名前は「藤岡弘」。
よもやファンでも何でもないが、「藤岡弘」という旬でもないこの芸能人の名前がこれだけ短期間の間に複数ブログで言及されたことがどうも気になった。いわく言い難い悪寒。


さてそこで問題です。「自分の複数の知り合いが3日の間に『藤岡弘』をブログで取り上げる確率はどれくらいでしょうか」


これを考え始めてみたが、なかなかの難問である。
まず検討する必要があるのは、これらが果たして独立事象として扱えるかどうかである。それぞれのブログで藤岡弘が言及された文脈は全く異なる。A氏はラジオにおける藤岡の「水は歴史を知っている」発言、B氏は新千歳空港における「マルセイバターサンド大量購入」目撃証言を取り上げている。つまり、「石原真理子」が今になって急に同時に取り上げられるといった事象の背後に見られるような相関関係はあまり想定しなくて構わない。加えて、A氏とB氏は微妙にお互いを知っている可能性が高いが、目下それぞれのブログを確認している関係とは思えないので、「最近二人の間で藤岡弘がたまたま話題になり、潜在意識の中で彼を話題にしたくなる機運が高まっていた」ということもありえない。
以上のことから、藤岡弘が相次いで言及されたこれらの事象は「たまたま」で、独立事象として扱って問題なさそうである。そうすると、「A氏が藤岡弘を取り上げる確率」と「B氏が藤岡弘を取り上げる確率」をそれぞれ(または同一モデルで)分析できれば、両者の相関関係については考えなくてもよい。

しかし、話がスムーズに進むのはここまでで、次のステップをどうするか?これはなかなか難しい。「ブログで藤岡弘が取り上げられる確率」をどのようにモデル化するか、この糸口がなかなかつかめないのである。

モデル化という作業は、説明要因を全て考慮に入れられるわけではなく、ある事象を簡潔かつ再現性の高いモデル上で分析することに意味があるのであって、したがってどこかで思い切った単純化が必要となる。しかし、アプリオリに「A氏が藤岡弘をブログで取り上げるのは2〜3年に一度くらいかな」というような仮定をおいてしまうと話は簡単であるが、直感としての妥当性はともかくもあまりモデルの奥行きがなくなってしまう。
ということで、単純ながらももう少し説明性と汎用性の高いモデルを構築する必要があるだろう。だが、例えば、「自分の知り合いが『芸能人』をブログで取り上げる確率モデル」としてしまうと、倖田來未エスパー清田も同じ扱いとなってしまい、わざわざモデル化する建設的意義が薄れてくる。さりとて、「藤岡弘」という特定の芸能人が取り上げられたところにはそれなりの意味があるにしても、藤岡弘のみを分析対象にしたいわけでもない。例えばこれが「スターにしきのが複数のブログで同時に言及される確率」だったとしても、やはり同様の関心を喚起するし、同一のモデルで分析されるべき事象であろう。そのように考えて今回の分析の趣旨に照らすと、「微妙な芸能人」が取り上げられる確率、といったところが落としどころになりそうである。
しかし、ここらで「微妙な芸能人がブログで取り上げられる確率」の仮定をエイヤっとおくのでもない限り、いや仮においたとしても、やはりまた大きな壁が存在する。「じゃあ誰が微妙な芸能人か」という問題は避けて通れないからである。「ブログで取り上げられたら思わず反応してしまいそうな微妙な芸能人はこいつらだ」とこちらが勝手にリストを作成したとしても、それら恣意的に選ばれた芸能人がブログで取り上げられる可能性について説得力のある数字が提示できるとは思えない。思いつくアイディアとしては例えば「微妙な芸能人スコア」のようなものを構築し、「『微妙な芸能人スコア』が一定以上の芸能人が同時に知り合いのブログで取り上げられる確率」を分析するというようなやり方が考えられる。「そんなもの作ったって、『何点以上が微妙な芸能人か』というところに恣意性が入るから無意味じゃないか、これだから実証主義者は」という一部社会科学徒の声が聞こえてきそうだが、使用する「微妙な芸能人スコア」の閾値を動かして感度分析をすればある程度客観性は確保できるだろう。
だが、「微妙な芸能人スコアの構築」というだけでも、これ自体dissertation topic(藁)とまでは言わないにしても、ちょっとした社会調査プロジェクトである。まとまった数の芸能人のリストを作って、「あなたはこの芸能人が『微妙』だと思いますか」、とそれぞれについて答えてもらい、各芸能人を特徴付ける観察可能な変数を使って因子分析等をすることになるだろうか。しかし、無作為抽出したサンプルにいきなり「微妙かどうか」と聞いてしまうと、ここでbroadmindが提起した「微妙」という表現と違うニュアンスで解釈された回答が集まる可能性もあり、それもあまり本意ではない。そうすると、この「微妙」という表現で何をより具体的に意味しているのかを検討した上で、どういう質問項目を作ればそのニュアンスを一番うまく拾えるかどうか、質的な予備調査を行う必要も出て来そうだ。
うむう。どんどん泥沼に嵌って収拾がつかなくなってきたぞ。さらに言うまでもないことだが、仮にこのスコアが構築できたとしても、自分の知り合いがブログでそれら微妙な芸能人を取り上げる確率をどう処理するか、というさらに困難な作業は手つかずのままだ。どうも本質的でないが議論のしやすいところから片付けようとするのはbroadmindの悪い癖だ。まあしかしこれをexplicitなモデルで表現するのは至難の業なので、例えば100エントリくらい書いてる人であれば、その中で芸能人を取り上げているエントリ数、その中でさらに「微妙な芸能人」が取り上げられている頻度、くらいに分けて帰納的に考えるくらいで勘弁して頂きたいものだ。だがこれもかなりサンプル数がないと信頼性の高いモデルにはならないだろうなぁ。
ということで、リーズナブルなモデルに到達できていないのだが、以上の「藤岡弘@ブログモデル」につき読者諸兄姉に良いアイディアがあれば知恵を寄せて頂きたい。