山の学校ゼミ(調査研究)の計画

浅野直樹です。

 

計画している調査研究のうち、統計的な数字を使った実証部分だけまとめます。

 

twitterのユーザーの中には、「流される」ユーザーが相当数いるのではないかという仮説(仮説1)を立てました。

 

数字で実証するために、ここでは、「流される」ユーザーを、RT率(=リツイート/全ツイート)が0.8以上のユーザーと定義します。

 

リツイートとオリジナルツイート(リツイート以外のツイート)がランダムで発生するのであれば、RT率は、0.5を中心とする正規分布のような形になるはずです。

 

しかし、実際には、0.0〜0.2と、0.8〜1.0の両極に分布が偏るのではないかと予測しています。

 

さらに、政治的なキーワードが含まれるツイートに限定すると、RT率が高い部分にだけ極端に偏るのではないかと予想しています。

 

これらを実証するために、政治的なキーワードとして「都知事選」を取り上げ、投票日の7/5(日)の20:00頃と、その前後1週間の計3回で、「都知事選」というキーワードを含む1000ツイートと、任意の1000ツイートを収集し、それぞれRT率を計算します。各ユーザーにつき、直近100ツイートによりRT率を計算します。

 

次に、仮説2として、RT率が0.8以上の「流される」ユーザーは、特定のテーマに流され続けるのではなく、その時々のトレンドに乗っているいるのではないかと考えています。

 

そこで、先の調査で「都知事選」のキーワードで取り出した「流される」ユーザーが、一週間後(または一ヶ月後)に、まだ「都知事選」というキーワードでつぶやいているかを探索します。

 

実証がメインの研究ではなく、実証的な要素がないよりもあったほうがよいだろうというくらいの扱いです。厳密な統計的検定は行いません。