クリスマスプレゼント2016としてのゆゆ式一挙放送

ふたたびゆゆ式一挙放送

live.nicovideo.jp

11/30に発表されたゆゆ式OVA発売日決定の興奮覚めやらぬまま師走に突入し、12/19には一挙放送の発表がなされた。 正直ゆゆ式一挙放送が1年程の間隔でまたあるとは想像できなかったのでテンションが最高潮に達したついでに、yuyu-crawler*1のバージョンアップに着手した。 そのまたついでにと言っては申し訳ないが、聞くに、今回は他作品の一挙放送を含めた大規模なイベントであるらしいので一緒にデータをとってみようと画策した。

ちなみに、放送時間帯順に列挙すると、ご注文はうさぎですか?ご注文はうさぎですか??きんいろモザイクハロー!!きんいろモザイクゆゆ式三者三葉のんのんびより干物妹!うまるちゃん未確認で進行形の9作品である。 このラインナップに対してなぜ○○がないのだと訝る気持ちも分かるがそこは楽しんだもん勝ちかと思う。

とりあえずデータの整理

ツイート数の取得期間はニコニコ生放送の枠の開始時間と終了時間に合わせている。 検索クエリとして利用するキーワードもそれなりに公平に決定したつもりではあるが、なにせゆゆ式以外の実況ツイートの検索キーワードがどの程度妥当かどうかが若干怪しい部分もある。 原則、公式が定めているハッシュタグがあればそれを利用し、加えて作品タイトルと作品タイトルの略称をOR検索で渡している。 因みに、Twitter APIの結果をそのまま使うと、仕様的にユーザ名等も検索対象としてしまう件や、キーワードを単語やN-gramに意図せず分割してしまうが、 各々の検索結果に対して再度containing判定をして、キーワードに対して部分一致する本文を持つデータ以外は除外する対応はしている。

結果概観

ひとまず、来場者数とコメント数はニコ生のページのデータであり、ツイート数は上で述べている条件で取得した値である。 RTも含まれているが、RTを除外したものでも全体傾向に大きな違いはなかった。

f:id:ekranoplan94:20161226221239p:plain

改めて見てみると、放送時間帯のバイアスを多分に受けていることは必至であり、またこの結果は作品自体の優劣であるとか面白さを比べるものではない。 ただ、贔屓目に見ても目を引くのはゆゆ式のツイート数である。 おそらくこの数値的は開きはもちろん実況参加者や一人あたりの発言数の多寡はあれど、きちんとハッシュタグをつけるだとかそういう所作の徹底にも起因している気がしており、ある意味積み上げられた経験の差なのかもしれない。

今後は時間帯を考慮した正規化等を実施し、データを少し触っていけたらなーと思っている。

*1:借りているVPS上で動作しているゆゆ式情報収集クローラー