twitterで犯罪予測というと,犯罪予告を見つけたり,言動から犯罪者予備軍を発見する.
こういうのをイメージするかもしれません.しかし少し考えると,わざわざtwitterで犯罪予告をしたり,犯罪をほのめかす人なんて犯罪者のうちのほんの一部で,予測出来たところで効果が薄そうです.
今回紹介する犯罪予測の方法はこのようなものではありません.
バージニア大学のMatthew Gerber氏はある方法でtweetを分析し,それを従来の方法と組み合わせることで,25種類の犯罪タイプを調査したうち19種類について精度を改善することに成功しました.
ここでは,その手法を紹介します.
Matthew Gerber氏の方法
twitterの設定によってはtweetに位置情報が含まれることは多くの人が知っていると思います.また,tweetにはつぶやいた時刻が記録されます.つまり,位置情報付きのtweetを調べることでtweetがどの場所,どの時点に集中しているのかの情報が得られます.
さらに,tweetの内容をトピックモデリングという手法を使うことで,適切な粒度に分類することができます.
Matthew Gerber氏はこの位置・時間・トピックの情報と実際の犯罪データを比較し,これらの情報と犯罪のタイプには相関関係があることを発見したのです.
コメント
個別のtweetに着目するのではなく,tweetの時空間的な分布や話題から犯罪の起こりやすさを測るというアプローチは面白いですね.確かにtweetの集中している場所は人も多そうで犯罪が起こりそうな気はしますが,トピックと犯罪タイプの相関まで得られるというのは驚きです.
リンク
Predicting crime using Twitter and kernel density estimation – ScienceDirect
紹介した論文です.