マウスパッドを洗ったらダメになった話

どうでもいいこと。
最近これまで使っていたArtisan紫電というマウスパッドがヘタってきたので同じものを買い替えました。
古いほうが余っていたので綺麗に洗えばまたどっかで使えるだろうと思ったので公式サイトの情報を元に洗ってみました。
ブラシであらったのですが、ブラシを使ったのが悪かったらしく布の上のガラスコーティングが剥がれて毛羽立ちというかバリみたいなのが大量に出てしまいました……
まあもともとダメに成ってたやつをリカバリーしようとして洗った結果がダメだったので全く問題ないんですが、これから今使ってるやつを洗おうとした時に気をつけるために自戒の意味を込めて。

マウスパッド自体はかなり好きです。宣伝とかあんまり好きじゃないけど。

RuCTF 2014予選に参加しました

お久しぶりです。ここのところ体調を崩してうだうだし続けていましたが、NetAgent株式会社で行われた(非公式)CTF合宿に行ってきました。
みむらさんやらゆったんさんやらopさんやら周りすごい人しかいなかったので人権がなかったです。
今回参加したのは RuCTF2014 qualsです。
CTFはSECCON CTF予選に2回ほど参加したことがあるのですが、まともに問題が解けたのは今回が初めてだったりします。
自分が解いた中でHardware 200の問題は特に頭がおかしいと思ったりしてました……なんでCTFやってるはずなのに回路図書いてるんだ俺って。
そんなこんなで楽しく2泊3日CTFすることが出来ました。NetAgentの皆様、参加者の皆さんありがとうございました!

Samuragochiマユゲ

長門の精度を適当に測った

それぞれのクラスごとに4種類の入力を用意して、それの想定されていた出力と同じかどうかをテストしました。

結果(%)

	        normal	complement
長門有希, 艦これ        	92.85	92.85
有希, 艦これ, 自治体	88.88	83.33
艦これ, 戦艦, 長門有希	64.28	64.28
4つすべて               	33.33	27.77

こんなかんじになりました。戦艦長門と艦これ長門はそもそも差がなさすぎてそれによって誤判定されるものが多かったようです。
戦艦と艦これの分類は結構厳しい……

長門のやつの精度測定用関数を書いた

書きました。
とりあえずComplementと普通のやつに両方分類させて精度を測定します。
今masterにマージしました。
テスト用データはCSVで定義。
テスト用でーたを用意するのがめっちゃ大変だということに気づいてしまって戦慄している。

個人サイトをHeroku上に移転してみた

これまでの旧個人サイトも一応残ってはいますが、Github pagesからHerokuに移転してみました。
今回の移転は、これからこのブログやその他サービスに分散している更新情報を一つにまとめるスクリプトを追加するためですが、まだやってないのでちょっと先になるかもしれません。
Heroku上のRoRをつかってみました。RoR意外と簡単に使えたけどRubyに馴染みがなく、まだ慣れていません。そのうち使ってくうちに慣れるかな。とりあえず便利だなあと思いました。

HaskellとMeCabで長門(その3) : Complement Naive Bayesもやってみた

結局やろうやろうおもいつつ全然やってなかったの続き。

今回は学習時の文書量に差があるときに効果を発揮するというComplement Naive Bayesを実装してみました。

どんなの

調べると、
新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転
をみつけました。

  1. そのクラスに属さない文書を使って学習
  2. そのクラスに属さない確率を計算
  3. その確率が一番低いクラスに分類

という、ほぼすべてをひっくり返した方法らしいです。これにより、学習時に文書量の多かったクラスにたくさんの単語が含まれていることにより、全体的な確率にばらつきが出てしまうことが防げるらしいです。

というわけで既存の分類器をあまりいじらずに出来ました。

どうだったの

学習元の文章自体少ないのですが、

と、かなり量がバラけています。
これは効果が期待できるのかな、と思ったけど殆ど変わりませんでした。具体的には以下から。
一応前回と同じ文章を使っています。上に表示されている結果はこれまでの普通のナイーブベイズで、下がComplement Naive Bayesです。
f:id:haru2036:20140120210025p:plain

f:id:haru2036:20140120210042p:plain

f:id:haru2036:20140120210054p:plain

f:id:haru2036:20140120210107p:plain

結局元から判別が難しいと思っていた艦これと戦艦はやっぱり無理でした。そして、長門有希に関しても"戦艦"の1語が入っていたために艦これと勘違いされています……これテーマ間違ったな。

まとめ

そもそも戦艦長門長門有希の時点でも結構テーマとしてもアレだったけどそれに人間でも紛らわしい艦これを突っ込んでしまったがためにかなりグダグダに。一応他のことにも使えるからいいか……

ソースはgithubにあります。実装もめっちゃグダグダですが……
haru2036/nagato · GitHub

次は何をしよう……