長門分類器
それぞれのクラスごとに4種類の入力を用意して、それの想定されていた出力と同じかどうかをテストしました。 結果(%) normal complement 長門有希, 艦これ 92.85 92.85 有希, 艦これ, 自治体 88.88 83.33 艦これ, 戦艦, 長門有希 64.28 64.28 4つすべて 33.3…
書きました。 とりあえずComplementと普通のやつに両方分類させて精度を測定します。 今masterにマージしました。 テスト用データはCSVで定義。 テスト用でーたを用意するのがめっちゃ大変だということに気づいてしまって戦慄している。
結局やろうやろうおもいつつ全然やってなかったの続き。今回は学習時の文書量に差があるときに効果を発揮するというComplement Naive Bayesを実装してみました。 どんなの 調べると、 新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ…
精度改善のために とりあえずMeCabの出力を使って品詞が名詞である単語のみをフィルタした状態で訓練するように修正しました。 結果 まず全エントリの3つの文を。 結果としては残念なことに全部艦これになってる…… 考察 長門有希の文章に関しては、「戦艦と…
前々からちょこちょこやっていたのがやっと一応の完成を見ました。 なにこれ 戦艦長門と長門有希と戦艦長門(艦これ)についての文章を判別することを目的にナイーブベイズな分類器をHaskell+MeCabで実装したやつです。 中身 言語処理のための機械学習入門 (自…