Haskell
regex - Matching specific unicode char in haskell regexp - Stack Overflow みたいです。実はこれと同じような状態で、Localeだけja_jp.UTF-8だけどUTF-8担ってるからいいのかなあと思ってたけどダメだった。 今回は特定の文字で文字列を分解するためだけ…
ハマったのでメモ。(割りとどうでも良い落ちだったのでアレ) 困った 環境: OSX10.9.4 + GHC7.8.2 + MeCab0.996(HomeBrewでインストール) + cabal1.20.0.2 (問題のプロジェクトはCabal sandboxにインストールしています。) 発生した問題: mecabを使ったプロジ…
作ったのは結構前のことですが、書くのがいまさらになったのでメモ。 Yesodはじめてみました - haru2036のブログ でYesodが意外としっくりきたことを書きましたが、そのままYesodで行ってみました。 私の部活はソフトウェア研究部とかいう名前のくせに部員の…
これまでWebアプリをまともにやったことなかったので、どうすればいいのかわからなかったのと、FlaskとかRoRとか触ってみてもなんかしっくり来なかったので、ヤケになってHaskellのWebフレームワークであるYesodを触ってみました。 YBlog - Haskell web prog…
書きました。 とりあえずComplementと普通のやつに両方分類させて精度を測定します。 今masterにマージしました。 テスト用データはCSVで定義。 テスト用でーたを用意するのがめっちゃ大変だということに気づいてしまって戦慄している。
結局やろうやろうおもいつつ全然やってなかったの続き。今回は学習時の文書量に差があるときに効果を発揮するというComplement Naive Bayesを実装してみました。 どんなの 調べると、 新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ…
精度改善のために とりあえずMeCabの出力を使って品詞が名詞である単語のみをフィルタした状態で訓練するように修正しました。 結果 まず全エントリの3つの文を。 結果としては残念なことに全部艦これになってる…… 考察 長門有希の文章に関しては、「戦艦と…
前々からちょこちょこやっていたのがやっと一応の完成を見ました。 なにこれ 戦艦長門と長門有希と戦艦長門(艦これ)についての文章を判別することを目的にナイーブベイズな分類器をHaskell+MeCabで実装したやつです。 中身 言語処理のための機械学習入門 (自…
というわけで結構ヤバいのではと思いつつ触ってます。正直言って寝起きなので変なこと書きまくってるかもしれない。 リポジトリはここでやってるのでツッコミをいただけるとありがたかったり。 haru2036/learnHaskell · GitHub なんとかそれぞれの要素に対し…
とりあえずさしあたっての目標に前のエントリに書いたようにラボユース成果物(haru2036/laboyouth · GitHub)をHaskellに移植することを設定したので、とりあえずモデルの生成部分からやっていこうと思ってます。まあいきなりtrigramの数え上げやったら死ぬと…