読者です 読者をやめる 読者になる 読者になる

OSXでText.RegexにUTF8な文字列使うとエラーでるっぽい

regex - Matching specific unicode char in haskell regexp - Stack Overflow みたいです。実はこれと同じような状態で、Localeだけja_jp.UTF-8だけどUTF-8担ってるからいいのかなあと思ってたけどダメだった。 今回は特定の文字で文字列を分解するためだけ…

OSXでHaskellとMeCab

ハマったのでメモ。(割りとどうでも良い落ちだったのでアレ) 困った 環境: OSX10.9.4 + GHC7.8.2 + MeCab0.996(HomeBrewでインストール) + cabal1.20.0.2 (問題のプロジェクトはCabal sandboxにインストールしています。) 発生した問題: mecabを使ったプロジ…

Yesodで部員管理用Webサービス作った

作ったのは結構前のことですが、書くのがいまさらになったのでメモ。 Yesodはじめてみました - haru2036のブログ でYesodが意外としっくりきたことを書きましたが、そのままYesodで行ってみました。 私の部活はソフトウェア研究部とかいう名前のくせに部員の…

Yesodはじめてみました

これまでWebアプリをまともにやったことなかったので、どうすればいいのかわからなかったのと、FlaskとかRoRとか触ってみてもなんかしっくり来なかったので、ヤケになってHaskellのWebフレームワークであるYesodを触ってみました。 YBlog - Haskell web prog…

長門のやつの精度測定用関数を書いた

書きました。 とりあえずComplementと普通のやつに両方分類させて精度を測定します。 今masterにマージしました。 テスト用データはCSVで定義。 テスト用でーたを用意するのがめっちゃ大変だということに気づいてしまって戦慄している。

HaskellとMeCabで長門(その3) : Complement Naive Bayesもやってみた

結局やろうやろうおもいつつ全然やってなかったの続き。今回は学習時の文書量に差があるときに効果を発揮するというComplement Naive Bayesを実装してみました。 どんなの 調べると、 新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ…

HaskellとMeCabで長門(その2)

精度改善のために とりあえずMeCabの出力を使って品詞が名詞である単語のみをフィルタした状態で訓練するように修正しました。 結果 まず全エントリの3つの文を。 結果としては残念なことに全部艦これになってる…… 考察 長門有希の文章に関しては、「戦艦と…

HaskellとMecabで長門に関してのテキストをを判別してみた

前々からちょこちょこやっていたのがやっと一応の完成を見ました。 なにこれ 戦艦長門と長門有希と戦艦長門(艦これ)についての文章を判別することを目的にナイーブベイズな分類器をHaskell+MeCabで実装したやつです。 中身 言語処理のための機械学習入門 (自…

Haskell触ってみる(2)

というわけで結構ヤバいのではと思いつつ触ってます。正直言って寝起きなので変なこと書きまくってるかもしれない。 リポジトリはここでやってるのでツッコミをいただけるとありがたかったり。 haru2036/learnHaskell · GitHub なんとかそれぞれの要素に対し…

Haskellを触って見る続き

とりあえずさしあたっての目標に前のエントリに書いたようにラボユース成果物(haru2036/laboyouth · GitHub)をHaskellに移植することを設定したので、とりあえずモデルの生成部分からやっていこうと思ってます。まあいきなりtrigramの数え上げやったら死ぬと…