入門自然言語処理
スクリプト言語pythonを利用した言語処理入門テキスト。 python自体の解説も結構詳しいので、pythonの予備知識がなくても読める。 (プログラミング自体が未経験の場合はさすがにキツいかもしれない)
http://www.nltk.org/で配布されているライブラリを使用する。 実行可能なスクリプトサンプルが豊富なので、実際に試しながら学習することができる。 上記リンクからnltkをダウンロードし、下記コマンドを入力するとインストールできる(LinuxなどのUnix系OSの場合)。 nltkインストール前に、PyYAMLも同様にインストールしておく。
sudo python setup.py install
さらに、nltk.download()を使って、パッケージをダウンロードする。 パッケージリストでbookを選択する。
原典は2009年に発刊されている。 邦訳には、日本語を処理するときの問題が追加されている。 この部分(12章)も力を入れて執筆されているので、邦訳を購入するほうが良いだろう。
各章末には、問題が掲載されているので、学習理解度を確認しながら読み進むことができる。 白丸、白黒半々の丸、黒丸、で難易度が区別されている。●は非常に難しい。
アマゾンで購入→ 入門 自然言語処理