研究

LSIやLDAを手軽に試せるGensimを使った自然言語処理入門

Gensimはベクトル空間モデルを扱うためのPythonモジュールです。ベクトル空間モデルは画像や音声などのメディアにも用いることができますが、Gensimは特に文書を扱うのに便利な機能を多数用意しており、文書集合から簡単に単語文書行列(GensimではCorpusと呼…

LDAでは何故ディリクレ分布を仮定するのか

LDAについて勉強してみた結果の雑記。間違っている可能性もあるので注意されたし。 LDAにおける文書モデル LDA(Latent Dirichlet Allocation)では文書は次のようにして生成されると考える 準備 文書dは高々K個のトピックzから成る K面のトピックサイコロを作…

科学論文におけるアブストラクトとイントロダクションの位置づけ

人は見た目が9割。論文もアブストが9割 かどうかは分かりませんが、人に読まれる論文にするには導入が大事。 個人的に指導を受けた内容などを備忘録を兼ねてエントリにまとめます。 アブストラクト その論文をふと手に取った人、あるいは自分の研究に関す…