素人がトピックモデルを試してみた (第3回)
前回は LDA によって求めたトピック分布をもとに、「最も高い確率を示したトピック番号にその文書を所属させる」という極めて単純な方法での記事のグループ分けの結果を踏まえて、より良い結果を得るための工夫…
2019年01月28日 月曜日
前回は LDA によって求めたトピック分布をもとに、「最も高い確率を示したトピック番号にその文書を所属させる」という極めて単純な方法での記事のグループ分けの結果を踏まえて、より良い結果を得るための工夫…
2019年01月28日 月曜日
前回はトピックモデルの概要と前処理を紹介し、実際のテキストデータでトピックモデルを試してみました。 IIR 英語版という非常に分野の偏ったテキストにシンプルな前処理を施して潜在的ディリクレ配分法(LD…
2018年09月10日 月曜日
私たちは毎日のように文書を読んでいます。 メール、SNS 投稿、技術文書、ニュース記事などなど…… もちろん読むだけでなく、自分たちで書いたりもします。 日々たくさんの文書に囲まれて生活しています。 …
2018年05月07日 月曜日