LDA(Latent Dirichlet Allocation)模型是2003年由David M. Blei等人提出的一个主题模型。
本文将按以下目录结构组织LDA学习笔记系列文章:
第一部分:数学基础,这部分主要介绍文本分析方法中用到的数学基础,如:Gama函数、Beta函数和分布、Dirichlet分布、共轭分布、二项分布、多项分布、SVD(奇异值分解)等。
第二部分:文本建模,这部分主要介绍三种在LDA模型出现之前的文本建模方法,分别是:VSM(向量空间模型)、LSA(潜在语义分析模型)和pLSA(概率潜在语义分析模型)。
第三部分:LDA模型,这部分重点介绍LDA模型的概念、参数评估和推理,并与其它文本建模方法做简单比较。
第四部分:LDA扩展模型,这部分主要介绍一些基于LDA原始模型扩展的模型,以及LDA模型的现实应用。
学习LDA的途中,看到了许多很好的博文,对我的学习产生了很大的帮助,以下列举几个:
- 统计之都LDA系列 - rickjin
- SVD奇异值分解 - leftnoteasy
- We Recommend a Singular Value Decomposition - David Austin
- 主题模型小servey - 天青色等烟雨
- LDA - 丕子