YouTube网红小哥Siraj Raval的趣味小视频系列The Math of Intelligence又来啦!这期我们来讲一讲机器学习里的生成式模型。
上面这位萌萌哒(?)的男子
就是数学家狄利克雷
他的全名非常长长长长
Johann Peter Gustav Lejeune Dirichlet
这种读不出来的名字一看就是德国人
今天我们就来讲讲
一种最常见的生成式模型
隐狄利克雷模型
到底是个啥
先说生成式模型
(Generative Model)
它的对立面是判别式模型
(Discriminative Model)
判别式模型告诉我们已有的数据是什么
生成式模型则可以生成新的数据
怎么样
是不是超酷!
生成的数据呢
就是下面这样的
LOL WTF
哈哈哈哈哈
或者是下面这样的
《根本停不下来!给它一个轮廓,TensorFlow还你一只完整的喵》(点击阅读)
隐狄利克雷
Latent Dirichlet Allocation (LDA)
就是一个生成式模型
它的名字来自狄利克雷分布
就长这样
这个模型还是由
吴恩达
最早推广的!!!
它的用途是
给一段话生成一个主题
它先看每个词可能属于什么主题
比如
“小猫很可爱”这句话
“小猫”和“可爱”
可能都是关于动物的
那么这句话的主题就是动物
模型里的“隐”字代表
通过“推断”
而不是直接观察得到的变量
因为我们只能观察到词语
而模型生成的主题是由推断得出的
好了不能再剧透更多了
更生动详细的解释
请大家观看视频
时长9分钟
有中文字幕哦
如果你有一把锤子
那么在你看来
无论什么看起来都像钉子
如果你有一篇文章
那么你就想提炼它的主题
没有主题?
那就用算法生成一个
这就是
隐·狄利克雷·模型
最后来讲一个笑话——
青年问禅师:“我觉得我在这个世界上是多余的,没有人需要我。”
禅师说:“就像你所学的数学,无论怎样复杂艰深的函数,都有适合的图形对应。你只是还没找到那个图形而已。”
青年沉思一番,提笔写下了狄利克雷函数的解析式。