人工智能教父Yann LeCun提出的『能量模型』到底是个啥？

人工智能能量模型| 2020-12-15

图7: 人工智能研究了个寂寞？Reddit热议：AI教父Yann LeCun提出的『能量模型』到底是个啥？

AI的未来是个“ppt”？

”

作者 | 贝爽

“能量自监督学习到底是什么鬼？”不少Reddit网友评论说。

刚刚，深度学习教父Yann LeCu登上了Reddit热搜。一位不知名的开发者发表了一篇题为“Yann LeCun提出基于能量的自监督学习到底是什么”的帖子，引发众多网友讨论。

图8: 人工智能研究了个寂寞？Reddit热议：AI教父Yann LeCun提出的『能量模型』到底是个啥？

讨论的焦点之一是，基于能量的自监督学习模型能做什么？有什么优势或意义？

这位开发者刚刚看完LeCun最新的主题演讲，他说，Yann LeCun似乎是在建议训练一个有条件的潜在变量模型，它可以根据输入和潜在变量预测输出（类似于pix2pix GAN或VAE）；同时，它也可以处理图像、视频或者音频等不同类型。

但有关优化生成模型的方法有很多，比如OpenAI通过iGPT预训练预测缺失像素，采用“对比预测编码法”，通过对比损失来进行丢失信息预测。这些方法在实际应用中均取得不错的成果。

相比之下，基于能量的自监督学习好像并没有特别之处，也没有相关的成功应用案例。

Reddit上，超过95%的网友对这一观点表示了赞同。

另外，还有一位网友透露，最近3-4年很多专家都对它很着迷，他们认为基于能量的模型是深度学习的『未来』。

那么，代表ML未来的『能量模型』到底是什么？

AI的未来：『能量』SSL模型

Yann LeCun，是2018年图灵奖得主之一，与Geoffrey Hinton 和 Yoshua Bengio二人被合称为深度学习三巨头。同时，他自己也被称为“CNN之父”。

图5: 人工智能研究了个寂寞？Reddit热议：AI教父Yann LeCun提出的『能量模型』到底是个啥？

LeCun在在业界和学术界颇具影响力。目前，他在Facebook公司担任人工智能研究院院长一职，同时也在纽约大学、Courant 数学科学研究所、神经科学中心和电气与计算机工程系等担任要职。

2019年11月，LeCun代表Facebook参加了《Using Physical Insights for Machine Learning》主题研讨会，并发表了名为《基于能量的自监督学习（Energy-Based Self-Supervised Learning）》的主题演讲。

在这篇演讲中，LeCun详细介绍了基于能量的学习方法在解决现有挑战方面的可能性。

近几年，深度学习在计算机感知、自然语言理解和控制方面取得了重大进展。但这些成功在很大程度上都依赖于监督学习或无模型强化学习。其中，监督学习是从标记的训练数据来推断一个功能的机器学习任务。强化学习分为有模型和无模型两种策略，前者区别与后者的特点是，有模型的方法主要学习前向状态转移模型p(st+1|st,at)，而无模型方法则不是。

从现有研究来看，无论是监督学习，还是无模型强化学习都存在明显的局限性。前者需要人类提供大量数据标签，后者需要机器学习动作回报最大化。

也就是说，监督学习只适用于特定任务，即使是学习简单的任务；强化学习也需要与环境进行大量的交互。例如，它在游戏和仿真工作中十分有效，但在现实世界很难奏效。

但如果存在一款模型能够像人类或动物那样，只需要少量观察和互动就能学习大量与任务无关的知识，那么这些现实困境就可以被很好的解决。而这款模型必须依靠自监督学习（Self-Supervised Learning，简称SSL）方法。

LeCun认为，SSL是深度学习的『未来』，基于能量的SSL可以在回避概率的同时处理不确定性。以下是基于能量的SSL模型：

图1: 人工智能研究了个寂寞？Reddit热议：AI教父Yann LeCun提出的『能量模型』到底是个啥？