稀疏模型最新进展！马毅+LeCun强强联手：「白盒」非监督式学习

WBOY

发布时间：2023-04-12 08:34:02

1121人浏览过

来源于51CTO.COM

转载

最近马毅教授和图灵奖得主Yann LeCun联手在ICLR 2023上发表了一篇论文，描述了一种极简和可解释的非监督式学习方法，不需要求助于数据增强、超参数调整或其他工程设计，就可以实现接近 SOTA SSL 方法的性能。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

论文链接：https://arxiv.org/abs/2209.15261

该方法利用了稀疏流形变换，将稀疏编码、流形学习和慢特征分析（slow feature analysis）相结合。

采用单层确定性稀疏流形变换，在 MNIST 上可以达到99.3% 的 KNN top-1精度，在 CIFAR-10上可以达到81.1% 的 KNN top-1精度，在 CIFAR-100上可以达到53.2% 的 KNN top-1精度。

通过简单的灰度增强，模型在 CIFAR-10和 CIFAR-100上的精度分别达到83.2% 和57% ，这些结果显著地缩小了简单的「白盒」方法和 SOTA 方法之间的差距。

此外，文中还提供了可视化解释如何形成一个无监督的表征变换。该方法与潜在嵌入自监督方法密切相关，可以看作是最简单的 VICReg 方法。

尽管在我们简单的建设性模型和 SOTA 方法之间仍然存在很小的性能差距，但有证据表明，这是一个有希望的方向，可以实现一个原则性的、白盒式的非监督式学习。

文章第一作者Yubei Chen是纽约大学数据科学中心（CDS）和Meta基础人工智能研究(FAIR)的博士后助理，导师为Yann LeCun教授，博士毕业于加州大学伯克利分校的Redwood Center理论神经科学和伯克利人工智能研究所（BAIR），本科毕业于清华大学。

主要研究方向研究为计算神经科学学习和深度无监督(自监督)学习的交叉，研究结果增强了对大脑和机器无监督表征学习的计算原理的理解，并重塑对自然信号统计的认识。

马毅教授于1995年获得清华大学自动化与应用数学双学士学位，并于1997年获加州大学伯克利分校EECS硕士学位，2000年获数学硕士学位与EECS博士学位。目前是加州大学伯克利分校电子工程与计算机科学系教授，同时也是IEEE Fellow，ACM Fellow，SIAM Fellow。

Yann LeCun最著名的工作是在光学字符识别和计算机视觉上使用卷积神经网络（CNN），也被称为卷积网络之父；2019年他同Bengio以及Hinton共同获得计算机学界最高奖项图灵奖。

从最简单的无监督学习开始

在过去的几年里，无监督表征学习取得了巨大的进展，并且有望在数据驱动的机器学习中提供强大的可扩展性。

不过什么是学习到的表征，以及它究竟是如何以无监督的方式形成的，这些问题仍然不清楚；此外，是否存在一套支撑所有这些无监督表征的共同原则仍不清楚。

许多研究者已经意识到提高模型理解力的重要性，并采取了一些开创性的措施，试图简化SOTA方法，建立与经典方法之间的联系，统一不同的方法，使表征可视化，并从理论角度分析这些方法，并希望能够开发出一种不同的计算理论：使我们能够基于第一原理从数据中建立简单的、完全可以解释的「白盒」模型，该理论也可以为理解人脑中无监督学习的原则提供指导。

在这项工作中，研究人员又朝着这个目标迈出了一小步，试图建立一个最简单的「白盒」无监督学习模型，并且不需要深度网络、projection heads、数据增强或其他各种工程设计。

Red Panda AI

AI文本生成图像

下载

文中通过利用两个经典的无监督学习原则，即稀疏性（sparsity）和频谱嵌入（spectral embedding），建立了一个两层模型，在几个标准数据集上取得了非显著的基准结果。

实验结果表明，基于稀疏流形变换（sparse manifold transform）的两层模型，与latent-embedding自监督方法具有相同的objective，并且在没有任何数据增强的情况下，在MNIST上取得了99.3%的KNN最高1级准确率，在CIFAR-10上取得了81.1%的KNN最高1级准确率，在CIFAR-100上取得了53.2%的准确率。

通过简单的灰度增强，进一步在CIFAR-10上实现了83.2%的KNN top-1精度，在CIFAR-100上实现了57%的KNN top-1精度。

这些结果为缩小「白盒」模型和SOTA自监督（SSL）模型之间的差距迈出了重要一步，虽然差距仍然很明显，但研究人员认为进一步缩小差距有可能对无监督表征的学习获得更深入的理解，这也是通往该理论实用化的一条有前景的研究路线。

三个基本问题

什么是无监督（自监督）的re-presentation

从本质上讲，原始信号的任何非同一性转换（non-identity transformation）都可以被称为表征（re-presentation），不过学术界更感兴趣的是那些有用的转换。

无监督re-presentation学习的一个宏观目标是找到一个函数，将原始数据转换到一个新的空间，使「相似」的东西被放在更接近的地方；同时，新的空间不应该是一个collapsed且trivial的，也就是说，必须保留数据的几何或随机结构。

如果这一目标得以实现，那么「不相似」的内容自然会在表示空间中被放置得很远。

相似性（similarity）从何而来？

相似性主要来自三个经典的想法：1）时序共现，2）空间共现；和3）原始信号空间中的局部相邻（local neighborhoods）。

当基础结构为几何结构时，这些想法在相当程度上是重叠的；但当结构为随机结构时，它们在概念上也会有所不同，下图展现了流形结构（manifold structure）和随机共现结构（stochastic co-occurrence structure.）之间的区别。

利用局部性，相关工作提出了两种无监督的学习方法：流形学习和共现统计建模，这些想法很多都达到了谱系分解的表述或密切相关的矩阵分解表述。

流形学习的理念是，只有原始信号空间中的局部邻域才是可信的，通过综合考虑所有的局部邻域，就会出现全局几何，即「全局思考，局部适配」（think globally, fit locally）。

相比之下，共现统计建模遵循一种概率理念，因为有些结构不能用连续流形来建模，所以它也是对流形理念的补充。

一个最明显的例子来自于自然语言，其中的原始数据基本不会来自于平滑的几何，比如在单词嵌入中，「西雅图」和「达拉斯」的嵌入可能很相似，尽管它们并没有频繁共现，其根本原因是它们有类似的上下文模式。

概率和流形的观点对于理解「相似性」是相互补充的，当有了相似性的定义后，就可以构造一个转换，使得相似的概念离得更近。

本文如何建立表征转换？基本原则：稀疏性和低秩（low rank）

大体上来说，可以用稀疏性来处理数据空间中的局部性和分解，以建立support；然后用低频函数构建表征变换，将相似的值分配给support上的相似点。

整个过程也可以称为稀疏流形变换（sparse manifold transform）。

如何通过 DeepSeek 优化分布式存储系统架构

DART：AI驱动的项目管理软件，提升团队效率

一键改变发型：Gemini AI 助你轻松打造时尚造型

即梦AI能否生成互动剧本_即梦AI互动剧本创建与分支设置方法【实操】

Xeon E5-2667 V2性能评测：老平台焕发新生，游戏与工作负载表现分析

相关专题

人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容，供大家免费下载体验。

401

2023.08.17

人工智能的基本概念是什么

人工智能的英文缩写为AI，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学；该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

289

2024.01.09

人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

620

2024.09.10

Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用，系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例（如房价预测、图像分类、文本情感分析），帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

2025.10.21

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1666

2024.08.16

SSL检测工具介绍

SSL检测工具有SSL Labs、SSL Check、SSL Server Test、SSLMate、SSL/TLS Analyzer等。详细介绍：1、SSL Labs是一个由Qualys提供的在线SSL检测工具，可以评估服务器证书的部署情况、加密套件、协议支持等方面的安全性，它提供了一个详细的报告，包括证书的颁发者、有效期、安全性配置等；2、SSL Check等等。

327

2023.10.20