0

0

用微衍生物从头开始了解反向传播

碧海醫心

碧海醫心

发布时间:2025-02-16 11:18:23

|

779人浏览过

|

来源于php中文网

原创

深入浅出神经网络:理解微积分的精髓

大家好,我是Hexmos的创始人Shrijith Venkatrama。我目前正在开发LiveaPi,一个简化API文档生成的工具

神经网络看起来复杂,但其核心思想却出奇地简单:导数。Andrej Karpathy的Micrograd项目完美诠释了这一点——仅用不到150行Python代码,就清晰地展现了神经网络的基本原理。本文将循序渐进地讲解Micrograd,从最基础的概念开始,逐步深入。您将学习:

  • 导数的真正含义及其计算方法
  • 符号微分与数值微分之间的区别
  • 微小输入变化如何影响输出(正、负和零斜率)
  • 为什么神经网络不需要显式导数公式

我们将通过图解、简短代码示例和实用见解,帮助您理解梯度下降如何驱动神经网络学习,避免不必要的复杂性。让我们开始吧!

Karpathy的Micrograd项目仅包含两个文件:

用微衍生物从头开始了解反向传播

  • Engine.py:不到100行代码,定义了值类,是神经网络运行的核心。
  • nn.py:定义了神经元、层和多层感知器(MLP),约60行代码。

核心思想:不到150行简洁的Python代码,就足以捕捉神经网络的核心思想。其他库中代码的复杂性主要在于效率的提升。

理解导数:基础概念

首先,让我们通过几个例子来理解导数的概念:

  1. 定义一个函数f,接收标量输入,返回标量输出。
  2. 生成一系列x值(输入)和对应的y值(输出)。
  3. 绘制函数图像。
  4. 计算导数的两种方法:

我们的目标是在特定点(例如x=3)找到函数的导数。在学校,我们通常学习的是符号微分法。

用微衍生物从头开始了解反向传播

例如,对于表达式3*x*2 - 4x + 5,我们可以求出导数表达式为6*x - 4。然而,在神经网络中,我们处理的表达式可能非常复杂,不可能手动求导。

因此,我们采用数值微分法。但在学习数值微分之前,先理解导数的概念非常重要。

谱乐AI
谱乐AI

谱乐AI,集成 Suno、Udio 等顶尖AI音乐模型的一站式AI音乐生成平台。

下载

可微函数的含义

关键公式如下:

用微衍生物从头开始了解反向传播

公式中,h是一个很小的值,并且趋近于0。我们关注的是:当输入发生微小变化时,函数输出的趋势是什么?更具体地说,在x点,如果我们增加一个微小的量h,输出会增加还是减少?变化的大小是多少?

公式的结果代表斜率。如果输入的微小增加导致正斜率,则输出值增加;如果导致负斜率,则输出值减少。

可微函数图像

在某些点上,输入的微小增加可能不会改变输出,此时斜率为零。

数值实验

我们可以通过数值实验来验证上述直觉,使用一系列有效的x值和一个微小的h值。

  • 正斜率示例
  • 负斜率示例
  • 零斜率示例

参考:神经网络和反向传播的简明介绍:构建Micrograd

用微衍生物从头开始了解反向传播

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

751

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

636

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

618

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

706

2023.08.11

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

36

2026.01.14

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 3.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号