位置：首页>> 网络编程>> Python编程>> 在pytorch中对非叶节点的变量计算梯度实例

在pytorch中对非叶节点的变量计算梯度实例

作者：FesianXu　　发布时间：2021-08-26 10:13:53　

标签：pytorch,节点,变量,梯度

在pytorch中一般只对叶节点进行梯度计算，也就是下图中的d,e节点，而对非叶节点，也即是c,b节点则没有显式地去保留其中间计算过程中的梯度（因为一般来说只有叶节点才需要去更新），这样可以节省很大部分的显存，但是在调试过程中，有时候我们需要对中间变量梯度进行监控，以确保网络的有效性，这个时候我们需要打印出非叶节点的梯度，为了实现这个目的，我们可以通过两种手段进行。

注册hook函数

Tensor.register_hook[2] 可以注册一个反向梯度传导时的hook函数，这个hook函数将会在每次计算关于该张量的时候被调用，经常用于调试的时候打印出非叶节点梯度。当然，通过这个手段，你也可以自定义某一层的梯度更新方法。[3] 具体到这里的打印非叶节点的梯度，代码如：

def hook_y(grad):
print(grad)

x = Variable(torch.ones(2, 2), requires_grad=True)
y = x + 2
z = y * y * 3

y.register_hook(hook_y)

out = z.mean()
out.backward()

输出如:

tensor([[4.5000, 4.5000],
[4.5000, 4.5000]])

retain_grad()

Tensor.retain_grad()显式地保存非叶节点的梯度，当然代价就是会增加显存的消耗，而用hook函数的方法则是在反向计算时直接打印，因此不会增加显存消耗，但是使用起来retain_grad()要比hook函数方便一些。代码如：

x = Variable(torch.ones(2, 2), requires_grad=True)
y = x + 2
y.retain_grad()
z = y * y * 3
out = z.mean()
out.backward()
print(y.grad)

输出如：

tensor([[4.5000, 4.5000],
[4.5000, 4.5000]])

来源：https://blog.csdn.net/LoseInVain/article/details/99172594

0

投稿

猜你喜欢

Python遍历文件夹和读写文件的实现方法
需求分析 1、读取指定目录下的所有文件2、读取指定文件，输出文件内容3、创建一个文件并保存到指定目录实现过程Python写代码简
Python时间序列处理之ARIMA模型的使用讲解
ARIMA模型ARIMA模型的全称是自回归移动平均模型，是用来预测时间序列的一种常用的统计模型，一般记作ARIMA(p,d,q)。ARIMA
Django开发中的日志输出的方法
开发环境：Ubuntu16.04+Django 1.11.9+Python2.7一:使用自定义函数输出日志到log文件:import tim
python将ip地址转换成整数的方法
本文实例讲述了python将ip地址转换成整数的方法。分享给大家供大家参考。具体分析如下：有时候我们用数据库存储ip地址时可以将ip地址转换
用js实现小球的自由移动代码
正在学习javascript 的朋友可以把它当作小练习动手做一做。加强自己的动手编码能力。参考代码：<!DOCTYPE HTML PU
设计可以量化吗？
我的工作内容可以说是五花八门，策划、文案、设计（包括平面设计、网站设计、VIS设计）、前端代码、交互、测试、摄影、项目管理等。所有这些工作最
最新idea2021最新激活超详细教程
分享一下 IntelliJ IDEA 2021.1 的激活破解教程，相当于永久激活了，亲测有效，下面是详细文档哦~申明：本教程 Intell
Python实现简单的四则运算计算器
一、算法 1、算法的主要思想就是将一个中缀表达式(Infix expression)转换成便
Docker构建python Flask+ nginx+uwsgi容器
安装Nginx首先拉下centos镜像docker pull centos我们安装最新的nginx1.19版本:下载地址将centos镜像运
DreamweaverMX 2004打造细线表格
如果仅仅是定义表格的边框为1(border="1")和边框颜色值(如borderC
用好Frontpage中的各种回车
Frontpage中的回车键有三种：enter、shift+enter、ctrl+enter。enter键对应于HTML中的<p>
Yii2结合Workerman的websocket示例详解
前言本文主要给大家介绍了关于Yii2结合Workerman的websocket的相关内容，两者都是好东西，我就想着能不能结合起来，这样Yii
python中如何使用正则表达式的非贪婪模式示例
前言本文主要给大家介绍了关于python使用正则表达式的非贪婪模式的相关内容，分享出来供大家参考学习，下面话不多说了，来一起详细的介绍吧。在
用Dreamweaver实现Real与网页结合
当你在IE中点击一个Realplayer连接时，系统会自动启动Realplayer软件，不仅占用系统内存，而且在上网时Realplayer容
一个将半角"转换为中文"的asp函数
一个非常简单的将半角"转换为中文"的asp函数function new_str(str)
ASP生成静态页面的方法
1，WITH TEMPLET意思是，生成的页面架构将采用某个已设定的模板，在此之前我的一篇教程中介绍过，希望各位在看本教程之前对ASP采用模
Python实现圣诞树的多种方法
马上就是圣诞节了，先提前祝大家圣诞快乐！:christmas_tree::christmas_tree::christmas_t
asp 隐藏并修改文件的最后修改时间
源码：代码如下: <％ '隐藏并修改文件的最后修改时间的aspshell '原理:通过FSO可以修改文件的属性，比
Google中秋logo被恶搞
Google中秋的logo出来了，酷似一美男站在月亮上，结果被网友弄出一撒尿版来。中国网民好智慧啊～原logo：撒尿版logo：
php使用pthreads v3多线程实现抓取新浪新闻信息操作示例
本文实例讲述了php使用pthreads v3多线程实现抓取新浪新闻信息。分享给大家供大家参考，具体如下：我们使用pthreads，来写一个

Python 中获取数组的子数组示例详解

python 对任意数据和曲线进行拟合并求出函数表达式的三种解决方案

python 获取计算机的网卡信息

Python实现双人五子棋对局

Python安装及Pycharm安装使用教程图解

Python爬虫：通过关键字爬取百度图片

python函数参数(必须参数、可变参数、关键字参数)

python计算时间差的方法

如何利用python实现列表嵌套字典取值

在python中画正态分布图像的实例

苹果iPad Pro或配3K屏

WPS打印时设置装订线的方法图解教程

如何在Windows 11上使用高对比度启用暗模式？

win8和fedora 19启动顺序设置全程图解

如何取消Win10电脑的自动更新？取消Win10电脑的自动更新方法

wps表格怎么进行计算减法

Win10远程控制鼠标出现错位怎么办？

asp中将有双引号标题入库的方法

如何将默认的maven仓库改为阿里的maven仓库

win10安装ie8提示系统不支持怎么办?win10不支持ie8的解决方法

手机版 网络编程 asp之家 www.aspxhome.com