model.eval()和loss.backward(retain_graph = True)

1:model.eval()会固定网络的nn.BN层和nn.Dropout层，nn.BN层在train的时候针对每一个batch会计算一次均值方差，然后最后归纳整个训练集的均值方差，所以在test的时候就不能再让BN层的均值方差发生变化了。参考文章：(1条消息) Pytorch model.eval()的作用_嘿，兄弟，好久不见的博客-CSDN博客_model.eval()作用2：loss.bac

xx_xjm

2055人浏览 · 2022-04-09 21:45:29

xx_xjm · 2022-04-09 21:45:29 发布

2：loss.backward(retain_graph = True)，首先，forward一次会建立一个计算图，正常backward（）会释放掉forward（）过程所建立的计算图。而在backward中指定retain_graph = True以后，则每次backward不会释放当次forward（）产生的计算图，这样会导致内存中计算图越来越多，使得训练会越来越慢。

另外为了保证每次backward（）之后，梯度不会积累，在backward之前一般会采取optmizer.zero_grad()的方法。

参考自：

为什么向后设置（retain_graph = True）会占用大量GPU内存？-python黑洞网 (pythonheidong.com)(1条消息) Pytorch中backward(retain_graph=True)的 retain_graph参数解释_今晚打老虎的博客-CSDN博客_retain_graph=true 为什么向后设置（retain_graph = True）会占用大量GPU内存？-python黑洞网 (pythonheidong.com)

华为开发者联盟HarmonyOS专区

鸿蒙生态一站式服务平台。

更多推荐

【grafana】使用教程

华为开发者联盟HarmonyOS专区

【PX4-AutoPilot教程-开发环境】使用VMware虚拟机安装Ubuntu系统并搭建PX4开发环境（ROS+mavros+jMAVSim+gazebo+QGC+QT）

学习PX4开发需要先配置好开发环境，对于新手推荐使用VMware虚拟机搭建Ubuntu系统，并下载PX4源码，配置好编译环境和工具链（ROS操作系统+mavros通信包+jMAVSim仿真+gazebo仿真+QGC地面站+QT开发平台）。教程中使用的是Ubuntu18.04系统（官方推荐使用版本），PX4固件版本为v1.13.0，飞控板为pixhawk2.4.8版本。