我总结一下在阅读源码时常用到的一些方法。有助于快速理解代码核心内容。
1.深度学习中的forward()
方法
在深度学习中,我们可能会使用各种各样的中间包,但是因为过分封装,导致调用的层数太多,而不知道程序运行到了哪里,但是需要记住的一条就是:
forward()
方法,然后通过一个优化函数来优化其中的参数。在刚开始接触一个开发工具或者其它开源代码时,一定要用其官方文档快速入手,或者找个视频看看,切勿闭门造车。
3.学习数学公式查看一个数学求和公式时,基本上就如下几种情况:
针对下面这个矩阵中的数据:
行\列 | j1 | j2 | j3 | j4 |
---|---|---|---|---|
i1 | a | b | c | d |
i2 | e | f | g | h |
在学习一个模型训练的过程中,需要了解整个数据集的切分过程,哪些数据做了训练集,什么数据做了测试集。都应该很熟悉,只有这样,才能在自己编码的时候好确定跟同行比较。
通常来说,数据集的划分都是固定的,也就是说:各篇论文中使用的数据集大都是相同的,使用的评测方法也都是一样的。
6 看懂代码再写代码看懂代码 再写代码,这两者可能是相辅相成的。也讲不好谁先谁后,二者一般都是同时进行的。