没有数据的时候直接自我学习,非常妙
深度学习,每层用不同维度,能把不同层面的特征学习出来,更好的表示输入的特征向量
加入噪音,鲁棒性会更好,不仅能学到输入的特征,还能把噪音数据过滤掉
传统的词袋发只是累计的一个词频统计而已,并没有把上下文的语义信息考虑进来
相似度匹配的前提是,这个进行相似度计算的向量一定是足够好的能表示输入图像、文本、语音特征的向量,那要训练出这样的向量,数据不能少,模型足够好
图像的回复
池化就是补零回复而已,反卷积其实本质上还是一个卷积运算,补零后进行卷积运算而已
预训练模型只是,无监督自编码的一个应用而已
引入L2正则化,让向量分布在0的周围,取周围的向量,恢复后,能看到机器确实能学到有规律的不一样的特征