1,模型集成ensemble有效性背后的Bayesian数学原理深度剖析
2,模型扰动造成的方差数学原理剖析
3,方差与normalization
4,基于投票思想的模型集成方法及其在多选题和完形填空中的应用
5,基于bagging思想的模型集成方法
6,基于boosting思想的集成方法
7,基于stacking思想的模型集成方法
8,Blending机制
9,阅读理解中的模型ensemble:BERT + Linguistic Knowledge + Ensemble Algorithm
10,用小模型去学习大模型的预测结果及泛化能力
11,Teacher model - distilled model架构解析
12,soft labels、hard label
13,soft predictions、hard prediction
14,信息对齐:样本、中间结果、网络结构
15,DistillBERT用于Knowledge Distillation
16,server framework + deep learning framework API
17,server framework + deep learning serving
18,modeling完整代码解析
19,data utils源码解析
20,model utils源码解析
21,classifier utils源码解析
22,classifier源码解析
23,squad_utils源码解析
24,run_squad源码解析
25,estimator源码解析
26,train方法源码解析
27,modeling_bert
28,modeling_roberta
29,ensemble源码解析
30,evaluate源码解析