1.知识体系
2.HIVE相关
四种排序的区别
提交一个hive任务后的后台执行流程(sql转化为mr的过程)
数据倾斜的成因及优化方法
概念模型、逻辑模型、物理模型是什么
3.基础概念相关
数仓概念、作用
数仓分层
数据仓库和数据库的区别
数仓模型设计思路(范式建模和维度建模,星座/星型)
4.数据库相关
哪些数据库是关系型的or非关系型的,各自有什么特点
4.Hadoop相关
mapReduce执行过程