1、 安装好hadoop2.7.3伪分布式环境(Linux环境);
2、安装好MySQL5.7(推荐使用) (Windows环境) ,允许mysql远程连接
3、并新建一个名为hive的数据库
1、官网下载hive安装文件,下载地址:mirrors.aliyun.com/apache/hive/
hadoop2.x需要下载hive-2.x.x,下载版本:apache-hive-2.3.6-bin.tar.gz
2、将hive安装文件上传到Linux系统中~/soft目录下,解压:
tar -zxvf apache-hive-2.3.6-bin.tar.gz
创建软连接:ln -s apache-hive-2.3.6-bin hive
配置环境变量:vi ~/.bashrc
使配置生效:
配置hive-site.xml
注意:
1. javax.jdo.option.ConnectionURL属性值的192.168.1.11为Windows的IP地址,请注意修改! 2. javax.jdo.option.ConnectionUserName值的root为数据库的用户名,注意修改! 3. javax.jdo.option.ConnectionPassword的值数据库的密码,注意修改!
将MySQL驱动文件拷贝到hive安装目录的lib下
下载MySQL驱动文件:https://mvnrepository.com/artifact/mysql/mysql-connector-java/5.1.46
将驱动文件上传到Linux,hive/lib目录下
初始化MySQL:schematool -dbType mysql -initSchema
看到"schemaTool completed"为正确完成初始化:
在启动hive之前,先启动hadoop:start-all.sh
启动hive:hive