大数据(Big Data):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现里和流程优化能力的海量、高增长率和多样化的信息资产。通常都是 TB、PB、EB级别的数据。
大数据主要解决海量数据的采集、存储和分析计算问题。
大数据的特点(4V):
● 大量(Volume)
● 高速(Velocity)
● 多样(Variety)
● 低价值密度(Value)
Hadoop 是由Apache基金会所开发的分布式系统基础架构。
主要解决海量数据的存储和海量数据的分析计算。
官网地址:https://hadoop.apache.org/
通常说的Hadoop,一般指广义上的Hadoop,即Hadoop生态圈,包括Hbase、Hive、ZooKeeper等。