本文主要是介绍Orc概览,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
对Hadoop运行负载来说,Orc格式是最小,运行最快的列式存储, 它具有以下特点:
ACID事务支持
包含支持ACID事务和快照隔离.
内建索引
用索引方式可以跳到合适的位置,每列包含最小,最大也包含bloom过滤器.
复杂类型
支持Hive的所有类型,包含复杂类型,struct,lists,maps和unions
快速入门
- 在Hive中运用
- 在Hadoop MapRed中运用
- 在Hadoop MapReduce中运用
- 在Java中使用Orc 核心功能
ORC是Apache项目
这篇关于Orc概览的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!