本文主要是介绍《大数据的一个重要方面:数据可用性》笔记,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
1.大数据可用性的概念、挑战和研究问题
1.1 大数据可用性的基本概念
- 一致性
- 精确性
- 完整性:数据集合中包含足够的数据来回答各种查询和支持各种计算
- 时效性
- 实体同一性:同一实体在各种数据源中的描述统一
1.2 大数据可用性的挑战和研究问题
- 高质量大数据获取与整合的理论和技术
- 完整的大数据可用性理论体系
- 数据错误自动检测与修复的理论和技术
- 弱可用数据上近似计算的理论和技术
弱可用数据:数据中的错误不能彻底修复
- 弱可用数据上的知识发掘与演化的机理
2.数据可用性的研究进展
2.1 高质量大数据获取与整合
大数据的主要来源:
1. 分布在Web上的丰富数据库资源
2. 物理信息系统,如智能电网、智慧城市等
3. 科学实验与观测数据
这篇关于《大数据的一个重要方面:数据可用性》笔记的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!