上篇序言中我们讲述了源码解读系列的由来,在 Nebula Graph Overview 篇中我们将带你了解下 Nebula Graph 的架构以及代码仓分布、代码结构和模块规划。
Nebula Graph 是一个开源的分布式图数据库。Nebula采用存储计算分离的设计,解耦存储与计算。同时在数据库内核之外,我们也提供了很多周边工具,比如数据导入,监控,部署,可视化,图计算等等。
Nebula 设计请参见《图数据库综述与 Nebula 在图数据库设计的实践》。
整体架构设计如下图所示:
查询引擎采用无状态设计,可轻松实现横向扩展,分为语法分析、语义分析、优化器、执行引擎等几个主要部分。
详细设计参见《图数据库的查询引擎设计》,《初识 Nebula Graph 2.0 Query Engine》。
查询引擎架构设计如下图所示:
Storage 包含两个部分, 一是 meta 相关的存储, 我们称之为 Meta Service ,另一个是 data 相关的存储, 我们称之为 Storage Service。
Storage Service 共有三层:最底层是 Store Engine;之上便是我们的 Consensus 层,实现了 Multi Group Raft;最上层,便是我们的 Storage interfaces,这一层定义了一系列和图相关的 API。
详细设计参见《图数据库的存储设计》 。
存储引擎架构设计如下图所示:
欢迎来到 vesoft 代码仓库(vesoft 为图数据库 Nebula Graph 开发商)。
目前 Nebula 产品架构中,包含了图数据库内核,客户端,工具,测试框架,编译,可视化,监控等。
本文的主要目的是简单介绍 Nebula Graph 主要 Repo 的代码结构,并说明各个模块的基本功能。后续会有更多的详细设计说明。希望能够帮助到社区读者更好地理解 Nebula Graph,并能够为 Nebula 社区做出自己的贡献,比如提交 Feature,修复 Bug,提交文档等。
以下列出 vesoft-inc 仓库中大部分的代码仓库:
nebula:Nebula 1.0 的内核代码
nebula graph:Nebula 2.0 查询计算引擎
nebula storage:Nebula 2.0 存储引擎
nebula common:Nebula 2.0 内核工具包
Nebula Clients
nebula-java:Java 客户端
nebula-cpp:CPP 客户端
nebula-go:Go 客户端
nebula-python:Python 客户端
Nebula Tools
nebula-importer:基于 Go 客户端实现的高性能数据导入工具
nebula-spark-utils:收录工具 Spark Connector、Exchange、Algorithm
nebula-br:备份恢复工具
nebula-ansible、nebula-operator:部署工具
Nebula Test
nebula-bench:压力与性能测试工程
nebula-chaos:混沌测试工程
Compiling
nebula-third-party:Nebula Graph 图数据库内核依赖的第三方包
nebula-gears:Nebula Graph 图数据库内核工具链
nebula-graph-studio:Nebula Graph 可视化工具
├── cmake ├── conf ├── LICENSES ├── package ├── resources ├── scripts ├── src │ ├── context │ ├── daemons │ ├── executor │ ├── optimizer │ ├── parser │ ├── planner │ ├── scheduler │ ├── service │ ├── session │ ├── stats │ ├── util │ ├── validator │ └── visitor └── tests ├── admin ├── bench ├── common ├── data ├── job ├── maintain ├── mutate ├── query └── tck
├── cmake ├── conf ├── docker ├── docs ├── LICENSES ├── package ├── scripts └── src ├── codec ├── daemons ├── kvstore ├── meta ├── mock ├── storage ├── tools ├── utils └── version
├── cmake │ └── nebula ├── LICENSES ├── src │ └── common │ ├── algorithm │ ├── base │ ├── charset │ ├── clients │ ├── concurrent │ ├── conf │ ├── context │ ├── cpp │ ├── datatypes │ ├── encryption │ ├── expression │ ├── fs │ ├── function │ ├── graph │ ├── hdfs │ ├── http │ ├── interface │ ├── meta │ ├── network │ ├── plugin │ ├── process │ ├── session │ ├── stats │ ├── test │ ├── thread │ ├── thrift │ ├── time │ ├── version │ └── webservice └── third-party
Nebula Common 仓库代码是 Nebula 内核代码的工具包,提供一些常用工具的高效实现。一些常用工具包相信各位工程师一定也是了然于心。这里只对其中和图数据库密切相关的目录进行说明。
以上为本篇文章的介绍内容。