connector模块中的WarehousePollContext是比较重要的
public class PipelineConfigDTO {
@NotNull
private String name; // 名称
@NotNull
private JobSchedule schedule; // 调度信息,主要是关于任务调度的
@NotNull
private Long appId; // 关联的appid,外部服务在Castled 中称之为app
@NotNull
private Long warehouseId; // 配置的warehouse 定义
@NotNull
private String sourceQuery; // 数据查询sql
@NotNull
private QueryMode queryMode; // 处理模式,全量以及增量
private AppSyncConfig appSyncConfig; // 关于app 的一些配置,从定义上来说属于重复定义,因为appid 可以代表
private CastledDataMapping mapping; // datawarehouse 与app 的数据schema 映射处理(基于了cfl处理)同时注意Castled 是需要主键的,这个在好多reverse ETL 都有说明
}
public class WarehousePollContext {
private WarehouseConfig warehouseConfig;
private List<String> primaryKeys;
private String query;
private QueryMode queryMode;
//uuid and not the incrementing id;
private String pipelineUUID;
private Long pipelineId;
private Long pipelineRunId;
private String dataEncryptionKey;
private RecordSchema warehouseSchema;
}
pipeline 以及context 是将app 以及poller 关联的对象,是比较重要的,后续web app 会用到这些
https://github.com/castledio/castled
https://oss-docs.castled.io/