我们已经知道 Reflector 中通过 ListAndWatch 获取到数据后传入到了本地的存储中,也就是 DeltaFIFO 中。从 DeltaFIFO 的名字可以看出它是一个 FIFO,也就是一个先进先出的队列,而 Delta 表示的是变化的资源对象存储,包含操作资源对象的类型和数据,Reflector 就是这个队列的生产者。
在了解 DeltaFIFO 之前我们需要先具体了解下什么是 Delta,我们先来看看 client-go 中是如何定义的,Delta 的数据结构定义位于staging/src/k8s.io/client-go/tools/cache/delta_fifo.go
文件中。
// staging/src/k8s.io/client-go/tools/cache/delta_fifo.go // DeltaType is the type of a change (addition, deletion, etc) // DeltaType 是变化的类型(添加、删除等) type DeltaType string // Change type definition // 变化的类型定义 const ( Added DeltaType = "Added" // 增加 Updated DeltaType = "Updated" // 更新 Deleted DeltaType = "Deleted" // 删除 // Replaced is emitted when we encountered watch errors and had to do a // relist. We don't know if the replaced object has changed. // 当遇到 watch 错误,不得不进行重新list时,就会触发 Replaced。 // 我们不知道被替换的对象是否发生了变化。 // // NOTE: Previous versions of DeltaFIFO would use Sync for Replace events // as well. Hence, Replaced is only emitted when the option // EmitDeltaTypeReplaced is true. // 注意:以前版本的 DeltaFIFO 也会对 Replace 事件使用 Sync。 // 所以只有当选项 EmitDeltaTypeReplaced 为真时才会触发 Replaced。 Replaced DeltaType = "Replaced" // Sync is for synthetic events during a periodic resync. // Sync 是针对周期性重新同步期间的合成事件 Sync DeltaType = "Sync" ) // Delta is a member of Deltas (a list of Delta objects) which // in its turn is the type stored by a DeltaFIFO. It tells you what // change happened, and the object's state after* that change. // Delta 是 DeltaFIFO 存储的类型。 // 它告诉你发生了什么变化,以及变化后对象的状态。 // // [*] Unless the change is a deletion, and then you'll get the final // state of the object before it was deleted. // [*] 除非变化是删除操作,否则你将得到对象被删除前的最终状态。 type Delta struct { Type DeltaType Object interface{} }
Delta 其实就是 Kubernetes 系统中带有变化类型的资源对象,如下图所示:
其实也非常好理解,比如我们现在添加了一个 Pod,那么这个 Delta 就是带有 Added 这个类型的 Pod,如果是删除了一个 Deployment,那么这个 Delta 就是带有 Deleted 类型的 Deployment,为什么要带上类型呢?因为我们需要根据不同的类型去执行不同的操作,增加、更新、删除的动作显然是不一样的。
上面我们解释了什么是 Delta,接下来需要说下 FIFO,我们说 FIFO 很好理解,就是一个先进先出的队列,Reflector 是其生产者,其数据结构定义位于 staging/src/k8s.io/client-go/tools/cache/fifo.go
文件中:
// staging/src/k8s.io/client-go/tools/cache/fifo.go type FIFO struct { lock sync.RWMutex cond sync.Cond // We depend on the property that every key in `items` is also in `queue` // 我们依赖于`items`中的每个键也在`queue`中的属性。 items map[string]interface{} queue []string // populated is true if the first batch of items inserted by Replace() has been populated // or Delete/Add/Update was called first. // 如果第一批 items 被 Replace() 插入或者先调用了 Deleta/Add/Update // 则 populated 为 true。 populated bool // initialPopulationCount is the number of items inserted by the first call of Replace() // 第一次调用 Replace() 时插入的 items 数 initialPopulationCount int // keyFunc is used to make the key used for queued item insertion and retrieval, and // should be deterministic. // keyFunc 用于生成排队的 item 插入和检索的 key。 keyFunc KeyFunc // Indication the queue is closed. // Used to indicate a queue is closed so a control loop can exit when a queue is empty. // Currently, not used to gate any of CRUD operations. // 标识队列已关闭,以便在队列清空时控制循环可以退出。 closed bool } var ( _ = Queue(&FIFO{}) // FIFO is a Queue FIFO 是一个Queue )
上面的 FIFO 数据结构中定义了 items 和 queue 两个属性来保存队列中的数据,其中 queue 中存的是资源对象的 key 列表,而 items 是一个 map 类型,其 key 就是 queue 中保存的 key,value 值是真正的资源对象数据。
既然是先进进去的队列,那么就要具有队列的基本功能,结构体下面其实就有一个类型断言,表示当前的 FIFO 实现了 Queue 这个接口,所以 FIFO 要实现的功能都是在 Queue 中定义的,Queue 接口和 FIFO 位于同一文件中:
// staging/src/k8s.io/client-go/tools/cache/fifo.go // Queue extends Store with a collection of Store keys to "process". // Every Add, Update, or Delete may put the object's key in that collection. // A Queue has a way to derive the corresponding key given an accumulator. // A Queue can be accessed concurrently from multiple goroutines. // A Queue can be "closed", after which Pop operations return an error. // Queue 扩展了 Store,有一个Store键的集合来 "处理"。 // 每一次添加、更新或删除都可以将对象的key放入到该集合中。 // Queue 具有使用给定的 accumulator 来推导出相应的 key 的方法 // Queue 可以从多个 goroutine 中并发访问 // Queue 可以被关闭,之后 Pop 操作会返回一个错误 type Queue interface { Store // Pop blocks until there is at least one key to process or the // Queue is closed. In the latter case Pop returns with an error. // In the former case Pop atomically picks one key to process, // removes that (key, accumulator) association from the Store, and // processes the accumulator. Pop returns the accumulator that // was processed and the result of processing. The PopProcessFunc // may return an ErrRequeue{inner} and in this case Pop will (a) // return that (key, accumulator) association to the Queue as part // of the atomic processing and (b) return the inner error from // Pop. // Pop 一直阻塞,直到至少有一个key要处理或队列被关闭,队列被关闭会返回一个错误。 // 在前面的情况下 Pop 原子性地选择一个 key 进行处理,从 Store 中删除关联(key、accumulator)的数据, // 并处理 accumulator。Pop 会返回被处理的 accumulator 和处理的结果。 // PopProcessFunc 函数可以返回一个 ErrRequeue{inner},在这种情况下,Pop 将 //(a)把那个(key,accumulator)关联作为原子处理的一部分返回到 Queue 中 // (b) 从 Pop 返回内部错误。 Pop(PopProcessFunc) (interface{}, error) // AddIfNotPresent puts the given accumulator into the Queue (in // association with the accumulator's key) if and only if that key // is not already associated with a non-empty accumulator. // 仅当该 key 尚未与一个非空的 accumulator 相关联的时候, // AddIfNotPresent 将给定的 accumulator 放入 Queue(与 accumulator 的 key 相关联的) AddIfNotPresent(interface{}) error // HasSynced returns true if the first batch of keys have all been // popped. The first batch of keys are those of the first Replace // operation if that happened before any Add, AddIfNotPresent, // Update, or Delete; otherwise the first batch is empty. // HasSynced 如果第一批 keys 都已经 Popped,则 HasSynced 返回 true。 // 如果在添加、更新、删除之前发生了第一次 Replace 操作,则第一批 keys 为 true // 否则为空。 HasSynced() bool // Close the queue // 关闭队列 Close() }
从上面的定义中可以看出 Queue 这个接口扩展了 Store 这个接口,这个就是前面我们说的本地存储,队列实际上也是一种存储,然后在 Store 的基础上增加 Pop、AddIfNotPresent、HasSynced、Close 4个函数就变成了 Queue 队列了,所以我们优先来看下 Store 这个接口的定义,该数据结构定义位于文件k8s.io/client-go/tools/cache/store.go
中:
// staging/src/k8s.io/client-go/tools/cache/store.go // Store is a generic object storage and processing interface. A // Store holds a map from string keys to accumulators, and has // operations to add, update, and delete a given object to/from the // accumulator currently associated with a given key. A Store also // knows how to extract the key from a given object, so many operations // are given only the object. // Store 是一个通用的对象存储和处理的接口。 // Store 包含一个从字符串 keys 到 accumulators 的映射,并具有 to/from 当前 // 给定 key 关联的 accumulators 添加、更新和删除给定对象的操作。 // 一个 Store 还知道如何从给定的对象中获取 key,所以很多操作只提供对象。 // // In the simplest Store implementations each accumulator is simply // the last given object, or empty after Delete, and thus the Store's // behavior is simple storage. // 在最简单的 Store 实现中,每个 accumulator 只是最后指定的对象,或者删除后为空, // 所以 Store 只是简单的存储。 // // Reflector knows how to watch a server and update a Store. This // package provides a variety of implementations of Store. // Reflector 反射器知道如何 watch 一个服务并更新一个 Store 存储,这个包提供了 Store 的各种实现。 type Store interface { // Add adds the given object to the accumulator associated with the given object's key // Add 将指定对象添加到与指定对象的 key 相关的 accumulator(累加器)中。 Add(obj interface{}) error // Update updates the given object in the accumulator associated with the given object's key // Update 与指定对象的 key 相关的 accumulator 中更新指定的对象 Update(obj interface{}) error // Delete deletes the given object from the accumulator associated with the given object's key // Delete 根据指定的对象 key 删除指定的对象 Delete(obj interface{}) error // List returns a list of all the currently non-empty accumulators List() []interface{} // ListKeys returns a list of all the keys currently associated with non-empty accumulators // List 返回当前所有非空的 accumulators 的列表 ListKeys() []string // Get returns the accumulator associated with the given object's key // Get 根据指定的对象获取关联的 accumulator Get(obj interface{}) (item interface{}, exists bool, err error) // GetByKey returns the accumulator associated with the given key // GetByKey 根据指定的对象 key 获取关联的 accumulator GetByKey(key string) (item interface{}, exists bool, err error) // Replace will delete the contents of the store, using instead the // given list. Store takes ownership of the list, you should not reference // it after calling this function. // Replace 会删除原来Store中的内容,并将新增的list的内容存入Store中,即完全替换数据 // Store 拥有 list 列表的所有权,在调用此函数后,不应该引用它了。 Replace([]interface{}, string) error // Resync is meaningless in the terms appearing here but has // meaning in some implementations that have non-trivial // additional behavior (e.g., DeltaFIFO). // Resync 在 Store 中没有意义,但是在 DeltaFIFO 中有意义。 Resync() error } // KeyFunc knows how to make a key from an object. Implementations should be deterministic. // KeyFunc 就是从一个对象中生成一个唯一的 Key 的函数,上面的 FIFO 中就有用到 type KeyFunc func(obj interface{}) (string, error) // MetaNamespaceKeyFunc is a convenient default KeyFunc which knows how to make // keys for API objects which implement meta.Interface. // The key uses the format <namespace>/<name> unless <namespace> is empty, then // it's just <name>. // // TODO: replace key-as-string with a key-as-struct so that this // packing/unpacking won't be necessary. // MetaNamespaceKeyFunc 是默认的 KeyFunc,生成的 key 格式为:<namespace>/<name> // 如果是全局的,则namespace为空,那么生成的 key 就是 <name> // 当然要从 key 拆分出 namespace 和 name 也非常简单 func MetaNamespaceKeyFunc(obj interface{}) (string, error) { if key, ok := obj.(ExplicitKey); ok { return string(key), nil } meta, err := meta.Accessor(obj) if err != nil { return "", fmt.Errorf("object has no meta: %v", err) } if len(meta.GetNamespace()) > 0 { return meta.GetNamespace() + "/" + meta.GetName(), nil } return meta.GetName(), nil }
Store 就是一个通用的对象存储和处理的接口,可以用来写入对象和获取对象。其中 cache 数据结构就实现了上面的 Store 接口。
我们说 Queue 扩展了 Store 接口,所以 Queue 本身也是一个存储,只是在存储的基础上增加了 Pop 这样的函数来实现弹出对象,是不是就变成了一个队列了。
FIFO 就是一个具体的 Queue 实现,按照顺序弹出对象是不是就是一个先进先出的队列了?如下图所示:
所以我们接下来看看 FIFO 是如何实现存储和 Pop 的功能的。首先是实现 Store 存储中最基本的方法,第一个就是添加对象:
// staging/src/k8s.io/client-go/tools/cache/fifo.go // Add inserts an item, and puts it in the queue. The item is only enqueued // if it doesn't already exist in the set. // Add 插入一个对象,将其放入队列中,只有当元素不在集合的时候才会插入队列 func (f *FIFO) Add(obj interface{}) error { // 获取对象的key id, err := f.keyFunc(obj) if err != nil { return KeyError{obj, err} } f.lock.Lock() defer f.lock.Unlock() f.populated = true // 元素不在队列的时候菜插入队列 if _, exists := f.items[id]; !exists { f.queue = append(f.queue, id) } // items 是一个map,所以直接赋值给这个key,这样对更新元素也同样适用 f.items[id] = obj f.cond.Broadcast() return nil }
更新对象,实现非常简单,因为上面的 Add 方法就包含了 Update 的实现,因为 items 属性是一个 Map,对象有更新直接将对应 key 的 value 值替换成新的对象即可:
// staging/src/k8s.io/client-go/tools/cache/fifo.go // Update is the same as Add in this implementation. // Update 和 Add 相同的实现 func (f *FIFO) Update(obj interface{}) error { return f.Add(obj) }
接着就是删除 Delete 方法的实现。
下面的删除实现只删除了 items 中的元素,会导致 queue 和 items 中的 key 会不一致,但是这是一个队列,下面的 Pop() 函数会根据 queue 里面的元素一个一个的弹出 key,没有对象就不处理了,相当于下面的 Pop() 函数中实现了 queue 的 key 的删除:
// staging/src/k8s.io/client-go/tools/cache/fifo.go // Delete removes an item. It doesn't add it to the queue, because // this implementation assumes the consumer only cares about the objects, // not the order in which they were created/added. // Delete 从队列中移除一个对象 // 不会添加到 queue中去,这个实现假设消费者只关心对象 // 不关心它们被创建的顺序 func (f *FIFO) Delete(obj interface{}) error { // 获取对象的key id, err := f.keyFunc(obj) if err != nil { return KeyError{obj, err} } f.lock.Lock() defer f.lock.Unlock() f.populated = true // 删除 items 中 key 为 id 的元素,就是删除队列中的对象 delete(f.items, id) return err }
然后是获取队列中所有对象的 List 方法实现以及获取队列中所有元素key的ListKeys方法实现:
// staging/src/k8s.io/client-go/tools/cache/fifo.go // List returns a list of all the items. // List 获取队列中所有的对象 func (f *FIFO) List() []interface{} { f.lock.RLock() defer f.lock.RUnlock() list := make([]interface{}, 0, len(f.items)) // 获取所有的items的values值(items是一个Map) for _, item := range f.items { list = append(list, item) } return list } // ListKeys returns a list of all the keys of the objects currently // in the FIFO. // ListKeys 返回现在 FIFO 队列中所有对象 keys 列表 func (f *FIFO) ListKeys() []string { f.lock.RLock() defer f.lock.RUnlock() list := make([]string, 0, len(f.items)) // 获取所有items的key(items是一个Map) for key := range f.items { list = append(list, key) } return list }
至于根据对象或者对象的 key 获取队列中的元素,就更简单了:
// staging/src/k8s.io/client-go/tools/cache/fifo.go // Get returns the requested item, or sets exists=false. // Get 获取指定对象在队列中的元素 func (f *FIFO) Get(obj interface{}) (item interface{}, exists bool, err error) { key, err := f.keyFunc(obj) if err != nil { return nil, false, KeyError{obj, err} } // 调用 GetByKey 实现 return f.GetByKey(key) } // GetByKey returns the requested item, or sets exists=false. // GetByKey 根据 key 获取队列中的元素 func (f *FIFO) GetByKey(key string) (item interface{}, exists bool, err error) { f.lock.RLock() defer f.lock.RUnlock() // 因为 items 是一个 Map,所以直接根据 key 获取即可 item, exists = f.items[key] return item, exists, nil }
然后是一个 Replace 替换函数的实现:
// staging/src/k8s.io/client-go/tools/cache/fifo.go // Replace will delete the contents of 'f', using instead the given map. // 'f' takes ownership of the map, you should not reference the map again // after calling this function. f's queue is reset, too; upon return, it // will contain the items in the map, in no particular order. // Replace 将删除队列中的内容,该用给定的map // 'f' 拥有 map 的所有权,调用该函数过后,不应该再引用 map。 // 'f' 的队列也会被重置,返回时,队列将包含 map 中的元素,没有特定的顺序。 func (f *FIFO) Replace(list []interface{}, resourceVersion string) error { // 从 list 中提取出 key 然后和里面的元素重新进行映射 items := make(map[string]interface{}, len(list)) for _, item := range list { key, err := f.keyFunc(item) if err != nil { return KeyError{item, err} } items[key] = item } f.lock.Lock() defer f.lock.Unlock() if !f.populated { f.populated = true f.initialPopulationCount = len(items) } // 重新设置 items 和 queue 的值 f.items = items f.queue = f.queue[:0] for id := range items { f.queue = append(f.queue, id) } if len(f.queue) > 0 { f.cond.Broadcast() } return nil }
还有 Store 存储中的最后一个方法 Resync 的实现:
// staging/src/k8s.io/client-go/tools/cache/fifo.go // Resync will ensure that every object in the Store has its key in the queue. // This should be a no-op, because that property is maintained by all operations. // Resync 会保证 Store 中的每个对象在 queue 中都有它的 key。 // 这应该是禁止操作的,因为该属性由所有操作维护 func (f *FIFO) Resync() error { f.lock.Lock() defer f.lock.Unlock() // 将所有 queue 中的元素放到一个 set 中 inQueue := sets.NewString() for _, id := range f.queue { inQueue.Insert(id) } // 然后将所有 items 中的 key 加回到 queue 中去 for id := range f.items { if !inQueue.Has(id) { f.queue = append(f.queue, id) } } if len(f.queue) > 0 { f.cond.Broadcast() } return nil }
上面的所有方法就实现了一个普通的 Store,然后要想变成一个 Queue,还需要实现额外的 Pop 方法:
// staging/src/k8s.io/client-go/tools/cache/fifo.go // Pop waits until an item is ready and processes it. If multiple items are // ready, they are returned in the order in which they were added/updated. // The item is removed from the queue (and the store) before it is processed, // so if you don't successfully process it, it should be added back with // AddIfNotPresent(). process function is called under lock, so it is safe // update data structures in it that need to be in sync with the queue. // Pop 会等到一个元素准备好后再进行处理,如果有多个元素准备好了,则按照它们被添加或更新的顺序返回。 // 在处理之前,元素会从队列(和存储)中移除,所以如果没有成功处理,应该用 AddIfNotPresent() 函数把它添加回来。 // 处理函数是在有锁的情况下调用的,所以更新其中需要和队列同步的数据结构是安全的。 func (f *FIFO) Pop(process PopProcessFunc) (interface{}, error) { f.lock.Lock() defer f.lock.Unlock() for { // 当队列为空时,Pop() 的调用会被阻塞住,直到新的元素插入队列后 for len(f.queue) == 0 { // When the queue is empty, invocation of Pop() is blocked until new item is enqueued. // When Close() is called, the f.closed is set and the condition is broadcasted. // Which causes this loop to continue and return from the Pop(). if f.closed { return nil, ErrFIFOClosed } // 等待 condition 被广播 f.cond.Wait() } // 取出queue队列中的第一个元素(key) id := f.queue[0] // 删除第一个元素 f.queue = f.queue[1:] if f.initialPopulationCount > 0 { f.initialPopulationCount-- } // 获取被弹出的元素 item, ok := f.items[id] if !ok { // Item may have been deleted subsequently. // item 可能已经被删除了 continue } // 删除弹出的元素 delete(f.items, id) // 处理弹出的元素 err := process(item) if e, ok := err.(ErrRequeue); ok { // 如果处理没成功,需要调用 addIfNotPresent 加回队列 f.addIfNotPresent(id, item) err = e.Err } return item, err } }
另外的一个就是上面提到的 AddIfNotPresent、HasSynced、Close 几个函数的实现:
// staging/src/k8s.io/client-go/tools/cache/fifo.go // AddIfNotPresent inserts an item, and puts it in the queue. If the item is already // present in the set, it is neither enqueued nor added to the set. // AddIfNotPresent 插入一个元素,将其放入队列中。 // 如果元素已经在集合中了,则会被忽略。 // // This is useful in a single producer/consumer scenario so that the consumer can // safely retry items without contending with the producer and potentially enqueueing // stale items. // 这在单个的 生产者/消费者 的场景下非常有用,这样消费者可以安全地重试 // 而不需要与生产者争夺,也不需要排队等待过时的元素。 func (f *FIFO) AddIfNotPresent(obj interface{}) error { // 获取对象的 key id, err := f.keyFunc(obj) if err != nil { return KeyError{obj, err} } f.lock.Lock() defer f.lock.Unlock() // 调用 addIfNotPresent 真正的实现 f.addIfNotPresent(id, obj) return nil } // addIfNotPresent assumes the fifo lock is already held and adds the provided // item to the queue under id if it does not already exist. // addIfNotPresent 会假设已经持有 fifo 锁了,如果不存在,则将其添加到队列中去。 func (f *FIFO) addIfNotPresent(id string, obj interface{}) { f.populated = true // 存在则忽略 if _, exists := f.items[id]; exists { return } // 添加到 queue 和 items 中去 f.queue = append(f.queue, id) f.items[id] = obj // 广播 condition f.cond.Broadcast() } // Close the queue. // 关闭队列 func (f *FIFO) Close() { f.lock.Lock() defer f.lock.Unlock() // 标记为关闭 f.closed = true f.cond.Broadcast() } // HasSynced returns true if an Add/Update/Delete/AddIfNotPresent are called first, // or the first batch of items inserted by Replace() has been popped. // 如果先调用了 Add/Update/Delete/AddIfNotPresent, // 或者先调用了Update,但被 Replace() 插入的第一批元素已经被弹出,则 HasSynced 返回true。 func (f *FIFO) HasSynced() bool { f.lock.Lock() defer f.lock.Unlock() return f.populated && f.initialPopulationCount == 0 }
其实这里对 FIFO 这个数据结构的理解,没有特别的地方,只是在队列里面有 items 和 queue 两个属性来维护队列而已。
DeltaFIFO 和 FIFO 一样也是一个队列,但是也有不同的地方,里面的元素是一个 Delta,Delta 上面我们已经提到表示的是带有变化类型的资源对象。
DeltaFIFO 的数据结构定义位于 staging/src/k8s.io/client-go/tools/cache/delta_fifo.go
文件中:
// staging/src/k8s.io/client-go/tools/cache/delta_fifo.go type DeltaFIFO struct { // lock/cond protects access to 'items' and 'queue'. // lock/cond 保护访问的 items 和 queue lock sync.RWMutex cond sync.Cond // `items` maps a key to a Deltas. // Each such Deltas has at least one Delta. // 用来存储 Delta 数据 -> 对象key: Delta数组 items map[string]Deltas // `queue` maintains FIFO order of keys for consumption in Pop(). // There are no duplicates in `queue`. // A key is in `queue` if and only if it is in `items`. // 用于存储资源对象的key queue []string // populated is true if the first batch of items inserted by Replace() has been populated // or Delete/Add/Update/AddIfNotPresent was called first. // 通过 Replace() 接口将第一批对象放入队列,或者第一次调用增、删、改接口时标记为true populated bool // initialPopulationCount is the number of items inserted by the first call of Replace() // 通过 Replace() 接口(全量)将第一批对象放入队列的对象数量 initialPopulationCount int // keyFunc is used to make the key used for queued item // insertion and retrieval, and should be deterministic. // 对象键的计算函数 keyFunc KeyFunc // knownObjects list keys that are "known" --- affecting Delete(), // Replace(), and Resync() // knownObjects 列出 "known" 的键 -- 影响到 Delete(),Replace() 和 Resync() // knownObjects 其实就是 Indexer,里面存有已知全部的对象 knownObjects KeyListerGetter // Used to indicate a queue is closed so a control loop can exit when a queue is empty. // Currently, not used to gate any of CRUD operations. // 标记 queue 被关闭了 closed bool // emitDeltaTypeReplaced is whether to emit the Replaced or Sync // DeltaType when Replace() is called (to preserve backwards compat). // emitDeltaTypeReplaced 当 Replace() 被调用的时候,是否要 emit Replaced 或者 Sync // DeltaType(保留向后兼容) emitDeltaTypeReplaced bool } // A KeyListerGetter is anything that knows how to list its keys and look up by key. // KeyListerGetter 任何知道如何列出键和按键获取对象的东西 type KeyListerGetter interface { KeyLister KeyGetter } // A KeyLister is anything that knows how to list its keys. // 获取所有的键 type KeyLister interface { ListKeys() []string } // A KeyGetter is anything that knows how to get the value stored under a given key. // 根据键获取对象 type KeyGetter interface { // GetByKey returns the value associated with the key, or sets exists=false. GetByKey(key string) (value interface{}, exists bool, err error) }
DeltaFIFO 与 FIFO 一样都是一个 Queue,所以它们都实现了 Queue,所以我们这里来看下 DeltaFIFO 是如何实现 Queue 功能的,当然和 FIFO 一样都是实现 Queue 接口里面的所有方法。
虽然实现流程和 FIFO 是一样的,但是具体的实现是不一样的,比如 DeltaFIFO 的对象键计算函数就不同:
// staging/src/k8s.io/client-go/tools/cache/delta_fifo.go // KeyOf exposes f's keyFunc, but also detects the key of a Deltas object or // DeletedFinalStateUnknown objects. // DeltaFIFO 的对象键计算函数 func (f *DeltaFIFO) KeyOf(obj interface{}) (string, error) { // 用 Deltas 做一次转换,判断是否为Delta切片 if d, ok := obj.(Deltas); ok { if len(d) == 0 { return "", KeyError{obj, ErrZeroLengthDeltasObject} } // 使用最新版本的对象进行计算 obj = d.Newest().Object } if d, ok := obj.(DeletedFinalStateUnknown); ok { return d.Key, nil } // 具体计算还是要看初始化 DeltaFIFO 传入的 KeyFunc函数 return f.keyFunc(obj) } // Newest is a convenience function that returns the newest delta, or // nil if there are no deltas. // Newest 返回最新的 Delta,如果没有则返回 nil。 func (d Deltas) Newest() *Delta { if n := len(d); n > 0 { return &d[n-1] } return nil }
DeltaFIFO 的计算对象键的函数为什么要先做一次 Deltas 的类型转换呢?那是因为 Pop() 出去的对象很可能还要再添加进来(比如处理失败需要再放进来),此时添加的对象就是已经封装好的 Deltas 对象了。
然后同样按照上面的方式来分析 DeltaFIFO 的实现,首先查看 Store 存储部分的实现,也就是增、删、改、查功能。
同样的 Add、Update 和 Delete 的实现方法基本上是一致的:
// staging/src/k8s.io/client-go/tools/cache/delta_fifo.go // Add inserts an item, and puts it in the queue. The item is only enqueued // if it doesn't already exist in the set. // Add 插入一个元素放入到队列中 func (f *DeltaFIFO) Add(obj interface{}) error { f.lock.Lock() defer f.lock.Unlock() // 队列第一次写入操作都要设置标记 f.populated = true return f.queueActionLocked(Added, obj) } // Update is just like Add, but makes an Updated Delta. // Update 和 Add 一样,只是 Updated 一个 Delta func (f *DeltaFIFO) Update(obj interface{}) error { f.lock.Lock() defer f.lock.Unlock() f.populated = true return f.queueActionLocked(Updated, obj) } // Delete is just like Add, but makes a Deleted Delta. If the given // object does not already exist, it will be ignored. (It may have // already been deleted by a Replace (re-list), for example.) In this // method `f.knownObjects`, if not nil, provides (via GetByKey) // _additional_ objects that are considered to already exist. // 删除和添加一样,但会产生一个删除的 Delta。如果给定的对象还不存在,它将被忽略。 // 例如,它可能已经被替换(重新list)删除了。 // 在这个方法中,`f.knownObjects` 如果不为nil,则提供(通过GetByKey)被认为已经存在的 _additional_ 对象。 func (f *DeltaFIFO) Delete(obj interface{}) error { id, err := f.KeyOf(obj) if err != nil { return KeyError{obj, err} } f.lock.Lock() defer f.lock.Unlock() f.populated = true // 相当于没有 Indexer 的时候,就通过自己的存储对象检查下 if f.knownObjects == nil { if _, exists := f.items[id]; !exists { // Presumably, this was deleted when a relist happened. // Don't provide a second report of the same deletion. // 自己的存储对象里面都没有,那就不用处理了 return nil } } else { // We only want to skip the "deletion" action if the object doesn't // exist in knownObjects and it doesn't have corresponding item in items. // Note that even if there is a "deletion" action in items, we can ignore it, // because it will be deduped automatically in "queueActionLocked" // 相当于 Indexer 里面和自己的存储里面都没有这个对象,那么也就相当于不存在了,就不处理了。 _, exists, err := f.knownObjects.GetByKey(id) _, itemsExist := f.items[id] if err == nil && !exists && !itemsExist { // Presumably, this was deleted when a relist happened. // Don't provide a second report of the same deletion. return nil } } // exist in items and/or KnownObjects // 同样调用 queueActionLocked 将数据放入队列 return f.queueActionLocked(Deleted, obj) }
可以看出 Add 、Update、Delete 方法最终都是调用的 queueActionLocked 函数来实现:
// staging/src/k8s.io/client-go/tools/cache/delta_fifo.go // queueActionLocked appends to the delta list for the object. // Caller must lock first. // queueActionLocked 追加到对象的 delta 列表中。 // 调用者必须先 lock。 func (f *DeltaFIFO) queueActionLocked(actionType DeltaType, obj interface{}) error { id, err := f.KeyOf(obj) if err != nil { return KeyError{obj, err} } // 将 actionType 和资源对象 obj 构造成 Delta,添加到 items 中 oldDeltas := f.items[id] newDeltas := append(oldDeltas, Delta{actionType, obj}) // 去重 newDeltas = dedupDeltas(newDeltas) if len(newDeltas) > 0 { // 新对象的key不在队列中则插入 queue 队列 if _, exists := f.items[id]; !exists { f.queue = append(f.queue, id) } // 重新更新 items f.items[id] = newDeltas // 通知所有的消费者解除阻塞 f.cond.Broadcast() } else { // This never happens, because dedupDeltas never returns an empty list // when given a non-empty list (as it is here). // If somehow it happens anyway, deal with it but complain. // 这种情况不会发生,因为给定一个非空列表时,dedupDeltas 永远不会返回一个空列表。 // 但如果真的返回了一个空列表,那就需要处理,并返回错误 if oldDeltas == nil { klog.Errorf("Impossible dedupDeltas for id=%q: oldDeltas=%#+v, obj=%#+v; ignoring", id, oldDeltas, obj) return nil } klog.Errorf("Impossible dedupDeltas for id=%q: oldDeltas=%#+v, obj=%#+v; breaking invariant by storing empty Deltas", id, oldDeltas, obj) f.items[id] = newDeltas return fmt.Errorf("Impossible dedupDeltas for id=%q: oldDeltas=%#+v, obj=%#+v; broke DeltaFIFO invariant by storing empty Deltas", id, oldDeltas, obj) } return nil } // If a & b represent the same event, returns the delta that ought to be kept. // Otherwise, returns nil. // TODO: is there anything other than deletions that need deduping? // 判断两个Delta是否重复 func isDup(a, b *Delta) *Delta { // 这个函数应该应该可以判断多种类型的重复,目前只有删除这一种能够合并 if out := isDeletionDup(a, b); out != nil { return out } // TODO: Detect other duplicate situations? Are there any? return nil } // keep the one with the most information if both are deletions. // 判断是否为删除类型的重复 func isDeletionDup(a, b *Delta) *Delta { // 二者类型都是删除那肯定有一个是重复的,则返回一个即可 if b.Type != Deleted || a.Type != Deleted { return nil } // Do more sophisticated checks, or is this sufficient? // 更复杂的检查还是这样就够了? if _, ok := b.Object.(DeletedFinalStateUnknown); ok { return a } return b }
因为系统对于删除的对象有 DeletedFinalStateUnknown 这个状态,所以会存在两次删除的情况,但是两次添加同一个对象由于 APIServer 可以保证对象的唯一性,所以这里没有考虑合并两次添加操作的情况。
接着看看其他几个主要方法的实现:
// staging/src/k8s.io/client-go/tools/cache/delta_fifo.go // List returns a list of all the items; it returns the object // from the most recent Delta. // You should treat the items returned inside the deltas as immutable. // List返回一个所有项目的列表,它返回最近的Delta中的对象。 // 你应该把deltas里面返回的项目视为不可改变的。 func (f *DeltaFIFO) List() []interface{} { f.lock.RLock() defer f.lock.RUnlock() return f.listLocked() } // 真正的 list 实现 func (f *DeltaFIFO) listLocked() []interface{} { list := make([]interface{}, 0, len(f.items)) for _, item := range f.items { list = append(list, item.Newest().Object) } return list } // ListKeys returns a list of all the keys of the objects currently // in the FIFO. // 返回现在 FIFO 中所有的对象键。 func (f *DeltaFIFO) ListKeys() []string { f.lock.RLock() defer f.lock.RUnlock() list := make([]string, 0, len(f.queue)) for _, key := range f.queue { list = append(list, key) } return list } // Get returns the complete list of deltas for the requested item, // or sets exists=false. // You should treat the items returned inside the deltas as immutable. // 根据对象获取FIFO中对应的元素 func (f *DeltaFIFO) Get(obj interface{}) (item interface{}, exists bool, err error) { key, err := f.KeyOf(obj) if err != nil { return nil, false, KeyError{obj, err} } return f.GetByKey(key) } // GetByKey returns the complete list of deltas for the requested item, // setting exists=false if that list is empty. // You should treat the items returned inside the deltas as immutable. // 通过对象键获取FIFO中的元素(获取到的是 Delta 数组) func (f *DeltaFIFO) GetByKey(key string) (item interface{}, exists bool, err error) { f.lock.RLock() defer f.lock.RUnlock() d, exists := f.items[key] if exists { // Copy item's slice so operations on this slice // won't interfere with the object we return. // 复制元素的slice,这样对这个切片的操作就不会影响返回的对象了。 d = copyDeltas(d) } return d, exists, nil } // copyDeltas returns a shallow copy of d; that is, it copies the slice but not // the objects in the slice. This allows Get/List to return an object that we // know won't be clobbered by a subsequent modifications. // copyDeltas 返回 d 的浅拷贝,也就是说它拷贝的是切片,而不是切片中的对象。 // Get/List 可以返回一个不会被后续修改影响的对象。 func copyDeltas(d Deltas) Deltas { d2 := make(Deltas, len(d)) copy(d2, d) return d2 } // IsClosed checks if the queue is closed // 判断队列是否关闭 func (f *DeltaFIFO) IsClosed() bool { f.lock.Lock() defer f.lock.Unlock() return f.closed }
接下来我们来看看 Replace 函数,这个也是 Store 里面的定义的接口:
// staging/src/k8s.io/client-go/tools/cache/delta_fifo.go // Replace atomically does two things: (1) it adds the given objects // using the Sync or Replace DeltaType and then (2) it does some deletions. // In particular: for every pre-existing key K that is not the key of // an object in `list` there is the effect of // `Delete(DeletedFinalStateUnknown{K, O})` where O is current object // of K. If `f.knownObjects == nil` then the pre-existing keys are // those in `f.items` and the current object of K is the `.Newest()` // of the Deltas associated with K. Otherwise the pre-existing keys // are those listed by `f.knownObjects` and the current object of K is // what `f.knownObjects.GetByKey(K)` returns. func (f *DeltaFIFO) Replace(list []interface{}, _ string) error { f.lock.Lock() defer f.lock.Unlock() keys := make(sets.String, len(list)) // keep backwards compat for old clients action := Sync if f.emitDeltaTypeReplaced { action = Replaced } // Add Sync/Replaced action for each new item. for _, item := range list { key, err := f.KeyOf(item) if err != nil { return KeyError{item, err} } // 记录处理过对象的键,使用set集合存储 keys.Insert(key) // 重新同步一次对象 if err := f.queueActionLocked(action, item); err != nil { return fmt.Errorf("couldn't enqueue object: %v", err) } } // 如果没有 Indexer 存储的话,自己存储的就是所有的老对象 // 目的是看看哪些老对象不在全量集合中,那么就是删除的老对象了 if f.knownObjects == nil { // Do deletion detection against our own list. // 针对自己的列表进行删除检测 queuedDeletions := 0 for k, oldItem := range f.items { // 如果元素在输入的对象中存在就忽略 if keys.Has(k) { continue } // Delete pre-existing items not in the new list. // This could happen if watch deletion event was missed while // disconnected from apiserver. // 到这里证明当前的 oldItem 元素不在输入的列表中,证明对象已经被删除了 var deletedObj interface{} if n := oldItem.Newest(); n != nil { deletedObj = n.Object } queuedDeletions++ // 因为可能队列中已经存在 Deleted 类型的元素了,避免重复,所以采用 DeletedFinalStateUnknown 来包装下对象 if err := f.queueActionLocked(Deleted, DeletedFinalStateUnknown{k, deletedObj}); err != nil { return err } } // 如果 populated 没有设置,说明是第一次并且还没有任何修改操作执行过 if !f.populated { // 这个时候需要标记下 f.populated = true // While there shouldn't be any queued deletions in the initial // population of the queue, it's better to be on the safe side. // 记录第一次设置的对象数量 f.initialPopulationCount = keys.Len() + queuedDeletions } return nil } // Detect deletions not already in the queue. // 检测已经删除但是没有在队列中的元素。 // 从 Indexer 中获取所有的对象键 knownKeys := f.knownObjects.ListKeys() queuedDeletions := 0 for _, k := range knownKeys { // 对象存在就忽略 if keys.Has(k) { continue } // 到这里同样证明当前的对象键对应的对象被删除了 // 获取被删除的对象键对应的对象 deletedObj, exists, err := f.knownObjects.GetByKey(k) if err != nil { deletedObj = nil klog.Errorf("Unexpected error %v during lookup of key %v, placing DeleteFinalStateUnknown marker without object", err, k) } else if !exists { deletedObj = nil klog.Infof("Key %v does not exist in known objects store, placing DeleteFinalStateUnknown marker without object", k) } // 累加删除的对象数量 queuedDeletions++ // 把对象删除的 Delta 放入队列,和上面一样避免重复,使用 DeletedFinalStateUnknown 包装下对象 if err := f.queueActionLocked(Deleted, DeletedFinalStateUnknown{k, deletedObj}); err != nil { return err } } if !f.populated { f.populated = true f.initialPopulationCount = keys.Len() + queuedDeletions } return nil }
Replace() 主要用于实现对象的全量更新,由于 DeltaFIFO 对外输出的就是所有目标的增量变化,所以每次全量更新都要判断对象是否已经删除,因为在全量更新前可能没有收到目标删除的请求。这一点与 cache 不同,cache 的Replace() 相当于重建,因为 cache 就是对象全量的一种内存映射,所以Replace() 就等于重建。
接下来就是实现 DeltaFIFO 特性的 Pop 函数的实现了:
// staging/src/k8s.io/client-go/tools/cache/delta_fifo.go func (f *DeltaFIFO) Pop(process PopProcessFunc) (interface{}, error) { f.lock.Lock() defer f.lock.Unlock() for { // 队列中是否有数据 for len(f.queue) == 0 { // When the queue is empty, invocation of Pop() is blocked until new item is enqueued. // When Close() is called, the f.closed is set and the condition is broadcasted. // Which causes this loop to continue and return from the Pop(). // 如果队列关闭了,直接返回错误 if f.closed { return nil, ErrFIFOClosed } // 没有数据就一直等待 f.cond.Wait() } // 取出第一个对象键 id := f.queue[0] // 更新queue,相当于把第一个元素弹出去 f.queue = f.queue[1:] depth := len(f.queue) // 对象计数减一,当减到0就说明外部已经全部同步完毕了 if f.initialPopulationCount > 0 { f.initialPopulationCount-- } // 取出真正的对象,queue里面是对象的键 item, ok := f.items[id] if !ok { // This should never happen klog.Errorf("Inconceivable! %q was in f.queue but not f.items; ignoring.", id) // Item可能后来被删除了 continue } // 删除对象 delete(f.items, id) // Only log traces if the queue depth is greater than 10 and it takes more than // 100 milliseconds to process one item from the queue. // Queue depth never goes high because processing an item is locking the queue, // and new items can't be added until processing finish. // https://github.com/kubernetes/kubernetes/issues/103789 if depth > 10 { trace := utiltrace.New("DeltaFIFO Pop Process", utiltrace.Field{Key: "ID", Value: id}, utiltrace.Field{Key: "Depth", Value: depth}, utiltrace.Field{Key: "Reason", Value: "slow event handlers blocking the queue"}) defer trace.LogIfLong(100 * time.Millisecond) } // 调用处理对象的函数 err := process(item) if e, ok := err.(ErrRequeue); ok { // 如果处理出错,那就重新加入队列 f.addIfNotPresent(id, item) err = e.Err } // Don't need to copyDeltas here, because we're transferring // ownership to the caller. // 这里不需要 copyDeltas,因为我们要把所有权转移给调用者。 return item, err } }
然后再简单看下其他几个函数的实现:
// staging/src/k8s.io/client-go/tools/cache/delta_fifo.go // 插入不存在的对象到队列中 func (f *DeltaFIFO) AddIfNotPresent(obj interface{}) error { // 放入的必须是 Delta 数组,就是通过 Pop 弹出的对象 deltas, ok := obj.(Deltas) if !ok { return fmt.Errorf("object must be of type deltas, but got: %#v", obj) } id, err := f.KeyOf(deltas) if err != nil { return KeyError{obj, err} } f.lock.Lock() defer f.lock.Unlock() // 调用真正的插入实现 f.addIfNotPresent(id, deltas) return nil } // addIfNotPresent inserts deltas under id if it does not exist, and assumes the caller // already holds the fifo lock. // 插入对象真正实现 func (f *DeltaFIFO) addIfNotPresent(id string, deltas Deltas) { f.populated = true // 如果对象已经存在,则忽略 if _, exists := f.items[id]; exists { return } // 不在队列中,则插入队列 f.queue = append(f.queue, id) f.items[id] = deltas // 通知消费者解除阻塞 f.cond.Broadcast() } // 对象同步接口真正的实现 func (f *DeltaFIFO) syncKeyLocked(key string) error { // 获取 Indexer 中的对象 obj, exists, err := f.knownObjects.GetByKey(key) if err != nil { klog.Errorf("Unexpected error %v during lookup of key %v, unable to queue object for sync", err, key) return nil } else if !exists { klog.Infof("Key %v does not exist in known objects store, unable to queue object for sync", key) return nil } // If we are doing Resync() and there is already an event queued for that object, // we ignore the Resync for it. This is to avoid the race, in which the resync // comes with the previous value of object (since queueing an event for the object // doesn't trigger changing the underlying store <knownObjects>. // 计算对象的键值,对象的键值不是穿过了么? // 其实传入的是存在 Indexer 里面的对象键,可能与这里的计算方式不同 id, err := f.KeyOf(obj) if err != nil { return KeyError{obj, err} } // 对象已经存在,说明后续回通知对象的新变化,所以再加更新也没意义 if len(f.items[id]) > 0 { return nil } // 添加对象同步的这个Delta if err := f.queueActionLocked(Sync, obj); err != nil { return fmt.Errorf("couldn't queue object: %v", err) } return nil } // HasSynced returns true if an Add/Update/Delete/AddIfNotPresent are called first, // or the first batch of items inserted by Replace() has been popped. // HasSynced 如果 Add/Update/Delete/AddIfNotPresent 第一次被调用则会返回 true。 // 或者通过 Replace 插入的元素都已经 Pop 完成了,则也会返回 true。 func (f *DeltaFIFO) HasSynced() bool { f.lock.Lock() defer f.lock.Unlock() // 同步就是全量内容已经进入 Indexer,Indexer 已经是系统中对象的全量快照了 // 相当于就是全量对象从队列中全部弹出进入 Indexer,证明已经同步完成了 return f.populated && f.initialPopulationCount == 0 } // Close the queue. // 关闭队列 func (f *DeltaFIFO) Close() { f.lock.Lock() defer f.lock.Unlock() f.closed = true f.cond.Broadcast() }
这里是否已同步是根据 populated 和 initialPopulationCount 这两个变量来判断的,是否同步指的是第一次从 APIServer 中获取全量的对象是否全部 Pop 完成,全局同步到了缓存中,也就是同步到 Indexer 中去了,因为 Pop 一次 initialPopulationCount 就会减1,当为0的时候就表示 Pop 完成了。
Reflector 通过 ListAndWatch 首先获取全量的资源对象数据,然后调用 DeltaFIFO 的 Replace() 方法全量插入队列,然后后续通过 Watch 操作根据资源对象的操作类型调用 DeltaFIFO 的 Add、Update、Delete 方法,将数据更新到队列中。我们可以用下图来总结这两个组件之间的关系:
至于 Pop 出来的元素如何处理,就要看 Pop 的回调函数 PopProcessFunc 了。我们可以回到最初的 SharedInformer 中,在 sharedIndexInformer 的 Run 函数中就初始化了 DeltaFIFO,也配置了用于 Pop 回调处理的函数:
// staging/src/k8s.io/client-go/tools/cache/shared_informer.go func (s *sharedIndexInformer) Run(stopCh <-chan struct{}) { defer utilruntime.HandleCrash() if s.HasStarted() { klog.Warningf("The sharedIndexInformer has started, run more than once is not allowed") return } // 初始化 DeltaFIFO,这里就可以看出KnownObjects 就是一个Indexer fifo := NewDeltaFIFOWithOptions(DeltaFIFOOptions{ KnownObjects: s.indexer, EmitDeltaTypeReplaced: true, }) cfg := &Config{ Queue: fifo, ListerWatcher: s.listerWatcher, ObjectType: s.objectType, FullResyncPeriod: s.resyncCheckPeriod, RetryOnError: false, ShouldResync: s.processor.shouldResync, Process: s.HandleDeltas, WatchErrorHandler: s.watchErrorHandler, } ...... } // HandleDeltas Pop回调处理函数 func (s *sharedIndexInformer) HandleDeltas(obj interface{}) error { s.blockDeltas.Lock() defer s.blockDeltas.Unlock() if deltas, ok := obj.(Deltas); ok { // 真正的 Pop 回调处理函数 return processDeltas(s, s.indexer, s.transform, deltas) } return errors.New("object given as Process argument is not Deltas") } // staging/src/k8s.io/client-go/tools/cache/controller.go // Multiplexes updates in the form of a list of Deltas into a Store, and informs // a given handler of events OnUpdate, OnAdd, OnDelete // 整整的Pop 回调处理函数 func processDeltas( // Object which receives event notifications from the given deltas handler ResourceEventHandler, clientState Store, transformer TransformFunc, deltas Deltas, ) error { // from oldest to newest for _, d := range deltas { obj := d.Object if transformer != nil { var err error obj, err = transformer(obj) if err != nil { return err } } switch d.Type { case Sync, Replaced, Added, Updated: if old, exists, err := clientState.Get(obj); err == nil && exists { if err := clientState.Update(obj); err != nil { return err } handler.OnUpdate(old, obj) } else { // 将对象添加到 Indexer 中 if err := clientState.Add(obj); err != nil { return err } handler.OnAdd(obj) } case Deleted: // 删除Indexer 中的对象 if err := clientState.Delete(obj); err != nil { return err } handler.OnDelete(obj) } } return nil }
从上面可以看出 DeltaFIFO 中的元素被弹出来后被同步到了 Indexer 存储中,而在 DeltaFIFO 中的 KnownObjects 也就是这个指定的 Indexer。