在2018年的Sigcomm会议上,Google的工程师以自动驾驶汽车为例提出了一个观点,与其寄希望于超级AI算法的开发,不如先解决网络内生的安全性问题。以自动驾驶汽车为例,只有汽车安全性提高了,自动驾驶才更容易被接受。
那么Google的工程师认为网络有哪些内生的安全性问题,论文给出了几个例子:
1)流量工程和拥塞控制同时对网络进行优化的时候如何避免冲突
2)网络状态的快速变化与路由协议收敛时间之间的矛盾。
3)大范围的网络同步。
更棘手的可能是所谓的“拜占庭”故障,文章借用了分布式系统中的拜占庭将军问题,描述网络路由信息随机的丢包、发送给错误对象、设备报告了错误信息等问题,这些问题都需要网络具有强大的内生安全性,避免发生类似情况时网络瘫痪。在网络发生类似情况时,AI系统往往需要一定的时间才能产生反馈。
2021年发生的数起由于BGP配置错误导致的网络瘫痪事件应该验证了Google工程师的观点。
要达到期望的网络内生安全性,需要什么:
1)网络强大的性能监视能力,实时监控网络业务的流量和流向。
2)对网络性能监视产生的大数据的分析和处理能力。
分布式系统中的每个网元本质上按照局部最优的方案进行独立决策,单网元很难预测其自身决策带来的网络整体效果。