六月的盛夏时节正是 eKuiper 项目捐献给 LF Edge 基金会一周年之时。六月初,项目圆满完成了在基金会的第一次年度 review,并确立了下一年度升级到 Stage 2 的目标。在此我们衷心感谢各位社区贡献者、合作伙伴和用户,期待新的一年能有更多伙伴加入到社区的建设中。
我们的开发工作也取得了不错的进展。月初,小版本 1.5.1 发布,主要解决了一些用户问题。在 1.6.0 版本开发方面,我们完成了离线缓存和重发机制的升级,更适应边缘部署中常见的边云网络连接易丢失的弱网场景。与此同时,我们补齐了一些 SQL 语法支持,包括 IN/NOT IN 表达式的支持、ORDER BY 对表达式和别名的支持等,方便用户编写更复杂的过滤和排序逻辑。最后,可视化拖拽能力的开发目前已完成后台 API 的部分验证。
离线缓存和重发
大数据时代,云边协同是主流的计算模式。边缘计算的一部分结果需要发送到云端进行进一步的整合。然而边云之间的网络连接常常是不稳定的,网络连接故障时有发生。作为边缘流式计算引擎,eKuiper 经常有规则将计算结果汇入外部系统,尤其是远程的外部系统中。这种情况下,我们需要考虑弱网环境的处理:在网络断开等故障期间,必须对数据进行缓存,并在重新连接后重新发送。
此前,eKuiper 在一定程度上支持 sink 缓存。它提供了一个全局配置来切换缓存开启;系统/规则级配置用于内存缓存的序列化时间间隔。然而,缓存只是在内存中和复制到 DB(内存的镜像)中,并且没有定义明确的重发策略。六月,我们对缓存机制进行了优化,缓存将同时保存在内存和磁盘中,这样缓存的容量就变得更大了;它还将持续检测故障恢复状态,并在不重新启动规则的情况下实现自动重新发送。
流程
缓存只发生在 sink 中,因为那是 eKuiper 之外唯一可以发送数据的地方。每个 sink 都可以配置自己的缓存机制。每个 sink 的缓存流程是相同的。如果启用了缓存,所有 sink 的事件都会经过两个阶段:首先是将所有内容保存到缓存中;然后在收到 ack 后删除缓存。
- 错误检测:发送失败后,sink 应该通过返回特定的错误类型来识别可恢复的失败(网络等),这将返回一个失败的 ack,这样缓存就可以被保留下来。对于成功的发送或不可恢复的错误,将发送一个成功的 ack 来删除缓存。
- 缓存机制:缓存将首先被保存在内存中。如果超过了内存的阈值,后面的缓存将被保存到磁盘中。一旦磁盘缓存超过磁盘存储阈值,缓存将开始 rotate。内存中最早的缓存将被丢弃,并加载磁盘中最早的缓存来代替。
- 重发策略:如果有一个 ack 正在发送中,则等待一个成功的 ack 以继续发送下个缓存数据。否则,当有新的数据到来时,发送缓存中的第一个数据以检测网络状况。如果 ack 成功,按顺序链式发送所有的缓存(mem + disk)。链式发送可定义一个发送间隔,防止形成消息风暴。