Beam中的Watermark是用于确保数据的时序完整性和准确性的重要机制。Watermark是一个时间戳,用来表示数据流中的事件的最大允许延迟时间。Beam会根据Watermark来判断哪些数据可以被处理,哪些数据已经延迟太久,需要被丢弃或者进行其他处理。通过Watermark,Beam可以在处理无界数据流时保证数据的正确性和时序性。
辰迅云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
推荐阅读: Beam处理大规模数据有哪些优势和局限性