概述
Apache Flink 是一个面向有限流和无限流有状态计算的分布式计算框架,它能够支持流处理和批处理两种应用类型。Flink 不仅能够提供同时支持 高吞吐 、 低延迟 和 Exactly-Once 语义的实时计算能力,同时 Flink 还提供了基于流式计算引擎处理批量数据的计算能力,真正意义上实现了 流批统一 。

使用场景
Flink 当前在业内应用较为广泛,常见的业务场景可总结为以下几类:
- 实时 ETL & 索引构建:主要借助实时计算来实现数据的实时抽取、实时聚合与清洗,例如实时监控平台或实时大屏场景;
- 实时的统计和分析:比如实时数仓场景;
- 实时机器学习(ML):传统 T+1 离线推荐引擎转化率效果渐差,推荐引擎正朝着实时化发展,通过实时样本拼接及实时增量模型来提升转化率;
- 实时事件处理/决策(CEP):主要用于实时监控、风控、精细化运营、个性化营销等场景,例如在金融领域的在线信贷实时金融风控场景、安全领域基于态势感知的大数据实时安全风控场景。