本课程适合零基础想学习Flink的大数据开发者、需要构建实时数据处理系统的数据工程师、准备从事流计算相关工作的求职者、以及希望从Spark Streaming转向Flink的技术人员。无论你是完全不了解流处理的新手,还是已经听说过Flink但不知道从何入手,本课程都将带你从零开始,系统掌握Flink的核心概念、架构体系和实战技能。
学员将系统掌握实时流处理核心概念、Flink基本概念与特性、Flink应用场景、Flink架构体系、作业执行过程、抽象级别与常见类库、环境搭建(Local模式/Standalone模式)、WordCount案例实战等核心技能,具备独立搭建Flink开发环境和开发流处理程序的能力。
在数据实时化的时代,实时流处理已成为企业数据架构的核心能力。而Flink作为业界领先的分布式流处理框架,凭借“有状态流计算”的先进设计,已成为实时计算领域的标杆:
真正的流处理:原生支持流计算,而非微批处理
低延迟高吞吐:毫秒级延迟,百万级吞吐
状态管理强大:内置状态后端,支持精确一次语义
大厂标配:阿里、腾讯、字节、美团等全面使用Flink
实时数仓基石:Flink + Kafka + ClickHouse成为实时数仓标准栈
然而,很多学习者在入门Flink时遇到以下问题:
实时处理和批处理的区别搞不清楚
Flink架构复杂,各种角色容易混淆
环境搭建总是踩坑,Standalone模式配置不知如何下手
缺乏实战经验,看完文档还是不会写第一个程序
本课程定位 “入门到实战” ,从实时流处理场景讲起,系统讲解Flink的核心概念、架构体系、环境搭建,并通过WordCount案例带你跑通第一个Flink程序。
零基础友好:从实时流处理是什么、为什么需要Flink讲起
概念精讲:Flink核心概念、特性、应用场景全覆盖
架构图解:架构体系、作业执行过程配有直观图示
环境搭建手把手:Local模式 + Standalone模式完整演示
案例实战:WordCount案例从0到1完整实现
课程分为三大模块,共11节视频课:
模块一:Flink入门与核心概念(5节)
Flink基础阶段的课程安排(学习路线与目标)
实时流处理场景和Flink(为什么需要实时流处理/Flink的定位)
Flink的基本概念(数据流/数据源/数据汇/算子)
Flink流处理的特性(事件驱动/有状态/精确一次/低延迟)
Flink常见的应用场景(实时监控/实时报表/实时推荐/实时数仓)
模块二:Flink架构体系(3节)
Flink的架构体系(JobManager/TaskManager/ResourceManager/Dispatcher)
Flink的作业执行过程(编程模型到物理执行的完整流程)
Flink抽象级别和常见类库(SQL/Table API/DataStream/Stateful Functions)
模块三:Flink环境搭建与实战(3节)
Flink的环境搭建之Local模式(本地运行Flink作业)
Flink的Standalone模式参数配置和Web页面监控(集群配置/Web UI监控)
Flink的简单WordCount案例(从代码编写到集群提交运行)
