首页 > 要闻 > > 内容页

大数据Flink进阶（十一）：Flink History Server配置使用

2023-04-10 06:24:33 来源:腾讯云

Flink History Server配置使用

基于Standalone或者Yarn模式提交Flink任务后，当任务执行失败、取消或者完成后，可以在WebUI中查看对应任务的统计信息，这些统计信息在生产环境中对我们来说非常重要，可以知道一个任务异常挂掉前发生了什么，便于定位问题。

当基于Standalone session模式提交相应任务时，集群重启后我们没有办法查看集群之前运行任务的情况，如果是基于pre-job方式提交任务，任务执行完成之后，那么相对应的统计信息也不会保存，基于Yarn运行的Flink任务也是一样道理。这样对于我们查看先前Flink作业统计信息或参数带来了不便。Flink中提供了History Server 来解决这个问题，可以在任务执行完成后保留相应的任务统计信息，便于分析和定位问题。

History Server 允许查询由JobManager归档的已完成作业的状态和统计日志信息。已完成的作业归档由JobManager上传持久化到某个路径下，这个路径可以是本地文件系统、HDFS、H3等，History Server 可以周期扫描该路径将归档的Flink任务日志恢复出来，从而可以查看相应Flink任务日志情况。

(资料图片)

一、Standalone History Server配置与验证

1、配置

在Standalone中配置History Server 服务需要选择一台节点当做History Server ,这台节点可以是JobManager/TaskManager节点，也可以是Standalone集群外的一台节点，这里选择node4节点作为Flink History Server 节点。Standalone配置HistoryServer 服务步骤如下：

1.1、在JM 和 TM 节点上配置 flink-conf.yaml

在Flink Standalone JobManager和TaskManager节点上配置flink-conf.yaml文件，指定Flink完成任务持久化的路径，这里选择HDFS目录作为任务日志持久化保存目录。在node1、node2、node3节点上配置$FLINK_HOME/conf/flink-conf.yaml文件，加入以下配置。

#Flink job运行完成后日志存储目录jobmanager.archive.fs.dir: hdfs://mycluster/flink/completed-jobs/

Flink会根据以上配置连接HDFS 目录存储任务数据，所以需要在node1、node2、node3节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。

#vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效source /etc/profile

1.2、在History Server 节点上配置 flink-conf.yaml

在node4节点上配置$FLINK_HOME/conf/flink-conf.yaml文件，加入如下配置，配置HistoryServer。

#Flink History Server 节点historyserver.web.address: node4#Flink History Server 端口historyserver.web.port: 8082#Flink History Server 恢复任务的目录historyserver.archive.fs.dir: hdfs://mycluster/flink/completed-jobs/#Flink History Server 监控任务日志目录刷新时间间隔（毫秒）historyserver.archive.fs.refresh-interval: 10000

Flink会根据以上配置连接HDFS目录恢复任务数据，这里要求"historyserver.archive.fs.dir"参数配置需要与Flink各个节点上配置的"jobmanager.archive.fs.dir"参数路径保持一致。此外，需要在node4节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。

# vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效[root@node4 ~]# source /etc/profile

1.3、启动 Flink 历史日志服务器

在node4节点上启动Flink History Server

#启动Flink 历史日志服务器[root@node4 ~]# cd /software/flink-1.16.0/bin/[root@node4 bin]# ./historyserver.sh start

2、验证

History Server 启动后，可以通过https://node4:8082 来访问历史日志服务页面。

我们可以通过向Standalone集群中提交任务来验证History Server是否能正常展示运行Flink任务的统计信息，步骤如下：

2.1、启动 Standalone 集群

[root@node1 ~]# cd /software/flink-1.16.0/bin/[root@node1 bin]# ./start-cluster.sh

2.2、提交任务

向Flink集群中提交任务，任务还是选择读取Socket端口数据实时统计WordCount。首先在node5节点上启动socket服务：

[root@node5 ~]# nc -lk 9999

在node4 客户端提交Flink任务（可以在任意节点提交Flink任务），命令如下：

[root@node4 ~]# cd /software/flink-1.16.0/bin/[root@node4 bin]# ./flink run -m node1:8081 -c com.mashibing.flinkjava.code.chapter3.SocketWordCount /root/FlinkJavaCode-1.0-SNAPSHOT-jar-with-dependencies.jar

提交任务后在HDFS中暂时不会生成hdfs://mycluster/flink/completed-jobs"目录，当Flink集群停止、任务取消、任务失败后才可以在该目录下看到job信息。

2.3、取消任务并查看历史日志

在node5节点向Socket 9999端口输入一些数据：

hello,ahello,bhello,chello,d

然后在Flink WebUI中取消当前任务：

取消任务后可以在"hdfs://mycluster/flink/completed-jobs"目录中看到取消任务的信息：

当任务取消后，也可以停止Flink集群，Flink集群重启后先前的任务统计信息不会展示，可以登录Flink历史日志服务器查看先前任务统计信息：

注意：在取消任务或者停止Flink集群后，需要等待一小段时间才能在Flink历史日志服务器中查看到对应的取消任务。

二、Yarn History Server配置与验证

1、配置

Flink基于Yarn运行时，当Flink任务形成的集群停止后，无法看到对应任务的统计信息，也可以通过配置History Server来实现基于Yarn的Flink集群停止后查看任务的统计信息。

这里选择node5节点为History Server，基于Yarn运行Flink任务配置HistoryServer服务步骤如下：

1.1、在node5 节点上配置 flink-conf.yaml

在node5节点上配置$FLINK_HOME/conf/flink-conf.yaml文件，最后配置以下配置项。

#Flink job运行完成后日志存储目录jobmanager.archive.fs.dir: hdfs://mycluster/flink-yarn/completed-jobs/#Flink History 服务器地址historyserver.web.address: node5#HistroyServer WebUI 访问端口historyserver.web.port: 8082#HistoryServer历史日志服务恢复任务信息目录historyserver.archive.fs.dir: hdfs://mycluster/flink-yarn/completed-jobs/#Flink History Server 监控任务日志目录刷新时间间隔（毫秒）historyserver.archive.fs.refresh-interval: 10000

Flink会根据以上配置连接HDFS 目录存储任务数据，所以需要在node5节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。

#vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效source /etc/profile

1.2、启动 Flink 历史日志服务器并访问

在node5节点上启动Flink History Server

#启动Flink 历史日志服务器[root@node5 ~]# cd /software/flink-1.16.0/bin/[root@node5 bin]# ./historyserver.sh start

访问历史日志服务地址：https://node5:8082

2、验证

在node5节点基于Yarn提交Flink任务来验证History Server是否能正常展示执行完成的Flink任务统计信息。步骤如下：

2.1、向Yarn 集群中提交 Flink任务

向Yarn集群中提交Flink任务，任务还是选择读取Socket端口数据实时统计WordCount。在node5节点启动socket服务器：

[root@node5 ~]# nc -lk 9999

在node5节点向Flink集群中提交Flink任务，命令如下：

[root@node5 ~]# cd /software/flink-1.16.0/bin/# 提交Flink任务[root@node5 bin]#./flink run-application -t yarn-application -c com.lanson.flinkjava.code.chapter3.SocketWordCount /root/FlinkJavaCode-1.0-SNAPSHOT-jar-with-dependencies.jar

提交任务后在HDFS中暂时不会生成hdfs://mycluster/flink/completed-jobs"目录，当Flink集群停止、任务取消、任务失败后才可以在该目录下看到job信息。

2.2、取消任务并查看历史日志

在node5节点向Socket 9999端口输入一些数据：

hello,ahello,bhello,chello,d

然后登录Yarn(https://node1:8081) WebUI，找到提交的任务取消对应Flink任务：

取消任务后可以在"hdfs://mycluster/flink-yarn/completed-jobs"目录中看到取消任务的信息：

登录Flink历史日志服务器查看取消任务统计信息：

注意：在取消任务或者停止Flink集群后，需要等待一小段时间才能在Flink历史日志服务器中查看到对应的取消任务。

关键词：

诺基亚1010怎么安装电话卡？诺基亚1010手机参数

2023-04-07 16:56:31

企业

小米手机陀螺仪怎么设置？订单号搞错了怎么撤回？|热门

2023-04-07 16:00:25

财经

办信用卡看不看配偶征信？民生京东PLUS联名卡年费多少？

2023-04-07

要闻

x 广告

大数据Flink进阶（十一）：Flink History Server配置使用

​Flink History Server配置使用

一、Standalone History Server配置与验证

1、配置

2、验证

二、Yarn History Server配置与验证

1、配置

2、验证

大数据Flink进阶（十一）：Flink History Server配置使用

基于Standalone或者Yarn模式提交Flink任务后，当任务执行失败、取消...

北山根村看振兴-全球独家

北山根村看振兴

最美人间四月天！怀来邀您开启“春日浪漫之约”！ 每日精选

最美人间四月天！怀来邀您开启“春日浪漫之约”！

巴西宣布将重返南美洲国家联盟|时快讯

新华社巴西利亚4月8日电（记者卞卓丹）巴西政府日前通报说，根据卢...

美国泄密文件显示其情报机构监听盟友 韩国：将进行必要沟通

中新网4月9日电据美国《纽约时报》8日报道，近来，社交媒体上出现的...

德国汉堡发生火灾 巨大烟雾蔓延|天天动态

中新社柏林4月9日电综合德媒报道，德国北部港口城市汉堡9日发生火灾...

澳媒：澳大利亚近六成民众反对通过加税为“奥库斯”协议买单-天天关注

中新社悉尼4月9日电据《澳大利亚金融评论报》9日报道称，近六成澳大...

通用视觉GPT之战打响！智源推出SegGPT，批量抠图神器来了

智东西作者|ZeR0编辑|漠影智东西4月8日报道，继ChatGPT掀起语言大模...

粮食工程专业就业方向_粮食工程专业

1、粮食工程专业旨培养德、智、体全面发展知识面宽基础扎实手能力强...

这种码，很危险！

近期，反诈民警发现了一个新型诈骗手法。不法分子利用邮寄的方式广...

电商热门选品思路-全球时讯

这是黄三水的第503期分享作者l黄三水来源l黄三水频道（ID：hss2083...

平谷区增速第一！2022年北京市各区GDP出炉！ 天天亮点

2022年北京市各区GDP出炉：第1名，海淀区，10206 9亿，同比增速3 ...

FSR、DLSS谁更好？26款游戏PK：AMD居然0胜！ 热点在线

AMDFSR、NVIDIADLSS是双方在同一技术路线上的又一次PK，但是和历史...

环球今日讯！福建省一批项目入选2023年农业产业融合发展项目拟批准创建名单

日前，农业农村部、财政部对2023年农业产业融合发展项目拟批准创建

【全球播资讯】对男朋友的爱称（对男朋友的昵称独特的备注）

1、宝贝、亲爱的、老公这些称呼大家都在叫，没有独特的心意。2、其...

微信黑名单在哪里查看 微信黑名单在哪里查看?-全球头条

1、登录微信：确保手机是保持在连接网络的状态。2、点击我：位置在...

天天时讯：335奶德毕业装备（奶德毕业装备）

1、SW毕业奶D装头智者乌索尔之帽JD掉落（我带的布甲的纯净奥术头盔...

新疆霍尔果斯今年开行中欧班列突破2000列_每日速递

新疆霍尔果斯今年开行中欧班列突破2000列。 李明 摄中新网乌鲁木...

中国海拔最高的县(中国海拔最高的县是什么县)-世界速读

本文目录一览：1、中国最高海拔是哪个县2、中国海拔最高的县是什么...

山东省招生办电话(山东省招生办的电话是多少？)

本文目录一览：1、山东省招生办的电话是多少？2、山东省招生办电话2...

4月09日18时河南周口疫情新增确诊数及周口目前为止疫情总人数

大家好该疫情数据更新统计周期为昨日0时起至24时，非今日实时数据，...

使用 Feign 实现微服务之间的认证和授权

在微服务架构中，认证和授权是保障系统安全和可靠性的重要手段。使...

魔盒插件怎么彻底删除_魔盒插件_每日播报

1、要完全卸载多玩魔盒，需要几个步骤。2、要重置所有设置，只需要...

世界观点：苁怎么读 拼音_苁怎么读

1、cōngㄘㄨㄥˉ1 〔～蓉〕寄生植物“草苁蓉”和“肉苁蓉”的统称...

离职后无法享受生育津贴？上海市医保局：正研究调整完善政策

近日，有市民通过上海市委领导信箱留言，建议生育津贴不与是否在职...

iphone主题怎么换（iPhone主题太单调？教你如何更换主题）

大家平时使用的iPhone手机，一直都是以白色为主的主题，时间长了，...

中信证券：规避主题炒作 回归业绩主线

【中信证券：规避主题炒作回归业绩主线】中信证券最新研报表示，当...

全球动态:奥普家居：一季度净利润同比增长115.24%

【奥普家居：一季度净利润同比增长115 24%】奥普家居(603551)4月9...

2022年违章停车罚单扣分吗

违章停车，或者没有及时驶离这种违章停车情况只罚款200元不扣分。机...

海洋“豹”款再增实力背书，海豹获央视中国汽车风云盛典最高奖 时快讯

2023年4月7日比亚迪海洋系列“豹”款海豹在央视举办的第三届“中国...

诺基亚1010怎么安装电话卡？诺基亚1010手机参数

小米手机陀螺仪怎么设置？订单号搞错了怎么撤回？|热门

办信用卡看不看配偶征信？民生京东PLUS联名卡年费多少？

Flink History Server配置使用

最美人间四月天！怀来邀您开启“春日浪漫之约”！每日精选

美国泄密文件显示其情报机构监听盟友韩国：将进行必要沟通

德国汉堡发生火灾巨大烟雾蔓延|天天动态

平谷区增速第一！2022年北京市各区GDP出炉！天天亮点

FSR、DLSS谁更好？26款游戏PK：AMD居然0胜！热点在线

微信黑名单在哪里查看微信黑名单在哪里查看?-全球头条

新疆霍尔果斯今年开行中欧班列突破2000列。　李明　摄中新网乌鲁木...

世界观点：苁怎么读拼音_苁怎么读

中信证券：规避主题炒作回归业绩主线

海洋“豹”款再增实力背书，海豹获央视中国汽车风云盛典最高奖时快讯