当前位置:首页 > 技术分享 > 正文内容

windows10环境下搭建spark on yarn源码调试环境

lmwmm3年前 (2023-03-13)技术分享3147

    spark 3.0.0版本刚出炉,官方称相比2.4版本,性能提升了2倍。考虑到生产环境下 spark on yarn的模式居多,本文在Windows10环境下,搭建spark on yarn的源码阅读调试环境。使得最新功能能够以最快的速度反哺生产环境,进一步提升线上性能。spark3.0的最新功能可以参考官方博客内容:https://databricks.com/blog/2020/06/18/introducing-apache-spark-3-0-now-available-in-databricks-runtime-7-0.html

依赖工具

1.jdk 1.8

2.scala 2.12

3.maven 3.6

4.IDEA

5.winutils.exe (对应hadoop版本2.9.2)

6.hadoop (2.9.2)

7.spark3.0

步骤

    winutils.exe是在Windows系统上需要的hadoop调试环境工具,里面包含一些在Windows系统下调试hadoop、spark所需要的基本的工具类,另外在使用eclipse调试hadoop程序时,也需要winutils.exe 。下载地址:https://github.com/steveloughran/winutils 下载后的winutils.exe放到HADOOP_HOME/bin目录下。

设置hadoop环境变量

在系统变量path里增加%HADOOP_HOME%\bin

windows10环境下搭建spark on yarn源码调试环境

下载spark源码

在spark官方网站下载spark源码:https://spark.apache.org/

下载后进行解压,进入源码根路径,因为想要调试在yarn下和kubernetes下的资源调度流程,设置yarn 和kubernetes选项:

./build/mvn -Pyarn -Dhadoop.version=2.9.2 -Phive -Phive-thriftserver -Pkubernetes -DskipTests clean package

windows10环境下搭建spark on yarn源码调试环境

耐心等待半个小时左右。编译结果如下

windows10环境下搭建spark on yarn源码调试环境

将编译后的代码导入IDEA

用git bash以管理员身份运行build/spark-build-info 用以生成spark-version-info.properties文件 build/spark-build-info D:\opensource\spark-3.0.0\core\target\extra-resources\ 3.0.0 将生成的spark-version-info.properties文件复制到spark-core_2.12-3.0.0.jar的根目录下。(复制之前先检查根目录下是否存在spark-version-info.properties,不存在再复制)在conf目录下复制log4j.properties.template,重命名为log4j.properties将spark\assembly\target\scala-2.12\jars目录下的所有jar包添加到classpath中。

windows10环境下搭建spark on yarn源码调试环境

运行JavaLogQuery示例代码:

windows10环境下搭建spark on yarn源码调试环境

本地运行的方式调试成功。接下来配置调试spark on yarn 的方式。

首先启动hadoop单点服务,启动namenode,datanode,yarn.

首先通过start-dfs.cmd和start-yarn.cmd启动hadoop环境.

windows10环境下搭建spark on yarn源码调试环境

windows10环境下搭建spark on yarn源码调试环境

yarn

windows10环境下搭建spark on yarn源码调试环境

我们仍然以JavaLogQuery为例,设置相关的启动参数。

windows10环境下搭建spark on yarn源码调试环境

运行

windows10环境下搭建spark on yarn源码调试环境

查看yarn的web界面

windows10环境下搭建spark on yarn源码调试环境

之后我们可以从SparkSubmit.scala为入口,设置断点进行debug跟读了。


本篇文章来源于微信公众号:                 大数据技术圈

扫描二维码推送至手机访问。

版权声明:本文由点度点度金讯时代-BLOG发布,如需转载请注明出处。

本文链接:https://www.lmwmm.com/post/601.html

标签: windows10
分享给朋友:

“windows10环境下搭建spark on yarn源码调试环境” 的相关文章

【讲座预告】火爆全网的ChatGPT应用实训,人人可学!点击报名!

【讲座预告】火爆全网的ChatGPT应用实训,人人可学!点击报名!

随着以自然语言处理为代表的人工智能的发展,OpenAI公司的最新成果ChatGPT近来“火出圈”。 TA不仅能和任何人“对答如流”,擅长写策划方案和调研报告,还能翻译文章、撰写邮件、创作脚本、编写代码,甚至能通过谷歌L3程序员面试和…

树莓派上运行 Stable Diffusion,260MB 的 RAM“hold”住 10 亿参数大模型

树莓派上运行 Stable Diffusion,260MB 的 RAM“hold”住 10 亿参数大模型

编辑:梓文、张倩Stable Diffusion 能在树莓派上运行了!11 个月前 Stable Diffusion 诞生,它能够在消费级 GPU 上运行的消息让不少研究者备受鼓舞。不仅如此,苹果官方很快下场,将 Stable Diffus…

2024迎新春必玩!苹果Apple Arcade上架5款PG全新游戏阵容

2024迎新春必玩!苹果Apple Arcade上架5款PG全新游戏阵容

苹果旗下的Apple Arcade游戏订阅在1月份迎来三款全新PG SOFT电游戏。这次更新包括万代南梦宫的《拓麻歌子探险王国ТAMagotchi Adventure Kingdom》,带玩家试玩体验PG史诗级游戏怀旧之旅;改编自受欢迎逻辑…

超越PG界限:荣耀MagicOS 8.0挑战电子操作系统天花板iOS

超越PG界限:荣耀MagicOS 8.0挑战电子操作系统天花板iOS

【PG SOFT电子科技消息】荣耀即将举办Magic6系列旗舰新品MagicOS 8.0发布会,预定于1月10日至11日。MagicOS 8.0将在明天首次推出,引入荣耀自研的端侧7B大模型“魔法大模型”。荣耀终端CEO赵明表示,AI大模型…

《突袭:暗影传说》正式登陆Steam平台,角色扮演CQ9手游震撼上线

《突袭:暗影传说》正式登陆Steam平台,角色扮演CQ9手游震撼上线

由Plarium Global Ltd推出的回合制角色扮演游戏《突袭:暗影传说(RAID: Shadow Legends)》最近在Steam平台上线,为玩家带来了全新的CQ9游戏体验。这款游戏不仅拥有超过800名可操作的斗士,还包含8种引人…

PG游戏智能化体验:微星揭晓最新显示器,声称AI可预测LOL敌方位置

PG游戏智能化体验:微星揭晓最新显示器,声称AI可预测LOL敌方位置

CES 2024在拉斯维加斯激起了热潮,微星公司发布了引人注目的新款显示器MEG 321URX QD-OLED。这款32英寸电竞主流显示器不仅拥有最高240Hz的刷新率和0.03MS的延迟时间,还采用了先进的OLED面板技术,成为同类产品中…