加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 黄冈站长网 (http://www.0713zz.com/)- 数据应用、建站、人体识别、智能机器人、语音技术!
当前位置: 首页 > 百科 > 正文

oracle – 在不增加Cores的情况下增加Spark Executor中的并行度

发布时间:2021-03-06 21:15:49 所属栏目:百科 来源:网络整理
导读:我正在运行一个Spark-Kafka Streaming作业,有4个执行器(每个1个核心).而kafka源主题有50个分区. 在流式java程序的foreachpartition中,我正在连接到oracle并做一些工作. Apache DBCP2用于连接池. Spark-streaming程序与数据库建立4个连接 – 每个执行程序可

我正在运行一个Spark-Kafka Streaming作业,有4个执行器(每个1个核心).而kafka源主题有50个分区.

在流式java程序的foreachpartition中,我正在连接到oracle并做一些工作. Apache DBCP2用于连接池.

Spark-streaming程序与数据库建立4个连接 – 每个执行程序可能为1.但是,我的期望是 – 由于有50个分区,应该有50个线程在运行并且存在50个数据库连接.

如何在不增加内核数量的情况下增加并行度.

解决方法

你的期望是错误的.一个核心是Spark命名法中的一个可用线程和一个可以在当时处理的分区.

4“核心” – > 4个主题 – > 4个分区经过精心处理.

(编辑:PHP编程网 - 黄冈站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读