Walt You - 行是知之始

Walt You - 行是知之始

在 IntelliJ IDEA 中调试 PySpark Source Code

2022-09-20

Spark

Big Data Spark PySpark

之前写过一篇文章来介绍如何构建 Spark 源码本地的 Debug 环境（详情看这里），但是对于 PySpark 的调试环境略有不同，再来一篇文章介绍一下。

Read All
一个Pig 调优的例子

2022-06-17

Pig

Big Data Pig

Read All
Spark在云上的费用调优

2021-11-23

Spark

Big Data Spark Cloud AWS

提起 Spark 调优，通常的目标都是如何让运行时间短，但最近看到一篇有趣的文章，它的调优目标却是如何让云服务费用越低，而做到了在保证不增加运行时间、不减少处理的数据的情况下，将云服务的费用降低了 60 %，很酷很新颖，来看看。

Read All
RDD 中特殊的 sortBy 算子

2021-11-17

Spark

Big Data Spark RDD

偶然发现Spark RDD 中的 sortBy 是个特殊的 transform 算子，它居然可以像 action 算子一样触发 job。这是为什么呢？来了解了解。

Read All
VSCode LSP Extension 指南

2020-06-11

VSCode

VSCode LSP

Read All
MapReduce 中的二级排序 Secondary Sort

2020-04-17

Hadoop

Hadoop Big Data MapReduce

Read All

4/11

Recent Posts

Categories

Tags