工作中 Spark Sql 占了不小的比重,为了提高开发效率,就想搞个在线编辑器,期待有语法高亮、语法检测、自动提示等功能。技术栈主要包含 CodeMirror 以及 Spark Catalyst。
为了方便的阅读、理解 Spark 源码,debug 是个好方式。来介绍一下Spark 在 IntelliJ IDEA 中 Debug 环境构建。
HFile 的底层存储格式,一共有三个版本,按先后顺序来学习一下。
工作中需要用到 Pig,来学习一下。
Java 8 中,对 HashMap 做了一些优化,就是会在链表过长的时候,将链表转为红黑树。 来仔细看看是怎么改的,以及为什么这么改。
启动 docker container后,默认的登陆用户为 root,那么如何以其他用户进入docker container 中呢?