Walt You - 行是知之始

Hive UDF

2018-05-30

Hive

Big Data Hive

Hive 内置了很多函数，可以参考Hive Built-In Functions。

但是有些情况下，这些内置函数还是不能满足我们的需求，这时候就需要UDF出场了。

Read All
Hive 介绍

2018-05-28

Hive

Big Data Hive

MapReduce很强大，但是对于不会JAVA的一些数据库开发者，还是不太友好。所以Hive出现了，它可以将SQL解析成为MapReduce程序，既降低了SQL开发者的入门成本，又可享受MapReduce强大的计算能力。

Read All
Docker一瞥

2018-05-21

Docker

Docker

今天因为工作需要，拿到了一个dockerfile和一份代码，然后要让代码在docker里跑起来。然而自己之前没有接触docker，所以快速的学习了一下，这里做个总结。

Read All
Hadoop Yarn的架构

2018-05-17

Hadoop

Hadoop Big Data Yarn

Yarn是Hadoop 2.x版本后，抽象出来的新的资源管理层，它关注的事情更加集中：资源管理。

Read All
Hadoop中的map和mapper的区别，reduce和reducer的区别

2018-05-11

Hadoop

Hadoop Big Data MapReduce

Hadoop中的MapReduce中，有两个主要的步骤，一个是map，一个是reduce。

在任务运行时，我们又常说启动了多个mapper，多少个reducer。

那么map和mapper的区别，reduce和reducer到底有什么区别？该怎么区分它们呢？

Read All
Hadoop中的分布式缓存

2018-05-06

Hadoop

Hadoop Big Data MapReduce

Hadoop中的MapReduce有个一个很实用的机制，叫做分布式缓存（Distributed cache）。

那它是什么？怎么用？有什么特点和注意点？

Read All

10/11

Hive UDF

Hive 介绍

Docker一瞥

Hadoop Yarn的架构

Hadoop中的map和mapper的区别，reduce和reducer的区别

Hadoop中的分布式缓存