Walt You - 行是知之始
Home
Archives
Categories
Tags
About
Hadoop MapReduce 工作流程
2018-05-02
Hadoop
Hadoop
Big Data
MapReduce
Mapreduce 作为hadoop的计算框架层, 是hadoop的核心之一。
Read All
11/11
Recent Posts
构建你的AI工作分身:自动化用户服务的实践指南
精通 Apache Spark 源码 | 问题 04・二、RDD与抽象 | Dataset/DataFrame 内存优化(Encoders 与 Tungsten 格式转换)
Spark 4.0 的新功能
精通 Apache Spark 源码 | 问题 03・二、RDD与抽象 | RDD 血缘链实现(map/filter/join 转换的宽窄依赖对比)
精通 Apache Spark 源码 | 问题 02・一、核心架构 | DAG 调度器作业划分逻辑(Stage 边界与 Shuffle 依赖解析)
精通 Apache Spark 源码 | 问题 01・一、核心架构 | SparkContext 初始化链路(DAGScheduler/TaskScheduler 与集群管理器交互)
DataProc Image 2.0 messes up Spark SQL's physical plan with Rule CollapseAggregates
Build a production-ready RAG system
精通 Apache Spark 源码系列之 00:开始学习吧
一个类似Continue.dev的简单代码助手工具
Categories
Hadoop
7
Docker
2
Hive
4
Spark
22
Hbase
6
Faiss
5
HIPI
1
Machine Learning
1
Elasticsearch
1
Java
1
Pig
2
VSCode
1
Soft Skills
1
GenAI
6
AI
1
Productivity
1
Tags
Hadoop
Big Data
MapReduce
HDFS
Yarn
Docker
Hive
Spark
Hbase
Faiss
Image Search
HIPI
Machine Learning
Python
Elasticsearch
Java8
Pig
Spark Sql
CodeMirror
Online Editor
VSCode
LSP
RDD
Cloud
AWS
PySpark
Conmunication
Azure
OpenAI
MCP
MCP Client
Intellij Plugin
Kotlin
Tool
BigData
RAG
Milvus
langchain
GCP
DataProc
Spark4.0
AI Agent
飞书CLI
自动化
知识管理