Walt You - 行是知之始
Home
Archives
Categories
Tags
About
Categories
Hadoop
2024-06-29 Sat.
MapReduce Classpath
Hadoop
MapReduce
2020-04-17 Fri.
MapReduce 中的二级排序 Secondary Sort
Hadoop
Hadoop
Big Data
MapReduce
2018-05-17 Thu.
Hadoop Yarn的架构
Hadoop
Hadoop
Big Data
Yarn
2018-05-11 Fri.
Hadoop中的map和mapper的区别,reduce和reducer的区别
Hadoop
Hadoop
Big Data
MapReduce
2018-05-06 Sun.
Hadoop中的分布式缓存
Hadoop
Hadoop
Big Data
MapReduce
2018-05-02 Wed.
HDFS读写数据流程
Hadoop
Hadoop
Big Data
HDFS
2018-05-02 Wed.
Hadoop MapReduce 工作流程
Hadoop
Hadoop
Big Data
MapReduce
Docker
2019-04-11 Thu.
以非root用户启动 Docker container
Docker
Docker
2018-05-21 Mon.
Docker一瞥
Docker
Docker
Hive
2018-07-08 Sun.
Hive 常用 Sql 命令
Hive
Big Data
Hive
2018-06-07 Thu.
Hive 调优
Hive
Big Data
Hive
2018-05-30 Wed.
Hive UDF
Hive
Big Data
Hive
2018-05-28 Mon.
Hive 介绍
Hive
Big Data
Hive
Spark
2025-08-18 Mon.
精通 Apache Spark 源码 | 问题 04・二、RDD与抽象 | Dataset/DataFrame 内存优化(Encoders 与 Tungsten 格式转换)
Spark
BigData
Spark
2025-07-18 Fri.
Spark 4.0 的新功能
Spark
BigData
Spark
Spark4.0
2025-06-25 Wed.
精通 Apache Spark 源码 | 问题 03・二、RDD与抽象 | RDD 血缘链实现(map/filter/join 转换的宽窄依赖对比)
Spark
BigData
Spark
2025-06-23 Mon.
精通 Apache Spark 源码 | 问题 02・一、核心架构 | DAG 调度器作业划分逻辑(Stage 边界与 Shuffle 依赖解析)
Spark
BigData
Spark
2025-06-16 Mon.
精通 Apache Spark 源码 | 问题 01・一、核心架构 | SparkContext 初始化链路(DAGScheduler/TaskScheduler 与集群管理器交互)
Spark
BigData
Spark
2025-06-15 Sun.
DataProc Image 2.0 messes up Spark SQL's physical plan with Rule CollapseAggregates
Spark
Big Data
Spark
GCP
DataProc
2025-05-15 Thu.
精通 Apache Spark 源码系列之 00:开始学习吧
Spark
BigData
Spark
2023-05-12 Fri.
Integrate Spark Metrics to Prometheus + Grafana
Spark
Spark
2023-05-05 Fri.
sparkDriver 无法绑定本地端口
Spark
Spark
2022-09-20 Tue.
在 IntelliJ IDEA 中调试 PySpark Source Code
Spark
Big Data
Spark
PySpark
2021-11-23 Tue.
Spark在云上的费用调优
Spark
Big Data
Spark
Cloud
AWS
2021-11-17 Wed.
RDD 中特殊的 sortBy 算子
Spark
Big Data
Spark
RDD
2020-03-28 Sat.
Spark Sql 在线编辑器
Spark
Big Data
Spark
Spark Sql
CodeMirror
Online Editor
2019-11-11 Mon.
Spark 源码 Build 及在 IntelliJ IDEA 中运行、调试Source Code
Spark
Big Data
Spark
2018-08-16 Thu.
Spark 图计算包:Graphx
Spark
Big Data
Spark
2018-07-24 Tue.
Spark 三种部署模式:YARN,Mesos,Standalone 介绍
Spark
Big Data
Spark
2018-07-18 Wed.
Spark 中 DAG 介绍
Spark
Big Data
Spark
2018-06-25 Mon.
记一次Spark调优经历
Spark
Big Data
Spark
2018-06-19 Tue.
Spark中RDD的介绍
Spark
Big Data
Spark
2018-06-13 Wed.
SparkContext 学习
Spark
Big Data
Spark
2018-06-10 Sun.
Spark 安装与环境配置
Spark
Big Data
Spark
2018-06-07 Thu.
Spark 介绍
Spark
Big Data
Spark
Hbase
2019-07-10 Wed.
HFile 底层存储格式
Hbase
Big Data
Hbase
2018-11-01 Thu.
Hbase Row Key 设计实例学习
Hbase
Big Data
Hbase
2018-10-30 Tue.
Hbase 的二级索引
Hbase
Big Data
Hbase
2018-09-13 Thu.
Hbase RowKey 设计与其他高级功能
Hbase
Big Data
Hbase
2018-09-13 Thu.
Hbase Schema 的设计
Hbase
Big Data
Hbase
2018-09-10 Mon.
Hbase 介绍
Hbase
Big Data
Hbase
Faiss
2019-03-25 Mon.
Faiss Practice
Faiss
Faiss
Image Search
2018-11-21 Wed.
Faiss 在项目中的使用
Faiss
Faiss
Image Search
2018-09-21 Fri.
Faiss 中的线程与异步调用
Faiss
Faiss
Image Search
2018-09-19 Wed.
Faiss Indexs 的进一步了解
Faiss
Faiss
Image Search
2018-09-17 Mon.
Faiss 介绍
Faiss
Faiss
Image Search
HIPI
2018-10-10 Wed.
HIPI 介绍
HIPI
Big Data
HIPI
Machine Learning
2018-10-23 Tue.
机器学习入门(一)--工具篇
Machine Learning
Machine Learning
Python
Elasticsearch
2019-03-22 Fri.
Elasticsearch 生产部署注意点
Elasticsearch
Big Data
Elasticsearch
Java
2019-05-16 Thu.
Java 8 中 HashMap的改进点
Java
Java8
Pig
2022-06-17 Fri.
一个Pig 调优的例子
Pig
Big Data
Pig
2019-07-07 Sun.
Apache Pig 入门学习
Pig
Big Data
Pig
VSCode
2020-06-11 Thu.
VSCode LSP Extension 指南
VSCode
VSCode
LSP
Soft Skills
2023-05-04 Thu.
TLSM 方法一撇
Soft Skills
Conmunication
GenAI
2025-06-12 Thu.
Build a production-ready RAG system
GenAI
RAG
Milvus
Elasticsearch
langchain
2025-05-10 Sat.
一个类似Continue.dev的简单代码助手工具
GenAI
Tool
2025-05-10 Sat.
A Simple Code Assistant Tool Similar to Continue.dev
GenAI
Tool
2024-06-29 Sat.
用kotlin在一个intellij 插件中实现一个MCP client
GenAI
MCP
MCP Client
Intellij Plugin
OpenAI
Kotlin
2024-06-29 Sat.
Implementing an MCP Client in an IntelliJ Plugin using Kotlin
GenAI
MCP
MCP Client
Intellij Plugin
OpenAI
Kotlin
2024-06-29 Sat.
The ConnectionResetError when using AzureOpenAIEmbeddings
GenAI
Azure
OpenAI
Content
Hadoop (7)
Docker (2)
Hive (4)
Spark (22)
Hbase (6)
Faiss (5)
HIPI (1)
Machine Learning (1)
Elasticsearch (1)
Java (1)
Pig (2)
VSCode (1)
Soft Skills (1)
GenAI (6)