关于我

你好，我是 多辣加香菜/椰果去冰七分甜 ☘

目前关注的方向是 LLM、强化学习与 训练框架。

没有忌口老板，麻烦辣帮我多加一点。

最近更新 |

vLLM 原理训推框架 Inference 大模型2026-03-12
LLM 中的强化学习：DAPO RLHF 大模型强化学习2026-03-11
大模型知识蒸馏 LLM 大模型2026-03-05
Autograd from scratch DeepLearning2026-03-04
LLM 中的强化学习：GRPO RLHF 大模型强化学习2026-03-02
LLM 中的强化学习：DPO RLHF 大模型强化学习2026-02-26
LLM 中的强化学习：PPO RLHF 大模型强化学习2026-02-19
大模型量化 LLM 大模型2026-02-17
LoRA&QLoRA LLM 大模型2026-02-16
强化学习基础 RLHF 大模型强化学习2026-02-16
MiniMind 学习指北项目笔记大模型深度学习2026-02-13
LLM Inference LLM 大模型 Inference2026-02-11
MoE 混合专家模型 LLM 大模型2026-02-06
分布式训练技术 - 张量并行 LLM 分布式2026-02-05
分布式训练技术 - 数据并行 LLM 分布式2026-02-02
transformer库的基类 LLM HuggingFace2026-01-27
Mask On Transformer DeepLearning 掩码 Transformer2026-01-24
CDN 加速博客和图床备忘 CDN2026-01-15
高级数据库系统课程笔记数据库复习2026-01-13
算法分析与设计课程笔记算法复习2026-01-08