关于我
你好,我是 多辣加香菜/椰果去冰七分甜 ☘
目前关注的方向是 LLM、强化学习与 训练框架。
没有忌口老板,麻烦辣帮我多加一点。
博文统计
2025-07-08
- 香港行1.28 千字
2025-08-22
- 估算模型需要的显存2.571 千字
2025-10-19
- Python Tricks0.305 千字
- Python 设计模式0.35 千字
- Python 异步编程0.292 千字
- Python 装饰器0.407 千字
2025-11-09
- Packing or Padding?2.232 千字
2025-11-19
- RNN1.047 千字
2025-11-27
- Bilateral LSTM1.254 千字
2025-11-28
- RoPE1.485 千字
2025-11-30
- Stanford-CS224N31.795 千字
2025-12-01
- Optimizer1.77 千字
2025-12-03
- KVCache1.346 千字
2025-12-17
- Stanford-CS33611.721 千字
2025-12-19
- LSTM3.278 千字
2025-12-27
- Loss Function1.172 千字
2026-01-01
- 冬游黄山0.361 千字
2026-01-08
- 算法分析与设计23.753 千字
2026-01-13
- 高级数据库系统26.879 千字
2026-01-15
- CDN 加速博客和图床1.151 千字
2026-01-24
- Mask On Transformer1.185 千字
2026-01-27
- transformer库的基类2.969 千字
2026-02-02
- 分布式训练技术 - 数据并行4.721 千字
2026-02-05
- 分布式训练技术 - 张量并行4.889 千字
2026-02-06
- MoE 混合专家模型2.413 千字
2026-02-11
- LLM Inference4.312 千字
2026-02-13
- MiniMind 学习指北17.806 千字
2026-02-16
- LoRA&QLoRA1.796 千字
- 强化学习基础9.886 千字
2026-02-17
- 大模型量化5.052 千字
2026-02-19
- LLM 中的强化学习:PPO7.573 千字
2026-02-26
- LLM 中的强化学习:DPO2.246 千字
2026-03-02
- LLM 中的强化学习:GRPO2.389 千字
2026-03-04
- Autograd from scratch2.73 千字
2026-03-05
- 大模型知识蒸馏2.429 千字
2026-03-11
- LLM 中的强化学习:DAPO2.575 千字
2026-03-12
- vLLM 原理8.749 千字
2026-03-14
- Flash Attention1.845 千字
2026-03-15
- vLLM 部署大模型1.398 千字
2026-03-17
- LLM 中的强化学习:GSPO3.293 千字
2026-03-18
- LLM 中的强化学习:ARPO5.647 千字
- 组合数学6.491 千字
2026-03-25
- Dataset 预处理1.709 千字
2026-03-27
- LLM reasoning & CoT7.816 千字
- MedicalGPT 学习指北10.559 千字
2026-03-29
- LLM 清洗数据7.162 千字
2026-03-30
- CLIProxyAPI&大模型反代4.23 千字
2026-04-13
- ToolBrain 学习指北5.289 千字
2026-04-16
- 从零开始学 verl 框架14.994 千字
2026-04-24
2026-05-07
- On-Policy Distillation7.457 千字
2026-05-18
- 面试算法速通4.031 千字
2026-05-21
- Search-R1 学习指北14.287 千字
2026-05-25
- 上海行0.886 千字
2026-06-02
- Interview Codes2.524 千字
- Interview Q&A11.076 千字
2026-06-10
- Codex Free 无限续杯1.811 千字
最近更新 |
所有文章- vLLM 原理训推框架Inference大模型
- LLM 中的强化学习:DAPORLHF大模型强化学习
- 大模型知识蒸馏LLM大模型
- Autograd from scratchDeepLearning
- LLM 中的强化学习:GRPORLHF大模型强化学习
- LLM 中的强化学习:DPORLHF大模型强化学习
- LLM 中的强化学习:PPORLHF大模型强化学习
- 大模型量化LLM大模型
- LoRA&QLoRALLM大模型
- 强化学习基础RLHF大模型强化学习
- MiniMind 学习指北项目笔记大模型深度学习
- LLM InferenceLLM大模型Inference
- MoE 混合专家模型LLM大模型
- 分布式训练技术 - 张量并行LLM分布式
- 分布式训练技术 - 数据并行LLM分布式
- transformer库的基类LLMHuggingFace
- Mask On TransformerDeepLearning掩码Transformer
- CDN 加速博客和图床备忘CDN
- 高级数据库系统课程笔记数据库复习
- 算法分析与设计课程笔记算法复习