多辣加香菜
多辣加香菜
文章 | POST系列 | SERIES生活 | LIFE浮世绘 | UKIYOE足迹 | FOOTPRINT关于 | ABOUT

LLM

LLM 清洗数据
LLM

LLM 清洗数据

📅 Mar 29, 2026📖 15 Min Read
READ MORE →
Dataset 预处理
LLM

Dataset 预处理

📅 Mar 25, 2026📖 4 Min Read
READ MORE →
Flash Attention
LLM

Flash Attention

📅 Mar 14, 2026📖 4 Min Read
READ MORE →
大模型知识蒸馏
LLM

大模型知识蒸馏

📅 Mar 5, 2026📖 5 Min Read
READ MORE →
大模型量化
LLM

大模型量化

📅 Feb 17, 2026📖 11 Min Read
READ MORE →
LoRA&QLoRA
LLM

LoRA&QLoRA

📅 Feb 16, 2026📖 4 Min Read
READ MORE →
LLM Inference
LLM

LLM Inference

📅 Feb 11, 2026📖 9 Min Read
READ MORE →
MoE 混合专家模型
LLM

MoE 混合专家模型

📅 Feb 6, 2026📖 5 Min Read
READ MORE →
分布式训练技术 - 张量并行
LLM

分布式训练技术 - 张量并行

📅 Feb 5, 2026📖 10 Min Read
READ MORE →
分布式训练技术 - 数据并行
LLM

分布式训练技术 - 数据并行

📅 Feb 2, 2026📖 10 Min Read
READ MORE →
LLM

transformer库的基类

📅 Jan 27, 2026📖 6 Min Read
READ MORE →
KVCache
LLM

KVCache

📅 Dec 3, 2025📖 3 Min Read
READ MORE →
RoPE
LLM

RoPE

📅 Nov 28, 2025📖 3 Min Read
READ MORE →
Packing or Padding?
LLM

Packing or Padding?

📅 Nov 9, 2025📖 5 Min Read
READ MORE →
估算模型需要的显存
LLM

估算模型需要的显存

📅 Aug 22, 2025📖 6 Min Read
READ MORE →

Series

deeplearning [7]llm [15]python 技巧 [4]rlhf [8]备忘 [2]游记 [3]训推框架 [3]论文阅读 [2]课程笔记 [5]面经 [3]项目笔记 [4]

Tags

asyncio [1]cdn [1]cloudflare [1]email [1]gpu [1]huggingface [1]inference [3]loss [1]module [2]netflix [1]python [4]register [1]transformer [3]分布式 [2]动作 [1]复习 [2]大模型 [21]异步 [1]强化学习 [7]掩码 [1]数据库 [1]数据集 [3]深度学习 [7]算法 [1]装饰器 [1]设计模式 [1]
© 2025-2026 多辣加香菜 CC BY-NC 4.0