日拱一卒
- Grouped GEMM
- Finetune MoE with LoRA
- 笔记:How To Write A CUDA Program: The Ninja Edition
- LLM.C 中的 CUDA Kernel
- 大模型训练优化——我的问题合集
- FLOPs 的计算
- Triton Puzzles: 从 softmax 到 flash attention
- RWKV
- Perplexity
- 简单了解什么是 MoE
- 部署多版本的 mdbook 到 Netlify
- Lox 实现日记:局部变量
- 安装配置 WSL2
- 深入理解 Python Mock 库:Mock,patch 和 patch.object 的实现原理
- How Salsa Works
- anyhow vs error_stack: 从用户的角度来看错误处理
- 如何在 k8s 上部署单节点的 redis
- 如何使用 GitLab CI/CD 自动化 Docker 镜像打包和部署
- 向 AutoGPT 学习如何发挥 GPT 的潜力
- Salsa: LRU needs keep dependency info
- 封装我最常用的 3 个 kubectl 命令
- Rust Analyzer: 为什么要跑 cargo check
- 如何看待 rust 体系中 rowan 的红绿树
- IR 竟然是......
- 自顶向下编译
- 《Crafting Interpreters》阅读笔记(四)
- rustc 如何做 name resolution
- 如何实现一个Rust Language Server?
- 《Crafting Interpreters》阅读笔记(三)
- 《Crafting Interpreters》阅读笔记(二)
- 《Crafting Interpreters》阅读笔记(一)