Dev Tools
Some notes about open source data science software and libraries.
Posts
-
用 Python 写 CUDA Kernel:NVIDIA cuda.compute 实战教程
-
Nested Sampling 与分层贝叶斯:用 Slice-within-Gibbs 实现高效证据计算
-
动态流水线重配置:异构 GPU 集群上 LLM 推理的在线调度实战
-
多模型推理系统的 Prefill 共享优化:让 Multi-Agent 快 4.5 倍
-
用强化学习训练 LLM 生成高性能 GPU Kernel:GPT-5 的实战突破
-
MoE 推理优化:通过预测性预取平衡计算与通信
-
大模型批处理推理的拥塞控制:CONCUR 系统深度解析
-
CUDA Tile IR:让 Triton 代码跑在 Tensor Core 上的新方式
-
CUDA推理能耗诊断与优化:从测量到优化的完整指南
-
Diffusion LLM采样优化:超越GEMM的GPU编程实践
-
大规模Transformer模型的异步检查点技术:CUDA实现与优化
-
RT Core加速固定半径近邻搜索:从原理到实战
-
CUDA中的测试时训练:从GPU矩阵乘法优化看TTT-Discover的实践应用
-
NVIDIA Dynamo:AI工厂操作系统
-
CUDA 13 革命性地改变GPU编程
-
Usingi Docker for Geospatial Data Science
-
My First Blog on Tools is about Vim and Spacevim
subscribe via RSS