Tensor Parallel on 黄文卓

Tensor Parallel on 黄文卓 | DevOps Engineer https://socake.github.io/tags/tensor-parallel/ Recent content in Tensor Parallel on 黄文卓 | DevOps Engineer Hugo -- gohugo.io zh-CN 17691281867@163.com (Wenzhuo Huang) 17691281867@163.com (Wenzhuo Huang) © 2026 Wenzhuo Huang Tue, 03 Mar 2026 09:30:00 +0800 vLLM 多机多卡分布式推理：Tensor Parallel 调优与踩坑实录 https://socake.github.io/posts/vllm-multi-node-distributed/ Tue, 03 Mar 2026 09:30:00 +0800 17691281867@163.com (Wenzhuo Huang) https://socake.github.io/posts/vllm-multi-node-distributed/ 从单机 8 卡讲到多机多卡，把 vLLM 的 TP/PP 拆分、Ray 启动方式、NCCL 调优、PagedAttention 显存核算和常见翻车场景串成一条完整的落地路径。