2025
-
AI:刷新 32 张 L40S 运行 DeepSeek-R1-INT8 的性能数据
-
AI:使 SGLang 支持在 32 张 L40S 上运行 DeepSeek-R1
-
AI:理解 FlashMLA 在 DeepSeek MLA 计算过程中的位置和作用
-
AI:2 行代码校验大模型(如DeepSeek-R1)权重文件下载完整性
-
AI:单机 KTransformers 运行 DeepSeek-R1-GGUF 4 bit 量化模型 Q4_K_M 实测
-
AI:DeepSeek-V3 MTP 工程实现思考
-
AI:DeepSeek 官方修正了 V3 的激活参数量说明
-
AI:LLM PD 分离背后的架构问题
-
AI:DeepSeek V3 模型各子模块参数量精算
-
AI:DeepSeek V3:AI 大模型 infra 基建新高度