边际效应 https://validator.w3.org/feed/docs/rss2.html 单机 KTransformers 运行 DeepSeek-R1-GGUF 4 bit 量化模型 Q4_K_M 实测 DeepSeek V3 模型各子模块参数量精算 LLM PD 分离背后的架构问题 应该把 Prefix Caching 当作一种效果优化技术 长期主义和高认知闭合 DeepSeek 官方修正了 V3 的激活参数量说明 DeepSeek V3:AI 大模型 infra 基建新高度 用 ARM NEON 实现 _mm_movemask_epi8 的几种方法 技术领导的杠杆和支点 DeepSeek-V3 MTP 工程实现思考