边际效应

跬步千里,不弃毫厘之功; 星火燎原,必珍方寸之芒

公众号：边际效应

杨文博

15年互联网老兵，现任某厂搜索架构部负责人。对冷门知识充满兴趣，对奇思妙想充满热情，对自己完成一事充满骄傲。

扫码关注我的公众号"边际效应"

近期评论

Solrex 发表在《生成引擎优化—对 AI 搜索引擎的提示词攻击》
曹磊发表在《生成引擎优化—对 AI 搜索引擎的提示词攻击》
曹磊发表在《生成引擎优化—对 AI 搜索引擎的提示词攻击》

友情链接

徐宥 | 4G Spaces
王捷 | 风云阁
张志强 | 阅微堂
夏恺 | 年华转瞬
王聪 | A Geek's Page
陈宇飞 | Random Tech Thoughts

2025

基础架构：Google Search 淘气三千问：Q10～Q12
7月16日
AI：生成引擎优化—对 AI 搜索引擎的提示词攻击
7月09日
悟忆行知：有关对讲机在车内发射时信号衰减的理论探讨
6月20日
AI：优化Qwen3 - FP8模型L40S卡性能提升18%
6月12日
AI：RDMA 环境下的一点 NCCL 调试经验
6月07日
AI：一个能提升 DeepSeek/Qwen3 在 L40S/L20 卡上 FP8 量化计算性能的 CUDA Kernel
6月03日
悟忆行知：乒乓球菜鸟聊一下最近买的几个球拍
5月18日
AI：GLM-4-Z1 模型设计做错了一件事
4月28日
AI：有关 GLM-4-0414 的 SGLang 推理支持
4月19日
AI：Llama-4 的 expert 参数组织问题和 FP8 量化方法
4月10日
AI：在 32 张 L40S/L20 上运行 DeepSeek-R1/V3 原版 FP8 模型
3月26日
AI：刷新 32 张 L40S 运行 DeepSeek-R1-INT8 的性能数据
3月22日
AI：使 SGLang 支持在 32 张 L40S/L20 上运行 DeepSeek-R1
3月17日
AI：理解 FlashMLA 在 DeepSeek MLA 计算过程中的位置和作用
3月08日
AI：2 行代码校验大模型（如DeepSeek-R1）权重文件下载完整性
2月24日
AI：单机 KTransformers 运行 DeepSeek-R1-GGUF 4 bit 量化模型 Q4_K_M 实测
2月18日
AI：DeepSeek-V3 MTP 工程实现思考
2月14日
AI：DeepSeek 官方修正了 V3 的激活参数量说明
2月08日
AI：LLM PD 分离背后的架构问题
2月07日
AI：DeepSeek V3 模型各子模块参数量精算
1月12日

文章分页

页 1 页 2 … 页 34 下一页

© 2005 - 2025 边际效应. All Rights Reserved.

Powered by WordPress.