2024
-
AI:应该把 Prefix Caching 当作一种效果优化技术
-
算法:Google Search 淘气三千问: Q7~Q9
-
算法:Google Search 淘气三千问: Q6
-
基础架构:Google Search 淘气三千问:Q1~Q5
-
AI:估值最高的 AI 搜索独角兽 Perplexity 使用倒排索引做 RAG
-
AI:LLM 推理优化 Prefix Caching 及其实现
-
AI:LLM 推理优化 Continuous Batching 及其实现
-
AI:Logits of API-Protected LLMs Leak Proprietary Information
-
AI:在 LLM 时代我们是否还需要倒排索引?
2023
2021
2020
2019
-
算法:基于 SIMD 指令的 PFOR-DELTA 解压和查找
-
基础架构:ABTest 平台设计 - 流量分布问题
-
基础架构:ABTest 平台设计 - 灰度发布和早鸟用户
-
基础架构:ABTest 平台设计 - 实验开关和分组信息传递