Topics Series
AI 专题精讲
每篇聚焦一个 AI 工程实战问题,独立可读,不依赖其他系列。从 RAG 全链路到意图识别,从缓存策略到 Token 管理,JS/TS + Python 双语言,附完整可运行代码。
Total Articles 14 篇
Level 专题
01.
SEP 22, 2025 RAGPython
RAG 文件解析:PDF / Word / Excel / HTML 全格式文本提取
知识库第一步是把文件变成纯文本,用 Python 实现 PDF、Word、Excel、HTML 四种格式的统一解析器
02.
OCT 08, 2025 RAGPython
RAG 文档切片策略:固定长度 vs 递归 vs 语义切分
切片质量决定检索质量,对比三种主流切片策略的效果、参数调优和适用场景
03.
OCT 22, 2025 RAG前端
RAG 大文件上传:分片上传、断点续传、进度追踪
100MB+ 文件上传总失败?前后端分片上传 + 断点续传 + 实时进度的完整方案
04.
NOV 05, 2025 RAGEmbedding
Embedding 模型选型:OpenAI / BGE / Jina 效果与成本对比
Embedding 选错后续全白搭,实测对比主流模型的中文效果、成本与部署方案
05.
NOV 20, 2025 RAG向量数据库
向量数据库选型:ChromaDB / pgvector / Pinecone / Milvus
四大主流向量库逐个拆解,CRUD 代码 + 性能对比 + 选型决策树
06.
DEC 05, 2025 RAG检索优化
RAG 检索优化:混合搜索、Reranking、多路召回
纯向量检索不够准?三板斧把召回率从 80% 拉到 95% 的完整方案
07.
DEC 18, 2025 意图识别语义路由
意图识别:从关键词匹配到语义路由
用户说了一句话,系统怎么知道他想干什么?三层意图识别方案完整实现
08.
JAN 08, 2026 结构化输出JSON Schema
结构化输出:让 AI 稳定返回 JSON
AI 返回的 JSON 老出错?三种方案 + 容错机制让结构化输出稳如老狗
09.
JAN 25, 2026 AI 缓存语义缓存
AI 缓存策略:精确缓存 + 语义缓存,省钱又提速
重复问题反复调 API 太浪费,双层缓存方案帮你省 30%~70% 成本
10.
FEB 10, 2026 Token上下文管理
Token 计算与上下文窗口管理实战
Token 精确计算、成本预估、四种上下文裁剪策略,附即插即用中间件
11.
FEB 28, 2026 微调LoRA
大模型微调实战:从 LoRA 到部署上线的完整方案
Prompt 调不动了怎么办?QLoRA 低成本微调 + GGUF 部署完整流程
12.
MAR 07, 2026 CursorSkill
Cursor Skill 开发:把工程经验变成 AI 可执行的技能
团队部署流程、代码规范还在口口相传?把它们写成 Skill,AI 自动标准化执行
13.
MAR 14, 2026 Harness EngineeringAI 工程效能
Harness Engineering:从"AI 辅助"到"驾驭 AI"的工程效能革命
别只让 AI 帮你补全代码了。Rule+Skill+Hook+Subagent 四层体系,系统化驾驭 AI 做工程
14.
APR 28, 2026 AI 开发规范AGENTS.md
AI 开发规范:让 AI 在真实项目里稳定工作的工程体系
基于两个真实项目(conor-site + ai-memory),拆解五层约束体系:AGENTS.md 入职文件、文档基建、Cursor Rules、Feature Gate、Spike-First