Topics Series

AI 专题精讲

每篇聚焦一个 AI 工程实战问题,独立可读,不依赖其他系列。从 RAG 全链路到意图识别,从缓存策略到 Token 管理,JS/TS + Python 双语言,附完整可运行代码。

Total Articles 14 篇
Level 专题
01.
SEP 22, 2025 RAGPython

RAG 文件解析:PDF / Word / Excel / HTML 全格式文本提取

知识库第一步是把文件变成纯文本,用 Python 实现 PDF、Word、Excel、HTML 四种格式的统一解析器

02.
OCT 08, 2025 RAGPython

RAG 文档切片策略:固定长度 vs 递归 vs 语义切分

切片质量决定检索质量,对比三种主流切片策略的效果、参数调优和适用场景

03.
OCT 22, 2025 RAG前端

RAG 大文件上传:分片上传、断点续传、进度追踪

100MB+ 文件上传总失败?前后端分片上传 + 断点续传 + 实时进度的完整方案

04.
NOV 05, 2025 RAGEmbedding

Embedding 模型选型:OpenAI / BGE / Jina 效果与成本对比

Embedding 选错后续全白搭,实测对比主流模型的中文效果、成本与部署方案

05.
NOV 20, 2025 RAG向量数据库

向量数据库选型:ChromaDB / pgvector / Pinecone / Milvus

四大主流向量库逐个拆解,CRUD 代码 + 性能对比 + 选型决策树

06.
DEC 05, 2025 RAG检索优化

RAG 检索优化:混合搜索、Reranking、多路召回

纯向量检索不够准?三板斧把召回率从 80% 拉到 95% 的完整方案

07.
DEC 18, 2025 意图识别语义路由

意图识别:从关键词匹配到语义路由

用户说了一句话,系统怎么知道他想干什么?三层意图识别方案完整实现

08.
JAN 08, 2026 结构化输出JSON Schema

结构化输出:让 AI 稳定返回 JSON

AI 返回的 JSON 老出错?三种方案 + 容错机制让结构化输出稳如老狗

09.
JAN 25, 2026 AI 缓存语义缓存

AI 缓存策略:精确缓存 + 语义缓存,省钱又提速

重复问题反复调 API 太浪费,双层缓存方案帮你省 30%~70% 成本

10.
FEB 10, 2026 Token上下文管理

Token 计算与上下文窗口管理实战

Token 精确计算、成本预估、四种上下文裁剪策略,附即插即用中间件

11.
FEB 28, 2026 微调LoRA

大模型微调实战:从 LoRA 到部署上线的完整方案

Prompt 调不动了怎么办?QLoRA 低成本微调 + GGUF 部署完整流程

12.
MAR 07, 2026 CursorSkill

Cursor Skill 开发:把工程经验变成 AI 可执行的技能

团队部署流程、代码规范还在口口相传?把它们写成 Skill,AI 自动标准化执行

13.
MAR 14, 2026 Harness EngineeringAI 工程效能

Harness Engineering:从"AI 辅助"到"驾驭 AI"的工程效能革命

别只让 AI 帮你补全代码了。Rule+Skill+Hook+Subagent 四层体系,系统化驾驭 AI 做工程

14.
APR 28, 2026 AI 开发规范AGENTS.md

AI 开发规范:让 AI 在真实项目里稳定工作的工程体系

基于两个真实项目(conor-site + ai-memory),拆解五层约束体系:AGENTS.md 入职文件、文档基建、Cursor Rules、Feature Gate、Spike-First