Topics Series

AI 专题精讲

每篇聚焦一个 AI 工程实战问题，独立可读，不依赖其他系列。从 RAG 全链路到意图识别，从缓存策略到 Token 管理，JS/TS + Python 双语言，附完整可运行代码。

Total Articles 14 篇

Level 专题

01.

SEP 22, 2025 RAGPython

RAG 文件解析：PDF / Word / Excel / HTML 全格式文本提取

知识库第一步是把文件变成纯文本，用 Python 实现 PDF、Word、Excel、HTML 四种格式的统一解析器

arrow_forward

02.

OCT 08, 2025 RAGPython

RAG 文档切片策略：固定长度 vs 递归 vs 语义切分

切片质量决定检索质量，对比三种主流切片策略的效果、参数调优和适用场景

arrow_forward

03.

OCT 22, 2025 RAG前端

RAG 大文件上传：分片上传、断点续传、进度追踪

100MB+ 文件上传总失败？前后端分片上传 + 断点续传 + 实时进度的完整方案

arrow_forward

04.

NOV 05, 2025 RAGEmbedding

Embedding 模型选型：OpenAI / BGE / Jina 效果与成本对比

Embedding 选错后续全白搭，实测对比主流模型的中文效果、成本与部署方案

arrow_forward

05.

NOV 20, 2025 RAG向量数据库

向量数据库选型：ChromaDB / pgvector / Pinecone / Milvus

四大主流向量库逐个拆解，CRUD 代码 + 性能对比 + 选型决策树

arrow_forward

06.

DEC 05, 2025 RAG检索优化

RAG 检索优化：混合搜索、Reranking、多路召回

纯向量检索不够准？三板斧把召回率从 80% 拉到 95% 的完整方案

arrow_forward

07.

DEC 18, 2025 意图识别语义路由

意图识别：从关键词匹配到语义路由

用户说了一句话，系统怎么知道他想干什么？三层意图识别方案完整实现

arrow_forward

08.

JAN 08, 2026 结构化输出JSON Schema

结构化输出：让 AI 稳定返回 JSON

AI 返回的 JSON 老出错？三种方案 + 容错机制让结构化输出稳如老狗

arrow_forward

09.

JAN 25, 2026 AI 缓存语义缓存

AI 缓存策略：精确缓存 + 语义缓存，省钱又提速

重复问题反复调 API 太浪费，双层缓存方案帮你省 30%~70% 成本

arrow_forward

10.

FEB 10, 2026 Token上下文管理

Token 计算与上下文窗口管理实战

Token 精确计算、成本预估、四种上下文裁剪策略，附即插即用中间件

arrow_forward

11.

FEB 28, 2026 微调LoRA

大模型微调实战：从 LoRA 到部署上线的完整方案

Prompt 调不动了怎么办？QLoRA 低成本微调 + GGUF 部署完整流程

arrow_forward

12.

MAR 07, 2026 CursorSkill

Cursor Skill 开发：把工程经验变成 AI 可执行的技能

团队部署流程、代码规范还在口口相传？把它们写成 Skill，AI 自动标准化执行

arrow_forward

13.

MAR 14, 2026 Harness EngineeringAI 工程效能

Harness Engineering：从"AI 辅助"到"驾驭 AI"的工程效能革命

别只让 AI 帮你补全代码了。Rule+Skill+Hook+Subagent 四层体系，系统化驾驭 AI 做工程

arrow_forward

14.

APR 28, 2026 AI 开发规范AGENTS.md

AI 开发规范：让 AI 在真实项目里稳定工作的工程体系

基于两个真实项目（conor-site + ai-memory），拆解五层约束体系：AGENTS.md 入职文件、文档基建、Cursor Rules、Feature Gate、Spike-First

arrow_forward

Related Series

初级全栈 → 高级专栏 → 开源项目 →