All tags

AI

9 posts

/17 min read/AI

Harness Engineering 实战:给 AI 编码代理装上缰绳系统

当 AI 代理写代码的速度远超人类审查速度时,你需要的不是更好的 prompt,而是一套完整的缰绳系统。本文记录了在真实全栈项目中落地 Harness Engineering 的完整过程——从引入 Ruff、重构 CLAUDE.md、到架构约束脚本和 CI 门禁,最终用 Superpowers 补全工作流层。

/16 min read/AI

RAG vs Fine-tuning:大模型"学知识"的两条路,该选哪条?

让大模型掌握你的专属知识,RAG 和 Fine-tuning 是两条截然不同的路。一篇文章讲清楚两者的原理、优劣、成本和适用场景,帮你做出正确选择。

/18 min read/AI

AI Agent 是怎么工作的?——从 Claude Code 看 Agent 的思考与行动

你每天在用的 Claude Code 就是一个 AI Agent。它是怎么思考、规划、调用工具、一步步完成任务的?从 ReAct 框架到 Agent Loop,带你看透 AI Agent 的工作原理。

/16 min read/AI

Agent Skills:给 AI 写一本"入职培训手册"

Skills 是 AI Agent 的"入职培训手册"——用一份 SKILL.md 文件教会 AI 如何完成特定类型的任务。从原理到实战,带你搞懂怎么设计和使用 Agent Skills。

/17 min read/AI

MCP 是什么?——AI 时代的"USB-C"统一接口协议

从充电线乱象到 USB-C 统一,MCP(Model Context Protocol)正在为 AI 工具生态做同样的事。一文搞懂 MCP 的原理、架构、生态和实践。

/19 min read/AI

DeepSeek 震动华尔街:一场改写 AI 格局的"春节风暴"

2025 年春节前夕,DeepSeek 以 600 万美元训练成本打造出媲美 GPT-4 的模型,引发 NVIDIA 单日市值蒸发 5900 亿美元。这场风暴背后的技术创新、市场逻辑与深远影响。

/21 min read/AI

一篇论文定义一个时代:Transformer 与注意力机制全解析

从零开始理解 Google 的"Attention Is All You Need"论文,看 Transformer 架构如何用"注意力"取代了传统模型,成为当今 AI 时代的基石。

/18 min read/AI

大模型是怎么"看懂"图片的?——多模态视觉理解全解析

从 Vision Transformer 的切片机制,到视觉与语言的桥梁,再到不同类型图片的识别原理,全面解析多模态大模型的视觉理解能力。

/20 min read/AI

大模型时代:从概念到未来

从核心概念、工作原理、训练过程到 Transformer 架构和 MOE 混合专家模型,全面理解大语言模型。