T13 · AI官方文档导航 · AI原住民养成手册

01 · 为什么要读官方文档

本书主体的Ch51讨论了"前沿判断"的方法：如何在AI快速迭代的时代保持判断的清晰度。关键一条就是尽量去官方信息源。

二手解读总是有损耗的。一篇博客文章改写了官方文档的内容，一条微博总结了博客的观点，一个视频演绎了微博的表述。每一层转述，都在损失细节、引入偏见、增加过时的风险。

当你需要做一个真正基于AI能力的决策时——要不要用某个API、该选哪个模型、能否在生产环境使用某个特性——你需要的不是"有人说"，而是官方直言。

这一章就是一份导航。我列出了全球主要AI厂商的文档入口、关键页面、以及如何快速从官方文档中提取对你有用的信息。

核心洞察：官方文档是AI厂商对产品最坦诚的沟通。定价、限制、最佳实践、已知问题——所有的真相都在里面。只是绝大多数人没有养成阅读的习惯。

02 · Anthropic（Claude）文档导航

Anthropic的文档体系相对清晰，分为几个明确的模块。

官方文档首页

必读

Anthropic官方文档的入口。界面清晰，分为API文档、指南、示例代码三个区域。

docs.anthropic.com

API

API 参考文档

编程必读

所有API端点的完整说明，包括请求参数、响应格式、错误码。这是你用代码调用Claude的核心参考。

docs.anthropic.com/reference

Anthropic Cookbook

实战参考

官方提供的代码示例库。包含提示词工程、文件处理、多轮对话、流式输出等常见场景的完整代码。

github.com/anthropics/cookbook

三个必读页面（优先级顺序）

① Models & Pricing

了解当前可用的模型版本、成本价格、token成本计算、rate limits等关键信息。这决定了你的整体成本和性能预期。

② Prompt Caching & Context Windows

了解Claude支持的最大上下文窗口、token计费方式、缓存机制。这关系到你能否处理长文档和节省成本。

③ Changelog

追踪最新的模型更新、API改进、已知问题。每个月阅读一遍，可以及时了解产品演进方向。

03 · OpenAI（GPT/ChatGPT）文档导航

OpenAI的文档最为庞大，按模型和应用分得很细。新手容易迷路，建议先从三个核心页面开始。

OAI

OpenAI官方文档

必读

包含所有产品线的文档入口：ChatGPT、GPT-4/4o、Assistants、Fine-tuning等。按用途分类，较容易找到需要的内容。

platform.openai.com/docs

API

Chat API 参考

编程必读

Chat Completions API的完整文档。包括模型选择、参数调优、流式响应、function calling等。

platform.openai.com/docs/api-reference

AGT

Assistants API & Agent 指南

进阶必读

构建AI Agent的官方指南。包括Assistant对象、Tools/Function Calling、长期对话管理、文件处理等。

Assistants API

04 · Google（Gemini）文档导航

Google的AI文档按产品线分为Gemini API、Vertex AI、AI Studio三块。新用户建议从Gemini API开始。

Google AI Studio & Gemini API

快速开始

无需API密钥即可在网页端尝试Gemini。Gemini API是Google的主力API服务，性价比不错。

Google AI Studio 在线体验

Google AI 开发者文档

API

Gemini API 参考

编程必读

完整的API参考，包括text/image/video处理、stream响应、embedding、token计数等功能。

ai.google.dev/api

Vertex AI（企业级）

企业用户

Google Cloud上的企业级AI平台。包括微调、部署、监控、审计等功能。如果你在Google Cloud上有项目，这是官方推荐方案。

cloud.google.com/vertex-ai

05 · 中国厂商文档导航

国内主要有五家：字节跳动（豆包）、百度（文心）、阿里（通义）、月之暗面（Kimi）、深度求索（DeepSeek）。各有特色。

豆包

字节跳动 · 豆包 / Doubao

06 · 开源模型与Meta Llama

如果你想自己部署模型，或者想用完全开源的方案，看这一部分。

LLAMA

Meta · Llama 开源模型

自建推荐

Meta开源的Llama系列。Llama 3.3 405B是性价比最高的开源大模型。可以在自己的服务器部署，完全可控。

Llama官网

HuggingFace模型库

GitHub代码仓库

MIX

Mistral AI · 高效开源模型

轻量推荐

Mistral是法国创业公司。他们的模型相对较小但高效。8B、7B版本可以在本地运行。如果想要轻量化方案，很值得看。

Mistral官网

HuggingFace模型库

Mistral API（付费托管）

07 · "15分钟/周AI前沿速览"的阅读清单

养成每周快速扫一遍官方文档更新的习惯，是保持前沿判断力的最小成本方案。具体怎么做？

第一步：建立RSS订阅或书签文件夹

Anthropic 官方博客

https://www.anthropic.com/research/publications — Anthropic每月发布2-3篇重要研究，涉及安全、能力演进等。是了解Claude最新方向的唯一源头。

OpenAI 官方博客

https://openai.com/blog/ — 新模型发布、能力更新、安全进展。GPT世界的所有重大动向都会先发布在这里。

Google AI Blog

https://ai.googleblog.com/ — Google的研究方向、Gemini进展、多模态能力更新。

Changelog 汇总

把各厂商的Changelog页面加入书签，每周一扫。5分钟能掌握所有API变化。

第二步：建立一个"关键概念"文件

每当看到官方文档中的新概念、新参数、新限制时，记录在一个本地文件或wiki中。包括：

新模型发布：模型名称、发布时间、主要优化方向、价格
API变更：新增的参数、deprecated的字段、性能改进
限制更新：速率限制、token成本变化、地域可用性
已知问题：稳定性问题、特定场景下的行为异常

第三步：制定"遇到问题时的查阅流程"

① 我的代码出问题了 → 先查官方API参考
② 不确定一个参数的效果 → 查官方示例代码或Cookbook
③ 想知道是否支持某个特性 → 查官方Changelog或FAQ
④ 遇到模型的诡异表现 → 查官方博客的known issues

08 · 文档阅读技巧

官方文档通常很长，很多信息对你的当前任务无关。如何快速提取有用的信息？

快速扫描三层次

第一遍：目录 → 关键词搜索

打开文档的目录，用Ctrl+F搜索你关心的关键词（比如"pricing", "limit", "error", "streaming"）。一般能在1-2分钟内定位到相关章节。

第二遍：代码示例优先

大多数文档的关键信息都体现在代码示例里。先看例子，再读旁边的解释。这样学得快得多。

第三遍：参数表详读

如果还有疑问，才去仔细读参数说明表。特别是那些有注释"required"、"default"、"range"的参数，这些决定了你能怎么用。

关键词清单

每次进入新文档时，都用这些关键词快速扫一遍：

"limitations"：官方声明的已知限制
"rate limit"：速率限制和配额
"error"：常见错误的解决方案
"beta" / "experimental"：试验特性（可能不稳定）
"deprecated"：即将下线的API（要迁移）
"best practice"：官方推荐的最佳实践
"example"：代码示例（最有价值）

文档阅读的三个陷阱

陷阱1：文档本身可能是过时的。总是看publication date，选最新版本。
陷阱2：某些"最佳实践"是针对特定使用场景的，不一定适用于你。
陷阱3：有些限制是可以通过申请豁免的。不要假设所有限制都绝对。

注意：本章列出的所有链接截至2026年3月。各厂商的文档结构会定期调整，如果链接失效，请到官方网站的"文档"或"开发者"页面寻找最新位置。建议把这些官方入口加入浏览器书签，而不是靠链接。

← 上一章 T12 · 提示词库 📖 目录返回目录下一章 → T14 · Harness Engineering实战