工具手册 T13 · 工具选择

AI官方文档导航

你的第一手信息源——绕过二手解读,直接获取官方真相

01 · 为什么要读官方文档

本书主体的Ch51讨论了"前沿判断"的方法:如何在AI快速迭代的时代保持判断的清晰度。关键一条就是尽量去官方信息源

二手解读总是有损耗的。一篇博客文章改写了官方文档的内容,一条微博总结了博客的观点,一个视频演绎了微博的表述。每一层转述,都在损失细节、引入偏见、增加过时的风险。

当你需要做一个真正基于AI能力的决策时——要不要用某个API、该选哪个模型、能否在生产环境使用某个特性——你需要的不是"有人说",而是官方直言。

这一章就是一份导航。我列出了全球主要AI厂商的文档入口、关键页面、以及如何快速从官方文档中提取对你有用的信息。

核心洞察:官方文档是AI厂商对产品最坦诚的沟通。定价、限制、最佳实践、已知问题——所有的真相都在里面。只是绝大多数人没有养成阅读的习惯。

02 · Anthropic(Claude)文档导航

Anthropic的文档体系相对清晰,分为几个明确的模块。

官方文档首页
必读
Anthropic官方文档的入口。界面清晰,分为API文档、指南、示例代码三个区域。
API 参考文档
编程必读
所有API端点的完整说明,包括请求参数、响应格式、错误码。这是你用代码调用Claude的核心参考。
Anthropic Cookbook
实战参考
官方提供的代码示例库。包含提示词工程、文件处理、多轮对话、流式输出等常见场景的完整代码。

三个必读页面(优先级顺序)

① Models & Pricing
了解当前可用的模型版本、成本价格、token成本计算、rate limits等关键信息。这决定了你的整体成本和性能预期。
② Prompt Caching & Context Windows
了解Claude支持的最大上下文窗口、token计费方式、缓存机制。这关系到你能否处理长文档和节省成本。
③ Changelog
追踪最新的模型更新、API改进、已知问题。每个月阅读一遍,可以及时了解产品演进方向。

03 · OpenAI(GPT/ChatGPT)文档导航

OpenAI的文档最为庞大,按模型和应用分得很细。新手容易迷路,建议先从三个核心页面开始。

OpenAI官方文档
必读
包含所有产品线的文档入口:ChatGPT、GPT-4/4o、Assistants、Fine-tuning等。按用途分类,较容易找到需要的内容。
Chat API 参考
编程必读
Chat Completions API的完整文档。包括模型选择、参数调优、流式响应、function calling等。
Assistants API & Agent 指南
进阶必读
构建AI Agent的官方指南。包括Assistant对象、Tools/Function Calling、长期对话管理、文件处理等。

04 · Google(Gemini)文档导航

Google的AI文档按产品线分为Gemini API、Vertex AI、AI Studio三块。新用户建议从Gemini API开始。

Google AI Studio & Gemini API
快速开始
无需API密钥即可在网页端尝试Gemini。Gemini API是Google的主力API服务,性价比不错。
Gemini API 参考
编程必读
完整的API参考,包括text/image/video处理、stream响应、embedding、token计数等功能。
Vertex AI(企业级)
企业用户
Google Cloud上的企业级AI平台。包括微调、部署、监控、审计等功能。如果你在Google Cloud上有项目,这是官方推荐方案。

05 · 中国厂商文档导航

国内主要有五家:字节跳动(豆包)、百度(文心)、阿里(通义)、月之暗面(Kimi)、深度求索(DeepSeek)。各有特色。

字节跳动 · 豆包 / Doubao
推荐
字节跳动旗下大模型。API成本低,响应快,支持文本/图像/视频理解。对标Claude和GPT-4。
百度 · 文心大模型
传统优势
百度的旗舰大模型。在搜索、文档理解、对话上积累深。性价比中等,适合搜索增强类应用。
阿里 · 通义千问
综合强
阿里云的通义系列。在代码生成、多模态上能力不错。API稳定性有保障。适合集成在企业系统。
月之暗面 · Kimi
长文档之王
上下文窗口最大(200K tokens)。特别适合处理长文档、论文、合同。用户体验流畅。
深度求索 · DeepSeek
开源友好
国内新兴玩家。开源模型性能不错,API成本极低。如果预算有限,值得尝试。

06 · 开源模型与Meta Llama

如果你想自己部署模型,或者想用完全开源的方案,看这一部分。

Meta · Llama 开源模型
自建推荐
Meta开源的Llama系列。Llama 3.3 405B是性价比最高的开源大模型。可以在自己的服务器部署,完全可控。
Mistral AI · 高效开源模型
轻量推荐
Mistral是法国创业公司。他们的模型相对较小但高效。8B、7B版本可以在本地运行。如果想要轻量化方案,很值得看。

07 · "15分钟/周AI前沿速览"的阅读清单

养成每周快速扫一遍官方文档更新的习惯,是保持前沿判断力的最小成本方案。具体怎么做?

第一步:建立RSS订阅或书签文件夹

Anthropic 官方博客
https://www.anthropic.com/research/publications — Anthropic每月发布2-3篇重要研究,涉及安全、能力演进等。是了解Claude最新方向的唯一源头。
OpenAI 官方博客
https://openai.com/blog/ — 新模型发布、能力更新、安全进展。GPT世界的所有重大动向都会先发布在这里。
Google AI Blog
https://ai.googleblog.com/ — Google的研究方向、Gemini进展、多模态能力更新。
Changelog 汇总
把各厂商的Changelog页面加入书签,每周一扫。5分钟能掌握所有API变化。

第二步:建立一个"关键概念"文件

每当看到官方文档中的新概念、新参数、新限制时,记录在一个本地文件或wiki中。包括:

第三步:制定"遇到问题时的查阅流程"

08 · 文档阅读技巧

官方文档通常很长,很多信息对你的当前任务无关。如何快速提取有用的信息?

快速扫描三层次

第一遍:目录 → 关键词搜索
打开文档的目录,用Ctrl+F搜索你关心的关键词(比如"pricing", "limit", "error", "streaming")。一般能在1-2分钟内定位到相关章节。
第二遍:代码示例优先
大多数文档的关键信息都体现在代码示例里。先看例子,再读旁边的解释。这样学得快得多。
第三遍:参数表详读
如果还有疑问,才去仔细读参数说明表。特别是那些有注释"required"、"default"、"range"的参数,这些决定了你能怎么用。

关键词清单

每次进入新文档时,都用这些关键词快速扫一遍:

文档阅读的三个陷阱

注意:本章列出的所有链接截至2026年3月。各厂商的文档结构会定期调整,如果链接失效,请到官方网站的"文档"或"开发者"页面寻找最新位置。建议把这些官方入口加入浏览器书签,而不是靠链接。