01 · 模块二:四章核心收获
在做练习之前,先快速回顾一下这四章的核心结论。这不是要你重读,而是帮你把这些知识放在同一个框架里理解。
Ch11
温度与创造性
Temperature 控制随机性。精确任务用低温(0–0.3),创意任务用高温(0.7–1.2)。聊天界面无法直接调,但提示词可以间接影响。
Ch12
幻觉深度解剖
幻觉不是 AI 在撒谎,是下一个 token 预测机制的副产品。减少幻觉:提供来源、追问置信度、使用 RAG、交叉验证。
Ch13
提示词认知科学
好提示词的解剖:角色+背景+任务+约束+格式。Chain of Thought 提升推理,Context Engineering 决定 AI 的整体工作质量。
Ch14
质量评估框架
CARLA 框架:准确性、对齐性、推理性、局限性、可用性。识别 7 个高风险信号。追问要针对具体维度,不要只说"重新写一下"。
02 · 模块二知识地图
点击任意节点,查看每个概念的核心要点。
👆 点击节点查看核心要点
每个节点对应模块二的核心概念,点击查看要点说明。
03 · 综合练习任务单
这是本模块的实战练习。每完成一项,点击打勾。总进度会在下方实时更新。
模块二练习总进度
0%
已完成 0 / 16 项任务
🌡️ 练习一:驾驭不确定性
温度与创造性(Ch11)
-
✓
选一个需要确定性答案的任务(如总结会议记录、翻译合同),给 AI 发送,在提示词中加入"请给出最准确的单一答案"。
-
✓
用同样的话题,发一个创意类任务(如"给这个产品写 5 种不同风格的文案"),观察输出多样性的变化。
-
✓
找到你工作中 3 个常用的 AI 任务,判断每个应该偏"低温"还是"高温",写下你的理由。
-
✓
(进阶)如果你有 API 访问权限:用同一个提示词,分别设置 temperature=0.1 和 temperature=1.2,对比输出差异。
👁️ 练习二:识别幻觉
幻觉深度解剖(Ch12)
-
✓
让 AI 介绍你所在行业的某个细分领域(你比较熟悉的),找出至少 1 个你能确认是错的细节。
-
✓
让 AI 给出一个行业报告中的具体数字(如"中国某行业的市场规模"),然后用搜索引擎核实这个数字,记录差异。
-
✓
提问一个关于 2025 年之后事件的问题,观察 AI 如何处理它的知识截止限制——它会承认不确定还是"编"?
-
✓
对一个 AI 输出追问:"你对这个回答有多大把握?有哪些部分你不确定?"观察它的回应,判断它的自我认知是否准确。
✍️ 练习三:解剖和重构你的提示词
提示词的认知科学(Ch13)
-
✓
翻出你最近发给 AI 的一个提示词,用五要素(角色+背景+任务+约束+格式)分析它——缺哪几个?
-
✓
把那个提示词改写成完整的五要素版本,发给 AI,对比两次回答的质量差异。
-
✓
选一个复杂的推理问题,先问一次"直接给答案",再问一次"先一步步分析,再给出答案",观察 Chain of Thought 的效果。
-
✓
为你工作中最常用的 AI 任务写一个"可复用提示词模板",包含所有五要素,存成随时可以调用的格式。
🧪 练习四:质量评估实战
AI 输出质量的评估框架(Ch14)
-
✓
让 AI 回答一个你工作中真实的分析类问题,用 CARLA 框架逐项打分(用 Ch14 的评分器)。
-
✓
找到那次输出中得分最低的维度,根据"精准追问"模板写一个追问,发送后对比前后两次输出。
-
✓
在一周内,对至少 3 个不同类型的 AI 输出(事实查询、分析、创意)各做一次 CARLA 评估,记录每次的主要发现。
-
✓
总结:你在这些输出中最常发现哪个维度的问题?(这是你使用 AI 时最需要注意的弱点)
04 · 模块二自测:8 道概念验证题
这不是考试——是帮你发现还没真正理解的部分。点击选项,立刻看到解释。
05 · 模块总结:写给自己的备忘录
完成这个模块,花 5 分钟回答这些问题。写下来,比只在脑子里想更有用。
🤔 在你的实际工作中,这四章里哪个知识点对你最有价值?为什么?
0 字
⚠️ 你之前在使用 AI 时,有没有因为没有这些知识而踩过坑?
0 字
🎯 从今天开始,你打算改变哪一个使用 AI 的具体习惯?
0 字
模块二完成!你已经从"知道 AI 怎么运转"(模块一)升级到了"知道如何驾驭 AI 输出质量"(模块二)。下一步:模块三,讲真实的人机协作方式——在工作、学习、创业中,AI 如何从工具变成搭档。