Section 01 · AI 辅助研究的核心原理
很多人觉得研究工作 AI 帮不了忙,因为它会 "编造数据"。但这个观点有一个根本的误解:AI 不是替你做研究,而是加速研究过程中的每一个环节。
研究工作的标准流程
无论是市场调研、竞品分析还是数据整理,都可以分成 4 个阶段:
研究流程的 4 个阶段
① 信息收集
找到可靠的数据源(官方报告、论文、新闻、用户反馈等)。这是基础,决定了后续分析的质量。
② 整理分类
把零散的信息按照某种结构(维度、时间线、分类)归类,让混乱变有序。
③ 深度分析
从数据中发现模式、趋势、异常和关键驱动因素。这是最耗脑力的部分。
④ 输出结论
用清晰的语言、图表、推荐,把分析结果呈现出来。
AI 在每一步的角色不同:
• 信息收集:AI 无法主动上网搜索(除非配合搜索工具),但可以帮你组织搜索策略。比如 "我要研究 AI 大模型领域,有哪些必看的信息源和维度?" AI 可以给你一份完整的清单。
• 整理分类:AI 擅长。把你收集的 Excel 数据、竞品信息、用户反馈这些原始材料,让 AI 按照你想要的结构重组。
• 深度分析:AI 半擅长。AI 可以快速给出模式识别("这些企业的共同特点是")、对标建议("对标友商,我们的差距在"),但你需要判断这些分析是否在理。
• 输出结论:AI 非常擅长。给定数据和视角,AI 可以快速整理成逻辑清晰的报告。
核心原则
AI 的作用是 "加速" 和 "补充",而不是 "替代"。你的判断力、领域知识、审美标准始终是决定性的。
Section 02 · 市场调研报告完整流程
第一步:明确调研目标和维度
不要漫无目的地让 AI 生成报告。先明确你要了解什么。
PROMPT
我需要做一份关于"宠物食品行业"的市场调研报告。
调研目标:我们是一家初创企业,想进入这个市场,需要理解现状和机会。
希望覆盖的维度:
1. 市场规模和增长趋势(过去 5 年和预测未来 3 年)
2. 主要参与者和竞争格局(头部 5-10 个品牌分析)
3. 消费者需求和痛点变化
4. 细分市场机会(高端、健康向、小众等)
5. 渠道分析(线上 vs 线下,主要平台)
我能提供的资料:
- 我自己收集的 5 份行业报告链接
- 3 个头部品牌的官网信息
- 10 个用户访谈笔记
- 某电商平台的销售数据节选
第二步:让 AI 生成结构化框架
PROMPT
基于上面的背景,请为我生成一份市场调研报告的框架(不用写内容,只要目录结构和每部分 2-3 句的说明)。
框架要求:
- 执行摘要(管理层需要的关键数字和结论)
- 市场概览(规模、增长、趋势)
- 竞争格局(主要玩家分析)
- 消费者分析(谁在买,买什么,为什么)
- 机会和风险(细分机会、进入壁垒)
- 建议(基于以上,我们应该如何定位)
第三步:关键数据部分,AI 帮你整理(人工验证)
PROMPT
我提供以下原始数据,请帮我结构化整理成一个表格:
数据输入:
[你从各个来源收集的原始数据,比如"2020 年市场规模 500 亿,2021 年 650 亿……"]
整理要求:
- 列:年份、市场规模(亿元)、增长率、数据来源
- 将数据按时间排序
- 标注哪些是官方数据,哪些是第三方估算
- 如果数据冲突,列出不同来源的版本
完成后我会:逐个验证数据来源,确保准确性
第四步:竞争分析部分
PROMPT
基于以下关于头部 5 个宠物食品品牌的信息,生成一份对标分析表格。
维度:
- 品牌、成立年份、融资阶段
- 主要产品线(干粮、湿粮、保健品等)
- 定位和价格区间
- 主要销售渠道
- 已知的市场占有率或销售额
- 差异化特点(比如"有机""科学营养""社群运营")
输出格式:一个 6 行 8 列的表格,便于对比
第五步:合并和输出最终报告
现在你有了框架、数据表格、竞争分析。把这些拼在一起,让 AI 写成连贯的报告文本。
PROMPT
根据以下信息,生成一份完整的市场调研报告文本。
[粘贴框架 + 数据表格 + 竞争分析表]
报告要求:
- 字数:3000-4000 字
- 在数据表格之前有 1-2 段说明文字
- 关键数字要有具体来源("根据 XXX 报告,2022 年市场规模为……")
- 竞争分析后加 1 段"总结对手特点"
- 最后部分是"我们的机会窗口"(3-4 个可行的切入角度)
- 每个部分后加"进一步深化的方向"(如果还需要更多信息)
效率对比
传统做法(你手工整理数据,写报告):15-20 小时。AI 协作做法(AI 帮整理和初稿,人工验证和修改):5-7 小时。提升 60-70%。
Section 03 · 竞品分析深度指南
五维竞品分析框架
竞品分析最常见的方式是 SWOT,但更实用的框架是"五维分析":战略定位、产品能力、市场表现、用户体验、团队实力。
五维竞品分析框架
战略定位
竞手目标用户、主打卖点、长期方向。理解他们想成为什么。
产品能力
核心功能、功能深度、特色功能、迭代速度。客观的产品审视。
市场表现
融资情况、团队规模、营收规模、市场占有率、增长趋势。
用户体验
用户评论情感、常见投诉、用户粘性指标、满意度。
生态和拓展
合作伙伴、营销策略、社群运营、生态野心。
提示词:让 AI 协助竞品分析
PROMPT
请基于以下关于竞品 X 的信息,生成一份五维分析报告。
我提供的竞品信息:
[官网首页截图描述、融资新闻、用户评论摘要、产品演示笔记等]
分析维度:
1. 战略定位:他们的目标用户是谁?核心卖点是什么?
2. 产品能力:3-5 个核心功能描述、差异化特性、缺失的功能
3. 市场表现:融资阶段、团队规模、估计的市场占有率
4. 用户体验:用户反馈的 Top 3 优点、Top 3 痛点
5. 生态拓展:他们在做什么市场开拓?有哪些合作?
输出格式:5 个小节,每节 300-400 字,最后加一段"对我们的启示"
功能对比矩阵(数据驱动)
如果你要和多个竞手对标,生成对比矩阵会很有帮助。
PROMPT
基于以下竞品信息,生成一份功能对比矩阵。
竞品:A(我们)、B、C、D
对比维度(15-20 个):
产品层面:核心功能、高级功能、AI 能力、定制化、集成能力
商业层面:价格、付费模式、免费额度、企业版
用户体验:界面易用性、学习成本、文档完整性
市场信号:融资轮数、用户规模、增长速度
矩阵填法:
- 有该功能:✓
- 部分有:◐
- 没有:✗
- 未知:?
关键提示
竞品分析矩阵最容易出现的问题是:信息过时。尤其是融资、团队规模这类数据,AI 的训练数据可能是 6 个月前的。一定要自己核实最关键的数据点。
Section 04 · 数据清洗与整理
场景:你有一个混乱的 Excel 文件,需要整理
实际工作中经常遇到这种情况:收集了很多原始数据(用户信息、交易记录、竞品数据等),格式不统一、有缺失值、有脏数据。
PROMPT
我有一个 Excel 文件,包含 500 条用户记录,需要清洗和标准化。
现有问题:
- "加入日期"列格式混乱(2022-01-01、2022/01/01、1/1/2022 混在一起)
- "城市"列有拼写错误("北京"被写成"北京市""北京市区""BJ" 等)
- "消费金额"列有文本符号("¥100""100 元""100.00CNY")
- 有 30 条记录缺少手机号
- 某些字段有前后空格
清洗要求:
1. 日期统一为 YYYY-MM-DD 格式
2. 城市字段去重和标准化(给我一个城市映射表,"北京市"→ "北京")
3. 消费金额提取数字,统一为整数
4. 标记缺失值(用 N/A)
5. 删除全重复行
6. 给我一份清洗日志(删除了多少行,修改了多少条记录)
AI 如何帮助:给出数据处理建议
如果你用的是 Excel,AI 可以教你用公式或 VBA 脚本。如果你用的是 Python,AI 可以给出 pandas 代码。但核心是:你负责理解和检查,AI 负责提供方案。
PROMPT
我用 Python 处理数据,以下是我的原始数据结构:
```
import pandas as pd
df = pd.read_excel('users.xlsx')
# df 有 500 行,列名:id, name, city, phone, signup_date, spend
```
需要的处理步骤:
1. 将 signup_date 转换为 datetime 格式
2. 城市名称标准化(多个变体映射到标准城市)
3. 删除手机号缺失的行
4. spend 列中去掉非数字字符,转为 float
5. 检查重复行
请给我:
- 完整的清洗代码
- 每一步的注释说明
- 清洗前后的数据统计(行数、缺失值数量变化)
异常值识别
数据清洗不是只删废数据,还要找异常——可能是 bug,也可能是有价值的信号。
PROMPT
我有 1000 条交易记录,金额分布如下:
平均:1500 元,中位数:800 元,最大:500,000 元
需要:
1. 识别离群值(outliers):用 IQR 方法标记超出合理范围的金额
2. 检查高金额订单(>50,000 元)的合理性:这些是真实订单还是数据错误?
3. 检查金额为 0 或负数的记录
4. 给我一份异常值清单,包括:订单 ID、金额、为什么异常
我的判断:高于 100,000 的可能是企业客户(合理),但 500,000 的那条需要人工审核
Section 05 · 研究结果的可靠性验证
AI 生成的结论,为什么要验证?
AI 的输出看起来很有说服力,但可能存在 3 个问题:
1. 数据陈旧:AI 的训练数据可能是 6-12 个月前的,市场变化快的领域这是致命的。
2. 逻辑跳跃:AI 可能从有限的信息推断出过度概括的结论。
3. 混淆或编造:AI 有时候分不清"我知道"和"我假设",会把假设当事实说出来。
验证方法:交叉核实(Triangulation)
简单来说,重要的数据和结论,要从至少 3 个独立的来源验证。
四步验证流程
第 1 步:AI 输出初步结论
比如 "中国宠物食品市场 2023 年规模约 800 亿元,年均增速 15%"
第 2 步:列出数据来源
AI 会说"根据 XXX 报告"或"基于市场估算"。追问:"你的数据来自哪里?你是从哪篇文章读到的?"
第 3 步:自己验证来源
去官网、论文数据库、新闻报道中找同样的数据。看看是否一致。
第 4 步:寻找反面意见
有没有报告给出不同的数据?有没有专家持不同观点?记录分歧。
实操:Fact-check 提示词
PROMPT
请检查以下研究结论的可靠性,并标注你的确信度。
我的结论:
"AI 芯片领域,英伟达占全球市场份额的 80%,预计 2025 年会被 AMD 和其他厂商蚕食到 70%。"
验证要求:
1. 这个"80%"的数据来自哪里?有多个来源吗?
2. "蚕食到 70%"的预测基于什么?是市场调研机构的预测还是你推导的?
3. 列出你知道的关于这个数据的不确定因素
4. 用 1-5 分标注你对这个结论的信心度(5 分最高)
你的回答格式:
[数据] → [来源] → [确认度] → [风险说明]
常见的红旗信号(别相信这些)
当 AI 说出这些话时,要特别警惕:
• "据说……" "有人说……" "通常认为……"(没有具体来源)
• "基于我的理解……" "可以推断……"(这是推测,不是事实)
• 给出的数字太圆整("100 亿""50%""恰好 10 倍")(可能是粗略估算)
• 多个相近的数字选择中,选最具说服力那个(selection bias)
Section 06 · 从数据到洞察
为什么有的研究报告很无聊?
因为它只是数据的堆砌,而不是洞察。
数据报告说:"2023 年 90 后女性在美妆品类的消费额增长 23%"。
洞察说:"90 后女性的美妆消费增速超过整体市场,原因是这个代际更接受成分党和小众品牌,推动了高客单价产品的销售。这意味着传统大品牌需要重新审视他们的营销策略。"
前者是信息,后者才是洞察。AI 可以帮你从数据生成洞察,但前提是你给它足够的上下文。
引导 AI 提炼洞察的提示词
PROMPT
我给你一份竞品分析数据,请帮我从中提炼出 3-5 个关键洞察。
数据:
[粘贴你的竞品对比表、用户评价数据、市场数据等]
洞察提炼的要求:
1. 每个洞察要指出"是什么" + "为什么" + "意味着什么"
不要只说"A 的功能更多",要说"A 的功能更多,因为他们的用户是专业人士,需要深度工具,这意味着……"
2. 要有数据支撑(指出来自哪个数据点)
3. 最后加一句"这对我们的启示"
我特别关心的问题:
- 为什么某个竞手增长更快?
- 用户的痛点有什么演变?
- 市场的未来方向是什么?
洞察的三个层次
从数据到洞察的三个层次
L1 描述
"A 功能的用户评分是 4.8,B 功能是 4.2"。这是事实,不是洞察。
L2 解释
"A 功能评分更高,因为它的设计更直观"。这开始解释 why,但还很浅。
L3 启示
"A 功能评分高意味着用户更看重'易用性'而非'功能全面',这启示我们下一个版本应该优先改进核心路径的流畅度"。这才是真正的洞察。
AI 可以帮你从 L1 到 L2,但 L3 需要你的行业知识和业务直觉。
Section 07 · 常见坑点与解决方案
坑点 1:过度依赖 AI 生成的数据
❌ 常见错误
让 AI 直接生成一份报告,里面的数字全来自 AI 的"知识",没有人工验证,最后报告被驳回。
✓ 正确做法
所有核心数字都要来自你手工收集、验证的来源。AI 只是帮你整理和分析这些数据。
坑点 2:报告框架过于通用
如果让 AI 直接生成报告,它会用最标准、最通用的框架(市场规模 → 竞争格局 → 趋势预测)。这样的报告看起来没有洞察力。
解决方案
自己设计报告框架,围绕你的核心问题。比如你想进入市场,就按照"市场是否友好 → 有利因素 → 风险 → 我的进入策略"来组织,而不是照搬通用框架。
坑点 3:数据冲突时的判断
不同来源的数据有时候会自相矛盾。AI 会列出所有版本,但无法判断哪个更准确。这需要你的判断。
PROMPT
我发现关于"中国在线教育市场规模"的数据冲突:
- 来源 A(2023 年报告):2500 亿元
- 来源 B(2023 年报告):3200 亿元
- 来源 C(2024 年报告):2100 亿元
我需要:
1. 分析为什么会有这么大的差异
2. 判断哪个来源最可靠(提示:A 是教育部,B 是咨询公司,C 是某个平台自己的估算)
3. 如果非要选一个,我应该用哪个?
线索:A 的数据可能是狭义的"线上教育",不包含 AI 辅导工具和短视频教育内容。
坑点 4:分析深度不够
警惕这个现象
AI 生成的报告,句式通常是 "现象 + 原因(推测)",但缺少实证。比如"增长快是因为用户需求增加"——这很可能是对的,但有没有数据证明?有没有找到增长驱动因素中最关键的那个?
解决方法:在提示词里明确要求"为每个观点提供 3 个以上的支撑证据"。
实战练习
选择一个你关心的行业或产品领域,按以下流程完成一份迷你市场调研:
任务:用 AI 完成一份 2000 字的市场调研报告
1. 信息收集(1 小时)
找 3-5 份行业报告或新闻(官网、新闻稿、行业媒体),记录链接和关键数据点。
2. 框架设计(0.5 小时)
不用 AI 默认框架,自己设计 4-5 个最关键的节点,围绕一个核心问题。
3. 数据整理(1 小时)
用本章的提示词模板,让 AI 帮你整理、表格化这些数据。
4. 分析和洞察(1.5 小时)
用竞品分析或趋势分析提示词,生成初稿。
5. 验证和迭代(1 小时)
逐个核实关键数据,修改过度推断的部分,确保逻辑清晰。
产出物: 一份完整的报告 + 一份"数据来源验证清单"(说明哪些数据你已经验证过)。