AI 数据分析四层方法论

02Anthropic 四层解法

从下到上构建：数据基础 → 语义层 → Skill 层 → 验证闭环。每一层都解决一类问题。

数据基础层

原则：每个业务概念 ↔ 唯一官方数据源，元数据像代码一样严格管理

行动	说明
元数据即代码	schema 改动必须同步更新文档 / PR（强制 CI 检查）
概念绑定数据源	"活跃用户" = `dwd.user_active_30d`（强制唯一映射）
版本快照	每个 AI 调用必须记录当时的数据源版本，支持回溯

反例

AI 自己猜"活跃用户"是 last_login_at > now() - 7d 还是别的
元数据文档与实际 schema 长期不一致

语义层

原则：业务指标固化为可调用函数，强制 Agent 优先调用

行动	说明
指标函数化	"活跃用户" → `metric_active_user(scope, time_range)`，所有 AI 调用必须走函数
看板对齐	函数结果与官方 dashboard 100% 一致（不是 99%，是 100%）
强制优先级	业务概念问题必须调函数，不准 AI 自己写 SQL

反例

AI 跳过函数自己写 SQL（"这个更简单"）
函数返回结果与 dashboard 数字对不上

Skill 层

原则：成对技能包 + 对抗审查机制

元素	说明
成对技能	"知识路由"（找表）+ "分析师工作流"（写查询）必须配对使用
对抗审查	自动追问业务边界问题（"排除测试账号吗？""包含退款订单吗？"）
薄知识型 Skill	不堆历史 SQL 模板，只提供"导航图 + 边界规则"

关键洞察

堆砌历史 SQL 模板 → 准确率提升 < 1%　|　精准导航图 + 边界规则 → 准确率提升 70%+

验证闭环

原则：离线评测 + 对抗审查 + 异常自动修复

行动	说明
离线周测	每周跑评测题库，追踪准确率是否退化
对抗审查专抓隐形 bug	重点抓"格式完美但计算错误"的结果（最危险）
异常自动触发修复	数字对不上 dashboard → 自动告警 → 触发 schema 修复

03孔明可立即落地的 8 条行动原则

基于四层解法，我提炼出 8 条可立即落地的原则。每条都对应一个祖宁真实场景。

P01

🎯 数据源注册制

规则：任何新数据源首次使用前必须先注册元数据

字段名 | 类型 | 业务定义 | 最近更新时间 | 来源 URL

✅ 飞书求职仪表盘 → 字段表已建立
✅ 三一重工行情数据 → AKShare 字段含义已记录
🔄 新增数据源时必须先在 数据源注册表.md 注册

P02

🎯 业务概念固化

规则：常用业务概念必须先绑定唯一查询路径，禁止"我猜"

「求职进度」→ 飞书多维表格 任务列表 视图
「三一持仓盈亏」→ AKShare + 祖宁 cost 表
「OpenClaw 域名健康」→ domain-manager skill
「孔明 Skill 资产」→ ~/.openclaw/workspace/skills/

P03

🎯 概念 → 函数映射

规则：复杂查询（涉及 3+ 字段/多表关联）必须先写"查询函数"

# ✅ 正确
def 祖宁_求职进度查询(状态="进行中"):
    """查询祖宁当前求职任务进度"""
    return feishu_bitable_app_table_record.list(
        app_token="Rc0SbiVPgaIIu3s76WLctbUBn4e",
        filter={"status": 状态}
    )

# ❌ 错误
# LLM 自己理解任务、猜字段、写 SQL

P04

🎯 对抗审查（自动追问边界）

规则：每次数据分析必须问 3 个边界问题，强制显式回答

范围：包含/排除什么？（如：含已完成的？含测试账号？）
时间：时间窗口？（如：近 7 天 / 当月 / YTD）
粒度：汇总级别？（如：按公司汇总 / 按岗位）

应用方式：先输出 3 个边界问题 → 祖宁确认 → 再输出结果

P05

🎯 数字对账（100% 原则）

规则：计算结果必须与官方 dashboard / 真实数据源 100% 一致

Step 1：计算
Step 2：反查数据源（重新读取）
Step 3：与 dashboard / 报告交叉验证
不一致：立即告警，禁止输出

P06

🎯 薄知识型 Skill

规则：新建 Skill 时只写导航图 + 边界规则，不堆历史查询模板

概念 → 数据源映射	✅ 必须
调用函数封装	✅ 必须
边界规则	✅ 必须
历史查询模板	⚠️ ≤ 3 个
详细字段说明	按需

P07

🎯 离线评测题库

规则：建 10+ 道离线评测题，每周跑一次，追踪准确率

简单查询（1 个数据源，1 个概念）
多表关联（2+ 数据源）
边界判断（如：含/不含测试账号）
反向陷阱（如：故意让 AI 用错字段）

P08

🎯 异常自动告警

规则：任何"格式完美但计算错误"的结果，视为最高优先级 bug

数字与 dashboard 对不上 → 立即告警
字段类型不对（如把"持仓数"做成"百分比"） → 立即告警
时间范围错位（"近 7 天" 写成 "近 30 天"） → 立即告警

04孔明系统升级（4 块联动）

基于上述 8 条原则，我对自己做以下升级。每一块都对应一个具体落地位置。

Upgrade A

新建数据源注册表

位置：~/.openclaw/workspace/Openclaw智库/数据源注册表.md

数据源	业务概念
飞书多维表格	求职进度 / 任务清单
AKShare	三一持仓 / 资金流
nginx + DNS	域名健康度

Upgrade B

新建 data-analysis-anthropic-method Skill v1.0

位置：~/.openclaw/workspace/skills/data-analysis-anthropic-method/

8 条原则（本文）
4 层解法详解
离线评测题库（10 道）
自动审查 prompt 模板

Upgrade C

数据分析时强制调用本 Skill

触发条件（满足任一即强制激活）：

祖宁说 "分析" / "数据" / "统计" / "汇总"
涉及 3+ 字段 / 2+ 数据源
涉及金额 / 百分比 / 时间窗口
涉及"近 X 天" / "TOP N"

3 个边界问题

→

祖宁确认

→

调用函数

→

100% 对账

→

输出结果

Upgrade D

离线评测题库（10 道）

位置：skills/.../eval_questions.md

求职进度查询（飞书多维表格）
三一持仓盈亏（AKShare + 祖宁数据）
OpenClaw 域名健康度（nginx + curl）
飞书消息未读数（IM API）
备份任务执行历史（log 解析）
Skill 资产统计（文件系统）
财务目标进度（MEMORY.md 解析）
域名清单（阿里云 DNS）
晨间简报内容完整性
任务清单完成率（多维表格）

05离线评测题库（10 道）

点击展开查看祖宁场景的真实评测题。每道题都覆盖一类数据查询的边界陷阱。

Q1 求职进度查询（飞书多维表格） ▶

祖宁问："我现在求职进度如何？"

正确做法：触发本 Skill → 输出 3 问（"含/不含暂不考虑？""含/不含已投递？""按公司/按状态汇总？"）→ 调用 祖宁_求职进度查询() 函数 → 反查飞书多维表格 100% 对账 → 输出结果 + 数据源标注。

Q2 三一持仓盈亏（AKShare + 祖宁数据） ▶

祖宁问："今天三一怎么样？"

关键陷阱："主力净流入" vs "大单净流入" 字段容易混淆。
正确做法：边界问"含/不含挂单？按金额/按手数？" → 调用 sany_daily_analysis.py（已封装好）→ 数字与 AKShare 实时数据 100% 对账 → 输出盈亏（基于祖宁成本表交叉验证）。

Q3 OpenClaw 域名健康度（nginx + curl） ▶

祖宁问："最近域名访问都正常吗？"

关键陷阱：301 自循环重定向 vs 200 OK vs 502 Bad Gateway 容易混淆。
正确做法：调 domain_health_check() 函数 → 100% 对账最近 7 天日志 → 输出 HTTP 200/301/500 分布 → 异常时立即告警。

Q4 飞书消息未读数（IM API） ▶

祖宁问："现在有几条未读消息？"

边界问："含/不含机器人消息？""含/不含群聊？""含/不含@我的？"
正确做法：调飞书 IM API → 按 message_type 过滤 → 输出各渠道未读数（p2p/group/mention） → 标注数据获取时间戳。

Q5 备份任务执行历史（log 解析） ▶

祖宁问："最近备份正常吗？"

关键陷阱：看 log 解析"push 成功"文本可能漏掉网络抖动。
正确做法：触发本 Skill → 调 health-check.sh 函数 → 100% 对账最近 7 天 log → 异常时立即告警 → 输出每日备份成功率。

Q6 Skill 资产统计（文件系统） ▶

祖宁问："我有多少个 Skill？"

边界问："含/不含 disabled 的？""按分类/按状态？"
正确做法：调 ls + wc -l 统计 ~/.openclaw/workspace/skills/ → 输出分类矩阵（系统/分析/创作/部署）→ 与 SKILL.md 索引 100% 对账。

Q7 财务目标进度（MEMORY.md 解析） ▶

祖宁问："今年财务目标完成度？"

关键陷阱：MEMORY.md 是纯文本，正则解析容易漏字段。
正确做法：先维护 财务目标.md（结构化）→ 解析该文件 → 与 MEMORY.md 交叉验证 → 输出"目标/实际/完成率"三列。

Q8 域名清单（阿里云 DNS） ▶

祖宁问："我现在管多少个域名？"

边界问："含/含子域名？""含/含已删除的？""含/含未备案的？"
正确做法：调阿里云 DNS API → 拉取 A 记录清单 → 与 domain-manager skill 状态对账 → 输出 4 列（域名/IP/状态/SSL 有效期）。

Q9 晨间简报内容完整性 ▶

祖宁问："今天早报里有什么？"

关键陷阱：早报可能因 API 失败而缺失某些模块。
正确做法：读最新早报文件 → 校验 8 个模块是否齐全（行情/新闻/任务/...）→ 缺失模块立即告警 → 输出"完整度百分比 + 缺失列表"。

Q10 任务清单完成率（多维表格） ▶

祖宁问："今天任务清单完成度？"

边界问："含/含子任务？""含/含今天创建/含累计？""按状态/按优先级？"
正确做法：调飞书多维表格 API → 按 created_time 过滤今日 → 按 status 聚合 → 输出 4 个数字（总/已完成/进行中/未开始）+ 完成率。

维度	升级前	升级后
字段查找	AI 自己猜，可能错	数据源注册表 + 函数调用
业务概念歧义	"活跃用户"模糊定义	强绑定唯一查询路径
边界处理	漏掉测试账号/退款	自动 3 问审查
数字对账	"差不多"	100% 反查验证
异常检测	难发现"格式完美但错"	强制 dashboard 对账
退化追踪	没有	每周离线评测题库
历史经验复用	堆 SQL 模板（无效）	薄知识 + 导航图

07应用案例（祖宁场景）

三个真实场景的对比，展示方法论落地前后的差异。

📋 案例 1：求职进度分析

祖宁问："我现在求职进度如何？"

升级前

孔明自己猜字段、自己写过滤条件
可能漏掉"暂不考虑"的任务
数字与多维表格对不上

升级后

触发本 Skill，输出 3 个边界问题
祖宁确认后调用 祖宁_求职进度查询() 函数
反查飞书多维表格 100% 对账
输出结果 + 数据源标注

📈 案例 2：三一持仓分析

祖宁问："今天三一怎么样？"

升级前

调 AKShare，可能字段解释错
"主力净流入" vs "大单净流入" 混淆
跟祖宁成本表对不上

升级后

触发本 Skill + 边界问"含/不含挂单？"
调用 sany_daily_analysis.py（已封装好）
数字与 AKShare 实时数据 100% 对账
输出盈亏（基于祖宁成本表交叉验证）

💾 案例 3：备份健康度分析

祖宁问："最近备份正常吗？"

升级前

看 log，解析"push 成功"文本
可能漏掉网络抖动
异常发现延迟

升级后

触发本 Skill + 调 health-check.sh 函数
100% 对账最近 7 天 log
异常时立即告警（自动触发修复）
输出每日备份成功率 + 异常明细

关键启示

AI 数据分析的本质不是"写 SQL"，是"在正确的数据源上查询正确的问题"。

堆砌历史 SQL 模板无效（准确率提升 < 1%），真正需要的是精准导航图——明确告诉 AI"这个问题该查哪个表"。

08团队起步只需三步

不要试图一次做完所有事。从这三个最小动作开始，立刻看到准确率提升。

01

建规范数据集

元数据 + 函数化指标

每个业务概念绑定唯一查询路径，所有调用走函数。

02

写离线评测题

10 道追踪退化

覆盖简单查询、关联查询、边界判断、反向陷阱。

03

加薄知识型 Skill

导航图 + 边界规则

不堆 SQL 模板，只写"这个概念该查哪张表"。

01问题本质：21% 准确率根源