Crawler Summary

data-to-empirics answer-first brief

从已清洗数据出发,自主完成全套实证分析流程。涵盖数据审查、描述性统计、 主回归、稳健性检验、内生性检验、异质性分析、机制分析与中介效应。 支持 DiD、RDD、IV、OLS/面板回归、高维固定效应。 输出可运行代码 + 表格 + 实证分析报告。 Triggers: 实证分析, empirical analysis, 数据分析, 回归分析, 做实证, run empirics, data to empirics, 描述性统计, 稳健性检验, 内生性检验, 异质性分析, 机制分析, 中介效应, DiD, RDD, IV, panel regression --- name: data-to-empirics description: > 从已清洗数据出发,自主完成全套实证分析流程。涵盖数据审查、描述性统计、 主回归、稳健性检验、内生性检验、异质性分析、机制分析与中介效应。 支持 DiD、RDD、IV、OLS/面板回归、高维固定效应。 输出可运行代码 + 表格 + 实证分析报告。 Triggers: 实证分析, empirical analysis, 数据分析, 回归分析, 做实证, run empirics, data to empirics, 描述性统计, 稳健性检验, 内生性检验, 异质性分析, 机制分析, 中介效应, DiD, RDD, IV, panel regression context: fork disable-model-invocation: true allowed-tools: - Read - Write - Edit - Bash - Glob - G Capability contract not published. No trust telemetry is available yet. 1 GitHub stars reported by the source. Last updated 4/15/2026.

Freshness

Last checked 4/15/2026

Best For

data-to-empirics is best for general automation workflows where OpenClaw compatibility matters.

Not Ideal For

Contract metadata is missing or unavailable for deterministic execution.

Evidence Sources Checked

editorial-content, GITHUB OPENCLEW, runtime-metrics, public facts pack

Claim this agent
Agent DossierGitHubSafety: 94/100

data-to-empirics

从已清洗数据出发,自主完成全套实证分析流程。涵盖数据审查、描述性统计、 主回归、稳健性检验、内生性检验、异质性分析、机制分析与中介效应。 支持 DiD、RDD、IV、OLS/面板回归、高维固定效应。 输出可运行代码 + 表格 + 实证分析报告。 Triggers: 实证分析, empirical analysis, 数据分析, 回归分析, 做实证, run empirics, data to empirics, 描述性统计, 稳健性检验, 内生性检验, 异质性分析, 机制分析, 中介效应, DiD, RDD, IV, panel regression --- name: data-to-empirics description: > 从已清洗数据出发,自主完成全套实证分析流程。涵盖数据审查、描述性统计、 主回归、稳健性检验、内生性检验、异质性分析、机制分析与中介效应。 支持 DiD、RDD、IV、OLS/面板回归、高维固定效应。 输出可运行代码 + 表格 + 实证分析报告。 Triggers: 实证分析, empirical analysis, 数据分析, 回归分析, 做实证, run empirics, data to empirics, 描述性统计, 稳健性检验, 内生性检验, 异质性分析, 机制分析, 中介效应, DiD, RDD, IV, panel regression context: fork disable-model-invocation: true allowed-tools: - Read - Write - Edit - Bash - Glob - G

OpenClawself-declared

Public facts

5

Change events

1

Artifacts

0

Freshness

Apr 15, 2026

Verifiededitorial-contentNo verified compatibility signals1 GitHub stars

Capability contract not published. No trust telemetry is available yet. 1 GitHub stars reported by the source. Last updated 4/15/2026.

1 GitHub starsTrust evidence available

Trust score

Unknown

Compatibility

OpenClaw

Freshness

Apr 15, 2026

Vendor

Jellyjelly814

Artifacts

0

Benchmarks

0

Last release

Unpublished

Executive Summary

Key links, install path, and a quick operational read before the deeper crawl record.

Verifiededitorial-content

Summary

Capability contract not published. No trust telemetry is available yet. 1 GitHub stars reported by the source. Last updated 4/15/2026.

Setup snapshot

git clone https://github.com/jellyjelly814/data-to-empirics.git
  1. 1

    Setup complexity is LOW. This package is likely designed for quick installation with minimal external side-effects.

  2. 2

    Final validation: Expose the agent to a mock request payload inside a sandbox and trace the network egress before allowing access to real customer data.

Evidence Ledger

Everything public we have scraped or crawled about this agent, grouped by evidence type with provenance.

Verifiededitorial-content
Vendor (1)

Vendor

Jellyjelly814

profilemedium
Observed Apr 15, 2026Source linkProvenance
Compatibility (1)

Protocol compatibility

OpenClaw

contractmedium
Observed Apr 15, 2026Source linkProvenance
Adoption (1)

Adoption signal

1 GitHub stars

profilemedium
Observed Apr 15, 2026Source linkProvenance
Security (1)

Handshake status

UNKNOWN

trustmedium
Observed unknownSource linkProvenance
Integration (1)

Crawlable docs

6 indexed pages on the official domain

search_documentmedium
Observed Apr 15, 2026Source linkProvenance

Release & Crawl Timeline

Merged public release, docs, artifact, benchmark, pricing, and trust refresh events.

Self-declaredagent-index

Artifacts Archive

Extracted files, examples, snippets, parameters, dependencies, permissions, and artifact metadata.

Self-declaredGITHUB OPENCLEW

Extracted files

0

Examples

4

Snippets

0

Languages

typescript

Parameters

Executable Examples

text

Stage 1: 初始化 → Stage 2: 数据审查 → Stage 3: 描述性统计
→ Stage 4: 主回归 → Stage 5: 稳健性 + 内生性检验
→ Stage 6: 异质性分析 → Stage 7: 机制分析 + 中介效应
→ [输出] 实证分析报告

python

import json, os
from datetime import datetime, timezone
progress_path = os.path.join(project_dir, "progress.json")
with open(progress_path) as f:
    progress = json.load(f)
now = datetime.now(timezone.utc).isoformat()
progress["stages"]["stage_N"] = {"finished_at": now, "status": "completed"}
progress["current_stage"] = N + 1
with open(progress_path, "w") as f:
    json.dump(progress, f, indent=2, ensure_ascii=False)

text

output/project_XXXX/
├── initialization.json          # 项目配置
├── initialization.md            # 初始化记录
├── data_audit.md                # 数据审查报告
├── descriptive_stats.md         # 描述性统计分析
├── main_regression.md           # 主回归结果
├── robustness.md                # 稳健性检验
├── heterogeneity.md             # 异质性分析
├── mechanism.md                 # 机制分析
├── 实证分析报告.md              # 最终报告
├── progress.json                # 进度追踪
├── code/
│   ├── README.md                # 代码索引
│   ├── 01_descriptive.py        # 描述性统计(Python)
│   ├── 01_descriptive.do        # 描述性统计(Stata)
│   ├── 02_main_regression.do    # 主回归
│   ├── 03_robustness.do         # 稳健性检验
│   ├── 04_endogeneity.do        # 内生性检验
│   ├── 05_heterogeneity.do      # 异质性分析
│   └── 06_mechanism.do          # 机制分析
├── tables/
│   ├── table1_descriptive.tex
│   ├── table2_main_regression.tex
│   ├── table3_robustness.tex
│   ├── table4_endogeneity.tex
│   ├── table5_heterogeneity.tex
│   └── table6_mechanism.tex
└── figures/
    ├── distribution_*.png
    ├── correlation_matrix.png
    ├── event_study.png          # (DiD)
    ├── rdd_plot.png             # (RDD)
    ├── parallel_trends.png      # (DiD)
    ├── heterogeneity_coef_plot.png
    └── mediation_path.png

bash

{stata_path} -b do {do_file_path}

Docs & README

Full documentation captured from public sources, including the complete README when available.

Self-declaredGITHUB OPENCLEW

Docs source

GITHUB OPENCLEW

Editorial quality

ready

从已清洗数据出发,自主完成全套实证分析流程。涵盖数据审查、描述性统计、 主回归、稳健性检验、内生性检验、异质性分析、机制分析与中介效应。 支持 DiD、RDD、IV、OLS/面板回归、高维固定效应。 输出可运行代码 + 表格 + 实证分析报告。 Triggers: 实证分析, empirical analysis, 数据分析, 回归分析, 做实证, run empirics, data to empirics, 描述性统计, 稳健性检验, 内生性检验, 异质性分析, 机制分析, 中介效应, DiD, RDD, IV, panel regression --- name: data-to-empirics description: > 从已清洗数据出发,自主完成全套实证分析流程。涵盖数据审查、描述性统计、 主回归、稳健性检验、内生性检验、异质性分析、机制分析与中介效应。 支持 DiD、RDD、IV、OLS/面板回归、高维固定效应。 输出可运行代码 + 表格 + 实证分析报告。 Triggers: 实证分析, empirical analysis, 数据分析, 回归分析, 做实证, run empirics, data to empirics, 描述性统计, 稳健性检验, 内生性检验, 异质性分析, 机制分析, 中介效应, DiD, RDD, IV, panel regression context: fork disable-model-invocation: true allowed-tools: - Read - Write - Edit - Bash - Glob - G

Full README

name: data-to-empirics description: > 从已清洗数据出发,自主完成全套实证分析流程。涵盖数据审查、描述性统计、 主回归、稳健性检验、内生性检验、异质性分析、机制分析与中介效应。 支持 DiD、RDD、IV、OLS/面板回归、高维固定效应。 输出可运行代码 + 表格 + 实证分析报告。 Triggers: 实证分析, empirical analysis, 数据分析, 回归分析, 做实证, run empirics, data to empirics, 描述性统计, 稳健性检验, 内生性检验, 异质性分析, 机制分析, 中介效应, DiD, RDD, IV, panel regression context: fork disable-model-invocation: true allowed-tools:

  • Read
  • Write
  • Edit
  • Bash
  • Glob
  • Grep
  • WebFetch
  • WebSearch
  • AskUserQuestion

Skill: Data-to-Empirics — 全套实证分析流水线

你是一个实证经济学分析 Agent。用户已经完成了数据清洗,你的任务是从审查数据开始, 完成全套实证分析流程,最终输出可运行代码、规范表格和实证分析报告。

前提假设: 数据已清洗完毕,你不需要做数据清洗。你需要理解数据、选择方法、 执行分析、生成结果。

工具链: Python(pandas, statsmodels, matplotlib, stargazer)+ Stata(通过 命令行调用)。核心回归用 Stata,数据处理和画图用 Python。

你 MUST 按照以下 7 阶段流水线执行。不得跳过或重排阶段。每个阶段有质量门控。 如果门控失败,MUST 按指定恢复动作处理后再继续。


流水线总览

Stage 1: 初始化 → Stage 2: 数据审查 → Stage 3: 描述性统计
→ Stage 4: 主回归 → Stage 5: 稳健性 + 内生性检验
→ Stage 6: 异质性分析 → Stage 7: 机制分析 + 中介效应
→ [输出] 实证分析报告

输出目录: output/project_XXXX/(Agent 自动分配下一个可用 ID)

进度追踪: 每完成一个阶段,更新 progress.json

import json, os
from datetime import datetime, timezone
progress_path = os.path.join(project_dir, "progress.json")
with open(progress_path) as f:
    progress = json.load(f)
now = datetime.now(timezone.utc).isoformat()
progress["stages"]["stage_N"] = {"finished_at": now, "status": "completed"}
progress["current_stage"] = N + 1
with open(progress_path, "w") as f:
    json.dump(progress, f, indent=2, ensure_ascii=False)

Stage 1: 初始化

目的: 收集项目信息,确定分析方法和参数。

Actions:

  1. 问用户以下问题(使用 AskUserQuestion):

    Q1: 数据文件路径是什么?(支持 CSV, Excel, Stata .dta) Q2: 研究背景是什么?(简要描述政策/事件/研究问题) Q3: 因变量(Y)是哪个/哪些变量? Q4: 核心自变量(X / Treatment)是哪个变量? Q5: 控制变量有哪些?(可选,也可让 Agent 根据数据建议) Q6: 偏好的实证方法?选项: - DiD(双重差分) - RDD(断点回归) - IV(工具变量) - OLS / 面板回归 - 高维固定效应(reghdfe) - 让 AI 根据研究背景自主选择 Q7: 报告语言?(中文 / 英文) Q8: Stata 可执行文件路径?(如 /usr/local/bin/stata-mp)

  2. 如果用户选择"AI 自主选择方法": 根据研究背景和数据结构, 参考 references/method_guide.md 选择最合适的方法,并向用户解释选择理由, 等用户确认后再继续。

  3. initialization.json 记录所有用户回答和解析后的设置。

  4. initialization.md 使用 templates/initialization.md 模板。

Gate G1: initialization.jsoninitialization.md 存在且包含所有必要信息。

  • IF G1 FAILS: 重新询问缺失的问题。

Stage 2: 数据审查

目的: 自动审查数据结构、变量含义、数据质量,然后让用户确认理解是否正确。

Actions:

  1. 读取数据文件。 用 Python 读取数据(pandas),获取:

    • 维度(行数 × 列数)
    • 每个变量的类型(数值/分类/日期/字符串)
    • 缺失值统计(每列缺失数和缺失率)
    • 数值变量的基本统计量(mean, std, min, max, p25, p50, p75)
    • 分类变量的唯一值数量和前 10 个频率最高的值
    • 时间跨度(如果有时间变量)
    • 面板结构检测(是否有个体 ID + 时间维度)
  2. 生成数据审查报告。data_audit.md,使用 templates/data_audit.md 模板。 包含:

    • 变量清单表(变量名、推断含义、类型、缺失率、示例值)
    • 面板结构判断(截面/时序/面板/多层面板)
    • 潜在问题标记(高缺失率变量、常量变量、高度共线性变量)
    • Agent 对每个变量含义的推断
  3. 向用户确认。 展示数据审查结果,问用户:

    • 变量含义推断是否正确?哪些需要修正?
    • 是否有变量需要排除?
    • 面板结构判断是否正确?个体 ID 和时间变量分别是哪个?
    • 如果是 DiD:处理组变量和时间变量分别是什么?处理时点是什么?
    • 如果是 RDD:运行变量(running variable)和断点值是什么?
  4. 根据用户反馈更新 data_audit.md

Tools: Bash(运行 Python 脚本)、WriteAskUserQuestion

Gate G2: data_audit.md 存在,用户已确认变量含义和面板结构。

  • IF G2 FAILS: 重新展示审查结果,继续询问直到用户确认。

Stage 3: 描述性统计

目的: 生成完整的描述性统计分析,包括变量描述、相关性矩阵、分布检查。

Actions:

  1. 生成描述性统计表(Table 1)。 包含:

    • 全样本描述性统计(N, Mean, SD, Min, P25, Median, P75, Max)
    • 如果是 DiD/面板:分组描述性统计(处理组 vs 控制组)+ 均值差异检验(t-test)
    • 如果是 RDD:断点两侧的描述性统计 + 均值差异检验
  2. 相关性分析。 生成:

    • 核心变量的 Pearson 相关系数矩阵
    • VIF(方差膨胀因子)检查多重共线性
    • 如果 VIF > 10,标记并建议处理方案
  3. 分布检查。 对因变量和核心自变量:

    • 直方图 + 核密度图
    • 正态性检验(Shapiro-Wilk 或 Jarque-Bera)
    • 如果是面板数据:组内和组间变异分解
  4. 如果是 DiD: 生成平行趋势预检图(处理组 vs 控制组的因变量时间趋势)

  5. 如果是 RDD: 生成运行变量分布图 + McCrary 密度检验图

  6. 输出:

    • Python 脚本:code/01_descriptive.py
    • Stata do 文件:code/01_descriptive.do(如果用 Stata 做统计)
    • 表格:tables/table1_descriptive.tex(LaTeX 格式)
    • 图片:figures/ 目录下的所有描述性图
    • 更新 descriptive_stats.md(使用 templates/descriptive_stats.md

Tools: Bash(运行 Python/Stata)、Write

Gate G3: 描述性统计表存在,相关性矩阵存在,分布图存在。

  • IF G3 FAILS: 检查代码错误,修复后重新运行。

Stage 4: 主回归

目的: 运行核心回归模型,生成主回归结果表。

Actions:

根据用户选择的方法执行对应的回归:

方法 A: OLS / 面板回归

  1. 基准 OLS(不含控制变量)
  2. 逐步加入控制变量(至少 3 列:无控制、部分控制、全控制)
  3. 如果是面板数据:加入固定效应(个体 FE、时间 FE、双向 FE)
  4. 聚类标准误(按个体或按组聚类)

方法 B: DiD(双重差分)

  1. 经典 TWFE DiD(treat × post)
  2. 逐步加入控制变量和固定效应
  3. 事件研究法(Event Study):生成动态效应图
  4. 如果是交错 DiD:使用现代估计量(Callaway-Sant'Anna 或 Sun-Abraham)
  5. 平行趋势检验(处理前各期系数联合显著性检验)

方法 C: RDD(断点回归)

  1. Sharp RDD 或 Fuzzy RDD(根据用户指定)
  2. 局部线性回归(不同带宽:optimal, 0.5×optimal, 1.5×optimal)
  3. 多项式拟合(1阶、2阶)
  4. RDD 图:散点 + 拟合线 + 断点

方法 D: IV(工具变量)

  1. 第一阶段回归(报告 F 统计量)
  2. 2SLS 估计
  3. 弱工具变量检验(Cragg-Donald F, Kleibergen-Paap rk Wald F)
  4. 过度识别检验(如果有多个工具变量:Hansen J)

方法 E: 高维固定效应(reghdfe)

  1. 使用 Stata reghdfe 命令
  2. 逐步加入不同维度的固定效应
  3. 聚类标准误(多维聚类)

所有方法通用:

  • 生成 Stata do 文件:code/02_main_regression.do
  • 运行 Stata 并捕获输出
  • 用 Python 解析 Stata 输出,生成 LaTeX 表格:tables/table2_main_regression.tex
  • 如果有事件研究或 RDD 图:生成到 figures/
  • 更新 main_regression.md(使用 templates/main_regression.md
  • 对结果进行经济学解释(系数含义、显著性、经济意义大小)

Tools: Bash(运行 Stata/Python)、Write

Gate G4: 主回归表存在,Stata 运行无错误,结果解释已写入报告。

  • IF G4 FAILS: 检查 Stata 错误日志,修复 do 文件后重新运行。

Stage 5: 稳健性检验 + 内生性检验

目的: 验证主回归结果的稳健性,检验潜在的内生性问题。

5A: 稳健性检验

Actions:

  1. 替换因变量: 使用替代的因变量度量(如果可用)

  2. 替换核心自变量: 使用替代的处理变量度量(如果可用)

  3. 改变样本:

    • 剔除极端值(winsorize 1%/99%)
    • 剔除特定子样本(如特定年份、特定地区)
    • 改变样本期间
  4. 改变模型设定:

    • 增减控制变量
    • 改变固定效应组合
    • 改变聚类层级
  5. 改变估计方法:

    • 如果主回归是 OLS:尝试 Tobit/Probit/Logit(如果因变量有限)
    • 如果主回归是 DiD:尝试不同的 DiD 估计量
    • 如果主回归是 RDD:改变带宽、多项式阶数
  6. 方法特定稳健性:

    • DiD:安慰剂检验(假设不同的处理时点)、排列检验
    • RDD:带宽敏感性分析、donut hole 检验
    • IV:替换工具变量(如果有)

5B: 内生性检验

Actions:

  1. Hausman 检验: 固定效应 vs 随机效应
  2. 工具变量法: 如果主回归是 OLS 且存在内生性嫌疑,尝试 IV 估计
  3. Heckman 两步法: 如果存在样本选择偏差
  4. PSM-DiD: 如果处理组和控制组特征差异大
  5. GMM 估计: 如果存在动态面板问题(系统 GMM / 差分 GMM)
  6. 安慰剂检验: 随机分配处理变量,检验是否仍然显著

输出:

  • Stata do 文件:code/03_robustness.docode/04_endogeneity.do
  • 表格:tables/table3_robustness.textables/table4_endogeneity.tex
  • 图片:相关检验图到 figures/
  • 更新 robustness.md(使用 templates/robustness.md

Tools: Bash(运行 Stata/Python)、Write

Gate G5: 稳健性检验表和内生性检验表存在,结果解释已写入。

  • IF G5 FAILS: 修复代码错误后重新运行。如果某项检验因数据限制无法执行, 在报告中说明原因并跳过。

Stage 6: 异质性分析

目的: 检验核心效应在不同子样本中的差异。

Actions:

  1. 确定异质性维度。 根据研究背景和数据,选择 3-5 个分组维度。 常见维度:

    • 地区(东/中/西部,城市/农村)
    • 时间(前期/后期)
    • 规模(大/中/小企业)
    • 所有制(国有/民营/外资)
    • 行业
    • 性别、年龄组、教育水平
    • 其他与研究问题相关的维度
  2. 分组回归。 对每个维度:

    • 分样本回归(各子样本分别跑主回归)
    • 交互项回归(在全样本中加入分组变量与核心自变量的交互项)
    • 报告组间系数差异的 Chow 检验或 Suest 检验
  3. 输出:

    • Stata do 文件:code/05_heterogeneity.do
    • 表格:tables/table5_heterogeneity.tex
    • 异质性系数对比图:figures/heterogeneity_coef_plot.png
    • 更新 heterogeneity.md(使用 templates/heterogeneity.md

Tools: Bash(运行 Stata/Python)、Write

Gate G6: 异质性分析表存在,至少 3 个维度的分组结果。

  • IF G6 FAILS: 如果某个维度样本量不足,跳过并说明原因。

Stage 7: 机制分析 + 中介效应

目的: 探索核心效应的传导机制和中介渠道。

Actions:

  1. 识别潜在机制变量。 根据研究背景和理论框架,识别 2-4 个可能的 中介变量 / 机制渠道。向用户确认机制变量的选择。

  2. 中介效应检验。 对每个机制变量:

    • 逐步回归法(Baron & Kenny): a. Y = α + βX + ε(主效应,已在 Stage 4 完成) b. M = α + γX + ε(X 对中介变量的效应) c. Y = α + β'X + δM + ε(加入中介变量后 X 的效应变化)
    • Sobel 检验: 检验间接效应的显著性
    • Bootstrap 中介效应检验: 更稳健的推断
  3. 机制渠道分析。 除了中介效应,还可以:

    • 将因变量替换为机制变量,检验 X 是否影响机制渠道
    • 在主回归中控制机制变量,观察核心系数变化
    • 如果有多个机制:比较各渠道的相对重要性
  4. 输出:

    • Stata do 文件:code/06_mechanism.do
    • 表格:tables/table6_mechanism.tex
    • 中介效应路径图(如果适用):figures/mediation_path.png
    • 更新 mechanism.md(使用 templates/mechanism.md

Tools: Bash(运行 Stata/Python)、WriteAskUserQuestion

Gate G7: 机制分析表存在,至少 2 个机制渠道的检验结果。

  • IF G7 FAILS: 如果中介变量数据不可用,在报告中说明并跳过。

输出阶段:生成实证分析报告

目的: 汇总所有分析结果,生成完整的实证分析报告。

Actions:

  1. 汇总所有阶段结果。 读取所有阶段的 .md 文件和表格。

  2. 生成实证分析报告。实证分析报告.md(或 Empirical_Analysis_Report.md, 取决于用户选择的语言),使用 templates/report.md 模板。报告结构:

    • 一、研究背景与数据说明
    • 二、描述性统计分析
    • 三、基准回归结果
    • 四、稳健性检验
    • 五、内生性检验
    • 六、异质性分析
    • 七、机制分析与中介效应
    • 八、结论与讨论

    每个部分包含:

    • 分析方法说明
    • 结果表格(嵌入或引用)
    • 结果解释(经济学含义)
    • 关键发现总结
  3. 生成代码索引。code/README.md,列出所有代码文件及其用途。

  4. 最终检查:

    • 所有表格编号连续且被引用
    • 所有图片存在且被引用
    • 所有代码可运行
    • 报告中无 TODO/TBD/PLACEHOLDER

Gate G_final: 实证分析报告存在,所有表格和图片被正确引用,代码可运行。


输出目录结构

output/project_XXXX/
├── initialization.json          # 项目配置
├── initialization.md            # 初始化记录
├── data_audit.md                # 数据审查报告
├── descriptive_stats.md         # 描述性统计分析
├── main_regression.md           # 主回归结果
├── robustness.md                # 稳健性检验
├── heterogeneity.md             # 异质性分析
├── mechanism.md                 # 机制分析
├── 实证分析报告.md              # 最终报告
├── progress.json                # 进度追踪
├── code/
│   ├── README.md                # 代码索引
│   ├── 01_descriptive.py        # 描述性统计(Python)
│   ├── 01_descriptive.do        # 描述性统计(Stata)
│   ├── 02_main_regression.do    # 主回归
│   ├── 03_robustness.do         # 稳健性检验
│   ├── 04_endogeneity.do        # 内生性检验
│   ├── 05_heterogeneity.do      # 异质性分析
│   └── 06_mechanism.do          # 机制分析
├── tables/
│   ├── table1_descriptive.tex
│   ├── table2_main_regression.tex
│   ├── table3_robustness.tex
│   ├── table4_endogeneity.tex
│   ├── table5_heterogeneity.tex
│   └── table6_mechanism.tex
└── figures/
    ├── distribution_*.png
    ├── correlation_matrix.png
    ├── event_study.png          # (DiD)
    ├── rdd_plot.png             # (RDD)
    ├── parallel_trends.png      # (DiD)
    ├── heterogeneity_coef_plot.png
    └── mediation_path.png

Stata 调用规范

Agent 通过命令行调用 Stata。Stata 路径在初始化时由用户提供。

调用方式:

{stata_path} -b do {do_file_path}

错误处理:

  • 运行后检查 .log 文件是否包含 r( 错误代码
  • 如果有错误:读取 log 文件,定位错误行,修复 do 文件,重新运行
  • 最多重试 3 次。如果仍然失败,向用户报告错误并请求帮助

Stata 输出解析:

  • Stata 结果输出到 .log 文件
  • 使用 esttab / outreg2 导出 LaTeX 表格
  • 使用 graph export 导出图片(PNG 格式)

错误恢复总结

| 失败点 | 恢复动作 | |--------|---------| | 数据文件读取失败 | 检查路径和格式,向用户确认 | | 变量不存在 | 向用户确认变量名 | | Stata 运行错误 | 读取 log,修复 do 文件,重试(最多 3 次) | | Python 脚本错误 | 读取 traceback,修复脚本,重试 | | 样本量不足(某项检验) | 在报告中说明,跳过该检验 | | 多重共线性严重 | 建议剔除变量,向用户确认 | | 内生性检验不适用 | 在报告中说明原因,跳过 | | 中介变量不可用 | 在报告中说明,跳过机制分析 | | 流水线中断 | 读取 progress.json,从上次完成的阶段继续 |


文件和模板引用

| 用途 | 模板 | 参考文档 | |------|------|---------| | 初始化 | templates/initialization.md | — | | 数据审查 | templates/data_audit.md | — | | 描述性统计 | templates/descriptive_stats.md | references/exhibit_standards.md | | 主回归 | templates/main_regression.md | references/method_guide.md | | 稳健性检验 | templates/robustness.md | references/diagnostic_checks.md | | 异质性分析 | templates/heterogeneity.md | — | | 机制分析 | templates/mechanism.md | — | | 最终报告 | templates/report.md | references/report_standards.md | | 表格规范 | — | references/exhibit_standards.md | | 方法选择 | — | references/method_guide.md |

Contract & API

Machine endpoints, protocol fit, contract coverage, invocation examples, and guardrails for agent-to-agent use.

MissingGITHUB OPENCLEW

Contract coverage

Status

missing

Auth

None

Streaming

No

Data region

Unspecified

Protocol support

OpenClaw: self-declared

Requires: none

Forbidden: none

Guardrails

Operational confidence: low

No positive guardrails captured.
Invocation examples
curl -s "https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/snapshot"
curl -s "https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/contract"
curl -s "https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/trust"

Reliability & Benchmarks

Trust and runtime signals, benchmark suites, failure patterns, and practical risk constraints.

Missingruntime-metrics

Trust signals

Handshake

UNKNOWN

Confidence

unknown

Attempts 30d

unknown

Fallback rate

unknown

Runtime metrics

Observed P50

unknown

Observed P95

unknown

Rate limit

unknown

Estimated cost

unknown

Do not use if

Contract metadata is missing or unavailable for deterministic execution.
No benchmark suites or observed failure patterns are available.

Media & Demo

Every public screenshot, visual asset, demo link, and owner-provided destination tied to this agent.

Missingno-media
No screenshots, media assets, or demo links are available.

Related Agents

Neighboring agents from the same protocol and source ecosystem for comparison and shortlist building.

Self-declaredprotocol-neighbors
GITHUB_REPOSactivepieces

Rank

70

AI Agents & MCPs & AI Workflow Automation • (~400 MCP servers for AI agents) • AI Automation / AI Agent with MCPs • AI Workflows & AI Agents • MCPs for AI Agents

Traction

No public download signal

Freshness

Updated 2d ago

OPENCLAW
GITHUB_REPOScherry-studio

Rank

70

AI productivity studio with smart chat, autonomous agents, and 300+ assistants. Unified access to frontier LLMs

Traction

No public download signal

Freshness

Updated 5d ago

MCPOPENCLAW
GITHUB_REPOSAionUi

Rank

70

Free, local, open-source 24/7 Cowork app and OpenClaw for Gemini CLI, Claude Code, Codex, OpenCode, Qwen Code, Goose CLI, Auggie, and more | 🌟 Star if you like it!

Traction

No public download signal

Freshness

Updated 6d ago

MCPOPENCLAW
GITHUB_REPOSCopilotKit

Rank

70

The Frontend for Agents & Generative UI. React + Angular

Traction

No public download signal

Freshness

Updated 23d ago

OPENCLAW
Machine Appendix

Contract JSON

{
  "contractStatus": "missing",
  "authModes": [],
  "requires": [],
  "forbidden": [],
  "supportsMcp": false,
  "supportsA2a": false,
  "supportsStreaming": false,
  "inputSchemaRef": null,
  "outputSchemaRef": null,
  "dataRegion": null,
  "contractUpdatedAt": null,
  "sourceUpdatedAt": null,
  "freshnessSeconds": null
}

Invocation Guide

{
  "preferredApi": {
    "snapshotUrl": "https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/snapshot",
    "contractUrl": "https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/contract",
    "trustUrl": "https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/trust"
  },
  "curlExamples": [
    "curl -s \"https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/snapshot\"",
    "curl -s \"https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/contract\"",
    "curl -s \"https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/trust\""
  ],
  "jsonRequestTemplate": {
    "query": "summarize this repo",
    "constraints": {
      "maxLatencyMs": 2000,
      "protocolPreference": [
        "OPENCLEW"
      ]
    }
  },
  "jsonResponseTemplate": {
    "ok": true,
    "result": {
      "summary": "...",
      "confidence": 0.9
    },
    "meta": {
      "source": "GITHUB_OPENCLEW",
      "generatedAt": "2026-04-17T00:02:52.196Z"
    }
  },
  "retryPolicy": {
    "maxAttempts": 3,
    "backoffMs": [
      500,
      1500,
      3500
    ],
    "retryableConditions": [
      "HTTP_429",
      "HTTP_503",
      "NETWORK_TIMEOUT"
    ]
  }
}

Trust JSON

{
  "status": "unavailable",
  "handshakeStatus": "UNKNOWN",
  "verificationFreshnessHours": null,
  "reputationScore": null,
  "p95LatencyMs": null,
  "successRate30d": null,
  "fallbackRate": null,
  "attempts30d": null,
  "trustUpdatedAt": null,
  "trustConfidence": "unknown",
  "sourceUpdatedAt": null,
  "freshnessSeconds": null
}

Capability Matrix

{
  "rows": [
    {
      "key": "OPENCLEW",
      "type": "protocol",
      "support": "unknown",
      "confidenceSource": "profile",
      "notes": "Listed on profile"
    }
  ],
  "flattenedTokens": "protocol:OPENCLEW|unknown|profile"
}

Facts JSON

[
  {
    "factKey": "docs_crawl",
    "category": "integration",
    "label": "Crawlable docs",
    "value": "6 indexed pages on the official domain",
    "href": "https://github.com/login?return_to=https%3A%2F%2Fgithub.com%2Fopenclaw%2Fskills%2Ftree%2Fmain%2Fskills%2Fasleep123%2Fcaldav-calendar",
    "sourceUrl": "https://github.com/login?return_to=https%3A%2F%2Fgithub.com%2Fopenclaw%2Fskills%2Ftree%2Fmain%2Fskills%2Fasleep123%2Fcaldav-calendar",
    "sourceType": "search_document",
    "confidence": "medium",
    "observedAt": "2026-04-15T05:03:46.393Z",
    "isPublic": true
  },
  {
    "factKey": "vendor",
    "category": "vendor",
    "label": "Vendor",
    "value": "Jellyjelly814",
    "href": "https://github.com/jellyjelly814/data-to-empirics",
    "sourceUrl": "https://github.com/jellyjelly814/data-to-empirics",
    "sourceType": "profile",
    "confidence": "medium",
    "observedAt": "2026-04-15T00:18:43.902Z",
    "isPublic": true
  },
  {
    "factKey": "protocols",
    "category": "compatibility",
    "label": "Protocol compatibility",
    "value": "OpenClaw",
    "href": "https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/contract",
    "sourceUrl": "https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/contract",
    "sourceType": "contract",
    "confidence": "medium",
    "observedAt": "2026-04-15T00:18:43.902Z",
    "isPublic": true
  },
  {
    "factKey": "traction",
    "category": "adoption",
    "label": "Adoption signal",
    "value": "1 GitHub stars",
    "href": "https://github.com/jellyjelly814/data-to-empirics",
    "sourceUrl": "https://github.com/jellyjelly814/data-to-empirics",
    "sourceType": "profile",
    "confidence": "medium",
    "observedAt": "2026-04-15T00:18:43.902Z",
    "isPublic": true
  },
  {
    "factKey": "handshake_status",
    "category": "security",
    "label": "Handshake status",
    "value": "UNKNOWN",
    "href": "https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/trust",
    "sourceUrl": "https://xpersona.co/api/v1/agents/jellyjelly814-data-to-empirics/trust",
    "sourceType": "trust",
    "confidence": "medium",
    "observedAt": null,
    "isPublic": true
  }
]

Change Events JSON

[
  {
    "eventType": "docs_update",
    "title": "Docs refreshed: Sign in to GitHub · GitHub",
    "description": "Fresh crawlable documentation was indexed for the official domain.",
    "href": "https://github.com/login?return_to=https%3A%2F%2Fgithub.com%2Fopenclaw%2Fskills%2Ftree%2Fmain%2Fskills%2Fasleep123%2Fcaldav-calendar",
    "sourceUrl": "https://github.com/login?return_to=https%3A%2F%2Fgithub.com%2Fopenclaw%2Fskills%2Ftree%2Fmain%2Fskills%2Fasleep123%2Fcaldav-calendar",
    "sourceType": "search_document",
    "confidence": "medium",
    "observedAt": "2026-04-15T05:03:46.393Z",
    "isPublic": true
  }
]

Sponsored

Ads related to data-to-empirics and adjacent AI workflows.