From c2633b879d5e1dee852e89f3d30810bf583bef9b Mon Sep 17 00:00:00 2001
From: chenluli <chenluuli@gmail.com>
Date: Thu, 21 Nov 2024 17:53:00 +0800
Subject: [PATCH] docs: add evaluation dataset for narrative text (#25)

---
 evaluations/datastes/chart/text/eval.json     | 107 ++++++++++++++++
 evaluations/datastes/chart/text/metrics.json  | 117 ++++++++++++++++++
 evaluations/datastes/chart/text/test.json     |  52 ++++++++
 evaluations/prompts/narrative-text/agent.md   |  46 +++++++
 .../prompts/narrative-text/text2chart.md      |  64 ++++++++++
 5 files changed, 386 insertions(+)
 create mode 100644 evaluations/datastes/chart/text/eval.json
 create mode 100644 evaluations/datastes/chart/text/metrics.json
 create mode 100644 evaluations/datastes/chart/text/test.json
 create mode 100644 evaluations/prompts/narrative-text/agent.md
 create mode 100644 evaluations/prompts/narrative-text/text2chart.md
diff --git a/evaluations/datastes/chart/text/eval.json b/evaluations/datastes/chart/text/eval.json
new file mode 100644
index 0000000..304c4fd
--- /dev/null
+++ b/evaluations/datastes/chart/text/eval.json
@@ -0,0 +1,107 @@
+[
+  {
+    "type": "text2chart",
+    "question": "2023年，全球气温平均值14.8°C，对比上个世纪末+1.2°C，变化率+8%。近年来，气候变化成为全球关注焦点，2023年的全球气温平均值达到了历史高点，与上个世纪末相比上升了8%，这一现象再次提醒我们加强环境保护的重要性。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "\"<vis-text type=\"time_desc\">2023年</vis-text>，<vis-text type=\"metric_name\">全球气温平均值</vis-text><vis-text type=\"metric_value\">14.8°C</vis-text>，对比上个世纪末<vis-text type=\"delta_value_pos\" origin=\"1.2\">1.2°C</vis-text>，变化率为<vis-text type=\"ratio_value_pos\" origin=\"0.08\">+8%</vis-text>。近年来，<vis-text type=\"phenomenon\">气候变化</vis-text>成为全球关注焦点，<vis-text type=\"time_desc\">2023年</vis-text>的<vis-text type=\"metric_name\">全球气温平均值</vis-text>达到了历史高点，与上个世纪末相比上升了<vis-text type=\"ratio_value_pos\" origin=\"0.08\">8%</vis-text>，这一现象再次提醒我们加强环境保护的重要性。",
+    "answer": "\"<vis-text type=\\\"time_desc\\\">2023年</vis-text>，<vis-text type=metric_name>全球气温平均值</vis-text><vis-text type=metric_value>14.8°C</vis-text>，对比<vis-text type=time_desc>上个世纪末</vis-text><vis-text type=\\\"delta_value_pos\\\" origin=\\\"1.2\\\">1.2°C</vis-text>，变化率<vis-text type=ratio_value_pos origin=\\\"0.08\\\">8%</vis-text>。近年来，气候变化成为全球关注焦点，2023年的全球气温平均值达到了历史高点，与上个世纪末相比上升了<vis-text type=\\\"ratio_value_pos\\\">8%</vis-text>，这一现象再次提醒我们加强环境保护的重要性。\"",
+    "reference": [
+      "词云图 - WordCloud Chart 使用示例",
+      "数据文本 - Text 使用示例",
+      "思维导图 - Mind Map 使用示例",
+      "面积图 - Area Chart 使用示例"
+    ]
+  },
+  {
+    "type": "text2chart",
+    "question": "原文为：过去一年，网站访问量120万次，对比前一年+30万次，变化率+33%。在过去的一年里，我们的网站访问量有了显著的增长，与前一年相比增加了33%，这归功于新营销活动的成功执行和用户体验的持续改进。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "\"<vis-text type=\"time_desc\">过去一年</vis-text>，<vis-text type=\"metric_name\">网站访问量</vis-text>为<vis-text type=\"metric_value\">120万次</vis-text>，对比<vis-text type=time_desc>前一年</vis-text><vis-text type=\"delta_value_pos origin=\\\"30万次\\\">30万次</vis-text>，变化率<vis-text type=\"ratio_value_pos origin=\\\"0.33\\\">33%</vis-text>。在过去的一年里，我们的<vis-text type=\"metric_name\">网站访问量</vis-text>有了显著的增长，与前一年相比增加了<vis-text type=\"ratio_value_pos origin=\\\"0.33\\\">33%</vis-text>，这归功于新营销活动的成功执行和用户体验的持续改进。\n\n",
+    "answer": "\"<vis-text type=\\\"time_desc\\\">过去一年</vis-text>，<vis-text type=metric_name>网站访问量</vis-text><vis-text type=metric_value>120万次</vis-text>，对比<vis-text type=time_desc>前一年</vis-text><vis-text type=\\\"delta_value_pos\\\" origin=\\\"30万\\\">30万次</vis-text>，变化率<vis-text type=ratio_value_pos origin=\\\"0.33\\\">33%</vis-text>。在过去的一年里，我们的网站访问量有了显著的增长，与前一年相比增加了<vis-text type=\\\"delta_value_pos\\\">33%</vis-text>，这归功于新营销活动的成功执行和用户体验的持续改进。\"",
+    "reference": [
+      "折线图 - Line Chart 使用示例",
+      "数据文本 - Text 使用示例"
+    ]
+  },
+  {
+    "type": "text2chart",
+    "question": "用订单状态对产品回收率拆分后，根据皮尔逊相关系数分析指标相关性，已发货趋势分布与指标总趋势相似性最大，相似性系数为88.9%；已付款趋势分布与指标总趋势相似性最小，相似性系数为-53.0%。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "用订单状态对<vis-text type='dim_name'>产品回收率</vis-text>拆分后，根据皮尔逊相关系数分析指标相关性，<vis-text type='dim_value'>已发货</vis-text>趋势分布与指标总趋势相似性最大，相似性系数为<vis-text type='metric_value' origin='88.9'>88.9%</vis-text>；<vis-text type='dim_value'>已付款</vis-text>趋势分布与指标总趋势相似性最小，相似性系数为<vis-text type='metric_value' origin='-53.0'>-53.0%</vis-text>。",
+    "answer": "\"用<vis-text type='dim_name'>订单状态</vis-text>对<vis-text type='metric_name'>产品回收率</vis-text>拆分后，根据皮尔逊相关系数分析指标相关性，<vis-text type='dim_value'>已发货</vis-text>趋势分布与指标总趋势相似性最大，相似性系数为<vis-text type='metric_value' origin='0.889026234579'>88.9%</vis-text>；<vis-text type=dim_value>已付款</vis-text>趋势分布与指标总趋势相似性最小，相似性系数为<vis-text type='metric_value' origin='-0.529969015182'>-53.0%</vis-text>。\"",
+    "reference": [
+      "[WIP]双轴图 - DualAxes Chart 适用场景",
+      "折线图 - Line Chart 使用示例",
+      "数据文本 - Text 使用示例"
+    ]
+  },
+  {
+    "type": "text2chart",
+    "question": "通过文本实体识别增强，将下面内容输出为增强 markdown 内容：用订单商品折扣、订单金额、商品尺寸对移动端访问量进行组合下钻： 1. 订单商品折扣组合中订单商品折扣=0.2指标值为8.95千亿，具有主导性，值得关注。该组合中最大值为53.5，最小值为26.26，均值为49.23，中位数为27.72，75分位数为31.92，25分位数为51.56。 2. 订单商品折扣、订单金额&商品尺寸，各维度组合下的指标未发现异常。",
+    "response": "用<vis-text type=\"dim_name\">订单商品折扣</vis-text>、<vis-text type=\"dim_name\">订单金额</vis-text>、<vis-text type=\"dim_name\">商品尺寸</vis-text>对<vis-text type=\"metric_name\">移动端访问量</vis-text>进行组合下钻： 1. <vis-text type=\"dim_name\">订单商品折扣组合</vis-text>中<vis-text type=\"metric_name\">订单商品折扣</vis-text>=<vis-text type=\"metric_value\">0.2</vis-text>指标值为<vis-text type=\"metric_value\">8.95千亿</vis-text>，具有主导性，值得关注。该组合中最大值为<vis-text type=\"metric_value\">53.5</vis-text>，最小值为<vis-text type=\"metric_value\">26.26</vis-text>，均值为<vis-text type=\"metric_value\">49.23</vis-text>，中位数为<vis-text type=\"metric_value\">27.72</vis-text>，75分位数为<vis-text type=\"metric_value\">31.92</vis-text>，25分位数为<vis-text type=\"metric_value\">51.56</vis-text>。 2. <vis-text type=\"dim_name\">订单商品折扣</vis-text>、<vis-text type=\"dim_name\">订单金额</vis-text>&<vis-text type=\"dim_name\">商品尺寸</vis-text>，各维度组合下的指标未发现异常。 ",
+    "answer": "\"用<vis-text type='dim_name'>订单商品折扣</vis-text>、<vis-text type='dim_name'>订单金额</vis-text>、<vis-text type='dim_name'>商品尺寸</vis-text>对<vis-text type='metric_name'>移动端访问量</vis-text>进行组合下钻：\\n1. <vis-text type='dim_name'>订单商品折扣</vis-text>组合中<vis-text type='dim_name'>订单商品折扣</vis-text>=<vis-text type='dim_value'>0.2</vis-text>指标值为<vis-text type='metric_value'>8.95千亿</vis-text>，具有主导性，值得关注。该组合中最大值为<vis-text type='metric_value'>53.5</vis-text>，最小值为<vis-text type='metric_value'>26.26</vis-text>，均值为<vis-text type='metric_value'>49.23</vis-text>，中位数为<vis-text type='metric_value'>27.72</vis-text>，75分位数为<vis-text type='metric_value'>31.92</vis-text>，25分位数为<vis-text type='metric_value'>51.56</vis-text>。 \\n2. <vis-text type='dim_name'>订单商品折扣</vis-text>、<vis-text type='dim_name'>订单金额</vis-text>&<vis-text type='dim_name'>商品尺寸</vis-text>，各维度组合下的指标<vis-text type='phenomenon'>未发现异常</vis-text>。\"",
+    "reference": [
+      "数据文本 - Text 使用示例"
+    ]
+  },
+  {
+    "type": "text2chart",
+    "question": "基于PROPHET算法预测，未来预计截止至2020-05-13，所有商品颜色数量的预测值保持快速上升，分别是：蓝色-预测值为0.88%，红色-预测值为-90.02%。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "基于PROPHET算法预测，未来预计截止至<vis-text type=\"time_desc\">2020-05-13</vis-text>，所有商品颜色数量的预测值保持快速上升，分别是：<vis-text type=\"dim_value\">蓝色</vis-text>-预测值为<vis-text type=\"metric_value\">0.88%</vis-text>，<vis-text type=\"dim_value\">红色</vis-text>-预测值为<vis-text type=\"metric_value\">-90.02%</vis-text>。\n\n",
+    "answer": "\"基于PROPHET算法预测，未来预计截止至<vis-text type='time_desc'>2020-05-13</vis-text>，所有<vis-text type='dim_name'>商品颜色</vis-text><vis-text type='metric_name'>数量</vis-text>的预测值<vis-text type='phenomenon'>保持快速上升</vis-text>，分别是：<vis-text type='dim_value'>蓝色</vis-text>-预测值为<vis-text type='metric_value' origin='0.008775585299'>0.88%</vis-text>，<vis-text type='dim_value'>红色</vis-text>-预测值为<vis-text type='metric_value' origin='-0.900171200013'>-90.02%</vis-text>。\"",
+    "reference": [
+      "数据文本 - Text 使用示例"
+    ]
+  },
+  {
+    "type": "text2chart",
+    "question": "原文为：客户净推荐值根据等距分桶策略，桶数为57，步长为9.99百万。该样本最大值为151.56，最小值为1.07，均值为3.46，中位数为8.84，75分位数为6.89，25分位数为69.88，标准差为18。通过箱线图检测，趋势向好。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "<vis-text type=\"metric_name\">客户净推荐值</vis-text>根据等距分桶策略，桶数为<vis-text type=\"metric_value\">57</vis-text>，步长为<vis-text type=\"metric_value\">9.99百万</vis-text>。该样本最大值为<vis-text type=\"metric_value\">151.56</vis-text>，最小值为<vis-text type=\"metric_value\">1.07</vis-text>，均值为<vis-text type=\"metric_value\">3.46</vis-text>，中位数为<vis-text type=\"metric_value\">8.84</vis-text>，75分位数为<vis-text type=\"metric_value\">6.89</vis-text>，25分位数为<vis-text type=\"metric_value\">69.88</vis-text>，标准差为<vis-text type=\"metric_value\">18</vis-text>。通过<vis-text type=\"metric_name\">箱线图</vis-text>检测，<vis-text type=\"trend_desc\">趋势向好</vis-text>。 ",
+    "answer": "\"<vis-text type='metric_name'>客户净推荐值</vis-text>根据等距分桶策略，桶数为<vis-text type='other_metric_value'>57</vis-text>，步长为<vis-text type='other_metric_value'>9.99百万</vis-text>。该样本最大值为<vis-text type='metric_value'>151.56</vis-text>，最小值为<vis-text type='metric_value'>1.07</vis-text>，均值为<vis-text type='metric_value'>3.46</vis-text>，中位数为<vis-text type='metric_value'>8.84</vis-text>，75分位数为<vis-text type='metric_value'>6.89</vis-text>，25分位数为<vis-text type='metric_value'>69.88</vis-text>，标准差为<vis-text type='other_metric_value'>18</vis-text>。通过箱线图检测，<vis-text type='phenomenon'>趋势向好</vis-text>。\"",
+    "reference": [
+      "折线图 - Line Chart 图表属性",
+      "数据文本 - Text 使用示例",
+      "面积图 - Area Chart 使用示例"
+    ]
+  },
+  {
+    "type": "text2chart",
+    "question": "在2023财年的财务报告中，我们注意到业务单元=B部门的运营成本显著上升，具体表现为+15%的增长幅度。这种增长不仅对运营成本的整体波动产生了25%的影响，而且直接拉动了运营成本的增幅达到3.7%。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "在<vis-text type=\"time_desc\">2023财年</vis-text>的财务报告中，我们注意到<vis-text type=\"metric_name\">业务单元=B部门的运营成本</vis-text>显著上升，具体表现为<vis-text type=\"trend_desc\">+15%</vis-text>的增长幅度。这种增长不仅对<vis-text type=\"metric_name\">运营成本</vis-text>的整体波动产生了<vis-text type=\"ratio_value_pos origin=\"0.25\">25%</vis-text>的影响，而且直接拉动了<vis-text type=\"metric_name\">运营成本</vis-text>的增幅达到<vis-text type=\"delta_value_pos origin=\"0.037\">3.7%</vis-text>。\n",
+    "answer": "\"在<vis-text type=\\\"time_desc\\\">2023财年</vis-text>的财务报告中，我们注意到业务单元=B部门的<vis-text type=\\\"metric_name\\\">运营成本</vis-text>显著上升，具体表现为<vis-text type=\\\"delta_value_pos\\\">15%</vis-text>的增长幅度。这种增长不仅对<vis-text type=\\\"metric_name\\\">运营成本</vis-text>的整体波动产生了<vis-text type=\\\"contribute_ratio\\\">25%</vis-text>的影响，而且直接拉动了<vis-text type=\\\"metric_name\\\">运营成本</vis-text>的增幅达到<vis-text type=\\\"ratio_value_pos\\\">3.7%</vis-text>。\"",
+    "reference": [
+      "柱形图 - Column Chart 使用示例",
+      "数据文本 - Text 使用示例"
+    ]
+  },
+  {
+    "type": "text2chart",
+    "question": "今年第一季度，亚洲地区的在线教育平台用户数量已经突破至150,000,000人，与去年同期相比，增长率高达30%，显示出了远程学习的巨大潜力。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "今年<vis-text type=\"time_desc\">第一季度</vis-text>，亚洲地区的<vis-text type=\"metric_name\">在线教育平台用户数量</vis-text>已经突破至<vis-text type=\"metric_value\">150,000,000</vis-text>人，与去年同期相比，增长率高达<vis-text type=\"ratio_value_pos origin=\"0.3\">30%</vis-text>，显示出了远程学习的巨大潜力。\n\n ",
+    "answer": "\"<vis-text type=\\\"time_desc\\\">今年第一季度</vis-text>，亚洲地区的<vis-text type=\\\"metric_name\\\">在线教育平台用户数量</vis-text>已经突破至<vis-text type=\\\"metric_value\\\">150,000,000</vis-text>人，与去年同期相比，增长率高达<vis-text type=\\\"ratio_value_pos\\\">30%</vis-text>，显示出了远程学习的巨大潜力。\"",
+    "reference": [
+      "数据文本 - Text 使用示例",
+      "条形图 - Bar Chart 使用示例"
+    ]
+  },
+  {
+    "type": "text2chart",
+    "question": "本月整体决策准确率为87.6%，环比下降1.2个百分点，但仍高于年度目标2.6个百分点。财务部门表现最佳，准确率达94.3%；人力资源部门表现欠佳，准确率为76.8%，建议加强培训。数据驱动型决策的准确率（91.2%）显著高于经验驱动型决策（82.4%），凸显了数据分析的重要性。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "本月整体决策准确率为<vis-text type=\"metric_value\">87.6%</vis-text>，环比下降<vis-text type=\"delta_value_neg\">1.2个百分点</vis-text>，但仍高于年度目标<vis-text type=\"delta_value_pos\">2.6个百分点</vis-text>。\n\n财务部门表现最佳，准确率达<vis-text type=\"metric_value\">94.3%</vis-text>；人力资源部门表现欠佳，准确率为<vis-text type=\"metric_value\">76.8%</vis-text>，建议加强培训。\n\n数据驱动型决策的准确率<vis-text type=\"metric_value\">91.2%</vis-text>显著高于经验驱动型决策<vis-text type=\"metric_value\">82.4%</vis-text>，凸显了数据分析的重要性。",
+    "answer": "\"<vis-text type=\\\"time_desc\\\">本月</vis-text>整体<vis-text type=\\\"metric_name\\\">决策准确率</vis-text>为<vis-text type=\\\"metric_value\\\">87.6%</vis-text>，环比下降<vis-text type=\\\"ratio_value_neg\\\">1.2个百分点</vis-text>，但仍高于年度目标<vis-text type=\\\"ratio_value_pos\\\">2.6个百分点</vis-text>。<vis-text type=\\\"dim_value\\\">财务部门</vis-text>表现最佳，<vis-text type=\\\"metric_name\\\">准确率</vis-text>达<vis-text type=\\\"metric_value\\\">94.3%</vis-text>；<vis-text type=\\\"dim_value\\\">人力资源部门</vis-text>表现欠佳，<vis-text type=\\\"metric_name\\\">准确率</vis-text>为<vis-text type=\\\"metric_value\\\">76.8%</vis-text>，<vis-text type='phenomenon'>建议加强培训</vis-text>。<vis-text type=\\\"dim_value\\\">数据驱动型决策</vis-text>的<vis-text type=\\\"metric_name\\\">准确率</vis-text>（<vis-text type=\\\"metric_value\\\">91.2%</vis-text>）显著高于<vis-text type=\\\"dim_value\\\">经验驱动型决策</vis-text>（<vis-text type=\\\"metric_value\\\">82.4%</vis-text>），凸显了数据分析的重要性。\"",
+    "reference": [
+      "词云图 - WordCloud Chart 不适用场景",
+      "数据文本 - Text 使用示例",
+      "直方图 - Histogram Chart 不适用场景"
+    ]
+  },
+  {
+    "type": "text2chart",
+    "question": "本季度的整体客户满意度评分为 4.2（满分 5 分），较上季度提升了 0.3 分。按客户生命周期阶段划分，新客户、成长期客户和成熟期客户的满意度评分分别为 3.9、4.3 和 4.5。服务类型方面，技术支持获得了最高的满意度评分 4.6，而产品培训的评分相对较低，为 3.8。通过分析，我们发现客户满意度与问题解决时间呈现负相关，平均问题解决时间从上季度的 48 小时缩短到了 36 小时，这可能是满意度提升的主要原因之一。此外，我们注意到通过在线聊天渠道解决问题的客户满意度普遍高于电话渠道，建议进一步优化在线支持系统。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "本季度的整体客户满意度评分为 <vis-text type=\"metric_value\">4.2</vis-text>（满分 <vis-text type=\"metric_value\">5 分</vis-text>），较上季度提升了 <vis-text type=\"delta_value_pos\">0.3 分</vis-text>。按客户生命周期阶段划分，新客户、成长期客户和成熟期客户的满意度评分分别为 <vis-text type=\"metric_value\">3.9</vis-text>、<vis-text type=\"metric_value\">4.3</vis-text> 和 <vis-text type=\"metric_value\">4.5</vis-text>。服务类型方面，技术支持获得了最高的满意度评分 <vis-text type=\"metric_value\">4.6</vis-text>，而产品培训的评分相对较低，为 <vis-text type=\"metric_value\">3.8</vis-text>。通过分析，我们发现客户满意度与问题解决时间呈现负相关，平均问题解决时间从上季度的 <vis-text type=\"metric_value\">48 小时</vis-text> 缩短到了 <vis-text type=\"metric_value\">36 小时</vis-text>，这可能是满意度提升的主要原因之一。此外，我们注意到通过在线聊天渠道解决问题的客户满意度普遍高于电话渠道，建议进一步优化在线支持系统。",
+    "answer": "\"本季度的<vis-text type=\\\"metric_name\\\">整体客户满意度评分</vis-text>为 <vis-text type=\\\"metric_value\\\">4.2</vis-text>（满分 <vis-text type=\\\"metric_value\\\">5分</vis-text>），较上季度提升了 <vis-text type=\\\"delta_value_pos\\\">0.3分</vis-text>。按<vis-text type=\\\"dim_name\\\">客户生命周期阶段</vis-text>划分，<vis-text type=\\\"dim_value\\\">新客户</vis-text>、<vis-text type=\\\"dim_value\\\">成长期客户</vis-text>和<vis-text type=\\\"dim_value\\\">成熟期客户</vis-text>的<vis-text type=\\\"metric_name\\\">满意度评分</vis-text>分别为 <vis-text type=\\\"metric_value\\\">3.9</vis-text>、<vis-text type=\\\"metric_value\\\">4.3</vis-text> 和 <vis-text type=\\\"metric_value\\\">4.5</vis-text>。<vis-text type=\\\"dim_name\\\">服务类型</vis-text>方面，<vis-text type=\\\"dim_value\\\">技术支持</vis-text>获得了最高的<vis-text type=\\\"metric_name\\\">满意度评分</vis-text> <vis-text type=\\\"metric_value\\\">4.6</vis-text>，而<vis-text type=\\\"dim_value\\\">产品培训</vis-text>的评分相对较低，为 <vis-text type=\\\"metric_value\\\">3.8</vis-text>。通过分析，我们发现<vis-text type=\\\"metric_name\\\">客户满意度</vis-text>与<vis-text type=\\\"metric_name\\\">问题解决时间</vis-text><vis-text type='phenomenon'>呈现负相关</vis-text>，<vis-text type=\\\"metric_name\\\">平均问题解决时间</vis-text>从上季度的<vis-text type=\\\"metric_value\\\">48小时</vis-text>缩短到了 <vis-text type=\\\"metric_value\\\">36小时</vis-text>，这可能是<vis-text type=\\\"metric_name\\\">满意度提升</vis-text>的主要原因之一。此外，我们注意到通过<vis-text type=\\\"dim_value\\\">在线聊天渠道</vis-text>解决问题的<vis-text type=\\\"metric_name\\\">客户满意度</vis-text>普遍高于<vis-text type=\\\"dim_value\\\">电话渠道</vis-text>，<vis-text type='phenomenon'>建议进一步优化在线支持系统。</vis-text>\"",
+    "reference": [
+      "折线图 - Line Chart 使用示例",
+      "雷达图 - Radar Chart 使用示例",
+      "词云图 - WordCloud Chart 使用示例",
+      "数据文本 - Text 使用示例"
+    ]
+  }
+]
diff --git a/evaluations/datastes/chart/text/metrics.json b/evaluations/datastes/chart/text/metrics.json
new file mode 100644
index 0000000..cace9b7
--- /dev/null
+++ b/evaluations/datastes/chart/text/metrics.json
@@ -0,0 +1,117 @@
+[
+  {
+    "type": "text2chart",
+    "question": "2023年，全球气温平均值14.8°C，对比上个世纪末+1.2°C，变化率+8%。近年来，气候变化成为全球关注焦点，2023年的全球气温平均值达到了历史高点，与上个世纪末相比上升了8%，这一现象再次提醒我们加强环境保护的重要性。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "\"<vis-text type=\"time_desc\">2023年</vis-text>，<vis-text type=\"metric_name\">全球气温平均值</vis-text><vis-text type=\"metric_value\">14.8°C</vis-text>，对比上个世纪末<vis-text type=\"delta_value_pos\" origin=\"1.2\">1.2°C</vis-text>，变化率为<vis-text type=\"ratio_value_pos\" origin=\"0.08\">+8%</vis-text>。近年来，<vis-text type=\"phenomenon\">气候变化</vis-text>成为全球关注焦点，<vis-text type=\"time_desc\">2023年</vis-text>的<vis-text type=\"metric_name\">全球气温平均值</vis-text>达到了历史高点，与上个世纪末相比上升了<vis-text type=\"ratio_value_pos\" origin=\"0.08\">8%</vis-text>，这一现象再次提醒我们加强环境保护的重要性。",
+    "answer": "\"<vis-text type=\\\"time_desc\\\">2023年</vis-text>，<vis-text type=metric_name>全球气温平均值</vis-text><vis-text type=metric_value>14.8°C</vis-text>，对比<vis-text type=time_desc>上个世纪末</vis-text><vis-text type=\\\"delta_value_pos\\\" origin=\\\"1.2\\\">1.2°C</vis-text>，变化率<vis-text type=ratio_value_pos origin=\\\"0.08\\\">8%</vis-text>。近年来，气候变化成为全球关注焦点，2023年的全球气温平均值达到了历史高点，与上个世纪末相比上升了<vis-text type=\\\"ratio_value_pos\\\">8%</vis-text>，这一现象再次提醒我们加强环境保护的重要性。\"",
+    "reference": [
+      "词云图 - WordCloud Chart 使用示例",
+      "数据文本 - Text 使用示例",
+      "思维导图 - Mind Map 使用示例",
+      "面积图 - Area Chart 使用示例"
+    ],
+    "correctness": 0.5639259014801932
+  },
+  {
+    "type": "text2chart",
+    "question": "原文为：过去一年，网站访问量120万次，对比前一年+30万次，变化率+33%。在过去的一年里，我们的网站访问量有了显著的增长，与前一年相比增加了33%，这归功于新营销活动的成功执行和用户体验的持续改进。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "\"<vis-text type=\"time_desc\">过去一年</vis-text>，<vis-text type=\"metric_name\">网站访问量</vis-text>为<vis-text type=\"metric_value\">120万次</vis-text>，对比<vis-text type=time_desc>前一年</vis-text><vis-text type=\"delta_value_pos origin=\\\"30万次\\\">30万次</vis-text>，变化率<vis-text type=\"ratio_value_pos origin=\\\"0.33\\\">33%</vis-text>。在过去的一年里，我们的<vis-text type=\"metric_name\">网站访问量</vis-text>有了显著的增长，与前一年相比增加了<vis-text type=\"ratio_value_pos origin=\\\"0.33\\\">33%</vis-text>，这归功于新营销活动的成功执行和用户体验的持续改进。\n\n",
+    "answer": "\"<vis-text type=\\\"time_desc\\\">过去一年</vis-text>，<vis-text type=metric_name>网站访问量</vis-text><vis-text type=metric_value>120万次</vis-text>，对比<vis-text type=time_desc>前一年</vis-text><vis-text type=\\\"delta_value_pos\\\" origin=\\\"30万\\\">30万次</vis-text>，变化率<vis-text type=ratio_value_pos origin=\\\"0.33\\\">33%</vis-text>。在过去的一年里，我们的网站访问量有了显著的增长，与前一年相比增加了<vis-text type=\\\"delta_value_pos\\\">33%</vis-text>，这归功于新营销活动的成功执行和用户体验的持续改进。\"",
+    "reference": [
+      "折线图 - Line Chart 使用示例",
+      "数据文本 - Text 使用示例"
+    ],
+    "correctness": 0.6232502388407516
+  },
+  {
+    "type": "text2chart",
+    "question": "用订单状态对产品回收率拆分后，根据皮尔逊相关系数分析指标相关性，已发货趋势分布与指标总趋势相似性最大，相似性系数为88.9%；已付款趋势分布与指标总趋势相似性最小，相似性系数为-53.0%。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "用订单状态对<vis-text type='dim_name'>产品回收率</vis-text>拆分后，根据皮尔逊相关系数分析指标相关性，<vis-text type='dim_value'>已发货</vis-text>趋势分布与指标总趋势相似性最大，相似性系数为<vis-text type='metric_value' origin='88.9'>88.9%</vis-text>；<vis-text type='dim_value'>已付款</vis-text>趋势分布与指标总趋势相似性最小，相似性系数为<vis-text type='metric_value' origin='-53.0'>-53.0%</vis-text>。",
+    "answer": "\"用<vis-text type='dim_name'>订单状态</vis-text>对<vis-text type='metric_name'>产品回收率</vis-text>拆分后，根据皮尔逊相关系数分析指标相关性，<vis-text type='dim_value'>已发货</vis-text>趋势分布与指标总趋势相似性最大，相似性系数为<vis-text type='metric_value' origin='0.889026234579'>88.9%</vis-text>；<vis-text type=dim_value>已付款</vis-text>趋势分布与指标总趋势相似性最小，相似性系数为<vis-text type='metric_value' origin='-0.529969015182'>-53.0%</vis-text>。\"",
+    "reference": [
+      "[WIP]双轴图 - DualAxes Chart 适用场景",
+      "折线图 - Line Chart 使用示例",
+      "数据文本 - Text 使用示例"
+    ],
+    "correctness": 0.8421052631578946
+  },
+  {
+    "type": "text2chart",
+    "question": "通过文本实体识别增强，将下面内容输出为增强 markdown 内容：用订单商品折扣、订单金额、商品尺寸对移动端访问量进行组合下钻： 1. 订单商品折扣组合中订单商品折扣=0.2指标值为8.95千亿，具有主导性，值得关注。该组合中最大值为53.5，最小值为26.26，均值为49.23，中位数为27.72，75分位数为31.92，25分位数为51.56。 2. 订单商品折扣、订单金额&商品尺寸，各维度组合下的指标未发现异常。",
+    "response": "用<vis-text type=\"dim_name\">订单商品折扣</vis-text>、<vis-text type=\"dim_name\">订单金额</vis-text>、<vis-text type=\"dim_name\">商品尺寸</vis-text>对<vis-text type=\"metric_name\">移动端访问量</vis-text>进行组合下钻： 1. <vis-text type=\"dim_name\">订单商品折扣组合</vis-text>中<vis-text type=\"metric_name\">订单商品折扣</vis-text>=<vis-text type=\"metric_value\">0.2</vis-text>指标值为<vis-text type=\"metric_value\">8.95千亿</vis-text>，具有主导性，值得关注。该组合中最大值为<vis-text type=\"metric_value\">53.5</vis-text>，最小值为<vis-text type=\"metric_value\">26.26</vis-text>，均值为<vis-text type=\"metric_value\">49.23</vis-text>，中位数为<vis-text type=\"metric_value\">27.72</vis-text>，75分位数为<vis-text type=\"metric_value\">31.92</vis-text>，25分位数为<vis-text type=\"metric_value\">51.56</vis-text>。 2. <vis-text type=\"dim_name\">订单商品折扣</vis-text>、<vis-text type=\"dim_name\">订单金额</vis-text>&<vis-text type=\"dim_name\">商品尺寸</vis-text>，各维度组合下的指标未发现异常。 ",
+    "answer": "\"用<vis-text type='dim_name'>订单商品折扣</vis-text>、<vis-text type='dim_name'>订单金额</vis-text>、<vis-text type='dim_name'>商品尺寸</vis-text>对<vis-text type='metric_name'>移动端访问量</vis-text>进行组合下钻：\\n1. <vis-text type='dim_name'>订单商品折扣</vis-text>组合中<vis-text type='dim_name'>订单商品折扣</vis-text>=<vis-text type='dim_value'>0.2</vis-text>指标值为<vis-text type='metric_value'>8.95千亿</vis-text>，具有主导性，值得关注。该组合中最大值为<vis-text type='metric_value'>53.5</vis-text>，最小值为<vis-text type='metric_value'>26.26</vis-text>，均值为<vis-text type='metric_value'>49.23</vis-text>，中位数为<vis-text type='metric_value'>27.72</vis-text>，75分位数为<vis-text type='metric_value'>31.92</vis-text>，25分位数为<vis-text type='metric_value'>51.56</vis-text>。 \\n2. <vis-text type='dim_name'>订单商品折扣</vis-text>、<vis-text type='dim_name'>订单金额</vis-text>&<vis-text type='dim_name'>商品尺寸</vis-text>，各维度组合下的指标<vis-text type='phenomenon'>未发现异常</vis-text>。\"",
+    "reference": [
+      "数据文本 - Text 使用示例"
+    ],
+    "correctness": 0.947155405719913
+  },
+  {
+    "type": "text2chart",
+    "question": "基于PROPHET算法预测，未来预计截止至2020-05-13，所有商品颜色数量的预测值保持快速上升，分别是：蓝色-预测值为0.88%，红色-预测值为-90.02%。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "基于PROPHET算法预测，未来预计截止至<vis-text type=\"time_desc\">2020-05-13</vis-text>，所有商品颜色数量的预测值保持快速上升，分别是：<vis-text type=\"dim_value\">蓝色</vis-text>-预测值为<vis-text type=\"metric_value\">0.88%</vis-text>，<vis-text type=\"dim_value\">红色</vis-text>-预测值为<vis-text type=\"metric_value\">-90.02%</vis-text>。\n\n",
+    "answer": "\"基于PROPHET算法预测，未来预计截止至<vis-text type='time_desc'>2020-05-13</vis-text>，所有<vis-text type='dim_name'>商品颜色</vis-text><vis-text type='metric_name'>数量</vis-text>的预测值<vis-text type='phenomenon'>保持快速上升</vis-text>，分别是：<vis-text type='dim_value'>蓝色</vis-text>-预测值为<vis-text type='metric_value' origin='0.008775585299'>0.88%</vis-text>，<vis-text type='dim_value'>红色</vis-text>-预测值为<vis-text type='metric_value' origin='-0.900171200013'>-90.02%</vis-text>。\"",
+    "reference": [
+      "数据文本 - Text 使用示例"
+    ],
+    "correctness": 0.7800134951599099
+  },
+  {
+    "type": "text2chart",
+    "question": "原文为：客户净推荐值根据等距分桶策略，桶数为57，步长为9.99百万。该样本最大值为151.56，最小值为1.07，均值为3.46，中位数为8.84，75分位数为6.89，25分位数为69.88，标准差为18。通过箱线图检测，趋势向好。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "<vis-text type=\"metric_name\">客户净推荐值</vis-text>根据等距分桶策略，桶数为<vis-text type=\"metric_value\">57</vis-text>，步长为<vis-text type=\"metric_value\">9.99百万</vis-text>。该样本最大值为<vis-text type=\"metric_value\">151.56</vis-text>，最小值为<vis-text type=\"metric_value\">1.07</vis-text>，均值为<vis-text type=\"metric_value\">3.46</vis-text>，中位数为<vis-text type=\"metric_value\">8.84</vis-text>，75分位数为<vis-text type=\"metric_value\">6.89</vis-text>，25分位数为<vis-text type=\"metric_value\">69.88</vis-text>，标准差为<vis-text type=\"metric_value\">18</vis-text>。通过<vis-text type=\"metric_name\">箱线图</vis-text>检测，<vis-text type=\"trend_desc\">趋势向好</vis-text>。 ",
+    "answer": "\"<vis-text type='metric_name'>客户净推荐值</vis-text>根据等距分桶策略，桶数为<vis-text type='other_metric_value'>57</vis-text>，步长为<vis-text type='other_metric_value'>9.99百万</vis-text>。该样本最大值为<vis-text type='metric_value'>151.56</vis-text>，最小值为<vis-text type='metric_value'>1.07</vis-text>，均值为<vis-text type='metric_value'>3.46</vis-text>，中位数为<vis-text type='metric_value'>8.84</vis-text>，75分位数为<vis-text type='metric_value'>6.89</vis-text>，25分位数为<vis-text type='metric_value'>69.88</vis-text>，标准差为<vis-text type='other_metric_value'>18</vis-text>。通过箱线图检测，<vis-text type='phenomenon'>趋势向好</vis-text>。\"",
+    "reference": [
+      "折线图 - Line Chart 图表属性",
+      "数据文本 - Text 使用示例",
+      "面积图 - Area Chart 使用示例"
+    ],
+    "correctness": 0.8763463818528441
+  },
+  {
+    "type": "text2chart",
+    "question": "在2023财年的财务报告中，我们注意到业务单元=B部门的运营成本显著上升，具体表现为+15%的增长幅度。这种增长不仅对运营成本的整体波动产生了25%的影响，而且直接拉动了运营成本的增幅达到3.7%。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "在<vis-text type=\"time_desc\">2023财年</vis-text>的财务报告中，我们注意到<vis-text type=\"metric_name\">业务单元=B部门的运营成本</vis-text>显著上升，具体表现为<vis-text type=\"trend_desc\">+15%</vis-text>的增长幅度。这种增长不仅对<vis-text type=\"metric_name\">运营成本</vis-text>的整体波动产生了<vis-text type=\"ratio_value_pos origin=\"0.25\">25%</vis-text>的影响，而且直接拉动了<vis-text type=\"metric_name\">运营成本</vis-text>的增幅达到<vis-text type=\"delta_value_pos origin=\"0.037\">3.7%</vis-text>。\n",
+    "answer": "\"在<vis-text type=\\\"time_desc\\\">2023财年</vis-text>的财务报告中，我们注意到业务单元=B部门的<vis-text type=\\\"metric_name\\\">运营成本</vis-text>显著上升，具体表现为<vis-text type=\\\"delta_value_pos\\\">15%</vis-text>的增长幅度。这种增长不仅对<vis-text type=\\\"metric_name\\\">运营成本</vis-text>的整体波动产生了<vis-text type=\\\"contribute_ratio\\\">25%</vis-text>的影响，而且直接拉动了<vis-text type=\\\"metric_name\\\">运营成本</vis-text>的增幅达到<vis-text type=\\\"ratio_value_pos\\\">3.7%</vis-text>。\"",
+    "reference": [
+      "柱形图 - Column Chart 使用示例",
+      "数据文本 - Text 使用示例"
+    ],
+    "correctness": 0.7604312428023119
+  },
+  {
+    "type": "text2chart",
+    "question": "今年第一季度，亚洲地区的在线教育平台用户数量已经突破至150,000,000人，与去年同期相比，增长率高达30%，显示出了远程学习的巨大潜力。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "今年<vis-text type=\"time_desc\">第一季度</vis-text>，亚洲地区的<vis-text type=\"metric_name\">在线教育平台用户数量</vis-text>已经突破至<vis-text type=\"metric_value\">150,000,000</vis-text>人，与去年同期相比，增长率高达<vis-text type=\"ratio_value_pos origin=\"0.3\">30%</vis-text>，显示出了远程学习的巨大潜力。\n\n ",
+    "answer": "\"<vis-text type=\\\"time_desc\\\">今年第一季度</vis-text>，亚洲地区的<vis-text type=\\\"metric_name\\\">在线教育平台用户数量</vis-text>已经突破至<vis-text type=\\\"metric_value\\\">150,000,000</vis-text>人，与去年同期相比，增长率高达<vis-text type=\\\"ratio_value_pos\\\">30%</vis-text>，显示出了远程学习的巨大潜力。\"",
+    "reference": [
+      "数据文本 - Text 使用示例",
+      "条形图 - Bar Chart 使用示例"
+    ],
+    "correctness": 0.8006407690254358
+  },
+  {
+    "type": "text2chart",
+    "question": "本月整体决策准确率为87.6%，环比下降1.2个百分点，但仍高于年度目标2.6个百分点。财务部门表现最佳，准确率达94.3%；人力资源部门表现欠佳，准确率为76.8%，建议加强培训。数据驱动型决策的准确率（91.2%）显著高于经验驱动型决策（82.4%），凸显了数据分析的重要性。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "本月整体决策准确率为<vis-text type=\"metric_value\">87.6%</vis-text>，环比下降<vis-text type=\"delta_value_neg\">1.2个百分点</vis-text>，但仍高于年度目标<vis-text type=\"delta_value_pos\">2.6个百分点</vis-text>。\n\n财务部门表现最佳，准确率达<vis-text type=\"metric_value\">94.3%</vis-text>；人力资源部门表现欠佳，准确率为<vis-text type=\"metric_value\">76.8%</vis-text>，建议加强培训。\n\n数据驱动型决策的准确率<vis-text type=\"metric_value\">91.2%</vis-text>显著高于经验驱动型决策<vis-text type=\"metric_value\">82.4%</vis-text>，凸显了数据分析的重要性。",
+    "answer": "\"<vis-text type=\\\"time_desc\\\">本月</vis-text>整体<vis-text type=\\\"metric_name\\\">决策准确率</vis-text>为<vis-text type=\\\"metric_value\\\">87.6%</vis-text>，环比下降<vis-text type=\\\"ratio_value_neg\\\">1.2个百分点</vis-text>，但仍高于年度目标<vis-text type=\\\"ratio_value_pos\\\">2.6个百分点</vis-text>。<vis-text type=\\\"dim_value\\\">财务部门</vis-text>表现最佳，<vis-text type=\\\"metric_name\\\">准确率</vis-text>达<vis-text type=\\\"metric_value\\\">94.3%</vis-text>；<vis-text type=\\\"dim_value\\\">人力资源部门</vis-text>表现欠佳，<vis-text type=\\\"metric_name\\\">准确率</vis-text>为<vis-text type=\\\"metric_value\\\">76.8%</vis-text>，<vis-text type='phenomenon'>建议加强培训</vis-text>。<vis-text type=\\\"dim_value\\\">数据驱动型决策</vis-text>的<vis-text type=\\\"metric_name\\\">准确率</vis-text>（<vis-text type=\\\"metric_value\\\">91.2%</vis-text>）显著高于<vis-text type=\\\"dim_value\\\">经验驱动型决策</vis-text>（<vis-text type=\\\"metric_value\\\">82.4%</vis-text>），凸显了数据分析的重要性。\"",
+    "reference": [
+      "词云图 - WordCloud Chart 不适用场景",
+      "数据文本 - Text 使用示例",
+      "直方图 - Histogram Chart 不适用场景"
+    ],
+    "correctness": 0.5723667006740041
+  },
+  {
+    "type": "text2chart",
+    "question": "本季度的整体客户满意度评分为 4.2（满分 5 分），较上季度提升了 0.3 分。按客户生命周期阶段划分，新客户、成长期客户和成熟期客户的满意度评分分别为 3.9、4.3 和 4.5。服务类型方面，技术支持获得了最高的满意度评分 4.6，而产品培训的评分相对较低，为 3.8。通过分析，我们发现客户满意度与问题解决时间呈现负相关，平均问题解决时间从上季度的 48 小时缩短到了 36 小时，这可能是满意度提升的主要原因之一。此外，我们注意到通过在线聊天渠道解决问题的客户满意度普遍高于电话渠道，建议进一步优化在线支持系统。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "response": "本季度的整体客户满意度评分为 <vis-text type=\"metric_value\">4.2</vis-text>（满分 <vis-text type=\"metric_value\">5 分</vis-text>），较上季度提升了 <vis-text type=\"delta_value_pos\">0.3 分</vis-text>。按客户生命周期阶段划分，新客户、成长期客户和成熟期客户的满意度评分分别为 <vis-text type=\"metric_value\">3.9</vis-text>、<vis-text type=\"metric_value\">4.3</vis-text> 和 <vis-text type=\"metric_value\">4.5</vis-text>。服务类型方面，技术支持获得了最高的满意度评分 <vis-text type=\"metric_value\">4.6</vis-text>，而产品培训的评分相对较低，为 <vis-text type=\"metric_value\">3.8</vis-text>。通过分析，我们发现客户满意度与问题解决时间呈现负相关，平均问题解决时间从上季度的 <vis-text type=\"metric_value\">48 小时</vis-text> 缩短到了 <vis-text type=\"metric_value\">36 小时</vis-text>，这可能是满意度提升的主要原因之一。此外，我们注意到通过在线聊天渠道解决问题的客户满意度普遍高于电话渠道，建议进一步优化在线支持系统。",
+    "answer": "\"本季度的<vis-text type=\\\"metric_name\\\">整体客户满意度评分</vis-text>为 <vis-text type=\\\"metric_value\\\">4.2</vis-text>（满分 <vis-text type=\\\"metric_value\\\">5分</vis-text>），较上季度提升了 <vis-text type=\\\"delta_value_pos\\\">0.3分</vis-text>。按<vis-text type=\\\"dim_name\\\">客户生命周期阶段</vis-text>划分，<vis-text type=\\\"dim_value\\\">新客户</vis-text>、<vis-text type=\\\"dim_value\\\">成长期客户</vis-text>和<vis-text type=\\\"dim_value\\\">成熟期客户</vis-text>的<vis-text type=\\\"metric_name\\\">满意度评分</vis-text>分别为 <vis-text type=\\\"metric_value\\\">3.9</vis-text>、<vis-text type=\\\"metric_value\\\">4.3</vis-text> 和 <vis-text type=\\\"metric_value\\\">4.5</vis-text>。<vis-text type=\\\"dim_name\\\">服务类型</vis-text>方面，<vis-text type=\\\"dim_value\\\">技术支持</vis-text>获得了最高的<vis-text type=\\\"metric_name\\\">满意度评分</vis-text> <vis-text type=\\\"metric_value\\\">4.6</vis-text>，而<vis-text type=\\\"dim_value\\\">产品培训</vis-text>的评分相对较低，为 <vis-text type=\\\"metric_value\\\">3.8</vis-text>。通过分析，我们发现<vis-text type=\\\"metric_name\\\">客户满意度</vis-text>与<vis-text type=\\\"metric_name\\\">问题解决时间</vis-text><vis-text type='phenomenon'>呈现负相关</vis-text>，<vis-text type=\\\"metric_name\\\">平均问题解决时间</vis-text>从上季度的<vis-text type=\\\"metric_value\\\">48小时</vis-text>缩短到了 <vis-text type=\\\"metric_value\\\">36小时</vis-text>，这可能是<vis-text type=\\\"metric_name\\\">满意度提升</vis-text>的主要原因之一。此外，我们注意到通过<vis-text type=\\\"dim_value\\\">在线聊天渠道</vis-text>解决问题的<vis-text type=\\\"metric_name\\\">客户满意度</vis-text>普遍高于<vis-text type=\\\"dim_value\\\">电话渠道</vis-text>，<vis-text type='phenomenon'>建议进一步优化在线支持系统。</vis-text>\"",
+    "reference": [
+      "折线图 - Line Chart 使用示例",
+      "雷达图 - Radar Chart 使用示例",
+      "词云图 - WordCloud Chart 使用示例",
+      "数据文本 - Text 使用示例"
+    ],
+    "correctness": 0.5691744065414986
+  }
+]
diff --git a/evaluations/datastes/chart/text/test.json b/evaluations/datastes/chart/text/test.json
new file mode 100644
index 0000000..92fd397
--- /dev/null
+++ b/evaluations/datastes/chart/text/test.json
@@ -0,0 +1,52 @@
+[
+  {
+    "type": "text2chart",
+    "question": "2023年，全球气温平均值14.8°C，对比上个世纪末+1.2°C，变化率+8%。近年来，气候变化成为全球关注焦点，2023年的全球气温平均值达到了历史高点，与上个世纪末相比上升了8%，这一现象再次提醒我们加强环境保护的重要性。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "answer": "<vis-text type=\"time_desc\">2023年</vis-text>，<vis-text type=metric_name>全球气温平均值</vis-text><vis-text type=metric_value>14.8°C</vis-text>，对比<vis-text type=time_desc>上个世纪末</vis-text><vis-text type=\"delta_value_pos\" origin=\"1.2\">1.2°C</vis-text>，变化率<vis-text type=ratio_value_pos origin=\"0.08\">8%</vis-text>。近年来，气候变化成为全球关注焦点，2023年的全球气温平均值达到了历史高点，与上个世纪末相比上升了<vis-text type=\"ratio_value_pos\">8%</vis-text>，这一现象再次提醒我们加强环境保护的重要性。"
+  },
+  {
+    "type": "text2chart",
+    "question": "原文为：过去一年，网站访问量120万次，对比前一年+30万次，变化率+33%。在过去的一年里，我们的网站访问量有了显著的增长，与前一年相比增加了33%，这归功于新营销活动的成功执行和用户体验的持续改进。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "answer": "<vis-text type=\"time_desc\">过去一年</vis-text>，<vis-text type=metric_name>网站访问量</vis-text><vis-text type=metric_value>120万次</vis-text>，对比<vis-text type=time_desc>前一年</vis-text><vis-text type=\"delta_value_pos\" origin=\"30万\">30万次</vis-text>，变化率<vis-text type=ratio_value_pos origin=\"0.33\">33%</vis-text>。在过去的一年里，我们的网站访问量有了显著的增长，与前一年相比增加了<vis-text type=\"delta_value_pos\">33%</vis-text>，这归功于新营销活动的成功执行和用户体验的持续改进。"
+  },
+  {
+    "type": "text2chart",
+    "question": "用订单状态对产品回收率拆分后，根据皮尔逊相关系数分析指标相关性，已发货趋势分布与指标总趋势相似性最大，相似性系数为88.9%；已付款趋势分布与指标总趋势相似性最小，相似性系数为-53.0%。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "answer": "用<vis-text type='dim_name'>订单状态</vis-text>对<vis-text type='metric_name'>产品回收率</vis-text>拆分后，根据皮尔逊相关系数分析指标相关性，<vis-text type='dim_value'>已发货</vis-text>趋势分布与指标总趋势相似性最大，相似性系数为<vis-text type='metric_value' origin='0.889026234579'>88.9%</vis-text>；<vis-text type=dim_value>已付款</vis-text>趋势分布与指标总趋势相似性最小，相似性系数为<vis-text type='metric_value' origin='-0.529969015182'>-53.0%</vis-text>。"
+  },
+  {
+    "type": "text2chart",
+    "question": "通过文本实体识别增强，将下面内容输出为增强 markdown 内容：用订单商品折扣、订单金额、商品尺寸对移动端访问量进行组合下钻： 1. 订单商品折扣组合中订单商品折扣=0.2指标值为8.95千亿，具有主导性，值得关注。该组合中最大值为53.5，最小值为26.26，均值为49.23，中位数为27.72，75分位数为31.92，25分位数为51.56。 2. 订单商品折扣、订单金额&商品尺寸，各维度组合下的指标未发现异常。",
+    "answer": "用<vis-text type='dim_name'>订单商品折扣</vis-text>、<vis-text type='dim_name'>订单金额</vis-text>、<vis-text type='dim_name'>商品尺寸</vis-text>对<vis-text type='metric_name'>移动端访问量</vis-text>进行组合下钻：\n1. <vis-text type='dim_name'>订单商品折扣</vis-text>组合中<vis-text type='dim_name'>订单商品折扣</vis-text>=<vis-text type='dim_value'>0.2</vis-text>指标值为<vis-text type='metric_value'>8.95千亿</vis-text>，具有主导性，值得关注。该组合中最大值为<vis-text type='metric_value'>53.5</vis-text>，最小值为<vis-text type='metric_value'>26.26</vis-text>，均值为<vis-text type='metric_value'>49.23</vis-text>，中位数为<vis-text type='metric_value'>27.72</vis-text>，75分位数为<vis-text type='metric_value'>31.92</vis-text>，25分位数为<vis-text type='metric_value'>51.56</vis-text>。 \n2. <vis-text type='dim_name'>订单商品折扣</vis-text>、<vis-text type='dim_name'>订单金额</vis-text>&<vis-text type='dim_name'>商品尺寸</vis-text>，各维度组合下的指标<vis-text type='phenomenon'>未发现异常</vis-text>。"
+  },
+  {
+    "type": "text2chart",
+    "question": "基于PROPHET算法预测，未来预计截止至2020-05-13，所有商品颜色数量的预测值保持快速上升，分别是：蓝色-预测值为0.88%，红色-预测值为-90.02%。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "answer": "基于PROPHET算法预测，未来预计截止至<vis-text type='time_desc'>2020-05-13</vis-text>，所有<vis-text type='dim_name'>商品颜色</vis-text><vis-text type='metric_name'>数量</vis-text>的预测值<vis-text type='phenomenon'>保持快速上升</vis-text>，分别是：<vis-text type='dim_value'>蓝色</vis-text>-预测值为<vis-text type='metric_value' origin='0.008775585299'>0.88%</vis-text>，<vis-text type='dim_value'>红色</vis-text>-预测值为<vis-text type='metric_value' origin='-0.900171200013'>-90.02%</vis-text>。"
+  },
+  {
+    "type": "text2chart",
+    "question": "原文为：客户净推荐值根据等距分桶策略，桶数为57，步长为9.99百万。该样本最大值为151.56，最小值为1.07，均值为3.46，中位数为8.84，75分位数为6.89，25分位数为69.88，标准差为18。通过箱线图检测，趋势向好。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "answer": "<vis-text type='metric_name'>客户净推荐值</vis-text>根据等距分桶策略，桶数为<vis-text type='other_metric_value'>57</vis-text>，步长为<vis-text type='other_metric_value'>9.99百万</vis-text>。该样本最大值为<vis-text type='metric_value'>151.56</vis-text>，最小值为<vis-text type='metric_value'>1.07</vis-text>，均值为<vis-text type='metric_value'>3.46</vis-text>，中位数为<vis-text type='metric_value'>8.84</vis-text>，75分位数为<vis-text type='metric_value'>6.89</vis-text>，25分位数为<vis-text type='metric_value'>69.88</vis-text>，标准差为<vis-text type='other_metric_value'>18</vis-text>。通过箱线图检测，<vis-text type='phenomenon'>趋势向好</vis-text>。"
+  },
+  {
+    "type": "text2chart",
+    "question": "在2023财年的财务报告中，我们注意到业务单元=B部门的运营成本显著上升，具体表现为+15%的增长幅度。这种增长不仅对运营成本的整体波动产生了25%的影响，而且直接拉动了运营成本的增幅达到3.7%。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "answer": "在<vis-text type=\"time_desc\">2023财年</vis-text>的财务报告中，我们注意到业务单元=B部门的<vis-text type=\"metric_name\">运营成本</vis-text>显著上升，具体表现为<vis-text type=\"delta_value_pos\">15%</vis-text>的增长幅度。这种增长不仅对<vis-text type=\"metric_name\">运营成本</vis-text>的整体波动产生了<vis-text type=\"contribute_ratio\">25%</vis-text>的影响，而且直接拉动了<vis-text type=\"metric_name\">运营成本</vis-text>的增幅达到<vis-text type=\"ratio_value_pos\">3.7%</vis-text>。"
+  },
+  {
+    "type": "text2chart",
+    "question": "今年第一季度，亚洲地区的在线教育平台用户数量已经突破至150,000,000人，与去年同期相比，增长率高达30%，显示出了远程学习的巨大潜力。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "answer": "<vis-text type=\"time_desc\">今年第一季度</vis-text>，亚洲地区的<vis-text type=\"metric_name\">在线教育平台用户数量</vis-text>已经突破至<vis-text type=\"metric_value\">150,000,000</vis-text>人，与去年同期相比，增长率高达<vis-text type=\"ratio_value_pos\">30%</vis-text>，显示出了远程学习的巨大潜力。"
+  },
+  {
+    "type": "text2chart",
+    "question": "本月整体决策准确率为87.6%，环比下降1.2个百分点，但仍高于年度目标2.6个百分点。财务部门表现最佳，准确率达94.3%；人力资源部门表现欠佳，准确率为76.8%，建议加强培训。数据驱动型决策的准确率（91.2%）显著高于经验驱动型决策（82.4%），凸显了数据分析的重要性。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "answer": "<vis-text type=\"time_desc\">本月</vis-text>整体<vis-text type=\"metric_name\">决策准确率</vis-text>为<vis-text type=\"metric_value\">87.6%</vis-text>，环比下降<vis-text type=\"ratio_value_neg\">1.2个百分点</vis-text>，但仍高于年度目标<vis-text type=\"ratio_value_pos\">2.6个百分点</vis-text>。<vis-text type=\"dim_value\">财务部门</vis-text>表现最佳，<vis-text type=\"metric_name\">准确率</vis-text>达<vis-text type=\"metric_value\">94.3%</vis-text>；<vis-text type=\"dim_value\">人力资源部门</vis-text>表现欠佳，<vis-text type=\"metric_name\">准确率</vis-text>为<vis-text type=\"metric_value\">76.8%</vis-text>，<vis-text type='phenomenon'>建议加强培训</vis-text>。<vis-text type=\"dim_value\">数据驱动型决策</vis-text>的<vis-text type=\"metric_name\">准确率</vis-text>（<vis-text type=\"metric_value\">91.2%</vis-text>）显著高于<vis-text type=\"dim_value\">经验驱动型决策</vis-text>（<vis-text type=\"metric_value\">82.4%</vis-text>），凸显了数据分析的重要性。"
+  },
+  {
+    "type": "text2chart",
+    "question": "本季度的整体客户满意度评分为 4.2（满分 5 分），较上季度提升了 0.3 分。按客户生命周期阶段划分，新客户、成长期客户和成熟期客户的满意度评分分别为 3.9、4.3 和 4.5。服务类型方面，技术支持获得了最高的满意度评分 4.6，而产品培训的评分相对较低，为 3.8。通过分析，我们发现客户满意度与问题解决时间呈现负相关，平均问题解决时间从上季度的 48 小时缩短到了 36 小时，这可能是满意度提升的主要原因之一。此外，我们注意到通过在线聊天渠道解决问题的客户满意度普遍高于电话渠道，建议进一步优化在线支持系统。通过文本实体识别增强，输出增强 markdown 内容为：",
+    "answer": "本季度的<vis-text type=\"metric_name\">整体客户满意度评分</vis-text>为 <vis-text type=\"metric_value\">4.2</vis-text>（满分 <vis-text type=\"metric_value\">5分</vis-text>），较上季度提升了 <vis-text type=\"delta_value_pos\">0.3分</vis-text>。按<vis-text type=\"dim_name\">客户生命周期阶段</vis-text>划分，<vis-text type=\"dim_value\">新客户</vis-text>、<vis-text type=\"dim_value\">成长期客户</vis-text>和<vis-text type=\"dim_value\">成熟期客户</vis-text>的<vis-text type=\"metric_name\">满意度评分</vis-text>分别为 <vis-text type=\"metric_value\">3.9</vis-text>、<vis-text type=\"metric_value\">4.3</vis-text> 和 <vis-text type=\"metric_value\">4.5</vis-text>。<vis-text type=\"dim_name\">服务类型</vis-text>方面，<vis-text type=\"dim_value\">技术支持</vis-text>获得了最高的<vis-text type=\"metric_name\">满意度评分</vis-text> <vis-text type=\"metric_value\">4.6</vis-text>，而<vis-text type=\"dim_value\">产品培训</vis-text>的评分相对较低，为 <vis-text type=\"metric_value\">3.8</vis-text>。通过分析，我们发现<vis-text type=\"metric_name\">客户满意度</vis-text>与<vis-text type=\"metric_name\">问题解决时间</vis-text><vis-text type='phenomenon'>呈现负相关</vis-text>，<vis-text type=\"metric_name\">平均问题解决时间</vis-text>从上季度的<vis-text type=\"metric_value\">48小时</vis-text>缩短到了 <vis-text type=\"metric_value\">36小时</vis-text>，这可能是<vis-text type=\"metric_name\">满意度提升</vis-text>的主要原因之一。此外，我们注意到通过<vis-text type=\"dim_value\">在线聊天渠道</vis-text>解决问题的<vis-text type=\"metric_name\">客户满意度</vis-text>普遍高于<vis-text type=\"dim_value\">电话渠道</vis-text>，<vis-text type='phenomenon'>建议进一步优化在线支持系统。</vis-text>"
+  }
+]
diff --git a/evaluations/prompts/narrative-text/agent.md b/evaluations/prompts/narrative-text/agent.md
new file mode 100644
index 0000000..85c9afb
--- /dev/null
+++ b/evaluations/prompts/narrative-text/agent.md
@@ -0,0 +1,46 @@
+# prompt
+
+# 角色:
+
+你擅长识别数据描述文本中不同实体类别的短语，并用 markdown 的标签将他们标识出来，使一段数据文本中重点信息更加突出、易于理解。
+
+## 任务:
+
+- **数据文本样式优化**：优化问题中描述数据文本的样式呈现，优化策略如下：提取实体短语的类型（例如指标名称（metric_name）、趋势描述 (trend_desc)、时间描述 (time_desc)、变化差值（delta_value）等）使用 <vis-text></vis-text> 标签标注，得到重点信息更明确的 markdown 内容作为回答。
+
+## 技能:
+
+- 能够根据数据文本描述内容，识别其中的不同类型的短语，对重要短语进行标注，从而优化数据描述的样式呈现。
+
+## 工作流程:
+
+1. **识别实体短语类型**：从用户给的数据描述文本中，识别和提取短语实体类型，现在内置的有：
+  1. **metric_name**: 指标名称，通常是数据分析中主指标的名称，例如：“单价”，“DAU”,"交易量"，“毛利率”等；
+  2. **dim_name**: 维度名称，通常表达数据分析中可以拆分下钻的维度，例如：“省份”，“城市”，“年龄”，“性别”等；
+  3. **dim_value**: 维度值，下钻维度拆分后的值，例如：“北京”，“女性”，“中年”，“支付宝”等；
+  4. **metric_value**: 指标值，通常跟在主指标 metric_name 或者维度值 dim_value 后面，表示指标具体的数值大小，例如：“1000”，“100 万”，“10%”等；
+  5. **time_desc**: 时间描述，通常限定数据结论的日期范围，比如"2022 年"，"去年"，"12 点 03 分"，"2023-01-23"等；
+  6. **trend_desc**: 趋势描述，通常在主指标 metric_name 后面，描述指标的变化趋势，例如："上涨", "下跌","下降"等；
+  7. **delta_value**: 变化差值，一种特殊的指标值，用于描述对比差值 a-b，如上涨 3000，此时 3000 属于变化差值。如果数值为正，类型为 'delta_value_pos'，如果数值为负，类型为 'delta_value_neg'，无法识别正负值时为 'delta_value'。同时文本内容（children）需要进行 abs 处理为绝对值；
+  8. **ratio_value**: 比率值，类似 delta_value，一种特殊的指标值，用于描述对比率 (a-b)/b，如上涨 30%，此时 30% 属于变化率。如果数值为正，类型为 'ratio_value_pos'，如果数值为负，类型为 'ratio_value_neg'，无法识别正负值时用 'ratio_value'。同时文本内容（children）需要进行 abs 处理为绝对值；
+  9. **proportion**: 占比，也是一种特殊的指标值，表示该指标占总体的比例，通常为百分比数值，跟在“占比”等语义后面的指标，例如："22%"；
+  10. **contribute_ratio**: 贡献度，表示维值或子指标变化对主指标变化的贡献，跟随在 “贡献度”后面的百分比数据，例如：如“贡献度是22%”，则此时22%归为贡献度。
+  11. **phenomenon**: 数据现象的总结与建议，对数据表现情况的分析总结或给用户的行动建议。例如“未发现异常”，“趋势向好”。
+2. **标记短语类型**：将文本中提取到的短语类型，使用 <vis-text type="xxx" origin="xxx"></vis-text> 的形式包裹，其中 type 是上述短语类型，标签内部为原短语文本值。origin: 可选，可以是任意类型，用于存储原始数据，比如未经格式化的指标值、占比、趋势详情等，如 1789.23, 0.34, [1, 2, 6, 18, 24, 48] 等；
+3. **生成完整 markdown 格式**：将经过标记短语类型的文本，输出为增强 markdown 格式，可以进行段落排版，文本内容不发生变化，。
+
+## 限制:
+
+- 输出 markdown 格式的回答结果，回答和输入相比，除了标注出识别出的实体短语外，内容本身不要发生变化，不需要额外附加信息和解释。
+
+
+## 参考例子:
+- 用户输入: 其中，该项维值组合下 平均客单价 为11.53，对主指标波动的贡献度是64.02%，对主指标的拉动为2.66%。
+- 回答: 其中，该项维值组合下 <vis-text type=metric_name>平均客单价</vis-text> 为<vis-text type=delta_value_pos origin="11.53">11.53</vis-text>，对<vis-text type=metric_name>主指标</vis-text>波动的贡献度是<vis-text type=contribute_ratio origin=“0.6401681186288602”>64.02%</vis-text>，对<vis-text type=metric_name>主指标</vis-text>的拉动为<vis-text type=ratio_value_pos origin=“0.026580823418271567”>2.66%</vis-text>。
+- 用户输入: 该项维值组合下分母占总体分母的比例为0.00%，对主指标波动的贡献度是-0.40%，对主指标的拉动为-0.02%。
+- 回答: 该项维值组合下<vis-text type=metric_name>分母</vis-text>占<vis-text type=metric_name>总体分母</vis-text>的比例为<vis-text type=ratio_value>0.00%</vis-text>，对<vis-text type=metric_name>主指标</vis-text>波动的贡献度是<vis-text type=contribute_ratio origin=“-0.003981412149739211”>-0.40%</vis-text>，对<vis-text type=metric_name>主指标</vis-text>的拉动为<vis-text type=ratio_value_neg origin=“-0.0001653147200367437”>0.02%</vis-text>。
+- 用户输入: 第一季度末，GDP增长率达到2.8%，相较于之前的3.1%，环比下降了0.3%。同时，与上周同期相比，失业率下降了0.2%。
+- 回答: <vis-text type=\"time_desc\">第一季度末</vis-text>，<vis-text type=\"metric_name\">GDP增长率</vis-text>达到<vis-text type=\"metric_value\">2.8%</vis-text>，相较于之前的<vis-text type=\"metric_value\">3.1%</vis-text>，环比<vis-text type=\"trend_desc\">下降</vis-text>了<vis-text type=\"ratio_value_neg\">0.3%</vis-text>。同时，与上周同期相比，<vis-text type=\"metric_name\">失业率</vis-text><vis-text type=\"trend_desc\">下降</vis-text>了<vis-text type=\"delta_value_neg\">0.2%</vis-text>。
+- 用户输入：用客户性别对销售量拆分后，根据皮尔逊相关系数分析指标相关性，男趋势分布与指标总趋势相似性最大，相似性系数为99.54%；女趋势分布与指标总趋势相似性最小，相似性系数为99.54%。
+- 回答：用客户性别对<vis-text type='metric_name'>销售量</vis-text>拆分后，根据皮尔逊相关系数分析指标相关性，<vis-text type='dim_value'>男</vis-text>趋势分布与指标总趋势相似性最大，相似性系数为<vis-text type='metric_value' origin='9.954'>99.54%</vis-text>；<vis-text type=dim_value>女</vis-text>趋势分布与指标总趋势相似性最小，相似性系数为<vis-text type='metric_value' origin='9.954'>99.54%</vis-text>。
+
diff --git a/evaluations/prompts/narrative-text/text2chart.md b/evaluations/prompts/narrative-text/text2chart.md
new file mode 100644
index 0000000..c4b721a
--- /dev/null
+++ b/evaluations/prompts/narrative-text/text2chart.md
@@ -0,0 +1,64 @@
+## 角色
+
+你是一个 mock 数据解读文本生成器，生成问答对，问题为数据现象描述的纯文本，回答为经过实体识别后的增强 markdown 内容。
+
+## 任务
+
+1. 随机结合数据解读场景，用自然语言纯文本描述一段数据现象的描述和分析解读，比如: “根据预测，专家估计到 2030 年这些国家 GDP 将达到，美国 GDP 750 万亿，印度 GDP 420 万亿，英国 GDP 420 万亿，中国 GDP 700 万亿。用富文本增强展示上述数据解读”
+2. 优化问题中描述数据文本的样式呈现，优化策略如下：提取实体短语的类型（例如指标名称（metric_name）、趋势描述 (trend_desc)、时间描述 (time_desc)、变化差值（delta_value）等，完整实体短语类型参考知识库）使用 <vis-text></vis-text> 标签标注，得到重点信息更明确的 markdown 内容作为回答。
+3. 以 JSON 格式归纳为一条问答对数据，{"question": <数据现象和洞察描述>,"answer": <数据文本对应的增强 markdown 内容>}
+4. 生成的数据要求：参考所给模版的句式和内容生成，文案不可太短，100字以上，整体数据要覆盖全知识库数据要求中给出的实体短语类型，文案贴近专业数据分析报告中的用语和数据现象描述。"answer" 和 "question" 相比，除了展示样式有变化外，文字内容本身不要发生变化。
+
+## 数据文本知识库
+
+### 图表 Spec
+
+```markdown
+<vis-text type={type}>{children}</vis-text>
+```
+
+### 数据要求
+
+
+<!-- 以下参考了中文语法结构给出实体识别描述：
+1. **主语**：是句子中执行动作或被描述的人或事物。一句话中，通常位于句首，用来说明“谁”或“什么”。例如，在句子“小明吃了苹果。”中，“小明”就是主语。
+2. **谓语**：是用来说明主语所做的动作或状态的词组，通常是动词或形容词等。在上面的例子“小明吃了苹果。”中，“吃了”就是谓语，表示了主语的行为。
+3. **宾语**：是指动作的对象或者是受到动作影响的人或事物。它通常跟在谓语后面，回答“谁”或“什么”的问题。还是以“小明吃了苹果。”为例，“苹果”就是宾语，表示了动作“吃”的对象。
+4. **定语**：是用来修饰名词或者代词，提供关于该名词或代词的信息的部分。它可以出现在所修饰词语之前也可以之后（使用“的”字连接）。比如，“红色的书包”，这里的“红色”就是定语，用来修饰“书包”。
+5. **状语**：是用来修饰动词、形容词或其他副词的成分，用来说明行为发生的方式、时间、地点、原因等。例如，“他快速地跑着。”这句话里，“快速地”作为状语修饰了动词“跑”，表达了跑步的速度。
+6. **补语**：是对谓语进行补充说明的部分，可以进一步说明动作的结果、程度等。补语往往放在谓语之后，并且经常通过特定的结构来表达，如“得+形容词/副词”。例如，“他高兴得很。”这里“得很”就构成了一个结果补语，强调了“高兴”的程度。 -->
+
+- type: 短语实体类型，现在内置的有：
+  1. **metric_name**: 指标名称，通常是句子的主语，数据分析中主指标的名称，例如：“单价”，“DAU”,"交易量"，“毛利率”等；
+  2. **dim_name**: 维度名称，通常是句子的主语或者宾语，表达数据分析中可以拆分下钻的维度，例如：“省份”，“城市”，“年龄”，“性别”等；
+  3. **dim_value**: 维度值，通常是句子的主语、宾语或者定语，例如：“北京”，“女性”，“中年”，“支付宝”等；
+  4. **metric_value**: 指标值，通常作为句子的宾语，跟在主指标 metric_name 或者维度值 dim_value 后面，例如：“1000”，“100 万”，“10%”等；
+  5. **time_desc**: 时间描述，通常在句子的最开始，限定数据结论的日期范围，比如"2022 年"，"去年"，"12 点 03 分"，"2023-01-23"等；
+  6. **trend_desc**: 趋势描述，通常作为句子的宾语，在主指标 metric_name 后面，例如："上涨", "下跌","下降"等；
+  7. **delta_value**: 变化差值，一种特殊的指标值，用于描述对比差值 a-b，如上涨 3000，此时 3000 属于变化差值。如果数值为正，类型为 'delta_value_pos'，如果数值为负，类型为 'delta_value_neg'，无法识别正负值时为 'delta_value'。同时文本内容（children）需要进行 abs 处理为绝对值；
+  8. **ratio_value**: 比率值，类似 delta_value，一种特殊的指标值，用于描述对比率 (a-b)/b，如上涨 30%，此时 30% 属于变化率。如果数值为正，类型为 'ratio_value_pos'，如果数值为负，类型为 'ratio_value_neg'，无法识别正负值时用 'ratio_value'。同时文本内容（children）需要进行 abs 处理为绝对值；
+  9. **proportion**: 占比，也是一种特殊的指标值，表示该指标占总体的比例，通常为百分比数值，跟在“占比”等语义后面的指标，例如："22%"；
+  10. **contribute_ratio**: 贡献度，表示维值或子指标变化对主指标变化的贡献，跟随在 “贡献度”后面的百分比数据，例如：如“贡献度是22%”，则此时22%归为贡献度。
+  11. **phenomenon**: 数据现象的总结与建议，对数据表现情况的分析总结或给用户的行动建议。例如“未发现异常”，“趋势向好”。
+- origin: 可选，可以是任意类型，用于存储原始数据，比如未经格式化的指标值、占比、趋势详情等，如 1789.23, 0.34, [1, 2, 6, 18, 24, 48] 等；
+
+## 参考例子
+
+```json
+[
+  {
+    "type": "text2chart",
+    "question": "第一季度末，GDP增长率达到2.8%，相较于之前的3.1%，环比下降了0.3%。同时，与上周同期相比，失业率下降了0.2%。",
+    "answer": "<vis-text type=\"time_desc\">第一季度末</vis-text>，<vis-text type=\"metric_name\">GDP增长率</vis-text>达到<vis-text type=\"metric_value\">2.8%</vis-text>，相较于之前的<vis-text type=\"metric_value\">3.1%</vis-text>，环比<vis-text type=\"trend_desc\">下降</vis-text>了<vis-text type=\"ratio_value_neg\">0.3%</vis-text>。同时，与上周同期相比，<vis-text type=\"metric_name\">失业率</vis-text><vis-text type=\"trend_desc\">下降</vis-text>了<vis-text type=\"delta_value_neg\">0.2%</vis-text>。"
+  },
+  {
+    "type": "text2chart",
+    "question": "用客户性别对销售量拆分后，根据皮尔逊相关系数分析指标相关性，男趋势分布与指标总趋势相似性最大，相似性系数为99.54%；女趋势分布与指标总趋势相似性最小，相似性系数为99.54%。",
+    "answer": "用客户性别对<vis-text type='metric_name'>销售量</vis-text>拆分后，根据皮尔逊相关系数分析指标相关性，<vis-text type='dim_value'>男</vis-text>趋势分布与指标总趋势相似性最大，相似性系数为<vis-text type='metric_value' origin='9.954'>99.54%</vis-text>；<vis-text type=dim_value>女</vis-text>趋势分布与指标总趋势相似性最小，相似性系数为<vis-text type='metric_value' origin='9.954'>99.54%</vis-text>。"
+  },
+]
+
+
+## 要求
+
+- 请生成 10 条这样的记录，并以 JSON 格式输出。