Skip to content

Latest commit

 

History

History
19 lines (12 loc) · 1 KB

task.md

File metadata and controls

19 lines (12 loc) · 1 KB

评测 InternLM-1.8B 实践

  • 记录复现过程并截图。

基础任务(完成此任务即完成闯关)

  • 使用 OpenCompass 评测浦语 API 记录复现过程并截图。(注意:写博客提交作业时切记删除自己的 api_key!)
  • 使用 OpenCompass 评测 InternLM2.5-1.8B-Chat 模型在 ceval 数据集上的性能,记录复现过程并截图。(可选)

进阶任务(闯关不要求完成此任务)

  • 使用 OpenCompass 进行主观评测(选做)
  • 使用 OpenCompass 评测 InternLM2-Chat-1.8B 模型使用 LMDeploy部署后在 ceval 数据集上的性能(选做)

闯关材料提交(完成任务并且提交材料视为闯关成功)