mirror of
https://github.com/tencentmusic/supersonic.git
synced 2025-12-10 19:51:00 +00:00
9 lines
526 B
Markdown
9 lines
526 B
Markdown
# 评测流程
|
||
|
||
1. 正常启动项目(必须包括LLM服务)
|
||
2. 执行evalution.sh脚本,主要包括构建表数据、数据建模、获取模型预测结果,执行对比逻辑。可以在命令行看到执行准确率,错误case会写到同目录的error_case.json文件中。
|
||
|
||
# 评测意义
|
||
|
||
制定评估工具方便supersonic快速对接其他模型、更改参数配置,对于提示词或代码更改的影响至关重要,可以帮助我们了解这些变化是否会提高或降低准确率、响应速度。
|