feat: 更新 Jade/VESTA 任务定义 + 最终评测清单

- Jade: 15个任务JSON更新 (instruction细化 + metadata.steps详细展开)
- VESTA: 10个任务JSON重构 (统一使用NaCl.cif/anatase_TiO2.cif + 步骤重写)
- VESTA: 删除task1, 新增2个CIF数据文件
- 新增 test_final.json (11 jade + 10 vesta = 21 tasks)
- run_proxmox.sh: MODEL→gpt-5.4, MAX_STEPS→35, TEST_META→test_final.json
This commit is contained in:
2026-03-11 11:02:26 +08:00
parent d71f1f976d
commit a943c1e961
30 changed files with 318 additions and 243 deletions

View File

@@ -1,7 +1,7 @@
{
"id": "VESTA_Manual_task2",
"snapshot": "vesta",
"instruction": "在 VESTA 中设置显示模式为 Ball-and-Stick用于 example_structure.cif 文件。",
"instruction": "在 VESTA 中加载 NaCl.cif 文件,并将显示模式从默认的 Ball-and-Stick 切换为 Space Filling 模式。",
"source": "custom",
"config": [
{
@@ -9,8 +9,8 @@
"parameters": {
"files": [
{
"local_path": "evaluation_examples/data/vesta/example_structure.cif",
"path": "C:\\Users\\user\\Desktop\\example_structure.cif"
"local_path": "evaluation_examples/data/vesta/NaCl.cif",
"path": "C:\\Users\\user\\Desktop\\NaCl.cif"
}
]
}
@@ -19,7 +19,8 @@
"type": "launch",
"parameters": {
"command": [
"C:\\VESTA-win64\\VESTA.exe"
"C:\\VESTA-win64\\VESTA.exe",
"C:\\Users\\user\\Desktop\\NaCl.cif"
]
}
},
@@ -49,10 +50,7 @@
"fixed_ip": false,
"possibility_of_env_change": "low",
"metadata": {
"input_files": [
"example_structure.cif"
],
"steps": "1. 双击桌面上的 \"VESTA\" 快捷方式图标启动软件。\n2. 单击主界面顶部菜单栏中的 \"File\" 菜单项。\n3. 在展开的下拉菜单中,单击 \"Open...\" 菜单项。\n4. 在弹出的文件选择对话框中,单击文件名输入框以获取焦点。\n5. 在文件名输入框中,输入 \"example_structure.cif\"。\n6. 单击文件选择对话框底部的 \"Open\" 按钮加载文件。\n7. 单击主界面顶部菜单栏中的 \"View\" 菜单项。\n8. 在展开的下拉菜单中,单击 \"Display Style\" 菜单项。\n9. 在弹出的对话框中,单击标签为 \"Ball-and-Stick\" 的单选按钮将其选中。\n10. 单击对话框底部的 \"OK\" 按钮应用更改并关闭对话框。",
"steps_original": "1. 打开 VESTA 软件并加载文件 loaded_structure.vesta。\n2. 在顶部菜单中选择 View → Display Style。\n3. 在弹出的对话框中选择 Ball-and-Stick 模式。\n4. 点击 OK 按钮应用设置。\n5. 查看主视图窗口以确认显示模式已改变。"
"steps": "1. 单击主界面顶部菜单栏中的 \"File\" 菜单项。\n2. 在展开的下拉菜单中,单击 \"Open...\" 菜单项。\n3. 在弹出的文件选择对话框中,导航至桌面,单击选中 \"NaCl.cif\" 文件。\n4. 单击文件选择对话框底部的 \"Open\" 按钮加载文件。\n5. 在主界面左侧面板中,找到 \"Style\" 下拉菜单(位于 Objects 面板区域上方)。\n6. 单击 \"Style\" 下拉菜单将其展开。\n7. 在展开的选项列表中,单击选择 \"Space Filling\" 选项。\n8. 观察主视图窗口,确认所有原子已按 van der Waals 半径显示为填充球体,化学键不再显示。",
"steps_original": "1. 打开 VESTA 软件并加载文件 NaCl.cif。\n2. 在左侧面板的 Style 下拉菜单中,选择 Space Filling 模式。\n3. 确认主视图窗口中原子以空间填充方式显示,化学键不可见。"
}
}
}