Commit Graph

20 Commits

Author SHA1 Message Date
lzy
3984ec002e 选项平衡后的第一次试跑,约70%正确率 2025-06-02 17:18:30 +08:00
lzy
7a725bc003 调整格式转换的代码:清理无用逻辑并加入选项平衡; 2025-06-02 17:17:42 +08:00
lzy
abeacaac3e 生成选项采用上采样的方式,采样6次并让模型进行回答;将早停的认为困难,全部采样都回答正确的认为简单。基于此构造新的stepy 2025-06-02 16:19:18 +08:00
lzy
d219b9b0c0 删掉没用的旧实验日志 2025-05-29 20:48:16 +08:00
lzy
6c87af5614 格式转换 2025-05-29 20:18:57 +08:00
lzy
1156bfdd7c 质量筛选完成 2025-05-29 16:18:16 +08:00
lzy
ae410dc6a7 过滤掉题目令人困惑的部分,且可以转换为简答题的题目 2025-05-29 16:09:37 +08:00
lzy
72a236d505 题目困惑度分类;调整high_quality代码到stepx 2025-05-29 16:08:56 +08:00
lzy
998c740df7 判断所有的问题是否可以转换为单选和判断题;删掉xlsx文件 2025-05-29 14:49:32 +08:00
lzy
a28774f6f0 调整分类代码和质量筛选代码 2025-05-29 11:52:51 +08:00
lzy
2774a4450f 编写质量筛选和难度筛选规则; 2025-05-28 17:29:42 +08:00
lzy
9be482ccdf 调整gitignore 2025-05-28 17:29:16 +08:00
lzy
d75ec45771 新增代码作者信息; 2025-05-28 17:29:03 +08:00
lzy
4959227855 Merge branch 'main' of https://git.siat-mic.com/fsy/MatBench 2025-05-28 15:57:05 +08:00
lzy
9abd8fc1c5 重构eval代码 2025-05-28 15:43:50 +08:00
lzy
472c183c5b layer3 commit 2025-05-28 15:33:18 +08:00
lzy
9f5318c23d layer2 commit 2025-05-28 11:00:24 +08:00
lzy
6a6b09ae20 layer1 commit 2025-05-28 10:59:32 +08:00
lzy
ef9355f2f5 second commit 2025-05-28 10:55:34 +08:00
lzy
0f80316f8b first commit 2025-05-28 10:53:34 +08:00