|
|
e23c48ef60
|
Merge branch 'lyt'
|
2025-06-03 11:20:24 +08:00 |
|
|
|
1786688911
|
全部的题目
|
2025-06-03 11:19:36 +08:00 |
|
|
|
f4568b6dcb
|
Merge branch 'lyt'
|
2025-06-03 10:52:13 +08:00 |
|
|
|
e4c2cfde34
|
分离出全部的难题
|
2025-06-03 10:43:44 +08:00 |
|
|
|
aade9e11cb
|
轻微修改
|
2025-06-03 10:33:53 +08:00 |
|
|
|
0f781f5679
|
问题分类
|
2025-06-03 10:23:41 +08:00 |
|
|
|
3984ec002e
|
选项平衡后的第一次试跑,约70%正确率
|
2025-06-02 17:18:30 +08:00 |
|
|
|
7a725bc003
|
调整格式转换的代码:清理无用逻辑并加入选项平衡;
|
2025-06-02 17:17:42 +08:00 |
|
|
|
abeacaac3e
|
生成选项采用上采样的方式,采样6次并让模型进行回答;将早停的认为困难,全部采样都回答正确的认为简单。基于此构造新的stepy
|
2025-06-02 16:19:18 +08:00 |
|
|
|
d219b9b0c0
|
删掉没用的旧实验日志
|
2025-05-29 20:48:16 +08:00 |
|
|
|
6c87af5614
|
格式转换
|
2025-05-29 20:18:57 +08:00 |
|
|
|
1156bfdd7c
|
质量筛选完成
|
2025-05-29 16:18:16 +08:00 |
|
|
|
ae410dc6a7
|
过滤掉题目令人困惑的部分,且可以转换为简答题的题目
|
2025-05-29 16:09:37 +08:00 |
|
|
|
72a236d505
|
题目困惑度分类;调整high_quality代码到stepx
|
2025-05-29 16:08:56 +08:00 |
|
|
|
998c740df7
|
判断所有的问题是否可以转换为单选和判断题;删掉xlsx文件
|
2025-05-29 14:49:32 +08:00 |
|
|
|
a28774f6f0
|
调整分类代码和质量筛选代码
|
2025-05-29 11:52:51 +08:00 |
|
|
|
2774a4450f
|
编写质量筛选和难度筛选规则;
|
2025-05-28 17:29:42 +08:00 |
|
|
|
9be482ccdf
|
调整gitignore
|
2025-05-28 17:29:16 +08:00 |
|
|
|
d75ec45771
|
新增代码作者信息;
|
2025-05-28 17:29:03 +08:00 |
|
|
|
4959227855
|
Merge branch 'main' of https://git.siat-mic.com/fsy/MatBench
|
2025-05-28 15:57:05 +08:00 |
|
|
|
9abd8fc1c5
|
重构eval代码
|
2025-05-28 15:43:50 +08:00 |
|
|
|
472c183c5b
|
layer3 commit
|
2025-05-28 15:33:18 +08:00 |
|
|
|
9f5318c23d
|
layer2 commit
|
2025-05-28 11:00:24 +08:00 |
|
|
|
6a6b09ae20
|
layer1 commit
|
2025-05-28 10:59:32 +08:00 |
|
|
|
ef9355f2f5
|
second commit
|
2025-05-28 10:55:34 +08:00 |
|
|
|
0f80316f8b
|
first commit
|
2025-05-28 10:53:34 +08:00 |
|