https://github.com/centerforaisafety/hle
Cedric: 人类的最后考试(HLE)是一个多模态基准测试,位于人类知识的前沿,被设计为最后一类封闭式学术基准测试,具有广泛的学科覆盖范围。人类的最后考试包括来自数十个学科的2500个问题,包括数学、人文科学和自然科学。HLE由全球学科专家开发,由适合自动评分的单选题和简答题组成。
https://github.com/tursodatabase/agentfs
Frozen: 基于SQLite通过对FS进行抽象,提供接口供Agent使用,从而使得在针对Agent编程时可以方便的进行状态管理
https://github.com/bubblelabai/BubbleLab
Frozen: 为开发人员构建的开源工作流自动化平台,全靠口喷即可完成复杂工作流的生成。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!
