autoresearch
由 karpathy 研发
autoresearch 是 karpathy 开创性推出的一款 AI 智能体研究工具,致力于自动化大型语言模型 (LLM) 的训练过程探索与优化。它赋予 AI 智能体自主修改模型架构、超参数及核心训练逻辑(`train.py`)的能力。在严格的5分钟训练周期内,系统会基于 `val_bpb` 指标进行评估与迭代,通过人类编写的 `program.md` 文件指导智能体。该工具旨在单GPU环境下自动发现并优化 LLM 配置,极大地加速前沿研究进程,实现高效且夜间无人值守的实验突破。
- AI智能体自主优化: 智能体可修改模型架构、超参数及训练逻辑,实现LLM配置的自主探索与优化。
- 固定时间高效迭代: 每次训练严格限定5分钟,以`val_bpb`为核心指标进行快速评估和迭代。
- 人类指令式引导: 通过编程`program.md`文件,为AI智能体提供研究方向和任务指导。
- 单GPU环境优化: 专为单GPU设计,能在特定计算平台下高效发现最优模型配置。
- 加速前沿研究: 大幅缩短实验周期,支持夜间无人值守的自动化实验,推动LLM研究突破。
linuxmacos