极限脑力挑战:1000神经元、100秒、10轮、2选1、无奖励
BrainCraft挑战赛旨在弥补计算神经科学领域的一个空白:创建一个能够执行连续任务的集成功能性“迷你大脑”。该挑战要求参与者设计一个受生物学启发的神经网络,用于控制一个代理(bot)在模拟环境中寻找能量源以求生存。模型被严格限制在最多1000个神经元,训练时间不超过100秒,并在10轮测试中进行评估。最终目标是开发一个能在简单决策任务中表现出高效导航和学习能力的系统。
挑战目标与背景
当前计算神经科学领域充满了对大脑特定结构(如海马体、基底节)的模型,但这些模型通常高度抽象,无法整合起来执行一个完整的、连续性的任务。我们仍然缺乏一个能够像真实生物一样在环境中行动的集成“迷你大脑”。
BrainCraft挑战赛正是为了解决这个问题,鼓励开发能够在模拟环境中控制代理完成简单决策任务的神经网络。
其核心目标是:将功能性的神经动力学与感觉运动控制在一个连续的循环中结合起来,体现具身认知的原则。
任务详情
挑战包含一系列难度递增的任务,每个任务持续两个月。
任务一:简单决策
- 环境:一个10x10的方形迷宫,中间有三条垂直通道。
- 目标:能量源会随机出现在左右两个可能的位置之一。代理需要先探索确定能源的实际位置,然后只在包含能源的那一侧循环移动以获取能量。
- 挑战:虽然任务看似简单,但由于模型和时间的严格限制,这对现有的神经科学模型构成了不小的挑战。
任务二:提示决策
- 环境:与任务一类似,但路径的一侧会被红墙堵死,而另一侧则由蓝墙标示为通路。
- 目标:两个能量源同时存在,但只有一个可以自由到达。代理必须根据初始的颜色提示(蓝色)选择正确的路径,并忽略后续的干扰信息。
- 挑战:考验模型根据外部线索进行决策并保持该决策的能力。
模型与限制
参与者设计的模型必须遵守严格的架构约束。
代理(Bot):
- 以恒定速度移动,模型只能控制其转向。
- 撞墙后速度不变,但会消耗更多能量。
- 配备了64个距离传感器、1个碰撞传感器和1个能量计。
神经网络模型:
- 结构类似于回声状态网络 (ESN),由一个输入层、一个神经元池和一个输出层组成。
- 神经元是 leaky rate units(泄漏速率单元)。
- 模型最终输出一个单一的标量值,代表航向的相对变化,该变化被限制在 [–5°, +5°] 的范围内。
评估方法与核心规则
评估过程分为训练和测试两个阶段,最终性能由代理在测试中走过的总移动距离来衡量。
训练阶段
- 时间严格限制在 100秒以内。
- 参与者可以使用任何学习范式(如强化学习、进化算法等)。
- 训练代码必须完全独立,不能依赖任何预先生成的数据或模型。
- 训练期间使用的任何外部信号(如奖励)在测试阶段将不可用,必须由模型内部根据自身状态(如能量变化率)生成。
测试阶段
- 使用训练好的模型参数进行 10次独立的试验。
- 每次试验直到代理能量耗尽为止。
- 最终得分是10次试验中移动距离的平均值。
关键规则摘要
- 为什么是1000个神经元? 足够解决这样的简单任务。
- 为什么是100秒? 确保任何拥有普通笔记本电脑的学生都能参与。
- 为什么没有奖励? 鼓励参与者从能量变化等内部状态中自行设计奖励信号。
- 有奖品吗? 没有,只有名望和荣誉,所有代码都必须开源。