您当前位置: > 资讯攻略 > 游戏资讯 - 详情

123小时游戏数据打造的MLMOVE,竟能像职业玩家般协作?

2025-07-05 14:09:26|昆明鱼豆网 |来源:互联网整理

你能想象不?一个游戏大模型竟然能跟职业玩家似的玩游戏,这事可新鲜它到底有多牛?咱们一起来看看

研究团队与数据基石

动视暴雪、斯坦福大学和英伟达等研究人员那可是费了老鼻子劲!他们紧紧盯着职业玩家,从职业玩家日志里搜集了整整123小时的数据这里面啥都有,玩家的移动路径、战斗对策、行动目标,还有怎么掩护队友和配合进攻,全涵盖在内。这123小时的数据,就像一座大宝藏,成了开发这个游戏大模型的坚实基础

模型测试与特点初显

_训练大模型玩《反恐精英》:自带外挂一枪爆头,堪比职业玩家_训练大模型玩《反恐精英》:自带外挂一枪爆头,堪比职业玩家

在全球那叫一个爆火的《反恐精英:全球攻势》里,这个模型可有了用武之地。它在游戏里一测,好家伙,表现惊人!它能像职业玩家似的,学会人类玩家的团队协作策略和技巧。而且性能比现有的商业游戏机器人和基于规则的机器人都要好得多,玩游戏的习惯更接近职业玩家。以往传统AI靠规则开发,玩家玩一阵子就能摸透规律,这游戏体验就差了不少。可这个模型不一样,用了独特架构,能轻松捕捉玩家间配合和移动指令。

核心机制之精妙所在

_训练大模型玩《反恐精英》:自带外挂一枪爆头,堪比职业玩家_训练大模型玩《反恐精英》:自带外挂一枪爆头,堪比职业玩家

这模型输入用了嵌入token,每个token代表玩家状态,经过嵌入层转成高维空间的点,这样处理指令就更高效。而且还用上了“自注意力机制”这个核心模块,学习玩家间空间关系和团队协作策略。就说玩家向前移动这事,模型得考虑对队友和对手位置的影响。玩家被击毙淘汰后没法参与游戏动态了,模型又用了掩码技术,把被淘汰玩家的token设成掩码,只关注存活玩家移动效果。这设计,简直太巧妙!

创新技术之提前预判

训练大模型玩《反恐精英》:自带外挂一枪爆头,堪比职业玩家_训练大模型玩《反恐精英》:自带外挂一枪爆头,堪比职业玩家_

提前预判移动是这个模型的一大创新。它不仅能预测下一个时刻移动命令,还能预测未来俩时间点的命令。这就好比开了“挂”似的,能帮助模型更好学习职业玩家运动的时间连贯性,生成的移动轨迹自然又流畅。游戏里玩家的行动那得一气呵成,这个功能要是用到游戏里去,玩起来肯定老刺激了。

数据处理与训练提升

训练大模型玩《反恐精英》:自带外挂一枪爆头,堪比职业玩家__训练大模型玩《反恐精英》:自带外挂一枪爆头,堪比职业玩家

收集到原始数据后,研究人员要做不少准备工作来帮模型“吃好”这些数据。他们把原始数据转换成模型能懂的格式,像玩家的位置和速度信息处理成离散token,再提取游戏关键状态信息,C4安放位置和剩余时间,这都是影响游戏胜负的重要细节。为了使模型更优更快地学习,又对数据分批处理,还采用优化算法调整参数,这就让模型能快速收敛到最优解,学到人类动作精华去应对复杂多变的游戏场景。

测试对比与结果惊人

训练大模型玩《反恐精英》:自带外挂一枪爆头,堪比职业玩家__训练大模型玩《反恐精英》:自带外挂一枪爆头,堪比职业玩家

最后研究人员把这个模型和商业机器人等放一起进行横向对比评价,还请职业玩家出面,根据专门的评分体系打分。结果很明显,这个模型在人类评价者那可是得了高分,效果提升在16% - 59%之间。这就说明它模仿人类职业玩家玩游戏有着明显优势,这样要是放在游戏里,感觉就跟和真的高手玩家在博弈一样。

所以我就想问问大家,这么厉害的游戏大模型要是普及到更多游戏里,你们觉得咱们将来玩游戏会变成什么样?是不是就跟进入职业赛场挑战顶尖高手似的?快点赞分享,留下你的看法!