皮卡丘也疯AI?科技巨头藉《宝可梦》测试AI模型长程决策能力

发布时间 - 2026-01-28 00:00:00    点击率:

在人工智慧(ai)领域,用于评估模型能力的基准测试(benchmarks)持续推陈出新,但眼下最引人瞩目的竞技舞台,竟是一款已发行近三十年的任天堂经典rpg——《宝可梦》(pokémon)。据《华尔街日报》披露,google、openai 与 anthropic 正全力投入这场别开生面的「ai 宝可梦大师」竞赛,借由该游戏高度动态的虚拟世界,检验模型在真实感任务中的逻辑推演、多目标权衡及长程规划等核心能力。

这场风潮起源于去年,由 Anthropic 应用 AI 负责人 David Hershey 主导的「Claude 玩宝可梦」Twitch |直播|项目。Hershey 强调,《宝可梦》所呈现的开放性与系统深度,远超早期 AI 测试常采用的《乓》(Pong,一款二维电子乒乓球游戏)等简化环境。玩家需在训练现有队伍、搜寻稀有宝可梦、规划路线穿越城镇与洞窟、以及挑战道馆馆主之间反复权衡——这对 AI 的不确定性应对、资源分配与长期目标拆解能力,提出了远超单步决策

的严苛要求。

如今,这项原本自发性的实验性测试,已跃升为科技巨头正式布局的技术验证场域。OpenAI 与 Google 的研究团队甚至会依据|直播|中模型的实际操作表现,针对性地调整推理路径与提示策略。公开资讯显示,GPT 系列与 Gemini 模型均已顺利通关《宝可梦 红/蓝》,并陆续推进至《黄版》《金/银》等后续作品;而 Anthropic 推出的最新模型 Claude 4.5,目前仍在关键道馆战与野外捕捉环节持续优化中。

延伸阅读:
手把也能量心跳?Anbernic内建心率计与2.5吋萤幕 玩游戏同步监测健康
10秒揪出办公室异常!恐怖游戏《P0: Byte-Sized Brilliance》挑战眼力极限

学界将此类高阶游戏代理任务,视为通向「通用人工智慧」(AGI)的关键试炼场——即具备类人水平的理解力、自主学习力、跨情境推理力与泛化执行能力的下一代AI系统。不同于标准问答式评测仅聚焦短程响应,完整驾驭《宝可梦》需达成数千回合连贯、自洽且具适应性的策略链。David Hershey 指出,从该过程中提取的「软体框架控制」(Harness)行为日志,正成为提升模型在现实复杂任务中计算效能与决策鲁棒性的重要数据来源。

相较过往以《踩地雷》等规则极简游戏为主的初级验证方式,在融合角色成长、属性克制、迷宫探索、剧情分支与随机事件的RPG环境中展现稳定策略输出能力,如今已成为判断AI是否真正迈向「拟人化战略思维」的核心标尺。


# go  # ai  # openai  # gpt  # google  # claude  # 任天堂  # 宝可梦  # gemini  # 事件  # agi  # 这场  # 长程  # 手把  # 华尔街  # 引人瞩目  # 别开生面  # 提出了  # 这对  # 此类  # 推陈出新 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: 公司网站制作价格怎么算,公司办个官网需要多少钱?  原生JS获取元素集合的子元素宽度实例  详解免费开源的.NET多类型文件解压缩组件SharpZipLib(.NET组件介绍之七)  如何批量查询域名的建站时间记录?  Laravel如何生成API文档?(Swagger/OpenAPI教程)  详解Android图表 MPAndroidChart折线图  音响网站制作视频教程,隆霸音响官方网站?  Laravel定时任务怎么设置_Laravel Crontab调度器配置  Laravel 419 page expired怎么解决_Laravel CSRF令牌过期处理  详解阿里云nginx服务器多站点的配置  免费网站制作appp,免费制作app哪个平台好?  Laravel Eloquent模型如何创建_Laravel ORM基础之Model创建与使用教程  Laravel如何配置和使用队列处理异步任务_Laravel队列驱动与任务分发实例  Bootstrap CSS布局之列表  Android实现代码画虚线边框背景效果  Laravel Eloquent访问器与修改器是什么_Laravel Accessors & Mutators数据处理技巧  Laravel如何使用Laravel Vite编译前端_Laravel10以上版本前端静态资源管理【教程】  Laravel怎么使用Intervention Image库处理图片上传和缩放  大同网页,大同瑞慈医院官网?  如何在Windows服务器上快速搭建网站?  在centOS 7安装mysql 5.7的详细教程  如何快速搭建FTP站点实现文件共享?  JS中使用new Date(str)创建时间对象不兼容firefox和ie的解决方法(两种)  html5如何实现懒加载图片_ intersectionobserver api用法【教程】  如何在七牛云存储上搭建网站并设置自定义域名?  bing浏览器学术搜索入口_bing学术文献检索地址  php静态变量怎么调试_php静态变量作用域调试技巧【解答】  香港代理服务器配置指南:高匿IP选择、跨境加速与SEO优化技巧  Claude怎样写结构化提示词_Claude结构化提示词写法【教程】  Laravel怎么实现验证码功能_Laravel集成验证码库防止机器人注册  如何制作新型网站程序文件,新型止水鱼鳞网要拆除吗?  JavaScript中如何操作剪贴板_ClipboardAPI怎么用  如何在HTML表单中获取用户输入并结合JavaScript动态控制复利计算循环  lovemo网页版地址 lovemo官网手机登录  谷歌浏览器如何更改浏览器主题 Google Chrome主题设置教程  如何在服务器上三步完成建站并提升流量?  如何在万网利用已有域名快速建站?  Laravel如何实现多对多模型关联?(Eloquent教程)  Laravel如何设置自定义的日志文件名_Laravel根据日期或用户ID生成动态日志【技巧】  如何快速搭建高效WAP手机网站?  详解Android中Activity的四大启动模式实验简述  如何在建站宝盒中设置产品搜索功能?  Laravel如何使用Seeder填充数据_Laravel模型工厂Factory批量生成测试数据【方法】  如何在Windows 2008云服务器安全搭建网站?  laravel怎么实现图片的压缩和裁剪_laravel图片压缩与裁剪方法  如何用PHP快速搭建高效网站?分步指南  常州企业网站制作公司,全国继续教育网怎么登录?  网站制作免费,什么网站能看正片电影?  Laravel如何获取当前用户信息_Laravel Auth门面获取用户ID  如何正确下载安装西数主机建站助手?