登录窗口
作者登录 审稿登录 编辑登录 读者登录
订阅 | 旧版入口 | English
 
  • 首页
  • 期刊简介
  • 编委会
  • 作者投稿
  • 订阅指南
  • 联系我们
  • 过刊目录
首页>战略与政策>为通用人工智能搭建新测试体系
为通用人工智能搭建新测试体系
发布时间:2023-11-30   
   来源:光明日报   作者:朱松纯
点击数量:322次

近来,大模型技术引发了全球对通用人工智能的广泛关注,在产业界、科研界掀起了巨大热潮。在人工智能技术大显身手、取得瞩目成就的同时,如何应对技术跨越所带来的风险并进行管控与治理,如何判断人工智能系统是否具备通用人工智能的性能等,也日益成为各方关注的焦点。在笔者看来,当下,我国科学界和产业界要抓住这一历史机遇,明确通用人工智能的发展路径和方向,牢牢把握解读和评估通用人工智能的话语权,尽快搭建并完善通用人工智能测试评级标准与平台。

在建构人工智能评测系统方面,早在1950年,英国计算机科学家阿兰·图灵就提出了基于行为的图灵测试:如果一台机器能够与人类展开对话而不被人类辨别出其机器身份,则称这台机器通过了测试。人工智能发展至今,现有的人工智能测试体系各自所呈现出的局限性,已无法满足通用人工智能的研究诉求:图灵测试不足以准确衡量人工智能的智能程度、任务导向测试(俗称“刷榜”),可能导致人工智能过度适应某项特定任务,当前很多基于Unity(一种实时三维互动内容创作和运营平台)的虚拟环境测试则在模拟复杂物理交互方面有所欠缺……显然,传统的人工智能测试已不适用于通用人工智能系统的评级。

另外,很多应用者反映,当下热门的大模型常常出现“脑雾”与“认知眩晕”等现象,在产业落地中出现问题。归根结底,是因为这种基于数据驱动的大模型仍然缺“心”,缺乏明确的认知架构和价值体系,只能按照人类设定的程序,机械地对问题进行反馈,求解“填空题”。这也倒逼通用人工智能测试之“心”要具备两个结构:其一为价值体系,具备符合人类价值观的通用智能体,才能被广泛接纳;其二为认知架构,这是通用智能体与人交流、合作的基础。价值体系、认知架构不仅应是驱动通用人工智能自主任务生成的根本内驱力,也是保障通用人工智能安全运转的关键。智能体只有具备了“良知”的知识体系及可以与人类沟通解释的“认知架构”,才能形成人机信任关系,实现人机和谐共生。

针对科学测试人工智能所需的种种条件,近期,笔者带领团队依据发展心理学和心智理论,参考人类婴幼儿发育的测试标准,研究总结出一种基于能力和价值的通用人工智能评测方法,并开发了复杂动态的物理场景(模拟仿真)和社会交互(混合现实)的测试平台——通智测试。这项成果于今年8月发表在中国工程院院刊《工程(英文)》上,这也是该领域发布的全球首个评级测试标准与平台。

该测试强调在复杂动态的物理及社会环境中,通用人工智能系统(智能体)应满足三个基本标准:

一是能完成无限任务并具备任务泛化能力,不依赖人类定义和训练任务。任务被定义为智能体对物理世界属性(如颜色、位置、速度等)或社会状态(如感知、认知、决策、心智等)状态的改变。人类在与外界交互时会产生无限可能,通用智能体需在这些场景中理解人类意图、与人协作,其任务和运动的规划必须符合物理因果与社会规范。

二是能根据变化的场景自主生成任务,不依赖于人类分配任务,做到俗话说的“眼里有活”。反之,如果智能体只能执行人类提前设定好的任务,不论是基于规则或者统计模型,既不能对预设之外的任务做到自主定义,也无法在与陌生环境交互中自动生成新任务,并不能适应人类社会的动态性与多样性。

三是由价值驱动并具有自我意识和层次化的价值体系。智能体能够自主生成并完成符合人类需求的任务,一套合适的价值系统至关重要。这套价值体系必须融入人类价值观,使智能体有能力学习和理解人类的价值偏好,并最终实现与人类价值的同向甚至对齐。例如,如果儿童提出不安全的要求,智能体能否识别出任务的不合理之处,并自主形成新任务。

通智测试从智能体探索和认知世界规律的各自感知、认知、运动、交互、社会、学习等能力,以及对自我、他人和群体的价值理解学习这两个角度入手,搭建了具体可行的测试平台架构。测试全面考虑了通用人工智能的关键特征,填补了通用人工智能评测的空白,突破了传统图灵测试的方法局限,在人工智能领域具有创新价值:不但有助于指导研究者为通用人工智能构建综合的设计架构与完善的评估体系,而且能为人工智能安全治理问题提供积极的解决方案。

在通智测试评估体系下,管理者可针对不同水平的智能体制定差异化监管准入机制,对通用人工智能规范化发展具有参考意义。此外,通智测试评级机制还可以为通用人工智能的科研路径提供明晰可靠的路线图,协助相关领域研究者找准科研道路上的前进方向。

(作者:朱松纯,系北京通用人工智能研究院院长,北京大学智能学院、人工智能研究院院长)





推荐文章
  • 油气安全战略与“双碳”战略:关系与路径
    百年变局叠加世纪疫情给全球能源安全敲响警钟,深刻理解能源转型...
  • 2023年中国经济增长速度的预测分析与政策建议
    受新冠肺炎疫情及采取的对应措施等因素的影响,2022年中国经...
  • 《2022研究前沿》——11个大学科领域发展趋势与重点研究问题
    2022年12月,中国科学院科技战略咨询研究院、中国科学院文...
  • 《2022技术聚焦》——20个高影响力专利技术焦点分析解读
    2022年,中国科学院科技战略咨询研究院研制《2022技术聚...
  • 新时代科技强国战略
    科技强国是现代化强国的核心要义,科技现代化是中国式现代化的重...
  • 科技改革十年回顾与未来走向
    文章从科技宏观治理、攻关应急体制机制、科研人员全职业生涯、科...
专题
  • 专题:生物制造——回顾与展望
  • 专题:智慧农业的发展与思考
  • 专题:人工智能与公共安全
  • 专题:纪念中国科学院学部成立70周年
  • 专题:人工智能与未来社会
  • 专题:科技创新与产业创新深度融合
  • 专题:高端制造的现状与未来思考
  • 专题:国家关键技术战略的认识与对策
  • 专题:大力推进科研范式变革
  • 专题:国家公园现代化治理体系建设
  • 专题报道
  • 专题:新时期重大科技基础设施建设理论与实践
  • 专题:“十五五”区域协调发展与国土空间发展格局优化
  • 专题报道
  • 专题:黄河流域科技创新研究与对策
  • 专题:科技创新引领现代化产业体系建设
  • 专题:前沿科技伦理风险及其治理
  • 专题:中国能源发展战略研究
  • 专题:科技预算绩效评价的理论与实践
  • 专题:中国生态文明建设进展与成效
  • 专题:技术经济安全理论与实践
  • 专题:开放科学发展趋势与治理策略
  • 专题:综合防治荒漠化 打赢“三北”攻坚战
  • 专题:科技创新支撑“一带一路”高质量发展
  • 专题:主要“一带一路”共建国家气候变化影响和适应研究
  • 专题:跨越“中等技术陷阱”与实现中国式现代化
  • 专题:构建自立自强的信息技术体系
  • 专题:新材料科学发展战略思考与创新实践
  • 专题:智库双螺旋法应用及实证研究
  • 专题:海洋观测探测与安全保障技术
  • 专题:中国空间科学——战略与突破
  • 专题:科技与金融融合逻辑与建议
  • 专题:数据要素市场化配置问题探究
  • 专题:中国战略性关键矿产资源安全研究
  • 专题:“双循环”格局下中国区域创新
  • 专题:哲学助力科技创新
  • 专题:绿色“一带一路”建设的挑战与应对
  • 专题:服务碳中和目标的海洋负排放技术路径与战略思考
  • 专题:哲学与科学
  • 专题:生物多样性保护与生态文明
  • 专题:生态草牧业高质量发展
  • 专题:建党百年·青年说
  • 专题:碳中和目标背景下的能源转型
  • 专题:科技助力“黑土粮仓”建设
  • 专题:科技伦理治理的战略研究
  • 专题:有组织的基础研究
  • 专题:新时代科学基金运行体系与管理研究
  • 专题:融合科学与开放数据
  • 专题:黄河流域生态保护和高质量发展
  • 专题:科技领航黄河三角洲农业高新技术产业示范区高质量发展
  • 专题:湾区比较研究
  • 专题:荒漠化治理与可持续发展
  • 专题:“十四五”规划的区域战略与空间治理
  • 专题:长江经济带高质量发展
  • 专题:公共卫生应急体系建设的战略思考
  • 专题:环境污染与人体健康
  • 专题:科技评价——实践与展望
  • 专题:畜牧业可持续发展
  • 专题:水声信号处理和声呐技术·发展现状和展望
  • 专题:中国高性能计算发展战略
  • 专题:行星科学——新学科·新梦想
  • 专题:国际新形势下知识产权保护研究
  • 专题:中国科技70年·回顾与思考
  • 专题:战略生物资源的保护与利用
  • 专题:2030年可持续发展目标的理论、指标与实践
  • 专题:土壤与可持续发展
  • 专题:知识产权转化与运营
  • 专题:“丝绸之路经济带”中亚能源地缘配置与国家安全
  • 专题:科学普及问题政策研究
  • 专题:分子模块设计育种
  • 专题:环境微塑料污染与管控策略
  • 专题:中国科学院·改革开放四十年
  • 专题:传统工艺的认知与振兴
  • 专题:国家生态保护与建设工程生态成效评估
  • 专题:心理学与社会治理
  • 专题:大气灰霾追因与控制
  • 专题:中国微生物组计划
  • 专题:“一带一路”建设对策研究
  • 专题:土壤微生物组
  • 专题:建成遗产
  • 专题:作物病虫害的导向性防控
  • 专题:青藏高原综合科学研究进展
  • 专题:气候变化的全球治理
  • 专题:科技促进农业供给侧结构性改革
  • 专题:生物传感与器官芯片
  • 专题:“十三五”区域发展战略研究
  • 专题:分布式可再生能源和智能微网
  • 专题:2015/2016超级厄尔尼诺事件研究
  • 专题:精准扶贫重大战略与政策研究
  • 专题: 生物安全——新问题、新挑战
  • 专题:绿色设计
  • 专题:空间科技助力“一带一路”建设
  • 专题:信息化变革科研模式
  • 专题:“一带一路”生态风险与地缘战略
  • 专题:脑科学与类脑智能
  • 专题:现代智库建设及其思想传播
  • 专题:知识产权强国建设
  • 专题:海岸科学与可持续发展
  • 专题:心理健康研究与服务
  • 专题:当代国家凝聚力研究
  • 专题:海洋科学发展现状与展望
  • 专题:云计算创新发展战略
  • 专题:在线社交网络分析理论和技术
  • 专题:西藏经济社会与科技协同发展
  • 专题:土壤与生态环境安全
  • 专题:可持续发展从行动走向科学
  • 专题:创新发展政策研究
  • 专题:土壤与可持续发
  • 专题:落实全面深化改革的科技思考
  • 专题:生物计算机研究进展
  • 专题:科教国际化发展战略
  • 专题:互联网产业发展战略
  • 专题:标准化发展战略
  • 专题:土壤重金属污染治理
  • 专题:可持续发展的难点与热点
  • 专题:生态系统服务与评估
  • 专题:知识产权战略与创新驱动发展
  • 专题:我国空间科学发展的挑战和机遇
  • 专题:知识产权的法制保障
  • 专题:城镇化战略研究
  • 专题:现代农业
  • 专题:大气灰霾追因与控制
  • 专题:知识产权管理
  • 专题:科研信息化
  • 专题:农业物联网
  • 专题:国家创新平台建设
快速通道
作者登录
编辑登录
审稿登录
读者登录
过刊浏览
点击排行
下载排行
引用排行
RSS
E-mail
文件检索
返回首页

 
 
您是第34919115位访问者!
1996-2021 中国科学院版本所有 备案序号: 京ICP备05002857
地址:北京三里河路52号 邮编 100864 Email:bulletin@cashq.ac.cn
技术支持:北京勤云科技发展有限公司