智谱 AI 发展月报(2021年8月)

  本报告依托科技情报大数据挖掘与服务系统平台 AMiner、新闻事件分析挖掘和搜索系统 NewsMiner,以及人工智能主流新闻网站及公众号,从 AI 学术会议、重大科研进展、人物动态、最新报告发布等角度,分析挖掘了每月人工智能领域所发生的、对领域技术发展产生重大推动作用的事件,旨在帮助 AI 领域研究人员和业内人士及时追踪最新科研动态、洞察前沿热点。

  从受关注子领域来看,本月最受关注的人工智能子领域是智能芯片,其次是智能机器人和机器学习,分别占比 45.51%、23.03% 和 18.26%,居于前三,具体分布情况如图 2 所示。

  第 59 届 ACL 大会及第 11 届亚洲自然语言处理学术会议 IJCNLP 联合会议举行并公布最佳论文等奖项;KDD 2021 奖项出炉,多位华人学者获奖;计算机图形顶会 ACM SIGGRAPH 2021 公布获奖论文;IJCAI 2021 会议开幕,中国论文接收量最多;数据库顶会 VLDB EA&B 最佳论文奖公布,华人学者囊括三项荣誉;2021 年 IEEE 认知发展与机器人学习国际会议在北京大学开幕等。

  IDC 发布全球半年度人工智能跟踪报告;澳鹏 Appen 发布《人工智能与机器学习现状年度报告》;中国电子学会和中国数字经济百人会发布《新一代人工智能白皮书》;清华大学数据治理研究中心主办“人工智能伦理与治理”专题研讨会并发布《人工智能伦理与治理报告》等。

  谷歌学术公布 2021 年最有影响力论文列表;IEEE 2021 编程语言排名公布,Python 夺冠、微软 C#成为黑马;福布斯 2021 云计算百强榜公布;百名“科学探索奖”获奖人提出“十大科学技术问题”等。

  清华与智源研究院联合成立健康计算联合研究中心;上海交大成立未来技术学院等。

  人工智能领域学者清华大学胡事民、南京大学周志华入围中科院院士候选名单;图灵得主 Yann LeCun 自传《科学之路》出版,黄铁军教授受邀作序;李国杰院士谈国内AI研究如何摆脱困境;斯坦福大学 Percy Liang、李飞飞等百余位学者联合探索“基础模型”的机遇与挑战;字节跳动 AI Lab 总监李磊加盟 UCSB 大学。

  清华大学与微软亚洲研究院的研究者提出了一种基于加性注意力的 Transformer 变体 Fastformer;百度开源了语言与视觉一体的预训练模型 ERNIE-UNIMO,并发布第二代百度昆仑 AI 芯片“昆仑芯2”;IBM 推出 Z 系列企业级处理器“Telum”;哈工大团队打造一款面向青少年人工智能教育的仿生四足机器狗 XGO-Mini;IEEE P2807.4《科技知识图谱指南》标准启动会在京召开等。

  8 月 2 日,计算语言学、自然语言处理领域顶会第 59 届 ACL 大会及第 11 届亚洲自然语言处理学术会议 IJCNLP 联合会议(ACL-IJCNLP)以线上方式举行。中科院自动化所研究员宗成庆担任了今年的 ACL-IJCNLP 主席,程序主席包括华盛顿大学的夏飞教授(Fei Xia)和香港理工大学的李文捷(Wenjie Li)教授以及罗马大学的 Roberto Navigli。

  今年共有 3350 篇投稿,其中包括 2327 篇长论文和 1023 篇短论文,相比去年(3429 篇)略有减少。在所有研究之中,有 710 篇最终被接收,接收率 21.2%。另有 493 篇论文被接收为 Findings,这额外 14.9% 的论文被接收到了大会的 Findings 子刊。有 1239 篇论文投稿来自中国大陆,其中 251 篇被接收,接收率 20.3%。

  KDD 2021服务奖的获得者为领英Communications AI 团队负责人俞诗鹏博士。俞诗鹏在北京大学取得学士和硕士学位,博士毕业于慕尼黑大学。曾担任 2017 年 KDD 总主席,目前是 SIGKDD 的赞助总监,负责监督 KDD 年度会议和其他数据挖掘社区活动的赞助工作。

  3. ACMSIGGRAPH 2021举办 浙江大学李旻辰获最佳博士论文奖

  顶级会议 ACM SIGGRAPH 2021 线上举行。大会公布了本年度各大奖项的获奖者,包括 Steven AnsonCoons 奖获得者 Markus Gross、最佳博士论文奖获得者李旻辰、计算机图形学成就奖获得者 Doug L. James 以及数字艺术终身成就杰出艺术家奖获得者 WilliamSeaman。

  颁给了苏黎世联邦理工学院的计算机科学教授 Markus Gross,以表彰他在几何处理、基于物理的模拟、面部捕捉和动画方面的研究贡献,以及他为计算机图形学学术与行业之间构建桥梁所做出的贡献。

  颁给了斯坦福大学计算机科学教授 Doug L. James,以表彰他在可变形模型的模拟和声音渲染方面的开创性工作。

  8 月 23 日,人工智能领域学术顶会 IJCAI 2021 在线上开幕。今年 IJCAI 的大会主席由 AAAI 卓越服务奖获得者、美国明尼苏达大学 Maria Gini 教授担任。今年的 IJCAI 总共收到 4204 份全文投稿,最终有 587 份投稿被大会接收,占大会全文投稿数的 13.9%。

  今年投稿的热门词汇前十名分别是:学习、网络、图、神经、模型、深度、强化、检测、图像和对抗。机器学习、计算机视觉、数据挖掘和自然语言处理这四大领域的投稿占了全文投稿数的 65%。今年接收论文的热门词汇前十名分别是:学习、网络、图、神经、模型、数据、知识、博弈(game)、检测和深度。

  投稿数量前三名的国家分别是:中国(2219)、美国(580)和澳大利亚(118);接收数量前三名分别是:中国(268)、美国(97)和德国(33);接收率前三名的国家分别是:奥地利(42.1%)、瑞士(39.1%)和德国(32.0%)。

  本次共有3 篇论文获得 IJCAI 2021 杰出论文奖,1 篇论文获得荣誉提名。

  16 日,VLDB 2021 大会以线上、线下两种方式在丹麦哥本哈根开幕。VLDB 是数据库领域的顶级学术会议之一。本次大会共收录了216篇 Research Paper、23 篇 IndustryPaper、56 篇 Demo Paper ,其中

  入选的最佳研究论文、最佳EA&B论文、最佳工业论文的一作作者均为华人学者

  ,他们分别是新加坡国立大学研究员杨任驰、西蒙弗雷泽大学博士生 Xiaoying Wang、加州大学伯克利分校博士生 Audrey Chen。

  8 月 23 日,2021 年 IEEE 认知发展与机器人学习国际会议在北京大学英杰交流中心开幕。与会的国内外专家学者围绕“发展机器人与未来生活”主题开展为期 4 天的深入研讨。会议由北京大学智能科学系主办,采用线下开幕式和线上会议结合的方式举行。北大副校长黄如院士出席开幕式并致辞。腾讯 AI 实验室及 Robotics X 实验室负责人张正友在线作了题为“走向有情商的和自我进化的机器人”的大会报告。

  在三个技术类别中,AI 软件占据了整个 AI 市场的 88%。就增长速度而言,IDC 认为 AI 硬件将是接下来几年里增长最快的领域;从 2023 年起,人工智能服务则将接手成为增长最快的类别。

  近日,世界领先的高质量训练数据提供商澳鹏 Appen Limited 发布了第七份《人工智能与机器学习现状年度报告》。报告显示,各企业 AI 预算金额较去年大幅增长 55%;同时,企业更加关注 AI 项目的实际实施,AI 项目的负责人正在从企业决策者转变为技术骨干。2021 全球 AI 市场 5 大发展趋势包括:一是 AI 发展的瓶颈是高质量数据,二是更精准的 AI 应用场景,三是从以模型为中心向以数据为中心转变,四是训练数据管理的新需求,五是辅助数据标注愈发火热。

  8 月 23 日,中国—上海合作组织数字经济产业论坛分论坛之一的数字经济百人会在重庆科技馆举办。会议期间,中国电子学会和中国数字经济百人会发布了《新一代人工智能白皮书(2021年)——数据要素新动能》。白皮书全面梳理了全球各国人工智能产业对数据资产的高度重视,详细分析了数据要素的供给侧优化特征,并归纳出数据要素驱动新一代人工智能产业基础层、技术层、应用层的模式和整体发展趋势,最后提出充分发挥数据要素的溢出效应、着力加强数据要素的有序共享、加速拓展数据要素的应用空间、全面助力数据资源的价值升级四大措施,为行业实现良性可持续发展提供智力支持,为行业主管部门制定出台发展战略及政策提供参考依据。

  近日,由清华大学数据治理研究中心主办的“人工智能伦理与治理”专题研讨会在线上召开,邀请了来自中央党校、中国社科院、清华大学、复旦大学、浙江大学、中国政法大学、电子科技大学、山东大学、北京化工大学、中国农业大学、对外经济贸易大学、山东师范大学等多位专家学者,围绕人工智能发展与应用带来的社会风险、人工智能伦理的核心关切和构建方式等问题,展开了谈论。研讨会上发表了《人工智能伦理与治理报告》。该报告认为,人工智能伦理准则可以分为安全、透明、公平、个人数据保护、责任、真实、人类自主、人类尊严等八个维度,并通过问卷调查方式收集了公众对于算法透明、算法公开及数据保护的态度。

  艾瑞咨询近日发布了《中国对话机器人 chatbot 行业发展研究报告》。该报告围绕对话机器人的产品功能、行业趋势、应用前景与发展洞察等进行了深入分析。报告显示,整个对话机器人行业的市场规模将从 2020 年的 27.1 亿元跃升至 2025 年的 98.5 亿元。从业务增长性来看,政务热线、泛政务等领域在未来有广阔的渗透空间,到 2025 年,政务领域对话机器人市场规模将达到 9.4 亿元,占总规模的 10%。

  报告研究显示,金融行业是对话机器人应用最多的领域,2020 年金融领域对线 年,金融领域对话机器人市场规模将达到 27.6 亿元,占总规模的 28%,持续为各子行业领域占比第一。报告还指出,融合了计算机视觉和多模态模型等技术的多模态数字人,是对话机器人产品形态上一次飞跃式的升级,也是行业发展的重要发展方向。金融行业的客户服务成为了数字人的最佳落地场景。

  8 月 10 日,《福布斯》发布“2021 Cloud 100强”榜单。该榜单从福布斯数据合作伙伴Bessemer Venture Partners 收到数百份申请中,挑选云领域具备强劲财务实力和其他特殊定性因素(如前所未有的客户接受度和满意度)的佼佼者。25 名(大部分为上市云公司CEO)评委组成的评审团,通过定量和定性分析,评选出100家上榜企业。评估涉及四大维度:估值(30%)、运营指标(20%)、人员和文化(15%)和市场领导力(35%)。今年榜单新增 29 位新成员,包括 3 家中国公司:Airwallex、帆软软件、聚水潭(JST)。帆软专注于商业智能领域;Airwallex 主要提供智能、无缝的跨境支付解决方案;聚水潭(JST)则以电商服务导向的企业资源计划切入市场。

  8 月 1 日,“青年科学家 50² 论坛”在深圳开幕,数十位院士与知名高校校长、百余名“科学探索奖”获得者与青年科学家同聚。“科学探索奖”是目前国内金额最高的青年科技人才资助计划之一。在论坛开幕式上,由 100 位“科学探索奖”获奖人提出并最终投票产生的“十大科学技术问题”重磅揭晓如下:

  8 月 20 日,北京智源人工智能研究院及清华大学智能产业研究院(AIR)强强联手成立“清华(AIR)- 智源健康计算联合研究中心”,马维英任联合中心主任。中心将致力于通过人工智能技术推动健康各领域从孤立、开环走向协同、闭环发展。推动被动式健康管理走向提早预测、主动预防、个性化、主动参与的新范式,实现更智能的个人健康管理,更有效的公共健康治理。

  8 月 19 日,上海交通大学未来技术学院正式揭牌成立。香港首富、宁德时代公司董事长曾毓群担任未来技术学院名誉院长,宁德时代首席制造官和工程制造及研发体系联席总裁倪军出任首任院长。曾毓群是上海交大船舶工程专业 1989 届本科校友,在今年 4 月被聘为上海交大校董。倪军主要从事先进制造科学领域中智能制造技术研究,现为密西根大学吴贤铭制造科学冠名教授及机械工程系终身教授。上海交大未来技术学院将开设可持续能源和健康科学与技术两个新专业。到2025年,招生规模预计达到本科生 2000 人(国内学位生 1200 人,国际学位生 400 人,国际访问生 400 人)及研究生 1600 人。

  8 月 13 日,华中科技大学计算机学院服务计算技术与系统教育部重点实验室组建的图计算团队获 GraphChallenge 2021 冠军。Graph Challenge 是图计算领域最具影响力的国际赛事之一,这是国内团队第一次在该赛事中获得冠军。华中科技大学参赛团队选择稀疏神经网络推理作为主赛道,为加速人工智能应用提供新方案。这个赛道的任务是将神经网络的权重数据抽象为图数据,执行推理任务,是人工智能领域的典型应用场景。

  2021 年中国科学院院士增选初步候选人名单现已公布。人工智能领域有南京大学人工智能学院院长周志华教授、清华大学胡事民教授入围增选。计算机领域共有 5 位学者入选。此轮初步候选人共有 191 人,包括数学物理学部 29 人、化学部 28 人、生命科学和医学学部 32 人、地学部 27 人、信息技术科学部 26 人、技术科学部 39 人。其中,北京大学入选 13 人,清华大学紧随其后入选 11 人,浙江大学有 6 人入选。南京大学、南开大学、上海交通大学和中科院物理所分别有 5 人入选。

  人工智能先驱、图灵奖得主、“深度学习三巨头”之一、“卷积神经网络之父” 杨立昆(Yann LeCun)教授的自传《科学之路:人,机器与未来》于 2021 年 8 月 1 日在中信出版集团出版。杨立昆教授在书中对人工智能提出了 10 个问题并进行了深入探讨,还分享了自己的学术生涯以及他对人工智能的理解和机器学习、深度学习等领域的看法。

  智源研究院院长黄铁军教授受邀为《科学之路》作序——《让历史告诉未来》。黄铁军认为 LeCun 等人所倡导的自监督学习并非智能的本质,指出人工智能未来的发展途径有三条:一是“大数据+大算力+强算法”的信息技术方法,从而得到信息模型。二是“结构仿脑+功能类脑+性能超脑”的类脑途径,从而得到生命模型。三是“强化学习+物理模型+算力”的自主学习途径,从而得到自主智能模型。

  近日,中国工程院院士李国杰发文讨论国内 AI 研究如何摆脱困境问题。该文章指出,目前我国大学和企业的人工智能实验室大多遇到顶天顶不了、立地又落不下去的困境,希望人工智能界的学者认真总结经验教训,在研究方向选择上多费点心思,争取获得让人眼睛一亮的重大成果。

  字节跳动 AI 实验室总监李磊称将重返学术界,加入加州大学圣巴巴拉分校(UCSB)的Computer Science 担任助理教授。李磊是上海交大 ACM(Association of Computing Machinery)班的第一批学生,毕业后考取了卡耐基梅隆大学计算机科学博士。在机器翻译研究过程当中,李磊团队侧重方向包括:多语言统一学习、无监督翻译模型、语音同传等,同时也开展了加速二阶算法,自适应优化算法等加速深度神经网络训练和干预方面的研究。截止目前,李磊已在机器学习、数据挖掘和自然语言理解领域于国际顶级学术会议发表论文 40 余篇。他也是 ACL 2021 最佳论文Vocabulary Learning via Optimal Transport for Neural MachineTranslation的合作著作者之一。

  朱俊彦等来自 CMU 和 MIT 的研究者提出 GAN Sketching,该方法通过一个或多个草图重写 GAN,让新手用户更容易地训练 GAN,还能通过用户草图改变原始 GAN 模型的权重,并通过跨域对抗损失鼓励模型输出来匹配用户草图。仅用一个或数个手绘草图,即可以自定义一个现成的 GAN 模型,进而输出与草图匹配的图像。相关论文已被 ICCV 2021 会议接收。

  阿里安全人工智能治理与可持续发展实验室(AAIG)等机构的研究者提出了一个通过扔掉一些不可察觉的图像细节来生成对抗样本的机制。这项研究成果已被 AI 顶会 ICCV 2021 收录。

  来自 MIT、Adobe Research 、CMU 的研究者探索了允许用户能够编辑类别级别的 NeRF,也被称为条件辐射场,在一个形状类别上进行训练。具体而言,研究者提出了一种将粗糙的 2D 用户涂鸦传播到 3D 空间以修改局部区域的颜色或形状的方法。

  若在前向传递中存在全局汇聚层,那么 CNN 在表示中如何包含位置信息?加拿大怀雅逊大学、约克大学等机构的研究者通过严格的定量实验证明,CNN 是通过沿着通道维度编码位置信息来做到这一点的,即使空间维度是折叠的也能实现。该研究还表明位置信息是基于通道维度的排序进行编码的,而语义信息在很大程度上不受这种排序的影响。

  在研究AI视觉稳定性的过程中,阿里安全图灵实验室的研究人员札奇发现,AI视觉有一个盲区:利用算法自动鉴别图片关键信息,并巧妙删除,就像给图片“打码”一样,AI视觉系统就会无法识别该图片。这项研究成果被AI顶会ICCV 2021收录。

  本源量子团队基于自主研发的量子机器学习框架VQNet,设计实现的量子生成对抗网络(QGAN)可用于图像处理领域,比如人像的修复。与经典计算机相比,量子计算处理图像在时间上具有指数级提升,在空间上处理的数据量也将随之呈指数级增加。其应用体验于8月5日正式上线日

  来自清华大学、微软亚洲研究院的研究者提出了一种基于加性注意力的Transformer 变体Fastformer,它能以线性复杂度实现有效的上下文建模。

  美国斯坦福大学博士Stephan Eismann和Raphael Townshend在计算机科学副教授Ron Dror的指导下,使用新机器学习技术,开发了一种方法,通过计算预测精确分子结构,从而帮助克服确定生物分子的三维形状这一问题。相关论文8月27日刊登于《科学》。论文名称:Geometric deep learning of RNA structure

  在Hot Chips大会上推出该公司旗下Z系列企业级处理器“Telum”。Telum采用三星7nm工艺制造,是IBM首款具有芯片上加速功能的处理器,而且能够在交易时进行人工智能推理。该芯片包含8个处理器核心,具有深度超标量乱序指令管道(A deepsuper-scalar out-of-order instruction pipeline),时钟频率超过5GHz,并针对异构企业级工作负载的需求进行了优化。8月23日

  8月18日,百度世界2021大会在线举行。会上,百度创始人、董事长兼首席执行官李彦宏发布了百度自主研发的第二代百度昆仑AI芯片“昆仑芯2”,并宣布实现量产。

  美国电动车制造商特斯拉公司19日发布一款人工智能(AI)训练芯片,用于数据中心人工智能网络训练。

  来自斯坦福大学的博士生 Keenon Werling提出了一个快速和功能完备的可微分物理引擎 Nimble,它支持拉格朗日动力学和关节刚体模拟的硬接触约束。开源SOTA人体骨骼模型Atlas。

  瑞士洛桑联邦理工学院研究人员开发的鳗鱼机器人登上Science Robotics封面。该鳗鱼机器人利用其各部分装有的传感器装置,能在中央控制系统损坏情况下,从水中获得传感反馈信号来协调其运动。

  弗吉尼亚大学教授 Dan Quinn 和博士后钟强结合生物力学、流体力学和机器人学揭秘了如何利用动态弹性调节实现高性能游动,研究已登上最新一期《Science Robotics》。

  哈工大团队打造的一款面向青少年人工智能教育的仿生四足机器狗XGO-Mini,能模拟波士顿动力spotmini的动作:伸懒腰、歪头卖萌……还能做出握手、觅食、甚至撒尿等动作。8月3日,这款12自由度桌面级四足机械狗XGO上线海外众筹平台Kickstarter ,1小时完成众筹目标,三天破十万美金,预计9月初完成三十万美金众筹总额。

  波士顿动力 双足人形机器人 Atlas 展示了接近于人类的跑酷能力,能够快速越过具有一定倾斜度的障碍物、执行快速转身、跳跃等动作。

  由俄勒冈州立大学孵化出来的公司 Agility Robotics 制造的两腿机器人Cassie。Cassie 通过深度强化学习算法学会了跑步,在 53 分钟内跑完户外 5 公里,没有系安全带,并且只充了一次电,还能在转换位置或运动时保持平衡。

  百度研究院机器人与自动驾驶实验室(RAL)在 Science 子刊《Science Robotics》上发文,提出了全球首个落地的无人挖掘机作业系统(Autonomous Excavator System, AES),内置的 AI 算法可以保证不同工况和环境中的无人化作业。

  首尔大学与汉阳大学的研究团队开发出了一个仿变色龙软体机器人,它具备实时、自动融入背景环境的伪装能力。

  谷歌公司对旗下音频编解码器SoundStream进行了技术详解。SoundStream是一款从端到端的“神经”音频编解码器,可处理的音频包括语音、音乐和环境声音。同时,SoundStream可同时进行压缩和增强音频以消除背景中的噪音。

  快手研究团队 MMU(Multimedia understanding)联合清华大学研究人员提出了一种基于音频信号的语种识别新方法。该方法自研一种动态多尺度卷积的新型网络结构,通过动态卷积核、局部多尺度学习和全局多尺度池化技术来捕获全局和局部上下文的语种 / 方言信息。目前该论文已经被国际顶级语音会议 Interspeech2021 所接收。

  IEEE P2807.4《科技知识图谱指南》(Guide for Scientific Knowledge Graphs)标准启动会成功在北京召开。该标准项目由北京智谱华章科技有限公司联合清华大学、中国电子技术标准化研究院等多家单位共同提报,并于 2021 年 3 月经 IEEE 标准协会标准委员会(IEEE SASB)审核正式获批立项。

  中国网是国务院新闻办公室领导,中国外文出版发行事业局管理的国家重点新闻网站。本网通过10个语种11个文版,24小时对外发布信息,是中国进行国际传播、信息交流的重要窗口。

分享: