苹果公司在去年12月发布的第一份公开发表学术论文《计算机视觉系统研究》(网易智能做了全篇中文编译报道),最近在2017年计算机视觉与模式识别大会上获得了最佳论文奖,这是该领域最受欢迎的奖项之一。
作为学术研究的衡量标准之一,今年7月,CVPR被认为是该领域最有影响力的会议之一,它将苹果的论文列为两项最佳论文奖之一。
据Appleinsider的读者汤姆说,CVPR奖是该领域最受欢迎的奖项之一。汤姆拥有机器学习和计算机视觉方面的博士学位。
今年,大会收到了创纪录的2680份有效意见书,其中有2620份被审查。代表们将这一数字削减至783份,保证71名参赛者能够进行长时间的口头陈述。苹果的研究论文最终挤到了最前面,考虑到这是该公司的首次展示,这将是一个令人印象深刻的成就。
CVPR的第二份最佳论文奖获得者是Gao Huang, Zhuang Liu, Laurens van der Maaten和Kilian Q. Weinberger。他们对“密集连接的卷积网络”进行了研究。这篇论文的研究是由康奈尔大学与清华大学和Facebook人工智能研究合作完成的。
这篇题为《借助对抗训练,从模拟、无监督图像中学习》的论文由计算机视觉专家Ashish Shrivastava执笔,由Tomas Pfister、Oncel Tuzel、Wenda Wang、Russ Webb和苹果人工智能研究主管Josh Susskind撰写。7月23日,Shrivastava向CVPR与会者展示了这项研究。
去年12月,苹果公司的公共研究报告详细描述了计算机视觉算法训练的技术,用以识别使用合成图像的物体。
根据苹果公司的说法,仅仅基于真实世界图像的训练模型通常比那些利用合成数据的模型效率低,因为计算机生成的图像通常都是通过添加标签。例如,一只眼睛或手的合成图像被标注为这样,而真实世界的图像描述类似的物体则是未知的,因此需要由人类操作员来描述。
然而,正如苹果所指出的,完全依赖于模拟图像结果可能不尽人意,因为计算机生成的内容有时不够真实,无法提供准确的学习集。为了弥补这一差距,苹果研究出一个系统,通过“模拟+无监督学习”,来改进模拟器的输出。这项技术将未标记的真实图像数据和带注释的合成图像结合起来,使用生成对抗网络(GANs),或相互竞争的神经网络。
在这项研究中,苹果将SimGAN应用于静态图像的凝视和手部姿势评估。该公司表示,他们希望有一天能将“s+u”学习模式更多地用于支持视频输入。
与其他硅谷科技公司一样,苹果正在将大量资金投入机器学习和计算机视觉技术领域。从这些研究中收集到的信息可能会改进面向消费者的产品,比如Siri和增强现实的应用。该公司还在开发多种自主解决方案,包括自动驾驶汽车应用,这些应用可能在未来几个月或几年里进入市场。
“我们专注于自主系统,”库克在6月接受采访时说。“这是一项我们认为非常重要的核心技术。我们把它看作是所有人工智能项目的鼻祖。”(选自:appleinsider 作者:Mikey Campbell 编译:网易见外智能编译平台 审校:Simone)
责任编辑:馨予
科技
苹果
1.75亿 | 未成年网民1.75亿 未成年互联网普及率达93.1% |
692.59亿 | 拼多多市值超京东 拼多多总市值约692.59亿美元 |
2倍 | 任天堂1至3月利润暴涨2倍 动物森友会创销售记录 |
9.56亿 | 动视暴雪发布Q1财报:微交易收入9.56亿美元 |