40纳秒完成图像分类，图像传感器自带神经网络登上Nature

fengzhimohan

2020-03-05

关注关注

AI芯片还可以怎么搞？登上Nature的研究带来新启发。

过去，我们做图像分类都是分成好几步：先用传感器收集图像模拟信号，数模转换后再交给计算机处理。整个过程既耗能又费时，就像眼睛把图像传给大脑。

试想一下，如果人类眼睛可以直接处理图像——不用劳烦大脑，那视觉图像信息的处理速度岂不是可以大大提升？

今天，Nature这篇新研究开拓性在于，直接让“眼睛”处理图像。而且效果反馈也相当震撼：

利用新感光元件，仅仅40纳秒即可完成图像分类，比交给计算机处理快了几十万倍。

真是不得了。

光电二极管网络

核心来说，研究团队在芯片上构建了一个光电二极管网络，并选择2D半导体二硒化钨（WSe2）作为光敏材料。

△单个二硒化钨光电二极管示意图

光电二极管阵列由27个具有良好均匀性、可调性和线性度的检测器组成，排列为3×3的成像阵列，像素大小约为17×17μm，每个像素由3个二硒化钨光电二极管（子像素）组成，其对光的响应度可以通过栅极电压调节。

也就是说，可以通过改变施加的电压来调节半导体对光的响应，从而调节每个二极管的灵敏度。

实际上，这就将光电传感器网络变成了神经网络，将光学传感和神经形态计算结合起来，使其能够执行简单的计算任务。

改变二极管的灵敏度，就相当于改变神经网络中的权重。

把权重放在传感器上

与其他神经不同的是，这套系统的权重不是存在计算机的内存和硬盘里，而是直接集成在图像传感器上。

实验中使用的有硒化钨光电二极管制成的特殊门电路。它的特殊就在于可以调制，相当于神经网络的训练。

随着外接偏置电压的不同，二极管对光线的敏感程度也不同，等于将网络的训练结果直接放在传感器端。

之前的神经网络都是将训练权重存储在外部存储器上，通过电路发送到每个检测器件上。

就像电脑的内存，断电后就会丢失存储信息。

而这一套设备，更像是硬盘，即使掉电后也能将权重信息存储下来。

研究人员将调制的电极也就是浮栅（floating gate）埋在氮化硼绝缘层中，一开始先对氧化铝绝缘层中的栅极加上电压，接着撤去外部电压。

浮栅依旧能在接下来的2300秒内维持对光电二极管的调制，直到改变外部偏置电压为止。

研究人员用这种方法实现了两种类型的神经网络：分类器和自动编码器。

在分类器中，光电二极管阵列、芯片感知器以及在芯片外的非线性激活函数一起运行。这种类型的神经代表一种监督学习算法，该算法能够将输入图像P分为不同的输出类别y。

实际效果如何呢？他们3×3像素制作了一组“简陋”的字母，分别是n、v、z。

图像传感器经过训练后，只需测量对应电路的电流是否为0，就能知道是哪个字母。

通过电压随时间的变化图可以看出，当传感器接受到图像40ns后，n和v两种输入产生的电压开始出现巨大的差异，约100ns后差异达到最大。

第二种神经网络是自动编码器，可以在无监督的训练过程中学习输入图像P的有效表示。它与解码器一起使用，对解码器进行训练后，就可以在其输出中重现图像。

编码器由光电二极管阵列本身构成，解码器由外部电子器件构成。

在这个过程中，图像的传输数据得到了压缩。

潜力巨大，但仍需大量后续研究

40纳秒就分辨出了两张不同的图像，AI视觉仿佛朝着人类大脑的效率更进一步。

但需要说明的是：这一令人兴奋的新技术，距离实际应用，还有很长的路要走。

首先，由于光电二极管阵列仅由27个检测器组成，最大只能处理3×3的图像。

其次，想要真正应用于自动驾驶和机器人技术，视觉系统需要捕获具有广阔视野的三维动态图像和视频。而现在，该技术是将3D视觉信息转换成2D来处理，丢失了运动信息和深度。

其图像传感器阵列的平面形状，也限制了广角相机的能力。

此外，根据Nature的报道，论文中描述的设备很难在昏暗光线下成像。并且，其设计需要高电压和大功率，相比之下，生物神经网络中每项操作消耗的能量仅为10-15到10-13焦耳。

从工艺角度上讲，芯片所采用的薄半导体目前很难大面积生产加工。

而且，尽管图像传感器兼具了采集和计算功能，减少了模数转换，但外部电路仍然存在固有延迟问题，还是会影响整个系统的等待时间。

不过，虽然还有很大的研究空间，在传感器中计算的相关研究，推动了AI硬件的进一步发展。而这样的研究思路，也不仅仅局限于计算机视觉，可以扩展到听觉、触觉等其他物理输入中。

其他尝试

人们对快速处理图像信息的要求越来越高，很多科学家都在研究在输入端处理图像的方法。

最近来自荷兰和美国学者也发明了一种在传感器端直接处理图像的方法。

不过他们不是输出图像的分类，而是输出图像的边缘，这对于目标检测和语义分割有重要的意义。

他们在传感器前方加入了一个“超表面”：不到半毫米厚的蓝宝石薄片，镀上206 nm厚、142 nm高、间距300 nm的硅长条。

把它放置在CCD感光芯片的表面上时，超表面的作用就像一个透镜，光线只能以陡峭的角度射向它，而过滤掉入射角很小的光。

图像的特征是由不同光波的组合而成，滤除了光波携带的其他细节，仅留下了较尖锐的分量，例如人脸的边缘，而不是单色的背景。

整个过程仅需要150纳秒的时间，而交给计算机处理需要几毫秒，二者相差4个数量级。

研究团队

最后介绍下研究团队，来自奥地利维也纳工业大学的Unterrainer group。

论文一作：Lukas Mennel，是电气工程与光子学专业在读博士，曾作为访问学者赴MIT交流学习，研究量子光子学。

△Lukas Mennel

神经网络 nature 权重

fengzhimohan

0 关注 0 粉丝 0 动态

关注关注

对迁移学习中域适应的理解和3种技术的介绍

域适应是计算机视觉的一个领域，我们的目标是在源数据集上训练一个神经网络，并确保在显著不同于源数据集的目标数据集上也有良好的准确性。为了更好地理解域适应和它的应用，让我们先看看它的一些用例。我们有很多不同用途的标准数据集，比如GTSRB用于交通标志识别，LI

皮皮虾大侠 2020-11-10

仅有算法远远不够：AI突破下一站，需要对硬件重新审视

如今的人工智能存在一个很重要问题：太贵了。训练现代计算机视觉模型Resnet-152的成本大约为100亿浮点运算，这比起现代语言模型相形见绌。训练OpenAI的最新自然语言模型GPT-3预计耗费3000万亿浮点运算，其中在商用GPU上的成本至少为500万美

Site 2020-11-07

选择困难终结者：不同问题之下的机器学习算法

刚开始学习数据科学时，笔者经常面临这样一个问题：遇到具体问题，选择何种算法才合适。也许你也和我一样，搜了很多有关机器学习算法的文章，会看到许多详细的描述，却并没有减少让抉择的难度。问题陈述2：深挖客户统计数据用以识别模式。问题陈述12：根据车辆特性预估车辆

lwnylslwnyls 2020-11-06

自动驾驶汽车深度学习如何应对挑战?

在自动驾驶汽车中使用深度学习可以帮助克服各种挑战，例如了解行人的行为，找到最短的路线以及对人和物体进行准确检测。根据一份报告，2018年约有80%的道路交通事故是由于人为错误造成的。因此，将自动驾驶汽车纳入主流的主要目标之一是消除对人类驾驶员的需求并减少道

86377811 2020-11-06

破解宇宙奥秘，为何人工智能是关键？

千百年来，人类对于宇宙一直抱有极大的好奇心。仰望天空，你会不禁感叹宇宙之大，那里有太多的东西需要人们去探索和发现。浩瀚宇宙，美丽如斯，宇宙学家和天体物理学家都在尽力揭开宇宙的神秘面纱。卫星每年传送下来数百兆字节的信息，智利正在建设的一台望远镜每晚将产生15

遇见人工智能 2020-11-03

如何在PyTorch和TensorFlow中训练图像分类模型

图像分类是计算机视觉的最重要应用之一。它的应用范围包括从自动驾驶汽车中的物体分类到医疗行业中的血细胞识别，从制造业中的缺陷物品识别到建立可以对戴口罩与否的人进行分类的系统。他们是如何做到的呢？你必须已阅读很多有关不同深度学习框架之间差异的信息。Tensor

xjtukuixing 2020-10-27

回归根基：5篇必读的数据科学论文，帮你保持领先地位

谷歌研究团队提供了在创建数据科学工作流时要避免的反模式的明确说明。这篇论文把技术债的隐喻从软件工程借鉴过来，将其应用于数据科学。假设检验的提出早于计算机的使用。

Evan 2020-10-26

全面的数据科学C/C++机器学习库整理，再也不用百度搜了

引言和动机--为什么是C++?C++是动态负载平衡、自适应缓存、开发大型数据框架和库的理想选择。以超低延迟和极高吞吐量著称的Scylla，使用C++作为Apache Casand and Amazon DynDoDB的替代者进行编码。C++作为编程语言的

xceman 2020-10-23

DeepMind发了篇物理论文，用神经网络求解薛定谔方程

只要解出薛定谔方程，你就能预测分子的化学性质。但现实很骨感，迄今为止，科学家只能精确求解一个电子的氢原子，即使是只有两个电子的氦原子都无能为力。原因是有两个以上电子组成的薛定谔方程实在太复杂，根本无法精确求解。近日，DeepMind开源了一个“费米网络”，

georgesale 2020-10-21

4个计算机视觉领域用作迁移学习的模型

使用SOTA的预训练模型来通过迁移学习解决现实的计算机视觉问题。如果你试过构建高精度的机器学习模型，但还没有试过迁移学习，这篇文章将改变你的生活。我们大多数人已经尝试过，通过几个机器学习教程来掌握神经网络的基础知识。这些教程非常有助于了解人工神经网络的基本

xceman 2020-10-15

机器翻译：谷歌翻译是如何对几乎所有语言进行翻译的？

谷歌翻译大家想必都不陌生，但你有没有想过，它究竟是如何将几乎所有的已知语言翻译成我们所选择的语言？本文将解开这个谜团，并且向各位展示如何用长短期记忆网络构建语言翻译程序。第一部分简单介绍神经网络机器翻译和编码器-解码器结构。什么是机器翻译？在机器翻译领域，

WhiteHacker 2020-10-11

算法中的微积分：5大函数求导公式让你在面试中脱颖而出

就业市场上，机器学习工程师总是受到质疑，人们不相信他们数学功底深厚。事实上，所有机器学习算法的本质都是数学问题，无论是支持向量机、主成分分析还是神经网络最终都归结为对偶优化、谱分解筛选和连续非线性函数组合等数学问题。只有彻底理解数学，才能正真掌握这些机器学

hexianhao 2020-10-06

科学家用机器人体外操控了小鼠脑神经！不到 1 分钟实现通信连接

本文转自雷锋网，如需转载请至雷锋网官网申请授权。但是，上面这款机器人可不普通，它带有神经元，能通过体外方式在神经簇之间形成并操纵神经网络。原因在于，这种方法可以在尽可能降低外部影响的前提下，在大脑目标位置进行精确的、有选择性的神经连接，从而测量神经活动、确

大白机器人 2020-09-30

深度学习之后会是啥？

我们被困住了，或者说至少我们已经停滞不前了。有谁还记得上一次一年没有在算法、芯片或数据处理方面取得重大显著进展是什么时候?几周前去参加Strata San Jose会议，却没有看到任何吸引眼球的新进展，这太不寻常了。我不是唯一一个注意到这些的人。例如，这

mpkno 2020-09-26

标准出现问题，人工智能正在走向错误的方向

我的这篇文章不是第一篇讨论人工智能界如何按自身规律发展的文章。正如不久前汉娜·克纳的话：“很多AI研究人员认为现实世界中的问题无关紧要。社区过度关注新方法，却忽略了真正要紧的事情。”许多大型会议公然忽视了应用型论文，这些文章聚焦于使用目前的技术解决现实世界

hiarxiaoliang 2020-09-23

自然语言处理必读：5本平衡理论与实践的书籍

当谈到学习方法时，我们常常会提到教程、博客文章、在线课程等等，书本总是会被忽略掉。即使是在找一本关于某个主题的书，也会很快发现这样的书太多了，无法快速判断哪一本最适合自己。它也称为NLTK书籍，应用Python进行自然语言处理在整个过程中都很大程度上依赖于

MakeRoomFor 2020-08-30

8个机器学习项目创意，助你在求职竞争中脱颖而出

本文转载自公众号“读芯术”。纸上得来终觉浅，绝知此事要躬行。光看教程是不够的，你需要通过实践来掌握更多更真实的内容。以下有8个创意十足的机器学习实操项目供你选择，赶紧行动起来吧!世界上有超过2.64亿人患有抑郁症。但与之相对的是，针对抑郁症的治疗却经常不到

lirika 2020-08-29

为什么AI感知与人类感知无法直接比较？

在开发AI系统的企业中，我们经常会听到这类表述，其指向范围则涵盖人脸识别、物体检测，乃至问题解答等各个方面。随着机器学习与深度学习的不断进步，近年来越来越多卓越的产品也开始将AI算法作为自身的实现基础。一旦贸然将关键性任务交付给AI模型，这种草率的考核标准

PokiFighting 2020-08-27

用C语言从头开始实现一个神经网络

本文转自雷锋网，如需转载请至雷锋网官网申请授权。在本文中，我们将用C语言从头开始实现一个基本的神经网络框架。在C语言中实现反向传播实际上会让我们更详细地了解改变权重和偏差是如何改变网络的整体行为的。我们的目标是建立一个通用的框架，其中的层数和神经元将由用户

cetrolchen 2020-08-14

图同构下等变,计算高效,韦灵思团队提出\"自然图网络\"消息传递方法

近日，韦灵思团队的一项研究通过研究图的局部对称性，提出了一种新的算法。该算法在不同的边上使用不同的核，从而使网络在局部与全局的图同构体上是等变的，也更易于表达。通常来说，常规神经消息传递算法在消息排列下是不变的，因此会忘记信息流如何在网络中传递。结果表明，

hnyzyty 2020-08-04

安科网

40纳秒完成图像分类，图像传感器自带神经网络登上Nature

fengzhimohan

光电二极管网络

△单个二硒化钨光电二极管示意图

把权重放在传感器上

潜力巨大，但仍需大量后续研究

其他尝试

研究团队

△Lukas Mennel

fengzhimohan

相关推荐

对迁移学习中域适应的理解和3种技术的介绍

仅有算法远远不够：AI突破下一站，需要对硬件重新审视

选择困难终结者：不同问题之下的机器学习算法

自动驾驶汽车深度学习如何应对挑战?

破解宇宙奥秘，为何人工智能是关键？

如何在PyTorch和TensorFlow中训练图像分类模型

回归根基：5篇必读的数据科学论文，帮你保持领先地位

全面的数据科学C/C++机器学习库整理，再也不用百度搜了

DeepMind发了篇物理论文，用神经网络求解薛定谔方程

4个计算机视觉领域用作迁移学习的模型

机器翻译：谷歌翻译是如何对几乎所有语言进行翻译的？

算法中的微积分：5大函数求导公式让你在面试中脱颖而出

科学家用机器人体外操控了小鼠脑神经！不到 1 分钟实现通信连接

深度学习之后会是啥？

标准出现问题，人工智能正在走向错误的方向

自然语言处理必读：5本平衡理论与实践的书籍

8个机器学习项目创意，助你在求职竞争中脱颖而出

为什么AI感知与人类感知无法直接比较？

用C语言从头开始实现一个神经网络

图同构下等变,计算高效,韦灵思团队提出\"自然图网络\"消息传递方法

fengzhimohan