谷歌量子计算改进图像分类,微美全息5G核心算法助力AI视觉发展

来源:岁月联盟 编辑:猪蛋儿 时间:2020-08-26

在一个新的教程中,谷歌的研究人员演示了如何使用量子计算技术对由单个光子照射的28像素乘28像素的图像进行分类。通过改变光子的量子态,他们表明他们能够在流行的手写数字MNIST语库上实现“至少”41.27%的精度——比传统计算方法提高了21.27%。

谷歌已经证明了量子计算也能解决传统机器学习中的图像分类问题,而且随着技术发展,量子计算机将在在学习能力上超越经典的神经网络。

另外量子计算还能解决经典网络中一些棘手问题,比如预防出现模型训练中的梯度消失问题。

工作研究人员说,这是为了说明量子力学教科书可以揭示人工智能问题,认为最大的可实现的分类精度,如果一个算法必须做出决定后发现第一个“量子”的光(即光子)通过液晶屏幕显示一个图像从一个数据集。MNIST,最经典的计算可以完成的是检测一个落在图像像素上的光子,然后通过将每张图像的亮度重调到一个单位和来从光强分布中猜测数字。

MNIST 对于机器学习研究者来说再熟悉不过了,它是一个由 Yann Lecun 等人创建的手写数字图像数据集,包含训练集和测试集,训练集包含 60000 个样本,测试集包含 10000 个样本(在 2019 年又增加了 50000 个测试集样本)。

研究人员的量子力学方法使用分光器、移相器和其他光学元件来创建一个类似全息图的推理模式。光子降落的推理模式区域可以用于图像分类,说明没有必要同时照亮多个光子以产生干扰。

研究人员写道:“从概念上讲,利用干扰来提高量子实验产生所寻求结果的可能性,是所有量子计算的基本理念。”“除了为量子和机器学习专家提供一个简单易懂的玩具问题之外,这个简单量子/简单机器学习角也可能对在一个更容易理解的设置中教授测量过程的物理很有兴趣。”

有人预测,量子计算将在人工智能和机器学习领域取得重大进展。例如,去年3月,IBM、MIT和牛津大学的研究人员在《自然》杂志上发表了一篇论文,声称随着量子计算机变得更加强大,它们将能够进行特征映射。在高度复杂的数据结构上,将数据分解成非冗余的特性,这是传统计算机无法做到的。然后,研究人员将能够开发出更有效的人工智能,例如,能够识别经典计算机看不到的数据模式。

“机器学习和量子计算这两项技术都有可能改变计算的执行方式,以解决以前无法解决的问题,”《自然》杂志论文的合著者写道。量子算法提供的计算加速的一个核心要素是通过可控的纠缠和干涉来开发指数级大的量子状态空间。

在现代科技中,量子力学和机器学习都发挥着重要作用,量子计算的 AI 应用这一新兴领域很有可能帮助许多学科实现重大突破。然而,目前大多数机器学习从业者对量子力学还没有透彻的了解,多数量子物理学家对机器学习的理解也非常有限。因此,找到一些二者都能理解的问题非常重要,这些问题既要包含简单且被广泛理解的机器学习思想,也要包含类似的量子力学思想。

全息技术可能是量子计算的关键

研究光的突破可能就是量子计算未来的入场券。利用电子和光之间相互作用的量子性质,以能量而不是空间来分离光束——这使得他们可以利用光脉冲加密电子波的信息,并用高速电子显微镜对其进行映射。

摄影测量不同颜色的光照射摄影胶片的程度。然而,光也是波,因此以相为特征。相位指定波周期内点的位置并与信息深度相关,这意味着记录物体散射的光的相位可以检索其完整的3D形状,这是通过简单照片无法获得的。这是光学全息术的基础,在星球大战等科幻电影中由花哨的全息展示。

目前,微美全息为中国领先的全息云综合技术方案提供商之一,公司提供从全息视觉AI合成与呈现、全息互动软件开发、全息AR广告投放、全息AR SDK支付、5G全息通讯软件开发到全息人脸识别等全息AR技术的一站式服务,商业应用场景主要聚集在家用娱乐、光场影院、演艺系统、商业发布系统及广告展示系统等五大专业领域。

在招股书里显示,随着5G全息通讯网络带宽条件变化,5G全息应用市场将迎来爆发,全息互动娱乐、全息会议、全息发布会等高端应用逐步向全息社交、全息通讯、全息导航、全息家庭应用等方向普及。微美全息云计划基于全息AI人脸识别技术和全息AI人脸换脸技术为核心技术,用多个技术创新的系统支持全息云平台服务和5G通讯全息应用。

目前,传统的全息术可以通过测量光从物体不同部分传播的距离差异来提取3D信息,但这需要来自不同方向的额外参考光束来测量两者之间的干扰。这个概念与电子相同,但由于波长短得多,我们现在可以获得更高的空间分辨率。例如,我们能够通过使用超短电子脉冲形成全息图来记录快速移动物体的全息电影。

除了量子计算之外,与替代方案相比,该技术具有最高的空间分辨率,并且可能改变我们在日常生活中对光的思考方式。到目前为止,科学和技术仅限于自由传播光子,用于宏观光学设备,新的全息技术让我们可以看到纳米级光线会发生什么,这是小型化和将光器件集成到集成电路上的第一步。

提到5G网络,与4G时代不同,将具有更高速率、更低时延和海量的连接。较4G提升数十倍的速度、低于1ms的低时延、全球超过500亿台设备相互连接。以此,也建立了超宽带移动通信(eMBB)、超低延时通信(uRLLC)、海量物连(mMTC)三大5G应用场景。正是基于这三大场景让5G时代催生了更多AR全息、无人驾驶和远程医疗、万物互连等市场的应用。从人与人的交互,转变成物与物的沟通,实现电信级的蜂窝物联,或将引发人类社会的一场新变革。

通信行业专家指出,射频在5G手机的设计中尤为关键。4G手机最大的制造成本在屏幕与处理器,但5G手机最大的成本或许会转向整套的射频方案。市场调查机构Navian预测,2020年仅移动终端中射频前端芯片的市场规模将达到212亿美元,年复合增长率达15.4%。5G时代将有更多的频段资源被投入使用,多模多频使得射频前端的芯片需求增加,同时Massive MIMO、波束成形、载波聚合、毫米波等关键技术也将助长射频前端芯片需求增加这一趋势,直接推动射频前端芯片市场成长。

5G带来的超宽带高速传输能力和低时延,可以解决VR/AR渲染能力不足、互动体验不强、终端移动性差和眩晕等痛点问题。

在普及AR的过程中,5G的优势主要体现在三个方面:更高的容量,更低的延迟和更好的网络均匀性。

当网络时延降低至毫秒级时,由于运动状态与视觉系统不一致造成的不适感将不复存在,因此5G网络的商用将使AR在传输方面的屏障将被打通,困扰AR技术在移动端应用的问题将会迎刃而解,AR/VR生态圈日趋成熟,将伴随5G迎来新的发展机会。