新闻中心

Intel在加速深度学习中提供“实时人工智能”技术

 2017-09-15

人工智能(Artificial Intelligence)和深度学习(Deep Learning)有望转变人类与世界互动以及企业运作的方式,从而使人们做出更明智的决策,而英特尔技术正在实现这场变革。今天,英特尔将着重介绍全球最大的云服务提供商之一是如何利用英特尔人工智能技术来运行复杂的深度学习模型,这些模型实现了各种应用,从智能手机上的人脸识别和语音识别再到自动驾驶等等。

微软选择了英特尔® Stratix® 10 FPGA 作为其新的深度学习加速平台(代号为 Project Brainwave)的关键硬件加速器。这种基于 FPGA 的深度学习加速平台可以提供“实时人工智能”技术,使云基础设施能够以超低延迟来尽可能快速地处理和传输数据。在云中,系统需要处理直播数据流(包括视 频,传感器或搜索查询)并快速将数据传送回用户,因此提供实时人工智能变得越来越重要。

 

 

Stratix 10 FPGA  SoC FPGA 使用了英特尔 14nm 制程工艺

在发布的博客中,微软详细介绍了采用英特尔 FPGA 的 Project Brainwave 平台如何以“前所未有”的高性能来灵活处理极具挑战性的深度学习模型。微软在 2017 年高效能芯片大会(Hot Chips 2017)上展示了基于 FPGA 的深度学习平台,该盛会主要展示半导体技术领域中的最新成就。微软是第一家在其公有云基础设施中部署 FPGA 的大型云服务提供商,而其通过英特尔 Stratix 10 FPGA 实现的技术进步加速了深度神经网络(DNN),这种网络可以通过概念类似的方式复制人类大脑的“思维”。

 

人工智能是一个快速发展的领域,需要多种技术来有效管理各种工作负载的需求。英特尔提供广泛的技术以推动市场演进,包括英特尔至强® 处理器,英特尔® FPGA 和英特尔 Nervana™ ASIC 技术。与那些为运行单个工作负载而优化的专用深度学习硬件加速器相比,英特尔 FPGA 的高度灵活性让用户可以自定义硬件以满足特定的工作负载需求,并可以随着深度学习工作负载和使用模式的更改而快速地重新配置硬件。英特尔 Stratix 10 FPGA 结合了硬化处理器模块,这种模块可提供高水平的持续性能和效率,并可根据使用者的自定义来灵活的程序设计。

许多硅人工智能加速器目前需要将多个请求分组(称为“批处理”)以实现高性能。微软的 Project Brainwave 平台利用英特尔 Stratix 10 技术,在单个请求上展示了超过每秒 39 万亿次浮点运算的性能,在云中确立了实时人工智能计算的新标准。Stratix 10 FPGA 为实时人工智能计算确立了新的云性能标准,具有创纪录性的低延迟、高性能以及无需批量处理人工智能请求的多种特点。

微软研究院 NexT 的著名工程师 Doug Burger 说:“我们利用英特尔 FPGA 的高度灵活性快速整合创新,同时提供与许多基于 ASIC 的深度学习处理单元相当或更高的性能。微软正努力在 Azure 云中部署 Project Brainwave,以便客户最终能够以创纪录式的高性能运行复杂的深度学习模型。”

通过加速模型训练、快速评分和高度可扩展的基础设施,基于英特尔技术的机器学习平台将数据转化为可操作的商业智能。结合最新的英特尔至强可扩展处理 器,英特尔 FPGA 可自定义和程序设计以提供低延迟和灵活的精度,与单独的英特尔® 至强™ 处理器相比,在深度学习推理方面每瓦特功耗具有更高的性能。