当前位置:首页 > 嵌入式 > 嵌入式新闻
[导读]近年来,人工智能在经历了两次大的低潮后又成为科技界的大热门,这和深度学习这个分支的勃兴有很大的关系。在训练深度神经网络的时候,人们也越发认识到,具有大的数据吞吐量,且可以并行计算的GPU比CPU拥有更快的训练速度,更低的功耗,这一度让CPU的王者英特尔感到异常紧张和失落。

近年来,人工智能在经历了两次大的低潮后又成为科技界的大热门,这和深度学习这个分支的勃兴有很大的关系。在训练深度神经网络的时候,人们也越发认识到,具有大的数据吞吐量,且可以并行计算的GPU比CPU拥有更快的训练速度,更低的功耗,这一度让CPU的王者英特尔感到异常紧张和失落。

好在,人工智能硬件平台争夺的序幕才刚刚拉开。随着时间的推移,人们很快发现相比GPU和CPU,FPGA具有的低能耗、高性能以及可编程等特性,十分适合感知计算,而且可以做到快速部署。2015年,英特尔便动用167亿美元收购了当时全球第二大FPGA厂商Altera,也是有史以来最大的一笔收购案。

也是在那一年,凭借拥有号称最快的深度学习框架 neon和首个结合机器智能软硬件云服务的Nervana Cloud,深度学习初创公司 Nervana 被 VentureBeat 评为值得关注的五家深度学习初创公司,次年8月,暗中观察许久的英特尔豪掷4亿美元将仅有48名员工的Nervana收入了囊中。

2017年3月,Nervana 以及其他英特尔内部的人工智能相关业务和资源被整合进一个部门,即人工智能产品事业部(AIPG),由Nervana的联合创始人、前CEO Naveen Rao来领导,直接向英特尔CEO科再奇汇报。

 

据AI科技大本营了解, 在整合了 Nervana 的技术之后,英特尔AIPG 计划推出 Crest 家族系列产品线。 首先亮相的是一款叫做 Lake Crest 的芯片,它是专为训练DNN而深度定制的ASIC解决方案,预计今年下半年测试,2018年上市。据 Naveen Rao 曾经对媒体介绍,相对于目前最快的GPU, Lake Crest的加速性能是它的10倍。

在近日英特尔举办的人工智能端到端技术研讨会上,英特尔AIPG资深首席工程师Andres Rodriguez 介绍了英特尔在AI方面的技术布局、产业趋势以及Nervana系列芯片的进展情况。

 

英特尔AIPG资深首席工程师:Andres Rodriguez

据Andres Rodriguez介绍:Lake Crest 使用了Flexpoint架构,MCM多芯片封装,搭载32GB HBM2存储,内部互联速度是PCIe的20倍。

会后记者对Andres Rodriguez进行了专访。

Andres透露, Lake Crest 的测试时间之所以从2017年的上半年推迟到了下半年 ,是因为Nervana在被intel整合后,其产品的质量需要满足英特尔平台的高标准,所以他们添加了一些额外的验证,这或多或少的会影响产品开发的速度。

在被问到目前的工作状态和Nervana被收购前有何不同时,Andres表示他们的工作模式其实并没有发生特别大的变化,仍保持着一个初创企业勇往直前的状态。 只是由于被英特尔收购后,客户的期待变得更高,压力也更大了。

写到这里正准备截稿,记者在9月12日南京政府主办的中国人工智能峰会上邂逅了旷视科技的首席科学家孙剑博士,当被问及2018以后会不会在训练时考虑Lake Crest芯片这个问题,孙博士表示可能会吧,但硬件平台那么多不可能每家都去试,言下之意是毕竟公司已经和英伟达深度合作了,所以……

深度学习芯片的架构能否被英特尔重新定义需要到2018年才能验证,而在Lake Crest上市后,如何改变用户的使用习惯也是需要英特尔好好思考的问题。

 

Andres Rodriguez接受记者专访

以下为Andres Rodriguez的采访实录,记者做了不改变原意的整理:

关于Nervana系列芯片:Lake Crest年底测试,2018年量产

记者:Nervana系列芯片的定位是什么,它和GPU相比有什么不同?

Andres Rodriguez: 首先,我想简单介绍一下英特尔Nervana人工智能平台,作为我们的NPU,它是Crest家族产品。

和GPU相比,其实主要有两点不同:

第一个不同点是作为整个Nervana AI平台,Lake Crest是为了深度学习而量身定制的,因此它本身并没有内置图像显卡,换句话说它并不支持相关图像的处理,这是跟GPU很大的不同之处。

第二个重要的不同在于它的计算能力包括性能上都是针对深度学习而进行的量身优化。

当然,也有一些相似之处,比如整个Crest家族产品来讲,包括市面上一些最新的芯片产品,都是拥有高宽带内存,不用通过CPU就可以进行整个芯片之间包括核心之间的直接互联。

同时整个Nervana AI平台是为了深度学习而量身打造的,那么不管是硬件平台还是软件平台都可以达到一个很好的整合。

记者:我经常听到有关媒体提到Nervana芯片在深度学习训练方面,比GPU拥有更强的加速。可否针对性的谈一谈在计算速度和计算力这些方面它的具体性能是什么。

Andres Rodriguez: 我们产品整个详细的细节目前只对签了保密协议的客户开放,具体内容到今年年底才能公开。性能或是功耗提升具体的数字我暂时不能透露给您。但是可以说的是,与其他系列产品相比,我们利用度是非常高。

记者:说起Lake Crest上市或者测试的时间,之前有消息称应该是在今年上半年,但是为什么推迟到下半年,中间是遇到了什么困难吗?

Andres Rodriguez: 因素是多方面的,其中有一个最主要的原因是在英特尔进一步的整合Nervana平台之后,对于Nervana芯片必须进行更加严格的测试,才能让它更好的满足英特尔目前对芯片质量的要求,同时也能够满足英特尔在全产品质量以及全平台系列的高标准。 正是基于这一个要求,我们必须要做很多的测试工作。

记者:Lake Crest或者是Crest家族的芯片是如何支持像Caffe、Torch、TensorFlow这些比较流行的人工智能框架?

Andres Rodriguez: 不管是Lake Crest、至强还是Movidius、FPGA,我们对其他框架提供支持的方式,整体流程都是比较一致的。[!--empirenews.page--]

首先用户会把自己的模型写入他所替代的框架当中,在整个框架底部会有专门针对深度学习所打造的内容库,针对不同的内容库我们会对架构进行优化。

这里我可以拿TensorFlow举个例子,TensorFlow有一个量身定制的算法,同时至强处理器、FPGA都有专门的单元库。不管你使用的哪个框架、哪种不同的硬件,我们都会针对具体内容对它的单元库进行优化,整个的方法相对来讲是比较一致的。

记者:Crest家族的芯片适用于哪些具体的应用场景?

Andres Rodriguez: 整个Crest芯片家族的系列产品,都是针对深度学习不同类型的负载而打造的,不管是之前所说的物品检测、物体识别,同时还有视频处理、图像识别、图像处理,还有语音处理、自然语言的处理。整个深度学习的通用功能都是非常支持的,这都是它所适用的领域。

除此之外还有训练和推理,以及在数据中心当中的使用,也是Crest系列家族产品所支持的。同时,具体的应用领域还是很广泛的,不管是像现在的基因测序、金融领域以及自动驾驶领域,Crest系列的产品都可以使用;同时它的训练模型取决于具体的环境,我们也可以把它用在推理过程中,包括数据中心,如果你要做推理,我们的Crest家族系列产品也是可以支持的。

记者:如果现在你自己有一个训练神经网络的需求,你会怎么为自己选择一款芯片呢?

Andres Rodriguez: 其实不管像我自己还是现在很多市面上的客户,可能都是跟我处在一样的情况中,就是有大量可用的至强处理器去考虑。在这种情况下,我可能不需要特意买其他的专门为深度学习打造的硬件,因为在至强处理器上可以完成所有的工作。

对比六个月之前,我们的性能已经提高了一百多倍,所以我们没有必要考虑其他的解决方案。另外在整个训练的过程当中,我的工作负载所需要的时间可以大幅度的缩短,在处理深度学习训练过程中,所有的工作负载是被分布到不同的核上同时完成的,这个可以大量的降低时间。

记者:你刚才提到Lake Crest是在今年年底发布,中国市场和美国市场同步吗,都是在同一时间拿到产品?

Andres Rodriguez: 作为Lake Crest具体的硅片的话,今年年底我们会公布具体的细节。但实际的投产包括大规模的量产还是要等到2018年上半年。作为整个Lake Crest,会集成在Nervana Cloud当中,客户在Nervana Cloud对它进行测试。我们一些非常紧密的合作伙伴,不管是美国还是中国的,都可以直接在Lake Crest进行测试。

当然,我们具体的测试也是分成两个不同类型的合作伙伴群体。对于有大量需求的客户,我们是只对一些合作非常紧密的合作伙伴开放,他们可能考虑会在未来把我们的Crest部署在他们的数据中心。如果作为一个通用的测试,那么开放范围会更加广一点。

记者未来AIPG在AI芯片技术方面的计划是什么样的,或者有没有一个产品路线图?

Andres Rodriguez: 答案是肯定的,路线图我们有一个既定的规划,除了传统的计算以及训练和推理之外,我们还会建立起更加完善的深度学习生态系统的规划。 但是我们关注的并不仅仅是训练以及推理本身,我们还有其他很多的详细产品的规划,但具体的内容包括细节我们只会跟我们签署了保密协议的客户去分享。

关于AIPG目前的情况:团队相比之前的Nervana有了很大扩张

记者:关于你个人的工作状态,因为现在Nervana刚被英特尔收购,现在你在英特尔或者在AIPG工作的状态跟原来在Nervana的时候有什么不同吗?

Andres Rodriguez: 可以说目前为止英特尔人工智能产品事业部的整个领导层跟我们之前Nervana 系统没有什么太大的变化。 我们现在的GM也是整个英特尔的VP,是我们之前Nervana System的前CEO,也是之前Nervana的联合创始人。

Nervana现在已经被英特尔收购并且加入到了AIPG事业部,我们依旧秉承了之前作为一个初创企业的勇往直前的精神。 我们的工作模式其实并没有发生特别大的变化。我们还是希望快速的完成产品研发,并且非常专注于我们所擅长的领域。

其中一个最大的区别,就是我们的规模明显比之前Nervana要大得多,但是很多的传统还有一些价值理念都被很好的传承了下来。还有另外一个重要的不同之处,毕竟整个人工智能产品事业部是有英特尔大品牌作为一个重要的背景支撑,而客户对我们后续的产品将会有更高的期待。 不管从性能还是安全的角度来讲都是如此,这对我们来讲也是一个巨大的压力,也就是说加入英特尔之后,必须要有一个更高的标准来开发我们的技术和产品。

除此之外,我们要开发出更好的产品,产品的质量、标准和要求都会更高,这对我们来讲也是额外挑战的,为了满足高标准高要求, 我们要添加一些额外的验证或者工作,这可能或多或少的会影响我们产品开发的速度,这也是我们必须要做出是一个妥协。

记者:刚才说团队有一个很大的扩张,因为在Nervana被收购之前,我记得有48个人,现在你们团队有多少个人?

Andres Rodriguez: 我们的规模肯定要比之前大得多了,但是具体的员工数量暂时不方便透露。 我觉得加入英特尔对我们来讲一个非常巨大的优势就是尽管之前Nervana也是人才济济,但毕竟人数比较少;而现在在整个英特尔平台之下,硬软件包括数字科学家们,我们能接触到的专家越来越多,这将是一个最大的优势。

同时,我们的全球市场也更大,视角更开阔。 因为在整个AIPG我们不仅仅关注Lake Crest加速器、Nervana系统,我们还有一个更大的市场。

举个例子,我们与谷歌TensorFlow的优化就是在整个AIPG事业部带领下实现的,所以说AIPG有一个更大的市场。

对中国AI芯片公司的看法

请问你如何看待中国本土的AI芯片?

Andres Rodriguez: 我觉得在现在整个市场百花齐放,让每个企业都有自己的选择空间,这是一个非常利好的事情。因为在整个生态系统之内,各相关方都可以互相学习,并且能够推动整个深度学习领域的快速发展,所以说我们也是非常高兴和欢迎这一个市场的发展与进步。我们也是希望能够有机会与中国企业包括与更多的客户去充分合作,能够共同的开发针对深度学习领域的软件、硬件以及其他产品。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

英特尔全球供应链中,仅应用材料公司等27家企业获此殊荣

关键字: 英特尔 供应链

3月29日消息,根据国外媒体报道,2024年2月,韩国半导体产业迎来了显著的增长,其产量增幅达到了14年来的最高水平,同比增长65.3%。

关键字: AI ChatGPT 人工智能

随着科技日新月异的进步,语音识别技术已成为人工智能领域的一项核心突破。这项技术旨在模拟人类听觉系统,通过复杂算法和模式识别手段将连续或离散的语音信号转换为可理解的文本或指令信息。本文深入探讨了语音识别技术在多个领域的广泛...

关键字: 语音识别 人工智能

随着人工智能和信息技术的飞速发展,语音识别技术已经从实验室走向了现实生活中的各个角落,成为人机交互领域的重要组成部分。语音识别产品不仅丰富了我们的日常生活,也正在深刻地改变着众多行业的工作模式和服务形态。

关键字: 语音识别 人工智能

在当今大数据和人工智能时代,机器学习作为核心的技术驱动力,正以前所未有的速度改变着我们的生活和工作方式。从基础的数据分析到复杂的决策支持系统,机器学习模型的成功构建和应用离不开一套严谨的流程。本文将详尽阐述机器学习过程中...

关键字: 机器学习 人工智能

机器学习作为人工智能领域的核心技术,其应用日益广泛,从搜索引擎优化到医疗诊断,从金融风控到自动驾驶等众多领域均发挥着重要作用。深入理解并掌握机器学习的关键步骤是成功构建高效模型和解决方案的基础。本文将详细阐述机器学习的主...

关键字: 机器学习 人工智能

是德科技(Keysight Technologies, Inc.)现已开启与全新 NVIDIA 6G 研究云平台的合作。该平台包括 NVIDIA Aerial Omniverse 数字孪生,这是一个开放、灵活的网络仿真资...

关键字: 6G 人工智能 RAN

纵观人类近现代史,每一次工业革命都是将战略性科技转化为生产力,从而创造巨大的新增财富和全面提升国家竞争力的过程;而且一个国家在工业革命面前的“沉与浮”,则取决于一个国家对这些战略性科技和产业化能力的把控。从被称为蒸汽机时...

关键字: 人工智能 算力 大模型

近日,英特尔在深圳举办以“智绘混合AI新篇, 赋能生成式 AI 无处不在 -- OpenVINO™ 2024 焕新启航”为主题的OpenVINO™ DevCon中国系列工作坊2024活动,此次活动汇聚了英特尔产品专家、行...

关键字: AI 英特尔 AIGC大模型

Arm Neoverse 旨在为从云到边缘的全场景基础设施用例提供高性能和出色能效。针对需要更高性能的工作负载和用例,Arm 推出了 Neoverse V 系列。其中,Neoverse V2 核心已被行业先行者广泛部署于...

关键字: 云计算 人工智能 CPU
关闭
关闭