“FPGA+云"助力高性能计算

摘要:
FPGA+云VSFPGA+端,C端市场VS数据中心自成立以来一直位于异构计算领域。它也是国内第一批专注于云异构加速和高性能计算的初创企业。该公司首席执行官王文华表示,他看好FPGA在异构领域的发展,主要原因如下。菲律宾数字技术的核心创始团队都是来自FPGA领域大型企业的高级人员。

“FPGA+云"助力高性能计算第1张


用AI防鲨鱼、用AI学写中国书法、用AI预测人类死亡时间、用AI审判罪犯……在人工智能方兴未艾的今天,越来越廉价和普及的AI领域真的是什么都不值钱,除了想象力。那在这无所不能的AI盛世,一定没道理让算力限制我们的想象力,更没道理让算力限制了我们的生产力。

从CPU到CPU+,从+GPU到+FPGA

随着通用处理器(CPU)的摩尔定律已入暮年,从美国的微软、亚马逊到中国的BAT、华为,几乎所有的互联网巨头们都在补充他们的标准服务器芯片——CPU,使用可替代的硅来追赶在人工智能领域的急速变化。2012年,微软开始将支撑了通讯行业二十年高速发展的可编程芯片,即FPGA用在其搜索业务——Bings上,且公布FPGA相比于CPU在处理Bing 的自定义算法时快出40倍,整个系统比Bing 现有的系统快出两倍,因此其可以将当前已经投入使用的服务器数量减少一半。甚至在接下来的几年里,几乎任何一个新的微软服务都会包含一个FPGA。

那么这个所谓的可编程芯片到底是什么?据菲数科技创始人兼CEO王文华介绍,2017年是全球超大规模数据中心的“爆发年”,全年新增超大规模数据中心90余个,总数量超过390个。且2018年也没有丝毫放缓的迹象。如此海量数据需要计算机高速计算各种矩阵运算、图像处理、机器学习、压缩、非对称加密、搜索排序等。即数据中心优先于人工智能发展,这一点也得到了目前在FPGA领域一枝独秀的赛灵思的支持。今年3月,其新上任的CEO Victor Peng在采访中表示,赛灵思已经把数据中心优先放在其三大战略重点的首位。

而传统计算机中无论是CPU,还是作为协处理器的GPU ,都属于冯•诺依曼结构,即指令译码执行、共享内存。但由于指令流的控制逻辑复杂,不可能有太多条独立的指令流。为每一个新问题开发专用的芯片又成本过高,因此,这对硬件算力的性能存在着极大的挑战。

在以通用处理器计算和特定目的的协处理器计算混合异构工作中,作为有着更加高效的数据处理能力和基础架构的FPGA,则延续了以“CPU+GPU”的第一代异构计算,形成了“CPU+FPGA”的第二代异构计算。其逻辑是在每一个服务器与基础网络连接的地方部署可编程芯片,在数据到达服务器之前提前一步处理它们。

“FPGA+云"助力高性能计算第2张

FPGA+云VS FPGA+端,C端市场VS数据中心

自成立起便定位于异构计算领域的菲数科技,也是国内最早一批专注于云端异构加速、高性能计算的创业公司,其CEO王文华表示,看好FPGA在异构领域的发展主要是基于以下几个原因。

首先,FPGA 之所以比 CPU 甚至 GPU 能效高,本质上是无指令、无需共享内存的体系结构带来的福利。其每个逻辑单元的功能在重编程时就已经确定,不需要指令;其次,对比GPU几乎只有的数据并行,FPGA则同时拥有流水线并行和数据并行,可以根据处理数据包的步骤搭建出不同流水线,在GPU的计算单元都按照统一步调做相同事情时,FPGA早就已经分散的处理完了;而即使是吞吐量、延迟和功耗三方面都可一战的ASIC专用芯片,FPGA也因其可以快速更新逻辑、可编程的万能部署、保持不同服务器不同加速卡的同构性等优势,解决了前者研发成本高、周期长等问题,在瞬息万变的人工智能领域减少了投资风险。

比起目前业内为数不多叫得上名字的创企,如深鉴、地平线等将FPGA的业务应用在端,即偏向C端的市场化,菲数科技的业务重心则在是FPGA+云,专注于数据中心的异构加速解决方案,产品形态包括硬件加速板卡和FPGA加速IP。除了以单个产品切入数据中心的大型B端企业外,菲数已经形成了从硬件板卡,FPGA IP方案到用户API的完整产品方案。

对此,王文华解释到,C端市场与数据中心是完全不同的市场,虽然都采用FPGA进行加速,数据中心更多的是关注性能,而C端更多的是关注功耗和成本。因此,FPGA在广阔的C端市场面临着众多ASIC解决方案的激烈竞争,而在数据中心则具有独特的优势。

首先,FPGA丰富的互联接口既适应于数据中心多样性的业务,也适应于新硬件的引入,如ssd硬盘或是HBM内存等等,具有良好的拓展性;同时它的可重构性,也使得它可以在相同的硬件上实现不同的加速功能。这让其很好的避免了因业务方向发生变化而被淘汰的情况,减少硬件投资试错成本;其次,FPGA不需要指令,稳定而又极低的延迟,也适用于流式的计算密集型任务和通信密集型任务;再次,CPU+FPGA的异构模式,既可以保持数据中心的硬件同构性,同时又具有实现软件定义的能力。

当然,随着人工智能在端上的下沉应用,对端的计算性能要求也会逐渐向云端的性能靠齐,因而FPGA在复杂的端设备的应用上(譬如辅助驾驶、机器人、智能摄像头等等)也会逐步推广。

“FPGA+云"助力高性能计算第3张

芯片国产化进程步履维艰?新兴创企征战蓝海市场

事实上,在与通讯基础网络的连接上,由于FPGA天然的通讯基因,更是明显优于其它竞争对手。这种架构上的优势使其定位并不是某种硬件的替代品,甚至将带来整个行业的革命。

而此前Grand View Research的分析,2015年全球FPGA总市场规模达 63.6 亿美元,预计到2024年将达到142亿美元。目前全球玩家都屈指可数的赛道无疑是个新蓝海。且由于技术驱动发展,根据此前巨头的布局时间和周期,以及菲数即将推出的新产品,目前处于培育期的FPGA异构加速市场极有可能在2019年年初迎来爆发性增长。

除了对市场方向的坚定,还有自身的专业。菲数科技的核心创始团队全部来自FPGA领域巨头企业资深人员。创始人兼董事长徐卫根,浙江大学MBA,原UTStarcom研发副总裁,20年+管理及运营经验;创始人兼CEO王文华,浙江大学硕士,15年+研发管理经验;技术团队接近二十人,分别来自美国中国名校、多有UT、华为、诺西等公司多年相关研发经验。

作为国内最早一批专注于云端异构加速,高性能计算的创业公司之一,菲数科技在成立之初即与IBM展开合作,2016年成为OpenPOWER成员;2017年10月成为阿里云异构计算生态共建的合作伙伴之一;其加速板卡的规格,功能以及完善的技术支持已经获得市场的认可,成为目前的主流产品。

未来在推出人工智能加速平台1.0后,将会进一步的实现FPGA异构加速的虚拟化和云化,进一步深耕数据中心异构加速蓝海市场。

中国本土综合实力最强大的大型IT企业之一,同时也是菲数科技的合作伙伴的浪潮集团,其高效能服务器和存储技术国家重点实验室陈继承博士表示,此前GPU赶上了计算数据结构大量调整的好时代,而用硬件适配软件、且每种软件都是最优适配方式的FPGA也显然是下一个爆发点。在目前还未系统建立生态、相对空白的市场中,如何将成千上万FPGA资源池化实现统一部署、动态重构和如何将单个FPGA虚拟化,实现细粒度资源优化利用进而实现FPGA异构计算的真正落地,是创业公司的重大机遇和挑战。

另外,浪潮科技作为该领域老牌巨头,陈继承也见证了FPGA在云计算领域的发展,关于对菲数团队的看好,其解释到,在芯片国产化进程的今天,创业公司不仅限制较少、也更为热情,且对比美国科技产业化,方向对、热情够的新兴创企,成果能更快的被市场认可。

2017年3月,菲数科技曾获得由中科创星领投的千万级天使轮融资,目前正在进行1500万—2500万的A轮融资,主要用于人员扩充、产品量产、技术研发、业务开拓等。值得一提的是,此前菲数科技已申请4项中国发明专利,一项美国发明专利。尽管赛道因为市场红利期未到使这个高壁垒的行业玩家多专注在技术上,但从各家创企在知识产权的结果来看似乎并没有太垂直的成就。这也让菲数科技深耕在技术领域的专利更具价值。

万物互联的时代,数据中心的云化是未来的趋势。独立的、单机模式的异构加速必然要被以FPGA为主体的池化模式所替代。随着FPGA在数据中心方向的逐步发力,以及相关生态的逐步改善,FPGA成为数据中心的主流硬件平台,则是一个正在逐步变成现实的趋势。

“FPGA+云"助力高性能计算第4张

文章来源:中国信息产业网

卿萃科技整理摘录


版权所有权归卿萃科技 杭州FPGA事业部,转载请注明出处

作者:杭州卿萃科技ALIFPGA

原文地址:杭州卿萃科技FPGA极客空间 微信公众号


“FPGA+云"助力高性能计算第5张

扫描二维码关注杭州卿萃科技FPGA极客空间


免责声明:文章转载自《“FPGA+云"助力高性能计算》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇centos 系统下安装FastDFS+nginx+fastdfs-nginx-module安装配置小程序表单回显下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

android黑科技系列——手机端破解神器MT的内购VIP功能破解教程

一、前言 在破解app的时候,我们现在几乎都是在PC端进行操作,但是之前bin神的MT管理器,可以在手机端直接破解,不过也有很大的局限性,但是对于一些简单的app破解没问题的。这个工具其实原理也很简单,就是解析apk中的dex,arsc等文件,然后支持修改其中的类方法信息和资源信息,然后在二次打包签名即可。其实把这部分功能移到了移动端做了,不过值得佩服的是...

科大讯飞语音识别

科大讯飞语音识别 随着当今社会的高速发展,我们所使用的产品也向着遍历和智能的方面发展着,当然了手机端的App也不例外。现在的App都在缩减用户操作的流程,优化用户的体验,为了更加便利用户。提高用户的DAU(日活),增加用户的粘性一般我们都会想出比较新颖的招式。 如果现在有这样一个需求:用户需求:用户需要绑定银行卡输入银行卡号,手动输入增加用户的操作度,所以...

cpu 之二 酷睿i3/i5/i7处理器到底简单区别

自从Intel推出酷睿系列处理器以来,i3、i5、i7处理器成为家喻户晓的品牌,这是商品很流行的一种根据级别定位命名的方式,即数字越大,代表相应产品价格越贵、性能越好。 一:普通的认识 Intel Core i7系列定位为发烧级、高性能用户专属,他们拥有4核心+8线程(Extreme系列则拥有6核心+12线程)、高主频、超大容量三级缓存等特性,性能是最强的...

【华为云技术分享】Linux内核发展史 (1)

openEuler是基于Linux 内核的企业级Linux 服务器操作系统平台的开源社区发行版。openEuler支持鲲鹏架构,可运行在TaiShan服务器上。本技术连载将会从理论基础、源码分析和实操方法三个方面来比较全面地介绍内核编程与应用编程的基础知识,到2020年8月之前主要介绍内核编程部分。通过本连载的介绍,您将对openEuler内核编程和应用编...

关于云计算基础架构IaaS层的几点看法

真实的云计算什么样? 云计算对普通用户来说,总是一个云里雾里的话题。 本文从最基础的概念開始科普,说明了四个常见的错误理解,和作者的四个猜想。 IaaS(Infrastructure as a Service),指基础设施即服务,消费者通过Internet可 以从完好的计算机基础设施获得服务。基于Internet的服务(如存储和数据库)是IaaS的...

如何优化 Java 性能?

对于 Java 性能比较关心的同学大概都知道《Java Performance》这本书,一般而言,很多同学在日常写 Java Code 的时候很少去关心性能问题,但是在我们写 Code 的过程中必须考虑到性能对程序的影响。小到我们使用位运算来实现算术运算,大到我们对 Java 代码的总体架构设计,「性能」其实离我们很近。本篇文章主要提到几个点,希望能够对大...