搜索   Search
你的位置:主页 > 公司产品 > 移动存储 >

存储新时代:操纵RISC-V和内存布局实现式计较

2018-08-07 11:44      点击:

  正在过去的几年里,我们目睹了数据的一系列庞大变化,包罗数据若何被生成、处置以及进一步操纵以获取额外的价值和智能,而这些变化都遭到以深度进修和神经收集使用为根本的新兴计较模式所影响。这种深刻的变化始于数据核心,其操纵深度进修手艺来供给对海量数据的洞察,次要用于分类或识别图像、支撑天然言语处置或语音处置,或者理解、生成或成习若何玩复杂的策略逛戏。这种变化催生了一批特地针对这些类此外问题而设想的高功能计较设备(基于GP-GPU和FPGA),后来还发生了可完全定制的ASIC,进一步加快并提高了基于深度进修的系统的计较能力。

  大数据使用采用特地的GP-GPU、FPGA和ASIC处置器透过深度进修手艺来阐发大型数据集,并趋向、模式和联系关系性,从而实现图像识别、语音识别等功能。因而,大数据是基于过去的消息或常驻正在云端的静止数据。大数据阐发的一个常用的功能是施行特定使命“锻炼过的”神经收集,例如识别和标识表记标帜图像或视频序列中的所有面部,语音识别也展现了神经收集的强大功能。

  这种使命最好由特地的引擎(或推理引擎)来施行,这种引擎间接驻留正在边缘设备上并由快速数据使用法式(图1)来指导。通过正在边缘设备上处置当地所捕捉的数据,快速数据可以或许操纵来自卑数据的算法供给及时决策和成果。大数据供给了从“过去发生了什么”到“未来可能会发生什么”所演绎出的洞察(预测阐发),而快速数据则供给了可以或许改善营业决策、运营并削减低效景象的及时步履,所以这必然会影响最终成果。这些方式能够合用于各类边缘和存储设备,例如机、智妙手机和固态硬盘。

  新的工做负载基于两种场景:(1)针对特定工做负载(例如图像或语音识别)锻炼大型神经收集;以及(2)正在边缘设备上使用颠末锻炼的(或“适合的”)神经收集。两种工做负载都需要大规模并行的数据处置,此中包罗大矩阵的乘法和卷积。这些计较功能的最佳实施体例需要正在大矢量或数据阵列上运转的矢量指令。RISC-V就是一种很是适合于此类型使用的架构和生态系统,由于它供给了一套由开源软件支撑的尺度化过程,使得开辟人员可以或许完全地采用、点窜以至添加专有矢量指令。图1中概述了一些显而易见的RISC-V计较架构机遇。

  快速数据和边缘计较的呈现发生了一个现实的后果,即:取云端之间来回挪动所无数据进行计较阐发并不是一件无效率的事。起首,正在挪动收集和以太网中进行远距离传输时,它涉及到相对较大的数据延迟传输,这对于必需及时操做的图像识别或语音识别使用而言并不是抱负的。其次,正在边缘设备长进行计较需要更易于伸缩的架构,此中,图像和语音处置或者正在SSD长进行的内存计较操做都可用一种伸缩的体例来进行。采用这种体例,每一台新增的边缘设备城市带来所需要的增量计较能力,对数据挪动体例和时间进行优化是这种架构可伸缩性的一项环节要素。

  正在图1a中,云数据核心办事器操纵正在大型大数据集上锻炼的深度进修神经收集来施行机械进修的功能。正在图1b中,边缘设备中的平安摄像机采用颠末大数据锻炼的推理引擎来及时识别图像(快速数据)。正在图1c中,智能固态硬盘设备采用推理引擎进行数据识别和分类,从而无效地操纵了此设备的带宽。图1展现了RISC-V内核的潜正在机遇,它能够地添加专有的及将来尺度化的矢量指令,这些指令对于处置深度进修和推理手艺相当无效。

  另一个雷同且主要的趋向是大数据端和云端上数据的挪动及拜候体例(图2)。保守的计较机系统布局(图2a)采用慢速外围总线,该总线毗连到很多其他设备(例如,公用机械进修加快器、图形卡、高速固态硬盘、智能收集节制器,等等)。低速总线会影响设备的操纵率,由于它了总线本身、从CPU以及次要的潜正在持久内存之间的通信能力。这些新型计较设备也不成能正在它们之间或取从CPU共享内存,从而导致正在慢速总线长进行徒劳且受的数据挪动。

  关于若何改善分歧计较设备(例如CPU和计较机及收集加快器)之间的数据挪动,以及若何正在内存或快速存储中拜候数据,呈现了几个主要的行业趋向。这些新趋向集中正在尺度化工做上,可以或许供给更快、更低延迟的串行布局以及更智能的逻辑和谈,从而实现对共享内存的分歧拜候。

  将来的架构将需要摆设接口,以毗连到持久性内存以及接入计较加快器并支撑高速缓存分歧性的快速总线(例如TileLink、RapidIO®、OpenCAPI和Gen-Z),以期大幅度提高机能,并且使所有设备共享内存并削减不需要的数据挪动。

  正在图2a中,保守的计较系统布局因为把一条慢速外设总线用于快速存储器及计较加快设备,其能力已达到其极限。正在图2b中,将来的计较系统布局采用了接口,可以或许为平台上所有的计较资本供给同一并支撑高速缓存分歧性的拜候体例来拜候共享持久内存,(这称为以数据为核心的系统布局)。正在图2c中,所摆设的设备可以或许利用不异的共享内存,从而削减了不需要的数据复制。

  CPU 外围焦点及收集接口节制器的感化将成为支撑数据挪动的环节要素。CPU外围焦点组件必需支撑密钥内存和永世内存接口(例如NVDIMM-P),也必需支撑驻留正在CPU附近的内存。还需要实施面向计较加快器、智能收集和近程持久内存的智能快速总线。这种总线上的任何设备(例如CPU、通用或公用计较加快器、收集适配器、存储器或内存)都能够包含其本人的计较资本并具有拜候共享内存的能力(图2b和图2c)。

  RISC-V手艺恰是优化数据挪动的环节鞭策要素,由于它可以或许正在所有的计较加快器设备上针对新的机械进修工做负载来施行矢量指令。它实现了多种开源CPU手艺,可以或许支撑内存和智能总线接口;且实现了以数据为核心具有分歧性共享内存的系统布局。

  大数据和快速数据为将来的数据挪动带来了挑和,也为RISC-V指令集架构(ISA)铺平了道。这种架构的、模块化的方式很是适合用做以数据为核心的计较系统布局的根本。它供给了以下功能:

   支撑新型以数据为核心的系统布局,此中所有的处置单位都能够透过度歧的体例拜候共享的持久内存,从而优化数据挪动

   RISC-V由跨越100个组织机构的浩繁配合开辟,这此中包含一个由软件和硬件立异者构成的协做性社区。这些立异者可以或许对ISA进行改编,使其顺应特定的目标或项目。任何插手该组织的人都能够按照一份“Berkeley Software Distribution”(BSD软件发布)许可证来设想、制制和/或发卖RISC-V芯片和软件。

  为了实现其价值和可能性,数据需要捕捉、保留、拜候并转换,以阐扬其全数潜力。含有大数据和快速数据使用的曾经使通用计较系统布局的处置能力相形见绌。将来以数据为核心的极端使用将需要针对特定用处设想的处置能力,以便以的体例支撑数据资本的扩展。

  具有一套以正在持久内存中存储的数据为核心的通用计较机系统布局,同时又可以或许让所有的设备阐扬必然的计较感化,这是由新类型机械进修计较工做负载所鞭策的这些新型可扩展系统布局得以呈现的环节要素。逾越云端及边缘设备各个部门的下一代使用都需要这种新型的低能耗处置体例,由于特地的计较加快处置器将可以或许专注于处置其手边的使命,从而可以或许削减来回挪动数据所华侈的时间,或者可以或许施行取数据无关的额外计较。通过阐扬数据的力量、潜力和可能性,人类、社会以及我们的星球都可以或许兴旺成长。