你好!欢迎来到深圳市品慧电子有限公司!
语言
当前位置:首页 >> 技术中心 >> 传感技术 >> 千芯科技致力于大算力存算一体芯片技术的研究

千芯科技致力于大算力存算一体芯片技术的研究


在过去的几年里,越来越多的企业加入了存算集成技术的研究,现在,存算集成芯片已经逐渐走向商业化。

如何选择内存类型。

千芯科技在SRAM、MRAM、RRAM等方面进行了探索,目前正在测试基于SRAM存算的产品样卡。

该公司的技术团队在早期就接触过各种内存。作为国家特殊项目的技术总监,陈伟波主持了当时国内最先进的NORFlash芯片和MemoryCompiler(内存编译器)的设计和开发。作为负责人,他创建了中国第一个3DNAND闪存设计团队,SRAM、RRAM、MRAM等。已经接触了10多年,这些内存有很多专利。

因为虽然都是存算一体化,但是从应用的角度来看,有些存算一体化需要更倾向于存算(ComputingMemory),有些更倾向于计算(MemoryComputing),比如一些端侧的语音识别和人像识别场景,对功耗和成本要求都比较高。

比如在云计算领域,这个领域需要计算的模型非常大。同时,数据需要在训练场景中不断更新。因此,在这样的应用场景中,一些非容易丢失的内存的读写速度不如SRAM、DRAM和RRAM。这些场景更倾向于计算,目前倾向于计算能力的内存。

也就是说,如果倾向于低成本,希望待机功耗更好,可以选择非易失存储器,包括Flash、RRAM、MRAM等。;如果倾向于大规模计算,RRAM、SRAM和DRAM在大多数情况下都可以选择。此外,具体来说,选择哪种存储器也与每家公司的专利布局绑定有关。

大算力存算一体化芯片BAW56T设计。

在自动驾驶、数据中心等领域,对大计算能力的需求相对明显,因此企业也将能源投入到大计算能力综合芯片的研发和推广和推广上。在陈伟看来,除了nor闪存的一些容量限制外,上述各种存储器基本上都可以用来整合大计算能力存款。

在闪存存算方面,目前的主要路线是基于norflash(不是目前优盘中使用的闪存类型),大多数情况下存储容量较小,这使得norflash单片计算能力达到1tops以上的设备成本较高。一般业内人士都说大计算能力一般在20-100tops以上,所以直接做大计算能力的存算是不好的。而其他存储器,包括SRAM、RRAM等。,现在已经看到,有实际的产品证明可以用来实现大计算能力的存算一体化。

在设计上,大计算力存算的一体化结构将不同于小计算力。据陈伟介绍,这与存算一体化结构中的计算结构有关。大计算力计算结构不同于小计算力计算结构。首先,大计算力的计算核心将有一个特殊的外围电路设计,使其吞吐能力强于小计算力;第二,在整体结构中,大计算力具有更多的核心并联,相当于将多个小计算力集成成一个大计算力,这有点类似于GPU的集成方法,因为GPU也相当于不同小计算力的核心和集成架构。

虽然可以可以做大计算力,但是基于非易失存储器,如果做大计算力存算,也会遇到一些工艺挑战。基本上,如果循环读写次数在10的6到8次之后,可能会出错。所以到目前为止,世界上直接用NVM做200tops以上的计算能力还是比较少的。

因为在高计算力的情况下,它有非常高的读写频率,这将面临早期故障的可能性,这种故障可能导致计算错误。对于产品,必须进行优化,特别是在自动驾驶领域,如果这种故障会导致车辆失控。

如何解决这个问题?陈伟表示,经过与行业专家的合作分析,他们认为需要从两个方面来做。一是需要优化设备的工艺水平,二是做冗余设备设计来解决这个问题。目前,对于以计算为基础的场景,其性能可能不如先进技术下的SRAM强,经过冗余设计后,其面积将进一步增加,从而在一定程度上降低成本优势。

所以综上所述,选择什么样的存储器来做大计算力的存算,还是要看场景,看客户的需求,而且还要看设备本身的工艺水平。

模拟与数字存算一体化技术的区别。

可以看出,模拟或数字技术的使用也是企业经常提到的一点。陈伟介绍,通常建议将模拟存算与传感器紧密连接。如果计算结构复杂,建议使用数字,因为使用模拟结构进行复杂计算的成本相对较高,当与传感器结合时,模拟计算具有其自然优势。

因此,事实上,它更多地取决于场景,例如对小计算能力的需求,即声音识别或小规模图像识别。此时,使用模拟更为合适。如果我们想做云计算的大计算能力,计算结构是复杂的。目前,我们使用更多的数字方法。存储和计算的阵列,如存储矩阵系数或重量,然后输入数据,即输入不同的电压。根据欧姆定律,将产生不同的电流,每个电流汇合在一起,即相当于电流加和(基尔霍夫定理),完成乘积加运算,这是模拟电路完成深度学习和其他计算的基本思想。

简单地说,数字的方式是将不同的模拟单元分开。原始模拟电路相当于将模拟值存储在一个单元中,可能是几个位置,例如8位或4位置宽。如果它变成一个数字,它相当于将一个值存储在一个单元中,这是一个位置宽度。很明显,模拟的优点是存储密度较高,但无法直接进行复杂计算。数字电路的离散性将更好、更灵活,可以直接进行复杂操作。

存算一体化技术的挑战与未来。

目前,存款一体化的发展仍存在一些挑战,陈伟谈到了两点:一是生态建设,虽然存款一体化的概念不是特别新,但实际进入实际阶段时间相对较短,特别是一般编译生态环境尚未完全成熟,因此会有一些适应要求,因为客户对生态有要求,所以迫切需要建立一个生态。

第二,如何更好地满足客户的需求也是整个人工智能芯片着陆需要解决的问题。企业需要从客户需求的角度设计更多的产品。对于客户来说,可能有很多计算场景。事实上,它不仅需要人工智能技术,还需要其他一些复合计算类型,如语音识别场景,除了人工智能计算需求外,还需要语音降噪算法。此时,需要根据客户的需要优化特定的场景。

技术的未来是什么?从两个阶段来看,陈伟认为,目前基本处于市场发展时期,许多客户没有充分意识到存款的优势和价值,但如果市场能出现一个非常有影响力的制造商,证明存款集成芯片,比传统的人工智能芯片能力,那么很快就会有重大突破,预计这样的突破将在不久的将来发生。

从长远来看,存算一体化与GPU、CPU技术相结合,成为CPU、GPU、DPU或其他AI芯片的计算核心,相当于现有的存算一体化技术赋能GPU或CPU,成为现有技术的计算核心。

从商业角度来看,目前中国至少有两个大规模生产的内存集成芯片。据估计,今年将有许多芯片可以用于商业用途。目前,已登陆的商业用途主要集中在端部可穿戴设备等领域,一些语音识别和小型视觉模型场景。

在自动驾驶和云计算领域,云计算领域的商业化预计将更快。据估计,从明年起,一些产品可以逐步进入中国的大型互联网制造商,自动驾驶领域的商业化时间将相对较长,因为自动驾驶通常需要五年的时间从架构设计到最终批量装载。如果前两年的设计已经完成,流约需要三年的适应性和大规模生产测试时间才能实现大规模应用。


用户评论

发评论送积分,参与就有奖励!

发表评论

评论内容:发表评论不能请不要超过250字;发表评论请自觉遵守互联网相关政策法规。

深圳市品慧电子有限公司