用稀疏化提升云AI芯片算力,「墨芯」获1亿元Pre-A轮投资

胡逸菲 36氪 2021-03-26 17:45:25

墨芯人工智能科技有限公司(以下简称墨芯)近日获得1亿元Pre-A轮投资,由将门创投领投,真格基金、深圳前海母基金共同投资,老股东凯旋创投、创享投资本轮继续加持,星汉资本担任本轮FA。

墨芯是AI芯片设计初创,公司提供终端和云端AI芯片加速方案,致力于提升AI芯片的算力。这是公司在一年内宣布完成的第三轮融资。2020年3月,墨芯曾完成凯旋创投领投的近千万美元的天使轮投资。2021年1月,墨芯再次宣布完成由浪潮领投的战略融资。

在云计算与人工智能时代,AI离不开大型、多层的深度神经网络模型,而训练和运行这些巨大的模型需要数以万亿的计算量。因此,为了让AI解决更复杂的问题,人工智能(深度学习)模型对系统的性能提出了更高的要求,市场需要更高算力、更低功耗的AI芯片。

作为AI芯片的新兴玩家,墨芯从近年来热门的AI算法稀疏化切入,以实现AI芯片高算力、低功耗这两大需求。稀疏化算法的优势在于可以让神经网络模型消减冗余和重复的内容,减少运算压力,提升有效性能。

墨芯致力于动态稀疏化、静态稀疏化AI算法技术的研发,从软件算法入手,以稀疏化硬件架构为核心,通过软硬件协同设计提升AI推理的计算效率,减轻AI计算对内存带宽和存储的需求,在提升芯片性能的同时也降低了芯片成本。

墨芯的稀疏化硬件架构可以通过对已有模型的激活来提高吞吐量,或者在同等吞吐量下降低功耗;也可以训练更大的稀疏模型,在同等模型参数量以及计算量的情况下,提高可部署模型的精度,从而实现更高算力、更低功耗的效果。

在整个产业界,2020年5月英伟达(Nvidia)发布了首款支持稀疏化技术的芯片A100,此款产品仅支持2倍的静态结构化稀疏。

墨芯将在2021年中旬推出新产品Antom。据墨芯公司创始人和CEO王维向36氪的介绍,Antom产品将芯片算力相较于现有行业水平,提高至少1个数量级。

王维表示,Antom在体积、算力、能耗三方面都有优势:Antom产品体积小,能适用多种类型服务器,将节省所占物理空间;产品在算力上拥有较大提升,能将单位算力拥有总成本(TCO)降低10倍以上;产品同等运算量的耗电量降至十分之一,将大大降低能耗成本。

凯旋创投创始合伙人周志雄认为,在服务器端广泛的AI推理场景中,想要在性能追上并赶超Nvidia,真正有可能突破的是在算法层面。墨芯团队的动态稀疏化技术展示了在AI计算上如何有效地提升单位功耗算力使其超过竞品1到2个数量级。“这是一个超出了国产替代‘me too’ 场景,实现 ‘me better’ 直线超车的真实案例。”

Antom产品的目标客户包括公有云/私有云、互联网视频网站、电商网站等云服务商及企业用户。公司将从头部客户入手,在业界逐步扩大产品影响力。

在现有计算平台面临极大的挑战的背景下,目前AI芯片业界主要的解决方法除了稀疏化技术还包括:设计芯片间互联做分布式推理和训练、采用大带宽的存储器件(HBM/GDDR)、采用大量的片上存储(On-chip SRAM) 等。这些方式都将带来芯片设计复杂度和硬件成本的提升。比较来看,采用稀疏化架构的芯片能在提升性能的同时减轻存储需求,降低芯片成本,是一举多得的选择。

根据IDC 2020HI《全球人工智能市场半年度追踪报告》的最新数据,目前全球半年度人工智能服务器市场规模达55.9亿美元(约326.6亿人民币),并处在高速发展阶段,预计在2024年全球市场规模将达到251亿美元。

在这一市场背景下,突破原有技术瓶颈,重点打造稀疏化的技术优势至关重要。

IDC报告同时显示,墨芯此前的战略投资方浪潮以16.4%的市占率位居全球第一,成为全球AI服务器头号玩家。该战略融资也可看作是浪潮对AI单芯片供应商的一次布局。

墨芯公司总部位于中国深圳。创始团队包括来自于人工智能领域的科学家和芯片行业的资深芯片架构师和设计工程师。


长按二维码关注我们