开源Logistic回归FPGA内核可加速机器学习
当必须对大量数据进行训练时,机器学习算法的计算量非常大且非常耗时。典型的处理器并未针对机器学习应用进行优化,因此性能有限。因此,学术界和工业界都致力于开发专用架构,以有效地加速机器学习应用程序。
FPGA是可编程芯片,可以使用针对特定应用而优化的量身定制架构进行配置。由于FPGA针对特定任务进行了优化,因此与通用CPU或GPU相比,它们具有更高的性能和更低的能耗。FPGA广泛用于图像处理,电信,网络,汽车和机器学习应用等应用。
最近,诸如Amazon,阿里巴巴,华为和Nimbix等主要的云和HPC供应商已开始在其数据中心中部署FPGA。但是,目前在机器学习领域中广泛使用FPGA的情况有限。
为此,InAccel今天发布了FPGA IP内核作为开放源代码,用于训练逻辑回归算法。与单线程执行相比,加速的FPGA IP内核提速高达70倍,与8内核通用CPU执行相比,提速的FPGA IP内核提速高达12倍。
用于逻辑回归的IP内核利用了Xilinx FPGA的处理能力。IP内核针对Xilinx FPGA(如Alveo U200和U250卡)进行了优化,并且这些FPGA作为实例在云提供商(AWS上的f1和阿里云上的f3)上可用。
Logistic回归IP内核的发布将有助于展示FPGA在机器学习领域的优势,并将为数据科学界提供实验,部署和利用FPGA的机会,以加速其机器学习应用程序。
逻辑回归IP核心可用作附加库,从而使逻辑回归训练的功能过载。InAccel提供了与Python,Java和Scala无缝集成的所有必需API。这意味着数据科学家和数据工程师根本不需要更改其代码。
1