技术成果简介
分布式计算是现代机器学习和数据分析的核心,在这些数据中,有数百万个维度非常高的数据点正在被处理。掉队节点的问题天然的存在于一个分布式系统之中,掉队节点指的是那些因为它们的计算能力或者通信链路较差,而导致它们返回计算结果极大的慢于平均水平的工作节点。在“编码计算”领域的许多研究都着眼于将冗余整合到分布式计算中,基于编码启发的策略来应对这些挑战。分布式系统的核心思想是通过编码来获得(n,k)组合特性(Combination Property,CP),即将k个原始独立的任务编码成n个(n≥k),在这n个任务结果中,任意k个就可以恢复原始k个计算结果。尽管取得了巨大的成功,但限制基于多项式的方法应用于实践的一个主要挑战是它们的数值稳定性问题。解码过程不可避免地涉及了多项式的插值,插值不稳定的主要原因是插值有效地求解了变换以范德蒙(Vandermonde)矩阵为特征的线性系统。众所周知,具有实值节点的Vandermonde矩阵的条件数在矩阵大小上呈指数增长,大的条件数意味着由于数值精度问题而引起的范德蒙矩阵的微小扰动可以导致奇异矩阵,从而影响解码结果不可信甚至解码失败。为了解决上述技术问题,本发明提供了一种编码分布式计算系统,将类牛顿多项式码应用于编码分布式计算系统中,在计算机集群中,其中一个计算机充当主节点,其他计算机充当工作节点,在所述计算机集群中分布式地计算矩阵AB相乘,主节点把矩阵A和矩阵B分成K块,然后执行编码策略,分别对矩阵A和矩阵B编码,当主节点接收到计算速度最快的K个工作节点的计算结果后就能解码AB。本发明的有益效果是:本发明具有较低的条件数,有效改善矩阵相乘中范德蒙矩阵解码数值不稳定问题,提高解码的准确度,并且具有容错、改善落后节点功能。
技术成果前景
本发明具有较低的条件数,有效改善矩阵相乘中范德蒙矩阵解码数值不稳定问题,提高解码的准确度,并且具有容错、改善落后节点功能。