HPE实验室视频|一种彻底的计算方法可以帮助治愈癌症,检测欺诈并阻止交通拥堵

HPE实验室视频|一种彻底的计算方法可以帮助治愈癌症,检测欺诈并阻止交通拥堵

德里克·斯莱特(Derek Slater)
2017年10月16日,星期一 - 上午8:45

Precision Medicine是一种治疗诸如癌症之类的复杂疾病的新兴方法,它使医生可以根据患者的遗传学,体型和环境来定制护理,而不仅仅是他的症状。

技术趋势的融合使它成为可能:医生,医院和研究人员每年都会捕获更多的健康数据;计算机变得更加强大,使他们能够跟上不断增长的数据量。分析技术的进步使医疗专业人员筛选所有数据以识别模式。

问题是内存。计算机,甚至是最复杂的计算机,都没有足够的计算机来有效地执行这些计算。

HPE研究员兼首席建筑师柯克·布雷斯尼克(Kirk Bresniker)说:“记忆速度,成本和能力的实际权衡一直是传统建筑的限制。”“每隔一年,我们将以前创建的数据量增加一倍。但是,您如何将其转变为行动?我们面临着这个巨大的机会,但无法利用我们现有的技术到达那里。”

布雷斯尼克(Bresniker)和他在惠普(Hewlett Packard)实验室的同事认为,计算需要从根本上进行新的建筑。因此,他们正在开发一台所谓的内存驱动计算机,该计算机将几乎无限的内存池放在系统的核心中。

当今的计算机都使用了60多年前开创的基本体系结构。处理器使用内存中的数据计算。该内存很快就可以访问,并且非常靠近处理器。但是,它的尺寸也有限。因此,当处理器准备好获取更多数据时,它将从较大的较慢的存储系统中获取,并将新数据交换为内存以继续计算。

随着处理能力的增加,计算机可以立即执行的计算数量成倍增长。但是记忆已经成为瓶颈。当今的首选记忆技术DRAM很昂贵,并且难以扩展到一百吨及以后的水平,这对于Precision Medicine等新用途是必需的。

结果是,当他们解决大型,复杂的问题时,计算机只能一次查看该问题的一部分。他们独立地对这些细分进行计算,然后组装一个完整的答案。并行处理可以通过分解问题同时跨多个处理器进行帮助。但是处理器必须协调其对内存的访问,从而创建开销,从而减慢工作量。

在大多数日常使用中,性能滞后并不明显,并且弥补了加工速度的弥补。尽管如此,执行诸如精密医学,检测财务欺诈或响应主要运输系统中断等数据密集型任务就像试图通过一次查看拼图拼图中的拼图拼图所示。到不切实际的程度很慢。

除挑战外,摩尔定律所描述的处理能力的稳定,可靠的增长即将结束。晶体管的变化不能比已经使用当前材料小得多。

布雷斯尼克说:“我们都对数据的潜力改变了我们的生活,但是正如我们准备好利用它一样,使我们到目前为止的技术正在消失。”

当今雄心勃勃的数据问题需要完全不同的计算体系结构。

佐治亚理工学院计算科学与工程学院主席戴维·巴德(David Bader)说:“限制我的数量是我一次记忆中的数据数量。”

Bader研究在计算生物学和基因组学等领域的大规模分析问题。他说,大型内存系统将“帮助我做出最佳决策,即使在新数据不断向我流式传输的情况下也是如此。”

新体系结构的一个关键特征是每个内存块之间的直接光子互连。相比之下,常规记忆块通过以电子形式传输数据的铜线网格连接。从某些块中获取数据比其他块需要更长的时间。

新实验室方法将基于从每个内存块到其他每个块的直接光纤连接的速度更快的系统代替逐个块数据传输。数据以光子的形式(光明)比电子传播。

现在,处理器可以以相同的速度有效地访问内存中的数据,这使系统可以更快地执行计算。另一个好处:许多专业处理器都可以在单个计算任务上承担,所有这些处理器都可以访问相同的共享数据池。

实验室研究人员仍然有一些障碍可以克服。为了实用,内存驱动的系统也需要使用非易失性内存,即使计算机关闭电源,也需要保留信息。目前,与生产规模的DRAM相比,非易失性记忆更难制造。

尽管实验室研究人员继续开发基础技术,但他们正在使用基于当今设备的模拟器来证明记忆驱动的计算可以解决的问题。这是四个应用程序,显示了这种新方法的变革力量。

聪明的城市

城市是复杂的生态系统。像修复坑洼一样简单的事情可能会引起事件的链反应:有人安排工作人员并分配材料;维修可能会影响下水道线或私人公用事业;它可能需要暂时改变交通信号,要求其他城市部门的船员注意。

HPE的Machine Project软件和应用程序总监Sharad Singhal说:“我可以尝试安排工作以最大程度地减少干扰,但我只是在猜测一些效果。”

像这样的问题,许多相互联系的实体在各种关系中相互影响,被称为图形分析问题。在计算机科学术语中,每个实体都是一个节点,而它们之间的关系称为边缘。

图分析问题不仅限于智能城市。诸如Facebook之类的社交网络也说明了这个想法,网络上的每个人都代表节点。这些节点之间的边缘或连接高度多样且无法预测。

相比之下,常规计算机旨在处理存储在结构化行和列中的数据。Bader说:“今天的系统是为了计算问题而设计的,您通常会系统地在内存中浏览数据,一行一行。”

开发了当前改善性能的技术,例如“预取”来自磁盘的下一部分数据,将其写入处理器实际需要之前,将其写入内存,以使此顺序过程更快。

但是,它们不适合图形推理问题。例如,城市居民,企业和部门之间互连的随机性质意味着所需的“下一个数据”不太可能像数据库中的下一行或列一样接近内存。

Singhal说,处理图形数据的最佳方法是立即将整个图形放入内存中,并使所有物理块同样迅速访问。内存驱动的计算使得更加可行。

含义远远超出了更有效的建筑区域。例如,一个城市可以从了解公民的价值(例如生活方式,开放空间,经济适用房等)开始。然后,计划人员可以使用将许多变量和数据点保存在内存中的计算机来测试场景,并查看战术决策的更大效果。

“如果我问一个有关允许建造新的高层建造或将分区法从商业区更改为住宅区的问题,这将对城市产生什么影响?”辛哈尔问。他说,今天,人们根据受过教育的猜测或仅解释几个变量的模拟做出这些决定,一如既往地通过计算记忆和时间来限制。

内存驱动的计算将使分析师能够以指数方式考虑更多变量,从而对每个决策的含义提供更广泛,更准确,更广泛的看法。

语音识别

在某些受控情况下,像智能手机一样小的计算机在语音识别方面做得不错。苹果的Siri和Microsoft的Cortana之类的语音助手声称在识别单个单词方面取得了95%的准确性。

这对于提供驱动程序导航等任务非常有效,部分原因是所涉及的词汇相对较小。街道名称不经常变化,诸如讽刺之类的语言并发症通常不会发挥作用。

这个看似简单的案例掩盖了很大的复杂性,限制了语音识别的实际价值。大多数语音识别是通过所谓的监督学习来实现的,该学习将系统揭示了数百万个单词和短语及其含义,以便该系统可以构建语言工作方式的模型。希望该模型将使系统能够成功解释从未听说过的话语。

为创建模型的监督学习是一个计算密集型过程,可能需要六个星期。布雷斯尼克说:“要将音素组装成单词,评估语法,应对语言的歧义 - 这是一个巨大的培训挑战。”

结果,这些系统目前无法跟上新闻周期,语言时尚和其他快速发展的趋势。

为了处理语言并确定含义,计算机将单词转换为数学表达式并应用一系列数学操作,检查不同的模型以找到产生最可能含义的模型。

Labs的研究经理Natalia Vassilieva说,这些操作基础的主要计算任务是矩阵乘法。一个矩阵或数字序列乘以其他矩阵,以查看哪些乘数产生最准确的输出。

这些矩阵比大图中的关系更为可预测。通常可以预测转换所需的下一组数据,从而使计算机可以提前访问系统内存的相关区域。

更大的挑战在于使整个系统中的所有处理器忙碌,将话语分解为任务,分发工作并重新组装结果所需的通信间接费用。

实验室正在互连内存节点的超快速织物可以比现有技术快得多。布雷斯尼克说:“我们希望需要六个星期的训练时间到六个小时。”

结果将是语音识别技术,该技术可以快速学习新单词,处理涉及以前不熟悉的人或术语的破坏新闻事件,并解析互联网模因的快速变化的词汇。

运输系统

这发生在所有人身上:您的航班准时到达,但必须坐在停机坪上,因为另一架飞机没有离开大门。同时,在飞机窗外,您看到邻近的大门空着。为什么很难将到达的一个门转移到右边?

HPE软件副总裁Jaap Suermondt说:“这不是因为人们很愚蠢,而是因为我们受到计算模型的束缚,这些模型在您添加变量时会很快变得复杂。”当今的运输管理系统无法即时更改时间表。鉴于铁路,卡车运输和其他运输系统的相互联系性质,涉及太多变量。

这种系统中有许多限制。飞机可以携带多少名乘客?多少行李?需要多少燃料,加油车的容量和时间表是什么?车辆,地面和码头或大门上有哪些机组人员可用?

运输系统具有太多的变量,以至于常规计算系统无法一次评估它们。结果,一个系统处理预订。另一个管理行李处理。第三个系统处理门和机组分配。

如果单个内存池同时拥有所有相关数据,则可以完全不同的方式管理运输系统。有了大量的非易失性记忆,运输公司和政府机构将能够运行什么情况,以确定对常见破坏的最佳反应。

从理论上讲,由于非易失性记忆几乎是无限的,并且不需要持续的功耗,因此这些方案可以无限期地位于内存中。如果取消飞行或雷暴,该系统可以拔出适当的预计解决方案,从而管理重新布鲁特乘客,航班或货物所需的所有不同资源。

布雷斯尼克说,即使手头方案没有确切的匹配,预先计算的场景仍然可以“为泵加油,给出有关最佳解决方案的提示。然后,您可以在几秒钟内计算确切的答案,而不是等待45分钟以获取解决方案,而问题会在其他系统中造成级联故障。”

处理这样的不规则事件是物流公司向前迈出的关键一步,该公司通常会以较薄的利润运作。布雷斯尼克(Bresniker)表示,内存驱动的系统还可以帮助乘客获得更有效和愉快的体验。

他说:“不规则的操作只是从独立和经常过时的系统转变的第一步,并实时运作。”

卫生保健

在过去的十年中,健康数据已经数字化:MRI图像,基因组数据,临床试验,患者历史以及各种各样的电子健康记录现在存在于计算系统中。

但是我们尚未真正利用所有这些数据。Suermondt说:“尽管医疗保健是经济的20%,但我们一直在使用只能看几千名患者来决定普通人的方法。”当今的计算机无法有效地进行更大的分析。

记忆驱动的计算将使医疗保健提供者能够查看来自每个相关患者,诊所,医院,医生或疾病的数据,以确切地查看所做的事情,结果是什么,有效的以及没有什么作用。

共享存储池允许计算系统足够快地筛选此信息,以使医生为所有患者(甚至是患有复杂症状的患者)制定诊断和治疗计划,即在小时或几分钟内入院,而不是在困难病例中等待数周或几个月。

布雷斯尼克说:“当您谈论基因组或大量图像时,即使算法很简单,进行这些比较也非常费力和记忆力密集。”

上网

2016年11月,实验室宣布它在线带来了第一个功能齐全的硬件原型。这个主要里程碑机器研究项目表明,团队在光子通信,非易失性记忆,系统体系结构和新编程模型中的突破可能会融合为统一的内存驱动计算体系结构。使用此原型,HPE将能够评估,测试和验证这种新的计算机体系结构和未来系统设计的关键功能方面。

正在进行的研究工作的关键部分是使架构和仿真工具可用于更广泛的软件社区,以便外部各方可以设计新的应用程序。188bet网址怎么打不开

布雷斯尼克说:“我们告诉开发团队,‘从这个模拟器开始,最终我会给你十倍大而迅速的东西。”

这种高速,高容量的内存体系结构打开了处理迄今为止抗计算的其他问题的可能性。Bresniker所说的“现实世界规模问题”的示例包括识别企业IT系统中的恶意软件,实时优化交通流以及分析国家情报数据。

该量表的数据之间的关系不仅对于随意观察来说太复杂了,而且对于当今的内存约束计算机而言。消除这些约束可以创造出检查数据庞大的能力并解决社会级别的问题。

布雷斯尼克说,这就是“您如何获得可以实时反应的城市,经济或企业。”

类别: 创新与技术