TechTarget新闻记者和网站编辑,主要关注数据管理领域的技术趋势和动态。
数据流处理技术已经得到业界越来越多青睐,随着更大量的Web数据和移动数据进入组织,越来越多的应用在将关注点转移到了处理动态大数据。
NoSQL是对数据库由内而外的全方位改造,从而创造出一个高容量、高速度和高可变性的架构。然而,NoSQL供应商在可变性部分却正在遭遇失败。
深度机器学习这项技术非常重要,因为它能教会机器,将一些过去需要人类脑力参与的工作转变为劳动密集型的工作。
对于在实时数据集上测试机器学习算法,搭建云平台特别有用,因为用户就不必为测试运行对内部系统进行供应和配置。
那些正挣扎在大量企业数据中的IT和分析管理人员可能发现,他们很难忽略不断变化的市场会推进从技术供应商那里获得机器学习工具。
汹涌而来的大数据浪潮正在改变数据建模技术,包括模式的创建。数据专业人员应该及时做出调整,适应形势的变化。
开源Apache Spark架构已经提供了快速的内存处理和高性能的机器学习库,还集成了数据流处理能力。它还在继续吸引更多来自Web新贵和传统企业环境的追随者。
GPU技术的使用是一些机器学习应用的前沿和核心。Facebook,百度、亚马逊和其他一些公司正在使用的GPU集群来研究深层神经网络相关的机器学习应用程序。
批处理本是大型机时代的主题,近十年来随着Hadoop MapReduce的关注度逐渐增加,批处理现在又重新成为热门主题。
Hadoop受到很多人的关注,但是大数据框架融入IT主流的步伐在减缓, Gartner公司2015年的调查显示只有十分之一的受访者将Hadoop用于生产应用。