新闻稿




大数据说明

“大数据”代表了用于存储,分析和利用信息资产的技术和技术的范式转变。在本专栏中,我们跟踪Hadoop,NoSQL和Data Science等技术的进度,并了解他们如何彻底改变数据库管理,商业惯例和我们日常生活。



看着从“我们不需要没有臭名SQL”态度的“我不需要没有臭名SQL”的态度,这一直有趣的是“我能用那样的SQL吗?”哲学。在过去8年中出现的非统一数据库最初没有提供任何SQL功能。但是,今天我们对“NoSQL”的SQL选项有尴尬。Hive为Hadoop系统提供SQL,Spark具有SparkSQL,MongoDB具有基于SQL的BI连接器,等等。

发表于2016年12月1日

多年来,Cassandra荣幸能够处理大规模扩展和全球可用性的能力。基于Amazon的Dynamo,Cassandra实现了一个万向一体的体系结构,即使数据库经过大规模网络或数据中心中断,也允许数据库事务继续。即使在通过网络中断完全隔离两个地理上单独的数据中心的情况下,Cassandra数据库也可以继续在两个地理上运行,调整冲突事务 - 尽管可能是不完美的 - 当中断解决时。

发表于2016年10月7日

迄今为止,迄今为止,MongoDB可以说是今天增长最快的数据库技术。MongoDB的快速增长主要是推动其对开发人员的吸引力。通过使用JavaScript对象符号(JSON)文档作为本机数据库格式,MongoDB减少了程序代码和数据库之间的阻抗不匹配,允许更灵活和快速的应用程序开发。

发表于2016年8月4日

对于那些没有遇到这个术语的人来说,“幻灭的槽”是Gartner Hype周期内的标准阶段。预计新技术将通过幻灭的低端达到“生产力平台”之前通过“膨胀期望”。大多数新技术都预计会经过这条槽,因此发现进入此阶段的大数据几乎不足为奇。

发表于2016年6月09日

它几乎是硅谷的标准职业道路:一位才华横溢的工程师在一个更大的组织内创造了一个有价值的开源软件商品,然后将该公司创建一个新的启动以将开源产品商业化。实际上,这几乎是硅谷的热闹HBO喜剧系列的情节线。Jay Krepes,LinkedIn和NoSQL数据库系统的voldemort的知名工程师,voldemort,有这样一个故事。

发表于2016年3月31日

说出你对Oracle的内容,它肯定不能被指控失败与时代搬家。通常,Oracle迟到了一个技术派对,但穿得杀死。

发表于2016年2月10日

它通常被断言 - 并且普遍接受 - “单尺寸适合”数据库的时代结束。我们希望企业将使用数据库技术的组合来满足各种应用架构创建的不同需求。

发表于2015年12月02日

有很多数据库竞争为NoSQL的“王”。MongoDB声称具有增长最快的NoSQL数据库生态系统,MarkLogic声称是唯一的企业NoSQL数据库,而其他数据库声称是最快或最可扩展的系统。

发表于2015年10月7日

在非关系数据库爆炸后不久,2009年左右,显而易见的是,而不是作为问题的一部分,SQL将继续成为解决方案的一部分。如果新浪潮数据库系统排除了大量的SQL识字专业人士,那么他们将阻碍他们在商业世界的摄取。此外,整个生商智能工具使用SQL作为将用户信息请求转换为数据库查询的常用方式。对于SQL采用的驱动器来说比Hadoop的情况更清楚。

发表于2015年8月10日

毫无疑问,新的非重点系统浪潮代表了数据库技术中的重要和必要的革命。但是,虽然我们需要避免与过去和不断创新的技术结婚,但忽略历史的教训永远不会是一个好主意。

发表于2015年6月9日

虽然新的数据商店和其他软件组件通常是开源和许多许可成本,但新堆栈的架构增长了更复杂,而且这种复杂性正在为更适合更适中的大小组织创造一个障碍。

发表于2015年4月06日

在阅读Hadoop的一些新闻报道后,可能会宽恕有人新的大数据和Hadoop的人。一方面,Hadoop已经在主流媒体上实现了很好的看涨覆盖范围。然而,在这种正覆盖范围内,已经有许多权利要求Hadoop被覆盖。什么是所有这些混合信息的人?

发表于2015年2月11日

引入非关系数据库的交易能力提高使得与在Hadoop顶部提供SQL层以及许多其他非关系商店的同样的方式是有道理的。但它确实提出了关系和非关系系统融合的可能性。毕竟,如果我采取非关系数据库并添加SQL和酸事务,我还有一个非关系数据库,或者我已经全圈回到关系模型?

发表于2014年12月3日

大数据革命的一个特征是确认,单个数据库管理系统架构无法满足所有需求。然而,Lambda架构提供了一种用于组合多个大数据技术来实现多种企业目标的有用模式。首先由Nathan Marz提出,它试图提供一种技术的组合,其中可以提供可以满足可用性,可维护性和容错的要求的网络级系统的特性。

发表于2014年10月8日

大数据的先驱,如谷歌,亚马逊和eBay,从他们的核心操作产生了“数据排气”,这足以让它们创建数据驱动的过程自动化。但是,对于较小的企业来说,数据可能是稀缺的商品。因此,数据市场的出现。

发表于2014年8月05日

大数据分析是一个复杂的字段,但如果您了解基本概念 - 例如监督和无监督的学习之间的区别 - 您一定要领先于您在下一个鸡尾酒会上谈论数据科学的人!

发表于2014年6月11日

大约3年前,AMP(算法,机器,人)实验室成立于U.C.伯克利攻击大数据上先进分析和机器学习的新出现挑战。由此产生的伯克利数据分析堆栈 - 特别是火花加工发动机 - 已经显示出快速的摄取和巨大的承诺。

发表于2014年4月4日

固态磁盘(SSD) - 散装闪存SSD - 承诺通过提供比磁盘更快的存储介质来彻底改变数据库性能,这提供了几十年磁盘I / O延迟的第一次显着改进。Aerospike是一个NoSQL数据库,它试图提供一种可以充分利用Flash SSD的I / O特性的数据库架构。

发表于2014年2月10日