分析数据库现在已经集成了Hadoop

开源的Hadoop框架非常适合跨大量服务器对大型数据集进行分布式处理。

它不擅长的是速度。Actian Corp.生产了许多专门的数据管理系统,包括基于sql的Vectorwise分析数据库,该公司一直在观察其客户试图通过建立自己的连接来弥补与Hadoop的差距。

最新版本的Vectorwise将为他们节省大量工作:3.0版本带有高级Hadoop集成,允许客户以Actian所说的相对适中的价格快速查询非结构化数据。

Vectorwise总经理弗雷德•加拉格尔(Fred Gallagher)表示,Hadoop有很多优势。Hadoop的HDFS文件系统提供了几乎无限的存储空间,Hadoop本身就是一个很好的并行处理。但是,他补充说,由于它是一个批处理处理器,所以执行特别查询或向下钻取数据发现非常麻烦。

“因此,通过将Hadoop的大数据集功能与Vectorwise集成,人们可以得到他们想要的响应。”

其他变化包括更高效的存储引擎、对更多数据类型和分析SQL函数的支持以及增强的DDL(数据描述语言)特性。

加拉格尔表示,使用Hadoop连接器,在一台拥有12个核心的戴尔服务器上使用Vectorwise,可以在90%的查询中胜过半机架的数据设备,成本不到10万美元(包括服务器)。

“我们可以在一小时内在一组普通的服务器上转移tb。”

他表示,使用Vectorwise和Hadoop的客户包括许多社交媒体公司,这些公司需要处理大量用户数据。其中一个Hadoop custer有超过250 TB的数据,一次需要分析20 TB的数据。另一个存储Web日志,并将1000亿条记录以向量方式进行处理。

Vectorwise运行在Windows服务器和Linux上。起价6万美元左右。

Vectorwise直接出售给拥有自己的数据库和商业智能应用程序的大型帐户;否则,它将由解决方案提供商与这些应用程序一起出售。

魁北克市的Korem Inc.是加拿大的合作伙伴之一,它销售地理空间测绘解决方案,其中一些方案利用了谷歌地球或邮政编码

Gallagher表示,Actian正在寻找更多在大数据和数据仓库方面有专长的解决方案提供商。合作伙伴将获得培训和产品销售折扣。

THE END
分享
二维码
海报
分析数据库现在已经集成了Hadoop
开源的Hadoop框架非常适合跨大量服务器对大型数据集进行分布式处理。 它不擅长的是速度。Actian Corp.生产了许多专门的数据管理系统,包括基于sql的Vectorwi……
<<上一篇
下一篇>>