25.03.2011 12:55
DataStax bündelt Hadoop und Hive mit Cassandra
DataStax, ein Anbieter kommerzieller Dienstleitungen rund um die NoSQL-Datenbank Apache Cassandra, hat eine Softwaredistribution veröffentlicht, die die Apache-Projekte Hadoop und Hive mit der hochskalierenden, spaltenorientierten Datenbank koppelt. Cassandra wurde ursprünglich von Facebook entwickelt und ist unter anderem bei Digg, Twitter und Reddit im Einsatz. Die Firmengründer von DataStax waren zuvor Angestellte des Social-Plattform-Betreibers.
Das Brisk genannte Paket aus Datenbank mit geringer Latenzzeit, Hadoops MapReduce-Implementierung zur Analyse und Verarbeitung großer Datenmengen sowie dem Warehouse-Projekt Hive soll sich für viel besuchte Webseiten eignen oder solchen Anwendungen, die nahezu in Echtzeit agieren müssen.
Die initiale Brisk-Version besteht aus Hadoop 0.20.2, Hive 0.7 und Cassandra 0.7.4, allerdings ersetzt sie das Hadoop File System (HDFS) der MapReduce-Implementierung mit einer CassandraFS genannten Schnittstelle. Brisk wird noch bis Anfang Mai unter der Apache-Lizenz verfügbar sein.
(ane)
Ab sofort kann man sich mit Vorträgen für die neue Konferenz zu Agile ALM, Continuous Delivery und DevOps bewerben.
Am 5. und 6. Juni trifft sich in Toulouse die Eclipse-Community zur Erstauflage der EclipseCon France. Bis 26. Mai kann man sich noch zum Frühbucherpreis registrieren.