07.06.2016 Новости, Идеи и практики автоматизации, Открытый код/LinuxК открывшейся 6 июня в Сан-Франциско конференции Spark Summit ряд игроков в области обработки больших данных подготовили объявления, касающиеся Open-Source-платформы Apache Spark для обработки больших данных с предварительной их загрузкой в оперативную память. MapR и Microsoft представили свои новые дистрибутивы Spark. Отметим, что оба дистрибутива фактически базируются на Hadoop, а не на самостоятельных кластерах Spark. Но обе компании выделяют в названиях своих докладов слово Spark, и их дистрибутивы ориентированы на использование именно этой платформы. Spark из Редмонда Дистрибутив Microsoft ранее уже существовал в формате предварительной версии, и теперь выпускается в свет официально. Хотя его первоначальный вариант, представленный почти год назад, был построен вокруг HDInsight (дистрибутива Hadoop на базе облака Microsoft) для Windows, компания изменила ...
читать далее.