编程札记

hadoop-05

Zookeeper分布式协调服务Apache Zookeeper旨在减轻构建健壮的分布式系统的服务。Zookeeper是基于分布式计算的核心概念而设计的,主要目的是给开发人员提供一套容易理解和开发的接口,从而简化分布式系统构建的服务。...

编程札记

数据挖掘-06-日志

日志的挖掘与应用日志概念日志是什么所谓日志(Log)是指系统所指定对象的某些操作和其操作结果按时间有序的集合。日志数据的核心就是简单的日志消息。日志数据可详细累出应用程序的信息、系统性能或用户活动等。几乎所有的计算机相关的设备、系统、...

编程札记

hadoop-04

MapReduce概述MapReduce是Hadoop系统核心组件之一,它是一种可用于大数据并行处理的计算模型、框架和平台,主要解决海量数据的计算,是目前分布式计算模型中应用较为广泛的一种。 NULL 传统并行计算框架 MapR...