编程札记

hadoop-06

Hadoop2.0改进与提升 相比Hadoop1.0版本,Hadoop2.0的优化改良主要体现在两个方面:一方面是Hadoop自身核心组件架构设计的改进,另一方面是Hadoop集群性能的改进,通过这些优化和提升,Hadoop可以支持更...

编程札记

hadoop-05

Zookeeper分布式协调服务 Apache Zookeeper旨在减轻构建健壮的分布式系统的服务。Zookeeper是基于分布式计算的核心概念而设计的,主要目的是给开发人员提供一套容易理解和开发的接口,从而简化分布式系统构建的服务...

编程札记

数据挖掘-06-日志

日志的挖掘与应用 日志概念 日志是什么 所谓日志(Log)是指系统所指定对象的某些操作和其操作结果按时间有序的集合。 日志数据的核心就是简单的日志消息。 日志数据可详细累出应用程序的信息、系统性能或用户活动等。 几乎所有的计算机相关的...