hadoop

hadoop-09

在实际开发中,有时候需要将HDFS或Hive上的数据导出到传统关系型数据库中(如MySQL、Oracle等),或者将传统关系型数据库中的数据导入到HDFS或Hive上,如果通过人工手动进行数据迁移的话,就会显得非常麻烦。为此,可使用A...

hadoop

hadoop-08

Spark简介 Spark最初由美国加州大学伯克利分校(UC Berkeley)的AMP实验室于2009年开发,是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序 2013年Spark加入Apache孵化器...

奇迹只有一瞬间所以看起来才有强烈的光芒,但最终会变得合乎常理,这个世界就是被构造成这样的

数据挖掘

数据挖掘-实验-神经网络

现在有这样一个场景,如花,小倩,小明和小强四位好基友/闺蜜偶尔一起看点电影。前四行是他们之前看电影的记录,比如第一次[0,0,1,0]表示的是 只有小明一个人去看了电影。第二次[1,1,1,1]表示的是他们都去看电影了… 但是第五次,...

数据挖掘

数据挖掘-07-基础应用案例

背景需求变压器在变压器运行的运行周期中,油温状态是影响变压器运行和负载能力的重要因素。所以变压器油温异常的甄别对变压器及线路的安全运行具有很高的实用价值。为了及时发现变压器油温异常,就需要对变压器平时正常运行时油温的状况有清晰的了解并...

hadoop

hadoop-07

数据仓库简介什么是数据仓库数据仓库是一个面向主题的、集成的、随时间变化的,但信息本身相对稳定的数据集合,它用于支持企业或组织的决策分析处理,这里对数据仓库的定义,指出了数据仓库的三个特点。 数据仓库的结构数据仓库的结构是由数据源、数据...

hadoop

hadoop-06

Hadoop2.0改进与提升相比Hadoop1.0版本,Hadoop2.0的优化改良主要体现在两个方面:一方面是Hadoop自身核心组件架构设计的改进,另一方面是Hadoop集群性能的改进,通过这些优化和提升,Hadoop可以支持更多...