HDFS分布式文件系统 HDFS的简介 Hadoop的核心是HDFS和MapReduce。其中,HDFS是解决海量大数据文件存储的问题,是目前应用最广泛的分布式文件系统。 HDFS的演变 HDFS 源于 Google 在2003年10...
数据挖掘-实验-SVM人脸识别
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263...
数据挖掘-实验-朴素贝叶斯
花的分类 123456789101112131415161718192021222324252627282930313233from sklearn import treeimport matplotlib.pyplot as plt...
数据挖掘-02-分类决策树
数据挖掘基础 分类概述 分类的基本概念 分类是一种重要的数据分析形式。 根据重要数据类的特征向量值及其他约束条件,建立分类函数或分类模型。 分类模型可以用于描述性建模和预测性建模。 解决分类问题的一般方法 分类法是一种根据输入数据集建...
数据挖掘-01-概念
数据挖掘基础 数据挖掘概述 什么是数据挖掘? 数据挖掘(Data Mining),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 数据挖掘的数据源包括数据...
从零到一搭建一个hexo博客
开个新坑,慢慢写 前言 以前用的blog一直是wordpress,配合着@moedog大佬的二次元主题,然后有段时间摸鱼,正好碰到了@Candinyadalao移植的hexo主题风格,想了想wp比较...