聚类 聚类概述 概述 聚类是一个将数据集划分为若干组或簇的过程,使得同一类的数据对象之间的相似度较高,而不同类的数据对象之间的相似度较低。 这里的类,也叫簇(cluster),是相似数据的集合。 聚类的过程 把相似数据归并到一类的过程...
数据挖掘-实验-聚类
首先我们随机创建一些二维数据作为训练集,选择二维特征数据,主要是方便可视化。代码如下: 12345678import matplotlib.pyplot as pltfrom sklearn.datasets.samples_gene...
数据挖掘-实验-SVM人脸识别
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263...
数据挖掘-实验-朴素贝叶斯
花的分类 123456789101112131415161718192021222324252627282930313233from sklearn import treeimport matplotlib.pyplot as plt...
数据挖掘-02-分类决策树
数据挖掘基础 分类概述 分类的基本概念 分类是一种重要的数据分析形式。 根据重要数据类的特征向量值及其他约束条件,建立分类函数或分类模型。 分类模型可以用于描述性建模和预测性建模。 解决分类问题的一般方法 分类法是一种根据输入数据集建...
数据挖掘-01-概念
数据挖掘基础 数据挖掘概述 什么是数据挖掘? 数据挖掘(Data Mining),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 数据挖掘的数据源包括数据...