现在有这样一个场景,如花,小倩,小明和小强四位好基友/闺蜜偶尔一起看点电影。前四行是他们之前看电影的记录,比如第一次[0,0,1,0]表示的是 只有小明一个人去看了电影。第二次[1,1,1,1]表示的是他们都去看电影了... 但是第五...
数据挖掘-07-基础应用案例
背景需求 变压器 在变压器运行的运行周期中,油温状态是影响变压器运行和负载能力的重要因素。所以变压器油温异常的甄别对变压器及线路的安全运行具有很高的实用价值。为了及时发现变压器油温异常,就需要对变压器平时正常运行时油温的状况有清晰的了...
数据挖掘-06-日志
日志的挖掘与应用 日志概念 日志是什么 所谓日志(Log)是指系统所指定对象的某些操作和其操作结果按时间有序的集合。 日志数据的核心就是简单的日志消息。 日志数据可详细累出应用程序的信息、系统性能或用户活动等。 几乎所有的计算机相关的...
数据挖掘-实验-FP-growth
关联规则之FP-growth算法 建立FP树的类定义 复制下面7个步骤的代码到一个python文件中 123456789101112131415class treeNode: def __init__(self, nameVal...
数据挖掘-05-Apriori&&FPgrowth
Apriori&&FPgrowth Apriori Apriori算法的核心思想 Apriori算法基于频繁项集性质的先验知识,使用由下至上逐层搜索的迭代方法,即从频繁1项集开始,采用频繁k项集搜索频繁k+1项集,直到...
数据挖掘-实验-关联分析
关联规则 引入需要用到的包 123import pandas as pdfrom mlxtend.frequent_patterns import apriorifrom mlxtend.frequent_patterns impor...
数据挖掘-04-关联规则
关联规则 关联规则概述 关联规则依据大量数据中存在的特定关系,通过对数据的分析,发现之间的联系。已经在电商、零售、大气物理、生物医学等多个方面有了广泛的应用。 关联规则的概念和定义 关联规则概念最早是由Agrawal等人在1993年首...
数据挖掘-03-聚类
聚类 聚类概述 概述 聚类是一个将数据集划分为若干组或簇的过程,使得同一类的数据对象之间的相似度较高,而不同类的数据对象之间的相似度较低。 这里的类,也叫簇(cluster),是相似数据的集合。 聚类的过程 把相似数据归并到一类的过程...
数据挖掘-实验-聚类
首先我们随机创建一些二维数据作为训练集,选择二维特征数据,主要是方便可视化。代码如下: 12345678import matplotlib.pyplot as pltfrom sklearn.datasets.samples_gene...
数据挖掘-实验-SVM人脸识别
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263...