人人范文网 范文大全

西安交通大学数据挖掘作业1

发布时间:2020-03-02 18:29:03 来源:范文大全 收藏本文 下载本文 手机版

数据挖掘第一周作业

计算机15班

高君宇

2110505112 第一章

1.给出一个例子,其中数据挖掘对于商务的成功是至关重要的。该商务需要什么数据挖掘功能?它们能够由数据查询处理或简单的统计分析来实现吗?

答:案例:DHL获得成功

DHL是国际快递和物流行业的全球市场领先者,它提供快递、水陆空三路运输、合同物流解决方案,以及国际邮件服务。DHL的国际网络将超过220个国家及地区联系起来,员工总数超过28.5万人。在美国 FDA 要求确保运送过程中药品装运的温度达标这一压力之下,DHL的医药客户强烈要求提供更可靠且更实惠的选择。这就要求DHL在递送的各个阶段都要实时跟踪集装箱的温度。

虽然由记录器方法生成的信息准确无误,但是无法实时传递数据,客户和DHL都无法在发生温度偏差时采取任何预防和纠正措施。因此,DHL的母公司德国邮政世界网(DPWN)通过技术与创新管理(TIM)集团明确拟定了一个计划,准备使用RFID技术在不同时间点全程跟踪装运的温度。通过IBM全球企业咨询服务部绘制决定服务的关键功能参数的流程框架。DHL获得了两方面的收益:对于最终客户来说,能够使医药客户对运送过程中出现的装运问题提前做出响应,并以引人注目的低成本全面切实地增强了运送可靠性。对于DHL来说,提高了客户满意度和忠实度;为保持竞争差异奠定坚实的基础;并成为重要的新的收入增长来源。

2)应用了关联规则挖掘和分类挖掘。

3)用于数据或信息检索的数据查询处理不具有发现关联规则能力,也不具有数据分类挖掘的功能。简单的统计分析不能处理大数据,更不能根据对大数据做出科学合理的决策。

2.使用你熟悉的生活中的数据库,给出关联规则挖掘、序列模式分析、分类、聚类、孤立点分析等数据挖掘功能的例子。 答:

① 关联规则挖掘:买面包的人有可能会买牛奶,超市近距离放置两种商品。 ② 序列模式分析:购买汽车的人,有可能近期会购置汽车配件,如座椅垫等。

③ 分类数据挖掘:使用Bayes模型,每次在制定生产计划,确定生产产品所用的配方、机器及工人,预测生产中有多少的一等品、二等品和次品。 ④ 聚类数据挖掘:对全国31个地区农村居民人均年食品消费量的聚类分析

⑤ 孤立点分析的例子:税务稽查机关在选案的过程中,先从数据仓库中根据企业的规模、行业、地区等维度查找出若干企业,将这些数据再用数据挖掘软件查找纳税额明显偏低的企业,可以将这些企业作为有逃税嫌疑的企业进行稽查 3.与挖掘少量数据相比,挖掘海量数据的挑战有哪些? 答:1)规模大 高效算法, 并行处理 2)高维特性

导致搜索空间指数级的增长,维度约减 3)过拟合

因过分强调对训练样本的效果导致过度拟合,使得对未知预测样本效果就会变差 4)动态、缺失、噪音数据 5)领域知识的运用 6)模式的可理解性

第二章

(a).若手动计算,其公式可参照ppt,下面用matlab编程实现: ave_age =46.4444 ave_pf =28.7833 med_age =51 med_pf =30.7000 std_age =13.2186 std_pf =9.2544 (b).

(c)

源代码如下:

age=[23,23,27,27,39,41,47,49,50,52,54,54,56,57,58,58,60,61]; percent_fat=[9.5,26.5,7.8,17.8,31.4,25.9,27.4,27.2,31.2,34.6,42.5,28.8,33.4,30.2,34.1,32.9,41.2,35.7];

ave_age = mean(age) ave_pf = mean(percent_fat)

med_age = median(age) med_pf = median(percent_fat)

std_age = std(age) std_pf = std(percent_fat)

boxplot(age); title(\'age盒图\'); figure; boxplot(percent_fat); title(\'%fat盒图\'); figure; scatter(age,percent_fat); title(\'age%fat分位数-分位数图\')

西安交通大学

西安交通大学

西安交通大学

数据挖掘

数据仓库与数据挖掘第一次作业

西安交通大学自荐信

西安交通大学附属中学

西安交通大学简介

西安交通大学自荐信

西安交通大学自荐信

西安交通大学数据挖掘作业1
《西安交通大学数据挖掘作业1.doc》
将本文的Word文档下载到电脑,方便编辑。
推荐度:
点击下载文档
点击下载本文文档