本站所列毕业设计(论文)资料均属于原创者所有,初衷是为大家在毕业设计(论文)过程中参考和学习交流之用。

毕业设计我帮你

基于SPSS Clementine软件对数据进行分析研究及应用

基于SPSS Clementine软件对数据进行分析研究及应用

SPSS Clementine这款软件在Web挖掘领域使用频率很高,它拥有的先进技术超越许多软件。挖掘任务可以在多个领域扩展,范围很广,包括各种数据的技术,数据挖掘的过程可以更容易表现,便于我们理解。SPSS Clementine软件挖掘数据过程简单,容易上手操作,也可以

如需购买请QQ扫描右边二维码或者加QQ 3449649974 咨询 毕业设计(论文)代做请加QQ 3139476774


  • 详细描述

    基于SPSS Clementine软件对数据进行分析研究及应用

    因为现在互联网上的信息具有数量巨大、没有规则以及很容易重复的特征,导致人们现在不能快速地从网络信息中获取所需要的信息,这让我们的生活十分的不方便,所以如何在互联网上使用Web数据挖掘技术就很重要。
    我们了解Web挖掘在大数据中大概被划分为三类,分别是Web内容挖掘、Web结构挖掘以及Web使用模式挖掘。在这里我们主要介绍其中之一:Web使用模式挖掘,它是对用户浏览及访问的网站数据进行观察、建模以及分析,从而观察用户的浏览行为,理解用户在浏览中的趣向,以便对浏览者供应更加具有特色的服务,又或者是对网站结构进一步改善。
    Web技术挖掘就是在实际应用中,提前在巨大得、残缺得、有杂音得、不清楚得、随机的数据中,将隐藏在里面的、人们事前不清楚的、但是又隐含在里面的,有用的情报消息提炼出来的经过。
    Web技术挖掘是近年来才发展起来的新兴信息技术。它将数据库技术,人工智能技术,统计技术和数学与其他学科知识的整合,在数据中将人们不清楚或者有用的知识提取出来。Web挖掘主要是挖掘寻找现象之间事先未知的关系。
    Web数据挖掘是一个高度集成的技术,它可以在我们从网站中获取到的所需的信息中,使我们观察网站用户的访问数据,从而了解用户访问网站的特点,以便为用户提供适合他们趣向的服务,或者是为网站结构提供更好的改善方案。
    Web数据挖掘有以下几个特点:
    1. 异构数据库环境。在网络上,每个站点可以看作是一个数据源,其中的信息内容和组织结构都是不同的,有这些数据源之间的差异可能会构成一个巨大的异构数据库。
    2.在世界各地的Web 服务器上都有Web,构成了分布式的数据源。
    3.动态性强。网络上的信息源具有高度动态的特性。因为人们会经常对Web查询,网页提供者也会不定期地更新,所以导致了各个站点的访问信息和浏览记录的更新非常频繁,来自网页的信息更新速度也很快。
    4.半结构化。Web上的数据是一种非完全结构化的数据,没有特定的模型描述。
    5.多样复杂性。复杂的网络信息资源中,它将文本数据,超链接,图片,影像视频数据和其他数据资源都包含在其中。

    目录
    一、绪论 8
    (一)Web挖掘课题的背景和意义 8
    (二)Web数据挖掘的历史 8
    (三)国内外研究现状 9
    二、Web挖掘课题的描述 10
    (一)Web挖掘特点 10
    (二)聚类分析原理 10
    (三)聚类分析方法 10
    三、实验过程分析 12
    (一)实验目的 12
    (二)实验工具 12
    (三)实验步骤 14
    (四)实验模型与图形结果 17
    (五)实验结论与分析 20
    四、毕业设计总结 22
    五、参考文献 23

    一、绪论
    (一)Web挖掘课题的背景和意义
    Web技术挖掘就是在实际应用中,提前在巨大得、残缺得、有杂音得、不清楚得、随机的数据中,将隐藏在里面的、人们事前不清楚的、但是又隐含在里面的,有用的情报消息提炼出来的经过。
    (二)Web数据挖掘的历史
    1989 IJCAI会议: 数据库中的知发识现讨论专题。
    Knowledge Discovery in Databases (G. Piatetsky-Shapiro and W. Frawley, 1991)
    1991-1994 KDD讨论专题。
    Advances in Knowledge Discovery and Data Mining (U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, 1996)。
    1995-1998 KDD国际会议 (KDD’95-98)。
    Journal of Data Mining and Knowledge Discovery (1997)
    1998 ACM SIGKDD, SIGKDD’1999-2002 会议,以及SIGKDD Explorations
    数据挖掘方面更多的国际会议。
    PAKDD, PKDD, SIAM-Data Mining, (IEEE) ICDM, DaWaK, SPIE-DM, etc.
    我们要知道,21世纪是一个互联网时代。积累的数据以每月超过15%的增长,如果你不使用功能强大的工具,只取决于人的能力,这些数据是不可能被理解的。就更别提从这些数据中获取自己所需的内容了。现在世界上的信息增长十分迅速,差不多每隔20个月就能增长到原先的一倍,而且数据库里面的数据更是在飞速增长中。由此可知,Web数据挖掘对于社会需求来说十分重要。
    Web数据挖掘技术主要运用在金融领域、营销领域、电子商务领域、电信等通讯领域、工业生产领域以及生物和医学领域。在这边,我们可以举一个非常成功的例子,相信不少人都有听说过,那就是美国加州大型超市著名的“啤酒与尿布”的捆绑销售。通过Web数据挖掘到的超市篮子数据中,工作结束后的大多数男性顾客会去超市购买婴儿尿布和啤酒。基于这一现状,超市主管应机立断,将超市的货架布局重新进行更改,把男士爱喝的啤酒这一类产品与婴儿尿布产品就近摆放,还在一边放置男性的日常用品。这样,大大提升了以上几种产品的销量。我们从中可以看到web数据挖掘的重要性。
    (三)国内外研究现状
    我们可以看到虽然现在互联网上有着不少的Web挖掘软件,但不少软件功能不齐全,技术还不成熟。而且国内的大部分软件还都处于科研阶段。各大学和科研机构主要对Web数据挖掘算法进行研究,而且国内著作的有关数据挖掘方面的书比较少,主要是一些翻译的书。有一些公司主要开发在国外产品基础上的特定应用。像IBM Intelligent Miner、SAS Enterprise Miner等这些Web数据挖掘软件具有自主知识产权。
    Web数据挖掘主要用于网络结构的数据采集,预处理技术的发展趋势的转变;在灵活性和研究的及时性方面使用可以采用现有的数据挖掘方法;基于Web技术挖掘和信息检索智能搜索引擎和钻研相关的算法;在特定的范畴内,如电子商务方面对Web技术挖掘程序的研究;越来越接近半结构化文档。
    数据挖掘的发展未来和方向主要依靠着数据库、统计学、数学系以及人工智能等学科的发展。我们应该在这些学科领域上取得成就,才能让国内杂乱的Web数据挖掘软件有一个好的进展。
     




    毕业设计总结
    通过这次的web数据挖掘课题,让自己对什么是数据挖掘有了较为广泛的了解。说实话,一开始接触这个课题的时候,整个人是懵的状态。但是一点一点在老师的帮助下,最终确定了自己课题的方向。
    一开始想着还早,在老师的催促下才完成了开题报告。对自己的课题也仅仅有一点了解。途中遇到了很多困难,光是选择合适的挖掘软件就占用了不少的时间,也浪费了不少的精力。现在的我对实验软件Clementine有了更深层次的了解,对它的操作也有了更加熟悉的掌握。这对我来说已经不是一次毕业设计,也是对自己从零开始的一个挑战。在利用Clementine软件来解决问题的实践过程中,不仅尝试了了学会使用一款陌生软件,同时也学会了对问题的应该如何分析的过程。与此同时,也让我对中国现如今Web挖掘有了进一步的了解,认识到了一些国内比之国外不足的地方。
    SPSS Clementine是一款很实用,同时也是功能很强大的一款软件。因此在操作过程中,有很多的步骤会因为某些因素操作错误,不过这款软件的自身的错误提示功能很不错。很感谢老师给予我的帮助,让我从零开始学习,对Clementine这款软件有了一个深刻的印象。同样也要感谢其他同学的帮助,让我完成了这篇论文。还有一些不懂得知识,都是通过对互联网的搜索、研究,才让我学习了很多平时不会也完全不了解的东西,知道了分析病人的方法。随着即将结束的论文,大学的课业生活也进入了尾声,在这里虽然对大家仍旧有很多的不舍,但是人生就是会不停地往前走,即使大家最终会分道扬镳,我仍会将这几年的美好时光一直珍藏在脑海中。
     
    参考文献
    [1]数据挖掘概念与技术[M],机械工业出版社 2012-08-01 
    [2]王军 数据挖掘技术[J],计算机世界,1998
    [3]俞勇 Web数据挖掘[M],清华大学出版社,2009
    [4]王斌 互联网大规模数据挖掘与分布式处理[M], 人民邮电出版社,2012
    [5]吴瑞 不确定理论与Web挖掘[M], 电子工业出版社,2011
    [6]马刚 基于语义的WEB数据挖掘[M], 东北财经大学出版社,2014
    [7]奎斯塔 大数据技术书籍[M], 机械工业出版社,2014
    [8]刘振学 实验设计与数据处理[M], 化学工业出版社,2015
    [9]李桃迎 交通领域中的聚类分析方法研究[M], 科学出版社,2014
    [10]张良均 数据挖掘[M], 机械工业出版社,2012
     
     
    收缩