缔冠期刊网

一种网店客户数据挖掘系统的设计与实现

2022-06-09

文/李博

摘要:本文讨论了一种以数据挖掘技术、XML技术以及数据库技术为基础的的网店客户数据挖掘系统的设计和实现方法。通过该系统可以帮助网店经营企业准确的把握网络市场中客户购买行为的规律和需求变化的趋势,提高网络营销的效率。

关键字:数据挖掘;XML;电子商务

数据挖掘技术是数据库应用研究较为活跃的领域之一,因为其现实意义,使得数据挖掘的技术研究和应用有了很大的发展,在国内外科研领域都备受关注。特别是在电子商务领域数据挖掘技术有着巨大的使用价值。随着电子商务市场的日臻成熟,第三方电子商务平台上众多的网店之间的竞争正日益激烈,网店开展网络营销的成本日益增加。每个网店企业通过一定时间的经营都会收集到众多的客户数据,如何通过庞大的客户访问数据挖掘出潜在的客户需求的金矿,使网店经营企业快速有效的通过现有客户数据掌握市场的变化的规律和趋势,已经成为网店经营管理者急需解决的问题。本文将探讨一种网店客户数据挖掘系统的设计与实现的方法。

1、网店客户购买数据挖掘系统的设计

1.1 客户购买数据挖掘系统的实现原理

对客户数据进行挖掘的关键要点就是把现有的网店访问日志经过数据预处理转换成满足XML文件格式要求的结构化数据,然后使用DBMS工具将结构化的XML文件转换成关系型数据库,最后运用数据挖掘的方法从数据库抽取能够反映客户消费和购买行为的数据。具体工作过程如下:

1)确定数据来源(主要是顾客购买记录)

数据挖掘离不开海量的数据,每一个网店在经营一段时间以后都会记录大量的客户购买记录,这些客户购买记录当中就蕴藏着大量的信息,这些信息我们进行数据挖掘的数据来源。

2)进行数据筛选

客户购买记录中蕴藏大量的信息不可能全部为数据挖掘的对象,从数据源中提取需要的数据,将无用的数据和干扰信息从数据源中剥离,为进一步的工作做准备。

3)数据格式转换

将进一步筛选过的有挖掘价值的非格式化数据数据转换为XML格式的文件并存储。

4)导入数据库

将表示客户访问数据的XML格式文件使用数据库管理工具进一步转换成可以存储于数据库的关系型数据库文件。[1]

5)进行数据挖掘

应用数据挖掘的相关算法,对存储在关系型数据库中的数据进行挖掘,发现海量数据中隐藏的客户行为模式和消费趋势。

6)对数据挖掘的结果进行甄别

通过数据挖掘总结出的一些模式有时可能脱离客户真实行为模式的实际,因此在最后一步需要为对数据挖掘总结出的规则进行甄别,这个工作目前还需要有经验的专家人工完成,今后考虑结合人工智能的技术加以解决。

1.2 网店客户购买数据挖掘系统模型

在上述系统设计的基础之上,我们提出了网店客户购买数据挖掘系统的模型,该模型由三个层次组成,其逻辑架构如图一所示。

2、系统设计与实现

2.1 系统开发与运行环境

硬件环境:CPUIntelI3380M/RAM2G/硬盘320G软件配置:

操作系统:Windows7SP1

开发工具:Microsoft.NET2005/VisualC#

数据库管理系统:MSSQLServer2008

辅助软件:spssClementine11.1;SQLServer2008AnalysisServices(SSAS)

2.2 主要技术与系统实现

通过对上述对客户购买数据挖掘系统模型的分析可知,该系统主要由用户接口模块、数据清洗模块、数据格式转换模块、数据库生成模块和数据挖掘引擎模块等组成。

1)用户接口模块

本系统最终目的还是为为客户的决策提供支持,因此友好的界面设计是用户与系统交互的基础。简洁而易于理解的界面有利于提高用户对系统的使用效率。

2)数据预处理模块

客户访问数据进入数据预处理模块进行清洗,去除无关的信息,剥离出对数据挖掘有价值的数据。数据预处理模块对原始访问数据进行分析,将用户购买数据记录逐条的分割成十个字段,分别为:u_id(访问者编号),u_date(到访日期),u_time(到访时间),u_orderid(订单编号),u_product(客户购买的商品),u_bowser(使用的浏览器类型),page(首次到访页面),place(客户所在地区),payment(支付方式),logistic(物流方式),同时删除访问数据中与以上字段不相干的数据。然后将经过预处理的数据存入中间文件。

3)XML转换模块

该模块程序使用.NET的相关的方法编写,主要功能将预处理过的客户购买数据转换成标准化XML格式的数据文件进行存储。该程序的主要实现原理是对经过预处理的中间文件中的数据记录逐个分割并存入数组,然后将数组的内容按照XML的格式写入文件,完成转换。

4)数据库导入模块

利用.NET的相关方法并结合数据库管理工具建立支持数据挖掘的客户购买数据库,编写相关程序将已经转换成XML格式的客户访问数据逐条的导入到数据库并形成日志数据表方便进行后续的数据挖掘。

5)数据挖掘引擎模块

数据挖掘引擎是实现客户购买数据挖掘系统的实现关键。优秀的数据挖掘算法不仅可以使数据挖掘的结果更加准确,也可以提高数据挖掘的效率。本系统主要用到的算法是该模块利用数据挖掘算法对数据进行挖掘,主要包括算法的优化、日志数据表的删除操作以及挖掘结果集的保存与删除操作等。这里主要用到的算法是K-Means算法。主要是利用该算法发现最相似的客户聚类,通过对聚类的分析来得出网店众多的顾客一般的购买行为模式,从而可以适当地调整网站营销的策略中的来提高网络营销的效果,进而增加销售量。[2]

3、小结

本文主要讨论了一种基于XML技术的网店客户访问数据挖掘系统的设计与实现方法。通该系统可以帮助网店经营企业对大量的客户访问数据进行分析,从中发现市场的变化规律和客户的行为模式,使企业的网络营销工作更有针对性,同时也更富有成效。

教育期刊网 http://www.jyqkw.com
参考文献:

[1] 张光辉.XML与Web数据挖掘分析[J].中原工学院学报,2002,13(4):61-64.

[2] 汤艳艳.数据仓库中基于面向对象技术的多维数据模型的设计与实现.计算机应用技术[J],2003,5(10):57-6

作者简介:李博,广东理工学院 讲师,研究方向:网络营销。

论文中心更多

期刊百科
期刊投稿 期刊知识 期刊审稿 核心期刊目录 录用通知 期刊版面费 投稿期刊推荐 学术问答
基础教育
小学语文 中学语文 小学数学 中学数学 小学英语 中学英语 物理教学 化学教学 生物教学 政治教学 历史教学 地理教学 科学教学 音乐教学 美术教学 体育教学 信息技术 班主任管理 校长管理 幼教 教育管理 微课教学 作文教学 德育教学 教学设计
医学论文
内科医学 外科医学 预防医学 妇科医学 检测医学 眼科医学 临床医学 药学论文 口腔医学 中西医 中医学 外科 护理 基础医学 急救医学 老年医学 医学实验 儿科医学 神经医学 兽医学 肿瘤医学 综合医学
职业教育
教育学原理 电影文学教育 学前教育 教育学管理 高等教育学 教育技术学 职业技术教育 成人教育学 特殊教育学 教育心理学 家庭教育 教育毕业 中专中职教育 教学设计 国学教育 学术研究 大学教育
药学卫生
社区门诊 医药学 医患关系 医院管理 疾病预防 保健医学 公共卫生 医学教育
文科论文
农业经济 工商管理毕业 会计毕业 行政管理 法律毕业 市场营销 经济毕业 汉语言文学 财务管理 物流管理 人力资源 旅游管理 国际贸易 物业管理 新闻学 企业管理 金融银行 社会科学 食品安全 办公档案 审计学 税务税收学 外国文学 哲学
理科论文
机电毕业 土木工程 计算机毕业 电气毕业 建筑毕业 电子商务 工程毕业 设计毕业 机械制造 汽车毕业 园林毕业 农学毕业 数控毕业 软件技术 水利工程 环境生态 畜牧渔业 化工毕业 科技创新 石油矿藏
论文格式
开题报告 论文题目 摘要关键词 目录提纲 论文致谢 参考文献 附录其他 论文答辩
职业论文
教育论文 经济论文 科技论文 财会论文 管理论文 医学论文 法学论文 文学论文 工业论文 建筑论文 农业论文 水利论文 计算机论文 社科论文 机械论文 生态环境 中西文化

先发表后付款 不成功可退款

权威机构认证 专注期刊10余年 1000余家杂志社长期合作

缔冠期刊网

首页 网站地图 返回顶部
Copyright © 1998- 缔冠期刊网