大数据时代下数据挖掘在银行中的应用
2024-02-01
来源:步旅网
ISSN 1009-3044 E—mail:jsh@dnzs.net.cn Computer Knowledge and Techno ̄gy电脑知识与技术 http://www.dnzs.net.cn Vo1.10,No.7,March 2014 Tel:+86—55 1-65690963 65690964 大数据时代下数据挖掘在银行中的应用 王日宏.王晓龙 (青岛理工大学计算机工程学院,山东青岛266033) 摘要:"3今,随着计算机和网络的飞速发展,-人们无论在工作中还是在日常生活中用到计算机的机会越来越多,由此产生 的信息量也就越来越巨大,如此巨大的网络信息量,标志着人们已经进入了“大数据”时代。“大数据”时代下的信息具有体 量大、高复杂性、增长速度快等特点,从具有如此复杂特性的信息中挖掘出用户所需要的信息,难度比以往要高了许多。 特别对于银行这一行业,数据决定着它的未来发展。虽然有些银行可能还没有意识到数据爆炸性增长带来的问题,但是 数据对于银行的重要性已经成为业界的共识。数据挖掘作为一种数据处理技术,在现如今数据量巨大的银行业领域中正 逐步受到重视。 关键词:大数据时代;银行;数据挖掘 中图分类号:TP393 文献标识码:A 文章编号:1O09—3044(2O14)07—1369—02 The Age of Big Data Mining Application in Bank WANG Ri—hong,WANG Xiao—long (CoUege ofComputer Engineering,Qingdao Technological University,Qingdao 266033,China) Abstract:Nowadays,with the rapid development of computer and network,people get whether at work or in daily life more and more opportuniyt to use computer,the resulting information is more and more big,the amount of network information SO huge,marking the people have entered the”era of big data”.”Big data”era of information has a large volume,high complexity, faster growth rate,from digging OUt the information users need such complicated characteristics of information,the dificulyt should be much higher than in the past.Especially for the banks in this industry,data determines its future development.A1- though some banks may not have been aware ofto bring growth data explosive issue,the data on the importance ofbank has be- come the consensus of the industry.Data mining is a data processing technology,nowadays,the huge amount of data in the field ofbanking industry is paid more attention gradually. Key words:the age ofbig data;bank;data mining l概述 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但潜在有用的信息 和知识的过程。并且数据挖掘又是与计算机科学相关,包括人工智能、数据库知识、机器学习、神经计算和统计分析等多学科领域 和方法的交叉学科,数据挖掘能够自动对数据进行分析,并归纳总结,推理,分析数据,从而帮助决策者对信息预测和决策其作用。 2数据挖掘的相关概念 数据挖掘的主要方法包括遗传算法、决策树、神经网络、K’-近邻算法等。遗传算法是一种最佳的空间搜索方法。它通过应用 算法的适应函数来决定搜索的方向,运用一些人工运算模拟生物种群“多样性”和“优胜劣汰”的过程,进行一代一代的周而复始的 演化,首先将群体中较劣的初始解通过复制、交叉和变异3个基本算子优化求解的技术,再在求解空间随机和定向搜索特征的多次 迭代,直到求得问题的最优解。决策树是一种用树枝状结构来展示数据受各变量影响的分析预测模型,树型结构表示分类或者决 策集合,决策树是采用自上到下的递归模式,树的非终端节点表示属性,叶节点表示所属的不同类别。通过计算各个决策的期望 值,选出最优解。神经网络是一种模仿人脑思考结构的数据分析模式,依据其非线形预测模型,通过模式识别的方式展开,获取的 知识需要存储在网络各单元之间的连接权中。人工神经网络能够完成分类和聚类等挖掘。K一邻近算法是一种常用的基于距离 度量的分类方法。K一近邻算法假设整个训练集不仅包含数据集,而且包含每个元组期望的类别标签。 数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策,其主要有以下五类功能。 收稿日期:2014—02~15 作者简介:王晓龙(1988一),男,山东诸城人,硕士,主要研究方向为数据挖掘;王日宏,男,山东青岛人,教授,硕士,主要研究方向为 数据挖掘.嵌入式。 本栏目责任编辑:代影 m 数据库与信息蕾疆… 1369