数据挖掘试题参考答案
原有的数据库技术已满足不了应用的需要,人们希望从这些媒体数据中得到一些高层的概念和模式,找出蕴涵于其中的有价值的知识。这种将数据挖掘技术和多媒体信息处理技术有机地结合起来形成的在多媒体数据中进行知识发现的信息处理方法就是多媒体数据挖掘 。
对多媒体数据进行挖掘并且实现智能化信息检索是未来发展的需求,是一个很有前途的研究方向。
1、文本数据挖掘
所谓多媒体文本数据挖掘,就是从大量的多媒体文本数据中发现有意义的模式过程。多媒体文本数据挖掘的过程对多媒体文本数据挖掘最行之有效的途径就是将多媒体文本数据结构化后,再对结构化数据采用数据挖掘方法。文本挖掘从功能上可以分为总结、分类、聚类、趋势预测等。
2、图像数据挖掘
图像挖掘是多媒体挖掘的一个分支,图像挖掘可以广泛地应用于图像检索、医学影像诊断分析、卫星图片分析、地下矿藏预测等各种领域。其挖掘方法和原型结构存在着巨大的改进空间。
3、视频、音频数据挖掘
除了静态图像,在数字文档、万维网、广播数据流、个人或专业数据库中,还能获得数字形式的大量音频和视频信息。
4、在医学图书馆服务中的应用
多媒体数据挖掘对医学信息有很强的适应性。多媒体技术的应用便于医学信息的储存多媒体技术是当今信息技术领域发展最快、最活跃的技术,是新一代电子技术发展和竞争的焦点。
<数据挖掘的未来发展趋势:>
未来的热点应用领域
网站的数据挖掘(Web site data mining)
生物信息或基因的数据挖掘
文本挖掘(Textual mining)
多媒体挖掘
未来的研究热点
发现语言的形式化描述
寻求数据挖掘过程中的可视化方法
研究在网络环境下的数据挖掘技术
加强对各种非结构化数据的挖掘
知识的维护更新
4.在电信行业中,如何利用数据挖掘技术对用户信用度进行分析
数据挖掘有其一般的通用过程,但是在具体应用的时候因为实际情况可能比较复杂, 根据具体的情况不同还要做出适当的修改。针对电信行业用户信用度分析,从项目需求的理解和定义开始, 经过数据的收集和抽取、清洗、整合的过程, 到建立数据挖掘模型, 最 后经过模型的评估到模型的发布。具体步骤如下:
项目需求
信用度分析的目标就是要对现有电信客户进行信用评估,通过评估分析建立的
挖掘分析模型可以获得客户信用等级的评分, 在此基础上可以结合用户分群的
结果, 将电信客户进行分群, 找出不同信用级别的客户群体, 然后由数据挖掘