论文介绍了应用数据挖掘实现审计数据总体分析的流程,并提出了一种关联规则快速算法来解决在海量数据条件下的审计数据的总体分析问题。理论证明它比Apriori算法的应用效率高,实验结果也证实了它的有效性。
维普资讯
关联规则在计算机辅助审计中的应用景波刘莹文巨峰 (南京审计学院计算机系,南京 2 0 2 ) 10 9E ma: o i.n . m— i j@v s a o lb pi c摘要论文介绍了应用数据挖掘实现审计数据总体分析的流程,并提出了一种关联规则快速算法来解决在海量数据
条件下的审计数据的总体分析问题。理论证明它比 A r r算法的应用效率高, po ii实验结果也证实了它的有效性。 关键词计算机辅助审计数据挖掘关联规则经典 A r r算法 po ii
文章编号 10— 3 1 (0 6 2— 2 0 0文献标识码 A 0 2 8 3一 20 )5 0 1— 3 中图分类号 T 3 1 P 9
Ap l a i n o s ca i n Ru e i i g i m p t r As it d Au i p i t f Aso i to ls M n n n Co c o u e sse d tJ NG o LI Yig W EN u e g I B U n J fn
( e a me to o p trS i c n eh ooy N nig A dtU i r t, aj g 2 0 2 ) D p r n fC m ue ce e a d T c n lg, aj u i nv sy N ni 1 0 9 t n n ei nAb ta t T i a e n r d c s h p c s n w ih t e a a sr c: h s p r i t u e t e r e s i h c h d t mi ig p l i h e e a a ay i f a dt g d t, p o o n n a p y n t e g n r l n l ss u i n a a o i
a d fs lo t m fr n a a t g r h a i o mi ig s o it g u e c n o v s h a d t g a a e e a a ay i n u e a aT e n n a s ca i r l s a s l e te u i n d t g n r l n l ss n i i h g d t . h e p rme t e ut h w t a h s a g r h i o t p r r roi xe i n a rs l s o h t t i l o t m s u ef ms Ap i r l s i o .Ke wo d y r s:C mp tr Asitd Au i, t nn, s o ito ue, p o i ta i o a o u e ss d t
Da a Mi i g a s c ai n r l a f r r dt n l e i i
随着我国信息化水平的飞速发展,据海量化的趋势已不数可逆转,而数据挖掘亦使数据库技术进入了一个更高级的阶段。不仅能对数据进行查询和遍历,且能够找出数据之间它并
审计挖掘分析模型 (图 1在体系架构上由以下几部分如 )组成:
数据采集系统:责采集审计模型要审计的数据,括网负包络数据包,统日志等;时也对数据进行预先处理。系同 业务数据库:放数据采集系统采集的经过格式化后的审存计记录数据。
的潜在联系,而促进信息的传递。这就使作为行使独立监管从职能的审计机关有能力应对审查单位数据日益海量化的挑战。 对此本文提出了数据挖掘中的关联规则快速算法 .以期能更快
捷、高效地得到数据之间的关联规则。更数据挖掘 ( a iig、据库知识发现 ( nwe g i D t M nn )数 a K o l e Ds d— cvr nD tbs。D[,前统称为数据挖掘。数据挖 oeyi aaae K D)等当 1 _在掘中,关联规则口1是描述这种在一个事务中对象之间同时出, 3就 现的规律的知识模式口更确切地说,联规则通过量化的数字 1。关描述对象甲的出现对对象乙的出现有多大的影响。掘关联规挖则的经典算法 A r r存在两个致命的性能瓶颈:1多次扫描 pi i o ()事务数据库,成巨大的 I负载;2产生庞大的候选集,造/ O ()造成时间和主存空间的浪费。 关联规则快速算法结合审计分析的特点,减少求解频繁在项集的计算量和简化查找过程,除规则间冗余的方面提出了消新的观点。一
数据挖掘系统:成对采集的数据进行数据分析 .掘出完挖 些能够反映用户行为的规则,存到审计规则库中 .时通保同过学习知识库里的规则进行实时规则匹配,进行判定风险等来级并触发审计事件;对采集的数据以及应用系统原始数据库在的进一步挖掘、析的同时可以自动扩充学习知识库。因此该分系统包括数据分
析和规则挖掘功能,审计挖掘分析模型的核是心部分。
动作响应系统:供实时控制接口,成了多种事件响应提集接口,以产生协作进程所需的消息;计工作底稿和审计工可审
作记录;动预警等。联审计规则库:放了数据挖掘系统进行数据分析时产生的存规则、规则用于和学习知识库进行模式匹配,匹配的话就该当触发动作响应。模型可以在数据挖掘系统运行时管理该规则库。
l审计挖掘分析模型 财务欺诈也是一个系统工程,要各个科目之间的协调配需
合,此很多公司出现了“科目、做账”因假真的现象,难免有个但别科目出现背离之势,此资产负债表、润表、金流量表三因利现大财务报表之间的勾稽关系是用来识别财务欺诈的有效途径之一。务报表主表与明细表之间的勾稽关系有比较简单的明财细与合计的关系,有比较复杂的涉及数张报表发生额和余额也的关系,这些数据成为审计挖掘分析的重点。基金项目:苏省高校自然科学基金资助项目 (号:3 J 5 0 0 )江编 0 K D 2 16图 1审计挖掘分析模型
作者简介:景波 (95 )男, 17一,讲师,硕士主要研究方向:分布式计算技术、人工智能软件。刘莹( 97 )女, 17一,讲师,硕士,主要研究方向:分布式计算技术。文巨峰 (9 3 )男,师,士,要研究方向:工智能、件体系结构。 17一,讲博主人软
2 0 2 o .计算机工程与应用 1 0 62 5