当前位置:大学毕业论文> 论文范文>材料浏览

关于审计论文范文写作 审计全覆盖中大数据技术应用相关论文写作资料

主题:审计论文写作 时间:2024-03-26

审计全覆盖中大数据技术应用,本论文为您写审计毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

审计论文参考文献:

审计论文参考文献 现造技术论文农村新技术杂志电脑知识和技术杂志全科医学杂志

此次研究将理论与实务有效融合,以医保审计为例,在其间应用Hadoop、云计算等技术,对以往软硬件技术处理大量数量慢、错误率高等问题予以解决,大幅提升了审计质量及效率.并且,还通过运用跨行业数据关联、聚类等大数据挖掘技术,对审计组开展工作提供帮助,有效改进了工作效率,不但给审计全覆盖给予了技术支撑,也为日后大数据审计的实施给予了新思路.

伴同我国社会经济的迅猛发展以及改革的持续深化,便需对公共、国有资产与国有资源等落实经济责任的状况实施审计全覆盖.但实际上,实施审计全覆盖具有较大困难,其所应对的最大问题即需针对各大行业海量数据信息、图片等加以处理,如此便对当前的审计技术运用、数据收集等带来了较大抨击.在此形势下,经由应用大数据技术便可将上述问题有效处理,其不但与大数据时*展需求相符,也属于执行党*、国务院有关强化审计监督的关键.基于此,针对审计实务里面大数据技术的应用予以研讨具备显著的学术及运用价值.此次研究把计算机、审计学等相应理论和审计实务有效衔接,将大数据技术引进到医保审计中,显著改善了审计质量与效率,给大数据时代下审计工作的实施给予了新路径.

一、创设医保审计大数据体系

当前,医保大数据审计需解决的最大难题即数据量巨大.为处理以往设备和方式收集难度大、资源损耗严重、数据处理分析效率不高等问题,此次研究应用Hadoop框架,构建形成了医保审计大数据体系.

借助Hadoop集群技术以增强数据处理水平.依照审计署要求与医保审计实际需求,此次研究对湖南省人社、卫计、民政与公积金四大部门设计了23张标准表,对医保、新农合等部门数据加以采集,合计7TB.如此庞大的数据量借助以往的审计方式难以实施,加之医保审计时间紧张、收集整理与分析任务繁重,故强化数据处理能力便成为了建设基础设施层的关键.

Hadoop属于以Java为基础构建形成的开源软件框架,主要是位于较多计算机构成的集群里面针对庞大的数据信息加以存储、实施分布式计算.其意义在于由单一的服务器扩张至数千台机器,所有单台机均能够实施本地计算与存储.该框架的优势即成本投入不高,用户不受限制,不但可对大规模数据予以处理,还可以对程序员工作进行精简,达成计算调度管理、负载均衡等目的.同時,该框架的主要设计即分布式文件系统( HDFS)与计算框架( MapReduce),前者主要适用到存储大量数据的计算中.

在医保审计里面先施行模拟压力测试,经由当前数据加以复制、更改,模拟当地预期数据量,对服务器数据承载和计算压力予以测试,依照结果借助Hadoop集群技术创设服务器集群,以处理海量数据分析效率不高的问题.结果表明,把5台容量为512G的服务器经由Hadoop集群技术整合为1台服务器,其处理数据的能力较之单台服务器要上涨5倍.

借助分布式文件系统以强化数据容错能力.针对湖南省医保数据收集期间,由于各区域应用系统众多且匮乏统一性,故依照分级采集市州汇总原则开展工作.抽取汇总上报数据统一创设数据库期间,假设选择以往关系数据库的文件存储方法,则一旦某一数据错误,那么便应编写语句针对整个数据库实施错误数据删除,不但耗时且操作繁琐.故而,为对数据容错能力较差的情况予以处理,此次研究将选择分布式文件系统(HDFS)为底层结构.其主要用于大量数据的分布式存储,能把较多计算机借助通信网络整合,在统一管理系统的控制下,协同达成大规模数据处理任务.并且,其在文件存储写入期间,把文件划分为文件块,分散存储于所有子节点主机中,但文件基础信息依旧存储于主节点,其优势即易拓展、容错性好、经济适用性高.通过HDFS把百余个区域的数据依照行政区域代码自主分布存储于4台子节点服务器中,且基于此产生若干副本,假设其间某一数据发生错误,则其他副本经由便捷操作能及时恢复.

借助达梦数据库与Hive数据仓库处理工具以改善数据采集加载效率.对大量医保数据抽取加载期间,为处理以往的关系数据库仅能将数据存储于服务器本地的文件系统、无法应用HDFS处理大量数据与审计工作者习惯选择SOL分析数据等问题,此次研究尝试选择Hive集成国产达梦软件创设数据仓库.

Hive是以Hadoop为基础构建形成的数据仓库处理工具,在数据提取加载(ETL)方面极为便捷,是一项能够存储、查询与分析存储于Hadoop分布式文件系统里面的大数据机制.尽管较之关系数据库而言,其具有扩张自身存储性能的作用,以及较好的计算能力,然而在面向大量数据运用时,数据挖掘、实效性不足,故此次研究应用国产关系数据库达梦软件集成应用.

Hive达成了医保数据的迅速分布式存储,然而其间如果存储表、字段名等元数据信息需持续更新、变动,因分布式文件系统里面的数据以多读少改为主,故无法把元数据存储到Hive里面.因而,为缩减检索期间执行语义检查的时间,且确保数据实时查询,便可通过国产达梦数据库对元数据予以存储,其语法和SOL相似,且导入各类型表格、数据等极为便捷.

借助MapReduce、分布式SQL引擎处理技术以改善数据分析效率.对审计数据分析期间,审计工作者往往需应对如下问题:其一,审计工作者编写的分析语句总需反复测试,依照结果多次修改SOL语句,但医保数据量庞大,位于全库中直接编写语句、测试时间较长;其二,分析任务繁重,但Hadoop体系会损耗较多资源,单次仅可执行1条查询语句.

为处理上述问题,此次研究借助MapReduce、分布式SQL引擎处理技术的同步应用并行计算对数据分析处理.其间,前者以HDFS为基础针对存储于分布式文件系统的数据实施分布式计算,该框架软件位于彼此协同的并行计算机中把大的祭祀环任务划分为若干小任务,经由一组计算机并行实施,提高计算效率;后者通过*查询、执行引擎、相应操作符对SQL语法提供支撑,数据分析迅速且具备实效性,数据处理位于内存中实施,且具有复杂查询等功能.

结论:大学硕士与本科审计毕业论文开题报告范文和相关优秀学术职称论文参考文献资料下载,关于免费教你怎么写北京审计公司方面论文范文。

大数据为核心预算执行审计全覆盖
摘要:随着网络信息时代的发展和計算机技术的进步,以大数据为核心的预算执行审计全覆盖在当前的发展形式中具有较大的优势,提高了对数据的快速处理能力水。

借力审计大数据推动实现政府审计全覆盖问题探微
摘 要:本文概述政府审计全覆盖的内在要求及落实困境,探讨审计大数据的优势,籍此分析其相对于政府审计全覆盖的可借力要点,进而探索借助审计大数据推动。

如何运用大数据助推审计全覆盖
摘 要:运用大数据技术是实现审计“全覆盖”的必由之路,是能够充分发挥审计在国家治理中的作用的有力举措。文章就如何运用大数据助推审计“全覆盖”进行。

基层审计机关如何实现审计全覆盖
摘要:进入21世纪以来,随着我国经济水平的提高、法制环境的完善,以及政府职能的转变,国家、民众以及网络监督都对审计工作提出了更高的要求。我国的审。

论文大全