扬起大数据风帆 走好信息化之路——湖北省审计厅探索大数据审计纪实
继物联网、云计算之后,大数据已经成为当前信息技术产业最受关注的概念之一。大数据,是信息技术不断发展和更多人群融入信息网络而产生的大量而又庞杂的数据总和。这些看似无序的数据中蕴含着许多商业和社会价值,而且已经被发掘并广泛应用于管理和商业活动。
大数据的应用已引起世界范围的广泛重视。在我国,各个行业领域也正积极探索对大数据的分析和利用。如公安部门通过对海量行车数据进行挖掘分析,几秒内即可完成行车轨迹分析与预测,从而发现套牌车等违规问题;医疗卫生机构通过分析医院数据,判断流行病发展趋势等;平安保险借助大数据加强消费者洞察,从过去的客户分群进化到从人定制。
审计署对数字化审计和大数据审计高度重视。刘家义审计长指出,“中国审计的出路关键在于信息化,信息化的关键在于数字化”,并强调,积极探索创新、大力推进大数据环境下的审计监督。在2014年12月召开的全国审计工作会议上,刘家义审计长再次就大数据应用提出“数据归集要全、数据分析要深、技术应用要新”的要求。近几年,审计署专门发布了国家审计数据中心系统规划以及审计数据综合利用指南。
在这种大背景下,湖北省审计厅坚持顺势前行,以手段创新为动力,以系统和平台建设为重点,以省市县三级网络为载体,尝试运用大数据分析技术,积极探索大数据环境下的审计监督路子。追踪他们走过的足迹,探索深化大数据环境下的审计之道,相信会对大数据审计实践有所启示。
夯实基础:为大数据审计做准备
大数据环境下的审计,是一项全新的课题。湖北省审计厅党组清醒地认识到,在信息化飞速发展的当今,谁不懂得应用信息技术,谁就会拖审计发展的后腿。早在2009年,厅党组就明确提出要以信息化建设为抓手,发挥后发优势,全力打造数字化审计指挥体系。
大数据概念是一个宽泛的结合体,不仅包括大数据本身,更重要的是要有对大数据进行分析的平台和技术。审计信息化的关键是数字化,而数字化的基础是审计及关联数据的大整合,数字化的核心是大数据的综合利用。依据这一考虑,厅党组在2012年便确立了“平台是基础、数据是核心、分析是关键、人才是保障”的数字化审计发展思路,从这一年开始完善平台、积累数据、制定标准、培训队伍,湖北省审计厅为大数据审计积极准备。
——系统准备,打造大数据审计平台
“工欲善其事,必先利其器”。湖北审计系统的信息化建设近几年发展非常快,该厅紧扣大数据审计需求,充分利用金审工程一期、二期的建设成果,以数据融合为目标,构建“一大网络、三大中心、六大系统”为主体的数字化审计平台。
一大网络:该厅借助电子政务外网,搭建了纵横交织的大网络。纵向上,实现了署、省、市、县审计机关四级网络互联;横向上,实现了与省委、省政府及相关部门的网络互联。利用这套网络,为上下级审计机关及与财政、地税、社保等重点单位数据互通和共享奠定了基础。
三大中心:为了解决数据传送、使用及安全问题,该厅建设了审计交换中心、审计数据中心和审计数据备份中心。建设的审计交换中心,通过安装防火墙、隔离网闸、安全认证等设备,借助互联网,审计人员在审计现场可以向审计机关安全传递和访问数据,为大数据应用打通了传输通道;建设的审计数据中心,将从不同渠道、不同方式、不同系统收集的各类相关数据,按行业、按单位、按年度以目录方式分门别类存放,既方便全面了解现有哪些数据,又方便审计人员统一下载授权使用的数据;建设的审计数据备份中心,可以集中备份全省审计管理数据及重要业务数据,免去了数据存放安全之忧。
六大系统:这六大系统为审计管理系统(以下简称OA)、现场审计实施系统(以下简称AO)、联网审计分析系统、审计结果分析系统、网上审理软件、权力运行风险电子监控系统。
该厅分管审计信息化的副厅长刘彩霞介绍,这六大系统是湖北省审计厅数字化审计工作平台的主体,其中每个系统都在数字化审计中担当着重要角色,各系统有机结合、互融互通,贯穿于审计的全过程。系统的开发和部署,既贯彻落实了审计署的要求,又结合了湖北审计信息化发展的实际,其中很多方面都是首创。如审计结果分析系统,对所有审计报告等结果类文书中的内容进行综合分析,挖掘审计结果价值,服务领导决策;网上审理软件,将现场资料审理环节前置,在审计现场阶段,审计人员就利用交换中心把审计工作底稿、审计证据、审计组报告等现场资料传回OA,审理人员对上传资料及时审理和反馈审理意见,并利用软件审计事项覆盖率自动统计功能,对审计项目的选择性审计、选择性报告的进行监督,实现审计报告与审计实施方案、审计工作底稿、审计证据的“3个匹配”,达到审计全过程的质量控制的目的;权力运行风险电子监控系统,对审计执法、审计管理、财务管理、人事管理和其他事务管理等5大领域的执法、廉政、效能3个方面进行全面监控,着重关注项目审计执行,从起草审计通知书开始到最后项目外勤经费报销,全过程纳入监控范围,严格规范审计行为,有效降低审计风险。
——数据准备,积累大数据审计之源
大数据审计最为核心的还是数据。没有数据源,就等于无米之炊。湖北省审计厅近几年坚持“数据先行”,按照数据广覆盖、连续性的原则,构建了被审计单位财务业务数据库、审计机关审计结果数据库、第三方信息数据库、互联网舆情数据库等四大类数据库。在该厅办公楼11楼,湖北省审计厅专门建立了“湖北审计数据中心”,据计算机审计中心的同志介绍,目前,数据中心已收集省直审计数据量8T,市县审计数据量3T。在数据准备方面,主要采取的是联网实时收集、审计中收集、定期上报等方式,对能收集到的数据要“横向到边、纵向到底”,确保应收全收。
在被审计单位财务业务数据库中,收集了全省口径财政、地税、省直所有部门全部一、二级预算单位数据库,包括2011-2014年所有省直预算单位的预算指标、国库集中支付业务、非税收入、总预算会计数据、财务核算数据;2010-2014全省地税征管数据;各市、县审计机关按照省厅要求收集的本级财政和预算单位所有业务、财务数据,实现了从省到县的“横向到边、纵向到底”的部门预算审计数据。同时收集了社保基金、公积金、低保资金、保障房建设等近5年来的相关数据。在审计结果数据库中,该厅通过审计结果分析系统,将全省近5年审计项目的审计通知书、审计报告、审计决定等非结构化文档转化为结构化数据;通过开展网上审理将现场审计工作底稿、审计证据等资料及时收集整理,充实到了基础数据库。在第三方信息数据库中,目前该厅已收集公安与审计相关的公共信息,包括车辆信息、死亡人口信息;房管部门的房产信息;工商部门的注册公司信息;人社厅的社保信息等数据。在互联网舆情数据库中,针对互联网数据都是以半结构化和非结构化形式存在、数据多、更新快的特点,从中国经济信息网、统计局等网站收集与审计相关的大量数据。
——制度准备,引导大数据审计方向
思路决定出路,制度影响方向。湖北省审计厅党组在推进数字化审计和大数据审计中,注重顶层设计,从制度建设入手,全面规划和规范信息化建设及大数据审计工作。他们着眼于建设完善审计指挥管理体系,建立了以责任为核心的目标管理机制,把审计指挥管理体系建设工作纳入年度工作目标,与业务工作一起研究、一起部署、一起考核。要求从审计立项开始,就把审计项目纳入数字化指挥管理体系管理,在信息化环境下运作。同时,将审计指挥管理体系建设工作作为一个整体在全省进行统筹部署,制定中长期发展规划,不定期提出工作指导意见,确保全省上下工作目标一致、步调一致。
为更好地指导和规范审计人员数字化审计操作,该厅制定发布了《部门预算执行数字化审计操作指南》、《财政联网审计数字化审计操作指南》、《医院收费系统审计操作指南》等3个操作指南。《操作指南》按数据采集、数据整理、数据分析的目录结构,规范了数据采集内容、数据整理方式、数据分析模型,对每一个要点、每一个步骤、每一个细节,都有明确的操作要求,使每一个审计人员都明确大数据审计应用的工作流程。
该厅财政审计处处长张文慧介绍说,《部门预算执行数字化审计操作指南》和《财政联网审计数字化审计操作指南》的制定,是湖北省审计厅在认真总结近年财政数字化审计经验基础上探索形成的,目的就是要指导和规范财政大数据审计工作,在指南介绍的每一个操作要点中,都有实例演示,配图详细说明,力求做到形象生动,便于理解和操作,以达到精细化的要求。
记者发现,为了确保收集数据标准一致,在《部门预算执行数字化审计操作指南》中,列出预算指标数据至少应采集单位编码、预算单位名称、资金性质、指标文号、支出功能分类名称等21个字段,支付数据至少应采集单位编码、预算单位名称、预算项目、支付金额、收款人、支付方式等33个字段,对这些,都详细说明了数据校正及收集方式和步骤。
审计人员说,拿到这些《操作指南》,再对相关单位审计的时候,面对复杂系统和海量数据,也不再是无从下手或者盲人摸象了。在《操作指南》的指引下,根据预置的分析模型完成“规定动作”,迅速查出和落实这些共性问题,将节约出来的更多时间,根据整理好的基础数据“自由发挥”,查出更多个性化的问题。
——智力准备,提升大数据审计应用能力
大数据审计,关键在人。系统有了、数据有了,接下来的关键就是如何建设一支大数据审计队伍。这对于湖北省审计厅来说,也是最大的难题。据该厅副巡视员、计算机审计中心负责人余念祖介绍,湖北审计系统计算机审计人才在全国来说没有优势,截止2011年底,全省通过审计署中级考试的人员仅26人,处于落后位置。
厅党组清醒地认识到,在这种状况下,要全面推进大数据审计,谈何容易,唯有在计算机人才培养上一搏。
在厅党组的高度重视下,2012年,号称“魔鬼”式计算机中级审计培训在湖北审计系统全面展开。2012年至2014年三年的时间里,省厅举办计算机审计中级培训班9期,培训人数近800人次。截止目前,全省共有350人获得审计署计算机审计中级证书,其中省厅共通过43人,占全厅人数的近四分之一,培养了一批能在现场组织计算机审计的骨干力量。通过审计署中级考试人数由全国靠后一跃全国前列。不仅于此,该厅在通过中级考试的人员中组织开展了一期中级后续培训班,促使现有中级人员从技术型人才向专家型研究人才转变,为打造一支高素质研究型团队打下扎实的基础。在审计署组织开展的高级数据分析师培训中,已有2人通过考试并拿到了高级数据分析师证书。
今年元旦刚过,该厅在全省范围内开展了大数据理念和业务应用培训,其中:在厅机关举办两期地县级审计局长培训班,厅党组成员、副厅长刘彩霞作了“面对大数据我们的准备”的专题辅导报告,全面分析了大数据审计发展形势,回顾总结了全省大数据审计的成果,分析了大数据审计面临的问题,提出了大数据审计应对措施。邀请相关处室就大数据分析在财政、投资、经责等中的应用做了概念解读,让大数据审计的概念植入各级领导干部的脑中;紧接着,又举办了一期全省业务人员视频培训班,以审计业务人员的角度,详细介绍了数据采集、清洗、整理、分析等步骤,让审计业务人员从细节上把握如何开展大数据审计,拓展审计思维、用好现有系统和数据。通过这次培训,全省审计人员对大数据审计统一了思想、明确了方向,以积极心态应对大数据时代对审计工作提出的新要求。
有了人员保障,开展大数据审计则有了底气,对全省审计机关的业务指导也更加顺畅。目前,湖北审计系统形成了浓厚的大数据审计氛围,在具体审计项目实施中,主动运用大数据思维开展审计监督。该厅现面向全省审计系统广泛征集数据关联比对分析案例,通过已收集的180多个分析案例来看,涵盖了业务数据与财务数据、业务数据之间、跨行业跨领域数据之间横向关联比对分析,以及不同年份之间的纵向关联比对分析。这些案例既扩展了审计人员的思路,也是大数据技术在审计工作中运用的智慧结晶。
摸着石头过河:大数据审计进行时
石爱中副审计长说:“数据是审计资源,使用过的数据同样也是审计资源。数据积累形成大数据,其价值取之不尽,用之不竭。”在湖北省审计厅,尽管在数据收集、数据应用方面还面临不少困难,但克服眼前的困难,开拓创新,积极推进大数据审计是他们不变的追求。他们摸着石头过河,在探索中前行。
——打开数据收集之门,全方位管理数据
数据资源是开展大数据审计的基础。要发展大数据审计“生产力”,提高审计效能和产出,数据信息资源是不可或缺的前提和条件。
该厅副厅长蔡伟认为,数据就是资源,资源就是效益。数据能够借助于各种各样的工具在分析的基础上提供正确的决策,从这个角度上来说它就是资源。他说,就实施的具体审计项目来讲,审计项目背后往往对各方面的数据存在着千丝万缕的联系,将这些看似不相关的数据整合到一块,进行对比,往往得到的效果可能就是事半功倍。没有数据的积累就上大数据审计。对此,该厅除了在数据准备中说到的推进数据收集外,在每一个审计项目实施过程中,广开数据收集之门,首要抓数据采集,把数据收集列为项目审计的第一个环节。记者实地采访了该厅机关财政审计处处长张文慧,他说,这几年,为了搞好财政数字化审计,他们在数据归集上想尽了办法。从去年开始,连续两年向所有省直预算单位发了数据收集的通知,对数据收集提出明确要求。除了采取通知方式收集数据外,该厅还利用联网系统,收集全省地税征管、省本级以及部署了联网系统的13个市州和37个县的区县财政相关数据。去年,该厅在社保资金审计中,通过发函的方式收集公安与审计相关的公共信息,包括车辆信息、死亡人口信息;采取上门采集的方式收集房管部门的房产信息;工商部门的公司注册信息以及人社厅的社保信息等数据。
收集数据不是目的,而是要能使用这些数据。要实现这一目标,必须解决数据一致性问题。该厅财政审计处的一位干部说,在实际工作中,往往存在各单位对同一个项目在国库支付系统的名称与财务核算系统中记账的名称不是一一对应的情况,人为地给数据关联制造了障碍。如在国库集中支付系统中预算项目名称是“局域网建设”,而在财务核算系统中记账却是“网络改造”,导致申请的指标与实际支付系统不能自动对应,由于两个系统之间数据不是互通的,财政部门对这方面也没有硬性规定,单位会计做账时可能就不会将每一笔项目支出与国库预算项目名称对应上,审计人员在做项目剖析时需要大量翻阅纸质凭证。为了有效解决这类问题,该厅一方面要求被审计单位规范记账,另一方面,按照数据一致性要求,对数据进行整理,确保数据可用。
解决数据转换也是摆在计算机审计人员面前的重要问题之一,也就是如何将数据变得可识别。在实际工作中利用AO2011采集数据,常常遇到很多财务软件在AO中没有采集模板。为此,该厅通过了解分析被审计单位财务软件数据库类型、结构、数据字典,利用AO将采集转换保存为模板功能,制作采集模板,固化采集转换方法,为数据采集提供保障。如某政府投资公司审计使用的是航天信息公司开发的企业财务管理软件A3,数据库后台为SQL Server2000,经过拷贝数据、抽取人员、集中时间,逐表查看分析内容、结构,找到关键表:科目表、科目余额表、凭证主表、凭证明细表,并弄清四张表中科目代码、科目名称、余额、借贷方向等关键字段及逻辑联系。运用AO“财务软件数据库数据”采集功能,根据事先了解的情况,按照提示步骤,将数据采集转换到AO中,并将采集转换过程保存为模板,以备以后长期使用。近两年,运用同样的方法,先后将工作中遇到的“远光财务3.0”、“天旺财务1.0”、“金算盘6”等10多个财务管理软件制作为AO转换模板。
多次参加财政资金审计的老河口一位审计人员说,收集数据并非需要全部采集数据,在这一过程中,还需要解决好数据筛选的问题,有时,根据审计目的不同,在数据收集时提取关键字段能简化数据分析过程。如在2013年某单位部门预算审计中,获取该单位年度全市各自然村某项村民补贴数据234张表35000多条记录,涉及资金950多万元。审计人员经过对234张表分类整理、叠加,构建该单位整体性的年度业务管理电子数据。对于手工的信息,采取最简录入法,即将资料中最主要的要素以最少的行数录入Excel中,构建电子信息。又如在开展的农村“一折通”审计调查过程中,为了取得农户承包面积电子数据,根据事先分析的结果,对抽查的重点村组,将农村经济管理部门的土地二轮承包档案调用,分户以户主、面积、土地性质三个字段简单录入,用于享受补贴面积与承包面积的数据对比分析,查找疑点。
——探索联网监督预警方式,从部分审计向全覆盖审计过渡
党的十八届四中全会决定明确要求,审计要对公共资金、国有资产、国有资源和领导干部履行经济责任情况实行审计全覆盖。刘家义审计长也多次强调,全覆盖要有深度、有重点、有步骤、有成效,这对于每个审计机关来说,都是需要认真研究探索的课题。当前,整个社会上数据量每三年就会翻一倍,数据规模呈指数增长,数据量的计量单位从TB、PB、EB到ZB。据资料载,到2013年,世界上存储的数据达到1.2ZB,具体到审计中,审计对象的财务数据随着经济的快速发展也呈几何式的增长,被审计单位数据、关联数据、第三方数据已成海量,这无疑加重了审计的工作量,给审计全覆盖提出了难题,一方面,审计力量不够,很难做到全覆盖;而另一方面,经济的健康发展需要审计的保驾护航。面对这一形势,审计怎么办?
湖北省审计厅的回答是,向科技要力量,向网络要效率,该厅运用新型的组织方式开展财政部门预算执行审计,选择在武汉市和恩恩恩施州进行联网审计试点,积极探索尝试审计全覆盖新方法。
一方面,积极探索省本级财政预算执行审计全覆盖的路子,全面收集和分析所有省直预算单位指标、国库集中支付数据以及所有120家一级预算单位和700多家二级预算单位财务数据,实现财政资金分析的全覆盖,在预算执行审计报告中,能全面反映省直部门预算执行的总体情况。同时,创新审计组织方式,探索集中审计、重点核查的方法。项目全面开展前,集中业务处骨干、计算机审计中心人员根据审计重点进行总体分析,筛选疑点后,改变以往发放审计通知书的做法,下发审计调查通知书,成立若干审计调查小组到相关单位核查落实。按照这种方式开展部门预算执行审计,由原来1年只能审计10多个单位,到去年审计40个单位,今年拟审计50个单位,力争实现2年所有省直预算单位审计全覆盖。
另一方面,在武汉市和恩施州开展联网审计试点。2012年开始,湖北省武汉市审计局针对海量税收不断膨胀而且高度集中的情况,探索构建了“以智能化为目标、三网融合为通道、联网审计系统为平台、数据模块为核心、流程规范为保障”的地税联网模块审计新模式。2014年,在武汉市开展的地方税务局税收征管审计中,设计制作了9张结构化原始数据表,收集约15400万条原始数据记录,同时使用的税收会计统计报表及财务报表约494张,重点核查的图片资料和网页信息近千条,审计查出少征漏征税款、调节税收、税款存放企业账户、未按期申报税款、未按期缴纳税款等税收征管方面存在的问题,实现了对全市税收征管审计的全覆盖。
恩施州以政府为主导,在湖北省审计厅的支持下,恩施州审计局全面部署和建成了州县“纵横交叉”的两级联网审计大格局,在州本级和所属的8个县(市)审计局统一部署了集采集预警、AO控制及AO联机作业一体的《湖北省区县财政联网审计系统》,通过安放前置服务器的备联方式,定期采集数据。根据统一规划的采集模板对数据进行标准化整理,从而使全州的财政审计数据结构统一、标准统一、审计分析方法共享并统一,有效实现了数据采集、清理、转换一体化,打造了具有恩施特色的财政审计核心工作平台。通过在《联网审计系统》中设置预算指标管理系统、国库集中支付系统、总预算会计账务系统、部门预算指标管理系统、非税收入业务和财务系统、会计核算中心账务系统、国资管理系统以及大额资金调度、单位资金划转、发放津补贴、资金运行同期比较等30余项技术监测分析指标,实现电脑联网自动监督财政资金的使用情况和所有预算单位的财务实施情况。同时该州审计局在授权的情况下还能查看县级财政部门的电子数据,安排和指导县级审计机关做好有关资金和项目的监控工作。审计监督对象实现由“局部”向“全面”、“本级”向“多级”转变,实现了横向覆盖所有同级预算部门,纵向覆盖州、县、乡三级的审计监督网络。目前,全州所有财政性资金和1548个预算单位、8个县市、88个乡镇(街道办事处)财政资金实现了“全覆盖”监控,年实时监督资金流量达207.52亿元。在人员力量未发生明显改变的情况下,全州审计机关2014年完成审计项目503个,比2013年增加1.9倍,是2010年联网前的2.5倍。日常监控由2009年的重点抽查监督212个部门变为2014年网上实时监控1548个部门。
截止到目前,湖北省共有13个市州、37个县(市、区)建设了财政联网审计系统,2个市州建设了社保联网审计系统。各部署单位充分利用联网审计系统数据采集及时、处理能力较强的特点,运用在线审计、动态监测功能,扩大审计覆盖面。
——在“深”字上下功夫,全面做好数据关联分析
大数据审计,最显著的特征就是对数据的关联分析,依托大数据分析平台,开展业务数据与财务数据,单位数据与行业数据以及跨行业、跨领域数据的综合比对分析,实现审计从单点审计向多点审计过渡,从离散审计向连续性过渡,从局部审计向整体审计过渡。
过去,一提到审计,大家往往会想到堆积如山的账册、埋头笔录的审计干部和远在异地沟通不畅的审计组。而现在,在湖北省审计厅,这一现象已经不见。传统的审计实施方式在发生变化,这最大的变化就是在审计实施中增加了一个重要的环节,就是对大数据的集中分析。通过集中分析,全面弄清基本情况,锁定审计疑点,为科学制定审计实施方案打下坚实基础。
拿保障房审计为例,原则上符合弱势群体对象就应该得到照顾。但同时也该思考,受益人是否真的是困难对象?低保证是否真的属实?这一切只有通过大数据交叉聚合、系统分析,才能确认受益人的收入、社保、缴税、生存情况,进而得出是否为违规享受保障房。
在2014年保障房审计中,该厅在“深”字上做文章,注重对外围相关数据比对分析。保障房分配数据分别与从工商局获取的公司注册数据、地税局获取的个税缴纳数据、公安厅获取的死亡人口数据和车辆数据、人社厅获取的养老保险数据、房产管理局的房产信息等做关联对比,以“身份证号”为关联字段,为审计提供了重要的线索,查出了一批有房、有车、有公司或高收入等不符合保障条件而违规享受住房保障待遇的家庭和个人。在这次审计中,全省审计机关通过比对分析锁定一人享受多套保障房以及低保人员、有车人员、死亡人员享受保障房等疑点问题2722条,依据线索跟踪审计共查处各类违纪违规问题金额12.12亿元,向各级纪检检察部门移送各类案件线索11起,移送涉案人员58人,涉案金额97.25万元。
2014年,湖北对30个市县低保和医疗救助开展了审计,为了避免用“死”方案去应对“活”情况,全省上下采取综合分析、数据比对、实地调查三种方式方法,并从事先确定的十一个重点方面逐一调查核实。为寻求审计工作突破口,针对低保和医疗救助涉及部门多、政策标准不统一、核实工作难度大、纵横交错等实际情况,去年从采集数据、录入整理、比对分析三个关键环节入手,全面开展低保和医疗救助审计工作。计算机审计中心采用大数据审计思维方式,利用第三方数据集中关联分析、整合分析、模块筛查,分区形成疑点待核表,发现了57114条疑点问题。各审计组人员通过对下发的疑点问题进一步延伸审计核实,查实了问题,找出了原因,并就改进和完善低保和医疗救助资金管理工作提出了一些合理化的意见和建议,成效十分明显。去年此项目共提出有针对性审计建议25条,共向各级纪检监察等部门移送案件线索27起,涉案56人,其中省厅直接向纪检监察机关及主管部门移送各类案件线索9起,移送涉案人员19人,涉案金额353.34万元。
同样,在财政预算执行审计中,该厅制作了查询、多维和专题等分析模型近200个,根据对省直部门预算执行总体情况中反映的问题和审计目标,对省直部门中重点部门的指标结余结转、历年指标结余、账户转款、实际支出结构和核算进行重点分析,建立预算指标差异分析表、历年预算指标结余分析表、国库支付转款分析表、“三公”规模分析表、部门经济科目结构分析表等审计中间表。通过这些审计中间表,最终查出28个单位的83个预算项目近3年资金结余未用;将财政资金转移到本单位实拨资金账户或所属单位账户类疑点3235条等问题和疑点。一位老审计人说道,采取总体分析、发现疑点、分散核查、精确定位的方式开展财政预算执行审计工作,真是快、准、狠!
——抓好疑点核查,实现“精准打击”
通过大数据分析快速锁定疑点,审计人员到审计现场只需拿着疑点查实查透,既节约了时间,又提升了效果。审计人员戏称,我们是“手中有粮、心里不慌”,用大数据分析这个精确制导的武器,来实现“精准打击”。
在对某医院收费数据进行分析时,审计人员将所有收费项目分类汇总后,结果中存在无法细化单位的收费项目,出现了小数的收费数量,如单价为1千元的眼科项目光动力疗法,出现收取0.54次的费用。审计人员最初预测可能是存在折扣,而形成小数计量,但经过对收费系统分析发现,系统中有专门的折扣字段,于是可以确认该系统在录入数量时没有做只允许输入整数的控制,存在漏洞。审计人员又进一步思考,这个漏洞很容易弥补,只需修改一个参数就可以了,而为什么医院未将这个漏洞及时修补,是否会利用这个漏洞进行违规操作呢。带着这个疑问,审计人员对眼科收费项目进行了重点分析,又进一步在药品和医疗耗材出入库数据与财务收入进行抽样对比的时候发现,出入库数据中没有眼镜的出入库记录,而财务数据中却有销售眼镜的收入,最终核实医院利用开光动力疗法诊疗收费项目来高价卖眼镜给公费医疗人员的问题,筛出这种情况的记录共计8948条。按照此思路延伸,最后查实大部分单位不可再分诊疗项目及材料进行小数计量的收费记录均为串项目收费。
在保障房审计中,审计人员不必到管理部门漫无目的地一项项查看登记情况,而是拿着筛选出的问题记录去查深查透。据参加保障房审计的同志说,审计进点后,每个审计组都有了疑点问题线索清单,在审计中,审计人员的主要任务是调查核实。如在宣恩县的审计中,分析比对发现疑点问题线索560条,审计人员按20%的比例进行抽查,而另外80%的问题线索,则要求相关部门和人员提供相关证据材料消号。使用“杠杆原理”,这样也大大节约了审计人员的时间。
在大数据环境下,审计的组织方式在发生变化。目前,凡是可以利用大数据开展的审计项目,在时间安排上,数据分析要占到三分之一的时间,在组织方式上,采取的是集中审计、分散核查。湖北省审计厅在部门预算执行审计中,首先组织一支分析团队,花将近一半的时间做数据集中分析工作。磨刀不误砍柴工,分析团队按照审计重点,生成各预算单位的“部门预算执行差异分析表”、“预算指标支付进度均衡分析表”、“虚拨支出向本部门实拨资金账户转款情况表”等审计基础表和疑点表,分发给每个审计组,审计组以审计调查的方式到现场核实,大概1周左右的时间即可完成一个单位疑点核查工作。
——利用大数据分析平台,提升审计成果附加值
加强审计综合分析,是提升审计成果层次重要途径。在以往的审计综合分析中,往往是根据分析需要,依据审计报告和专报内容,手工制定分析表格,开展综合分析,不仅费时,还缺乏科学性。而现在,通过该厅建立的审计数据中心,可以从不同角度分析利用审计结果。
该厅综合处处长高军说,在大数据环境下,审计要更好地为领导决策服务,需要运用大数据思维,充分利用好审计报告、审计专报等这些结果类文书中的数据。
为实现这一目标,湖北省审计厅研究开发了审计结果分析系统。在系统开发中,着力解决两个难点:一是如何将非结构化的文本数据进行结构处理,二是如何将审计问题准确归类统计。利用信息抽取、文本分类等技术,将审计报告、审计决定、审计通知书等非结构化文档转换为结构化标准表,再以审计项目为主线进行集成,建立了审计结果标准数据库,在此基础上展开各种数据分析。
系统已从OA中收集了近5年千余份审计文书,提取了大量被审计单位、审计金额、审计问题等基础数据,通过建立分析模型,可以快速得到很多原来需经过多方面收集,并大量时间汇总才能得到的结果。
目前,厅机关在草拟审计计划时,依托审计结果分析系统,能准确、快速了解每个年度审计总体情况,点击按钮,系统马上自动统计每年审计了多少单位、多少单位连续审计了3年、哪些单位有3年没有审计了。这样,按照全覆盖的要求,哪些单位和部门该列入年度审计范围一目了然,直接为编制年度项目计划提供了依据。
在综合审计成果运用方面,比以往更加快捷。如要对审计发现问题总体分析,系统从审计报告所反映的基本情况中抽取被审计资金的总额,并在分析模型中自动计算出“问题资金占比=问题资金总额/被审计资金总额”,通过图表的方式直观地反映出被审计单位的问题严重程度,并可以通过按问题资金占比排序来横向比较各个被审计单位的审计情况。
利用审计结果分析系统,还能解决过去靠手工方式难以解决的问题。如要了解经济责任审计情况,系统则首先通过一张汇总表一目了然地反映从2010年到现在的主要工作情况,包括被审计的领导人数(分为地方领导、部门领导、省属高校领导和企业领导4类)、审计覆盖面增长率的折线图展示、三大类审计问题资金(违纪违规、损失浪费、管理不规范)的汇总金额等,还可以分别查看4类领导的详细审计情况,包括审计的具体是哪些单位、哪些领导、什么职务、任职时期,以及这些单位的基本情况等。
如要详细了解某个专项资金审计情况分析,如2014年扶贫资金专项审计中,根据厅领导要求实现有针对性的精准分析,对上一次扶贫资金专项审计中所发现的问题进行分类汇总,重点审计各个县市是否仍然存在相同的问题。那么在结果分析系统中,按照审计人员所关心的问题类型,先建立个性化的问题分类体系,第一层是资金性质分类,包括扶贫项目、扶贫搬迁等,第二层是问题性质分类,包括挤占挪用等,然后对上一次扶贫资金专项审计中所有审计报告的审计问题进行了标注。在此基础上,扶贫资金分析模型自动按分类体系汇总相关数据,向领导展示了多种不同视角的分析结果,而且分析结果非常准确、操作过程非常便捷。
审计结果分析系统的开发人员告诉记者,目前从格式千差万别的审计报告中获取准确的问题金额实际上是非常困难的,但大数据的分析应用,始终离不开高新技术的支撑,始终在技术创新上求突破,在建立模型时也采取了智能化的处理,例如用一种树搜索算法来避免重复统计,虽然不可能做到最后的统计数据百分之百准确,但经验证明已经具有了很高的准确率,能够真实地反映问题的量级。
大展宏图:大数据审计永远在路上
当今,大数据、云计算、物联网、社交网站,是信息化发展的四大趋势,新技术、新方式层出不穷,变化速度惊人。
面对日新月异的信息化发展,湖北省审计厅下一步将有什么打算,记者采访了厅党组书记、厅长张永祥。张永祥厅长说,湖北省审计厅在探索大数据审计中虽然作了一些探索,也取得了一些成效,但与新形势要求、与做得较好的兄弟单位相比,仍有很多差距和不足。大数据审计既是审计工作的现实需要,也是审计工作发展的方向,可以说,大数据审计永远在路上。
张永祥厅长向记者列举了推进大数据审计中遇到的一些困难。他说,目前该厅所做的工作,主要还是硬件方面的多,而在应用方面显得不够。究其原因,主要是“三难”,即数据采集难、数据管理难、有效运用数据更难。虽然在最近,国务院《关于加强审计工作意见》中也明确规定,各部门各单位要依法向审计部门提供电子数据,但由于技术、制度等方面的原因,数据归集仍然存在困难;数据管理难,主要是标准化、规范化问题难以解决,制约了数据的有效运用;再就是有效运用好数据难的问题,主要表现在计算机审计人才还相对匮乏,存在审计业务人员和计算机技术人员“两张皮”的现象,分析技术和能力难以跟上。诸如这些问题,都在一定程度上阻碍和制约了大数据审计的发展。
张永祥厅长说,厅党组对审计信息化建设和大数据审计高度重视,根据审计署提出“审计指挥一体化、审计数据一体化、审计业务一体化、审计模式一体化和审计保障一体化”的“五个一体化”目标,今年的全省审计工作会议提出,要在审计技术手段上实现新突破,强化审计指挥中心和省级审计数据中心建设运用,建立全方位的数据报送积累机制,推进各行业、各部门数据分类归集,探索利用云计算、数据挖掘等技术开展数据融合分析,全面加强大数据审计团队建设,切实提高运用数据、分析数据的能力。
——完善数字化审计指挥系统建设
根据金审工程三期规划,湖北省审计厅已启动数字化审计指挥系统建设。通过指挥管理系统的数字化审计平台,全面拓展数据式审计模式。
今年,该厅正在实施的全省OA数据大集中,完善审计指挥系统建设,其目的就是要实现数据集中展现、工作实时指挥调度以及审计决策支持。围绕这一目标,该厅在今年将开发数据展现功能。一是审计管理数据、审计业务数据、审计结果数据的多维分析处理,并对分析结果进行分类、统一呈现,解决审计指挥中心海量异构信息可视化问题,如对全省预算执行整体分析、全省社保资金情况分析等。二是支持信息地图展示,根据数据特点进行热力图、分段图等多样化展示,如全省项目分布情况热力图等。三是提供分析指标的自定义功能,可扩展、修改和删除指标分析模型,保证指挥系统展现平台能够随时根据政策变化进行调整,实时动态更新。
——加强大数据积累
如何让审计工作运用大数据这把“利剑”,大数据积累迫在眉睫。没有持续的数据,开展大数据审计只能沦为一纸空谈。数据不仅要归集,也要具有规模性、多样性、高速性、价值性。
计算机审计中心负责人介绍,该厅在数据收集中,拟借助电子政务网络,联网采集各行业数据。加强与省电子政务网的信息共享规划和计划制定,建立跨部门、跨层级的信息采集机制,以协同业务需求为导向,明确共享信息内容和程序,确定信息共享部门责任,制定信息共享制度,建立信息共享基础设施,保障共享信息安全,进一步完善行业数据库。
依托审计项目,逐步建立各行业审计数据库。根据《国务院关于加强审计工作的意见》关于“加大数据集中力度,构建国家审计数据系统的要求,该厅将逐步建立各行业审计数据库,审计数据库的建设原则是分级建立、分级管理。这样,收集数据的制度瓶颈没有了。以省以下统一管理为目标,完成全省各级财政预算执行审计数据库的建设工作。已部署财政联网审计系统的单位自动抽取,未部署的单位报送数据。未来还将按行业逐步实现全省数据积累,开展全省集中分析,进而推进审计工作提质增效。
完善采集数据规章制度。虽然数据中心中已获取大量数据,但是,只有省级财政数据和全省地税征管数据能够每年定期获取,其他数据都在当年审计项目中获取的,如果第二年不审计这些资金,数据就无法及时更新;市县的财政数据仅覆盖部署了联网审计系统的13个市(州)、37个县(市、区),未实施财政联网审计的就没有相关电子数据;另外,车辆管理、人口户籍管理、税务工商登记、组织机构代码登记等第三方信息数据,由于涉及所有企业和个人的隐私信息,相关政府部门在数据提供时会不配合,认为不在审计期间或者不是审计范围,即使提供了也会是处理后的数据而非原始数据。数据不能及时更新、不能全覆盖、内容不完整等问题的出现,归结起来主要是采集数据规章制度不明确造成的。不解决计算机审计以及大数据等信息技术应用相关的制度依据问题,大数据技术很难在国家审计领域中真正的开展应用。审计业务处室加强与经常性被审计单位的联系和协调,法规处加快研究未下达审计通知书时审计数据的报送制度,逐步建立起电子数据报送的长效机制,让静止、碎片化的数据动态、连续化,为大数据审计创建基础数据环境。
——建立分析团队
有效开展数据分析,关键是建立一支高素质的分析团队。从今年开始,一方面向内挖潜,整合全省审计系统计算机审计和审计传统队伍,组建跨行业综合数据分析团队。根据审计数据综合利用的发展需求,拟组建包括计算机数据分析人员和业务骨干在内的非专职的跨行业综合数据分析团队。加强对大数据环境下审计目标与思路的研究,更新审计理念与方法,提出有价值的分析需求,重新构建、优化大数据分析模型。
另一方面,借助高校力量。为加大对大数据技术的研究和开发力度,厅计算机审计中心与武汉大学计算机学院联合成立“湖北省公共财政和经济运行大数据工程技术研究中心”,并已通过省科技厅的评审与批准。该厅在确保数据保密的前提下,充分利用武汉大学计算机学院人才资源和理论研究方面的优势,深度合作,共同探索云计算、大数据等前沿技术在审计工作的实际应用,实现理论研究和实际应用齐头并进。
信息技术的广泛运用和大数据技术的深度发展,为审计实现审计监督全覆盖,促进国家治理现代化和国民经济健康发展提供了更为有利的条件。大数据已经在技术上开启了一个全新的世界,审计机关和审计人员必须主动求变,在思维与行动上体现出更新的认知,并高效地转化为成果。
在实践中探索,在探索中前行,乘着大数据技术发展的东风,湖北省审计厅以宏伟气势扬帆起航,在大数据审计时代踏上新的征程!(刘明亮 周刚 刘燕)