一是人工采集,二是智能采集(人工智能与大数据审计的概念（一）的定义)

　　一、人工智能与大数据审计的概念

　　（一）人工智能的概念。

　　人工智能是研究和开发用于模拟、扩展和扩展人类智能的理论、方法、技术和应用系统的技术科学。它是计算机科学的一个分支，包括机器人学、语言识别、图像识别、自然语言处理和专家系统等，使用人工智能的目标是使机器能够完成通常需要人类智能才能完成的复杂任务。

　　（二）大数据的概念。

　　什么是大数据？位于美国康涅狄格州的美国给出了这样的定义，大数据需要一种新的处理模式，具有更强的决策能力、洞察力和发现能力以及流程优化能力，以适应海量、高增长率和多样化的信息资产。. 麦肯锡全球研究院给出的定义是：在采集、存储、管理和分析方面大大超过传统数据库软件工具能力的*敏*感*词*数据采集。简单地说，大数据是一种信息资产，是一个庞大的数据集合。它具有四大特点：数据规模海量、数据流转速度快、数据类型多样、价值密度低。就审计工作而言，大数据是指采集、生成、或与被审计对象相关的开展审计工作。根据数据来源的不同，可以分为被审计单位的数据、审计本身形成的数据和土地、海关、*敏*感*词*等外部数据。

　　（三）大数据审计的定义。

　　到目前为止，大数据审计还没有明确的概念。2014年10月，《国务院关于加强审计工作的意见》提出，推动有关部门、金融机构、国有企事业单位、审计机构信息共享，提高数据集中度，构建全国审计数据体系。 . 探索大数据技术在审计实践中的应用，提高数据综合利用能力，提高利用信息技术查问题、评价判断、宏观分析的能力。这是国家首次将大数据审计列为审计信息化工作重点。在此基础上，我们可以将大数据审计定义为：在大数据环境中，

　　二、人工智能在审计工作中的意义

　　人工智能随着大数据的发展而发展。一方面，人工智能离不开大数据的支持。例如，可以分析所售产品的种类、数量、交货时间、交货地点等因素，实现产品集中整合。一、实时配送，大大节省产品库存和配送成本；另一方面，人工智能也推动了大数据技术的发展。例如，它可以分析客户最近浏览的产品，并为客户推荐目标产品。

　　在审计工作中使用人工智能，或者说审计智能，是将大数据概念和技术应用到审计工作中，通过使用通用的、高度成熟的数据采集技术、数据处理技术、数据分析技术、数据挖掘技术、审计判断技术以审计模板的形式固定，形成以审计模板为核心的审计软件。审核员可以通过单击按钮并输入必要条件来开始审核技术。审计智能的基础是大数据，核心是人工智能。审计情报将大大减少审计项目的时间、地点等因素的制约，将颠覆传统的审计组织模式，引领审计工作新的发展和改革。主要体现在：

　　（一）智能审计有利于实现全面审计。

　　当前，审计工作受审计时间、人力资源等因素的影响。审核组经常采用重点抽查。重点抽查仅限于“整体>样本”，可能漏掉重大问题。借助人工智能，审计软件可以夜以继日、不知疲倦地工作，使审计工作摆脱审计时间特别是人力资源的限制，真正实现全面审计。同时，人工智能还可以避免人为因素的影响，比如审计人员的误判，甚至是故意“放水”等疏漏，造成重大问题。

　　（二）审计智能有助于自动化审计工作。

　　使用人工智能，审计软件可以根据审计模板（本质上是审计人员设置的程序）自动进行数据采集、数据整理、数据分析，甚至可以纠正被审计单位的日常问题，检查舞弊。同时，利用深度学习技术，还可以对被审计单位新出现的普遍性和趋势性异常问题进行自动搜索、识别、归纳和总结，自动形成便携的“傻瓜式”审计模板，其他审计团队使用。模板，可以自动审计这类问题。

　　（三）智能审核将大大减少审前知识储备。

　　随着经济的发展，社会分工会越来越细化，同时，法律法规的完善也意味着其内容会更加丰富多样。为了更好地履行职责，作为“经济守夜人”的审计师需要学习越来越多的法律法规知识和行业背景知识。为此，传统审计模式下的审计师在审计前阶段不得不花费大量时间研究相关法律法规和行业背景。利用人工智能，计算机可以实时更新现行法律体系，自动搜索行业背景和专业知识，不会出现混淆、不准确、无法记忆，也不会出现疏忽，

　　（四）智能审计将大大解放审计人员。

　　智能审计不仅可以缩短审计工作所需的时间，还可以将审计人员从繁琐重复的简单劳动中解放出来。比如在传统的审计模式下，审计一家银行的审计组一般需要派七到八名审计员到采集，整理电子数据。使用人工智能后，工作可以由审计软件自动完成。因此，审计情报相当于增加审计权力。这样，审计人员可以进一步发挥主观能动性，聚焦审计软件难以完成的重大问题，如*敏*感*词*重大违纪*敏*感*词*，从制度机制角度分析问题产生的原因。，并在更高层次和更广范围内。,

　　三、构建大数据审计平台的关键技术

　　建设大数据审计平台是一个比较复杂的系统工程，包括网络、数据库、审计平台软件等技术项目。通过总结总结审计方法和审计经验，以及技术项目与审计模板的融合形成的审计模板。从技术角度看，大数据审计平台的建设以大数据为基础，主要依托审计自动化、深度学习、网络蜘蛛三大技术。其中，审计自动化是基础，深度学习和网络蜘蛛是审计自动化技术的延伸。和扩张。

　　（一）审计自动化。

　　审计自动化是指审计软件，在没有审计员干预或较少干预的情况下，按照审计模板设置的审计程序，通过数据采集和数据整理自动化、数据分析和数据挖掘自动化，以及审计问题调查和处理自动化实现审计目标的过程。审计自动化的关键是审计程序的设置（或审计模板的固化）。其工作原理如图1所示：

　　数据采集和数据排序自动化

　　数据分析和数据挖掘自动化

　　审计追踪

　　自动化审计问题排*敏*感*词*理

　　审计问题

　　图1 审计自动化的工作原理

　　1、数据采集和数据排序自动化。该技术基于对被审计单位的大部分信息系统（如现有数据库类型、数据结构等）的了解，根据审计标准数据接口的要求，采用传统的数据采集整理技术进一步进行。总结总结，最后形成数据采集整理模板。每次设定数据采集周期（如一个季度采集一次或半年采集一次），审计软件会自动接收相关单位的原创数据形成审计标准数据，并保存到指定的数据库中。虽然成型模板的工作量比较大，但成型后可连续使用；同时，利用这项技术，审计软件通常会自动完成数据采集并进行整理，避免原创数据提供缓慢和中间数据形成晚。问题。

　　2. 数据分析和数据挖掘自动化。数据分析和数据挖掘是审计自动化的核心，其目的是获取审计线索。在传统的审计模式下，数据分析和数据挖掘依赖审计人员手动进行分析。分析的结果很大程度上取决于审计师的业务能力。分析技术强，业务能力强，获取线索多，质量高；相反，线索少，质量差。目前，国家审计署很少有既懂数据分析挖掘技术又懂审计业务的两栖人才。了解审计业务的数据分析技术往往不是很好，反之亦然。数据分析和数据挖掘的自动化是将成熟有效的数据分析方法和数据挖掘技术以分析模板的形式固定下来。对于审计人员来说，具体的分析方法类似于一个“黑匣子”——你可以在不知道具体分析过程的情况下使用它。数据分析和数据挖掘自动化技术的本质是将审核员的成功经验和专业知识以分析模板的形式透明无阻碍地分享给其他审核员，达到降低技术依赖和工作强度的目的。

　　3. 审计问题的自动化调查和处理。审计问题排查自动化基于数据分析和数据挖掘自动化，根据审计判断模板设定的程序和条件，判断分析中发现的审计线索是否符合现行法律法规，直接获得审计问题的技术。从本质上讲，审计问题调查自动化技术是数据分析和数据挖掘自动化的升级。同是：模板是核心，模板的好坏在很大程度上决定了审计软件能否尽可能多地发现被审计实体的问题，并决定发现的问题是否“真正违反现行法律”和规定”；不同是的，自动化审计问题排*敏*感*词*理获取审计问题，进一步减少了审计人员的直接参与，但对人工智能也有更高的要求，要求审计软件具有人为判断，而不仅仅是按照预先设定的程序。某些操作。

　　4. 审核模板。审计模板是审计自动化的核心。模板的质量是审计自动化成功的关键。模板的质量包括内容质量和技术质量。内容质量是指模板内容（即设定的程序）符合相关审计要求、审计程序和法律法规，其质量依赖于优秀审计师对自身审计经验的总结和总结。技术质量有四个指标：通用性、稳定性、可移植性和可扩展性。通用性是指审计模板应用的广泛性，是适用于几种类型的审计情况还是一种或几种特定情况；稳定性是指审计模板对审计环境的适应性，即使审计环境发生微小变化。正常工作；可移植性是指对某类审计模板进行适当的修改（或审计软件的自动修改），形成新的审计模板；可扩展性是指审计模板的兼容性，新增模板和删除模板简单方便，模板的增减不影响正常工作。一般通用性强、稳定性好、可移植性高、可扩展性大的模板是技术质量好的模板。但是，内容质量是模板质量的基础。只有合格和不合格两个指标。如果内容质量存在偏差，则技术质量最好的模板将被视为不合格模板。

　　（二）深度学习技术。

　　深度学习的概念起源于人工神经网络的研究。它是由 Hinton 等人提出的。2006年，专门研究计算机如何模拟或实现人类学习行为以获取新知识或技能并重组现有知识或技能。知识结构使其能够不断提高自身的绩效。深度学习是一种基于数据特征学习的机器学习方法。它结合低级特征，形成更抽象的高级表示属性类别或特征，以发现数据的分布式特征表示。

　　1. 深度学习简介。深度学习也称为深度结构学习、分层学习或深度机器学习。它是算法的集合，是机器学习的一个分支。它是使用各种机器学习算法来解决多层神经网络上的图像和文本等各种问题的算法集合。如果有纸质会议纪要“关于银行向某公司贷款”，计算机应写出会议纪要的摘要（即主要内容）。第一层神经网络扫描获取会议记录图片；第二层神经网络识别图片上的符号（即文字、图像、表格等），将纸质会议记录的图片内容转换为计算机本身可识别的文字、图像、表格；

　　2.文字识别技术。在讨论深度学习在审计工作中的应用之前，让我先解释一下单词识别技术。计算机表示文本和图像的方式是不同的。当我们输入文本时，计算机使用它可以识别的二进制代码。因此，在计算机中，每一个字都是二进制编码的，但是当它显示在屏幕上时，计算机使用的是点阵。技术将二进制代码转换为我们人眼看到的单词。但是图像的表示是不同的。计算机首先将图像分解成小像素，然后每个像素用二进制代码表示。无论是英文代表的字母文字，还是汉字代表的笔画文字，每个字符（或字母）本质上都是一幅图画。

　　因此，文本识别技术实际上是一个将像素转换为二进制的过程。识别时，首先由计算机通过扫描或相机获取图片；其次，根据图片的像素规则（例如，有文字的地方是黑色，文字是白色或灰色等），将图片分成一个或几个分量。由许多像素组成的小图像；再次，计算机利用图片文字匹配库，结合每张图片的特点（如字母A有尖点，字母P有圆圈，汉字“十”为两条垂直交叉线等） , 将每个图像识别为文本并用二进制代码表示。至此，计算机完成文字识别。但是，在实际工作中，字符识别要复杂得多。例如，简单的“十”字用行书书写，有的用草书书写，有的用草书书写。哪怕是同一个人，有时候写的大一些，有时候写的小一些。因此，在图文匹配库中，一个文本往往对应多个图像。同时，由于文字书写不规则，计算机在识别文字时需要使用模糊匹配技术，即寻找最相似的图像等。

　　3.深度学习技术。深度学习技术在审计工作中的运用主要包括两个方面。一种是计算机根据识别的文本做出一定的判断。仍以“关于某银行向某公司贷款”的会议纪要为例，计算机识别出纸质版会议纪要后，根据参会者的权重、发言内容等进行判断。，贷款的发放是通过集体决策或个人决策违规的判断作出的。其中，可以根据会议记录中与会人员的方式和顺序来判断发言者的权重。例如，参加者比在场者好，前面的人比后面的人好；演讲内容可从内容是否含有“同意”、“不同意”或“不同意”、“保留意见”等关键词语言来判断。在这个例子中，如果大多数人的发言中收录“不同意”和“保留意见”等关键词，则属于非法决定。当然，生成一个好的审计判断模板，远非判断上述关键词是否收录在演讲中，核心还是要尽可能模拟审计师的审计判断过程。模拟程度越高，模板内容的质量就越好。好的。和其他关键词语言来判断。在这个例子中，如果大多数人的发言中收录“不同意”和“保留意见”等关键词，则属于非法决定。当然，生成一个好的审计判断模板，远非判断上述关键词是否收录在演讲中，核心还是要尽可能模拟审计师的审计判断过程。模拟程度越高，模板内容的质量就越好。好的。和其他关键词语言来判断。在这个例子中，如果大多数人的发言中收录“不同意”和“保留意见”等关键词，则属于非法决定。当然，生成一个好的审计判断模板，远非判断上述关键词是否收录在演讲中，核心还是要尽可能模拟审计师的审计判断过程。模拟程度越高，模板内容的质量就越好。好的。但核心仍然是尽可能模拟审计师的审计判断过程。模拟程度越高，模板内容的质量就越好。好的。但核心仍然是尽可能模拟审计师的审计判断过程。模拟程度越高，模板内容的质量就越好。好的。

　　二是自动生成审计模板。该技术是软件根据设定的程序自动分析数据，无需审计人员参与。如果发*敏*感*词*额等）。) 每年根据全国工商数据，判断注册数量是否突然大幅增加。假设增长率设定为50%，超过50%可以看作是突然的大幅增长。二是判断公司是否异常。在公司注册方面，可以通过一个特定的关键词（如公司注册地址、股东*敏*感*词*号码、经办人员*敏*感*词*号码、预留电话号码等）对公司数量进行分类统计。如果同一个*敏*感*词*号（或者同一个预留电话号码）如果注册公司数量多，就会出*敏*感*词*额。同时，对收录特定关键词（如医药、酒店等）的*敏*感*词*对应金额进行分类统计。“药品”金额占*敏*感*词*总金额的60%以上，可以确定为：这些*敏*感*词*要向药企开具*敏*感*词*，涉及企业数量、药企数量、和*敏*感*词*金额。电脑得到结果后，提示：是否关注此事；如果审核员确认需要注意，会进一步提示：是否需要生成新的审核模板；如果审计师确认需要生成，计算机会按照上面分析的SQL语句自动生成审计分析模板。

　　（三）网络蜘蛛。本质上，互联网是一个分布式的、开放的、海量的大数据平台。其中，分布式是指互联网信息存储在多个服务器（即数据库）中；开放性是指互联网提供的服务是公开透明的，用户不需要任何权限，也不需要知道服务器地址，就可以免费获取大部分信息；海量是指互联网提供的信息量非常大，用户可以使用任意关键字通过搜索引擎，获取数万甚至数百万条信息。

　　网络蜘蛛是网络蜘蛛。如果互联网是蜘蛛网，那么网络蜘蛛就是在网上爬行的蜘蛛。网络蜘蛛通过网页的链接地址寻找网页。从某个页面开始，读取该网页的内容，找到该网页中的其他链接地址，然后利用这些链接地址查找下一个网页，如此循环往复。继续直到这个网站的所有网页都被抓取完毕。除了抓取网页，网络蜘蛛还可以对网络信息内容进行深度分析，形成每条信息的关键词和摘要。当用户使用关键词进行搜索时，网络蜘蛛会根据摘要过滤出相关信息，将用户最需要的信息放在首位。审计工作利用网络蜘蛛利用互联网信息，

　　1、建立和更新审计对象的行业背景数据库和专业知识库。行业背景是指这个行业的具体工作，以及这个行业所涉及的部门、人员、产品、市场。比如财务审计。金融业可以分为三大类：银行、证券和保险。其中，银行可分为中央银行、政策性银行和大型商业银行。在此之下，各家银行还可以标注其职能、职责、发展定位等。在国家金融政策领域，可以根据时间和金融政策类型（即货币政策、利率政策和汇率政策）。网络蜘蛛还可以建立行业专业知识库，如主营业务包括资产业务、负债业务、中间业务、国际业务等，其中资产业务包括信用贷款、抵押贷款、担保贷款、贷款证券化等。建立行业背景数据库和专业知识库，审计人员在对某家银行进行审计时，可以利用它了解相关的行业背景和行业专业知识。与此同时，网络蜘蛛不断在互联网上搜索并更新相关内容。贷款证券化等。建立行业背景数据库和专业知识库后，审计人员在对某家银行进行审计时，可以利用它了解相关的行业背景和行业专业知识。与此同时，网络蜘蛛不断在互联网上搜索并更新相关内容。贷款证券化等。建立行业背景数据库和专业知识库后，审计人员在对某家银行进行审计时，可以利用它了解相关的行业背景和行业专业知识。与此同时，网络蜘蛛不断在互联网上搜索并更新相关内容。

　　2. 提供审计线索或核实审计情况。由于其强大的搜索功能，网络蜘蛛可以方便地进行预审和中审阶段的审计工作。比如某省的生态环保审计，在预审阶段，审计人员可以通过网络蜘蛛搜索自己想要的信息。审核员如要查找本省生态环境重大破坏案例，可在搜索栏中输入关键词“某省&生态环境&损害”，搜索与生态环境破坏相关的信息。为了进一步提高搜索命中率，还可以将关键词修改为“某省&废水|土壤|河流|空气&污染|损害|”。

　　在审核阶段，审计人员可以通过网络蜘蛛验证某些特定信息。如果审计人员需要验证“张三”是否为县政府公职人员，可以在搜索栏中输入关键词“某县&张三”进行搜索。，结合张三的年龄等信息，基本可以确定张三是否是县里的公职人员。再比如，如果审计人员怀疑某公司在自然保护区从事房地产开发，则可以使用关键字“公司&自然保护区名称&项目”进行搜索。如果互联网提供了与自然保护区项目相关的网页，则表明该事项基本属实。

AI时代内容工厂

一是人工采集,二是智能采集(人工智能与大数据审计的概念（一）的定义)

0 个评论

发起人

AI时代内容工厂

一是人工采集,二是智能采集(人工智能与大数据审计的概念（一）的定义)

0 个评论

发起人

相关问题