解决方案:[网络安全] 二

　　最近开始研究网络安全和系统安全，接触了很多新名词、新方法、新工具。作为初学者，感觉安全领域涉及的知识非常广泛和复杂，但也很有趣。所以我希望通过这100多篇网络安全文章，把Web渗透的相关工作、知识体系、学习路径和探索过程分享给大家，让我们躺那些坑，跨那些洞，守住那些站在一起。未知来袭，知如何守，守望相惜，希望大家多多推荐和支持作者公众号。

　　那掌AI安全之家于2020年8月18日开通，将以Python与安全技术为核心，主要分享Web渗透、系统安全、人工智能、大数据分析、图像识别、恶意代码检测、CVE复现、威胁信息分析与其他文章。很想把自己这十年所学、所做、所感分享出来，与大家共同进步。

　　本文重构作者CSDN系列，同时参考了B站谢老师和阿干哥的文章。真心推荐白帽、谢老师和阿干哥的文章。写得真好。（参考文献见文末）

　　免责声明：作者虽然是安全小白，但保证每篇文章都用心写。希望这些基础文章对你有所帮助，我们一起在平安的路上前行。同时，本人坚决反对利用教学手段进行恶意攻击。所有错误的行为都将受到严厉的惩罚。绿色网络需要我们共同维护。建议大家了解技术背后的原理，更好的进行安全防护。

　　文章目录：

　　1、Web渗透第一步

　　网站是安装在计算机上的应用程序，它有操作系统、应用程序和服务器。例如 WAMP 包括：

　　网站HTML站点访问的基本流程如下图所示：客户端输入访问URL，DNS服务器将域名解析为IP地址，然后IP地址访问服务器内容（服务器、数据库、应用程序） program），最后将内容反馈给客户端的浏览器。

　　数据库包括要调用的数据并存储在网络服务器上。这个服务器有一个真实的IP地址，每个人都可以访问和ping它。每次请求页面或运行程序时，Web 应用程序都会在服务器上执行，而不是在客户端计算机上执行。

　　那么，您如何破解网站？

　　入侵安装在计算机上的应用程序称为Web应用程序渗透测试，入侵带有操作系统的计算机和应用程序称为服务器端攻击，入侵人称为社会工程攻击。我们在进行网页渗透之前，不是在获取目标时使用Webdirscan、SQLMAP、Caidao、Cobalt Strike等工具，而是需要先获取网站的综合（指纹）信息。我们获取的信息越多，就越容易找到背后的漏洞或者注入点。

　　信息

" target="_blank">采集

方法可分为主动和被动两种。

　　通常采集

的信息包括：

　　本文将讲解Web渗透的第一步——信息采集

。正好弥补了我们安全初学者的入门，同时可以增加学习安全的兴趣。我希望你喜欢它。文中如有不足之处，还请海涵指教。

　　二、域名信息采集

1、域名查询

　　域名系统

　　域名系统（简称DNS）是互联网的一项服务。作为一个将域名和IP地址相互映射的分布式数据库，可以让人们更方便地访问互联网。简单的说，就是一个将域名翻译成IP地址的系统。

　　域名由一串以点号分隔的名称组成，是互联网上某台计算机或计算机组的名称，用于在数据传输过程中定位和识别该计算机（有时也指地理位置）。浏览网站的过程如下图所示，从DNS服务器获取指定域名对应的IP地址。

　　域名系统

　　举个例子，作为域名，对应IP地址198.35.26.96。DNS就像一个自动电话簿，我们可以直接拨打198.35.26.96这个名字而不是电话号码（IP地址）。我们直接调用网站名称后，DNS会把一个人类容易使用的名称转换成机器容易识别的IP地址，比如198.35.26.96。再比如域名，是域名对应的子域名，而edu（教育网）和www（万维网）是对应的主机名。

　　2.whois查询

　　Whois是一种用于查询域名IP和所有者信息的传输协议。简单的说，Whois是一个用来查询域名是否被注册的数据库，以及注册的域名信息（如域名拥有者、域名注册商、注册商邮箱等）。

　　不同域名后缀的Whois信息需要在不同的Whois数据库中查询，例如.com的Whois数据库与.edu的Whois数据库是不同的。每个域名或IP的Whois信息由相应的管理机构保存。例如，以.com结尾的域名的Whois信息由.com运营商VeriSign管理，中国国家顶级域名.cn由CNNIC（中国互联网络信息中心）管理。

　　Whois协议的基本内容是：先与服务器的TCP 43端口建立连接，发送查询关键字并加回车换行，然后从服务器接收查询结果。

　　域名注册人的邮箱地址等信息可以通过Whois查询获得。一般中小型网站的域名注册人是站长。使用搜索引擎搜索Whois查询的信息，获取更多域名注册人的个人信息。

　　whois查询方法：

　　(1) Web界面查询

　　常见的信息采集

站点包括：

　　(2)通过Whois命令查询

　　Kali Linux自带的Whois查询工具可以通过命令Whois查询域名信息。

　　(3) Python编写Whois代码

import urllib.request

　　req_whois = urllib.request.urlopen('http://whois.chinaz.com/doucube.com')

　　print(req_whois.read().decode())

　　import whois

　　data = whois.whois("sohu.com")

print(data)

　　例子：

　　以下是使用站长之家Whois查询东山网站()的相关信息。可以看到网站标题是“修章学习世界”，网站服务器是阿里云，2021年到期，联系邮箱，DNS，域名服务器也可以查询。一些网站可能会暴露私人电话号码、电子邮件地址和地址，社工将进一步调查。

　　然后笔者使用Robtex DNS查询该网站的相关信息，如下图，添加了IP地址（60.xxx.xxx.36）的内容，即可通过该网站定位到物理地址。

　　Netcraft站点报告显示目标网站信息如下，包括网站建设框架和操作系统。

　　3.备案信息查询

　　ICP备案是指互联网内容提供商（Internet Content Provider）。《互联网信息服务*敏*感*词*》指出，网站需备案，未经许可不得从事互联网信息服务。

" />

　　IPC备案查询方式包括：

　　例如作者和哔哩哔哩网站的备案信息如下图所示。你在这里找到什么了吗？

　　三、网站信息采集 1、CMS指纹识别

　　在渗透测试中，对目标服务器进行指纹识别是很有必要的，因为只有识别出对应的Web容器或CMS（内容管理系统），才能发现相关的漏洞，进而进行相应的渗透操作。CMS也叫整站系统。常见的CMS有：WordPress、Dedecms（织梦）、Discuz、PhpWeb、PhpWind、Dvbbs、PhpCMS、ECShop、SiteWeaver、AspCMS、Empire、Z-Blog等。

　　CMS，又称整站系统或文章系统，用于网站内容管理。用户只需下载相应的CMS软件包进行部署构建，即可直接使用CMS。但是，各种CMS都有其独特的结构命名规则和特定的文件内容，因此可以通过这些内容来获取具体的软件CMS和CMS站点的版本。

　　常用识别工具：

　　(1) 在线工具

　　(2) 本地工具

　　例子：

　　以某网站为例，通过该网站进行指纹识别，发现是Discuz搭建的。信息包括：

　　接下来从Github下载大鱼到本地，扫描CMS。

　　2.CMS漏洞查询

　　对于查询的CMS，可以通过五云漏洞库网站查询制定的CMS的漏洞。

　　显示如下图，包括详细的利用过程和防御措施。

　　3.敏感目录信息

　　检测目标Web目录结构和敏感隐藏文件非常重要。在检测过程中，很可能会检测到后台页面、上传页面、数据库文件，甚至网站源代码文件。补充一下谢公子老师的内容，扫描网站的目录结构，看目录是否可以遍历，或者敏感文件是否泄露，包括：

　　常见的探测工具包括：

　　文件 robots.txt

　　同时，提到网站的敏感目录就不得不提到robots.txt文件。robots.txt 文件是专门为搜索引擎机器人编写的纯文本文件。我们可以在这个文件中指定我们不希望被机器人访问的网站目录。使我们网站的部分或全部内容不被搜索引擎收录，或只有指定的内容被搜索引擎收录。

　　因此，robots.txt可以用来阻止Google的robots访问我们网站的重要文件，Google Hack的威胁将不复存在。如果robots.txt文件内容如下，则“Disallow”参数后面是禁止机器人采集的路径。比如我们想让机器人禁止采集网站目录下的“data”文件夹，只需要在Disallow参数后面加上即可。/数据/会做。如果要添加其他目录，继续按此格式添加即可。文件写好后，上传到网站根目录，可以让网站远离Google Hack。

User-agent: *

　　 Disallow: /data/

　　 Disallow: /db/

　　 Disallow: /admin/

　　 Disallow: /manager/

Allow:/images/

　　不过，虽然robots文件的目的是为了防止搜索蜘蛛爬取我们要保护的页面，但是如果我们知道robots文件的内容，就可以知道目标网站的哪些文件夹是不允许访问的。从侧面看，这些文件夹非常重要。

　　埃奇沃思

　　御剑系列的网页工具一直都是比较好用的工具。这款御剑也是一款非常好用的网站后台扫描工具，图形化的页面，简单易用，所以也受到了大多数人的喜欢。它的作者可能是《帝剑孤》。

　　迪尔布

　　dirb 是一个基于字典的网络目录扫描工具，它使用递归的方法来获取更多的目录。它还支持代理和 http 身份验证以限制对网站的访问。

　　迪尔巴斯特

　　Kali Linux提供的目录扫描工具DirBuster支持所有的web目录扫描方式。它不仅支持网络爬虫扫描、基于字典的暴力扫描，还支持纯暴力扫描。该工具使用Java语言编写，提供命令行（Headless）和图形界面（GUI）两种模式。用户不仅可以指定字符规则进行纯暴力扫描，还可以设置URL模糊方式构造网页路径。同时，用户还可以自定义网页解析方式，以提高URL解析效率。

　　4. WordPress 测试

　　WordPress是一个使用PHP语言开发的博客平台。用户可以在支持PHP和MySQL数据库的服务器上建立自己的网站，或者使用WordPress作为内容管理系统CMS。对于 WordPress 测试，可以使用 WpScan 工具进行安全测试。

　　比如识别官网的框架信息，可以调用whatwep命令或者在线网站获取其CMS信息。

　　如果发现目标网站是WordPress搭建的，那就用WPScan检测一下。

　　四、口岸信息采集 1、口岸介绍

　　如果把IP地址比作房子，端口就是进出房子的大门。真正的房子只有几扇门，但是一个IP地址的端口却可以有多达65536（2^16）扇门。端口由端口号标识，端口号仅为 0 到 65536 (2^16-1) 范围内的整数。

　　计算机的常用端口号包括：

　　每个端口代表计算机中的一个服务，使用netstat -ano | netstat -anbo 在 Windows 命令行中显示打开的端口。

　　需要以管理员权限打开CMD，输入netstat -anbo查看开放的端口。其中，443端口是HTTPS建立的连接，80端口是网站HTTP建立的连接。

　　2.口岸信息采集

　　可以使用工具来采集

目标及其端口状态。其工作原理是利用TCP或UDP等协议向目标端口发送指定标志等数据包，等待目标返回数据包来判断端口状态。后续作者准备通过Python编写相关代码。

　　本文主要使用工具采集

端口信息，包括：

　　例子：

　　查看本地端口的开放状态，命令为：

　　使用masscan检测端口开放信息，命令为：

　　工具的使用通常会在目标网站上留下痕迹，其次是在线网站检测方法。

　　例子：

　　使用站长之家检测作者网站80端口开放，443端口关闭（最早支持多端口扫描，目前只支持单端口扫描，如果读者能自己写程序就更好了).

　　接下来，使用ThreatScan 在线网站扫描作者的网站信息。

　　ThreatScan 是一种扫描器，主要用于渗透测试的第一阶段：信息采集

。这里强烈推荐DYBOY大神的博客，地址是：。

　　笔者果然只开放了80端口访问网页和FTP 21端口。

　　3.侧站和C段扫描

　　边站是指同一台服务器上的其他网站。在很多情况下，有些网站可能没那么容易被破解。然后，您可以查看与该网站位于同一服务器上的其他网站。如果有其他网站，可以先把其他网站的webshell拿下来，然后提权拿到服务器权限，最后自然就可以把网站拿下来了！

　　对于红蓝对抗和网络保护，C段扫描更有意义。对于个别网站的渗透测试，C段扫描意义不大。C网段是指同一内网网段中的其他服务器。每个 IP 都有四个 ABCD 段。比如192.168.0.1，A网段是192，B网段是168，C网段是0，D网段是1，C网段嗅探就是拿下同一个C网段的一台服务器，即说是D-segment 1-255的服务器，然后用工具嗅探把服务器拿下来。边站及C区在线查询地址：

　　侧站扫描可以扫描该IP地址下属的其他网站，有利于Web渗透，侧站可能存在漏洞，如下图。

　　4.端口攻击

　　针对不同的端口有不同的攻击方式，因为每个端口都是录音服务器或者目标系统的大门，只要打开大门就可以进入目标系统。例如：针对远程连接服务端口的攻击方法如下，由于23端口的Telnet远程连接以明文方式传输信息，可以通过爆破、嗅探、弱口令等方式进行攻击。

　　在这里我推荐大家：当我们扫描目标网站的端口号时，可以在搜索引擎中搜索对应的攻击方法进行测试，或者在五云漏洞库（）或CVE库中搜索。例如：

　　注：CVE漏洞的复用是网络攻击的常用手段。非常有必要提醒厂商尽快打补丁，用户使用一些软件版本更新。

　　五、防御措施

　　对于端口攻击，只要端口是开放的，可以连接的，就可以使用相应的方法进行攻击测试。这里提供的防御措施包括：

　　5.敏感信息的采集

　　对于某些安全性较好的目标，不可能直接通过技术层面完成渗透测试。在这种情况下，可以利用搜索引擎目标在 Internet 上公开相关信息。例如：数据库文件、SQL注入、服务配置信息，甚至通过Git发现的站点源代码泄露，以及Redis等非授权访问、Robots.txt等敏感信息，从而达到渗透的目的。

　　在某些情况下，采集

的信息将对以后的测试有用。如果通过采集

敏感信息直接获取目标系统的数据库访问权限，那么渗透测试任务就完成了一大半。因此，在技术情况下测试之前，应该采集

更多的信息，尤其是敏感信息。

　　1.谷歌黑客语法

　　Google Hack是指利用谷歌、百度等搜索引擎搜索某些特定网站主机漏洞（通常是服务器上的脚本漏洞），以快速找到漏洞主机或特定主机漏洞。常用方法包括：

　　Google 提供了强大的搜索功能，可以得到准确的结果。如果不能访问，也可以通过百度获取相关内容，但结果远不如谷歌准确，很多不相关的广告和视频会返回给你。举例如下：

　　谷歌黑客数据库是：。例如查询数据Access数据库，使用filetype:mdb "standard jet"(password | username | user | pass)。

　　完美:数据超市丨相会文化大数据——国家文化大数据标准体系（上）

　　开场白

　　当前，文化数字化已上升为国家战略。国务院中央办公厅专门印发《关于推进实施国家文化数字化战略的意见》进行部署。文化大数据产业正摩拳擦掌，积极参与文化数字化实践。

　　文化数字化是一个新事物。老眼容易蒙蔽，用老方法推广容易误入歧途。大家在学习文献和推动实践的过程中都会遇到各种各样的问题。

　　今天，中国公共关系协会文化大数据专业委员会副主任高书生对国家文化大数据标准体系第一部分进行解读。

　　目标

　　通过建立国家文化大数据标准体系，整合现有技术和产业资源，统一规划文化大数据标准发展路线，发挥文化大数据产业各企业优势中国公共关系协会委员会可用于共同建设文化大数据。标准体系框架着眼于未来标准的应用和未来文化大数据标准的布局，充分发挥委员会的价值，高效开展文化大数据标准化工作。

　　国家文化大数据标准体系建设贯彻落实国务院《推进大数据发展行动纲要》和《深化标准化工作改革方案》精神，高质量推进文化大数据建设，促进文化繁荣，并实现以下总体目标：

　　为文化大数据分类、标注、估价提供方法支持，推动文化大数据库建设。

　　为文化大数据生产、传播、服务、消费等方面提供技术支撑，推动文化网络平台建设。

　　为文化大数据监管提供监管支持，促进文化产业生态建设。

　　支持文化领域国际标准化工作，提升国际文化传播话语权。

　　配套措施

　　中国公共关系协会文化大数据行业委员会专门成立了标准化中心，下设文化资源数据技术工作委员会、文化数字内容技术工作委员会、文化体验技术工作委员会三个工作组委员会。按照制度的形成、完善和后续标准化工作提供了组织保障。

　　标准化中心将从标准化组织建设、标准化队伍建设、重点核心标准制定、标准化示范验证、国际标准推广五个方面逐步深化，具体如下：

　　1.在组织建设方面，充分利用现有*敏*感*词*标准化组织资源，建设以中国公关协会文化大数据行业专业委员会为核心，跨领域协作的文化大数据标准化组织，可虚拟或实体，制定标准化工作机制。

　　2、在队伍建设方面，要充分调动委员积极性，通过开展文化大数据标准化技能培训，建设一支专业化、规范化、技术能力和管理能力兼备的人才队伍。逐步实现人才培训、考核、发证、发证的标准化管理。

　　3.在重点通用标准制定方面，要分类开展文化大数据国家、行业、群体等不同层面的标准制定工作，通过标准宣传扩大行业影响。

　　4.论证验证方面，要凝聚典型行业需求，形成技术攻关和工程建设项目建议书，在开展核心关键标准论证验证的基础上，积极争取资金支持，为大中型产业发展创造条件。规模推广。

　　5.在国际化方面，要提出我国文化大数据的国际标准应对策略，选择国际上达成共识、能够促进我国文化国际传播的方向，积极开展国际化标准制定。

　　整体结构

　　国家文化大数据标准体系除需要引用的基础技术标准外，还包括以下六大体系：

　　1.文化大数据基础应用标准体系：包括文化大数据通用标准，主要涵盖文化资源数据和文化数字内容的分类、识别、标识、编码方法等。包括4个分标准体系，即：

　　标准体系：规定国家文化大数据标准体系，包括文化大数据产业生态、标准体系*敏*感*词*、标准明细表、标准统计表和标准体系表编制说明等。

　　标识：规范文化大数据的标识方式，包括但不限于标识编码，以及标识分发、分析等服务流程和支撑系统。

　　标注：规范文化资源数据和文化数字内容的标注方法、流程及相关支撑体系。

　　分类与编码：规范文化资源数据和文化数字内容的分类、编码方式等。

　　2.文化大数据监管标准体系：包括文化大数据服务所需的监管要求、流程及相应支撑体系等技术标准。包括2个不合标准的系统，即：

　　监管要求：规范文化大数据服务监管职责划分和监管流程。

　　监管体系：规范文化大数据服务监管所需的支撑体系。

　　3. 文化大数据资源标准体系：包括支持文化资源数据

" target="_blank">采集和共享的相关流程和支撑系统技术标准。包括2个不合标准的系统，即：

　　资源数据采集：规范中华文化遗产标本库、中华民族文化基因库、中华文化资料库等文化资源数据采集技术和支撑体系。

　　资源数据共享：规范中国文化遗产标本库、中国文化基因库、中国文化资料库等文化资源数据的数据模型、数据维护、数据共享等技术和支撑体系。

　　4.文化大数据生产端标准体系：包括支撑文化生产的相关技术和配套系统标准。包括2个不合标准的系统，即：

" />

　　文化产线：规范文化产线系统的分类和产能要求。

　　文化生产技术：规范各类文化生产技术。

　　5.文化大数据云标准体系：包括有线电视网络为文化大数据各环节提供数据传输通道时应满足的组网和服务技术标准，开展文化大数据所需的机构设置和支撑体系。大数据服务。标准。包括3个子标准体系，即：

　　文化数据服务平台：规范文化数据服务平台的能力和各组成系统的技术要求。

　　文化数据服务中心：规范国家、省、区域文化数据服务中心的功能、建设、运行等要求。

　　国家文化专网：规范有线电视网络为文化大数据产业链各组织提供数据传输通道的组网技术要求，以及应满足的业务技术要求。

　　6.文化大数据消费标准体系：包括体验设施建设、体验设置与运营、提供文化体验服务的体验设备等技术标准。包括4个分标准体系，即：

　　文化体验设施建设：规范文化体验设施分类、建设和改造，以及体验设备、驻地网络、支撑系统部署要求。

　　文化体验设施运营：规范各类文化体验设施运营流程、运营支撑体系和服务能力评价要求。

　　文化体验设备：规范文化体验设备的分类和技术要求。

　　文化体验网关：规范文化体验网关的技术要求。

　　文化资料鉴定技术要求

　　1. 文化数据识别分类：首先是文化数据实体识别，识别国家文化大数据系统中的文化数据、参与者、载体、时间、事件、地点等实体。二是文化数据关联识别，是对国家文化大数据系统中文化数据实体的关联关系识别。

　　2、标识编码原则：一是遵循GB/T 32867-2016国际标准协会标识符（ISLI）标准；第二，识别码是唯一的；三、标识码用于文化数据实体和实体关联的唯一标识；第四，如果文化数据实体已有管理标识（如多类各级标准标识、馆藏编号等），则应使用已有标识，并将相应的标识纳入文化元数据列表项。数据识别码。

　　3.识别码申请：编码登记人在文化数据识别服务系统注册文化数据识别元数据，申请文化数据识别码；代码注册人应使用底层关联集成系统或文化数据标识服务系统的应用层工具接口完成文化数据标识代码的申请/注册和嵌入。

　　4.标志代码管理：标志代码由国家文化大数据标志登记服务机构管理。在ISO国际标准协会标识符管理体系框架下，国家文化大数据标识登记服务机构是ISLI国际登记机构授权的ISLI区/行登记中心，承担范围内区域/行业的ISLI由ISLI国际注册机构指定。识别码注册管理业务。

　　文化资源数据分类及代码

　　一、基本原则：

　　a) 合理性——文化资源分类和分类代码逻辑严密、层次分明、分类适度。

　　b) 唯一性——文化资源的分类和分类代码是唯一的。

　　c) 实用性——文化资源分类和分类代码可以覆盖国家文化大数据系统中的所有文化数据资源。

　　d) 可扩展性——文化资源的分类和分类代码需要具有良好的可扩展性。

　　2. 文化资源数据分类方法：根据《2009年联合国教科文组织文化统计框架》所列文化统计框架中的六大类，包括文化与自然遗产、表演与庆典、视觉艺术与工艺品、书籍与报纸、视听和互动媒体、设计和创意服务。

　　3、文化资源分类编码方法：文化资源分类编码采用七位编码，四级分类。其中，第一位用英文大写字母表示一级分类，第二至第三位用小数表示指定的二级分类代码，第四至第五位用小数表示指定的三级分类代号，第6位～第7位代表十进制的四级分类代号。编码采用顺序码。如果一级分类后没有二级分类，则第二至第七位代码填“000000”。如果二级分类下没有三级分类，第四至第七位代码的编码用“0000”填充。若三级分类下无四级分类，则第6～7位码的编码补“00”。

　　文化数字内容溯源系统

　　它由两个子系统组成，即溯源特征标记子系统和溯源监控子系统。

　　1、溯源特征标识子系统主要是数据层，通过与部署在国家文化专网的文化数据分发系统对接，实现文化数字内容的指纹采集和水印嵌入。数据层主要包括文化数字内容指纹采集、文化数字内容水印嵌入、文化数字内容指纹库和文化数字内容水印库。

　　2、溯源监控子系统主要分为数据层、应用层和接入层。在，

　　数据层通过传播内容采集代理或传播内容采集探针采集互联网传播平台传播的文化数字内容的指纹和水印信息。数据层主要包括传播内容采集代理、传播内容采集探针、传播内容水印库、传播内容指纹库、水印库、指纹库和溯源库等功能模块。

　　应用层实现文化数字内容溯源所需的各类管理和分析能力。应用层主要包括数字内容特征提取、数字内容信息管理、数字内容溯源分析等功能模块。

　　接入层为文化数字内容溯源系统用户提供应用接口接入能力，为其他相关系统提供溯源服务接口接入能力。

　　文化遗产数字馆藏技术要求

　　1、数字馆藏服务模型：主要包括数字馆藏人员、工具、对象、流程、数据和评价，其中：数字馆藏人员使用馆藏工具，通过馆藏过程对馆藏对象进行数字化采集，形成数据；在馆藏过程中进行服务水平评估，形成数字馆藏服务水平。

　　人员是指提供数字馆藏服务的人员，工具是指数字馆藏服务中使用的设备，物是指需要数字馆藏的文化遗产，过程是指数字馆藏服务的阶段和过程，数据是指文化符合馆藏质量评价要求的遗产对于数据而言，评价是对整个数字馆藏过程服务水平的评价。

" />

　　2.数字馆藏服务分类：根据文化遗产数字馆藏方式的不同，分为平面扫描数字馆藏服务、数字摄影数字馆藏服务、多光谱图像数字馆藏服务、显微图像数字馆藏服务、三类——立体可移动文物服务。数字馆藏服务、不可移动文化遗产三维数字馆藏服务、存档音频数字馆藏服务、现场声音数字馆藏服务、馆藏视频数字馆藏服务、现场视频数字馆藏服务。

　　3. 数字馆藏服务水平评价方法：用于评价服务机构，对数字馆藏服务的各个类别分别进行评价，分为一、二、三级，一级为最高等级。等级评定方法是根据总分的大小来划分的。

　　文化资源数据解构技术要求（二维图像）

　　1. 定义：从文化资源数据的二维图像中提取具有一定内涵或特殊意义的不同文化元素。文化元素的提取依赖于不同的约束条件，不同约束条件下提取的文化元素的数量和内涵是不同的。在国家文化大数据标准体系中，重点解构中国影像图书馆（中华图书馆）、博物馆、美术馆、图书馆、文化馆等公共文化机构的二维影像文化资源数据结构等关键技术共同服务于生产端。

　　2、文化资源数据与文化要素的关系：文化资源数据由多种文化要素组成，单一的文化要素也可以由多个不同文化内涵或更小的文化要素组成。

　　3.过程：解构过程包括图像预处理、解构提取、解构数据标注、解构评价方法四个环节。解构预处理环节对输入图像采用数字化、几何变换、归一化、平滑、复原、增强等方法，消除图像中无关信息，恢复有用的真实信息，增强相关信息的可检测性，将图像简化为最大程度。数据，用于提高特征性能，增强解构提取的可靠性，用于后续的解构提取工作；对预处理后的数据进行解构提取，根据不同的数据类型，根据相应的要求对线稿、pattern、以及色彩解构提取，选择相应的线稿解构、图案解构、色彩解构等方法进行解构，解构结果输出文化元素；解构数据标注对于解构提取的文化元素，根据文化资源数据标注的要求，选择有监督标注和半监督标注、无监督标注或无监督标注等合适的方法进行语义清晰的标注；解构评价采用主观评价和客观评价相结合的方法，对文化元素的质量进行定性和定量分析，并根据评价结果对解构质量进行优化。选择相应的线稿解构、图案解构、色彩解构等方式进行解构，解构结果输出文化元素；解构数据标注对于解构提取的文化元素，根据文化资源数据标注的要求，选择有监督标注和半监督标注、无监督标注或无监督标注等合适的方法进行语义清晰的标注；解构评价采用主观评价和客观评价相结合的方法，对文化元素的质量进行定性和定量分析，并根据评价结果对解构质量进行优化。选择相应的线稿解构、图案解构、色彩解构等方式进行解构，解构结果输出文化元素；解构数据标注对于解构提取的文化元素，根据文化资源数据标注的要求，选择有监督标注和半监督标注、无监督标注或无监督标注等合适的方法进行语义清晰的标注；解构评价采用主观评价和客观评价相结合的方法，对文化元素的质量进行定性和定量分析，并根据评价结果对解构质量进行优化。解构结果输出文化元素；解构数据标注对于解构提取的文化元素，根据文化资源数据标注的要求，选择有监督标注和半监督标注、无监督标注或无监督标注等合适的方法进行语义清晰的标注；解构评价采用主观评价和客观评价相结合的方法，对文化元素的质量进行定性和定量分析，并根据评价结果对解构质量进行优化。解构结果输出文化元素；解构数据标注对于解构提取的文化元素，根据文化资源数据标注的要求，选择有监督标注和半监督标注、无监督标注或无监督标注等合适的方法进行语义清晰的标注；解构评价采用主观评价和客观评价相结合的方法，对文化元素的质量进行定性和定量分析，并根据评价结果对解构质量进行优化。选择有监督标注和半监督标注、无监督标注或无监督标注等合适的方法进行语义清晰的标注；解构评价采用主观评价和客观评价相结合的方法，对文化元素的质量进行定性和定量分析，并根据评价结果对解构质量进行优化。选择有监督标注和半监督标注、无监督标注或无监督标注等合适的方法进行语义清晰的标注；解构评价采用主观评价和客观评价相结合的方法，对文化元素的质量进行定性和定量分析，并根据评价结果对解构质量进行优化。

　　文化资源数据与文化数字内容重构技术要求（模式重构）

　　1、定义：图案再造是将图案元素、图案元素或图案基因进行组合、再创造的方法和过程，并充分考虑各种元素和要素之间的关系，并结合现代技术创造出和谐、富有文化认同感和共鸣的方法和过程。数字内容符合大众现代审美，以最佳视觉效果呈现重构内容。

　　2.过程：模式重建过程包括四个环节：重建预处理、模式重建、重建数据标注、模式重建结果评价。重建预处理环节采用去噪、光平衡、图像增强、平滑等方法对二维图案图像进行预处理，改善和增强图像的视觉效果，使图案图像满足数据输入的要求，为后续的重建环节提供信息。高质量的图案图像。图案重构对预处理后的图案图像，采用聚类、组织、分层、拼贴等不同的重构方法，重构图像中的不同文化元素和文化元素，并通过重构的方法得到各种图案图像结果，输出重构后的图案图像。重构数据标注对于重构的图案图像，根据文化资源数据标注的要求，选择合适的标注方式，明确图案图像的属性、来源、重构方法，输出带有标注的重构图案图像。图案重建结果评价对于标记后的重建图案图像结果，采用主观评价和客观评价的方法，对质量进行定性和定量分析，输出符合评价要求的结果。根据文化资源数据标注的要求，选择合适的标注方式，明确图案图像的属性、来源、重构方法，输出重构后的图案图像，并附注解。图案重建结果评价对于标记后的重建图案图像结果，采用主观评价和客观评价的方法，对质量进行定性和定量分析，输出符合评价要求的结果。根据文化资源数据标注的要求，选择合适的标注方式，明确图案图像的属性、来源、重构方法，输出重构后的图案图像，并附注解。图案重建结果评价对于标记后的重建图案图像结果，采用主观评价和客观评价的方法，对质量进行定性和定量分析，输出符合评价要求的结果。

　　3、图案重建结果质量要求：图案重建后生成的二维图像应满足以下要求，即图案合理；混合意义；一致的愿景；一致的互动；多层次内涵；美丽的形式; 信噪比SNR >20；峰值信噪比PSNR>30；均方误差 MSE

　　文化资源数据矢量化技术要求（二维图像）

　　1. 定义：将文化资源数据中以二维图像呈现的具有一定内涵或特殊意义的文化元素，转化为矢量格式的图形进行表达和存储。矢量化依赖于不同的约束条件，不同约束条件下得到的矢量图像质量各不相同。在国家文化大数据标准体系中，重点对中华文化资料库和中华民族文化基因库中的文化数据进行矢量化处理，并以采集、标注、关联、重构等关键技术服务于生产端。

　　2、过程：二维图像矢量化过程包括四个环节：预处理、矢量化处理、矢量化标注、矢量化评价。预处理环节对用户上传的图片进行质量优化，为矢量处理环节提供输入数据，并将优化后的图片保存到数据库；矢量处理环节根据上传图片的类型选择不同的算法进行矢量处理，生成矢量Maps，为矢量标注环节提供存储数据；矢量标注链接标注矢量图形并标注类别；矢量化评测环节对矢量图的质量进行评测，获得评测信息和排名，方便用户展示。

　　文化数据服务中心技术要求

　　1.文化数据服务中心架构：文化数据服务中心是国家文化大数据系统的枢纽，为国家文化大数据系统健康有序发展提供各项服务支撑。主要业务内容包括规划服务、保障服务、运营服务、公共服务、产业服务等。文化数据服务中心按照国家文化大数据国家中心（简称国家中心）分三级布局。、区域文化数据服务中心（简称区域中心）和省级文化数据服务中心（简称省中心）。文化数据服务中心通常简称为数据中心或服务中心。

　　2.国家中心：国家中心是国家文化大数据系统运行的顶层枢纽。负责规划建设国家文化大数据综合数据中心，对接中华文化遗产标本库、中华民族文化基因库、中华文化资料库等。大数据系统运用大数据、云计算、区块链等技术，贯彻国家文化大数据标准体系，采用国际标准进行信息文件关联标识，建设国家文化大数据确权、交易、结算和支付平台,

　　3、区域中心：区域中心是建立在全国有线电视网络和平台基础上的数据中心。它与国家中心相连，与省中心相连。负责提供数据、信息、产品等专业服务。

　　4. 省级中心：在各省（区、市）建设省级中心，通过区域中心与国家中心相连，负责地方文化数据的存储、传输和安全，与资源终端（地方数据库）和生产对接省内终端（数字文化产线）和消费端（文化体验系统），为省内数据、信息、产品等提供确认、交易、结算、支付等专业服务。

　　5、IT基础设施构成：包括计算资源、存储资源、网络资源等资源。相关资源可自建或租用部署，但应建立容灾系统和数据备份，并采取有效的安全隔离措施，防止基础设施平台内不同客户间的风险传递。

　　6、安全监控要求：一是对核心资产、各类威胁和违规行为、网络东西南北流量进行持续检测分析，提升整体网络安全防护能力。二是定期检查、及时更新安全产品（软硬件）病毒库，做到实时防护和定期扫描。三是定期扫描文化数据服务中心各系统及相关设备的安全漏洞，及时修复。及时安装最新补丁，升级防护软件，确保信息安全。

　　7. 安全保护要求：一是对访问信息和数据进行安全保密管理，提供数据加密保护能力，数据传输和存储支持基于国密算法的加密保护，防止敏感数据泄露。漏水。二是提供数据库保护能力，支持发现（或阻断）对数据库系统的攻击，保护数据库系统的安全。三是提供敏感数据脱敏能力，支持敏感数据实时脱敏，实现对敏感隐私数据的可靠保护。四是提供数据水印保护能力，支持数据使用过程中的水印标记，实现数据泄露溯源。五是监控和阻断端口扫描、暴力破解攻击、木马后门攻击、拒绝服务攻击、缓冲区溢出攻击、IP分片攻击、网络蠕虫攻击等。数据库服务器应具备必要的入侵检测手段。

　　8、安全响应要求：一是具有快速响应和恢复能力，支持操作系统恢复、数据库系统恢复、网络配置恢复、文件恢复。二是定期对数据中心内的各种系统和数据进行备份，定期进行容灾演练，适当提供冗余，确保数据中心系统的可靠性和数据可恢复性。三是具备网络攻击溯源能力，包括攻击主体来源、攻击路径、攻击方式、攻击对象等。四是实现安全态势可视化呈现，从攻击事件、资产安全、溯源、运营监控等多个维度进行可视化展示，

　　文化数据服务平台技术要求

　　1.文化数据服务平台结构：按照国家文化大数据体系，分为国家文化数据服务平台、区域文化数据服务平台和省级文化数据服务平台。三类平台通过全国文化专网互联互通。

　　2、文化数据服务平台系统功能：包括用户管理系统、数据管理系统、文化数据确权系统、文化数据交易系统、文化数据分发系统、服务运营系统、服务监管系统、运维管理系统和服务门户等系统功能。

　　3、文化数据服务平台接口：通过统一认证服务接口向文化数据服务平台中的用户管理系统发起用户认证信息。

　　4、文化数据服务平台架构：主要由用户管理系统、数据管理系统、文化数据确权系统、文化数据交易系统、文化数据分发系统、服务运营系统、服务监管系统、运维管理系统和服务组成门户等组成，各系统互联互通，实现数据和业务互通。

　　5、平台安全：遵循GB/T 22239-2019信息安全技术和网络安全等级保护的基本要求，并按照国家信息安全相关规定采取相应措施，确保文化的准确性、完整性、可信度和可信度大数据。可信、保密、防篡改。具体要求包括：第一，利用资源、角色等权限控制机制，控制用户的业务操作访问权限。二是系统要在核心操作环节保留日志记录，确保每一个操作都有据可查。三是采用跨主机多副本机制来保证数据的可靠性，即可以将一份数据分成2~3份，分布在不同的主机上。当部分主机无法提供服务时，另起一份全一致性副本，业务不会受到任何影响。此外，还应有带外备份数据保护机制。

　　国家文化专网技术要求

　　1、国家文化专网承载网：以有线电视网络现有网络资源为基础，可用资源包括有线网络资源和广播电视移动通信网络资源。有线网络资源主要包括光缆网络、传输网络和数据网络三类资源。其中，光缆网络为传输网和数据网提供光纤传输通道，直接为文化数据服务中心提供光纤租用服务；网络在提供传输电路通道的同时，也直接为文化数据服务中心提供传输电路服务；数据网络为文化数据服务中心或直接为业务系统提供数据通信服务。广电移动通信网络为文化数据服务中心和业务系统提供无线通信服务，或通过边缘计算等形式为业务系统提供算力服务。

　　2、国家文化专网算力网络：为业务系统提供数据共享所需的计算和存储能力，以及通用安全、管理、算法等基础服务能力。算力网络主要由各类文化数据服务中心建设或租用的数据中心计算资源组成。这些资源互联互通，形成覆盖全国的虚拟化专网，为各类文化大数据运营主体提供透明的算力服务。

　　3、国家文化专网的作用：一是为各级文化数据服务中心提供数据传输通道；提供数据访问通道。文化机构通过底层协会集成系统接入全国文化专网，实现向文化专网中的文化数据库提供文化资源数据聚合能力，从文化数据库中获取文化资源数据的能力，以及在文化数据服务平台登记和发布文化数据。资源数据和文化数字内容能力。文化体验设施和互联网通过文化体验网关接入全国文化专网，从文化数据服务中心的文化数据服务平台获取各种文化数字内容。底层协会集成系统和文化体验网关应具备相关网络的安全访问控制能力。

　　（本文由高书生根据中国公共关系协会文化大数据行业委员会发布的《全国文化大数据系统系列团体标准》整理）

　　▼

AI时代内容工厂

解决方案:[网络安全] 二

0 个评论

发起人