汇总:材料数字化内容管理平台-搜象OCR解决方案

优采云 发布时间: 2022-12-11 10:59

  汇总:材料数字化内容管理平台-搜象OCR解决方案

  素材数字内容管理平台-识别内容管理

  素材数字内容管理平台——全文检索

  产品特点 卓越的用户体验

  这取决于我们早期对架构方案的技术选择以及我们在设计和开发中对细节的关注。

  支持图片、PDF和压缩文件上传,支持多应用通道访问

  图片支持但不限于jpg、jpeg、png、bmp、gif、tif、tiff、jfif、heic、jpe、dib格式;压缩文件支持兼容Windows和Linux的ZIP格式,自动从压缩文件中提取图像和PDF识别。支持平台本地上传,支持多系统频道接入上传。

  图像无失真压缩、旋转

  

  几M大小的图像可以压缩到100多到200多K而不失真,适合*敏*感*词*存储。可以开启自动旋转系统参数,对非正片图像进行旋转存储。

  分布式对象存储

  面向非结构化图片和PDF数据的底层对象存储,面向*敏*感*词*数据场景的组件的高性能读写、多节点分布式存储。

  内容标签聚类,热门趋势

  默认文本识别结果自动打标签,可按需自定义,内容标签自动聚合,热门标签排序置顶,点击标签即可检索相关图片和PDF页面。

  全文搜索,组合条件搜索

  集成Elasticsearch强大的检索能力,支持中文分词搜索、精确搜索、模糊搜索、字符串匹配搜索等多种条件组合下的复杂搜索。

  自定义数据统一查询服务

  通过简单的编写类SQL脚本,即可定制平台的数据API,提供给外部应用通道调用。

  

  异步总线方式,提高系统并发性和稳定性

  基于Kafka消息队列的总线模式,可以有效降低处理数据时对数据库的依赖,有效缓存和削峰,提高并发处理能力,使系统稳定运行。

  工业级安全认证和权限控制

  OAuth2协议标准用于用户访问的安全认证,独立的权限管理服务将用户的权限粒度控制到菜单/按钮权限、数据权限和界面权限。

  大数据支持

  在大数据存储和计算方面,平台相关组件支持分布式和横向扩展,如分布式文件存储、NewSql数据库、分布式搜索引擎、分布式消息总线等。

  容器化运维

  该平台使用容器化结合技术进行部署和维护。

  【详情请来电:】@搜米信息技术

  解决方案:「网络安全」信息收集系列|子域名收集姿势总结

  免责声明:本文的初衷是分享网络安全知识。请不要利用技术进行任何危害网络安全的行为。因传播和使用本文提供的信息而造成的任何直接或间接的后果和损失由用户自行负责

  概述

  在渗透测试或SRC漏洞挖掘中,安全测试人员通常会得到一些域名资产。为了更好的进行渗透测试,通常需要采集子域名。

  为什么需要采集子域名?

  扩大资产范围可以增加漏洞发现的概率

  众所周知,一般情况下,主站的安全性可能比较高,而一些不常见的分站或上线不久的站点在安全性上可能没有得到充分考虑,可能成为主站的漏洞点目标系统

  通常,同一个组织极有可能使用同一个应用构建多个服务,补丁情况可能大致相同,所以出现同一个漏洞的概率非常高

  采集子域名通常有两种方式,即被动采集和主动采集。

  被动采集是指在不与目标系统交互的情况下由第三方采集。这种方式具有明显的优势,因为不需要与目标系统交互,所以不会对目标系统造成任何影响,也不会触发安全产品的告警。

  被动子域名采集方式:

  信息泄露

  搜索引擎

  网络空间映射引擎

  证书透明度

  第三方 DNS 服务

  AS号查询

  SAN 集合

  使用公共数据集

  主动采集是指通过与目标系统交互来采集子域。由于需要与目标系统进行交互,容易出现高频访问,存在违反安全产品告警的风险。

  主动采集子域名的方法:

  字典枚举

  位移扫描

  域转移漏洞

  DNSSEC

  DNS缓存

  被动子域集合

  信息泄露

  【→关注我获取所有资源,回复“资料”获取←】

  1.网络安全学习路线

  2. 电子书(白帽子)

  3.安防厂内部视频

  4. 100个src文件

  5. 常见的安全面试问题

  6.ctf比赛经典题目解析

  7.全套工具包

  八、应急处置须知

  搜索引擎

  常用的搜索引擎有谷歌和百度,基本搜索语法:

  site:*.baidu.com

  一般作为工具集的补充,也可以编写脚本进行批量操作

  网络资产搜索引擎

  常见的空间映射引擎:

  初段

  变焦眼

  佛法

  使用语法直接在搜索框中搜索,基本语法:

  domain=Your_domain

  您还可以使用 API 进行搜索

  echo 'domain="baidu.com"' | base64 - | xargs -I{} curl "https://fofa.info/api/v1/search/all?email=${Your_Mail}&key=${Your_Key}&page=1&qbase64={}"

  然后写一个脚本简单处理返回的数据,得到一个子域名列表。

  import requests

from base64 import b64encode

import json

# 配置信息

domain = 'domain="baidu.com"'

domain = str(b64encode(domain.encode("utf-8")), "utf-8")

email = "Your_email"

key = "Your_key"

# end

url = "https://fofa.info/api/v1/search/all?email={email}&key={key}&qbase64={domain}".format(email=email, key=key, domain=domain) + "&page={page}"

page = 1

subdomain = list()

while True:

url = url.format(page=str(page))

req = requests.get(url=url).text

result = json.loads(req)['results']

if result:

<p>

tmp = [i[0] for i in result]

subdomain += tmp

else:

break

page += 1

print(set(subdomain)) # 去重</p>

  注意:这里的代码只是为了展示处理逻辑,还没有考虑优化处理。

  第三方 DNS 服务

  病毒总数

  VirusTotal 运行 DNS 复制功能,通过存储用户访问 URL 时执行的 DNS 解析来构建其数据库。

  其他在线DNS工具总结:

  证书透明度

  普通证书透明查询网站

  人口统计:

  crtsh:

  *敏*感*词*:

  证书侦察员:

  委托:

  Facebook:

  谷歌:

  使用起来也比较简单,直接搜索主域名即可。因为这种方式的原理是基于日志信息采集,只增不减,所以可能会出现一些无效的子域名。

  ASN

  AS 编号有助于识别属于可能具有有效域的组织的网络块

  查找 ASN

  使用nmap查找

  nmap --script targets-asn --script-args targets-asn.asn=Your_asn > netblocks.txt

  fofa 等网络空间地图引擎也支持 ASN 查找

  存储区

  SAN(Subject Alternative Name)是 SSL 标准 x509 中定义的扩展。使用SAN字段的SSL证书可以扩展该证书支持的域名,使一张证书可以支持多个不同域名的解析。

  允许使用安全证书中的 subjectAltName 字段将各种值与证书相关联,称为主题替代名称。该名称可能包括:IP 地址、DNS 名称等。

  下面是一个使用 Firefox 浏览器的例子:

  也可以使用appsecco提供的shell脚本:

<p>sed -ne &#39;s/^\( *\)Subject:/\1/p;/X509v3 Subject Alternative Name/{

N;s/^.*\n//;:a;s/^\( *\)\(.*\), /\1\2\n\1/;ta;p;q; }&#39; <

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线