话题：文章采集调用 - 自动文章采集器-优采云官网

解决方案:微服务下链路追踪与日志埋点第二篇-链路追踪

采集交流 • 优采云发表了文章 • 0 个评论 • 126 次浏览 • 2022-11-07 18:25 • 来自相关话题

　　解决方案:微服务下链路追踪与日志埋点第二篇-链路追踪
　　上面简单解释了什么是链接跟踪和日志埋藏，以及它们想要达到什么效果。
　　本来主要讲的是链接的最终实现。
　　链接跟踪的概念
　　tranceID：全局基于id，可以理解为请求整个过程的唯一标识
　　spanID：调用者的ID，可以理解为一个链接在整个请求过程中的唯一标识
　　parentSpanId：调用端的父ID，即当前链接的上一个链接的标识
　　cs(client send)：客户端发送请求标识符，
　　
　　cr(client receive)：客户端接收返回请求标识，两个用户计算通话结束时间。
　　ss（服务器发送）：服务器返回请求标识符：两者用于计算服务调用的结束时间。
　　sr（服务器接收）：服务器接收请求标识符
　　采样率：控制链路组接口的采样量
　　这里只提取主要概念，具体内容可以在以下地址找到
　　链接跟踪的基本实现
　　链接跟踪的框架有很多，我个人接触过的有pinpoint和zipkin。
　　Pinpoint 以探针的形式实现链路跟踪。虽然对代码没有侵入，但对探针开发的要求比较高。
　　
　　而zipkin，作为spring-cloud-sleuth背书的解决方案，显然已经成为了我的首选。毕竟，强大的社区是一件严肃的事情，剩下的只是不必要的麻烦。
　　通过查看spring-could-sleuth的文档可以知道，我们可以通过依赖加载来实现链接跟踪。他会自动为我们添加tranceID和spanID到日志中，并且可以通过配置将日志发送到zipkin。链接可视化界面通过zipkin展示。我们可以配置更多的东西发送到 zipkin，比如 sql 执行状态等。【详情见官方文档】。
　　随着默认配置的实现，我还需要两件事
　　在链接跟踪中，我需要能够操纵链接上下文以添加一些自定义参数，这将为将来的页面掩埋铺平道路。在spring-cloud-sleuth中，是通过bagage来实现的。链接信息集成到ES中，可以通过zipkin实现，为后续ELK的集成提供方便。注意：上面提到的bagage不能被zipkin采集访问，但是sleuth已经想到了这个问题，并且打通了bagage和MDG和zipkin的TAG的关系，所以不用担心. 综上所述
　　至此，我认为上一篇文章提到的调用链埋点的问题已经解决了，我们现在有了以下能力
　　可以为日志埋点提供唯一标识【通过阅读spring-cloud-sleuth的文档可以知道这是通过MDC实现的】
　　通过zipkin获取可视化调用链提供日志嵌入的tranceID和spanID【通过阅读spring-cloud-sleuth的文档可以知道这是通过MDC实现的】提供页面嵌入添加参数的能力【通过bagage】
　　和平与爱
　　解决方案:天津优化网站关键词【天津优化网站关键词网站建设制作模板建站】
　　天津优化网站关键词网站建设和生产模板建站平台
　　高端网站设计天津优化网站关键词平台值得您免费注册使用
　　▶1.网站模板免费使用，3000+海量网站行业模板供您选择
　　▶阿拉伯数字。维护网站简单，可自由修改网站施工网站模板
　　▶3.丰富的覆盖功能，稳定的产品，持续每周更新，优质服务
　　
　　▶4.覆盖电脑网站、手机网站、小程序、微网站等显示终端
　　▶5.高性价比网站施工方案，买三年送三年
　　天津优化网站关键词网站为各行各业提供免费网站模板
　　▶ 此外，天津优化网站关键词可以定制服务，也可以使用免费模板自行构建，无需懂代码
　　
　　▶ 只要您知道如何使用计算机，就可以制作网站，并且有客户服务专家教您
　　▶ 我们如何打造天津网站优化网站关键词网站优势的公司
　　▶ 您无需编写自己的代码
　　▶ 即使您不知道如何编码，也可以轻松制作网站
　　▶ 一键免费注册可以让建站网站
　　▶ 易于使用的网站构建步骤
　　▶ 网站四合一查看全部

　　解决方案:微服务下链路追踪与日志埋点第二篇-链路追踪
　　上面简单解释了什么是链接跟踪和日志埋藏，以及它们想要达到什么效果。
　　本来主要讲的是链接的最终实现。
　　链接跟踪的概念
　　tranceID：全局基于id，可以理解为请求整个过程的唯一标识
　　spanID：调用者的ID，可以理解为一个链接在整个请求过程中的唯一标识
　　parentSpanId：调用端的父ID，即当前链接的上一个链接的标识
　　cs(client send)：客户端发送请求标识符，
　　

　　cr(client receive)：客户端接收返回请求标识，两个用户计算通话结束时间。
　　ss（服务器发送）：服务器返回请求标识符：两者用于计算服务调用的结束时间。
　　sr（服务器接收）：服务器接收请求标识符
　　采样率：控制链路组接口的采样量
　　这里只提取主要概念，具体内容可以在以下地址找到
　　链接跟踪的基本实现
　　链接跟踪的框架有很多，我个人接触过的有pinpoint和zipkin。
　　Pinpoint 以探针的形式实现链路跟踪。虽然对代码没有侵入，但对探针开发的要求比较高。
　　

　　而zipkin，作为spring-cloud-sleuth背书的解决方案，显然已经成为了我的首选。毕竟，强大的社区是一件严肃的事情，剩下的只是不必要的麻烦。
　　通过查看spring-could-sleuth的文档可以知道，我们可以通过依赖加载来实现链接跟踪。他会自动为我们添加tranceID和spanID到日志中，并且可以通过配置将日志发送到zipkin。链接可视化界面通过zipkin展示。我们可以配置更多的东西发送到 zipkin，比如 sql 执行状态等。【详情见官方文档】。
　　随着默认配置的实现，我还需要两件事
　　在链接跟踪中，我需要能够操纵链接上下文以添加一些自定义参数，这将为将来的页面掩埋铺平道路。在spring-cloud-sleuth中，是通过bagage来实现的。链接信息集成到ES中，可以通过zipkin实现，为后续ELK的集成提供方便。注意：上面提到的bagage不能被zipkin采集访问，但是sleuth已经想到了这个问题，并且打通了bagage和MDG和zipkin的TAG的关系，所以不用担心. 综上所述
　　至此，我认为上一篇文章提到的调用链埋点的问题已经解决了，我们现在有了以下能力
　　可以为日志埋点提供唯一标识【通过阅读spring-cloud-sleuth的文档可以知道这是通过MDC实现的】
　　通过zipkin获取可视化调用链提供日志嵌入的tranceID和spanID【通过阅读spring-cloud-sleuth的文档可以知道这是通过MDC实现的】提供页面嵌入添加参数的能力【通过bagage】
　　和平与爱
　　解决方案:天津优化网站关键词【天津优化网站关键词网站建设制作模板建站】
　　天津优化网站关键词网站建设和生产模板建站平台
　　高端网站设计天津优化网站关键词平台值得您免费注册使用
　　▶1.网站模板免费使用，3000+海量网站行业模板供您选择
　　▶阿拉伯数字。维护网站简单，可自由修改网站施工网站模板
　　▶3.丰富的覆盖功能，稳定的产品，持续每周更新，优质服务
　　

　　▶4.覆盖电脑网站、手机网站、小程序、微网站等显示终端
　　▶5.高性价比网站施工方案，买三年送三年
　　天津优化网站关键词网站为各行各业提供免费网站模板
　　▶ 此外，天津优化网站关键词可以定制服务，也可以使用免费模板自行构建，无需懂代码
　　

　　▶ 只要您知道如何使用计算机，就可以制作网站，并且有客户服务专家教您
　　▶ 我们如何打造天津网站优化网站关键词网站优势的公司
　　▶ 您无需编写自己的代码
　　▶ 即使您不知道如何编码，也可以轻松制作网站
　　▶ 一键免费注册可以让建站网站
　　▶ 易于使用的网站构建步骤
　　▶ 网站四合一

详细解析:Java性能分析神器-JProfiler详解

采集交流 • 优采云发表了文章 • 0 个评论 • 462 次浏览 • 2022-11-07 06:13 • 来自相关话题

　　详细解析:Java性能分析神器-JProfiler详解
　　一、什么是JProfiler JProfiler是ej-technologies GmbH开发的性能瓶颈分析工具（该公司也开发部署工具）。其特点：使用方便，界面友好，操作友好，对被分析应用影响小平台 2. 数据采集Q1. 既然 JProfiler 是一个性能瓶颈分析工具，那么这些分析的相关数据是从哪里来的呢？Q2。JProfiler 如何采集和显示这些数据？A1。分析数据主要来自以下两部分 1、部分来自jvm分析接口**JVMTI**（JVM Tool Interface），JDK必须>=1.6JVMTI是基于事件的系统。分析代理库可以为不同的事件注册处理函数。然后它可以启用或禁用选定的事件，例如：对象生命周期、线程生命周期等。
　　3. JProfiler Agent（如果不了解Agent，请看文章Part 3“启动模式”）收到指令后，将指令转换成相关事件或需要监控的指令，注册到JVMTI 或者直接让JProfiler Agent JVMTI 执行一个功能（比如dump jvm 内存） 4. JVMTI 根据注册的事件采集当前jvm 的信息。例如：线程的生命周期；jvm的生命周期；类的生命周期；对象实例的生命周期；堆内存等的实时信息，按照一定的规则（如果所有数据都发送到JProfiler GUI，将对正在分析的应用网络产生较大的影响） 6. 返回JProfiler GUI Socket.7。JProfiler GUI Socket 将接收到的信息返回给 JProfiler GUI Render8。JProfiler GUI Render 渲染最终的显示效果 3. Data采集方法和启动方式 A1. JProfier采集方法分为两种：Sampling(sample采集)和InstrumentationSampling：类似于sample统计，每个线程栈的method stack中的信息都是定时（5ms）统计的。
　　优点是对应用影响不大（即使不配置任何Filter，Filter可以参考文章第四部分），缺点是不能提供一些数据/特征（例如：方法调用次数） Instrumentation：在类加载之前，JProfier将相关的功能代码写入待分析的类中，对运行的jvm有一定的影响。优点：功能强大，但是如果要分析的类很多，对应用的影响会比较大。一般与Filter配合使用。所以一般的JRE类和框架类通常在Filter中被过滤掉。注意：JProfiler 本身并没有指明采集类型的数据，这里的采集类型是采集类型用于方法调用。因为JProfiler的大部分核心功能都依赖于方法调用采集的数据，所以可以直接认为是JProfiler的数据采集类型。A2：启动方式：Attach方式可以直接将本机正在运行的jvm加载到JProfiler Agent中。优点是很方便，缺点是有些功能不能支持。如果选择 Instrumentation data采集方法，重写需要分析的类会花费一些额外的时间。Profile at startup 在被分析的 jvm 启动时手动将指定的 JProfiler Agent 加载到 jvm 中。Attach模式可以直接将本机正在运行的jvm加载到JProfiler Agent中。优点是很方便，缺点是有些功能不能支持。如果选择 Instrumentation data采集方法，重写需要分析的类会花费一些额外的时间。Profile at startup 在被分析的 jvm 启动时手动将指定的 JProfiler Agent 加载到 jvm 中。Attach模式可以直接将本机正在运行的jvm加载到JProfiler Agent中。优点是很方便，缺点是有些功能不能支持。如果选择 Instrumentation data采集方法，重写需要分析的类会花费一些额外的时间。Profile at startup 在被分析的 jvm 启动时手动将指定的 JProfiler Agent 加载到 jvm 中。
　　
　　JProfiler GUI通过socket向JProfiler Agent发送采集信息类型、策略等配置信息，收到信息后jvm才会启动。在分析的jvm的启动参数中添加如下内容：语法：-agentpath:[jprofilerti库的路径][注意]：语法不清楚也没关系，JProfiler提供了帮助向导。Prepare for profiling:和Profile at startup的主要区别：被分析的jvm可以在不从JProfiler GUI接收相关配置信息的情况下启动。离线 profiling 一般用于无法直接在线调试的场景。离线profiling需要打包信息采集内容和策略（部分Triggers请参考文章第五部分 ) 到一个配置文件（config.xml）中，当jvm在线启动并加载JProfiler Agent时，加载那个xml。然后JProfiler Agent会根据Trigger的类型生成不同的信息。例如：堆转储；线程转储；方法调用记录等语法：-agentpath:/home/2080/jprofiler8/bin/Linux-x64/libjprofilerti.so=offline,id=151,config=/home/2080/config.xml [注]：采集 config.xml中每个被分析的jvm的信息都有一个id来识别。
　　四。JProfiler核心概念Filter：需要分析什么类。有两种类型的过滤器收录和不收录。Profiling Settings: Receipt 采集 strategy: Sampling and Instrumentation，一些数据采集细节可以自定义。Triggers：一般用在**offline**模式，告诉JProfiler Agent什么时候触发什么行为来采集指定的信息。Live memory：关于类/类实例的信息。比如对象的数量和大小，对象创建的方法执行栈，对象创建的热点。Heap walker：静态分析一定时间内采集到的内存对象信息，功能强大，好用。收录传出引用、传入引用、最大对象等对象的CPU视图：CPU消耗分布和时间（cpu时间或运行时间）；方法执行图；方法执行统计（最大值、最小值、平均运行时间等）线程：当前jvm所有线程的运行状态，持有锁的线程的状态，可以dump线程。Monitors & locks：所有线程持有锁和锁信息 Telemetries：趋势图（遥测视图）包括堆、线程、gc、类等理解上面的相关概念。
　　JProfiler自带的例子如下：模拟内存泄露和线程阻塞的场景：具体源码参考：/jprofiler install path/demo/bezierLeak 内存模拟内存泄露，模拟阻塞模拟线程间锁的阻塞） A1 . 首先我们来分析一下内存泄漏的场景：（Check Leak Memory 模拟内存泄漏） 1. 在**Telemetries->Memory** 视图中，你会看到如下图所示的场景（你可以执行Run GC at查看过程中的intervals函数）：见下图蓝色区域，gc后老年代的内存大小（**valley**）在Live memory->中缓慢增加（理想情况下，这个值应该是稳定的） Recorded Objects 点击**记录分配数据**按钮，开始统计一段时间内创建的对象信息。
　　
　　最后，您看到的信息可能类似于下图。分析刚刚记录在Heap walker中的对象信息，点击实例最多的类。右键单击 **Use Selected Instances->Reference->Incoming Reference**。发现Long数据最终存放在**bezier.BaierAnim.leakMap**中。在 Allocations 选项卡中，右键单击其中一种方法以查看特定的源代码信息。【注意】：问题到这里已经很清楚了，明白为什么图17中的实例数是一样的，为什么fullgc后内存不能回收（老区的一个对象leakMap，put信息会也进入老区，如果leakMap不能回收，那么map中收录的对象也不能回收）。A2。
　　观察**Monitors & locks->Monitor History**一段时间后，你会发现出现锁的情况有4种。第一种：AWT-EventQueue-0线程持有Object锁，处于Waiting状态。下面的代码表示 Demo.block 方法调用了 object.wait 方法。这还是比较容易理解的。第二种：AWT-EventQueue-0持有bezier.BezierAnim$Demo实例上的锁，测试线程等待线程释放。注意下图底部的源代码。这个锁的原因是Demo的blcok方法会在AWT和测试线程中都执行，并且方法是同步的。第三种和第四种：测试线程会不断的发送事件给Event Dispatching Thread提交任务，导致对 java.awt.EventQueue 对象锁的竞争。提交任务的方式如下代码： repaint() 和 EventQueue.invokeLater public void run() {Thread me = Thread.currentThread();while (thread == me) {repaint();if (block) { block(false);}try {Thread.sleep(10);} catch (Exception e) {break;}EventQueue.invokeLater(new Runnable() {@Overridepublic void run() {onEDTMethod();}});} thread = null ;}六。最佳实践 JProfiler 会给出一些特殊操作的提示，此时最好仔细阅读说明。“标记当前”功能在某些场景下非常有效。Heap walker一般是Live memory中的静态分析-> while (thread == me) {repaint();if (block) {block(false);}try {Thread.sleep(10);} catch (Exception e) {break;}EventQueue.invokeLater(new Runnable() {@Overridepublic void run() {onEDTMethod();}});}thread = null ;}六。最佳实践 JProfiler 会给出一些特殊操作的提示，此时最好仔细阅读说明。“标记当前”功能在某些场景下非常有效。Heap walker一般是Live memory中的静态分析-> while (thread == me) {repaint();if (block) {block(false);}try {Thread.sleep(10);} catch (Exception e) {break;}EventQueue.invokeLater(new Runnable() {@Overridepublic void run() {onEDTMethod();}});}thread = null ;}六。最佳实践 JProfiler 会给出一些特殊操作的提示，此时最好仔细阅读说明。“标记当前”功能在某些场景下非常有效。Heap walker一般是Live memory中的静态分析-> 功能在某些场景下非常有效。Heap walker一般是Live memory中的静态分析-> 功能在某些场景下非常有效。Heap walker一般是Live memory中的静态分析->
　　这种现象是正常的。您可以在工具栏中的“开始录制”工具栏中配置一次性信息采集。收录和排除是有序的。注意，可以使用下图左下方的“Show Filter Tree”来验证order_2014_10_17_3_41_18_PM（图25）七。参考 JProfiler 助手：JVMTI：
　　免费的:文章采集器-免费文章采集工具大全
　　内容更新是增加现有内容流量的最佳方式之一，也是让您的自媒体或网站信息保持新鲜和更新的好方法。而文章采集器让你拥有自己的文章库，告别没有想法的写文章。网站填充数据内容不会遭受无内容填充。当你读了几万篇文章，创作了几千篇文章，你就会发现文章的所有写作技巧和营销套路。全网一键免费行业内容采集如图！
　　页面关键词和关键词密度优化
　　许多搜索引擎和自媒体平台使用页面的关键字密度来确定页面与关键字的相关性。相关性越高，页面的相关性就越高。因此，应确保关键词在整个网页中得到充分合理的利用。
　　关键词分布式布局的具体方法是：
　　● 利用所有可用的因素，但不要重复或简单地安排关键词；
　　● 遵循必要的语法规则，形成自然流畅的句子，使网页更具吸引力；
　　● 从页面因素优化的角度，考虑在页面标题元素、页面描述/关键字元素、正文标题、正文内容、文本链接和 ALT 标记之间分配关键字。
　　
　　如何优化内容
　　1.标题很吸引人
　　俗话说，一个好的开始是成功的一半，所以创造一个有吸引力的标题是成功的第一步。除了引人入胜之外，内容标题还应突出网站核心关键词。研究表明，文章作品通常只吸引 5 秒。
　　如果文章标题未能引起用户的兴趣，让用户继续浏览内容，则用户继续浏览内容的希望渺茫。如果我们的文章标题更吸引人、更新颖，可以立即激发用户的阅读兴趣，这样才能让用户在我们的网站上停留更久。
　　2.提高内容质量
　　优质的原创内容是网站优化的基础，是提升企业品牌形象的关键。因此，高质量的原创文章可以更好地满足搜索引擎的需求，最大限度地满足用户的搜索需求。所以，只有写出更多符合搜索引擎和用户需求的文章，他们才会更加喜欢和认可我们的网站。
　　在内容优化的过程中，除了优质的原创内容外，还要注意内容的更新时间。定时更新时间方便搜索引擎抓取收录，也能有效培养用户行为习惯，实现原创内容。网站整体流量稳步增长。
　　3.内容不断更新
　　
　　可持续的内容也是网站运营成功的关键。随着时间的推移，网站中已经收录的部分内容会为网站带来更多的流量和更高的权重。
　　如果网站的内容不断更新，保证新鲜度和及时性，用户可以随时随地感受我们的网站变化，增加页面收录。只有每天更新一些优质内容，呈现给用户，才能全面提升网站的权重。对于一些长期不更新内容的网站来说，总会面临被降级的风险。
　　4.内容关键词合理布局
　　关键词布局可以在一定程度上促进网站内容的优化。关键词密度是指关键词在文章文章中出现的频率和次数。通常，关键词会分布在文章的开头、中间和结尾。以关键词为文章开始，文章的整体权重也会增加。
　　因为搜索引擎遵循从左到右的模式来索引和捕获信息，所以文章的开头通常是搜索引擎首先读取的内容。
　　但是在使用关键词布局的时候，一定要注意适度，即要保证关键词以最自然的方式适配文章，没有关键词堆积的现象，否则我们的网站将面临被降级的风险。返回搜狐，查看更多查看全部

　　详细解析:Java性能分析神器-JProfiler详解
　　一、什么是JProfiler JProfiler是ej-technologies GmbH开发的性能瓶颈分析工具（该公司也开发部署工具）。其特点：使用方便，界面友好，操作友好，对被分析应用影响小平台 2. 数据采集Q1. 既然 JProfiler 是一个性能瓶颈分析工具，那么这些分析的相关数据是从哪里来的呢？Q2。JProfiler 如何采集和显示这些数据？A1。分析数据主要来自以下两部分 1、部分来自jvm分析接口**JVMTI**（JVM Tool Interface），JDK必须>=1.6JVMTI是基于事件的系统。分析代理库可以为不同的事件注册处理函数。然后它可以启用或禁用选定的事件，例如：对象生命周期、线程生命周期等。
　　3. JProfiler Agent（如果不了解Agent，请看文章Part 3“启动模式”）收到指令后，将指令转换成相关事件或需要监控的指令，注册到JVMTI 或者直接让JProfiler Agent JVMTI 执行一个功能（比如dump jvm 内存） 4. JVMTI 根据注册的事件采集当前jvm 的信息。例如：线程的生命周期；jvm的生命周期；类的生命周期；对象实例的生命周期；堆内存等的实时信息，按照一定的规则（如果所有数据都发送到JProfiler GUI，将对正在分析的应用网络产生较大的影响） 6. 返回JProfiler GUI Socket.7。JProfiler GUI Socket 将接收到的信息返回给 JProfiler GUI Render8。JProfiler GUI Render 渲染最终的显示效果 3. Data采集方法和启动方式 A1. JProfier采集方法分为两种：Sampling(sample采集)和InstrumentationSampling：类似于sample统计，每个线程栈的method stack中的信息都是定时（5ms）统计的。
　　优点是对应用影响不大（即使不配置任何Filter，Filter可以参考文章第四部分），缺点是不能提供一些数据/特征（例如：方法调用次数） Instrumentation：在类加载之前，JProfier将相关的功能代码写入待分析的类中，对运行的jvm有一定的影响。优点：功能强大，但是如果要分析的类很多，对应用的影响会比较大。一般与Filter配合使用。所以一般的JRE类和框架类通常在Filter中被过滤掉。注意：JProfiler 本身并没有指明采集类型的数据，这里的采集类型是采集类型用于方法调用。因为JProfiler的大部分核心功能都依赖于方法调用采集的数据，所以可以直接认为是JProfiler的数据采集类型。A2：启动方式：Attach方式可以直接将本机正在运行的jvm加载到JProfiler Agent中。优点是很方便，缺点是有些功能不能支持。如果选择 Instrumentation data采集方法，重写需要分析的类会花费一些额外的时间。Profile at startup 在被分析的 jvm 启动时手动将指定的 JProfiler Agent 加载到 jvm 中。Attach模式可以直接将本机正在运行的jvm加载到JProfiler Agent中。优点是很方便，缺点是有些功能不能支持。如果选择 Instrumentation data采集方法，重写需要分析的类会花费一些额外的时间。Profile at startup 在被分析的 jvm 启动时手动将指定的 JProfiler Agent 加载到 jvm 中。Attach模式可以直接将本机正在运行的jvm加载到JProfiler Agent中。优点是很方便，缺点是有些功能不能支持。如果选择 Instrumentation data采集方法，重写需要分析的类会花费一些额外的时间。Profile at startup 在被分析的 jvm 启动时手动将指定的 JProfiler Agent 加载到 jvm 中。
　　

　　JProfiler GUI通过socket向JProfiler Agent发送采集信息类型、策略等配置信息，收到信息后jvm才会启动。在分析的jvm的启动参数中添加如下内容：语法：-agentpath:[jprofilerti库的路径][注意]：语法不清楚也没关系，JProfiler提供了帮助向导。Prepare for profiling:和Profile at startup的主要区别：被分析的jvm可以在不从JProfiler GUI接收相关配置信息的情况下启动。离线 profiling 一般用于无法直接在线调试的场景。离线profiling需要打包信息采集内容和策略（部分Triggers请参考文章第五部分 ) 到一个配置文件（config.xml）中，当jvm在线启动并加载JProfiler Agent时，加载那个xml。然后JProfiler Agent会根据Trigger的类型生成不同的信息。例如：堆转储；线程转储；方法调用记录等语法：-agentpath:/home/2080/jprofiler8/bin/Linux-x64/libjprofilerti.so=offline,id=151,config=/home/2080/config.xml [注]：采集 config.xml中每个被分析的jvm的信息都有一个id来识别。
　　四。JProfiler核心概念Filter：需要分析什么类。有两种类型的过滤器收录和不收录。Profiling Settings: Receipt 采集 strategy: Sampling and Instrumentation，一些数据采集细节可以自定义。Triggers：一般用在**offline**模式，告诉JProfiler Agent什么时候触发什么行为来采集指定的信息。Live memory：关于类/类实例的信息。比如对象的数量和大小，对象创建的方法执行栈，对象创建的热点。Heap walker：静态分析一定时间内采集到的内存对象信息，功能强大，好用。收录传出引用、传入引用、最大对象等对象的CPU视图：CPU消耗分布和时间（cpu时间或运行时间）；方法执行图；方法执行统计（最大值、最小值、平均运行时间等）线程：当前jvm所有线程的运行状态，持有锁的线程的状态，可以dump线程。Monitors & locks：所有线程持有锁和锁信息 Telemetries：趋势图（遥测视图）包括堆、线程、gc、类等理解上面的相关概念。
　　JProfiler自带的例子如下：模拟内存泄露和线程阻塞的场景：具体源码参考：/jprofiler install path/demo/bezierLeak 内存模拟内存泄露，模拟阻塞模拟线程间锁的阻塞） A1 . 首先我们来分析一下内存泄漏的场景：（Check Leak Memory 模拟内存泄漏） 1. 在**Telemetries->Memory** 视图中，你会看到如下图所示的场景（你可以执行Run GC at查看过程中的intervals函数）：见下图蓝色区域，gc后老年代的内存大小（**valley**）在Live memory->中缓慢增加（理想情况下，这个值应该是稳定的） Recorded Objects 点击**记录分配数据**按钮，开始统计一段时间内创建的对象信息。
　　

　　最后，您看到的信息可能类似于下图。分析刚刚记录在Heap walker中的对象信息，点击实例最多的类。右键单击 **Use Selected Instances->Reference->Incoming Reference**。发现Long数据最终存放在**bezier.BaierAnim.leakMap**中。在 Allocations 选项卡中，右键单击其中一种方法以查看特定的源代码信息。【注意】：问题到这里已经很清楚了，明白为什么图17中的实例数是一样的，为什么fullgc后内存不能回收（老区的一个对象leakMap，put信息会也进入老区，如果leakMap不能回收，那么map中收录的对象也不能回收）。A2。
　　观察**Monitors & locks->Monitor History**一段时间后，你会发现出现锁的情况有4种。第一种：AWT-EventQueue-0线程持有Object锁，处于Waiting状态。下面的代码表示 Demo.block 方法调用了 object.wait 方法。这还是比较容易理解的。第二种：AWT-EventQueue-0持有bezier.BezierAnim$Demo实例上的锁，测试线程等待线程释放。注意下图底部的源代码。这个锁的原因是Demo的blcok方法会在AWT和测试线程中都执行，并且方法是同步的。第三种和第四种：测试线程会不断的发送事件给Event Dispatching Thread提交任务，导致对 java.awt.EventQueue 对象锁的竞争。提交任务的方式如下代码： repaint() 和 EventQueue.invokeLater public void run() {Thread me = Thread.currentThread();while (thread == me) {repaint();if (block) { block(false);}try {Thread.sleep(10);} catch (Exception e) {break;}EventQueue.invokeLater(new Runnable() {@Overridepublic void run() {onEDTMethod();}});} thread = null ;}六。最佳实践 JProfiler 会给出一些特殊操作的提示，此时最好仔细阅读说明。“标记当前”功能在某些场景下非常有效。Heap walker一般是Live memory中的静态分析-> while (thread == me) {repaint();if (block) {block(false);}try {Thread.sleep(10);} catch (Exception e) {break;}EventQueue.invokeLater(new Runnable() {@Overridepublic void run() {onEDTMethod();}});}thread = null ;}六。最佳实践 JProfiler 会给出一些特殊操作的提示，此时最好仔细阅读说明。“标记当前”功能在某些场景下非常有效。Heap walker一般是Live memory中的静态分析-> while (thread == me) {repaint();if (block) {block(false);}try {Thread.sleep(10);} catch (Exception e) {break;}EventQueue.invokeLater(new Runnable() {@Overridepublic void run() {onEDTMethod();}});}thread = null ;}六。最佳实践 JProfiler 会给出一些特殊操作的提示，此时最好仔细阅读说明。“标记当前”功能在某些场景下非常有效。Heap walker一般是Live memory中的静态分析-> 功能在某些场景下非常有效。Heap walker一般是Live memory中的静态分析-> 功能在某些场景下非常有效。Heap walker一般是Live memory中的静态分析->
　　这种现象是正常的。您可以在工具栏中的“开始录制”工具栏中配置一次性信息采集。收录和排除是有序的。注意，可以使用下图左下方的“Show Filter Tree”来验证order_2014_10_17_3_41_18_PM（图25）七。参考 JProfiler 助手：JVMTI：
　　免费的:文章采集器-免费文章采集工具大全
　　内容更新是增加现有内容流量的最佳方式之一，也是让您的自媒体或网站信息保持新鲜和更新的好方法。而文章采集器让你拥有自己的文章库，告别没有想法的写文章。网站填充数据内容不会遭受无内容填充。当你读了几万篇文章，创作了几千篇文章，你就会发现文章的所有写作技巧和营销套路。全网一键免费行业内容采集如图！
　　页面关键词和关键词密度优化
　　许多搜索引擎和自媒体平台使用页面的关键字密度来确定页面与关键字的相关性。相关性越高，页面的相关性就越高。因此，应确保关键词在整个网页中得到充分合理的利用。
　　关键词分布式布局的具体方法是：
　　● 利用所有可用的因素，但不要重复或简单地安排关键词；
　　● 遵循必要的语法规则，形成自然流畅的句子，使网页更具吸引力；
　　● 从页面因素优化的角度，考虑在页面标题元素、页面描述/关键字元素、正文标题、正文内容、文本链接和 ALT 标记之间分配关键字。
　　

　　如何优化内容
　　1.标题很吸引人
　　俗话说，一个好的开始是成功的一半，所以创造一个有吸引力的标题是成功的第一步。除了引人入胜之外，内容标题还应突出网站核心关键词。研究表明，文章作品通常只吸引 5 秒。
　　如果文章标题未能引起用户的兴趣，让用户继续浏览内容，则用户继续浏览内容的希望渺茫。如果我们的文章标题更吸引人、更新颖，可以立即激发用户的阅读兴趣，这样才能让用户在我们的网站上停留更久。
　　2.提高内容质量
　　优质的原创内容是网站优化的基础，是提升企业品牌形象的关键。因此，高质量的原创文章可以更好地满足搜索引擎的需求，最大限度地满足用户的搜索需求。所以，只有写出更多符合搜索引擎和用户需求的文章，他们才会更加喜欢和认可我们的网站。
　　在内容优化的过程中，除了优质的原创内容外，还要注意内容的更新时间。定时更新时间方便搜索引擎抓取收录，也能有效培养用户行为习惯，实现原创内容。网站整体流量稳步增长。
　　3.内容不断更新
　　

　　可持续的内容也是网站运营成功的关键。随着时间的推移，网站中已经收录的部分内容会为网站带来更多的流量和更高的权重。
　　如果网站的内容不断更新，保证新鲜度和及时性，用户可以随时随地感受我们的网站变化，增加页面收录。只有每天更新一些优质内容，呈现给用户，才能全面提升网站的权重。对于一些长期不更新内容的网站来说，总会面临被降级的风险。
　　4.内容关键词合理布局
　　关键词布局可以在一定程度上促进网站内容的优化。关键词密度是指关键词在文章文章中出现的频率和次数。通常，关键词会分布在文章的开头、中间和结尾。以关键词为文章开始，文章的整体权重也会增加。
　　因为搜索引擎遵循从左到右的模式来索引和捕获信息，所以文章的开头通常是搜索引擎首先读取的内容。
　　但是在使用关键词布局的时候，一定要注意适度，即要保证关键词以最自然的方式适配文章，没有关键词堆积的现象，否则我们的网站将面临被降级的风险。返回搜狐，查看更多

专业知识:你有真正了解过国产开源框架APM工具——SkyWalking技术有多牛吗

采集交流 • 优采云发表了文章 • 0 个评论 • 138 次浏览 • 2022-11-04 16:22 • 来自相关话题

　　专业知识:你有真正了解过国产开源框架APM工具——SkyWalking技术有多牛吗
　　空中漫步技术
　　SkyWalking是提交给中国Apache孵化器的开源产品，这是一个可视化平台，用于采集，分析，聚合和可视化来自不同服务和本地基础服务的数据。SkyWalking 提供了一种简单的方法来清楚地了解分布式系统，甚至跨云服务。SkyWalking 符合 OpenTracing 规范，同时提供更现代、更酷的 UI，以便更直观地监控应用程序。SkyWalking的官方架构如下所示。
　　整个系统分为三个部分。
　　代理：采集并报告跟踪和指标信息。
　　● OAP：通过分析核心模块采集跟踪和指标信息，将数据放入持久化容器（内存数据库H2、MySQL等），进行二次统计和监控告警。
　　● Webapp：前端和后端分离，前端负责渲染，并将查询请求打包为 GraphQL 并提交给后端;后端通过功能区将负载均衡器转发到 OAP 群集，然后呈现并显示查询结果。
　　SkyWalking符合OpenTracing规范，调用链采集数据格式如下。
　　
　　空中漫步通道简介
　　创意本地启动：
　　开始使用罐子：
　　SkyWalking将TraceID与日志记录组件（Log4j，Logback，ELK等）集成在一起。
　　
　　SkyWalking的页面显示，以及整体服务呼叫统计信息DashBoard，如下图所示。
　　这
　　将显示调用链详细信息，如下图所示。
　　根据
　　从原理和功能上讲，监控系统可以分为三类：指标、日志和跟踪。对于不同的监控对象和监控数据类型，需要采用相应的技术栈和监控方法。对于 Spring Boot 微服务架构，除了开发框架自带的生产就绪组件支持服务的健康状态指标查询外，我们还需要引入第三方 ELK 框架作为日志监控组件，使用 Zipkin 和 SkyWalking 等组件实现调用链监控。
　　本文的内容是服务
　　监控治理、服务调用链技术、SkyWalking技术下一篇文章文章给大家讲解的内容是响应式微服务架构，响应式编程感觉文章好朋友可以转发这篇文章关注小编;谢谢大家的支持！
　　多种方法:一个推广人员经常用到的几种工具，你知道吗？
　　把我们当作专业人士。除了seo思维，日常工作中用到的工具和软件也很重要，因为好的工具软件可以帮助我们批量提高效率。
　　我们工作的时候，不仅关乎思想的投入，更关乎具体执行的效率。seo的基础知识是外推的。否则，如果你效率低下，也会对长期工作产生一定的影响。影响主要是对自信心的打击，特别是在工作量比较大的时候，对业务成果的打击。
　　以下是一些建议。这些是 SEO 外推器经常使用的一些工具。最常见的一种是我们需要执行关键词挖掘。我们可以使用市场上流行的关键词挖矿工具进行关键词挖矿和筛选。挖矿后，我们需要使用表单进行过滤，我们需要关键词。
　　
　　第二个是文档和文件的批量编辑工具。因为我们可能需要在 . 在我们要发布的帖子中，我们需要提前组织和添加它们。比如添加关键词或者添加一些特殊字符会批量添加，所以批处理工具也很重要。这样可以避免我们一一添加而浪费时间。
　　对于第三个，我们只需要使用一些批次的采集东西。比如批量URL链接采集，那么我们还需要使用专业工具批量采集，然后进行关键词排名和帖子查询收录。
　　再说一次，帖子的排版也很关键。我们需要使用专业的一键排版工具进行专业排版，这样可以节省更多的时间，我们也可以使用那些批量排版工具进行排版，目的是帮助我们节省排版时间。
　　
　　对于第五个，我们需要为那些素材库，或者一些网页准备一些软件。帮助我们采集和整理材料，这也很重要，因为现在我们要发布和我们。在教育中，seo 推断了一些与行业相关的事情。比如你在做纹身培训，就必须准备一些材料，用于纹身技术知识的课程讲解。因为相关性越高，用户喜欢的越多，对他们来说就越有价值，从而提高我们后期的转化和排名。
　　我们有第六个。专门查询关键词覆盖率的排名，或者和刚才提到的收录和关键词的页面排名一样的集成工具软件。不需要我们手动一一检查，那是浪费时间。如果你只有几十个字，那很好。如果涵盖了数十万个关键词查询，您将需要使用软件。.
　　做完一切，seo的基础知识就外推了，后面肯定需要发布。手动发布的效果肯定会更好，但是我们可以在市场上找到一些更好的发布软件，因为有很多论坛。贴吧是的，或者微博等一些需要发帖量比较大的平台，你可以用发帖软件发帖，但是你的时间设置必须是可以模拟人工操作的。这种发电软件如果模拟人工操作，按照人工操作的思路发布，就不会出现被封禁的情况，效果会更好。
　　最后，如果你有实力，还是可以做一点百度竞价的。百度竞价推广和信息流推广非常好。结合多种方法控制合理成本效果更好。今天，这些是教育和培训 SEO 外推人员使用的工具。查看全部

　　专业知识:你有真正了解过国产开源框架APM工具——SkyWalking技术有多牛吗
　　空中漫步技术
　　SkyWalking是提交给中国Apache孵化器的开源产品，这是一个可视化平台，用于采集，分析，聚合和可视化来自不同服务和本地基础服务的数据。SkyWalking 提供了一种简单的方法来清楚地了解分布式系统，甚至跨云服务。SkyWalking 符合 OpenTracing 规范，同时提供更现代、更酷的 UI，以便更直观地监控应用程序。SkyWalking的官方架构如下所示。
　　整个系统分为三个部分。
　　代理：采集并报告跟踪和指标信息。
　　● OAP：通过分析核心模块采集跟踪和指标信息，将数据放入持久化容器（内存数据库H2、MySQL等），进行二次统计和监控告警。
　　● Webapp：前端和后端分离，前端负责渲染，并将查询请求打包为 GraphQL 并提交给后端;后端通过功能区将负载均衡器转发到 OAP 群集，然后呈现并显示查询结果。
　　SkyWalking符合OpenTracing规范，调用链采集数据格式如下。
　　

　　空中漫步通道简介
　　创意本地启动：
　　开始使用罐子：
　　SkyWalking将TraceID与日志记录组件（Log4j，Logback，ELK等）集成在一起。
　　

　　SkyWalking的页面显示，以及整体服务呼叫统计信息DashBoard，如下图所示。
　　这
　　将显示调用链详细信息，如下图所示。
　　根据
　　从原理和功能上讲，监控系统可以分为三类：指标、日志和跟踪。对于不同的监控对象和监控数据类型，需要采用相应的技术栈和监控方法。对于 Spring Boot 微服务架构，除了开发框架自带的生产就绪组件支持服务的健康状态指标查询外，我们还需要引入第三方 ELK 框架作为日志监控组件，使用 Zipkin 和 SkyWalking 等组件实现调用链监控。
　　本文的内容是服务
　　监控治理、服务调用链技术、SkyWalking技术下一篇文章文章给大家讲解的内容是响应式微服务架构，响应式编程感觉文章好朋友可以转发这篇文章关注小编;谢谢大家的支持！
　　多种方法:一个推广人员经常用到的几种工具，你知道吗？
　　把我们当作专业人士。除了seo思维，日常工作中用到的工具和软件也很重要，因为好的工具软件可以帮助我们批量提高效率。
　　我们工作的时候，不仅关乎思想的投入，更关乎具体执行的效率。seo的基础知识是外推的。否则，如果你效率低下，也会对长期工作产生一定的影响。影响主要是对自信心的打击，特别是在工作量比较大的时候，对业务成果的打击。
　　以下是一些建议。这些是 SEO 外推器经常使用的一些工具。最常见的一种是我们需要执行关键词挖掘。我们可以使用市场上流行的关键词挖矿工具进行关键词挖矿和筛选。挖矿后，我们需要使用表单进行过滤，我们需要关键词。
　　

　　第二个是文档和文件的批量编辑工具。因为我们可能需要在 . 在我们要发布的帖子中，我们需要提前组织和添加它们。比如添加关键词或者添加一些特殊字符会批量添加，所以批处理工具也很重要。这样可以避免我们一一添加而浪费时间。
　　对于第三个，我们只需要使用一些批次的采集东西。比如批量URL链接采集，那么我们还需要使用专业工具批量采集，然后进行关键词排名和帖子查询收录。
　　再说一次，帖子的排版也很关键。我们需要使用专业的一键排版工具进行专业排版，这样可以节省更多的时间，我们也可以使用那些批量排版工具进行排版，目的是帮助我们节省排版时间。
　　

　　对于第五个，我们需要为那些素材库，或者一些网页准备一些软件。帮助我们采集和整理材料，这也很重要，因为现在我们要发布和我们。在教育中，seo 推断了一些与行业相关的事情。比如你在做纹身培训，就必须准备一些材料，用于纹身技术知识的课程讲解。因为相关性越高，用户喜欢的越多，对他们来说就越有价值，从而提高我们后期的转化和排名。
　　我们有第六个。专门查询关键词覆盖率的排名，或者和刚才提到的收录和关键词的页面排名一样的集成工具软件。不需要我们手动一一检查，那是浪费时间。如果你只有几十个字，那很好。如果涵盖了数十万个关键词查询，您将需要使用软件。.
　　做完一切，seo的基础知识就外推了，后面肯定需要发布。手动发布的效果肯定会更好，但是我们可以在市场上找到一些更好的发布软件，因为有很多论坛。贴吧是的，或者微博等一些需要发帖量比较大的平台，你可以用发帖软件发帖，但是你的时间设置必须是可以模拟人工操作的。这种发电软件如果模拟人工操作，按照人工操作的思路发布，就不会出现被封禁的情况，效果会更好。
　　最后，如果你有实力，还是可以做一点百度竞价的。百度竞价推广和信息流推广非常好。结合多种方法控制合理成本效果更好。今天，这些是教育和培训 SEO 外推人员使用的工具。

总结归纳:企查查SEO亮点分析、采集+精准词库=高权重

采集交流 • 优采云发表了文章 • 0 个评论 • 158 次浏览 • 2022-11-04 16:16 • 来自相关话题

　　总结归纳:企查查SEO亮点分析、采集+精准词库=高权重
　　最近又有朋友让我分析一下七叉叉。本着知识共享的原则，结合自己浅薄的认知和知识，给大家讲讲七叉叉的SEO亮点，希望能帮助更多的兄弟了解SEO。自然！
　　我之前也分析过顺奇网和58网。如果你喜欢它，你可以看看。58同城的词库比较笼统一点，七叉搜索比较准确。与以上两者相比，顺奇网的词更加复杂，不同的业务，不同的词库，不分级别。
　　（内容，模板）稀缺
　　现在很多人实现了SEO，仍然认为原创是SEO的核心。七叉叉就是对这种观点的最大否定。因为上面的信息基本都是采集。
　　不过目测采集的内容应该是调用国家数据库吧，因为国内每个企业的信息应该不会那么好采集，就算是采集，也有仍然是不准确的情况，因为非权威网站上的企业信息的信任度比较低。只有国家信息才能准确。
　　
　　内容解决了，七叉叉在用户体验和模板上都做得很好。我们在之前的课程中也谈到了影响网站排名和收录的因素，模板也是其中之一。.
　　大规模的网站到最后，绝对是一场量级的较量。词库决定权重，收录决定词库。收录这么大的规模，绝对不是几十上百人能做到的。
　　准确的词库定位
　　词库的定位与业务直接相关，但就竞争而言，七叉戟的词库远小于58同城的词库。七叉叉的词库一般以【企业名称】【法人名称、股东名称】为主，而58则主要以本地服务为主，比如XXX搬家、XXXX租车，大家自然明白很难关键词轻松。
　　
　　但是，词库的准确定位意味着客户将更加准确。当你的规模达到几千万、几亿的时候，长尾带来的流量是相当恐怖的，而这些恐怖流量的日访问量网站，增加的信任度绝不是普通小站点可比的.
　　就像之前和58聊天一样，以品牌流量为源头，带动网站的整体信任度。信任度高后，长尾流量来了，回馈给网站，一次又一次，良性循环！
　　学习和应用
　　其实为什么要分析七叉叉呢？因为七叉叉的词库难度比较低。我们可以将他的词库导出为权重站！
　　比如我之前做过人名站，可以做公司名站，或者其他站，毕竟有词库，而且内容是聚合的，即使是随机生成的，还是分分钟的分钟。
　　案例研究:用Python挖掘Twitter数据：数据采集
　　这是 7 部分系列的第 1 部分，专注于为各种用例挖掘 Twitter 数据。这是第一个文章，它专注于数据采集并作为基础。
　　Twitter 是一种流行的社交网络，用户可以在其中分享称为推文的短短信类消息。用户在 Twitter 上分享想法、链接和图片，记者评论现场活动，企业改进产品并吸引客户等等。使用 Twitter 的不同方式的列表可能很长，每天有 5 亿条推文，有大量数据等待分析。
　　这是一系列文章中的第一篇，专门用于使用 Python 进行 Twitter 数据挖掘。在第一部分，我们将了解 Twitter 数据采集的不同方式。一旦我们建立了一个数据集，我们将在接下来的会议中讨论一些有趣的数据应用程序。
　　注册应用程序
　　为了能够以编程方式访问 Twitter 数据，我们需要创建一个与 Twitter 的 API 交互的应用程序。
　　第一步是注册您的一个应用程序。值得注意的是，您需要转到浏览器，登录 Twitter（如果您尚未登录），然后注册一个新应用程序。您现在可以为您的应用程序选择名称和描述（例如“Mining Demo”或类似名称）。您将收到消费者密钥和消费者密码：这些是应用程序设置，应始终保密。在应用程序的配置页面上，您还可以要求获取访问令牌和访问令牌的密码。与消费者密钥类似，这些字符串也必须保密：它们为应用程序提供代表您的帐户访问 Twitter 的权限。默认权限是只读的，这在我们的案例中是我们需要的，但是如果您决定更改您的权限以在应用程序中提供更改功能，
　　重要提示：使用 Twitter 的 API 时存在速率限制，或者如果您想提供可下载的数据集，请参阅：>
　　您可以使用 Twitter 提供的 REST API 与他们的服务进行交互。还有一堆基于 Python 的客户端，我们可以一遍又一遍地回收。尤其是 Tweepy 是最有趣和最直接的一种，所以让我们一起安装它：
　　更新：Tweepy 发布的 3.4.0 版本 Python3 存在一些问题，目前绑定 GitHub 无法使用，所以在新版本出来之前我们会使用 3.3.0 版本。
　　更多更新：Tweepy 的 3.5.0 版本已经可用，并且似乎修复了 Python 3 上的上述问题。
　　为了授权我们的应用程序代表我们访问 Twitter，我们需要使用 OAuth 接口：
　　
　　API 变量现在是我们可以在 Twitter 上执行的大多数操作的入口点。
　　例如，我们可以看到我们自己的时间线（或我们的 Twitter 主页）：
　　Tweepy 提供了一个方便的光标接口来迭代不同类型的对象。在上面的示例中，我们使用 10 来限制我们正在阅读的推文数量，但当然我们可以访问更多。状态变量是 Status() 类的一个实例，是访问数据的一个很好的包装器。来自 Twitter API 的 JSON 响应在 _json 属性（带有前导下划线）上可用，它不是一个普通的 JSON 字符串，而是一个字典。
　　所以上面的代码可以重写来处理/存储JSON：
　　如果我们想要一个所有用户的列表怎么办？这里是：
　　那么我们所有推文的列表呢？也很简单：
　　通过这种方式，我们可以轻松地采集推文（以及更多）并将它们存储为原创 JSON 格式，可以根据我们的存储格式轻松地将其转换为不同的数据模型（许多 NoSQL 技术提供了一些批量导入功能）。
　　process_or_store() 函数是您的自定义实现的占位符。最简单的方法是您可以打印出 JSON，每行一条推文：
　　流动
　　
　　如果我们想“保持联系”并采集有关将要出现的特定事件的所有推文，我们需要 Streaming API。我们需要扩展 StreamListener() 来定义我们如何处理输入数据。一个使用 #python 标签采集所有新推文的示例：
　　根据不同的搜索词，我们可以在几分钟内采集到数千条推文。对于覆盖全球的现场赛事（世界杯、超级碗、奥斯卡等）尤其如此，因此请密切关注 JSON 文件以了解其增长速度，并考虑您的测试可能需要多少推文。上面的脚本会将每条推文保存在一个新行上，因此您可以使用 Unix shell 中的 wc -l python.json 命令来找出您采集了多少条推文。
　　您可以在下面的要点中看到 Twitter API 流的最小工作示例：
　　twitter_stream_downloader.py
　　总结
　　我们已经介绍了 tweepy 作为通过 Python 访问 Twitter 数据的相当简单的工具。根据明确的“推文”项目目标，我们可以采集几种不同类型的数据。
　　一旦我们采集了一些数据，我们就可以继续分析应用程序。在下文中，我们将讨论其中的一些问题。
　　简历：Marco Bonzanini 是英国伦敦的一名数据科学家。他活跃于 PyData 社区，喜欢研究文本分析和数据挖掘应用程序。他是《用 Python 掌握社交媒体挖掘》（2016 年 7 月出版）的作者。
　　原创>>
　　文章来源36大数据，微信大数聚36，36大数据是一家专注于大数据创业、大数据技术与分析、大数据业务与应用的网站。分享大数据的干货教程和大数据应用案例，提供大数据分析工具和数据下载，解决大数据产业链创业、技术、分析、商业、应用等问题，提供企业和数据在大数据产业链。行业从业者提供支持和服务。
　　来自：舒梦
　　结尾。查看全部

　　总结归纳:企查查SEO亮点分析、采集+精准词库=高权重
　　最近又有朋友让我分析一下七叉叉。本着知识共享的原则，结合自己浅薄的认知和知识，给大家讲讲七叉叉的SEO亮点，希望能帮助更多的兄弟了解SEO。自然！
　　我之前也分析过顺奇网和58网。如果你喜欢它，你可以看看。58同城的词库比较笼统一点，七叉搜索比较准确。与以上两者相比，顺奇网的词更加复杂，不同的业务，不同的词库，不分级别。
　　（内容，模板）稀缺
　　现在很多人实现了SEO，仍然认为原创是SEO的核心。七叉叉就是对这种观点的最大否定。因为上面的信息基本都是采集。
　　不过目测采集的内容应该是调用国家数据库吧，因为国内每个企业的信息应该不会那么好采集，就算是采集，也有仍然是不准确的情况，因为非权威网站上的企业信息的信任度比较低。只有国家信息才能准确。
　　

　　内容解决了，七叉叉在用户体验和模板上都做得很好。我们在之前的课程中也谈到了影响网站排名和收录的因素，模板也是其中之一。.
　　大规模的网站到最后，绝对是一场量级的较量。词库决定权重，收录决定词库。收录这么大的规模，绝对不是几十上百人能做到的。
　　准确的词库定位
　　词库的定位与业务直接相关，但就竞争而言，七叉戟的词库远小于58同城的词库。七叉叉的词库一般以【企业名称】【法人名称、股东名称】为主，而58则主要以本地服务为主，比如XXX搬家、XXXX租车，大家自然明白很难关键词轻松。
　　

　　但是，词库的准确定位意味着客户将更加准确。当你的规模达到几千万、几亿的时候，长尾带来的流量是相当恐怖的，而这些恐怖流量的日访问量网站，增加的信任度绝不是普通小站点可比的.
　　就像之前和58聊天一样，以品牌流量为源头，带动网站的整体信任度。信任度高后，长尾流量来了，回馈给网站，一次又一次，良性循环！
　　学习和应用
　　其实为什么要分析七叉叉呢？因为七叉叉的词库难度比较低。我们可以将他的词库导出为权重站！
　　比如我之前做过人名站，可以做公司名站，或者其他站，毕竟有词库，而且内容是聚合的，即使是随机生成的，还是分分钟的分钟。
　　案例研究:用Python挖掘Twitter数据：数据采集
　　这是 7 部分系列的第 1 部分，专注于为各种用例挖掘 Twitter 数据。这是第一个文章，它专注于数据采集并作为基础。
　　Twitter 是一种流行的社交网络，用户可以在其中分享称为推文的短短信类消息。用户在 Twitter 上分享想法、链接和图片，记者评论现场活动，企业改进产品并吸引客户等等。使用 Twitter 的不同方式的列表可能很长，每天有 5 亿条推文，有大量数据等待分析。
　　这是一系列文章中的第一篇，专门用于使用 Python 进行 Twitter 数据挖掘。在第一部分，我们将了解 Twitter 数据采集的不同方式。一旦我们建立了一个数据集，我们将在接下来的会议中讨论一些有趣的数据应用程序。
　　注册应用程序
　　为了能够以编程方式访问 Twitter 数据，我们需要创建一个与 Twitter 的 API 交互的应用程序。
　　第一步是注册您的一个应用程序。值得注意的是，您需要转到浏览器，登录 Twitter（如果您尚未登录），然后注册一个新应用程序。您现在可以为您的应用程序选择名称和描述（例如“Mining Demo”或类似名称）。您将收到消费者密钥和消费者密码：这些是应用程序设置，应始终保密。在应用程序的配置页面上，您还可以要求获取访问令牌和访问令牌的密码。与消费者密钥类似，这些字符串也必须保密：它们为应用程序提供代表您的帐户访问 Twitter 的权限。默认权限是只读的，这在我们的案例中是我们需要的，但是如果您决定更改您的权限以在应用程序中提供更改功能，
　　重要提示：使用 Twitter 的 API 时存在速率限制，或者如果您想提供可下载的数据集，请参阅：>
　　您可以使用 Twitter 提供的 REST API 与他们的服务进行交互。还有一堆基于 Python 的客户端，我们可以一遍又一遍地回收。尤其是 Tweepy 是最有趣和最直接的一种，所以让我们一起安装它：
　　更新：Tweepy 发布的 3.4.0 版本 Python3 存在一些问题，目前绑定 GitHub 无法使用，所以在新版本出来之前我们会使用 3.3.0 版本。
　　更多更新：Tweepy 的 3.5.0 版本已经可用，并且似乎修复了 Python 3 上的上述问题。
　　为了授权我们的应用程序代表我们访问 Twitter，我们需要使用 OAuth 接口：
　　

　　API 变量现在是我们可以在 Twitter 上执行的大多数操作的入口点。
　　例如，我们可以看到我们自己的时间线（或我们的 Twitter 主页）：
　　Tweepy 提供了一个方便的光标接口来迭代不同类型的对象。在上面的示例中，我们使用 10 来限制我们正在阅读的推文数量，但当然我们可以访问更多。状态变量是 Status() 类的一个实例，是访问数据的一个很好的包装器。来自 Twitter API 的 JSON 响应在 _json 属性（带有前导下划线）上可用，它不是一个普通的 JSON 字符串，而是一个字典。
　　所以上面的代码可以重写来处理/存储JSON：
　　如果我们想要一个所有用户的列表怎么办？这里是：
　　那么我们所有推文的列表呢？也很简单：
　　通过这种方式，我们可以轻松地采集推文（以及更多）并将它们存储为原创 JSON 格式，可以根据我们的存储格式轻松地将其转换为不同的数据模型（许多 NoSQL 技术提供了一些批量导入功能）。
　　process_or_store() 函数是您的自定义实现的占位符。最简单的方法是您可以打印出 JSON，每行一条推文：
　　流动
　　

　　如果我们想“保持联系”并采集有关将要出现的特定事件的所有推文，我们需要 Streaming API。我们需要扩展 StreamListener() 来定义我们如何处理输入数据。一个使用 #python 标签采集所有新推文的示例：
　　根据不同的搜索词，我们可以在几分钟内采集到数千条推文。对于覆盖全球的现场赛事（世界杯、超级碗、奥斯卡等）尤其如此，因此请密切关注 JSON 文件以了解其增长速度，并考虑您的测试可能需要多少推文。上面的脚本会将每条推文保存在一个新行上，因此您可以使用 Unix shell 中的 wc -l python.json 命令来找出您采集了多少条推文。
　　您可以在下面的要点中看到 Twitter API 流的最小工作示例：
　　twitter_stream_downloader.py
　　总结
　　我们已经介绍了 tweepy 作为通过 Python 访问 Twitter 数据的相当简单的工具。根据明确的“推文”项目目标，我们可以采集几种不同类型的数据。
　　一旦我们采集了一些数据，我们就可以继续分析应用程序。在下文中，我们将讨论其中的一些问题。
　　简历：Marco Bonzanini 是英国伦敦的一名数据科学家。他活跃于 PyData 社区，喜欢研究文本分析和数据挖掘应用程序。他是《用 Python 掌握社交媒体挖掘》（2016 年 7 月出版）的作者。
　　原创>>
　　文章来源36大数据，微信大数聚36，36大数据是一家专注于大数据创业、大数据技术与分析、大数据业务与应用的网站。分享大数据的干货教程和大数据应用案例，提供大数据分析工具和数据下载，解决大数据产业链创业、技术、分析、商业、应用等问题，提供企业和数据在大数据产业链。行业从业者提供支持和服务。
　　来自：舒梦
　　结尾。

干货教程:Python爬虫实现的微信公众号文章下载器

采集交流 • 优采云发表了文章 • 0 个评论 • 295 次浏览 • 2022-11-04 08:16 • 来自相关话题

　　干货教程:Python爬虫实现的微信公众号文章下载器
　　硒爬行过程
　　安装python selenium自动模块，使用selenium中的webdriver驱动浏览器获取cookies登录微信公众号后台；
　　使用webdriver功能需要安装对应浏览器的驱动插件。
　　注意：谷歌浏览器版本和chromedriver需要对应，否则启动时会报错。
　　微信公众号登录地址：
　　微信公众号文章的接口地址可以在微信公众号后台创建，可以从超链接函数中获取：
　　搜索公众号名称
　　获取要爬取的公众号fakeid
　　选择要爬取的公众号，获取文章的接口地址
　　文章列表翻页和内容获取
　　AnyProxy 代理批量采集
　　1、微信客户端：可以是安装了微信应用的手机，也可以是电脑上的安卓模拟器。
　　2、微信个人账号：采集的内容，不仅需要微信客户端，采集还需要微信个人账号。
　　3.本地代理服务器系统：通过Anyproxy代理服务器将公众号历史消息页面中文章的列表发送到自己的服务器。
　　4、文章列表分析存储系统，分析文章列表并建立采集队列，实现批量采集内容。
　　Fiddler 设置代理并抓包
　　通过捕获和分析多个账户，可以确定：
　　_biz：这个14位的字符串是每个公众号的“id”，可以从搜狗的微信平台获取。
　　uin：与访客相关，微信ID
　　key：与访问的公众号相关
　　步：
　　1、编写按钮向导脚本，在手机端自动点击公众号文章的列表页面，即“查看历史消息”；
　　2、使用fiddler代理劫持手机访问，将URL转发到php编写的本地网页；
　　3、将接收到的URL备份到php网页上的数据库中；
　　4、使用python从数据库中检索URL，然后进行正常爬取。
　　
　　潜在问题：
　　如果只是想爬文章的内容，貌似没有访问频率限制，但是如果想爬读点赞数，一定频率后返回值会变空。
　　付费平台
　　例如，如果你只是想看数据，你可以不花钱只看每日清单。如果你需要访问自己的系统，他们也提供了一个api接口
　　3 项目步骤
　　3.1 基本原则
　　目标爬取网站收录微信平台大部分优质微信公众号文章，会定期更新。经过测试，发现对爬虫更加友好。
　　1.网站页面排版及排版规则，不同公众号以链接中的账号区分
　　2.公众号采集下文章的翻页也是有规律的：id号每翻一页+12
　　所以过程思路是
　　获取预查询微信公众号ID（不是直接显示的名字，而是信息名片中的ID号，一般由数字和字母组成）
　　请求一个html页面判断公众号是否被更改收录
　　如果没有收录，页面显示结果为：404 页面不存在，可以直接用正则表达式匹配提示信息
　　正则匹配查找目标公众号的最大页数收录文章
　　解析请求的页面，提取文章链接和标题文本
　　保存信息提取结果
　　调用pdfkit和wkhtmltopdf转换网页
　　3.2 环境
　　win10(64位)
　　蜘蛛（python3.6）
　　安装转换工具包 wkhtmltopdf
　　要求
　　pdf工具包
　　3.3 公众号信息检索
　　通过向目标url发起requset请求，获取页面的html信息，然后调用正则方法匹配两条信息
　　1、公众号是否存在？
　　2.如果存在，文章收录的最大页数是多少
　　
　　当公众号存在时，直接调用request解析目标请求链接。
　　注意目标爬虫网站必须添加headers，否则会直接拒绝访问
　　3.4 正则解析、提取链接和文章标题
　　以下代码用于从 html 文本中解析链接和标题文本信息
　　3.5 自动跳转页面
　　下面的代码通过循环递增赋值来改变url中的页码参数
　　3.6 去除标题中的非法字符
　　因为windows下的file命令，有些字符不能使用，所以需要使用正则剔除
　　itle = re.sub('[\\\\/:*?\"|]', '', info.loc[indexs]['title'])
　　3.7 将html转换为PDF
　　使用pandas的read_csv函数读取爬取的csv文件，循环遍历“link”、“title”、“date”
　　然后调用pdfkit函数转换生成的PDF文件
　　3.7 将html转换为PDF
　　使用pandas的read_csv函数读取爬取的csv文件，循环遍历“link”、“title”、“date”
　　然后调用pdfkit函数转换生成的PDF文件
　　3.8 生成的 PDF 结果
　　4 结果显示
　　
　　完全免费:PbootCMS采集-免费采集发布伪原创插件
　　Pbootcms怎么样采集？pbootcms网站模板优化提示允许网站fast收录关键词排名。很多人网站认为施工完成后就完成了。其实网站构建完成后，还需要优化。什么是优化？例如，如果您种植一棵树，您需要除草、施肥、修剪等。等等，网站就像那棵树也需要维护才能茁壮成长。我们可以在网上看到，有的网站做得很好，有的网站年久失修。今天博主就简单介绍一下网站的优化技巧。
　　一、定期量化发布是关键
　　为了让网站保持持续稳定的更新习惯，同时让百度蜘蛛发现这种规律，实现定时爬取，需要定时发布新内容。作为百度二次收录的关键因素，定期定量发布对SEO的友好性非常有利。所以，我们应该每天保持恒定的更新数量，放弃今天10篇，明天100篇的情况。因为它会被降级和沙盒化，同时也会给搜索引擎留下你的网站不稳定和善变的坏印象。
　　2.一个好的网站结构是基础
　　为了更利于访问者对网站的结构和层次结构的理解和理解，方便蜘蛛爬取和索引，需要建立良好的网站结构。这是基础，但也要注意。如果可能，尽量使用静态页面，因为一般静态页面比动态页面对蜘蛛更友好。
　　三、打造优质内容是关键
　　作为搜索引擎打分网站的重要标准，我们一定要注意。那么什么是好的内容呢？我们认为原创和网站内容相关性是最重要的两点。不管怎么创作，都必须注意发布的内容和网站定位的话题的关联性，那么加强两者关联性有什么好处呢？搜索引擎的青睐有利于打造高质量的网站，增加网站的权重。可以说是好处多多。今天给大家分享一个快速采集高质量文章Pbootcms采集。
　　
　　这个Pbootcms采集不需要学习更多的专业技能，只需几个简单的步骤就可以轻松采集内容数据，用户只需要在Pbootcms采集在>上进行简单的设置，完成后Pbootcms采集会根据用户设置的关键词匹配内容和图片的准确率，可以选择保存在本地或者选择伪原创发布后，提供方便快捷的内容采集伪原创发布服务！！
　　和其他Pbootcms采集插件相比，这个Pbootcms采集基本没有门槛，不需要花很多时间学习正则表达式或者html标签. 您可以在几分钟内开始。只需输入关键词即可实现采集（Pbootcms采集也自带关键词采集的功能）。一路挂断！设置任务自动执行采集伪原创发布和推送任务。
　　几十万个不同的cms网站可以统一管理。一个人维护数百个网站文章更新也不是问题。这个Pbootcms采集发布插件工具还配备了很多SEO功能，通过软件发布还可以提升很多SEO优化采集伪原创 .
　　例如：设置自动下载图片保存在本地或第三方（使内容不再有对方的外链）。自动内链（让搜索引擎更深入地抓取你的链接）、前后插入内容或标题，以及网站内容插入或随机作者、随机阅读等，形成“高原创 ”。
　　
　　这些SEO小功能不仅提高了网站页面原创的度数，还间接提升了网站的收录排名。您可以通过软件工具上的监控管理直接查看文章采集的发布状态，不再需要每天登录网站后台查看。目前博主亲测软件是免费的，可以直接下载使用！
　　四、外链渠道是保障
　　也很可惜，每天发布的优质内容，因为得不到百度蜘蛛的青睐，所以无趣。对于很多外链强的老站来说，建立高质量的外链和访问渠道一般不难，但对于外链差的新站，就不一定了。那么我们需要采取什么方法呢？我们可以选择一些热门的论坛，将新内容页面的地址链接发送出去，这样自然会带来更多的流量，帮助蜘蛛从这些站点爬到你的站点。对新的内容页面进行爬网和索引。
　　5、部署内链创造机会
　　为什么我们需要布局内部链接？在网站的短期内，为了让蜘蛛从你网站的其他页面快速到达新的内容页面，应该努力在网站的主页等重要页面上发布新内容，以及同时，您可以设置调用其他页面的新内容。已发布内容的面板和锚文本指向新的内容页面，有利于为百度妙说创造机会和条件。同时，从网站的长远发展来看，要达到增加网站权重的目标，也必须重视内链的建设。
　　网站优化是网站构建后的必做工作。操作网站的人员需要具备耐得住寂寞、不骄不躁、善于探索、坚持操作的素质。自己操作肯定会很累，所以我们需要使用一些SEO插件功能来帮助我们减少每天必须要做的复杂繁琐的SEO维护。看完这篇文章，如果觉得不错，不妨采集一下，或者发给需要的朋友同事。关注博主，每天为你展示各种SEO经验，打通你的二线任命和主管！查看全部

　　干货教程:Python爬虫实现的微信公众号文章下载器
　　硒爬行过程
　　安装python selenium自动模块，使用selenium中的webdriver驱动浏览器获取cookies登录微信公众号后台；
　　使用webdriver功能需要安装对应浏览器的驱动插件。
　　注意：谷歌浏览器版本和chromedriver需要对应，否则启动时会报错。
　　微信公众号登录地址：
　　微信公众号文章的接口地址可以在微信公众号后台创建，可以从超链接函数中获取：
　　搜索公众号名称
　　获取要爬取的公众号fakeid
　　选择要爬取的公众号，获取文章的接口地址
　　文章列表翻页和内容获取
　　AnyProxy 代理批量采集
　　1、微信客户端：可以是安装了微信应用的手机，也可以是电脑上的安卓模拟器。
　　2、微信个人账号：采集的内容，不仅需要微信客户端，采集还需要微信个人账号。
　　3.本地代理服务器系统：通过Anyproxy代理服务器将公众号历史消息页面中文章的列表发送到自己的服务器。
　　4、文章列表分析存储系统，分析文章列表并建立采集队列，实现批量采集内容。
　　Fiddler 设置代理并抓包
　　通过捕获和分析多个账户，可以确定：
　　_biz：这个14位的字符串是每个公众号的“id”，可以从搜狗的微信平台获取。
　　uin：与访客相关，微信ID
　　key：与访问的公众号相关
　　步：
　　1、编写按钮向导脚本，在手机端自动点击公众号文章的列表页面，即“查看历史消息”；
　　2、使用fiddler代理劫持手机访问，将URL转发到php编写的本地网页；
　　3、将接收到的URL备份到php网页上的数据库中；
　　4、使用python从数据库中检索URL，然后进行正常爬取。
　　

　　潜在问题：
　　如果只是想爬文章的内容，貌似没有访问频率限制，但是如果想爬读点赞数，一定频率后返回值会变空。
　　付费平台
　　例如，如果你只是想看数据，你可以不花钱只看每日清单。如果你需要访问自己的系统，他们也提供了一个api接口
　　3 项目步骤
　　3.1 基本原则
　　目标爬取网站收录微信平台大部分优质微信公众号文章，会定期更新。经过测试，发现对爬虫更加友好。
　　1.网站页面排版及排版规则，不同公众号以链接中的账号区分
　　2.公众号采集下文章的翻页也是有规律的：id号每翻一页+12
　　所以过程思路是
　　获取预查询微信公众号ID（不是直接显示的名字，而是信息名片中的ID号，一般由数字和字母组成）
　　请求一个html页面判断公众号是否被更改收录
　　如果没有收录，页面显示结果为：404 页面不存在，可以直接用正则表达式匹配提示信息
　　正则匹配查找目标公众号的最大页数收录文章
　　解析请求的页面，提取文章链接和标题文本
　　保存信息提取结果
　　调用pdfkit和wkhtmltopdf转换网页
　　3.2 环境
　　win10(64位)
　　蜘蛛（python3.6）
　　安装转换工具包 wkhtmltopdf
　　要求
　　pdf工具包
　　3.3 公众号信息检索
　　通过向目标url发起requset请求，获取页面的html信息，然后调用正则方法匹配两条信息
　　1、公众号是否存在？
　　2.如果存在，文章收录的最大页数是多少
　　

　　当公众号存在时，直接调用request解析目标请求链接。
　　注意目标爬虫网站必须添加headers，否则会直接拒绝访问
　　3.4 正则解析、提取链接和文章标题
　　以下代码用于从 html 文本中解析链接和标题文本信息
　　3.5 自动跳转页面
　　下面的代码通过循环递增赋值来改变url中的页码参数
　　3.6 去除标题中的非法字符
　　因为windows下的file命令，有些字符不能使用，所以需要使用正则剔除
　　itle = re.sub('[\\\\/:*?\"|]', '', info.loc[indexs]['title'])
　　3.7 将html转换为PDF
　　使用pandas的read_csv函数读取爬取的csv文件，循环遍历“link”、“title”、“date”
　　然后调用pdfkit函数转换生成的PDF文件
　　3.7 将html转换为PDF
　　使用pandas的read_csv函数读取爬取的csv文件，循环遍历“link”、“title”、“date”
　　然后调用pdfkit函数转换生成的PDF文件
　　3.8 生成的 PDF 结果
　　4 结果显示
　　
　　完全免费:PbootCMS采集-免费采集发布伪原创插件
　　Pbootcms怎么样采集？pbootcms网站模板优化提示允许网站fast收录关键词排名。很多人网站认为施工完成后就完成了。其实网站构建完成后，还需要优化。什么是优化？例如，如果您种植一棵树，您需要除草、施肥、修剪等。等等，网站就像那棵树也需要维护才能茁壮成长。我们可以在网上看到，有的网站做得很好，有的网站年久失修。今天博主就简单介绍一下网站的优化技巧。
　　一、定期量化发布是关键
　　为了让网站保持持续稳定的更新习惯，同时让百度蜘蛛发现这种规律，实现定时爬取，需要定时发布新内容。作为百度二次收录的关键因素，定期定量发布对SEO的友好性非常有利。所以，我们应该每天保持恒定的更新数量，放弃今天10篇，明天100篇的情况。因为它会被降级和沙盒化，同时也会给搜索引擎留下你的网站不稳定和善变的坏印象。
　　2.一个好的网站结构是基础
　　为了更利于访问者对网站的结构和层次结构的理解和理解，方便蜘蛛爬取和索引，需要建立良好的网站结构。这是基础，但也要注意。如果可能，尽量使用静态页面，因为一般静态页面比动态页面对蜘蛛更友好。
　　三、打造优质内容是关键
　　作为搜索引擎打分网站的重要标准，我们一定要注意。那么什么是好的内容呢？我们认为原创和网站内容相关性是最重要的两点。不管怎么创作，都必须注意发布的内容和网站定位的话题的关联性，那么加强两者关联性有什么好处呢？搜索引擎的青睐有利于打造高质量的网站，增加网站的权重。可以说是好处多多。今天给大家分享一个快速采集高质量文章Pbootcms采集。
　　

　　这个Pbootcms采集不需要学习更多的专业技能，只需几个简单的步骤就可以轻松采集内容数据，用户只需要在Pbootcms采集在>上进行简单的设置，完成后Pbootcms采集会根据用户设置的关键词匹配内容和图片的准确率，可以选择保存在本地或者选择伪原创发布后，提供方便快捷的内容采集伪原创发布服务！！
　　和其他Pbootcms采集插件相比，这个Pbootcms采集基本没有门槛，不需要花很多时间学习正则表达式或者html标签. 您可以在几分钟内开始。只需输入关键词即可实现采集（Pbootcms采集也自带关键词采集的功能）。一路挂断！设置任务自动执行采集伪原创发布和推送任务。
　　几十万个不同的cms网站可以统一管理。一个人维护数百个网站文章更新也不是问题。这个Pbootcms采集发布插件工具还配备了很多SEO功能，通过软件发布还可以提升很多SEO优化采集伪原创 .
　　例如：设置自动下载图片保存在本地或第三方（使内容不再有对方的外链）。自动内链（让搜索引擎更深入地抓取你的链接）、前后插入内容或标题，以及网站内容插入或随机作者、随机阅读等，形成“高原创 ”。
　　

　　这些SEO小功能不仅提高了网站页面原创的度数，还间接提升了网站的收录排名。您可以通过软件工具上的监控管理直接查看文章采集的发布状态，不再需要每天登录网站后台查看。目前博主亲测软件是免费的，可以直接下载使用！
　　四、外链渠道是保障
　　也很可惜，每天发布的优质内容，因为得不到百度蜘蛛的青睐，所以无趣。对于很多外链强的老站来说，建立高质量的外链和访问渠道一般不难，但对于外链差的新站，就不一定了。那么我们需要采取什么方法呢？我们可以选择一些热门的论坛，将新内容页面的地址链接发送出去，这样自然会带来更多的流量，帮助蜘蛛从这些站点爬到你的站点。对新的内容页面进行爬网和索引。
　　5、部署内链创造机会
　　为什么我们需要布局内部链接？在网站的短期内，为了让蜘蛛从你网站的其他页面快速到达新的内容页面，应该努力在网站的主页等重要页面上发布新内容，以及同时，您可以设置调用其他页面的新内容。已发布内容的面板和锚文本指向新的内容页面，有利于为百度妙说创造机会和条件。同时，从网站的长远发展来看，要达到增加网站权重的目标，也必须重视内链的建设。
　　网站优化是网站构建后的必做工作。操作网站的人员需要具备耐得住寂寞、不骄不躁、善于探索、坚持操作的素质。自己操作肯定会很累，所以我们需要使用一些SEO插件功能来帮助我们减少每天必须要做的复杂繁琐的SEO维护。看完这篇文章，如果觉得不错，不妨采集一下，或者发给需要的朋友同事。关注博主，每天为你展示各种SEO经验，打通你的二线任命和主管！

解读:案例 | 以《疯狂动物城》为例，教你如何做基于 Spark 的文本情感分析

采集交流 • 优采云发表了文章 • 0 个评论 • 173 次浏览 • 2022-11-03 23:18 • 来自相关话题

　　解读:案例 | 以《疯狂动物城》为例，教你如何做基于 Spark 的文本情感分析
　　微信加CDA为好友（ID：joinlearn），拉你进入500人数据分析师交流群。点击阅读原文，查看CDA数据分析师交流群的规范和好处。期待你的到来~本文介绍一个基于Spark的认证系统。知识系统：一种文本情感分析系统，用于分析和理解来自社交论坛的非结构化文本数据。
　　基于 Spark 的文本情感分析
　　文本情感分析是指对带有人类主观情感色彩的文本素材进行处理、分析和推理的过程。文本情感分析的主要应用场景是对用户对某个话题的评论文本进行处理和分析。例如，人们在计划看电影之前，通常会先阅读豆瓣电影版块的用户评论，然后再决定是否看电影。另一方面，电影制作人将通过分析专业论坛上的用户评论来了解电影的整体市场反馈。本文文本分析的对象是在线短评，即非正式场合的短文本语料库。在只考虑正负倾向的情况下，实现了文本倾向的分类。
　　文本情感分析主要涉及以下四个技术环节。
　　为什么使用 Spark
　　传统的单节点计算已经难以满足用户对海量数据的处理和分析需求。例如，在豆瓣网站上有 111,421 条关于电影《疯狂动物城》的短评。如果需要同时处理多个专业网站的所有电影的影评，单台服务器的计算能力和存储容量难以满足需求。这时就需要考虑引入分布式计算技术，让计算能力和存储容量线性扩展。
　　Spark 是一个快速、通用的集群计算平台，是业界非常流行的开源分布式技术。Spark 围绕 RDD（弹性分布式数据集）弹性分布式数据集扩展了广泛使用的 MapReduce [5] 计算模型。与 Hadoop [6] 的 MapReduce 计算框架相比，Spark 更高效、更灵活。Spark的主要特点如下：
　　内存计算：可以在内存中进行计算。会优先使用各个计算节点的内存作为存储，只有在内存不足时才考虑使用磁盘，大大降低了磁盘I/O，提高了效率。
　　懒惰评估：RDD丰富的计算操作可以分为两类，变换操作和动作操作。当程序调用RDD的变换操作（如数据读取、Map、Filter）时，Spark不会立即开始计算，而是会记下需要执行的操作，并尽可能结合一些变换操作。减少计算数据的步骤。只有当一个action操作（如获取数据的行数Count）被调用时，才会读取数据，转换操作，action操作，得到结果。
　　接口丰富：Spark提供Scala、Java、Python、R四种编程语言接口，可以满足不同技术背景工程师的需求。它可以与其他大数据工具紧密合作。例如，Spark 可以运行在 Hadoop 之上，并且可以访问所有支持 Hadoop 的数据源（例如 HDFS、Cassandra、Hbase）。
　　本文以Spark的Python接口为例，介绍如何搭建文本情感分析系统。作者使用 Python 3.5.0 和 Spark1.6.1 作为开发环境，使用 Jupyter Notebook [7] 编写代码。Jupyter Notebook 是 IPython Notebook 的演变，它是一个基于 Web 的交互式环境，允许您将代码、代码执行、数学函数、丰富的文档、绘图和其他元素集成到单个文件中。在运行pyspark之前，需要指定pyspark的运行环境，如下：
　　清单 1. 为 pyspark 指定 ipython notebook 运行时环境
　　接下来，您可以在 Jupyter Notebook 中编写代码。
　　如何搭建基于Spark的文本情感分析系统
　　本文第一章介绍了文本情感分析涉及的四个主要技术环节。基于Spark的文本分类系统的技术流程也是如此。在大规模文本数据的情况下，区别在于文本的特征维度一般都非常大。试想一下，汉字字数有多少，再加上其他语言和网上能查到的所有文字，那么文字数据按照文字的维度就可以轻松超过几十万上百万的维度，所以有必要寻找一种方法来处理非常大维度的文本数据。
　　在本文的后续章节中，我们将讨论基于 Spark 的数据预处理、文本建模、特征提取、训练分类模型以及实现待输入文本分类。系统的上下文图如图1所示，系统的功能架构图如图2所示。
　　图 1. 基于 Spark 的文本情感分析系统的上下文
　　图 2. 基于 Spark 的文本情感分析系统功能架构图
　　爬取数据说明
　　为了说明文本分类系统的构建过程，作者在豆瓣网（）上爬取了《疯狂动物城》的短评和评分。示例数据如下所示：
　　表 1. 样本数据
　　表格中每一行收录一条评论数据，按照“评分、评论文本”排列，中间有标签，范围从1到5。总共有116567条这样的数据。
　　数据预处理
　　本文的这一部分将解释如何使用 Spark 来清理和提取数据。该子系统的输入是爬虫的数据，输出是收录相同数量的正面和负面评论的 Saprk 弹性分布式数据集。
　　Spark数据处理主要围绕RDD（Resilient Distributed Datasets）弹性分布式数据集对象展开。本文首先将爬虫数据加载到 Spark 系统中，并将其抽象为 RDD。可以使用 distinct 方法对数据进行重复数据删除。数据转换主要使用map方法，它接受传入的数据转换方法逐行执行该方法，从而实现转换操作。它只需要使用一个函数来映射输入和输出，就可以完成转换。数据过滤使用filter方法，保留条件为真的数据。您可以使用以下语句将每一行文本变成一个列表，并只保留长度为 2 的数据。
　　清单 2. 用于数据预处理的 Spark
　　清单 3. 统计基本信息
　　本文共有5个点的数据30447条，4点、3点、2点和1点的数据分别为11711条，123条和70条。五分的分数无疑是正面评价；考虑到不同人对评分的偏好不同，对于一个四分数据，本文无法判断是好评还是差评；三分及以下是差评。
　　接下来，可以将带有评分的数据转换为正面数据和差评数据。为了提高计算效率，本文对其进行了重新分区。
　　清单 4. 合并负样本数据
　　根据计算，正面评价30447条，负面评价2238条，属于不平衡样本的机器模型训练。本文只取部分正面数据，正面和负面评论数量相同，使训练的正负样本平衡。最后将正负样本放在一起，将分类标签和文本分开，形成训练数据集
　　
　　清单 5. 生成训练数据集
　　文本的向量表示和文本特征提取
　　本节主要介绍如何进行文本分割，以及如何使用 TF-IDF 算法提取文本特征。将输入的文本数据转换成向量，以便计算“读取”文本。
　　要解决文本分类问题，最重要的是使文本可计算并以合适的方式表示文本。其中的核心是找到文本的特征和特征值。与英文相比，中文多了一个分词过程。本文首先使用jieba tokenizer对文本进行分词，使得每个词都可以作为文本的一个特征。jieba分词器具有三种分词模式：
　　这里本文使用搜索引擎模型将每条评论转化为一个词。
　　清单 6. 分词
　　考虑到大规模数据的计算需求，spark的词频计算是使用特征哈希（HashingTF）来计算的。特征哈希是一种处理高维数据的技术，通常应用于文本和分类数据集。普通的 1/k 特征编码需要维护可能的特征值及其到向量中下标的映射，而构建这种映射的每个过程都需要遍历数据集本身。这不适用于几千万甚至更多维度的特征处理。
　　特征哈希通过哈希方程给特征分配向量下标，所以在不同的情况下，相同的特征可以得到相同的向量下标，所以不需要维护一个特征值的向量和下表。
　　要使用特征散列处理文本，您需要实例化一个 HashingTF 对象以将单词转换为词频。为了高效计算，本文将缓存词频，稍后会重复使用。
　　清单 7. 训练词频矩阵
　　默认情况下，实例化的 HashingTF 特征维度 numFeatures 采用 220 次方维度。在spark源码中可以看到，HashingTF的过程就是对每个单词进行一次hash，取特征维度的余数。单词的位置，然后计算单词出现的次数。因此，不需要像传统方法那样每次都维护一个词汇表，使用HashingTF可以很容易地得到该词对应的向量元素的位置。当然，这样做的代价是向量的维数会很大。好在spark可以支持稀疏向量，所以计算开销并不大。
　　图 3. HashingTF 源代码
　　词频是一种提取特征的方法，但它仍然存在很多问题。比如这句话“这几天天气真好，项目组老师打算组织大家去春游”。与“project”相比，“group”更容易出现在人们的语言中，而“of”和“project group”也只出现一次，但project group对于这句话来说更重要。
　　本文采用TF-IDF作为特征提取方法，其权重与特征项在文档中的评价率正相关，与该特征项出现在整个语料库中的文档负相关。下面是根据tf计算逆词频idf，计算TF-IDF
　　清单 8. 计算 TF-IDF 矩阵
　　至此，本文已经提取了文本的特征，并用向量表示了文本。
　　训练分类模型
　　在本小节中，本文将介绍如何使用 Spark 训练朴素贝叶斯分类模型。这个过程的输入是文本的特征向量和标记的分类标签。本文在这里得到的是分类模型和文本分类的正确率。
　　现在有了文本的特征项和特征值，以及分类标签，就需要使用RDD的zip算子将两部分数据连接起来，转换成分类模型中的LabeledPoint类型。并将数据随机分为训练集和测试集，60%作为训练集，40%作为测试集。
　　清单 9. 生成训练集和测试集
　　本文使用训练数据训练贝叶斯模型，得到NBmodel模型来预测测试集的文本特征向量，并计算每个模型的正确率。该模型的正确率为74.83%。
　　清单 10. 训练贝叶斯分类模型
　　可以看出，贝叶斯模型的最终预测模型并不高，但是基于本文采集有限的数据资源，特征提取过程还是比较简单直接的。因此，还有很大的优化空间。在第 4 章中，本文将介绍提高准确性的方法。
　　分类未标记的文档
　　本文训练的模型现在可用于对未标记的文本进行分类。过程是获取用户输入的评论，然后对输入的评论文本进行token化，转换成tf-idf特征向量，然后使用3.4节训练的分类模型。分类。
　　清单 11. 分类未分类的文本
　　当节目进入评论被归类：“这部电影很无聊，剧情老套，很无聊，看了很后悔”
　　程序输出是“NaiveBayes 模型预测：0.0”。
　　节目进入评论归类：“精彩，讲了一个梦的故事，剧情反转，制作非常好。”
　　程序输出是“NaiveBayes 模型预测：1.0”。
　　
　　至此，最简单的文本情感分类系统就完成了。
　　提高准确性的方法
　　第三章介绍了构建文本分类系统的方法，但正确率只有74.83%。在本章中，本文将描述文本分类正确率低的原因以及如何改进它。
　　文本分类准确率低的主要原因是：
　　本文分别从以下四个方面进行处理，并对模型进行了优化。
　　从数据预处理中删除停用词
　　停用词是指在所有文档中出现多次的常用词，例如“的”、“的”、“是”等。这些噪声可以在提取特征时去除。
　　首先，你需要统计词频，看看哪些词被使用最多，然后定义一个停用词列表，在构造向量之前去除这些词。本文首先进行词频统计，看看哪些词最常用。
　　清单 12. 计算词频
　　通过观察，选择出现频率较高但对文本情感表达没有意义的词作为停用词，并建立停用词列表。然后定义一个过滤函数，如果该词在停用词列表中，则该词需要被过滤掉。
　　清单 13. 删除停用词
　　尝试不同的分词模式
　　本文在分词时使用的搜索引擎分词模式，在这种模式下只提取重要的关键词，可能会忽略一些可能的特征词。可以将分词模式切换为全分词模式，尽量不要漏掉特征词。同样的模型训练会提高1%到2%的准确率。
　　清单 14. 全分词模式分词
　　改变训练模型方法
　　在没有深度优化的情况下，SVM 往往比其他分类模型具有更好的分类性能。相同条件下，使用SVM模型进行训练，最终准确率为78.59%。
　　清单 15. 使用支持向量机训练分类模型
　　训练数据的问题
　　本文只是为了演示如何搭建这个系统，所以爬取的数据量并不多，获取的文本数据也没有人工检查正确性。如果这篇文章能有更丰富和权威的数据源，模型的准确率会大大提高。
　　作者对中国科学院大学谭松波教授发表的酒店产品评论文本进行了分类系统测试。该数据集被大多数学者认可和使用。用 SVM 训练的模型正确率为 87.59%。
　　总结
　　本文详细介绍了使用Spark构建文本情感分类系统的过程。从数据清洗和转换来看，Spark 的 RDD 有 Filter 和 Map 方法，可以轻松胜任；对于文本特征的提取，Spark对大规模数据的处理不仅在计算模型和算法优化上都有优化。采用哈希特征算法实现TF-IDF，可支持千万维度的模型训练；对于分类模型的选择，Spark也实现了常用的分类模型。, 打电话很方便。最后希望这篇文章可以对大家学习spark和文本分类有所帮助。
　　参考
　　一、IBM认知业务新时代简介
　　2.jieba分词的项目主页
　　3. TF-IDF算法介绍
　　%E2%80%93idf&cm_mc_uid=555979257447&cm_mc_sid_50200000=1465287280
　　4. Spark项目官网
　　5. MapReduce算法介绍
　　6.Hadoop项目主页
　　7. Jupyter Notebook 项目主页
　　在 developerWorks 认知计算专区 () 了解有关认知计算、访问技术文档、操作方法文章、培训、下载、产品信息和其他资源的更多信息。
　　在 developerWorks() 大数据和分析部分了解有关大数据的更多信息、获取技术文档、操作方法文章、培训、下载、产品信息和其他资源。
　　文 | 姜婉，北京邮电大学研究生，北京邮电大学迎春，软件服务团队架构师，IBM原创链接：
　　总结:使用帮站SEO刷点击工具快速提升关键词排名的方法
　　提升关键词关键词在百度搜索引擎中的排名，在站长圈已经不是什么秘密了。许多新网站使用点击工具来快速获得排名。在SEO站长中，相信每个人都有自己喜欢的排名软件，峰峰就是用SEO工具帮站的。
　　帮助站SEO排名工具介绍
　　帮站的主要目的是帮助站长做好网站，解决网站的优化问题，通过平台快速提升网站的权重，提高关键词排名，提升百度指数，为站长免费提供安全、快速、稳定的工具平台。
　　帮站SEO刷关键词排名方法
　　
　　需要积分来帮助网站刷新排名。免费赚取积分相对较慢。小康的朋友可以充值换积分。操作也比较简单，直接登录帮助网站后台，创建百度任务，做基础设置：关键词、域名、自然排名、点击深度、任务总数等.、打开任务自动刷新百度关键词排名。
　　使用SEO工具的注意事项
　　1、百度排名任务用于提升网站百度关键词的排名，请添加百度排名前50的关键词！为提高手机排名，请使用手机百度功能。
　　2.任务总数代表该任务总共可以完成多少次，每天的次数代表每天可以完成的任务数量。
　　3、每日推荐次数为关键词索引的十分之一左右，具体数量可根据排名适当增减。
　　4、百度排名功能需要长时间使用才能生效。如果只是偶尔使用，效果很小。
　　
　　排名工具确实好用，但不是所有词都能用。从上面的注释可以看出，排名还有一些硬指标关键词：关键词排名至少应该在百度页面前5，进入前5页也证明了你的话被百度认可了，剩下的就是百度搜索引擎通过用户点击反馈用户体验来判断页面的价值，并给出排名，所以网站还需要做基础优化。
　　关于网站滑动点击有惩罚吗？
　　如果过去有人问过这个问题，我认为十个网站管理员中有九个会回答不可能的问题。如果您滑动点击，您将受到搜索引擎的惩罚。许多竞争对手会故意使用刷卡工具来攻击他们的竞争对手。网站，让他们关键词排名下降确实有意义。但现在不同了。百度搜索资源平台正式上线“雷霆算法”，旨在打击点击作弊行为。
　　根据百度站长平台官方公布的消息，迅雷算法将于11月底上线，但风峰觉得迅雷算法现在已经开始行动了。因为峰峰目前在做站群SEO，目前管理着近40个网站，其中大部分是单页网站，也有一部分被拿出来刷新排名。这两天同事发现网站首页的第一位置有一个关键词排名。不知道是巧合还是什么。滑动和点击的方法可能会暂时停止。
　　结论：帮助网站SEO刷点击软件对网站关键词的排名还是有帮助的，但是在目前的形式下，百度SEO的站长们还是比较谨慎的，在风头下切不可被大量使用。因为百度对网站排名的攻击力度未知，测试前一段时间相关数据会流出。
　　但是，从搜索引擎的角度来看，峰峰支持打击黑帽SEO行为。对广大网友来说，净化搜索引擎也是一个好消息。我们暂时拭目以待。，SEO优化可以走的路越来越少，站长的痛苦只有他们自己最清楚。最后，祝广大站长越走越远！查看全部

　　解读:案例 | 以《疯狂动物城》为例，教你如何做基于 Spark 的文本情感分析
　　微信加CDA为好友（ID：joinlearn），拉你进入500人数据分析师交流群。点击阅读原文，查看CDA数据分析师交流群的规范和好处。期待你的到来~本文介绍一个基于Spark的认证系统。知识系统：一种文本情感分析系统，用于分析和理解来自社交论坛的非结构化文本数据。
　　基于 Spark 的文本情感分析
　　文本情感分析是指对带有人类主观情感色彩的文本素材进行处理、分析和推理的过程。文本情感分析的主要应用场景是对用户对某个话题的评论文本进行处理和分析。例如，人们在计划看电影之前，通常会先阅读豆瓣电影版块的用户评论，然后再决定是否看电影。另一方面，电影制作人将通过分析专业论坛上的用户评论来了解电影的整体市场反馈。本文文本分析的对象是在线短评，即非正式场合的短文本语料库。在只考虑正负倾向的情况下，实现了文本倾向的分类。
　　文本情感分析主要涉及以下四个技术环节。
　　为什么使用 Spark
　　传统的单节点计算已经难以满足用户对海量数据的处理和分析需求。例如，在豆瓣网站上有 111,421 条关于电影《疯狂动物城》的短评。如果需要同时处理多个专业网站的所有电影的影评，单台服务器的计算能力和存储容量难以满足需求。这时就需要考虑引入分布式计算技术，让计算能力和存储容量线性扩展。
　　Spark 是一个快速、通用的集群计算平台，是业界非常流行的开源分布式技术。Spark 围绕 RDD（弹性分布式数据集）弹性分布式数据集扩展了广泛使用的 MapReduce [5] 计算模型。与 Hadoop [6] 的 MapReduce 计算框架相比，Spark 更高效、更灵活。Spark的主要特点如下：
　　内存计算：可以在内存中进行计算。会优先使用各个计算节点的内存作为存储，只有在内存不足时才考虑使用磁盘，大大降低了磁盘I/O，提高了效率。
　　懒惰评估：RDD丰富的计算操作可以分为两类，变换操作和动作操作。当程序调用RDD的变换操作（如数据读取、Map、Filter）时，Spark不会立即开始计算，而是会记下需要执行的操作，并尽可能结合一些变换操作。减少计算数据的步骤。只有当一个action操作（如获取数据的行数Count）被调用时，才会读取数据，转换操作，action操作，得到结果。
　　接口丰富：Spark提供Scala、Java、Python、R四种编程语言接口，可以满足不同技术背景工程师的需求。它可以与其他大数据工具紧密合作。例如，Spark 可以运行在 Hadoop 之上，并且可以访问所有支持 Hadoop 的数据源（例如 HDFS、Cassandra、Hbase）。
　　本文以Spark的Python接口为例，介绍如何搭建文本情感分析系统。作者使用 Python 3.5.0 和 Spark1.6.1 作为开发环境，使用 Jupyter Notebook [7] 编写代码。Jupyter Notebook 是 IPython Notebook 的演变，它是一个基于 Web 的交互式环境，允许您将代码、代码执行、数学函数、丰富的文档、绘图和其他元素集成到单个文件中。在运行pyspark之前，需要指定pyspark的运行环境，如下：
　　清单 1. 为 pyspark 指定 ipython notebook 运行时环境
　　接下来，您可以在 Jupyter Notebook 中编写代码。
　　如何搭建基于Spark的文本情感分析系统
　　本文第一章介绍了文本情感分析涉及的四个主要技术环节。基于Spark的文本分类系统的技术流程也是如此。在大规模文本数据的情况下，区别在于文本的特征维度一般都非常大。试想一下，汉字字数有多少，再加上其他语言和网上能查到的所有文字，那么文字数据按照文字的维度就可以轻松超过几十万上百万的维度，所以有必要寻找一种方法来处理非常大维度的文本数据。
　　在本文的后续章节中，我们将讨论基于 Spark 的数据预处理、文本建模、特征提取、训练分类模型以及实现待输入文本分类。系统的上下文图如图1所示，系统的功能架构图如图2所示。
　　图 1. 基于 Spark 的文本情感分析系统的上下文
　　图 2. 基于 Spark 的文本情感分析系统功能架构图
　　爬取数据说明
　　为了说明文本分类系统的构建过程，作者在豆瓣网（）上爬取了《疯狂动物城》的短评和评分。示例数据如下所示：
　　表 1. 样本数据
　　表格中每一行收录一条评论数据，按照“评分、评论文本”排列，中间有标签，范围从1到5。总共有116567条这样的数据。
　　数据预处理
　　本文的这一部分将解释如何使用 Spark 来清理和提取数据。该子系统的输入是爬虫的数据，输出是收录相同数量的正面和负面评论的 Saprk 弹性分布式数据集。
　　Spark数据处理主要围绕RDD（Resilient Distributed Datasets）弹性分布式数据集对象展开。本文首先将爬虫数据加载到 Spark 系统中，并将其抽象为 RDD。可以使用 distinct 方法对数据进行重复数据删除。数据转换主要使用map方法，它接受传入的数据转换方法逐行执行该方法，从而实现转换操作。它只需要使用一个函数来映射输入和输出，就可以完成转换。数据过滤使用filter方法，保留条件为真的数据。您可以使用以下语句将每一行文本变成一个列表，并只保留长度为 2 的数据。
　　清单 2. 用于数据预处理的 Spark
　　清单 3. 统计基本信息
　　本文共有5个点的数据30447条，4点、3点、2点和1点的数据分别为11711条，123条和70条。五分的分数无疑是正面评价；考虑到不同人对评分的偏好不同，对于一个四分数据，本文无法判断是好评还是差评；三分及以下是差评。
　　接下来，可以将带有评分的数据转换为正面数据和差评数据。为了提高计算效率，本文对其进行了重新分区。
　　清单 4. 合并负样本数据
　　根据计算，正面评价30447条，负面评价2238条，属于不平衡样本的机器模型训练。本文只取部分正面数据，正面和负面评论数量相同，使训练的正负样本平衡。最后将正负样本放在一起，将分类标签和文本分开，形成训练数据集
　　

　　清单 5. 生成训练数据集
　　文本的向量表示和文本特征提取
　　本节主要介绍如何进行文本分割，以及如何使用 TF-IDF 算法提取文本特征。将输入的文本数据转换成向量，以便计算“读取”文本。
　　要解决文本分类问题，最重要的是使文本可计算并以合适的方式表示文本。其中的核心是找到文本的特征和特征值。与英文相比，中文多了一个分词过程。本文首先使用jieba tokenizer对文本进行分词，使得每个词都可以作为文本的一个特征。jieba分词器具有三种分词模式：
　　这里本文使用搜索引擎模型将每条评论转化为一个词。
　　清单 6. 分词
　　考虑到大规模数据的计算需求，spark的词频计算是使用特征哈希（HashingTF）来计算的。特征哈希是一种处理高维数据的技术，通常应用于文本和分类数据集。普通的 1/k 特征编码需要维护可能的特征值及其到向量中下标的映射，而构建这种映射的每个过程都需要遍历数据集本身。这不适用于几千万甚至更多维度的特征处理。
　　特征哈希通过哈希方程给特征分配向量下标，所以在不同的情况下，相同的特征可以得到相同的向量下标，所以不需要维护一个特征值的向量和下表。
　　要使用特征散列处理文本，您需要实例化一个 HashingTF 对象以将单词转换为词频。为了高效计算，本文将缓存词频，稍后会重复使用。
　　清单 7. 训练词频矩阵
　　默认情况下，实例化的 HashingTF 特征维度 numFeatures 采用 220 次方维度。在spark源码中可以看到，HashingTF的过程就是对每个单词进行一次hash，取特征维度的余数。单词的位置，然后计算单词出现的次数。因此，不需要像传统方法那样每次都维护一个词汇表，使用HashingTF可以很容易地得到该词对应的向量元素的位置。当然，这样做的代价是向量的维数会很大。好在spark可以支持稀疏向量，所以计算开销并不大。
　　图 3. HashingTF 源代码
　　词频是一种提取特征的方法，但它仍然存在很多问题。比如这句话“这几天天气真好，项目组老师打算组织大家去春游”。与“project”相比，“group”更容易出现在人们的语言中，而“of”和“project group”也只出现一次，但project group对于这句话来说更重要。
　　本文采用TF-IDF作为特征提取方法，其权重与特征项在文档中的评价率正相关，与该特征项出现在整个语料库中的文档负相关。下面是根据tf计算逆词频idf，计算TF-IDF
　　清单 8. 计算 TF-IDF 矩阵
　　至此，本文已经提取了文本的特征，并用向量表示了文本。
　　训练分类模型
　　在本小节中，本文将介绍如何使用 Spark 训练朴素贝叶斯分类模型。这个过程的输入是文本的特征向量和标记的分类标签。本文在这里得到的是分类模型和文本分类的正确率。
　　现在有了文本的特征项和特征值，以及分类标签，就需要使用RDD的zip算子将两部分数据连接起来，转换成分类模型中的LabeledPoint类型。并将数据随机分为训练集和测试集，60%作为训练集，40%作为测试集。
　　清单 9. 生成训练集和测试集
　　本文使用训练数据训练贝叶斯模型，得到NBmodel模型来预测测试集的文本特征向量，并计算每个模型的正确率。该模型的正确率为74.83%。
　　清单 10. 训练贝叶斯分类模型
　　可以看出，贝叶斯模型的最终预测模型并不高，但是基于本文采集有限的数据资源，特征提取过程还是比较简单直接的。因此，还有很大的优化空间。在第 4 章中，本文将介绍提高准确性的方法。
　　分类未标记的文档
　　本文训练的模型现在可用于对未标记的文本进行分类。过程是获取用户输入的评论，然后对输入的评论文本进行token化，转换成tf-idf特征向量，然后使用3.4节训练的分类模型。分类。
　　清单 11. 分类未分类的文本
　　当节目进入评论被归类：“这部电影很无聊，剧情老套，很无聊，看了很后悔”
　　程序输出是“NaiveBayes 模型预测：0.0”。
　　节目进入评论归类：“精彩，讲了一个梦的故事，剧情反转，制作非常好。”
　　程序输出是“NaiveBayes 模型预测：1.0”。
　　

　　至此，最简单的文本情感分类系统就完成了。
　　提高准确性的方法
　　第三章介绍了构建文本分类系统的方法，但正确率只有74.83%。在本章中，本文将描述文本分类正确率低的原因以及如何改进它。
　　文本分类准确率低的主要原因是：
　　本文分别从以下四个方面进行处理，并对模型进行了优化。
　　从数据预处理中删除停用词
　　停用词是指在所有文档中出现多次的常用词，例如“的”、“的”、“是”等。这些噪声可以在提取特征时去除。
　　首先，你需要统计词频，看看哪些词被使用最多，然后定义一个停用词列表，在构造向量之前去除这些词。本文首先进行词频统计，看看哪些词最常用。
　　清单 12. 计算词频
　　通过观察，选择出现频率较高但对文本情感表达没有意义的词作为停用词，并建立停用词列表。然后定义一个过滤函数，如果该词在停用词列表中，则该词需要被过滤掉。
　　清单 13. 删除停用词
　　尝试不同的分词模式
　　本文在分词时使用的搜索引擎分词模式，在这种模式下只提取重要的关键词，可能会忽略一些可能的特征词。可以将分词模式切换为全分词模式，尽量不要漏掉特征词。同样的模型训练会提高1%到2%的准确率。
　　清单 14. 全分词模式分词
　　改变训练模型方法
　　在没有深度优化的情况下，SVM 往往比其他分类模型具有更好的分类性能。相同条件下，使用SVM模型进行训练，最终准确率为78.59%。
　　清单 15. 使用支持向量机训练分类模型
　　训练数据的问题
　　本文只是为了演示如何搭建这个系统，所以爬取的数据量并不多，获取的文本数据也没有人工检查正确性。如果这篇文章能有更丰富和权威的数据源，模型的准确率会大大提高。
　　作者对中国科学院大学谭松波教授发表的酒店产品评论文本进行了分类系统测试。该数据集被大多数学者认可和使用。用 SVM 训练的模型正确率为 87.59%。
　　总结
　　本文详细介绍了使用Spark构建文本情感分类系统的过程。从数据清洗和转换来看，Spark 的 RDD 有 Filter 和 Map 方法，可以轻松胜任；对于文本特征的提取，Spark对大规模数据的处理不仅在计算模型和算法优化上都有优化。采用哈希特征算法实现TF-IDF，可支持千万维度的模型训练；对于分类模型的选择，Spark也实现了常用的分类模型。, 打电话很方便。最后希望这篇文章可以对大家学习spark和文本分类有所帮助。
　　参考
　　一、IBM认知业务新时代简介
　　2.jieba分词的项目主页
　　3. TF-IDF算法介绍
　　%E2%80%93idf&cm_mc_uid=555979257447&cm_mc_sid_50200000=1465287280
　　4. Spark项目官网
　　5. MapReduce算法介绍
　　6.Hadoop项目主页
　　7. Jupyter Notebook 项目主页
　　在 developerWorks 认知计算专区 () 了解有关认知计算、访问技术文档、操作方法文章、培训、下载、产品信息和其他资源的更多信息。
　　在 developerWorks() 大数据和分析部分了解有关大数据的更多信息、获取技术文档、操作方法文章、培训、下载、产品信息和其他资源。
　　文 | 姜婉，北京邮电大学研究生，北京邮电大学迎春，软件服务团队架构师，IBM原创链接：
　　总结:使用帮站SEO刷点击工具快速提升关键词排名的方法
　　提升关键词关键词在百度搜索引擎中的排名，在站长圈已经不是什么秘密了。许多新网站使用点击工具来快速获得排名。在SEO站长中，相信每个人都有自己喜欢的排名软件，峰峰就是用SEO工具帮站的。
　　帮助站SEO排名工具介绍
　　帮站的主要目的是帮助站长做好网站，解决网站的优化问题，通过平台快速提升网站的权重，提高关键词排名，提升百度指数，为站长免费提供安全、快速、稳定的工具平台。
　　帮站SEO刷关键词排名方法
　　

　　需要积分来帮助网站刷新排名。免费赚取积分相对较慢。小康的朋友可以充值换积分。操作也比较简单，直接登录帮助网站后台，创建百度任务，做基础设置：关键词、域名、自然排名、点击深度、任务总数等.、打开任务自动刷新百度关键词排名。
　　使用SEO工具的注意事项
　　1、百度排名任务用于提升网站百度关键词的排名，请添加百度排名前50的关键词！为提高手机排名，请使用手机百度功能。
　　2.任务总数代表该任务总共可以完成多少次，每天的次数代表每天可以完成的任务数量。
　　3、每日推荐次数为关键词索引的十分之一左右，具体数量可根据排名适当增减。
　　4、百度排名功能需要长时间使用才能生效。如果只是偶尔使用，效果很小。
　　

　　排名工具确实好用，但不是所有词都能用。从上面的注释可以看出，排名还有一些硬指标关键词：关键词排名至少应该在百度页面前5，进入前5页也证明了你的话被百度认可了，剩下的就是百度搜索引擎通过用户点击反馈用户体验来判断页面的价值，并给出排名，所以网站还需要做基础优化。
　　关于网站滑动点击有惩罚吗？
　　如果过去有人问过这个问题，我认为十个网站管理员中有九个会回答不可能的问题。如果您滑动点击，您将受到搜索引擎的惩罚。许多竞争对手会故意使用刷卡工具来攻击他们的竞争对手。网站，让他们关键词排名下降确实有意义。但现在不同了。百度搜索资源平台正式上线“雷霆算法”，旨在打击点击作弊行为。
　　根据百度站长平台官方公布的消息，迅雷算法将于11月底上线，但风峰觉得迅雷算法现在已经开始行动了。因为峰峰目前在做站群SEO，目前管理着近40个网站，其中大部分是单页网站，也有一部分被拿出来刷新排名。这两天同事发现网站首页的第一位置有一个关键词排名。不知道是巧合还是什么。滑动和点击的方法可能会暂时停止。
　　结论：帮助网站SEO刷点击软件对网站关键词的排名还是有帮助的，但是在目前的形式下，百度SEO的站长们还是比较谨慎的，在风头下切不可被大量使用。因为百度对网站排名的攻击力度未知，测试前一段时间相关数据会流出。
　　但是，从搜索引擎的角度来看，峰峰支持打击黑帽SEO行为。对广大网友来说，净化搜索引擎也是一个好消息。我们暂时拭目以待。，SEO优化可以走的路越来越少，站长的痛苦只有他们自己最清楚。最后，祝广大站长越走越远！

直观:丢，我讲的是监控，不是QPS

采集交流 • 优采云发表了文章 • 0 个评论 • 118 次浏览 • 2022-11-03 23:17 • 来自相关话题

直观:丢，我讲的是监控，不是QPS
　　你好，我3岁
　　今天奥斯汀项目给大家一个不一样的点：花点时间关注文章完成，屏幕壁纸即可。我上传一张图，大家就明白了。
　　每当同事扫视你的电脑，就会发现是一个图形化的黑色界面，看起来很高端：“嗯，我又在找bug了。”
　　对了，要聊的话题是监控
　　01. 为什么要监控
　　记得以前采访的时候，有人问我：“网上有问题，你是怎么调查的？调查的方法是什么？”
　　我以前的部门负责人非常重视稳定性，经常要求我们整理系统的上下行和接口信息。我认为：要想提高系统的稳定性，就需要有完善的监控和及时的告警。
　　有了监控，可以快速定位问题（而不是打印日志找问题，很多问题可以通过监控数据直接看到）。有了监控，我们可以配置监控中的所有指标，不管是技术还是业务（但业务数据叫看板，系统数据叫监控）。有了监控，我们会从不同的角度看系统（全面了解系统的性能指标和业务指标）
　　如果你的在线系统没有被监控，那真的不可行。
　　02. 监控开源组件
　　无需考虑监控和报警。直接依赖开源组件就足够了。只有大公司才有人力开发自己的监控和报警组件。
　　我选择了Prometheus，这个在业界还是很有名的，很多公司都用它来做监控和告警。
　　在prometheus官网，我们可以从文档中找到一个架构图：
　　根据我的理解，我“不恰当地”简化了上图
　　简化后发现：他妈一家人的照片很美
　　总的来说，prometheus 的核心在于服务器。如果我们要访问prometheus，其实是打开prometheus拉取数据的界面，然后在web-ui下配置图形界面，实现监控功能。
　　03. Prometheus环境搭建
　　prometheus的环境搭建，我这次也是直接用docker。毕竟，Redis 和 Kafka 都在 docker 上。新建prometheus文件夹，存放docker-compose.yml的信息：
　　version: '2' networks: monitor: driver: bridge services: prometheus: image: prom/prometheus container_name: prometheus hostname: prometheus restart: always volumes: - ./prometheus.yml:/etc/prometheus/prometheus.yml # - ./node_down.yml:/usr/local/etc/node_down.yml:rw ports: - "9090:9090" networks: - monitor alertmanager: image: prom/alertmanager container_name: alertmanager hostname: alertmanager restart: always # volumes: # - ./alertmanager.yml:/usr/local/etc/alertmanager.yml ports: - "9093:9093" networks: - monitor grafana: image: grafana/grafana container_name: grafana hostname: grafana restart: always ports: - "3000:3000" networks: - monitor node-exporter: image: quay.io/prometheus/node-exporter container_name: node-exporter hostname: node-exporter restart: always ports: - "9100:9100" networks: - monitor cadvisor: image: google/cadvisor:latest container_name: cadvisor hostname: cadvisor restart: always volumes: - /:/rootfs:ro - /var/run:/var/run:rw - /sys:/sys:ro - /var/lib/docker/:/var/lib/docker:ro ports: - "8899:8080" networks: - monitor 
　　此处拉取的图片有：
　　新建prometheus配置文件prometheus.yml（这个配置其实就是告诉prometheus从哪个端口拉取相应的监控数据）
　　global: scrape_interval: 15s evaluation_interval: 15s scrape_configs: - job_name: 'prometheus' static_configs: - targets: ['ip:9090'] ## TODO ip自己写 - job_name: 'cadvisor' static_configs: - targets: ['ip:8899'] ## TODO ip自己写 - job_name: 'node' static_configs: - targets: ['ip:9100'] ## TODO ip自己写 
　　（注意这里的端口，根据自己的配置）
　　把这个prometheus.yml的配置复制到/etc/prometheus/prometheus.yml路径下（有很多配置信息我都忽略了没写，prometheus的功能还是挺强大的，想知道的话更多关于监控，可以查看官网文档）
　　然后在目录下启动docker-compose up -d，这样我们就可以访问了：
　　一个 docker-compose 有 5 个服务器，非常好用！
　　04. Grafana配置监控
　　现在我们已经启动了Grafana，我们可以直接使用Grafana作为监控的可视化工具（prometheus有自己的可视化界面，但是我们不需要）。进入Grafana主页，我们首先需要配置prometheus作为我们的数据源
　　进入配置页面，记下对应的URL，保存。
　　
　　配置好数据源后，我们就可以配置相应的监控信息了。常用的配置监控已经有相应的模板，我们不需要一一配置。（不满意还是要自己配）
　　在这里，我将演示如何使用现有的模板，直接导入相应的模板，相关的模板可以在这里找到。
　　我们只是使用 8919 来直接监控服务器。
　　导入后可以直接在tall上看到监控页面：
　　因为我们使用docker启动了很多服务，所以也可以看一下Docker监控（上面启动的cadvisor服务收录Docker信息），我们使用模板893来配置监控docker信息：
　　05. Java系统指标
　　没想到通过上面的短内容已经配置好了服务器和Docker服务的监控，但是还是少了点什么吧？我们写Java程序，但是JVM相关的监控还没做？这怎么能行。
　　所以，起来
　　配置Java监控也很简单，只要我们在项目中再引入两个pom依赖（SpringBoot自带的监控组件执行器）
　　 org.springframework.boot spring-boot-starter-actuator io.micrometer micrometer-registry-prometheus 
　　然后在配置文件中添加对应的配置（开启监控，让prometheus拉取配置）
　　# 监控配置 TODO management: endpoint: health: show-details: always metrics: enabled: true prometheus: enabled: true endpoints: web: exposure: include: '*' metrics: export: prometheus: enabled: true 
　　当我们启动服务时，访问/actuator路径可以看到很多输出指标，包括prometheus
　　可以看到打印了这些指标，说明我们的程序访问已经完成，剩下的就是通过prometheus来采集应用指标了。
　　获取prometheus采集到Java应用的数据，其实只要改一下对应的配置文件就大功告成了。在前面写的prometheus.yml文件中添加相关配置信息：
　　 - job_name: 'austin' metrics_path: '/actuator/prometheus' # 采集的路径 static_configs: - targets: ['ip:port'] # todo 这里的ip和端口写自己的应用下的 
　　当我们访问：ip:9090/targets 时，可以看到 prometheus 采集可以到达的端点。如果我们看到自己配置的状态是up，说明是正常的。
　　然后我们继续在 Grafana 中配置相应的监控。这里我选择了4701模板的JVM监控和12900的SpringBoot监控，可以简单的看看它们的效果：
　　06.压力测量
　　到目前为止，我们要发送的消息都是通过 HTTP 接口调用的，恰好 Spring 执行器可以监控 HTTP 数据。那我们再做压力测试，看看监控平台的指标会不会有变化？
　　这里我使用的是压测工具wrk（使用起来很简单）所以，首先安装它（环境Centos 7.6）：
　　sudo yum groupinstall 'Development Tools' sudo yum install -y openssl-devel git git clone https://github.com/wg/wrk.git wrk cd wrk make # 将可执行文件移动到 /usr/local/bin 位置 sudo cp wrk /usr/local/bin # 验证安装是否成功 wrk -v 
　　百度打压测试下：wrk -t2 -c100 -d10s --latency（开启两个线程并发100个10s请求百度）
　　压测我们的接口，然后看数据：wrk -t4 -c100 -d10s --latency ':8888/sendSmsTest?phone=&templateId=1'
　　
　　明明数据有明显波动，而且数据似乎和我们的压力测试不相符？
　　个人理解：prometheus每N秒拉一次暴露的数据（可配置），界面上配置的可视化也是每N秒执行一次Query（可配置）。基于这种架构，我们很难得到某个时刻（秒）对应的值。
　　所以在prometheus系统下只能看到一个时间段内的数值，对QPS、RT等指标不太友好。
　　07. 将项目部署到Linux
　　通过上面的命令，我在 Linux 下运行了 austin 项目，虽然这是一个比较基础的东西。不过为了新人，我把具体过程贴一下吧？
　　首先，我们需要下载JDK
　　下载JDK：https://www.oracle.com/technet ... %3Bbr /> 账号：liwei@xiaostudy.com 密码：OracleTest1234 
　　之后，我们需要将下载的包上传到 Linux。我用的是Mac（使用Windows的同学可以百度下载，估计很简单），IP切换到对应地址。
　　scp -P22 /Users/3y/Downloads/下载的dmg/jdk-8u311-linux-i586.tar.gz root@ip:/root/austin 
　　解压java包
　　tar -zxvf jdk-8u231-linux-x64.tar.gz 
　　配置相应的环境变量：
　　vim /etc/profile # 在配置文件后添加下面的内容 export JAVA_HOME="/root/java/jdk1.8.0_311" export PATH="$JAVA_HOME/bin:$PATH" #刷新配置文件 source /etc/profile # 检查版本看是否安装成功 java -version # 如果出现以下错误，则安装下面的环境 -- 未出现则忽略 -bash: /root/java/jdk1.8.0_311/bin/java: /lib/ld-linux.so.2: bad ELF interpreter: 没有那个文件或目录 # 安装环境 yum install glibc.i686 
　　在本地输入对应的jar包：
　　mvn package -Dmaven.test.skip=true 
　　上传到Linux服务器（同上），然后后台启动：
　　nohup java -jar austin-web-0.0.1-SNAPSHOT.jar --server.port=8888 & 
　　08.业务指标
　　从上面，我配置了 docker 监控、服务器监控和 SpringBoot 应用程序监控。但可以发现，其中大部分是系统性的指标监测。有朋友可能会问：“是吗？你不是说有业务监控吗？怎么没看到？”
　　我们也可以为采集实现自定义指标监控到prometheus，但是如果系统本身连接的是类似ELK的系统，那么我们更倾向于在ELK上做业务指标数据。毕竟ELK是用来做日志数据的。我们只要记录日志，就可以清理日志数据，进行业务指标面板监控。
　　对于austin项目，ELK相关的组件会在后面接上。所以这里不需要prometheus去采集业务指标。我更喜欢使用 prometheus 作为采集系统指标的组件。
　　09. 总结
　　这篇文章主要讲监控的基本介绍（一般都是运维团队做的，但是作为开发者最好了解一下）。如果你公司的系统没有被监控，你可以规划规划，用开源组件搭建相对容易。
　　一个系统对于监控来说确实是必不可少的，监控和故障排除的问题会快得多。
　　最后，我们来回答一下之前采访中提出的问题：“网上有问题，你是怎么调查的？调查的思路是什么？”
　　我是这样理解的：首先，如果网上出现问题。然后想想最近系统有没有发布。很多时候在线问题是由系统的版本变化引起的。如果系统是最近发布的，对线上问题影响比较大，先回滚，不要先排查。
　　如果系统最近没有发布，那么检查系统的监控是否正常（流量监控、业务监控等），一般情况下我们可以从监控中发现问题（毕竟我们最了解系统），很快就出现异常。可以定位问题）
　　如果系统监控没有问题，那么在线查看是否有特殊的错误日志，使用错误日志来排查问题。一般来说，如果你对系统有更深入的了解，还是很容易看出来的。如果没有，就去开发环境用请求参数调试执行过程。
　　所以：我们有回滚机制、监控机制和一般错误，我们会及时提醒他们SMS、电子邮件和IM 工具。如果这些都不可用，我们可能必须通过错误日志来重现问题。这是我的一般调查思路。
　　这个文章就到这里了，预警：我已经在代码中连接了分布式配置中心
　　不知不觉写了这么久。喜欢它并不过分。
　　《》公众号持续分享面试题，没关注的同学可以关注一下！这是奥斯汀项目的最后一个系列，质量杆
　　奥斯汀项目Gitee链接：
　　奥斯汀项目 GitHub 链接：
　　直观:走近监控系统的神经中枢
　　随着软件系统的发展，监控目标场景越来越广泛，对监控系统的能力要求也越来越高。对于监控系统，基本可以分为六部分：数据采集、数据计算、数据存储、异常检测、告警处理和监控可视化。为了更好地应对大规模复杂的监控业务场景，我们不仅需要深化和加强具体的监控能力，还需要建立相应的机制来协调这些能力，使其协同工作。今天的文章文章将介绍监控系统的神经中枢——配置管理和分发系统，让我们一起揭开它的神秘面纱！
　　需要
　　在业务系统开发初期，由于场景简单，监控需求也比较简单。比如只需要采集默认机器监控数据，不需要进程、日志等监控能力。同时，监控的规模也比较小，用户配置的数量一般在几百或几千的水平。这时候只需要定期读取数据库中的配置就可以正常工作了。
　　随着业务系统的快速发展，业务量越来越大，业务的复杂度越来越高，对监控的需求也越来越高。传统的简单读数据库配置在业务扩展性和性能方面遇到了挑战。
　　1 支持不同类型的配置管理
　　监控指标采集、计算、告警等配置类型越来越多。如物理机的机器资源指标，采集应用进程和日志指标配置，站点连通性采集配置，服务器宕机检测任务配置，多实例间指标计算任务配置，异常检测配置指标数据、告警信息发送配置等
　　2 支持不同场景下的配置分发
　　3 支持从故障中快速恢复
　　配置分发系统用作监控中心。有很多相关的模块。系统故障会影响采集、计算、报警子系统的正确性，用户新的监控配置不会生效。因此，需要相应的解决方案来保证监控。系统的快速恢复或重建能力保证了监控系统的可用性。
　　图1 配置管理与分配系统交互流程图
　　程序
　　
　　梳理出问题和需求后，下一步就是针对这些问题进行相应的改造升级。下面从技术角度来介绍一下如何解决这些问题！
　　1 支持配置可扩展性
　　完善的监控能力意味着监控系统的配置灵活多样。如果配置分发模型与业务模型直接相连，则意味着业务中的每一次变更都需要配置并分发到系统中进行相应的变更。那么如何统一配置的多样性，让配置下发对上层业务透明呢？答案是：分类+抽象。
　　1、不同的配置按“目录”分类管理，达到统一的配置管理要求。
　　2、以文件为载体，所有配置都以文件的形式进行管理。不同的文件内容格式代表不同类型的配置。将原有格式的升级和新类型的增加统一抽象成文件处理，增强了系统的扩展能力。
　　3、通过代码管理系统管理文件，实现变更历史跟踪。通过定期备份文件系统，构建快速故障恢复机制，提高系统的可用性和可靠性。
　　图 2 配置分类与抽象
　　在分类方面，由于不同的能力需要不同的配置形式，我们以此为基础进行分类。对应实现，通过目录来表达分类的含义，通过子目录来表达配置的级别和属性的关系。这里我们将配置目录的级别划分为三个级别：监控功能级别->用户级别->应用级别，将具体配置（如进程监控配置、日志监控配置）写入应用目录下的文件中。
　　2 确保一致的交付
　　通过对配置管理方法的抽象和分类，可以通过构建配置文件内容的一致性机制来解决配置的一致性交付问题。我们使用“版本”作为文件内容一致性机制的核心。当用户更改配置时，配置管理系统会生成一个全局唯一的版本来描述配置更改操作，该版本收录更改操作对应的配置文件更改详情。
　　配置发布时，各子系统会定期检测配置版本差异，将本地配置更新到最新版本，以保证每个更新周期内配置一致。
　　3 应对高并发压力
　　
　　大规模的压力主要体现在采集 Agent 的配置分发部分。由于代理只需要获取部署主机所需的监控配置，因此配置文件按照监控的最小单位进行拆分，按照规范打包。
　　图3 代理配置拆分&下载流程
　　目前的业务部署往往采用混合分布的方式，多个不同类型的应用部署在同一台主机上。为了支持这种监控场景，部署在宿主机上的采集Agent会查找宿主机上部署的应用，并下载对应的多个应用配置。随着业务规模的增加，物理机数量增加，配置下载请求也呈指数级增长，因为配置存储的服务器端很容易达到性能瓶颈。采用横向扩展的静态文件下载服务，应对高并发下载压力，采用ETag方式检测文件是否发生变化，只传输变化的配置文件，减少下载流量，最终满足百万主机和千万实例的需求。配置交付要求。
　　4 快速从故障中恢复
　　考虑到配置在监控系统中的重要性，为了保证业务的可用性，需要为监控系统构建快速故障恢复机制。
　　同时，由于监控系统配置集中管理，随着系统的发展，配置量也在不断增加。配置文件的体积达到几十GB的级别，全部由小文件组成，文件数量达到百万级别。为了减轻系统压力，在系统中加入了“快照”机制，定期生成当前全配置的快照。当发生大量更新时，先使用“快照”减少更新量，然后通过相应的同步机制处理少量文件。更新。
　　总结
　　经过不断的努力和多次改造，目前的配置管理和分布已经可以满足监控系统的需要。因为可以灵活地管理多种配置并将它们快速一致地交付给每个系统。面对故障场景，也可以及时撤回配置，避免更大的损失。但是，随着监控服务的发展和系统架构的变化，起核心作用的配置管理和分发系统将面临新的挑战。任重而道远，我要上上下下一探究竟！
　　关于作者：
　　思进，百度高级研发工程师，负责百度智能运维（Noah）监控平台的设计与研发，在监控系统配置管理方面拥有丰富的实践经验。
　　本文转载自公众号AIOps智能运维（ID：AI_Ops）。
　　原文链接：查看全部

直观:丢，我讲的是监控，不是QPS
　　你好，我3岁
　　今天奥斯汀项目给大家一个不一样的点：花点时间关注文章完成，屏幕壁纸即可。我上传一张图，大家就明白了。
　　每当同事扫视你的电脑，就会发现是一个图形化的黑色界面，看起来很高端：“嗯，我又在找bug了。”
　　对了，要聊的话题是监控
　　01. 为什么要监控
　　记得以前采访的时候，有人问我：“网上有问题，你是怎么调查的？调查的方法是什么？”
　　我以前的部门负责人非常重视稳定性，经常要求我们整理系统的上下行和接口信息。我认为：要想提高系统的稳定性，就需要有完善的监控和及时的告警。
　　有了监控，可以快速定位问题（而不是打印日志找问题，很多问题可以通过监控数据直接看到）。有了监控，我们可以配置监控中的所有指标，不管是技术还是业务（但业务数据叫看板，系统数据叫监控）。有了监控，我们会从不同的角度看系统（全面了解系统的性能指标和业务指标）
　　如果你的在线系统没有被监控，那真的不可行。
　　02. 监控开源组件
　　无需考虑监控和报警。直接依赖开源组件就足够了。只有大公司才有人力开发自己的监控和报警组件。
　　我选择了Prometheus，这个在业界还是很有名的，很多公司都用它来做监控和告警。
　　在prometheus官网，我们可以从文档中找到一个架构图：
　　根据我的理解，我“不恰当地”简化了上图
　　简化后发现：他妈一家人的照片很美
　　总的来说，prometheus 的核心在于服务器。如果我们要访问prometheus，其实是打开prometheus拉取数据的界面，然后在web-ui下配置图形界面，实现监控功能。
　　03. Prometheus环境搭建
　　prometheus的环境搭建，我这次也是直接用docker。毕竟，Redis 和 Kafka 都在 docker 上。新建prometheus文件夹，存放docker-compose.yml的信息：
　　version: '2' networks: monitor: driver: bridge services: prometheus: image: prom/prometheus container_name: prometheus hostname: prometheus restart: always volumes: - ./prometheus.yml:/etc/prometheus/prometheus.yml # - ./node_down.yml:/usr/local/etc/node_down.yml:rw ports: - "9090:9090" networks: - monitor alertmanager: image: prom/alertmanager container_name: alertmanager hostname: alertmanager restart: always # volumes: # - ./alertmanager.yml:/usr/local/etc/alertmanager.yml ports: - "9093:9093" networks: - monitor grafana: image: grafana/grafana container_name: grafana hostname: grafana restart: always ports: - "3000:3000" networks: - monitor node-exporter: image: quay.io/prometheus/node-exporter container_name: node-exporter hostname: node-exporter restart: always ports: - "9100:9100" networks: - monitor cadvisor: image: google/cadvisor:latest container_name: cadvisor hostname: cadvisor restart: always volumes: - /:/rootfs:ro - /var/run:/var/run:rw - /sys:/sys:ro - /var/lib/docker/:/var/lib/docker:ro ports: - "8899:8080" networks: - monitor 
　　此处拉取的图片有：
　　新建prometheus配置文件prometheus.yml（这个配置其实就是告诉prometheus从哪个端口拉取相应的监控数据）
　　global: scrape_interval: 15s evaluation_interval: 15s scrape_configs: - job_name: 'prometheus' static_configs: - targets: ['ip:9090'] ## TODO ip自己写 - job_name: 'cadvisor' static_configs: - targets: ['ip:8899'] ## TODO ip自己写 - job_name: 'node' static_configs: - targets: ['ip:9100'] ## TODO ip自己写 
　　（注意这里的端口，根据自己的配置）
　　把这个prometheus.yml的配置复制到/etc/prometheus/prometheus.yml路径下（有很多配置信息我都忽略了没写，prometheus的功能还是挺强大的，想知道的话更多关于监控，可以查看官网文档）
　　然后在目录下启动docker-compose up -d，这样我们就可以访问了：
　　一个 docker-compose 有 5 个服务器，非常好用！
　　04. Grafana配置监控
　　现在我们已经启动了Grafana，我们可以直接使用Grafana作为监控的可视化工具（prometheus有自己的可视化界面，但是我们不需要）。进入Grafana主页，我们首先需要配置prometheus作为我们的数据源
　　进入配置页面，记下对应的URL，保存。

配置好数据源后，我们就可以配置相应的监控信息了。常用的配置监控已经有相应的模板，我们不需要一一配置。（不满意还是要自己配）
　　在这里，我将演示如何使用现有的模板，直接导入相应的模板，相关的模板可以在这里找到。
　　我们只是使用 8919 来直接监控服务器。
　　导入后可以直接在tall上看到监控页面：
　　因为我们使用docker启动了很多服务，所以也可以看一下Docker监控（上面启动的cadvisor服务收录Docker信息），我们使用模板893来配置监控docker信息：
　　05. Java系统指标
　　没想到通过上面的短内容已经配置好了服务器和Docker服务的监控，但是还是少了点什么吧？我们写Java程序，但是JVM相关的监控还没做？这怎么能行。
　　所以，起来
　　配置Java监控也很简单，只要我们在项目中再引入两个pom依赖（SpringBoot自带的监控组件执行器）
　　 org.springframework.boot spring-boot-starter-actuator io.micrometer micrometer-registry-prometheus 
　　然后在配置文件中添加对应的配置（开启监控，让prometheus拉取配置）
　　# 监控配置 TODO management: endpoint: health: show-details: always metrics: enabled: true prometheus: enabled: true endpoints: web: exposure: include: '*' metrics: export: prometheus: enabled: true 
　　当我们启动服务时，访问/actuator路径可以看到很多输出指标，包括prometheus
　　可以看到打印了这些指标，说明我们的程序访问已经完成，剩下的就是通过prometheus来采集应用指标了。
　　获取prometheus采集到Java应用的数据，其实只要改一下对应的配置文件就大功告成了。在前面写的prometheus.yml文件中添加相关配置信息：
　　 - job_name: 'austin' metrics_path: '/actuator/prometheus' # 采集的路径 static_configs: - targets: ['ip:port'] # todo 这里的ip和端口写自己的应用下的 
　　当我们访问：ip:9090/targets 时，可以看到 prometheus 采集可以到达的端点。如果我们看到自己配置的状态是up，说明是正常的。
　　然后我们继续在 Grafana 中配置相应的监控。这里我选择了4701模板的JVM监控和12900的SpringBoot监控，可以简单的看看它们的效果：
　　06.压力测量
　　到目前为止，我们要发送的消息都是通过 HTTP 接口调用的，恰好 Spring 执行器可以监控 HTTP 数据。那我们再做压力测试，看看监控平台的指标会不会有变化？
　　这里我使用的是压测工具wrk（使用起来很简单）所以，首先安装它（环境Centos 7.6）：
　　sudo yum groupinstall 'Development Tools' sudo yum install -y openssl-devel git git clone https://github.com/wg/wrk.git wrk cd wrk make # 将可执行文件移动到 /usr/local/bin 位置 sudo cp wrk /usr/local/bin # 验证安装是否成功 wrk -v 
　　百度打压测试下：wrk -t2 -c100 -d10s --latency（开启两个线程并发100个10s请求百度）
　　压测我们的接口，然后看数据：wrk -t4 -c100 -d10s --latency ':8888/sendSmsTest?phone=&templateId=1'

明明数据有明显波动，而且数据似乎和我们的压力测试不相符？
　　个人理解：prometheus每N秒拉一次暴露的数据（可配置），界面上配置的可视化也是每N秒执行一次Query（可配置）。基于这种架构，我们很难得到某个时刻（秒）对应的值。
　　所以在prometheus系统下只能看到一个时间段内的数值，对QPS、RT等指标不太友好。
　　07. 将项目部署到Linux
　　通过上面的命令，我在 Linux 下运行了 austin 项目，虽然这是一个比较基础的东西。不过为了新人，我把具体过程贴一下吧？
　　首先，我们需要下载JDK
　　下载JDK：https://www.oracle.com/technet ... %3Bbr /> 账号：liwei@xiaostudy.com 密码：OracleTest1234 
　　之后，我们需要将下载的包上传到 Linux。我用的是Mac（使用Windows的同学可以百度下载，估计很简单），IP切换到对应地址。
　　scp -P22 /Users/3y/Downloads/下载的dmg/jdk-8u311-linux-i586.tar.gz root@ip:/root/austin 
　　解压java包
　　tar -zxvf jdk-8u231-linux-x64.tar.gz 
　　配置相应的环境变量：
　　vim /etc/profile # 在配置文件后添加下面的内容 export JAVA_HOME="/root/java/jdk1.8.0_311" export PATH="$JAVA_HOME/bin:$PATH" #刷新配置文件 source /etc/profile # 检查版本看是否安装成功 java -version # 如果出现以下错误，则安装下面的环境 -- 未出现则忽略 -bash: /root/java/jdk1.8.0_311/bin/java: /lib/ld-linux.so.2: bad ELF interpreter: 没有那个文件或目录 # 安装环境 yum install glibc.i686 
　　在本地输入对应的jar包：
　　mvn package -Dmaven.test.skip=true 
　　上传到Linux服务器（同上），然后后台启动：
　　nohup java -jar austin-web-0.0.1-SNAPSHOT.jar --server.port=8888 & 
　　08.业务指标
　　从上面，我配置了 docker 监控、服务器监控和 SpringBoot 应用程序监控。但可以发现，其中大部分是系统性的指标监测。有朋友可能会问：“是吗？你不是说有业务监控吗？怎么没看到？”
　　我们也可以为采集实现自定义指标监控到prometheus，但是如果系统本身连接的是类似ELK的系统，那么我们更倾向于在ELK上做业务指标数据。毕竟ELK是用来做日志数据的。我们只要记录日志，就可以清理日志数据，进行业务指标面板监控。
　　对于austin项目，ELK相关的组件会在后面接上。所以这里不需要prometheus去采集业务指标。我更喜欢使用 prometheus 作为采集系统指标的组件。
　　09. 总结
　　这篇文章主要讲监控的基本介绍（一般都是运维团队做的，但是作为开发者最好了解一下）。如果你公司的系统没有被监控，你可以规划规划，用开源组件搭建相对容易。
　　一个系统对于监控来说确实是必不可少的，监控和故障排除的问题会快得多。
　　最后，我们来回答一下之前采访中提出的问题：“网上有问题，你是怎么调查的？调查的思路是什么？”
　　我是这样理解的：首先，如果网上出现问题。然后想想最近系统有没有发布。很多时候在线问题是由系统的版本变化引起的。如果系统是最近发布的，对线上问题影响比较大，先回滚，不要先排查。
　　如果系统最近没有发布，那么检查系统的监控是否正常（流量监控、业务监控等），一般情况下我们可以从监控中发现问题（毕竟我们最了解系统），很快就出现异常。可以定位问题）
　　如果系统监控没有问题，那么在线查看是否有特殊的错误日志，使用错误日志来排查问题。一般来说，如果你对系统有更深入的了解，还是很容易看出来的。如果没有，就去开发环境用请求参数调试执行过程。
　　所以：我们有回滚机制、监控机制和一般错误，我们会及时提醒他们SMS、电子邮件和IM 工具。如果这些都不可用，我们可能必须通过错误日志来重现问题。这是我的一般调查思路。
　　这个文章就到这里了，预警：我已经在代码中连接了分布式配置中心
　　不知不觉写了这么久。喜欢它并不过分。
　　《》公众号持续分享面试题，没关注的同学可以关注一下！这是奥斯汀项目的最后一个系列，质量杆
　　奥斯汀项目Gitee链接：
　　奥斯汀项目 GitHub 链接：
　　直观:走近监控系统的神经中枢
　　随着软件系统的发展，监控目标场景越来越广泛，对监控系统的能力要求也越来越高。对于监控系统，基本可以分为六部分：数据采集、数据计算、数据存储、异常检测、告警处理和监控可视化。为了更好地应对大规模复杂的监控业务场景，我们不仅需要深化和加强具体的监控能力，还需要建立相应的机制来协调这些能力，使其协同工作。今天的文章文章将介绍监控系统的神经中枢——配置管理和分发系统，让我们一起揭开它的神秘面纱！
　　需要
　　在业务系统开发初期，由于场景简单，监控需求也比较简单。比如只需要采集默认机器监控数据，不需要进程、日志等监控能力。同时，监控的规模也比较小，用户配置的数量一般在几百或几千的水平。这时候只需要定期读取数据库中的配置就可以正常工作了。
　　随着业务系统的快速发展，业务量越来越大，业务的复杂度越来越高，对监控的需求也越来越高。传统的简单读数据库配置在业务扩展性和性能方面遇到了挑战。
　　1 支持不同类型的配置管理
　　监控指标采集、计算、告警等配置类型越来越多。如物理机的机器资源指标，采集应用进程和日志指标配置，站点连通性采集配置，服务器宕机检测任务配置，多实例间指标计算任务配置，异常检测配置指标数据、告警信息发送配置等
　　2 支持不同场景下的配置分发
　　3 支持从故障中快速恢复
　　配置分发系统用作监控中心。有很多相关的模块。系统故障会影响采集、计算、报警子系统的正确性，用户新的监控配置不会生效。因此，需要相应的解决方案来保证监控。系统的快速恢复或重建能力保证了监控系统的可用性。
　　图1 配置管理与分配系统交互流程图
　　程序

　　梳理出问题和需求后，下一步就是针对这些问题进行相应的改造升级。下面从技术角度来介绍一下如何解决这些问题！
　　1 支持配置可扩展性
　　完善的监控能力意味着监控系统的配置灵活多样。如果配置分发模型与业务模型直接相连，则意味着业务中的每一次变更都需要配置并分发到系统中进行相应的变更。那么如何统一配置的多样性，让配置下发对上层业务透明呢？答案是：分类+抽象。
　　1、不同的配置按“目录”分类管理，达到统一的配置管理要求。
　　2、以文件为载体，所有配置都以文件的形式进行管理。不同的文件内容格式代表不同类型的配置。将原有格式的升级和新类型的增加统一抽象成文件处理，增强了系统的扩展能力。
　　3、通过代码管理系统管理文件，实现变更历史跟踪。通过定期备份文件系统，构建快速故障恢复机制，提高系统的可用性和可靠性。
　　图 2 配置分类与抽象
　　在分类方面，由于不同的能力需要不同的配置形式，我们以此为基础进行分类。对应实现，通过目录来表达分类的含义，通过子目录来表达配置的级别和属性的关系。这里我们将配置目录的级别划分为三个级别：监控功能级别->用户级别->应用级别，将具体配置（如进程监控配置、日志监控配置）写入应用目录下的文件中。
　　2 确保一致的交付
　　通过对配置管理方法的抽象和分类，可以通过构建配置文件内容的一致性机制来解决配置的一致性交付问题。我们使用“版本”作为文件内容一致性机制的核心。当用户更改配置时，配置管理系统会生成一个全局唯一的版本来描述配置更改操作，该版本收录更改操作对应的配置文件更改详情。
　　配置发布时，各子系统会定期检测配置版本差异，将本地配置更新到最新版本，以保证每个更新周期内配置一致。
　　3 应对高并发压力
　　

　　大规模的压力主要体现在采集 Agent 的配置分发部分。由于代理只需要获取部署主机所需的监控配置，因此配置文件按照监控的最小单位进行拆分，按照规范打包。
　　图3 代理配置拆分&下载流程
　　目前的业务部署往往采用混合分布的方式，多个不同类型的应用部署在同一台主机上。为了支持这种监控场景，部署在宿主机上的采集Agent会查找宿主机上部署的应用，并下载对应的多个应用配置。随着业务规模的增加，物理机数量增加，配置下载请求也呈指数级增长，因为配置存储的服务器端很容易达到性能瓶颈。采用横向扩展的静态文件下载服务，应对高并发下载压力，采用ETag方式检测文件是否发生变化，只传输变化的配置文件，减少下载流量，最终满足百万主机和千万实例的需求。配置交付要求。
　　4 快速从故障中恢复
　　考虑到配置在监控系统中的重要性，为了保证业务的可用性，需要为监控系统构建快速故障恢复机制。
　　同时，由于监控系统配置集中管理，随着系统的发展，配置量也在不断增加。配置文件的体积达到几十GB的级别，全部由小文件组成，文件数量达到百万级别。为了减轻系统压力，在系统中加入了“快照”机制，定期生成当前全配置的快照。当发生大量更新时，先使用“快照”减少更新量，然后通过相应的同步机制处理少量文件。更新。
　　总结
　　经过不断的努力和多次改造，目前的配置管理和分布已经可以满足监控系统的需要。因为可以灵活地管理多种配置并将它们快速一致地交付给每个系统。面对故障场景，也可以及时撤回配置，避免更大的损失。但是，随着监控服务的发展和系统架构的变化，起核心作用的配置管理和分发系统将面临新的挑战。任重而道远，我要上上下下一探究竟！
　　关于作者：
　　思进，百度高级研发工程师，负责百度智能运维（Noah）监控平台的设计与研发，在监控系统配置管理方面拥有丰富的实践经验。
　　本文转载自公众号AIOps智能运维（ID：AI_Ops）。
　　原文链接：

干货教程:超级干货｜Python学习汇总+0基础资料，做数据采集的一些小技巧

采集交流 • 优采云发表了文章 • 0 个评论 • 120 次浏览 • 2022-11-03 09:19 • 来自相关话题

　　干货教程:超级干货｜Python学习汇总+0基础资料，做数据采集的一些小技巧
　　我学习 Python 已经有一段时间了。在学习的过程中，我不断地实践所学的各种知识。我做的最多的是爬虫，也就是简单的数据采集，里面有采集图片（这个是最多的……），有的下载电影，有的和学习有关，比如爬虫ppt模板，当然我也写过诸如收发邮件、自动登录论坛发帖、验证码相关操作等等！
　　这些脚本有一个共同点。它们都与网络有关。总是使用一些获取链接的方法。我在这里总结一下，分享给正在学习的人。
　　安装相关
　　其实python的各个版本差别不大，用3.6还是3.7不用太担心。
　　至于我们经常使用的库，建议大家先了解安装哪些库，安装哪些库。
　　有的同学会纠结，库装不上。百度搜索推荐这个：python whl 是第一个。其中每个库都有不同的版本。选择对应的下载，用pip安装文件的全路径安装。能！
　　例如：pip install d:\requests_download-0.1.2-py2.py3-none-any.whl
　　最基本的抓取站——获取源码
　　导入请求#导入库
　　html = requests.get(url)#获取源代码
　　
　　html.encoding='utf-8'#指定收录中文的网页源码的编码格式，具体格式一般存在于源码的meta标签中
　　对于静态网页
　　网站反“反爬”
　　大部分网站（各种中小网站）都需要你的代码有headers信息，如果没有，会直接拒绝你的访问！大型网站，尤其是门户网站，如新浪新闻、今日头条图集、百度图片的爬虫等很少。！
　　对于有防爬措施的网站，大部分可以按照添加UA信息的顺序添加到headers数据（字典格式）中——添加HOST和Referer（防盗链）信息！代码格式 requestts.get(url,headers=headers)
　　UA信息是浏览器信息。它告诉另一个服务器我们是什么浏览器。通常，我们可以采集相关信息来制作一个UA池。我们可以在需要的时候调用，也可以随机调用，防止被网站发现。是的，如果是移动端，一定要注意移动网页和PC端的区别。例如，我们更喜欢移动端作为微博爬虫。其抗爬网能力远低于PC端。网站反爬很厉害，可以到手机端（手机登录复制url），说不定有惊喜！
　　HOST信息，网站的主机信息，这个一般不变
　　Referer信息，这是“防盗链”的关键信息。简单来说就是你来到当前页面的地方，破解也很简单，把url放进去就行了！
　　如果上面的方法还是绕不过反爬的话，那就比较麻烦了，把所有信息都写在headers里。
　　终极反“反爬”：学硒，少年！
　　
　　保存文件
　　其实可以简单的分为两类：字符串内容保存和其他内容保存！简单2行代码即可解决
　　a+是文本末尾的附加书写方式，适合字符串内容的书写。注意排版。也可以在'a+'后面加上参数encoding='utf-8'来指定保存文本的编码格式
　　wb为二进制写入方式，适用于找到对象的真实下载地址后，以二进制方式下载文件
　　奖金时间！
　　关于2019 Python 400集高清视频教程，教程内容包括最新资源+基础基础+实战经验。近期想学习python的朋友可以学习一下。说了这么多粉丝，能学到这么丰富的教程吗？小编来告诉你，只要你细心，绝对可以学会的。喜欢的朋友可以采集一份。在外面训练 python 视频教程是非常昂贵的。今天很难跟大家分享。教程就在你面前。学会看自己，希望这些资料对你有所帮助。
　　获取方法：
　　1.点击右上角关注；
　　专业知识:怎么提高百度权重？利用枫树seo站长工具提高百度权重
　　每个从事SEO工作的人都会接触到网站权重的概念。每个站长都渴望增加网站的权重，却不知从何下手。今天枫叶SEO小编就和大家一起来看看百度的权重是多少？网站为什么体重下降了？如何增加百度的权重？
　　什么是百度权重？
　　网站权重是指某个网站在搜索引擎上的综合排名能力，但实际上百度没有网站权重的说法，百度权重是第三方站长工具根据平台估算，百度搜索引擎对某个网站关键词的热度进行评分，等级分为0~9。越来越受到搜索引擎的欢迎。
　　如何查看网站的重量？
　　您可以使用站长工具查询网站的权重，例如：枫叶SEO、爱站、站长之家等平台可以进行全面的SEO查询，并定期查看网站权重分析网站数据可以给出有效的发展规划。
　　网站为什么体重下降了？
　　1、网站使用了关键词堆垛、BLOG群发、斗篷法等黑帽SEO方式，被百度发现，确定网站作弊后降级权威;
　　2、服务器空间宕机，导致网站无法访问或访问速度过慢，搜索引擎蜘蛛抓取网页不流畅，用户浏览体验不佳；
　　3、网站过度的SEO优化会导致搜索引擎认为网站是垃圾站，认为网站是作弊的；
　　4. 网站结构太模仿其他网站；
　　5、网站上的大部分内容是文章，是其他网站通过采集携带的，原创内容不多是有意义的；
　　6、网站动辄修改，搜索引擎有记忆，网站频繁修改会导致搜索引擎下次访问找到对应的内容进行爬取，从而减少爬取，减轻权重；
　　7、网站经常更换网站的标题，会导致搜索引擎不稳定收录网站，权重可能会下降，从而影响网站 ;
　　
　　8、网站被恶意镜像；
　　9、参赛者在网站的评论下留下过多的垃圾锚文本链接，影响网站的外链质量；
　　10、网站长时间不更新，或大部分更新内容与网站主题无关，内容无意义；
　　11、网站短时间内增加大量外链，被搜索引擎判定为作弊，导致网站减少；
　　12. 短时间内大量减少外部链接也会导致网站降级；
　　13、网站有网站被搜索引擎判定作弊并处罚在同一个IP地址。
　　如何增加百度的权重？
　　1.域名和服务器的选择
　　注册网站域名时，尽量选择有记录、时间长、没有黑历史的老域名。老域名可以增加搜索引擎的信任度；在预算范围内选择最好的服务器，高速稳定的服务器可以保证搜索引擎蜘蛛和用户可以访问网站正常查看内容。
　　2.设置首选域
　　由于一个网站至少有两个域名显示给搜索引擎，虽然搜索引擎会默认指向相同的网站域名，有WWW没有www，为了防止网站拥有多个域名会导致权重分散。网站应该选择其中一个域名作为首选域名，这样可以让网站的PR值更加集中准确。
　　3. URL标准化
　　如果网站的首页可以通过不同的URL访问，那么需要指定一个URL指向首页，将所有内外部链接都指向一个URL。
　　4. 选择合适的关键词
　　
　　在网站关键词上谨慎选择，不要选择竞争激烈的词来排名。例如：如果Maple SEO网站直接使用“SEO”作为网站的关键词，想想是否有成千上万的人在做关键词“SEO”，你怎么能保证你的网站会在数以百万计的人中脱颖而出吗？竞争太激烈了，可以缩小范围，把关键词设为“南宁SEO”，会不会少很多竞争？这样的关键词排名速度也会让网站获得权重的时间得到有效的缩短。
　　5.交换友链，在网站中添加优质外链
　　高质量的外部链接具有很高的权重，并且受到搜索引擎的信任。将它们链接到网站也可以增加它们自己的网站的权重。
　　6.创建百度百科词条
　　百度百科具有很高的权威性。如果在百度上建立自己的网站百科词条，可以获得大量的流量、曝光率和转化率。
　　7、优质网站内容稳定更新
　　网站上线后，需要持续稳定的更新网站的内容。不要一次全部更新，然后再不更新。您可以设置发布内容的时间。更新的内容必须与网站 Relevance的内容保持一致，从解决用户需求出发，为用户和搜索引擎提供有价值的内容。也可以使用Maple seoURL推送工具绑定网站，让站长工具自动抓取网站更新的网页并提交给百度，可以减少百度蜘蛛发现网页的时间和加快收录，提高网站的排名。
　　8.站内定向锚文本
　　网站内的每个内页都应该有一个锚文本，以将网站的权重集中在网站的首页上。
　　9. 面包屑
　　面包屑导航可以体现网站的结构，让用户了解自己当前的位置，引导用户穿越网站，帮助用户快速了解网站的内容，减少网站跳出率；搜索引擎蜘蛛还可以沿着面包屑导航的链接抓取网页，非常方便。面包屑不仅有利于搜索引擎抓取，也有助于提升用户的浏览体验，所以可以在网站中设置。
　　10.密切关注你的竞争对手
　　古语有云：知己知彼，百战不殆。要想稳定自己的网站排名，就要不断观察竞争对手的网站在发生什么变化，如何优化关键词，网站排名有没有变化还有收录等，取其精华，去其糟粕，才有机会超越他人。
　　以上就是枫叶小编根据实践经验得出的结论，百度权重是什么以及网站权重下降的13个原因以及百度权重提升的10个方法。如果您觉得本文文章对您有帮助，请关注并保存。查看全部

　　干货教程:超级干货｜Python学习汇总+0基础资料，做数据采集的一些小技巧
　　我学习 Python 已经有一段时间了。在学习的过程中，我不断地实践所学的各种知识。我做的最多的是爬虫，也就是简单的数据采集，里面有采集图片（这个是最多的……），有的下载电影，有的和学习有关，比如爬虫ppt模板，当然我也写过诸如收发邮件、自动登录论坛发帖、验证码相关操作等等！
　　这些脚本有一个共同点。它们都与网络有关。总是使用一些获取链接的方法。我在这里总结一下，分享给正在学习的人。
　　安装相关
　　其实python的各个版本差别不大，用3.6还是3.7不用太担心。
　　至于我们经常使用的库，建议大家先了解安装哪些库，安装哪些库。
　　有的同学会纠结，库装不上。百度搜索推荐这个：python whl 是第一个。其中每个库都有不同的版本。选择对应的下载，用pip安装文件的全路径安装。能！
　　例如：pip install d:\requests_download-0.1.2-py2.py3-none-any.whl
　　最基本的抓取站——获取源码
　　导入请求#导入库
　　html = requests.get(url)#获取源代码
　　

　　html.encoding='utf-8'#指定收录中文的网页源码的编码格式，具体格式一般存在于源码的meta标签中
　　对于静态网页
　　网站反“反爬”
　　大部分网站（各种中小网站）都需要你的代码有headers信息，如果没有，会直接拒绝你的访问！大型网站，尤其是门户网站，如新浪新闻、今日头条图集、百度图片的爬虫等很少。！
　　对于有防爬措施的网站，大部分可以按照添加UA信息的顺序添加到headers数据（字典格式）中——添加HOST和Referer（防盗链）信息！代码格式 requestts.get(url,headers=headers)
　　UA信息是浏览器信息。它告诉另一个服务器我们是什么浏览器。通常，我们可以采集相关信息来制作一个UA池。我们可以在需要的时候调用，也可以随机调用，防止被网站发现。是的，如果是移动端，一定要注意移动网页和PC端的区别。例如，我们更喜欢移动端作为微博爬虫。其抗爬网能力远低于PC端。网站反爬很厉害，可以到手机端（手机登录复制url），说不定有惊喜！
　　HOST信息，网站的主机信息，这个一般不变
　　Referer信息，这是“防盗链”的关键信息。简单来说就是你来到当前页面的地方，破解也很简单，把url放进去就行了！
　　如果上面的方法还是绕不过反爬的话，那就比较麻烦了，把所有信息都写在headers里。
　　终极反“反爬”：学硒，少年！
　　

　　保存文件
　　其实可以简单的分为两类：字符串内容保存和其他内容保存！简单2行代码即可解决
　　a+是文本末尾的附加书写方式，适合字符串内容的书写。注意排版。也可以在'a+'后面加上参数encoding='utf-8'来指定保存文本的编码格式
　　wb为二进制写入方式，适用于找到对象的真实下载地址后，以二进制方式下载文件
　　奖金时间！
　　关于2019 Python 400集高清视频教程，教程内容包括最新资源+基础基础+实战经验。近期想学习python的朋友可以学习一下。说了这么多粉丝，能学到这么丰富的教程吗？小编来告诉你，只要你细心，绝对可以学会的。喜欢的朋友可以采集一份。在外面训练 python 视频教程是非常昂贵的。今天很难跟大家分享。教程就在你面前。学会看自己，希望这些资料对你有所帮助。
　　获取方法：
　　1.点击右上角关注；
　　专业知识:怎么提高百度权重？利用枫树seo站长工具提高百度权重
　　每个从事SEO工作的人都会接触到网站权重的概念。每个站长都渴望增加网站的权重，却不知从何下手。今天枫叶SEO小编就和大家一起来看看百度的权重是多少？网站为什么体重下降了？如何增加百度的权重？
　　什么是百度权重？
　　网站权重是指某个网站在搜索引擎上的综合排名能力，但实际上百度没有网站权重的说法，百度权重是第三方站长工具根据平台估算，百度搜索引擎对某个网站关键词的热度进行评分，等级分为0~9。越来越受到搜索引擎的欢迎。
　　如何查看网站的重量？
　　您可以使用站长工具查询网站的权重，例如：枫叶SEO、爱站、站长之家等平台可以进行全面的SEO查询，并定期查看网站权重分析网站数据可以给出有效的发展规划。
　　网站为什么体重下降了？
　　1、网站使用了关键词堆垛、BLOG群发、斗篷法等黑帽SEO方式，被百度发现，确定网站作弊后降级权威;
　　2、服务器空间宕机，导致网站无法访问或访问速度过慢，搜索引擎蜘蛛抓取网页不流畅，用户浏览体验不佳；
　　3、网站过度的SEO优化会导致搜索引擎认为网站是垃圾站，认为网站是作弊的；
　　4. 网站结构太模仿其他网站；
　　5、网站上的大部分内容是文章，是其他网站通过采集携带的，原创内容不多是有意义的；
　　6、网站动辄修改，搜索引擎有记忆，网站频繁修改会导致搜索引擎下次访问找到对应的内容进行爬取，从而减少爬取，减轻权重；
　　7、网站经常更换网站的标题，会导致搜索引擎不稳定收录网站，权重可能会下降，从而影响网站 ;
　　

　　8、网站被恶意镜像；
　　9、参赛者在网站的评论下留下过多的垃圾锚文本链接，影响网站的外链质量；
　　10、网站长时间不更新，或大部分更新内容与网站主题无关，内容无意义；
　　11、网站短时间内增加大量外链，被搜索引擎判定为作弊，导致网站减少；
　　12. 短时间内大量减少外部链接也会导致网站降级；
　　13、网站有网站被搜索引擎判定作弊并处罚在同一个IP地址。
　　如何增加百度的权重？
　　1.域名和服务器的选择
　　注册网站域名时，尽量选择有记录、时间长、没有黑历史的老域名。老域名可以增加搜索引擎的信任度；在预算范围内选择最好的服务器，高速稳定的服务器可以保证搜索引擎蜘蛛和用户可以访问网站正常查看内容。
　　2.设置首选域
　　由于一个网站至少有两个域名显示给搜索引擎，虽然搜索引擎会默认指向相同的网站域名，有WWW没有www，为了防止网站拥有多个域名会导致权重分散。网站应该选择其中一个域名作为首选域名，这样可以让网站的PR值更加集中准确。
　　3. URL标准化
　　如果网站的首页可以通过不同的URL访问，那么需要指定一个URL指向首页，将所有内外部链接都指向一个URL。
　　4. 选择合适的关键词
　　

　　在网站关键词上谨慎选择，不要选择竞争激烈的词来排名。例如：如果Maple SEO网站直接使用“SEO”作为网站的关键词，想想是否有成千上万的人在做关键词“SEO”，你怎么能保证你的网站会在数以百万计的人中脱颖而出吗？竞争太激烈了，可以缩小范围，把关键词设为“南宁SEO”，会不会少很多竞争？这样的关键词排名速度也会让网站获得权重的时间得到有效的缩短。
　　5.交换友链，在网站中添加优质外链
　　高质量的外部链接具有很高的权重，并且受到搜索引擎的信任。将它们链接到网站也可以增加它们自己的网站的权重。
　　6.创建百度百科词条
　　百度百科具有很高的权威性。如果在百度上建立自己的网站百科词条，可以获得大量的流量、曝光率和转化率。
　　7、优质网站内容稳定更新
　　网站上线后，需要持续稳定的更新网站的内容。不要一次全部更新，然后再不更新。您可以设置发布内容的时间。更新的内容必须与网站 Relevance的内容保持一致，从解决用户需求出发，为用户和搜索引擎提供有价值的内容。也可以使用Maple seoURL推送工具绑定网站，让站长工具自动抓取网站更新的网页并提交给百度，可以减少百度蜘蛛发现网页的时间和加快收录，提高网站的排名。
　　8.站内定向锚文本
　　网站内的每个内页都应该有一个锚文本，以将网站的权重集中在网站的首页上。
　　9. 面包屑
　　面包屑导航可以体现网站的结构，让用户了解自己当前的位置，引导用户穿越网站，帮助用户快速了解网站的内容，减少网站跳出率；搜索引擎蜘蛛还可以沿着面包屑导航的链接抓取网页，非常方便。面包屑不仅有利于搜索引擎抓取，也有助于提升用户的浏览体验，所以可以在网站中设置。
　　10.密切关注你的竞争对手
　　古语有云：知己知彼，百战不殆。要想稳定自己的网站排名，就要不断观察竞争对手的网站在发生什么变化，如何优化关键词，网站排名有没有变化还有收录等，取其精华，去其糟粕，才有机会超越他人。
　　以上就是枫叶小编根据实践经验得出的结论，百度权重是什么以及网站权重下降的13个原因以及百度权重提升的10个方法。如果您觉得本文文章对您有帮助，请关注并保存。

详细介绍:泛目录快速收录排名原理

采集交流 • 优采云发表了文章 • 0 个评论 • 136 次浏览 • 2022-11-03 09:00 • 来自相关话题

详细介绍:泛目录快速收录排名原理
　　究竟什么是泛目录？为什么这么多人在寻找泛目录快速排名方法？今天，bug 博客（）分享了《Pan Directory 收录 Ranking Principle（Pan Directory 站群 Program）》。我希望能有所帮助。
　　泛目录收录排名原则
　　1.什么是泛目录
　　pan-directory，在seo圈里通常是指那些能够自动采集最新资讯和热点，然后批量生成大量相互关联的文章、标签或者栏目页面，并且可以自动推送百度搜索程序的链接。这里有几点需要注意：
　　1.自动采集最新消息和热点
　　一个好的泛目录必须是一次采集新内容的程序，最好是当天的热点新闻。
　　2. 互联页面
　　一个好的pan目录会产生大量相互关联的页面，或者说是链轮，也就是无数蜘蛛因为没有尽头而爬不上去的页面。这些页面可以是文章、标签或部分。
　　3.推
　　现在大部分站群系统都有自动推送的功能，直接获取百度提交的推送API，定期向百度推送文章。
　　
　　4. 程序
　　bug博客认为这个程序可以看成是一个带有一定脚本功能的php程序，当然也可以是一个asp程序，或者我们可以简单的把它看成一个网站程序，就像dedecms和WordPress的网站程序一样，但是大部分人的泛目录程序没有后台，直接修改php代码（或asp代码）即可完成站点信息配置。
　　2.泛目录排序原则
　　泛目录是搜索引擎的目标。它的快速排名原理是什么？错误博客总结了以下几点：
　　1.旧域名
　　老域名不是简单的说注册时间长，而是之前有建站的历史。它曾经网站流量和排名都很高。如果能有很多高质量的外链就更好了。它非常快，因为它本身具有搜索引擎友好性。因此，很多人为了快速排名，高价购买一些有企业网站记录的老域名。一般来说，PR值高的域名都不错。如果没有做过违法的内容，效果会更好。如果这样做，您可能无法起床。
　　2、揉热点
　　很多网站也发表过很多原创内容，但是这些原创内容属于多少年前的知识了，如果网站权重很低的话，那么搜索引擎就会非常关注这个内容。这样的内容可能不受欢迎，他们也不认为这样的内容对互联网有一定的价值。自然，他们不会对这些电台发布的原创文章进行排名。
　　采集最新消息
　　一个已经有一定排名能力的老域名，再加上当天的新闻热点，那么对于搜索引擎来说，如果内容比较新，网站信任度高的话，可能会给这个泛目录< 文章一些关键词排名。
　　
　　热点
　　3.无限链轮
　　网站可以给文章一个排名，即使网站的权重很高，也不是每一个像文章这样的垃圾都会排名，所以泛目录的无限链轮会起到一定的作用。因为文章内容本身也使用了关键词和采集这两个句子来构造标题和内容。说白了就是将采集的最新内容进行拆分，然后随机调用到文章的正文中，标题直接采用优化后的关键词，调用关键词在文章的正文中。
　　构建文章
　　4.推
　　很多程序都号称能吸引蜘蛛，或者在我们的网站上放一些蜘蛛，但说这话的人多半是想收割韭菜。很多不懂的人只看到了蜘蛛的增加，但他们不知道的是，程序中只放置了自动推送功能，可以吸引一些蜘蛛。有人说各种搜索引擎的蜘蛛都来了，人为地把一些蜘蛛引到你的网站。时间长了，你会发现蜘蛛没有来，网站网站也没有收录。
　　自动推送功能是泛目录必不可少的功能。不要小看这一点。网站每天最小推送额度3000，最大推送额度100000。一般来说，如果你购买更好的旧域名，推送配额是10,000。每次推送意味着推送一个 sprocket 页面。还有一些泛目录直接提交大量的sitemap，效果感觉差不多，原理也差不多，但是sitemap感觉提交的会比较多。
　　您需要联系上述泛目录程序的站长。
　　以上是错误博客（）分享的“Pan Directory 收录 Ranking Principle（Pan Directory 站群 Program）”。谢谢阅读。更多原创文章搜索“bug 博客”。
　　测评:盘点14款SEO竞争分析工具（助力排名更上一层楼）
　　例如，如果您是工业泵制造商，您可以搜索“工业泵制造商”，并在页面顶部输入结果的域名。该报告将告诉您竞争对手正在撰写的主题以及每个主题的表现。
　　这种类型的 SEO 竞争分析将帮助您建立成功的内容营销策略并主导搜索结果。
　　3.页面优化器专业版
　　Page Optimizer Pro 允许插入网站和直接竞争对手的特定关键字。然后，它会告诉您与那些在特定关键字上表现优于您的竞争对手相比，您的页面缺少什么。它涵盖了页面复制、元数据和一些技术内容。
　　这个 SEO 比较工具有两个优点：
　　(1) 考虑到每个关键词有不同的排名因素，Page Optimizer Pro 会根据每个具体的关键词来获取数据，这意味着您不必在所谓的“排名因素”上浪费时间。
　　(2) Page Optimizer Pro 仅根据单一变体测试测量经科学证明会影响排名的因素。
　　4. Alexa流量排名
　　Alexa 流量排名信息丰富，可以轻松提供价值。只需单击一个按钮，Alexa 流量排名工具即可轻松集成到您的 Google Chrome 浏览器中，为您提供强大的信息。
　　用户可以使用该工具分析自己的网站或其他网站以识别网站开发、SEO 中的特定缺陷，甚至查看网站是否比它更容易受到攻击实际上是。欢迎。
　　Alexa 的流量报告可帮助用户了解竞争对手在哪里获得了大部分流量，以及他们是如何获得这些流量的。
　　5.谷歌
　　对于特定的搜索词，更有价值的工具是谷歌本身。
　　对于全面的 SEO 竞争分析，用户可以从研究更热门的行业关键词开始，然后根据前 10 个结果进行谷歌搜索。
　　PageSpeed洞察力
　　但它不仅仅是谷歌的搜索结果可以提供帮助，谷歌页面速度洞察力也是一个很好的工具，可以对你的竞争对手进行页面速度分析。
　　Google 的算法倾向于提供更好的用户体验和快速加载网站。通过进行页面速度洞察，您可以构建快速加载页面并提高排名的机会。
　　
　　结构化数据测试
　　以竞争对手的 3-5 个排名靠前的页面为例。通过 Google 的结构化数据测试工具运行其页面。看看他们在这些页面上使用了什么样的架构，找出你缺少的东西并添加到你的竞争页面中。
　　6.间谍
　　借助 SpyFu 工具中的一系列 SEO 竞争对手分析功能，SpyFu 允许您查看任何公司的 SEO 绩效并将您的关键词与竞争对手进行比较。
　　除了显示客户站点与竞争对手站点之间的重叠之外，SpyFu 还可以轻松地使用数据进行优化以确保客户满意度。
　　7. 冲浪者
　　审核网站和页面是识别您与竞争对手之间差距的重要一步。
　　您可以使用审核，因为它可以为您要审核的页面提出非常具体的建议。搜索引擎优化工具将向您展示您的元标签有什么问题以及谁链接到您的竞争对手。
　　Surfer 可以将您的内容与前十名的排名进行比较，它会告诉您是否添加或删除内容，在哪里添加或删除精确、相似的关键字，以及前十名中多个页面的链接。网站列表。
　　8. 搜索指标
　　进行 SEO 竞争对手分析的最佳方法是在 Searchmetrics 上，将有机竞争对手可见性功能与 Google 更新功能结合使用。
　　Searchmetrics 可以帮助用户了解竞争对手是否受到算法更新的严重影响，以及用户可以从竞争对手那里学到什么。
　　9.雄伟的搜索引擎优化
　　Majestic SEO 是一种工具，可以跟踪您和您的竞争对手收到的反向链接。
　　为什么知道谁与您的竞争对手有关联很重要？因为很多时候，这些公司也会链接到你，推高你的排名。Majestic SEO 是您查看此内容的工具。
　　Majestic SEO 可以帮助您正确分析反向链接并查看您与竞争对手之间的差距。
　　10. Moz 链接资源管理器
　　
　　Moz Link Explorer 在进行 SEO 竞争性研究时是一个有价值的工具。使用它时，您输入一个链接到竞争对手的网站，它会为您提供相关数据：DA、链接域、入站链接和前 50 个关键字的数量。
　　每月最多 10 个网站是免费的，因此 Moz Link Explorer 是更免费的工具。
　　此外，Moz Link Explorer 还有其他功能。Moz 的关键字搜索功能允许您根据目标关键词识别竞争对手。它显示特定关键字的竞争程度（基于其在 Google 搜索结果首页上的排名），并向您显示首页上的网站是什么。
　　11. 数字权威
　　Digital Authority 工具可以分析任何关键词的前 10 页，并为您提供有关这些结果在影响搜索排名的各种参数上的表现的综合报告。
　　12. 优步推荐
　　您可以通过在 Ubersuggest 中键入链接来研究内容和内容中的关键字。
　　使用 Ubersuggest 时，您所要做的就是联系链接到他们帖子的人，并告诉他们为什么您的帖子更好。您还可以通过在 Ubersuggest 中输入搜索结果找到所有与他们相关的网站。
　　13. 尖叫的青蛙
　　Screaming Frog 工具速度很快，并提供所有页面及其元数据的快速概览。
　　一些网站s没有很好的SEO，通过Screaming Frog分析他们的元数据，你可以快速了解网站SEO优化是怎么回事。
　　Screaming Frog 还可以帮助您全面了解竞争对手网站的表现。
　　14. 康皮特
　　Kompyte 可让您实时跟踪竞争对手的网站变化和其他信息来源。
　　Kompyte 可让您了解您的竞争对手网站的活跃程度、他们编写的内容、他们正在运行的 A/B 测试以及其他有用信息。您可以将这些发现与他们内置的关键词跟踪器相关联，以查看哪些变化对他们的排名产生了影响。
　　以上就是易读狗小编整理的14个SEO竞争分析工具和帮助排名更上一层楼的相关知识，希望对大家有所帮助。
　　相关文章查看全部

　　详细介绍:泛目录快速收录排名原理
　　究竟什么是泛目录？为什么这么多人在寻找泛目录快速排名方法？今天，bug 博客（）分享了《Pan Directory 收录 Ranking Principle（Pan Directory 站群 Program）》。我希望能有所帮助。
　　泛目录收录排名原则
　　1.什么是泛目录
　　pan-directory，在seo圈里通常是指那些能够自动采集最新资讯和热点，然后批量生成大量相互关联的文章、标签或者栏目页面，并且可以自动推送百度搜索程序的链接。这里有几点需要注意：
　　1.自动采集最新消息和热点
　　一个好的泛目录必须是一次采集新内容的程序，最好是当天的热点新闻。
　　2. 互联页面
　　一个好的pan目录会产生大量相互关联的页面，或者说是链轮，也就是无数蜘蛛因为没有尽头而爬不上去的页面。这些页面可以是文章、标签或部分。
　　3.推
　　现在大部分站群系统都有自动推送的功能，直接获取百度提交的推送API，定期向百度推送文章。
　　

4. 程序
　　bug博客认为这个程序可以看成是一个带有一定脚本功能的php程序，当然也可以是一个asp程序，或者我们可以简单的把它看成一个网站程序，就像dedecms和WordPress的网站程序一样，但是大部分人的泛目录程序没有后台，直接修改php代码（或asp代码）即可完成站点信息配置。
　　2.泛目录排序原则
　　泛目录是搜索引擎的目标。它的快速排名原理是什么？错误博客总结了以下几点：
　　1.旧域名
　　老域名不是简单的说注册时间长，而是之前有建站的历史。它曾经网站流量和排名都很高。如果能有很多高质量的外链就更好了。它非常快，因为它本身具有搜索引擎友好性。因此，很多人为了快速排名，高价购买一些有企业网站记录的老域名。一般来说，PR值高的域名都不错。如果没有做过违法的内容，效果会更好。如果这样做，您可能无法起床。
　　2、揉热点
　　很多网站也发表过很多原创内容，但是这些原创内容属于多少年前的知识了，如果网站权重很低的话，那么搜索引擎就会非常关注这个内容。这样的内容可能不受欢迎，他们也不认为这样的内容对互联网有一定的价值。自然，他们不会对这些电台发布的原创文章进行排名。
　　采集最新消息
　　一个已经有一定排名能力的老域名，再加上当天的新闻热点，那么对于搜索引擎来说，如果内容比较新，网站信任度高的话，可能会给这个泛目录< 文章一些关键词排名。

　　热点
　　3.无限链轮
　　网站可以给文章一个排名，即使网站的权重很高，也不是每一个像文章这样的垃圾都会排名，所以泛目录的无限链轮会起到一定的作用。因为文章内容本身也使用了关键词和采集这两个句子来构造标题和内容。说白了就是将采集的最新内容进行拆分，然后随机调用到文章的正文中，标题直接采用优化后的关键词，调用关键词在文章的正文中。
　　构建文章
　　4.推
　　很多程序都号称能吸引蜘蛛，或者在我们的网站上放一些蜘蛛，但说这话的人多半是想收割韭菜。很多不懂的人只看到了蜘蛛的增加，但他们不知道的是，程序中只放置了自动推送功能，可以吸引一些蜘蛛。有人说各种搜索引擎的蜘蛛都来了，人为地把一些蜘蛛引到你的网站。时间长了，你会发现蜘蛛没有来，网站网站也没有收录。
　　自动推送功能是泛目录必不可少的功能。不要小看这一点。网站每天最小推送额度3000，最大推送额度100000。一般来说，如果你购买更好的旧域名，推送配额是10,000。每次推送意味着推送一个 sprocket 页面。还有一些泛目录直接提交大量的sitemap，效果感觉差不多，原理也差不多，但是sitemap感觉提交的会比较多。
　　您需要联系上述泛目录程序的站长。
　　以上是错误博客（）分享的“Pan Directory 收录 Ranking Principle（Pan Directory 站群 Program）”。谢谢阅读。更多原创文章搜索“bug 博客”。
　　测评:盘点14款SEO竞争分析工具（助力排名更上一层楼）
　　例如，如果您是工业泵制造商，您可以搜索“工业泵制造商”，并在页面顶部输入结果的域名。该报告将告诉您竞争对手正在撰写的主题以及每个主题的表现。
　　这种类型的 SEO 竞争分析将帮助您建立成功的内容营销策略并主导搜索结果。
　　3.页面优化器专业版
　　Page Optimizer Pro 允许插入网站和直接竞争对手的特定关键字。然后，它会告诉您与那些在特定关键字上表现优于您的竞争对手相比，您的页面缺少什么。它涵盖了页面复制、元数据和一些技术内容。
　　这个 SEO 比较工具有两个优点：
　　(1) 考虑到每个关键词有不同的排名因素，Page Optimizer Pro 会根据每个具体的关键词来获取数据，这意味着您不必在所谓的“排名因素”上浪费时间。
　　(2) Page Optimizer Pro 仅根据单一变体测试测量经科学证明会影响排名的因素。
　　4. Alexa流量排名
　　Alexa 流量排名信息丰富，可以轻松提供价值。只需单击一个按钮，Alexa 流量排名工具即可轻松集成到您的 Google Chrome 浏览器中，为您提供强大的信息。
　　用户可以使用该工具分析自己的网站或其他网站以识别网站开发、SEO 中的特定缺陷，甚至查看网站是否比它更容易受到攻击实际上是。欢迎。
　　Alexa 的流量报告可帮助用户了解竞争对手在哪里获得了大部分流量，以及他们是如何获得这些流量的。
　　5.谷歌
　　对于特定的搜索词，更有价值的工具是谷歌本身。
　　对于全面的 SEO 竞争分析，用户可以从研究更热门的行业关键词开始，然后根据前 10 个结果进行谷歌搜索。
　　PageSpeed洞察力
　　但它不仅仅是谷歌的搜索结果可以提供帮助，谷歌页面速度洞察力也是一个很好的工具，可以对你的竞争对手进行页面速度分析。
　　Google 的算法倾向于提供更好的用户体验和快速加载网站。通过进行页面速度洞察，您可以构建快速加载页面并提高排名的机会。
　　

　　结构化数据测试
　　以竞争对手的 3-5 个排名靠前的页面为例。通过 Google 的结构化数据测试工具运行其页面。看看他们在这些页面上使用了什么样的架构，找出你缺少的东西并添加到你的竞争页面中。
　　6.间谍
　　借助 SpyFu 工具中的一系列 SEO 竞争对手分析功能，SpyFu 允许您查看任何公司的 SEO 绩效并将您的关键词与竞争对手进行比较。
　　除了显示客户站点与竞争对手站点之间的重叠之外，SpyFu 还可以轻松地使用数据进行优化以确保客户满意度。
　　7. 冲浪者
　　审核网站和页面是识别您与竞争对手之间差距的重要一步。
　　您可以使用审核，因为它可以为您要审核的页面提出非常具体的建议。搜索引擎优化工具将向您展示您的元标签有什么问题以及谁链接到您的竞争对手。
　　Surfer 可以将您的内容与前十名的排名进行比较，它会告诉您是否添加或删除内容，在哪里添加或删除精确、相似的关键字，以及前十名中多个页面的链接。网站列表。
　　8. 搜索指标
　　进行 SEO 竞争对手分析的最佳方法是在 Searchmetrics 上，将有机竞争对手可见性功能与 Google 更新功能结合使用。
　　Searchmetrics 可以帮助用户了解竞争对手是否受到算法更新的严重影响，以及用户可以从竞争对手那里学到什么。
　　9.雄伟的搜索引擎优化
　　Majestic SEO 是一种工具，可以跟踪您和您的竞争对手收到的反向链接。
　　为什么知道谁与您的竞争对手有关联很重要？因为很多时候，这些公司也会链接到你，推高你的排名。Majestic SEO 是您查看此内容的工具。
　　Majestic SEO 可以帮助您正确分析反向链接并查看您与竞争对手之间的差距。
　　10. Moz 链接资源管理器
　　

　　Moz Link Explorer 在进行 SEO 竞争性研究时是一个有价值的工具。使用它时，您输入一个链接到竞争对手的网站，它会为您提供相关数据：DA、链接域、入站链接和前 50 个关键字的数量。
　　每月最多 10 个网站是免费的，因此 Moz Link Explorer 是更免费的工具。
　　此外，Moz Link Explorer 还有其他功能。Moz 的关键字搜索功能允许您根据目标关键词识别竞争对手。它显示特定关键字的竞争程度（基于其在 Google 搜索结果首页上的排名），并向您显示首页上的网站是什么。
　　11. 数字权威
　　Digital Authority 工具可以分析任何关键词的前 10 页，并为您提供有关这些结果在影响搜索排名的各种参数上的表现的综合报告。
　　12. 优步推荐
　　您可以通过在 Ubersuggest 中键入链接来研究内容和内容中的关键字。
　　使用 Ubersuggest 时，您所要做的就是联系链接到他们帖子的人，并告诉他们为什么您的帖子更好。您还可以通过在 Ubersuggest 中输入搜索结果找到所有与他们相关的网站。
　　13. 尖叫的青蛙
　　Screaming Frog 工具速度很快，并提供所有页面及其元数据的快速概览。
　　一些网站s没有很好的SEO，通过Screaming Frog分析他们的元数据，你可以快速了解网站SEO优化是怎么回事。
　　Screaming Frog 还可以帮助您全面了解竞争对手网站的表现。
　　14. 康皮特
　　Kompyte 可让您实时跟踪竞争对手的网站变化和其他信息来源。
　　Kompyte 可让您了解您的竞争对手网站的活跃程度、他们编写的内容、他们正在运行的 A/B 测试以及其他有用信息。您可以将这些发现与他们内置的关键词跟踪器相关联，以查看哪些变化对他们的排名产生了影响。
　　以上就是易读狗小编整理的14个SEO竞争分析工具和帮助排名更上一层楼的相关知识，希望对大家有所帮助。
　　相关文章

文章采集调用直观:深入浅出JProfiler

采集交流 • 优采云发表了文章 • 0 个评论 • 279 次浏览 • 2022-11-02 07:14 • 来自相关话题

　　文章采集调用直观:深入浅出JProfiler
　　由于最近的工作，我使用 JProfiler(8) 来分析性能瓶颈。我发现这个工具用起来真的很方便。下面我就整理一下JProfiler的相关知识。
　　1.什么是JProfiler
　　JProfiler 是由 ej-technologies GmbH 开发的性能瓶颈分析工具（该公司还开发部署工具）。
　　其特点：
　　2.数据采集
　　Q1。既然 JProfiler 是一个性能瓶颈分析工具，那么这些分析的相关数据是从哪里来的呢？
　　Q2。JProfiler 如何采集和显示这些数据？
　　（图2）
　　A1。分析的数据主要来自以下两部分
　　1.来自jvm的部分解析接口JVMTI（JVM Tool Interface），JDK必须>=1.6
　　JVMTI 是一个基于事件的系统。分析代理库可以为不同的事件注册处理函数。然后它可以启用或禁用选定的事件
　　例如：对象生命周期、线程生命周期等信息
　　2、部分来自instruments类（可以理解为类的重写）
　　例如：方法执行时间、次数、方法栈等信息
　　A2。数据采集原理如图2所示
　　1.用户在JProfiler GUI中发出监控命令（通常通过点击按钮）
　　2. JProfiler GUI JVM通过socket（默认端口8849）向被分析JVM中的JProfile Agent发送指令。
　　3. JProfiler Agent（如果不了解Agent，请看文章第三部分“启动模式”）收到指令后，将指令转换成相关事件或需要监控的指令注册到JVMTI或直接让JVMTI执行一个功能（比如dump jvm内存）
　　4、JVMTI根据注册的事件采集当前jvm的信息。例如：线程的生命周期；jvm的生命周期；类的生命周期；对象实例的生命周期；堆内存的实时信息等
　　5、JProfiler Agent将采集好的信息保存在内存中，并按照一定的规则进行统计（如果数据全部发送，对被分析的应用网络会有比较大的影响）
　　6. 返回 JProfiler GUI Socket。
　　7. JProfiler GUI Socket将接收到的信息返回给JProfiler GUI Render
　　8. JProfiler GUI Render 渲染最终显示效果
　　3.data采集方法及启动方式
　　A1。JProfier采集方法分为两种：Sampling (sample采集) 和 Instrumentation
　　注意：JProfiler 本身并没有指明采集类型的数据，这里的采集类型是采集类型用于方法调用。因为JProfiler的大部分核心功能都依赖于方法调用采集的数据，所以可以直接认为是JProfiler的数据采集类型。
　　A2：启动模式：
　　四。JProfiler 核心概念
　　过滤器：需要分析什么类。有两种类型的过滤器收录和不收录。
　　（图4）
　　Profiling Settings: Receipt 采集 strategy: Sampling and Instrumentation，一些数据采集细节可以自定义。
　　（图5） Triggers：一般用在离线模式下，告诉JProfiler Agent什么时候触发什么行为来采集指定的信息。
　　（图 6）实时内存：关于类/类实例的信息。比如对象的数量和大小，对象创建的方法执行栈，对象创建的热点。
　　（图7） Heap walker：静态分析一定时间内采集到的内存对象信息，强大实用。传出引用、传入引用、最大对象等。
　　
　　（图8）CPU视图：CPU消耗分布和时间（cpu时间或运行时间）；方法执行图；方法执行统计（最大值、最小值、平均运行时间等）
　　（图9）线程：当前jvm所有线程的运行状态，持有锁的线程的状态，线程可以dump。
　　(图10) Monitors & locks：所有线程持有锁和锁信息
　　（图11） Telemetries：趋势图（遥测视图）包括堆、线程、gc、类等。
　　5. 练习
　　为了方便实践，使用JProfiler8自带的一个例子来帮助理解上述相关概念。
　　JProfiler 自带的例子如下：模拟内存泄漏和线程阻塞的场景：
　　（图 12）
　　（图 13）
　　A1。首先，我们来分析一下内存泄漏的场景：
　　1、在Telemetries->Memory视图中，会看到大致如下图的场景（查看过程中可以间隔执行Run GC功能）：老年代gc后内存大小慢慢增加（理想情况下，这个值应该是稳定的）
　　（图 14）
　　点击Live memory->Recorded Objects**中的记录分配数据按钮，开始统计一段时间内创建的对象信息。执行一次Run GC后，查看当前对象信息的大小，点击工具栏中的Mark Current**按钮（其实就是标记当前对象个数。执行一次Run GC，然后继续观察；执行一次运行GC，然后继续观察....最后看看GC后哪些对象在不断增加，最后看到的信息可能类似于下图
　　（图15）分析刚刚记录在Heap walker中的对象信息
　　（图 16）
　　（图17）点击上图中实例最多的类，右键Use Selected Instances->Reference->Incoming Reference。
　　发现Long数据最终保存在bezier.BeierAnim.leakMap中。
　　（图 18）
　　在 Allocations 选项卡中，右键单击其中一种方法以查看特定的源代码信息。
　　（图 19）
　　【注】：至此，问题就很清楚了，明白为什么图17的instance数一样，为什么fullgc后内存无法回收（老区的一个对象leakMap，的信息put也会进入老区，如果leakMap无法回收，则map中收录的对象也无法回收）。具体源码参考：/jprofiler install path/demo/bezier
　　A2。模拟线程阻塞的场景
　　为了方便区分线程，我将Demo中BezierAnim.java的L236的线程命名为test
　　公共无效开始（）{
　　线程 =newThread(this,"test");
　　thread.setPriority(Thread.MIN_PRIORITY);
　　线程.start();
　　}
　　正常情况下，如下图所示
　　（图 20）
　　在Demo中勾选“模拟阻塞”选项后，如下图（注意下图中的状态图标），测试线程的阻塞状态明显增加。
　　（图 21）
　　在 Monitors & locks->Monitor History 中观察一段时间后，会发现出现锁的情况有 4 种。
　　首先：
　　AWT-EventQueue-0 线程持有对象锁，处于等待状态。
　　
　　下图代码表示Demo.block方法调用了object.wait方法。这还是比较容易理解的。
　　（图 22）
　　第二：
　　AWT-EventQueue-0 持有 bezier.BezierAnim$Demo 实例上的锁，测试线程等待线程释放它。
　　注意下图底部的源代码。这个锁的原因是Demo的blcok方法在AWT和测试线程中。
　　将被执行并且方法被同步。
　　（图 23）
　　第三和第四：
　　测试线程会继续向 Event Dispatching Thread 提交任务，从而导致对 java.awt.EventQueue 对象锁的竞争。
　　提交任务的方式如下代码：repaint()和EventQueue.invokeLater
　　公共无效运行（）{
　　Threadme =Thread.currentThread();
　　而（线程==我）{
　　重绘（）；
　　如果（块）{
　　块（假）；
　　}
　　尝试{
　　线程.sleep(10);
　　}catch（异常）{
　　休息;
　　}
　　EventQueue.invokeLater(newRunnable() {
　　@覆盖
　　公共无效运行（）{
　　onEDT方法（）；
　　}
　　});
　　}
　　线程=空；
　　}
　　（图 24）
　　6. 最佳实践
　　JProfiler会给出一些特殊操作的提示，此时最好仔细阅读说明。“标记当前”功能在某些场景下非常有效。Heap walker一般静态分析Live memory->Recorder objects中的对象信息。此信息可能会被 GC 回收，导致 Heap walker 中不显示任何内容。这种现象是正常的。您可以在工具栏中的开始录制中配置一次采集的信息
　　免费获取:关键词查询-精准关键词查询-网站整站关键词分析工具免费
　　关键词查询功能：输入关键词实时查询网站排名
　　关键词查询，网站的流量是由关键词带来的，所以关键词的优化对提高网站的权重有重要作用，我们已经知道关键词有很强的目的性，也就是说用户对这种性质的关键词有一定的需求，所以很容易让用户准确找到自己想要的内容，以及如何拓展相关行业的流量关键词。今天给大家分享一款免费的关键词挖矿工具，设置收录词只挖行业相关词。详情请看图片！！！
　　Peer关键词采集功能：输入网站，一键采集Peer关键词解析
　　SEO优化不提升，网站关键词排名上不去，感觉不错！被迫说话，让我安静！搜索引擎优化给你分析分析，别着急，找对方法，关键词查询关键词排名接近首页！
　　很多情况下，我们发布的外部链接的位置是否有很强的用户浏览体验，即页面的清洁度、打开的速度，尤其是完整性、关键词查询和稳定的加载速度都可以有待提高搜索引擎抓取的速度。提高用户访问效率。
　　随着在线时间的积累，网站内容的持续跟进和更新，域名的使用时间，流量的稳定性，用户回访率的稳定性，用户的持续推荐都会提高网站信任。关键因素。网站信任度的提高是搜索引擎排名网站的重要依据。
　　
　　一是持续更新优质网站内容
　　网站内容的持续更新对网站的截图、采集、排名有很大的影响。如果网站要增加其在搜索引擎中的权重并保持网站快照更新和收录，则关键词查询必须保持网站内容不断更新。必须每天更新，三天不钓，两天不晒网，否则会导致抓网效率低下。
　　二是及时提升网站用户体验
　　用户体验也很重要。通过SEO优化网站、关键词查询时，一定要考虑用户体验。在优化过程中，我们可以注意及时改善和提升网站的用户体验。
　　三是兑换优质网站链
　　构建外链，我们要尽量选择高权重的网站，这对你的网站权重也有帮助。请勿发送垃圾链接添加外部链接，关键词查询对您的网站非常危险。
　　四、网站服务器空间的安全稳定
　　服务器是网站的基础设施之一。它不仅考虑了服务器的稳定性和性能速度，还考虑了相同的网站类型的服务器。网站域名必须匹配网站主题。关键词这样查询，应该用百度来评价你的网站。
　　流行一句话：内容为王，链接为王。近年来，搜索引擎一直在变化，外部链接的作用已经不是那么重要了，但是对于内容为王的说法，因为搜索引擎的功能就是将用户搜索到的词或者问题的答案呈现给用户用户，所以高质量的内容是搜索引擎喜欢的。
　　
　　那么如何呈现高质量的网站内容呢？seo文章的写作技巧。其实SEO文章的写作技巧并不难，只是一些琐碎的点，可能你没有注意到，或者你忘了这里。
　　一、内容操作分类
　　SEO文章的内容操作可以分为两类：一类是一次性操作；这是什么意思？关键词查询即我们添加后不需要修改内容，例如我们的网站中的公司简介和联系我们等部分。这些列只是固定在基础上的内容。尝试一下子做完，然后我们就不用担心了。二是持续操作，比如我们的列表页，在列表页中，我们需要为变化的列编辑很多文章，不断更新内容，这就是我们所说的持续内容操作。
　　2. 可延续的内容
　　对于连续的内容，也就是我们需要每天更新的栏目文章，需要注意以下几点：
　　1、标题可以说是文章的重要组成部分。标题是收录关键词的句子描述。关键词查询这是我的定义。首先，您需要在网站主页或部分的标题中收录关键词。另外，如果你描述一个完整的句子，你不能只是堆叠关键词，你可以陈述事实，或者你可以提问。
　　2.说到字数，有的小伙伴说200-500字比较合适。我在这里纠正它。这是片面的看法。我们提供的内容旨在满足用户的需求。只要满足用户的需求，100字也行。如果一个话题需要详细解释，关键词query then 2000 words就可以了。另外还需要注意的是，文章的内容要符合当前栏目的风格。简单来说，新闻内容应该放在“新闻中心”栏目下，产品介绍内容应该放在“产品介绍”栏目下，产品FAQ应该放在“问答”栏目下。
　　3、图片是文字内容的形象展示，起到辅助作用。它也是用户相关需求的规范。需要注意的是，图片应该提供alt属性，但并不是所有的图片都应该提供alt属性。图片的alt属性应该收录标题中要展开的内容并描述为一个句子，关键词查询而不是堆叠关键字。
　　4.相关推荐是一种内链方式。优化内链可以解决用户跳出率高的问题，增加网站浏览的PV量。查看全部

　　文章采集调用直观:深入浅出JProfiler
　　由于最近的工作，我使用 JProfiler(8) 来分析性能瓶颈。我发现这个工具用起来真的很方便。下面我就整理一下JProfiler的相关知识。
　　1.什么是JProfiler
　　JProfiler 是由 ej-technologies GmbH 开发的性能瓶颈分析工具（该公司还开发部署工具）。
　　其特点：
　　2.数据采集
　　Q1。既然 JProfiler 是一个性能瓶颈分析工具，那么这些分析的相关数据是从哪里来的呢？
　　Q2。JProfiler 如何采集和显示这些数据？
　　（图2）
　　A1。分析的数据主要来自以下两部分
　　1.来自jvm的部分解析接口JVMTI（JVM Tool Interface），JDK必须>=1.6
　　JVMTI 是一个基于事件的系统。分析代理库可以为不同的事件注册处理函数。然后它可以启用或禁用选定的事件
　　例如：对象生命周期、线程生命周期等信息
　　2、部分来自instruments类（可以理解为类的重写）
　　例如：方法执行时间、次数、方法栈等信息
　　A2。数据采集原理如图2所示
　　1.用户在JProfiler GUI中发出监控命令（通常通过点击按钮）
　　2. JProfiler GUI JVM通过socket（默认端口8849）向被分析JVM中的JProfile Agent发送指令。
　　3. JProfiler Agent（如果不了解Agent，请看文章第三部分“启动模式”）收到指令后，将指令转换成相关事件或需要监控的指令注册到JVMTI或直接让JVMTI执行一个功能（比如dump jvm内存）
　　4、JVMTI根据注册的事件采集当前jvm的信息。例如：线程的生命周期；jvm的生命周期；类的生命周期；对象实例的生命周期；堆内存的实时信息等
　　5、JProfiler Agent将采集好的信息保存在内存中，并按照一定的规则进行统计（如果数据全部发送，对被分析的应用网络会有比较大的影响）
　　6. 返回 JProfiler GUI Socket。
　　7. JProfiler GUI Socket将接收到的信息返回给JProfiler GUI Render
　　8. JProfiler GUI Render 渲染最终显示效果
　　3.data采集方法及启动方式
　　A1。JProfier采集方法分为两种：Sampling (sample采集) 和 Instrumentation
　　注意：JProfiler 本身并没有指明采集类型的数据，这里的采集类型是采集类型用于方法调用。因为JProfiler的大部分核心功能都依赖于方法调用采集的数据，所以可以直接认为是JProfiler的数据采集类型。
　　A2：启动模式：
　　四。JProfiler 核心概念
　　过滤器：需要分析什么类。有两种类型的过滤器收录和不收录。
　　（图4）
　　Profiling Settings: Receipt 采集 strategy: Sampling and Instrumentation，一些数据采集细节可以自定义。
　　（图5） Triggers：一般用在离线模式下，告诉JProfiler Agent什么时候触发什么行为来采集指定的信息。
　　（图 6）实时内存：关于类/类实例的信息。比如对象的数量和大小，对象创建的方法执行栈，对象创建的热点。
　　（图7） Heap walker：静态分析一定时间内采集到的内存对象信息，强大实用。传出引用、传入引用、最大对象等。
　　

　　（图8）CPU视图：CPU消耗分布和时间（cpu时间或运行时间）；方法执行图；方法执行统计（最大值、最小值、平均运行时间等）
　　（图9）线程：当前jvm所有线程的运行状态，持有锁的线程的状态，线程可以dump。
　　(图10) Monitors & locks：所有线程持有锁和锁信息
　　（图11） Telemetries：趋势图（遥测视图）包括堆、线程、gc、类等。
　　5. 练习
　　为了方便实践，使用JProfiler8自带的一个例子来帮助理解上述相关概念。
　　JProfiler 自带的例子如下：模拟内存泄漏和线程阻塞的场景：
　　（图 12）
　　（图 13）
　　A1。首先，我们来分析一下内存泄漏的场景：
　　1、在Telemetries->Memory视图中，会看到大致如下图的场景（查看过程中可以间隔执行Run GC功能）：老年代gc后内存大小慢慢增加（理想情况下，这个值应该是稳定的）
　　（图 14）
　　点击Live memory->Recorded Objects**中的记录分配数据按钮，开始统计一段时间内创建的对象信息。执行一次Run GC后，查看当前对象信息的大小，点击工具栏中的Mark Current**按钮（其实就是标记当前对象个数。执行一次Run GC，然后继续观察；执行一次运行GC，然后继续观察....最后看看GC后哪些对象在不断增加，最后看到的信息可能类似于下图
　　（图15）分析刚刚记录在Heap walker中的对象信息
　　（图 16）
　　（图17）点击上图中实例最多的类，右键Use Selected Instances->Reference->Incoming Reference。
　　发现Long数据最终保存在bezier.BeierAnim.leakMap中。
　　（图 18）
　　在 Allocations 选项卡中，右键单击其中一种方法以查看特定的源代码信息。
　　（图 19）
　　【注】：至此，问题就很清楚了，明白为什么图17的instance数一样，为什么fullgc后内存无法回收（老区的一个对象leakMap，的信息put也会进入老区，如果leakMap无法回收，则map中收录的对象也无法回收）。具体源码参考：/jprofiler install path/demo/bezier
　　A2。模拟线程阻塞的场景
　　为了方便区分线程，我将Demo中BezierAnim.java的L236的线程命名为test
　　公共无效开始（）{
　　线程 =newThread(this,"test");
　　thread.setPriority(Thread.MIN_PRIORITY);
　　线程.start();
　　}
　　正常情况下，如下图所示
　　（图 20）
　　在Demo中勾选“模拟阻塞”选项后，如下图（注意下图中的状态图标），测试线程的阻塞状态明显增加。
　　（图 21）
　　在 Monitors & locks->Monitor History 中观察一段时间后，会发现出现锁的情况有 4 种。
　　首先：
　　AWT-EventQueue-0 线程持有对象锁，处于等待状态。
　　

　　下图代码表示Demo.block方法调用了object.wait方法。这还是比较容易理解的。
　　（图 22）
　　第二：
　　AWT-EventQueue-0 持有 bezier.BezierAnim$Demo 实例上的锁，测试线程等待线程释放它。
　　注意下图底部的源代码。这个锁的原因是Demo的blcok方法在AWT和测试线程中。
　　将被执行并且方法被同步。
　　（图 23）
　　第三和第四：
　　测试线程会继续向 Event Dispatching Thread 提交任务，从而导致对 java.awt.EventQueue 对象锁的竞争。
　　提交任务的方式如下代码：repaint()和EventQueue.invokeLater
　　公共无效运行（）{
　　Threadme =Thread.currentThread();
　　而（线程==我）{
　　重绘（）；
　　如果（块）{
　　块（假）；
　　}
　　尝试{
　　线程.sleep(10);
　　}catch（异常）{
　　休息;
　　}
　　EventQueue.invokeLater(newRunnable() {
　　@覆盖
　　公共无效运行（）{
　　onEDT方法（）；
　　}
　　});
　　}
　　线程=空；
　　}
　　（图 24）
　　6. 最佳实践
　　JProfiler会给出一些特殊操作的提示，此时最好仔细阅读说明。“标记当前”功能在某些场景下非常有效。Heap walker一般静态分析Live memory->Recorder objects中的对象信息。此信息可能会被 GC 回收，导致 Heap walker 中不显示任何内容。这种现象是正常的。您可以在工具栏中的开始录制中配置一次采集的信息
　　免费获取:关键词查询-精准关键词查询-网站整站关键词分析工具免费
　　关键词查询功能：输入关键词实时查询网站排名
　　关键词查询，网站的流量是由关键词带来的，所以关键词的优化对提高网站的权重有重要作用，我们已经知道关键词有很强的目的性，也就是说用户对这种性质的关键词有一定的需求，所以很容易让用户准确找到自己想要的内容，以及如何拓展相关行业的流量关键词。今天给大家分享一款免费的关键词挖矿工具，设置收录词只挖行业相关词。详情请看图片！！！
　　Peer关键词采集功能：输入网站，一键采集Peer关键词解析
　　SEO优化不提升，网站关键词排名上不去，感觉不错！被迫说话，让我安静！搜索引擎优化给你分析分析，别着急，找对方法，关键词查询关键词排名接近首页！
　　很多情况下，我们发布的外部链接的位置是否有很强的用户浏览体验，即页面的清洁度、打开的速度，尤其是完整性、关键词查询和稳定的加载速度都可以有待提高搜索引擎抓取的速度。提高用户访问效率。
　　随着在线时间的积累，网站内容的持续跟进和更新，域名的使用时间，流量的稳定性，用户回访率的稳定性，用户的持续推荐都会提高网站信任。关键因素。网站信任度的提高是搜索引擎排名网站的重要依据。
　　

　　一是持续更新优质网站内容
　　网站内容的持续更新对网站的截图、采集、排名有很大的影响。如果网站要增加其在搜索引擎中的权重并保持网站快照更新和收录，则关键词查询必须保持网站内容不断更新。必须每天更新，三天不钓，两天不晒网，否则会导致抓网效率低下。
　　二是及时提升网站用户体验
　　用户体验也很重要。通过SEO优化网站、关键词查询时，一定要考虑用户体验。在优化过程中，我们可以注意及时改善和提升网站的用户体验。
　　三是兑换优质网站链
　　构建外链，我们要尽量选择高权重的网站，这对你的网站权重也有帮助。请勿发送垃圾链接添加外部链接，关键词查询对您的网站非常危险。
　　四、网站服务器空间的安全稳定
　　服务器是网站的基础设施之一。它不仅考虑了服务器的稳定性和性能速度，还考虑了相同的网站类型的服务器。网站域名必须匹配网站主题。关键词这样查询，应该用百度来评价你的网站。
　　流行一句话：内容为王，链接为王。近年来，搜索引擎一直在变化，外部链接的作用已经不是那么重要了，但是对于内容为王的说法，因为搜索引擎的功能就是将用户搜索到的词或者问题的答案呈现给用户用户，所以高质量的内容是搜索引擎喜欢的。
　　

　　那么如何呈现高质量的网站内容呢？seo文章的写作技巧。其实SEO文章的写作技巧并不难，只是一些琐碎的点，可能你没有注意到，或者你忘了这里。
　　一、内容操作分类
　　SEO文章的内容操作可以分为两类：一类是一次性操作；这是什么意思？关键词查询即我们添加后不需要修改内容，例如我们的网站中的公司简介和联系我们等部分。这些列只是固定在基础上的内容。尝试一下子做完，然后我们就不用担心了。二是持续操作，比如我们的列表页，在列表页中，我们需要为变化的列编辑很多文章，不断更新内容，这就是我们所说的持续内容操作。
　　2. 可延续的内容
　　对于连续的内容，也就是我们需要每天更新的栏目文章，需要注意以下几点：
　　1、标题可以说是文章的重要组成部分。标题是收录关键词的句子描述。关键词查询这是我的定义。首先，您需要在网站主页或部分的标题中收录关键词。另外，如果你描述一个完整的句子，你不能只是堆叠关键词，你可以陈述事实，或者你可以提问。
　　2.说到字数，有的小伙伴说200-500字比较合适。我在这里纠正它。这是片面的看法。我们提供的内容旨在满足用户的需求。只要满足用户的需求，100字也行。如果一个话题需要详细解释，关键词query then 2000 words就可以了。另外还需要注意的是，文章的内容要符合当前栏目的风格。简单来说，新闻内容应该放在“新闻中心”栏目下，产品介绍内容应该放在“产品介绍”栏目下，产品FAQ应该放在“问答”栏目下。
　　3、图片是文字内容的形象展示，起到辅助作用。它也是用户相关需求的规范。需要注意的是，图片应该提供alt属性，但并不是所有的图片都应该提供alt属性。图片的alt属性应该收录标题中要展开的内容并描述为一个句子，关键词查询而不是堆叠关键字。
　　4.相关推荐是一种内链方式。优化内链可以解决用户跳出率高的问题，增加网站浏览的PV量。

技巧:Java性能分析神器-JProfiler详解（一）

采集交流 • 优采云发表了文章 • 0 个评论 • 410 次浏览 • 2022-11-02 07:12 • 来自相关话题

技巧:Java性能分析神器-JProfiler详解（一）
　　前段时间在为公司的项目做性能分析，从简单的Log分析（GC日志，postgrep日志，hibernate统计），到通过AOP采集软件运行数据，再到PET测试。感觉花了很多时间，性能也有一定的提升，但总感觉像是在原创时代工作，不可能以简单流畅、极其清晰的方式获得想要的效果。花了一些时间整理学习了之前用过的各种jvm调优和内存分析的工具，包括jps、jstack、jmap、jconsole，JDK自带的，还有IBM的HeapAnalyzer等。虽然这些工具都提供了很多的功能，但它的可用性和便利性远非 IntelliJ 用于 java 开发的水平。偶尔，在云栖社区发现有人推荐Jprofiler，安装版本使用，发现是神器，特此推荐给大家。首先，我声明这个软件是用于商业用途的。网上有很多关于 lisence 的帖子。我会在这里转发，但我绝对不会推荐大家使用破解版！
　　#36573-fdkscp15axjj6#25257
　　#5481-ucjn4a16rvd98#6038
　　#99016-hli5ay1ylizjj#27215
　　#40775-3wle0g1uin5c1#0674
　　#7009-14frku31ynzpfr#20176
　　#49604-1jfe58we9gyb6#5814
　　#25531-1qcev4yintqkj#23927
　　#96496-1qsu1lb1jz7g8w#23479
　　#20948-11amlvg181cw0p#171159
　　然后，转到云栖上的一个文章，然后慢慢开始我们的Jprofiler之旅。
　　1.什么是JProfiler
　　JProfiler 是由 ej-technologies GmbH 开发的性能瓶颈分析工具（该公司还开发部署工具）。
　　其特点：
　　2.数据采集
　　Q1。既然 JProfiler 是一个性能瓶颈分析工具，那么这些分析的相关数据是从哪里来的呢？
　　Q2。JProfiler 如何采集和显示这些数据？
　　（图2）
　　A1。分析的数据主要来自以下两部分
　　1.部分分析接口来自jvm**JVMTI**(JVM Tool Interface)，JDK必须>=1.6
　　JVMTI 是一个基于事件的系统。分析代理库可以为不同的事件注册处理函数。然后它可以启用或禁用选定的事件
　　例如：对象生命周期、线程生命周期等信息
　　2.部分来自instruments类（可以理解为类的重写，增加了JProfiler相关的统计功能）
　　例如：方法执行时间、次数、方法栈等信息
　　A2。数据采集原理如图2所示
　　1.用户在JProfiler GUI中发出监控命令（通常通过点击按钮）
　　2. JProfiler GUI JVM通过socket（默认端口8849）向被分析jvm中的JProfile Agent发送指令。
　　3. JProfiler Agent（如果不了解Agent，请看文章Part 3“启动模式”）收到指令后，将指令转换成相关事件或需要监控的指令，注册到JVMTI 或者直接让JProfiler Agent JVMTI 执行一个功能（比如dump jvm内存）
　　4、JVMTI根据注册的事件采集当前jvm的信息。例如：线程的生命周期；jvm的生命周期；类的生命周期；对象实例的生命周期；堆内存的实时信息等
　　5. JProfiler Agent将采集好的信息保存在**memory**中，并按照一定的规则进行统计（如果所有数据都发送到JProfiler GUI，对被分析的应用网络会有比较大的影响）
　　6. 返回 JProfiler GUI Socket。
　　7. JProfiler GUI Socket将接收到的信息返回给JProfiler GUI Render
　　8. JProfiler GUI Render 渲染最终显示效果
　　3.data采集方法及启动方式
　　A1。JProfier采集方法分为两种：Sampling (sample采集) 和 Instrumentation
　　注意：JProfiler 本身并没有指明采集类型的数据，这里的采集类型是采集类型用于方法调用。因为JProfiler的大部分核心功能都依赖于方法调用采集的数据，所以可以直接认为是JProfiler的数据采集类型。
　　A2：启动模式：
　　四。JProfiler 核心概念
　　过滤器：需要分析什么类。有两种类型的过滤器收录和不收录。
　　（图4）
　　Profiling Settings: Receipt 采集 strategy: Sampling and Instrumentation，一些数据采集细节可以自定义。
　　（图5）
　　Triggers：一般用在**offline**模式下，告诉JProfiler Agent什么时候触发什么行为来采集指定信息。
　　（图 6）
　　实时内存：关于类/类实例的信息。比如对象的数量和大小，对象创建的方法执行栈，对象创建的热点。
　　
　　（图 7）
　　Heap walker：静态分析一定时间内采集到的内存对象信息，功能强大，好用。传出引用、传入引用、最大对象等。
　　（图 8）
　　CPU视图：CPU消耗分布和时间（cpu时间或运行时间）；方法执行图；方法执行统计（最大值、最小值、平均运行时间等）
　　（图 9）
　　线程：当前jvm所有线程的运行状态，持有锁的线程的状态，可以dump线程。
　　（图 10）
　　Monitors & locks：所有线程持有锁和锁信息
　　（图 11）
　　遥测：趋势图（遥测视图），包括堆、线程、gc、类等。
　　五、实践
　　为了方便实践，使用JProfiler8自带的一个例子来帮助理解上述相关概念。
　　JProfiler 自带的例子如下：模拟内存泄漏和线程阻塞的场景：
　　具体源码参考：/jprofiler install path/demo/bezier
　　（图 12）
　　（图13Leak Memory模拟内存泄漏，模拟阻塞模拟线程间锁的阻塞）
　　A1。首先我们来分析一下内存泄露的场景：（勾选图13中的Leak Memory来模拟内存泄露）
　　1、在**Telemetries->Memory**视图中，会看到下图的场景（查看过程中可以间隔执行Run GC功能）：见下图蓝色区域，老年代 gc (**trough**) 后内存大小缓慢增加（理想情况下，这个值应该是稳定的）
　　（图 14）
　　点击Live memory->Recorded Objects中的**record allocation data**按钮，开始统计一段时间内创建的对象信息。执行一次**Run GC**后，查看当前对象信息的大小，点击工具栏中的**Mark Current**按钮（其实就是标记当前对象个数。执行一次Run GC，然后继续观察；执行一次Run GC，然后继续观察....最后看看哪些对象在不断GC，数量一直在增加，最后看到的信息可能类似于下图
　　（图15绿色为标注前的数量，红色为标注后的增量）
　　分析刚刚记录在Heap walker中的对象信息
　　（图 16）
　　（图 17）
　　点击上图中实例最多的类，右键**Use Selected Instances->Reference->Incoming Reference**。
　　发现Long数据最终存放在**bezier.BeierAnim.leakMap**中。
　　（图 18）
　　在 Allocations 选项卡中，右键单击其中一种方法以查看特定的源代码信息。
　　（图 19）
　　【注】：此时问题已经很清楚了。明白为什么图17的实例数一样，为什么fullgc后内存无法回收（老区的一个对象leakMap，put的信息也会进入老区，如果leakMap无法回收，地图中收录的对象无法回收）。
　　A2。模拟线程阻塞的场景（勾选图13中的模拟阻塞，模拟线程间锁的阻塞）
　　为了方便区分线程，我将Demo中BezierAnim.java的L236的线程命名为test
　　public void start() {
thread = new Thread(this, "test");
thread.setPriority(Thread.MIN_PRIORITY);
thread.start();
}


　　正常情况下，如下图所示
　　（图 20）
　　在Demo中勾选“模拟阻塞”选项后，如下图（注意下图中的状态图标），测试线程的阻塞状态明显增加。
　　（图 21）
　　观察**Monitors & locks->Monitor History**一段时间后，你会发现出现锁的情况有4种。
　　首先：
　　AWT-EventQueue-0 线程持有对象锁，处于等待状态。
　　下图代码表示Demo.block方法调用了object.wait方法。这还是比较容易理解的。
　　（图 22）
　　第二：
　　AWT-EventQueue-0 持有 bezier.BezierAnim$Demo 实例上的锁，测试线程等待线程释放它。
　　注意下图底部的源代码。这个锁的原因是Demo的blcok方法在AWT和测试线程中。
　　将被执行并且方法被同步。
　　（图 23）
　　第三和第四：
　　测试线程会继续向 Event Dispatching Thread 提交任务，从而导致对 java.awt.EventQueue 对象锁的竞争。
　　提交任务的方式如下代码：repaint()和EventQueue.invokeLater
　　 public void run() {
Thread me = Thread.currentThread();
while (thread == me) {
repaint();
if (block) {
block(false);
}
try {
Thread.sleep(10);
} catch (Exception e) {
break;
}
EventQueue.invokeLater(new Runnable() {
@Override
public void run() {
onEDTMethod();
}
});
}
thread = null;
}
　　（图 24）
　　6. 最佳实践 JProfiler 会给出一些特殊操作的提示。这时，最好仔细阅读说明。“标记当前”功能在某些场景下非常有效。Heap walker 一般静态分析 Live memory->Recorder objects 中的对象信息，这些信息可能会被 GC 回收，导致 Heap walker 中什么也不显示。这种现象是正常的。您可以在工具栏中的“开始录制”工具栏中配置一次采集的信息。Filter 中的 include 和 exclude 是按顺序排列的。请使用下图左下方的“显示过滤树”来验证顺序。
　　（图 25）七。参考 JProfiler 助手：
　　JVMTI：
　　实用文章:文章生成器大全
　　
　　文章生成器集合
　　2022年1月11日
　　
　　文章生成器具有多种功能在线，一键分享修改等功能，好评！如果你是网站编辑，你可以帮忙协助修改文章，成为自己的想法开启新的文章探索，如果你能看到更多文章好的资源，你可以去一键修改，一键生成，这样帮助我们打开更多的资源整合，分享自己的文章，还有一键排版功能，一键分享功能，还可以检测原创问题，合作伙伴可以来这里开启更多玩法！查看全部

　　技巧:Java性能分析神器-JProfiler详解（一）
　　前段时间在为公司的项目做性能分析，从简单的Log分析（GC日志，postgrep日志，hibernate统计），到通过AOP采集软件运行数据，再到PET测试。感觉花了很多时间，性能也有一定的提升，但总感觉像是在原创时代工作，不可能以简单流畅、极其清晰的方式获得想要的效果。花了一些时间整理学习了之前用过的各种jvm调优和内存分析的工具，包括jps、jstack、jmap、jconsole，JDK自带的，还有IBM的HeapAnalyzer等。虽然这些工具都提供了很多的功能，但它的可用性和便利性远非 IntelliJ 用于 java 开发的水平。偶尔，在云栖社区发现有人推荐Jprofiler，安装版本使用，发现是神器，特此推荐给大家。首先，我声明这个软件是用于商业用途的。网上有很多关于 lisence 的帖子。我会在这里转发，但我绝对不会推荐大家使用破解版！
　　#36573-fdkscp15axjj6#25257
　　#5481-ucjn4a16rvd98#6038
　　#99016-hli5ay1ylizjj#27215
　　#40775-3wle0g1uin5c1#0674
　　#7009-14frku31ynzpfr#20176
　　#49604-1jfe58we9gyb6#5814
　　#25531-1qcev4yintqkj#23927
　　#96496-1qsu1lb1jz7g8w#23479
　　#20948-11amlvg181cw0p#171159
　　然后，转到云栖上的一个文章，然后慢慢开始我们的Jprofiler之旅。
　　1.什么是JProfiler
　　JProfiler 是由 ej-technologies GmbH 开发的性能瓶颈分析工具（该公司还开发部署工具）。
　　其特点：
　　2.数据采集
　　Q1。既然 JProfiler 是一个性能瓶颈分析工具，那么这些分析的相关数据是从哪里来的呢？
　　Q2。JProfiler 如何采集和显示这些数据？
　　（图2）
　　A1。分析的数据主要来自以下两部分
　　1.部分分析接口来自jvm**JVMTI**(JVM Tool Interface)，JDK必须>=1.6
　　JVMTI 是一个基于事件的系统。分析代理库可以为不同的事件注册处理函数。然后它可以启用或禁用选定的事件
　　例如：对象生命周期、线程生命周期等信息
　　2.部分来自instruments类（可以理解为类的重写，增加了JProfiler相关的统计功能）
　　例如：方法执行时间、次数、方法栈等信息
　　A2。数据采集原理如图2所示
　　1.用户在JProfiler GUI中发出监控命令（通常通过点击按钮）
　　2. JProfiler GUI JVM通过socket（默认端口8849）向被分析jvm中的JProfile Agent发送指令。
　　3. JProfiler Agent（如果不了解Agent，请看文章Part 3“启动模式”）收到指令后，将指令转换成相关事件或需要监控的指令，注册到JVMTI 或者直接让JProfiler Agent JVMTI 执行一个功能（比如dump jvm内存）
　　4、JVMTI根据注册的事件采集当前jvm的信息。例如：线程的生命周期；jvm的生命周期；类的生命周期；对象实例的生命周期；堆内存的实时信息等
　　5. JProfiler Agent将采集好的信息保存在**memory**中，并按照一定的规则进行统计（如果所有数据都发送到JProfiler GUI，对被分析的应用网络会有比较大的影响）
　　6. 返回 JProfiler GUI Socket。
　　7. JProfiler GUI Socket将接收到的信息返回给JProfiler GUI Render
　　8. JProfiler GUI Render 渲染最终显示效果
　　3.data采集方法及启动方式
　　A1。JProfier采集方法分为两种：Sampling (sample采集) 和 Instrumentation
　　注意：JProfiler 本身并没有指明采集类型的数据，这里的采集类型是采集类型用于方法调用。因为JProfiler的大部分核心功能都依赖于方法调用采集的数据，所以可以直接认为是JProfiler的数据采集类型。
　　A2：启动模式：
　　四。JProfiler 核心概念
　　过滤器：需要分析什么类。有两种类型的过滤器收录和不收录。
　　（图4）
　　Profiling Settings: Receipt 采集 strategy: Sampling and Instrumentation，一些数据采集细节可以自定义。
　　（图5）
　　Triggers：一般用在**offline**模式下，告诉JProfiler Agent什么时候触发什么行为来采集指定信息。
　　（图 6）
　　实时内存：关于类/类实例的信息。比如对象的数量和大小，对象创建的方法执行栈，对象创建的热点。
　　

（图 7）
　　Heap walker：静态分析一定时间内采集到的内存对象信息，功能强大，好用。传出引用、传入引用、最大对象等。
　　（图 8）
　　CPU视图：CPU消耗分布和时间（cpu时间或运行时间）；方法执行图；方法执行统计（最大值、最小值、平均运行时间等）
　　（图 9）
　　线程：当前jvm所有线程的运行状态，持有锁的线程的状态，可以dump线程。
　　（图 10）
　　Monitors & locks：所有线程持有锁和锁信息
　　（图 11）
　　遥测：趋势图（遥测视图），包括堆、线程、gc、类等。
　　五、实践
　　为了方便实践，使用JProfiler8自带的一个例子来帮助理解上述相关概念。
　　JProfiler 自带的例子如下：模拟内存泄漏和线程阻塞的场景：
　　具体源码参考：/jprofiler install path/demo/bezier
　　（图 12）
　　（图13Leak Memory模拟内存泄漏，模拟阻塞模拟线程间锁的阻塞）
　　A1。首先我们来分析一下内存泄露的场景：（勾选图13中的Leak Memory来模拟内存泄露）
　　1、在**Telemetries->Memory**视图中，会看到下图的场景（查看过程中可以间隔执行Run GC功能）：见下图蓝色区域，老年代 gc (**trough**) 后内存大小缓慢增加（理想情况下，这个值应该是稳定的）
　　（图 14）
　　点击Live memory->Recorded Objects中的**record allocation data**按钮，开始统计一段时间内创建的对象信息。执行一次**Run GC**后，查看当前对象信息的大小，点击工具栏中的**Mark Current**按钮（其实就是标记当前对象个数。执行一次Run GC，然后继续观察；执行一次Run GC，然后继续观察....最后看看哪些对象在不断GC，数量一直在增加，最后看到的信息可能类似于下图
　　（图15绿色为标注前的数量，红色为标注后的增量）
　　分析刚刚记录在Heap walker中的对象信息
　　（图 16）
　　（图 17）
　　点击上图中实例最多的类，右键**Use Selected Instances->Reference->Incoming Reference**。
　　发现Long数据最终存放在**bezier.BeierAnim.leakMap**中。
　　（图 18）
　　在 Allocations 选项卡中，右键单击其中一种方法以查看特定的源代码信息。
　　（图 19）
　　【注】：此时问题已经很清楚了。明白为什么图17的实例数一样，为什么fullgc后内存无法回收（老区的一个对象leakMap，put的信息也会进入老区，如果leakMap无法回收，地图中收录的对象无法回收）。
　　A2。模拟线程阻塞的场景（勾选图13中的模拟阻塞，模拟线程间锁的阻塞）
　　为了方便区分线程，我将Demo中BezierAnim.java的L236的线程命名为test
　　public void start() {
thread = new Thread(this, "test");
thread.setPriority(Thread.MIN_PRIORITY);
thread.start();
}

正常情况下，如下图所示
　　（图 20）
　　在Demo中勾选“模拟阻塞”选项后，如下图（注意下图中的状态图标），测试线程的阻塞状态明显增加。
　　（图 21）
　　观察**Monitors & locks->Monitor History**一段时间后，你会发现出现锁的情况有4种。
　　首先：
　　AWT-EventQueue-0 线程持有对象锁，处于等待状态。
　　下图代码表示Demo.block方法调用了object.wait方法。这还是比较容易理解的。
　　（图 22）
　　第二：
　　AWT-EventQueue-0 持有 bezier.BezierAnim$Demo 实例上的锁，测试线程等待线程释放它。
　　注意下图底部的源代码。这个锁的原因是Demo的blcok方法在AWT和测试线程中。
　　将被执行并且方法被同步。
　　（图 23）
　　第三和第四：
　　测试线程会继续向 Event Dispatching Thread 提交任务，从而导致对 java.awt.EventQueue 对象锁的竞争。
　　提交任务的方式如下代码：repaint()和EventQueue.invokeLater
　　 public void run() {
Thread me = Thread.currentThread();
while (thread == me) {
repaint();
if (block) {
block(false);
}
try {
Thread.sleep(10);
} catch (Exception e) {
break;
}
EventQueue.invokeLater(new Runnable() {
@Override
public void run() {
onEDTMethod();
}
});
}
thread = null;
}
　　（图 24）
　　6. 最佳实践 JProfiler 会给出一些特殊操作的提示。这时，最好仔细阅读说明。“标记当前”功能在某些场景下非常有效。Heap walker 一般静态分析 Live memory->Recorder objects 中的对象信息，这些信息可能会被 GC 回收，导致 Heap walker 中什么也不显示。这种现象是正常的。您可以在工具栏中的“开始录制”工具栏中配置一次采集的信息。Filter 中的 include 和 exclude 是按顺序排列的。请使用下图左下方的“显示过滤树”来验证顺序。
　　（图 25）七。参考 JProfiler 助手：
　　JVMTI：
　　实用文章:文章生成器大全

　　文章生成器集合
　　2022年1月11日
　　

　　文章生成器具有多种功能在线，一键分享修改等功能，好评！如果你是网站编辑，你可以帮忙协助修改文章，成为自己的想法开启新的文章探索，如果你能看到更多文章好的资源，你可以去一键修改，一键生成，这样帮助我们打开更多的资源整合，分享自己的文章，还有一键排版功能，一键分享功能，还可以检测原创问题，合作伙伴可以来这里开启更多玩法！

最佳实践:采集js调用数据（js读取数据）

采集交流 • 优采云发表了文章 • 0 个评论 • 240 次浏览 • 2022-11-02 00:18 • 来自相关话题

　　最佳实践:采集js调用数据（js读取数据）
　　在这篇文章中，我会告诉你采集js调用数据以及js读取数据对应的知识点。我希望它对你有帮助。不要忘记为这个网站添加书签。
　　本文内容列表：
　　php采集js如何生成内容
　　访问需要采集的页面。如果数据是js输出的html，那么在自己的页面中必须有接口或者数据提供给js来遍历输出html。
　　
　　在chrome的review元素中使用network，可以单独看xhr，看是不是ajax请求的接口。如果数据来自接口，可以直接使用PHP获取该接口的数据。
　　如果没有ajax请求，查看html源码，找到里面的数据。
　　怎么去采集js生成的页面数据，在源码中找不到想要的数据信息
　　最原创的方法就是自己模拟一个请求，在js中拼接出ajax的链接地址，再次发起请求。这时候需要注意post方法或者get方法。
　　
　　Python如何获取采集JS中的数据，比如QQ群空间中的数据
　　如果你写代码解决js问题，分析js代码和模拟请求的方法只有一种。
　　还有一个更简单的解决方案。不要编写代码，而是直接使用采集器。目前市面上支持js的采集器只有优采云采集器。界面直观操作，只需点击鼠标即可，无需任何技术知识。
　　采集js调用数据和js读取数据的介绍到此结束。你找到你需要的信息了吗？如果您想了解更多相关信息，请记得采集并关注本站。
　　最佳实践:最全的ASP.NET开源CMS汇总
　　内置网页篡改保护
　　支持动态或静态页面输出
　　下载链接：
　　6.江波cms--JUMBOTcms
　　是个人自主开发的一套内容管理系统。它的前身是jbsitecms，采用WEB2.0设计理念，页面更新不刷新，自定义前端模板。
　　.NET版本：VS2005+MSSQL2000
　　1.基础模块还是文章，图片和下载（增加视频模块）。
　　2、使用评论、公告、统计、友情链接、点赞等作为扩展插件，可以灵活启用或禁用。
　　3、新增用户留言模块（插件形式）。
　　4. 部分标签已更改。
　　5.其他小功能更新较多，这里不一一列举。以上是功能更新。技术上，v2008主要基于WebControls，而v2009融合了更多的前端技术……
　　下载链接：
　　7. DotNetNuke (ASP.NET 2.0)
　　DotNetNuke 是一个 Web 应用程序框架，非常适合创建和部署项目，例如商业网站、企业内部网和外部网、在线发布门户和自定义垂直应用程序。用户友好 - DotNetNuke 旨在让用户更轻松地管理项目的各个方面。
　　下载地址：
　　8. 内容管理系统点cms
　　SQL版本的内容管理系统（Diancms.SQL）是基于微软ASP.NET2.0、AJAX1.0技术，采用MS SQL2000/2005存储过程开发的内容管理和多线程管理。层架构。其功能设计主要针对大中型企业、各行业、事业单位、政府机关等复杂功能场所。系统建立了文章系统、图片系统、下载系统、个人求职、企业招聘、房产系统、音乐系统、网店。使用自定义模型、自定义字段、自定义表单、自定义录入界面、会员系统等功能，您还可以轻松灵活地创建任何适合您需求的系统功能，随时最大限度满足每个用户的不同需求。
　　9.Zoomla！波浪 cms
　　变焦！追波cms是一个强大的网站内核和管理系统，集成了内容管理\OA\SNS\项目管理\采集\邮件订阅等强大功能，基于c#语言。net架构开发，目前国内唯一同时支持MSSQL和Oracle两大数据库的高端cms，用于快速搭建高效门户网站，首创高端中国公开提供门户站群系统cms开发者的系统。
　　演示地址：
　　下载链接：
　　10. 网站Express.NET网站管理系统
　　网站Express.NET是公司八年cms系统开发经验的结晶，新一代强大、快速、安全、可靠的开发网站管理系统（cms）。本系统采用MS SQL和存储过程，系统运行速度快，安全性很好。创新的视觉标注系统和数据模型功能，让您可以使用该系统创建几乎所有类型的网站，开发任何风格。网站风格。系统不仅有丰富的模板，还提供了相当丰富的定制服务，我们可以为您定制理想的网站。
　　快递系统的高性能网站管理系统经过200万条数据5000列测试。
　　然后使用快递系统。
　　express系统是最具扩展性的网站管理系统，数据模型（联表）功能，让网站可以无限扩展功能。
　　快递系统是最好最酷的网站管理系统。系统采用WEB OS后台，类似WINDOWS的操作方式，让从未从事过网站管理的人也能轻松上手多窗口操作。，可以同时进行各种工作，国内没有第二家公司使用该技术。
　　快递系统是模板设计最灵活的系统网站，所有标签都是可视化设计，无需导入模板，修改标签参数后，直接刷新页面即可看到
　　
　　效果。无需记住标签参数的含义。
　　高品质、高服务、高品质的后台系统，优质的服务，我们的系统一次购买，享受技术支持和终身免费升级，无需支付年费。
　　下载链接：
　　11.风新闻dotNETcms
　　dotNETcmsv1.0是一款基于ASP.NET+MSSQL架构的功能强大的内容管理软件。是国内第一个开源、集成web2.0元素、模块化的CMS网站。系统。dotNETcmsv1.0版本功能：SQL数据库+内容管理+渠道管理+发布管理+会员中心+插件管理（广告系统+采集系统+问卷+链接+统计系统+集成界面+文件对比+自定义字段+自定义表单+数据库维护）
　　节目特色：
　　1.全部生成静态页面/动态页面
　　2、完全人性化的操作模式
　　3.系统内置标签和免费标签管理，可以生成任意页面需要的任意元素和样式
　　4.综合新闻采集系统
　　5. 会员管理系统，与热门论坛高度融合
　　6、放开权限分配管理
　　7.完全个性化的模板生成，模板由用户自由定义
　　8. 投稿、投票、广告管理
　　9. 为高级技术人员开放的 SQL 扩展标签
　　10.自动生成图片水印
　　11.自由灵活的后台操作
　　12. 其他一些功能...
　　下载链接：
　　12. 容易吗？现场工厂
　　东易SiteFactory是一套基于微软.NET平台，采用最新的ASP.NET 2.0技术，基于WEB应用分层开发的B/S架构的内容管理系统。专为需要搭建企业信息门户平台的大中型企业而开发。;具有强大的信息管理功能、图片展示功能、人才招聘管理功能*、在线客服系统*、问答系统、问卷管理、广告管理、短信发送、信息采集、自定义表单管理A系列功能齐全，内置标准化内容模型包括文章、图片、软件、商品、flash、视频、音乐等，开箱即用，以最经济的成本、最便捷的方式帮助大中型企业打造无限强大的企业信息门户！其中，人才招聘管理功能可以帮助企业轻松招聘和管理在线人才；在线客服系统可以帮助企业建立强大的在线客服中心，为客户提供更专业的售后服务；多用户博客系统允许企业开通企业博客进行博客营销；问答系统可以帮助企业搭建开放式客服中心或行业垂直专业问答平台。人才招聘管理功能，帮助企业轻松招聘和管理在线人才；在线客服系统可以帮助企业建立强大的在线客服中心，为客户提供更专业的售后服务；多用户博客系统允许企业开通企业博客进行博客营销；问答系统可以帮助企业搭建开放式客服中心或行业垂直专业问答平台。人才招聘管理功能，帮助企业轻松招聘和管理在线人才；在线客服系统可以帮助企业建立强大的在线客服中心，为客户提供更专业的售后服务；多用户博客系统允许企业开通企业博客进行博客营销；问答系统可以帮助企业搭建开放式客服中心或行业垂直专业问答平台。
　　在SiteFactory 3.0版本中，系统特别增加了全文检索系统*、多用户博客系统*、会员注册推广、模板标签库升级工具等一系列功能。更好的改进和改进。全文检索系统可对网站海量各种信息文章进行高速检索，多用户博客系统允许企业开通企业博客进行博客营销，模板标签库升级工具可以让企业文章@网站在升级时轻松使用原有的网站模板。
　　下载链接：
　　13.拓文网站内容管理系统
　　同时支持Access数据库和MS Sqlserver数据库，同时支持静态页面和动态页面。
　　文章采集、会员管理、广告管理、软件下载、新闻文章、留言簿、调查投票、友情链接、在线文件管理、公告发布、数据库管理。界面友好，功能完善，使用方便，管理方便。它可以帮助您构建一个高效的独立站点。
　　下载链接：
　　国外cms： 1. Ludico Ludico是一个Portal/cms系统，用C#编写，生活在ASP.NET 2.0。其模块化设计允许您根据需要使用或开发网站功能。它具有先进的用户管理、
　　海外cms：
　　
　　1.卢迪科
　　Ludico 是一个 Portal/cms 系统，用 C# 编写并使用 ASP.NET 2.0。其模块化设计允许您根据需要使用或开发网站功能。它具有先进的用户管理、所见即所得的编辑器等。
　　下载链接：
　　2. umbraco
　　Umbraco是.net平台下用C#开发的开源内容管理系统。该系统高效、灵活并具有良好的用户界面。
　　下载链接：
　　3. mojo门户
　　mojoPortal 是一个用 C# 开发的面向对象的网站框架，它可以在 Windows 的 ASP.NET 和 GNU/Linux 或 Mac OS X 的 Mono 上运行。
　　下载链接：
　　4. Kodai cms
　　Kodaicms是.NET平台下的全功能内容管理系统。
　　下载链接：
　　5. nkcms
　　Nkcms 是使用 Sql server 2000 开发的内容管理系统。
　　下载链接：
　　6. 去。克里奥
　　Go.Kryo 是一个使用 ASP.NET(C#).NET 实现的简单内容管理系统，后端数据库使用 Microsoft SQL Server。
　　下载链接：
　　7. 文件
　　Amplefile 是一个内容管理系统，一个.Net 环境中的Windows 应用程序，使用.Net 远程处理。
　　下载链接：
　　8. ndcms
　　ndcms 是（C#）下的内容管理系统。它提供用户管理、文件管理、所见即所得编辑器、模板管理、拼写检查和内置 http 压缩。ndcms 的目标是提供一种简单快捷的方式来部署 .Net 站点
　　下载链接：
　　9. 凯霍加
　　Cuyahoga 是用 C# 开发的灵活的 cms/Portal 解决方案。它可以在 Microsoft .NET 和 Mono 平台上运行，并支持 SQL Server、PostgreSQL 或 MySQL 作为底层数据库。
　　下载链接：
　　10. 彩虹
　　Project Rainbow 是使用 Microsoft 的 ASP.NET 和 C# 技术开发的功能丰富的开源内容管理系统。查看全部

　　最佳实践:采集js调用数据（js读取数据）
　　在这篇文章中，我会告诉你采集js调用数据以及js读取数据对应的知识点。我希望它对你有帮助。不要忘记为这个网站添加书签。
　　本文内容列表：
　　php采集js如何生成内容
　　访问需要采集的页面。如果数据是js输出的html，那么在自己的页面中必须有接口或者数据提供给js来遍历输出html。
　　

　　在chrome的review元素中使用network，可以单独看xhr，看是不是ajax请求的接口。如果数据来自接口，可以直接使用PHP获取该接口的数据。
　　如果没有ajax请求，查看html源码，找到里面的数据。
　　怎么去采集js生成的页面数据，在源码中找不到想要的数据信息
　　最原创的方法就是自己模拟一个请求，在js中拼接出ajax的链接地址，再次发起请求。这时候需要注意post方法或者get方法。
　　

　　Python如何获取采集JS中的数据，比如QQ群空间中的数据
　　如果你写代码解决js问题，分析js代码和模拟请求的方法只有一种。
　　还有一个更简单的解决方案。不要编写代码，而是直接使用采集器。目前市面上支持js的采集器只有优采云采集器。界面直观操作，只需点击鼠标即可，无需任何技术知识。
　　采集js调用数据和js读取数据的介绍到此结束。你找到你需要的信息了吗？如果您想了解更多相关信息，请记得采集并关注本站。
　　最佳实践:最全的ASP.NET开源CMS汇总
　　内置网页篡改保护
　　支持动态或静态页面输出
　　下载链接：
　　6.江波cms--JUMBOTcms
　　是个人自主开发的一套内容管理系统。它的前身是jbsitecms，采用WEB2.0设计理念，页面更新不刷新，自定义前端模板。
　　.NET版本：VS2005+MSSQL2000
　　1.基础模块还是文章，图片和下载（增加视频模块）。
　　2、使用评论、公告、统计、友情链接、点赞等作为扩展插件，可以灵活启用或禁用。
　　3、新增用户留言模块（插件形式）。
　　4. 部分标签已更改。
　　5.其他小功能更新较多，这里不一一列举。以上是功能更新。技术上，v2008主要基于WebControls，而v2009融合了更多的前端技术……
　　下载链接：
　　7. DotNetNuke (ASP.NET 2.0)
　　DotNetNuke 是一个 Web 应用程序框架，非常适合创建和部署项目，例如商业网站、企业内部网和外部网、在线发布门户和自定义垂直应用程序。用户友好 - DotNetNuke 旨在让用户更轻松地管理项目的各个方面。
　　下载地址：
　　8. 内容管理系统点cms
　　SQL版本的内容管理系统（Diancms.SQL）是基于微软ASP.NET2.0、AJAX1.0技术，采用MS SQL2000/2005存储过程开发的内容管理和多线程管理。层架构。其功能设计主要针对大中型企业、各行业、事业单位、政府机关等复杂功能场所。系统建立了文章系统、图片系统、下载系统、个人求职、企业招聘、房产系统、音乐系统、网店。使用自定义模型、自定义字段、自定义表单、自定义录入界面、会员系统等功能，您还可以轻松灵活地创建任何适合您需求的系统功能，随时最大限度满足每个用户的不同需求。
　　9.Zoomla！波浪 cms
　　变焦！追波cms是一个强大的网站内核和管理系统，集成了内容管理\OA\SNS\项目管理\采集\邮件订阅等强大功能，基于c#语言。net架构开发，目前国内唯一同时支持MSSQL和Oracle两大数据库的高端cms，用于快速搭建高效门户网站，首创高端中国公开提供门户站群系统cms开发者的系统。
　　演示地址：
　　下载链接：
　　10. 网站Express.NET网站管理系统
　　网站Express.NET是公司八年cms系统开发经验的结晶，新一代强大、快速、安全、可靠的开发网站管理系统（cms）。本系统采用MS SQL和存储过程，系统运行速度快，安全性很好。创新的视觉标注系统和数据模型功能，让您可以使用该系统创建几乎所有类型的网站，开发任何风格。网站风格。系统不仅有丰富的模板，还提供了相当丰富的定制服务，我们可以为您定制理想的网站。
　　快递系统的高性能网站管理系统经过200万条数据5000列测试。
　　然后使用快递系统。
　　express系统是最具扩展性的网站管理系统，数据模型（联表）功能，让网站可以无限扩展功能。
　　快递系统是最好最酷的网站管理系统。系统采用WEB OS后台，类似WINDOWS的操作方式，让从未从事过网站管理的人也能轻松上手多窗口操作。，可以同时进行各种工作，国内没有第二家公司使用该技术。
　　快递系统是模板设计最灵活的系统网站，所有标签都是可视化设计，无需导入模板，修改标签参数后，直接刷新页面即可看到
　　

　　效果。无需记住标签参数的含义。
　　高品质、高服务、高品质的后台系统，优质的服务，我们的系统一次购买，享受技术支持和终身免费升级，无需支付年费。
　　下载链接：
　　11.风新闻dotNETcms
　　dotNETcmsv1.0是一款基于ASP.NET+MSSQL架构的功能强大的内容管理软件。是国内第一个开源、集成web2.0元素、模块化的CMS网站。系统。dotNETcmsv1.0版本功能：SQL数据库+内容管理+渠道管理+发布管理+会员中心+插件管理（广告系统+采集系统+问卷+链接+统计系统+集成界面+文件对比+自定义字段+自定义表单+数据库维护）
　　节目特色：
　　1.全部生成静态页面/动态页面
　　2、完全人性化的操作模式
　　3.系统内置标签和免费标签管理，可以生成任意页面需要的任意元素和样式
　　4.综合新闻采集系统
　　5. 会员管理系统，与热门论坛高度融合
　　6、放开权限分配管理
　　7.完全个性化的模板生成，模板由用户自由定义
　　8. 投稿、投票、广告管理
　　9. 为高级技术人员开放的 SQL 扩展标签
　　10.自动生成图片水印
　　11.自由灵活的后台操作
　　12. 其他一些功能...
　　下载链接：
　　12. 容易吗？现场工厂
　　东易SiteFactory是一套基于微软.NET平台，采用最新的ASP.NET 2.0技术，基于WEB应用分层开发的B/S架构的内容管理系统。专为需要搭建企业信息门户平台的大中型企业而开发。;具有强大的信息管理功能、图片展示功能、人才招聘管理功能*、在线客服系统*、问答系统、问卷管理、广告管理、短信发送、信息采集、自定义表单管理A系列功能齐全，内置标准化内容模型包括文章、图片、软件、商品、flash、视频、音乐等，开箱即用，以最经济的成本、最便捷的方式帮助大中型企业打造无限强大的企业信息门户！其中，人才招聘管理功能可以帮助企业轻松招聘和管理在线人才；在线客服系统可以帮助企业建立强大的在线客服中心，为客户提供更专业的售后服务；多用户博客系统允许企业开通企业博客进行博客营销；问答系统可以帮助企业搭建开放式客服中心或行业垂直专业问答平台。人才招聘管理功能，帮助企业轻松招聘和管理在线人才；在线客服系统可以帮助企业建立强大的在线客服中心，为客户提供更专业的售后服务；多用户博客系统允许企业开通企业博客进行博客营销；问答系统可以帮助企业搭建开放式客服中心或行业垂直专业问答平台。人才招聘管理功能，帮助企业轻松招聘和管理在线人才；在线客服系统可以帮助企业建立强大的在线客服中心，为客户提供更专业的售后服务；多用户博客系统允许企业开通企业博客进行博客营销；问答系统可以帮助企业搭建开放式客服中心或行业垂直专业问答平台。
　　在SiteFactory 3.0版本中，系统特别增加了全文检索系统*、多用户博客系统*、会员注册推广、模板标签库升级工具等一系列功能。更好的改进和改进。全文检索系统可对网站海量各种信息文章进行高速检索，多用户博客系统允许企业开通企业博客进行博客营销，模板标签库升级工具可以让企业文章@网站在升级时轻松使用原有的网站模板。
　　下载链接：
　　13.拓文网站内容管理系统
　　同时支持Access数据库和MS Sqlserver数据库，同时支持静态页面和动态页面。
　　文章采集、会员管理、广告管理、软件下载、新闻文章、留言簿、调查投票、友情链接、在线文件管理、公告发布、数据库管理。界面友好，功能完善，使用方便，管理方便。它可以帮助您构建一个高效的独立站点。
　　下载链接：
　　国外cms： 1. Ludico Ludico是一个Portal/cms系统，用C#编写，生活在ASP.NET 2.0。其模块化设计允许您根据需要使用或开发网站功能。它具有先进的用户管理、
　　海外cms：
　　

　　1.卢迪科
　　Ludico 是一个 Portal/cms 系统，用 C# 编写并使用 ASP.NET 2.0。其模块化设计允许您根据需要使用或开发网站功能。它具有先进的用户管理、所见即所得的编辑器等。
　　下载链接：
　　2. umbraco
　　Umbraco是.net平台下用C#开发的开源内容管理系统。该系统高效、灵活并具有良好的用户界面。
　　下载链接：
　　3. mojo门户
　　mojoPortal 是一个用 C# 开发的面向对象的网站框架，它可以在 Windows 的 ASP.NET 和 GNU/Linux 或 Mac OS X 的 Mono 上运行。
　　下载链接：
　　4. Kodai cms
　　Kodaicms是.NET平台下的全功能内容管理系统。
　　下载链接：
　　5. nkcms
　　Nkcms 是使用 Sql server 2000 开发的内容管理系统。
　　下载链接：
　　6. 去。克里奥
　　Go.Kryo 是一个使用 ASP.NET(C#).NET 实现的简单内容管理系统，后端数据库使用 Microsoft SQL Server。
　　下载链接：
　　7. 文件
　　Amplefile 是一个内容管理系统，一个.Net 环境中的Windows 应用程序，使用.Net 远程处理。
　　下载链接：
　　8. ndcms
　　ndcms 是（C#）下的内容管理系统。它提供用户管理、文件管理、所见即所得编辑器、模板管理、拼写检查和内置 http 压缩。ndcms 的目标是提供一种简单快捷的方式来部署 .Net 站点
　　下载链接：
　　9. 凯霍加
　　Cuyahoga 是用 C# 开发的灵活的 cms/Portal 解决方案。它可以在 Microsoft .NET 和 Mono 平台上运行，并支持 SQL Server、PostgreSQL 或 MySQL 作为底层数据库。
　　下载链接：
　　10. 彩虹
　　Project Rainbow 是使用 Microsoft 的 ASP.NET 和 C# 技术开发的功能丰富的开源内容管理系统。

直观:Preference组件探究之自定义Preference

采集交流 • 优采云发表了文章 • 0 个评论 • 125 次浏览 • 2022-11-01 03:25 • 来自相关话题

直观:Preference组件探究之自定义Preference
　　在前面的文章中，我们从源代码中解释了首选项屏幕显示的原理。本文章描述了官方引用组件是如何实现的，以及我们如何自己自定义 PReference 组件。
　　首选项 UI 分析
　　包括两部分。首先是组件本身的 UI，然后是单击时显示的 UI。
　　例如：
　　我们知道系统提供了很多 Ppreferences组件供我们使用，大致如下。
　　某些组件是为 UI 自定义的
　　组件本身，有些是针对单击后显示的 UI 自定义的。
　　根据这种区别，这些组件分为以下两类。
　　■ 自定义首选项本身的UI
　　双状态首选项
　　不能直接使用的 AbstractClass 需要自定义子类才能使用
　　复选框首选项
　　继承自 TwoStatePpreferences，它显示了复选框的插件设置项
　　开关首选项
　　继承自 TwoStatePpreferences，它将插件显示为开关设置项
　　搜索栏首选项
　　显示拖动栏的设置项
　　■ 自定义点击后显示的UI
　　对话框首选项
　　不能直接使用的 AbstractClass 需要自定义子类才能使用
　　编辑文本首选项
　　继承自“对话框首选项”，单击以显示带有嵌入输入框的对话框的设置项
　　列表首选项
　　继承自“对话框首选项”，单击以显示嵌入在列表视图中的对话框的设置项
　　多选列表首选项
　　继承自对话框首选项，对话框的设置项，单击时显示嵌入的复选框
　　搜索栏对话框首选项
　　继承自对话框首选项，单击后将显示带有嵌入式拖动栏的对话框的设置项
　　卷首选项
　　继承自 SeekBarDialogPpreferences，单击后显示音量级别拖动栏的对话框的设置项
　　铃声偏好
　　覆盖点击
　　处理中，点击跳转到系统铃声设置页面的设置项
　　让我们以相对复杂的音量偏好为例，介绍系统如何实现自定义音量调整设置组件。
　　体积参考分析
　　扩展 android.preference.SeekBarDialogPreference
　　扩展 android.preference.DialogPreference
　　扩展 android.ppreferences.Ppreferences
　　示例效果：
　　让我们先来看看对话框弹出窗口是如何工作的。
　　对话框首选项
　　public abstract class DialogPreference extends Preference…{
public DialogPreference(
Context context, AttributeSet attrs, int defStyleAttr, int defStyleRes) {
super(context, attrs, defStyleAttr, defStyleRes);
final TypedArray a = context.obtainStyledAttributes(attrs,
com.android.internal.R.styleable.DialogPreference, defStyleAttr, defStyleRes);
…
mDialogLayoutResId = a.getResourceId(com.android.internal.R.styleable.DialogPreference_dialogLayout,
mDialogLayoutResId); // 从attr中读取布局ID。
a.recycle();
}
…
// 覆写onClick逻辑调用展示Dialog
protected void onClick() {
if (mDialog != null && mDialog.isShowing()) return;
showDialog(null);
}
protected void showDialog(Bundle state) {
// 创建Dialog并显示
mBuilder = new AlertDialog.Builder(context)
.setTitle(mDialogTitle)
.setIcon(mDialogIcon)
.setPositiveButton(mPositiveButtonText, this)
.setNegativeButton(mNegativeButtonText, this);
// 创建Dialog的内容View
View contentView = onCreateDialogView();
if (contentView != null) {
onBindDialogView(contentView); // 内容View的初始化
mBuilder.setView(contentView);
} else {
mBuilder.setMessage(mDialogMessage);
}
…
}
// 加载配置的dialog布局
// 可由dialogLayout标签或setDialogLayoutResource()指定
protected View onCreateDialogView() {
LayoutInflater inflater = LayoutInflater.from(mBuilder.getContext());
return inflater.inflate(mDialogLayoutResId, null);
}
// 用以准备Dialog的View视图，进行一些配置，子类可覆写更改UI
protected void onBindDialogView(View view) {
View dialogMessageView = view.findViewById(com.android.internal.R.id.message);
…
} }
　　那么SeekBar是如何适应的呢？
　　搜索栏对话框首选项
　　public class SeekBarDialogPreference extends DialogPreference {
…
public SeekBarDialogPreference(Context context, AttributeSet attrs) {
// 指定了名为seekBarDialogPreferenceStyle的默认attr给父类的构造函数
this(context, attrs, R.attr.seekBarDialogPreferenceStyle);★
}
…
}
　　★ 指定的默认属性如下所示。
　　
@style/Preference.DialogPreference.SeekBarPreference
…
　　默认属性中的 dialogLayout 标记指定的布局如下所示。
　　
@layout/preference_dialog_seekbar

　　如果应用未覆盖样式、布局和 setDialogLayoutResource（）中对话框的布局 ID，则 DialogPreference 构造函数将从默认属性加载收录 SeekBar 的布局。
　　最后，它与体积有什么关系？
　　卷首选项
　　public class VolumePreference extends SeekBarDialogPreference… {
public VolumePreference(Context context, AttributeSet attrs) {
// 指定的默认attr和父类一致，因为UI上它和父类完全相同
this(context, attrs, R.attr.seekBarDialogPreferenceStyle);
}

protected void onBindDialogView(View view) {
// 将SeekBar控件和SeekBarVolumizer组件产生关联
// 并启动SeekBarVolumizer
final SeekBar seekBar = (SeekBar) view.findViewById(R.id.seekbar);
mSeekBarVolumizer = new SeekBarVolumizer(getContext(), mStreamType, null, this);
mSeekBarVolumizer.start();
mSeekBarVolumizer.setSeekBar(seekBar);
…
// 设置KEY操作监听器并将SeekBar获取的焦点便于快速支持KEY处理
view.setOnKeyListener(this);
view.setFocusableInTouchMode(true);
view.requestFocus();
}
public boolean onKey(View v, int keyCode, KeyEvent event) {
// 监听硬件的音量+,-和静音键并向SeekBarVolumizer反映
boolean isdown = (event.getAction() == KeyEvent.ACTION_DOWN);
switch (keyCode) {
case KeyEvent.KEYCODE_VOLUME_DOWN:
if (isdown) {
mSeekBarVolumizer.changeVolumeBy(-1);
}
return true;
case KeyEvent.KEYCODE_VOLUME_UP:
if (isdown) {
mSeekBarVolumizer.changeVolumeBy(1);
}
return true;
case KeyEvent.KEYCODE_VOLUME_MUTE:
if (isdown) {
mSeekBarVolumizer.muteVolume();
}
return true;
…
}
}
// Dialog取消或者意外关闭(非OK BTN)的场合
protected void onDialogClosed(boolean positiveResult) {
super.onDialogClosed(positiveResult);
if (!positiveResult && mSeekBarVolumizer != null) {
mSeekBarVolumizer.revertVolume(); // 将已设置回滚
}
cleanup();
}
// Activity或者Fragment的onStop回调进入后台的时候执行
public void onActivityStop() {
if (mSeekBarVolumizer != null) {
mSeekBarVolumizer.stopSample(); // 将预览的铃声播发停止
}
}
// 处理一些意外状况，将SeekBarVolumizer重置，线程结束等
private void cleanup() {
getPreferenceManager().unregisterOnActivityStopListener(this);
if (mSeekBarVolumizer != null) {
final Dialog dialog = getDialog();
if (dialog != null && dialog.isShowing()) {
final View view = dialog.getWindow().getDecorView().findViewById(R.id.seekbar);
if (view != null) {
view.setOnKeyListener(null);
}
// Stopped while dialog was showing, revert changes
mSeekBarVolumizer.revertVolume();
}
mSeekBarVolumizer.stop();
mSeekBarVolumizer = null;
}
}
// SeekBarVolumizer中铃声预览播放时候的回调，供APP处理
public void onSampleStarting(SeekBarVolumizer volumizer) {
if (mSeekBarVolumizer != null && volumizer != mSeekBarVolumizer) {
mSeekBarVolumizer.stopSample();
}
}
// SeekBar上的拖动条数值发生变化时候的回调，供APP知晓程度
public void onProgressChanged(SeekBar seekBar, int progress, boolean fromTouch) {
// noop
}
// 外部导致系统音量发生变化的回调
public void onMuted(boolean muted, boolean zenMuted) {
// noop
}
…
}
　　此时，VolumePpreferences继承自SeekBarDialogPpreferences实现，以显示带有SeekBar的对话框组件。类在内部用于控制卷设置、预览、回滚、保存和还原。
　　值得一提的是SeekBarVolumizer处理的细节。
　　寻宝吧容积器
　　public class SeekBarVolumizer implements OnSeekBarChangeListener, Handler.Callback {
// 持有SeekBar实例并监听拖动条进度
public void setSeekBar(SeekBar seekBar) {
if (mSeekBar != null) {
mSeekBar.setOnSeekBarChangeListener(null);
}
mSeekBar = seekBar;
mSeekBar.setOnSeekBarChangeListener(null);
mSeekBar.setMax(mMaxStreamVolume);
updateSeekBar();
mSeekBar.setOnSeekBarChangeListener(this);
}

// 更新SeekBar进度
protected void updateSeekBar() {
final boolean zenMuted = isZenMuted();
mSeekBar.setEnabled(!zenMuted);

if (zenMuted) {
mSeekBar.setProgress(mLastAudibleStreamVolume, true);
} else if (mNotificationOrRing && mRingerMode == AudioManager.RINGER_MODE_VIBRATE) {
mSeekBar.setProgress(0, true);
} else if (mMuted) {
mSeekBar.setProgress(0, true);
} else {
mSeekBar.setProgress(mLastProgress > -1 ? mLastProgress : mOriginalStreamVolume, true);
}
}
// 音量调节逻辑开始，由Preference调用
public void start() {
if (mHandler != null) return; // already started
// 启动工作Thread
HandlerThread thread = new HandlerThread(TAG + ".CallbackHandler");
thread.start();
// 创建该Thread的Handler并在该线程里初始化铃声播放器实例
mHandler = new Handler(thread.getLooper(), this);
mHandler.sendEmptyMessage(MSG_INIT_SAMPLE);
// 监听系统音量的变化，变化交由上述线程的Handler处理
mVolumeObserver = new Observer(mHandler);
mContext.getContentResolver().registerContentObserver(
System.getUriFor(System.VOLUME_SETTINGS[mStreamType]),
false, mVolumeObserver);
// 监听系统音量，铃声模式变化的广播
mReceiver.setListening(true);
}
//音量调节逻辑结束，由Preference调用
public void stop() {
if (mHandler == null) return; // already stopped
postStopSample(); // 关闭铃声播放

// 注销内容监听，广播监听，Thread内Looper停止轮询消息等重置处理
mContext.getContentResolver().unregisterContentObserver(mVolumeObserver);
mReceiver.setListening(false);
mSeekBar.setOnSeekBarChangeListener(null);
mHandler.getLooper().quitSafely();
mHandler = null;
mVolumeObserver = null;
}
// 运行在工作线程的Handler回调
public boolean handleMessage(Message msg) {
switch (msg.what) {
case MSG_SET_STREAM_VOLUME:
…
break;
case MSG_START_SAMPLE:
onStartSample();
break;
case MSG_STOP_SAMPLE:
onStopSample();
break;
case MSG_INIT_SAMPLE:
onInitSample();
break;
default:
Log.e(TAG, "invalid SeekBarVolumizer message: "+msg.what);
}
return true;
}
// 初始化铃声播放，运行在工作Thread中
private void onInitSample() {
synchronized (this) {
mRingtone = RingtoneManager.getRingtone(mContext, mDefaultUri);
if (mRingtone != null) {
mRingtone.setStreamType(mStreamType);
}
}
}
// 通知工作Thread需要开始播放
private void postStartSample() {
if (mHandler == null) return;
mHandler.removeMessages(MSG_START_SAMPLE);
mHandler.sendMessageDelayed(mHandler.obtainMessage(MSG_START_SAMPLE),
isSamplePlaying() ? CHECK_RINGTONE_PLAYBACK_DELAY_MS : 0);
}
// 工作Thread响应开始播放
private void onStartSample() {
if (!isSamplePlaying()) {
// 执行Preference的回调
if (mCallback != null) {
mCallback.onSampleStarting(this);
}
synchronized (this) {
if (mRingtone != null) {
try {
mRingtone.setAudioAttributes(new AudioAttributes.Builder(mRingtone
.getAudioAttributes())
.setFlags(AudioAttributes.FLAG_BYPASS_MUTE)
.build());
mRingtone.play();
} catch (Throwable e) {
Log.w(TAG, "Error playing ringtone, stream " + mStreamType, e);
}
}
}
}
}
// 通知工作Thread停止播放
private void postStopSample() {
if (mHandler == null) return;
// remove pending delayed start messages
mHandler.removeMessages(MSG_START_SAMPLE);
mHandler.removeMessages(MSG_STOP_SAMPLE);
mHandler.sendMessage(mHandler.obtainMessage(MSG_STOP_SAMPLE));
}
// 工作Thread相应停止播放
private void onStopSample() {
synchronized (this) {
if (mRingtone != null) {
mRingtone.stop();
}
}
}
// UI线程的进度变化后处理，通知工作线程音量发生变化
public void onProgressChanged(SeekBar seekBar, int progress, boolean fromTouch) {
if (fromTouch) {
postSetVolume(progress);
}
// 回调Preference的处理
if (mCallback != null) {
mCallback.onProgressChanged(seekBar, progress, fromTouch);
}
}
// 向工作线程发出通知
private void postSetVolume(int progress) {
if (mHandler == null) return;
// Do the volume changing separately to give responsive UI
mLastProgress = progress;
mHandler.removeMessages(MSG_SET_STREAM_VOLUME);
mHandler.sendMessage(mHandler.obtainMessage(MSG_SET_STREAM_VOLUME));
}
// 开始拖动不作处理(音量变化由onProgressChanged通工作知线程去更新音量值)
public void onStartTrackingTouch(SeekBar seekBar) {
}
// 拖动停止时开始处理通知工作线程播放，因为需要预览暂时设置好的音量效果
public void onStopTrackingTouch(SeekBar seekBar) {
postStartSample();
}
// 预留了供APP调用用于手动预览音量效果和停止预览的接口
public void startSample() {
postStartSample();
}
public void stopSample() {
postStopSample();
}
// 供APP调用用于逐格调节音量的接口，比如系统的Volume+-按钮触发
// 将通知工作线程设置音量和播放效果
public void changeVolumeBy(int amount) {
mSeekBar.incrementProgressBy(amount);
postSetVolume(mSeekBar.getProgress());
postStartSample();
mVolumeBeforeMute = -1;
}
// 供APP调用用于设置是否静音的接口，比如系统的静音按钮触发
// 将通知工作线程设置音量和播放效果
public void muteVolume() {
if (mVolumeBeforeMute != -1) {
mSeekBar.setProgress(mVolumeBeforeMute, true);
postSetVolume(mVolumeBeforeMute);
postStartSample();
mVolumeBeforeMute = -1;
} else {
mVolumeBeforeMute = mSeekBar.getProgress();
mSeekBar.setProgress(0, true);
postStopSample();
postSetVolume(0);
}
}
// 定义在UI线程的Handler，用于更新SeekBar进度
private final class H extends Handler {
private static final int UPDATE_SLIDER = 1;
@Override
public void handleMessage(Message msg) {
if (msg.what == UPDATE_SLIDER) {
if (mSeekBar != null) {
mLastProgress = msg.arg1;
mLastAudibleStreamVolume = msg.arg2;
final boolean muted = ((Boolean)msg.obj).booleanValue();
if (muted != mMuted) {
mMuted = muted;
if (mCallback != null) {
mCallback.onMuted(mMuted, isZenMuted());
}
}
updateSeekBar();
}
}
}
public void postUpdateSlider(int volume, int lastAudibleVolume, boolean mute) {
obtainMessage(UPDATE_SLIDER, volume, lastAudibleVolume, new Boolean(mute)).sendToTarget();
}
}
// 通知UI线程更新SeekBar
private void updateSlider() {
if (mSeekBar != null && mAudioManager != null) {
final int volume = mAudioManager.getStreamVolume(mStreamType);
final int lastAudibleVolume = mAudioManager.getLastAudibleStreamVolume(mStreamType);
final boolean mute = mAudioManager.isStreamMute(mStreamType);
mUiHandler.postUpdateSlider(volume, lastAudibleVolume, mute);
}
}
// 监听到系统音量变化通知UI线程刷新
private final class Observer extends ContentObserver {
public Observer(Handler handler) {
super(handler);
}
@Override
public void onChange(boolean selfChange) {
super.onChange(selfChange);
updateSlider();
}
}
// 监听音量变化广播，必要时向UI线程发送刷新请求
private final class Receiver extends BroadcastReceiver {
…
public void onReceive(Context context, Intent intent) {
…else if (AudioManager.STREAM_DEVICES_CHANGED_ACTION.equals(action)) {
int streamType = intent.getIntExtra(AudioManager.EXTRA_VOLUME_STREAM_TYPE, -1);
int streamVolume = mAudioManager.getStreamVolume(streamType);
updateVolumeSlider(streamType, streamVolume);
} else if (NotificationManager.ACTION_INTERRUPTION_FILTER_CHANGED.equals(action)) {
mZenMode = mNotificationManager.getZenMode();
updateSlider();
}
}
}
}
　　总结上述过程。
　　SeekBarVolumizer的作用是将SeekBar与音量设置相关联，以便UI上的显示和设置的值保持一致。
　　由 SeekBar Volumizer 通过处理程序请求通过拖动 SeekBar 上的条或键触发的音量调整，以更新值、播放和停止值。
　　SeekBarVolumizer 监视系统音量，铃声由处理程序设置，以向 UI 线程发送 UI 刷新请求。
　　除了系统公开的偏好组件外，系统设置APP还自定义了许多组件。
　　设置自定义首选项分析
　　
　　例如：
　　移动/Wi-Fi 使用情况屏幕显示数据使用图表图表数据使用情况首选项。
　　例如，单击“下拉列表首选项”，该首选项将在设置项目后弹出下拉列表。
　　例如，开发人员选项屏幕用于显示用于采集日志的错误报告首选项。
　　快速浏览一下上述首选项是如何自定义的。
　　图表数据使用首选项
　　public class ChartDataUsagePreference extends Preference {
public ChartDataUsagePreference(Context context, AttributeSet attrs) {
…
// 指定包含图表UsageView的自定义布局
setLayoutResource(R.layout.data_usage_graph);
}
// 采用的是support包的Preference
// 覆写了类似onBindView()的onBindViewHolder()
// 针对自定义布局内的UsageView做些初始化处理
public void onBindViewHolder(PreferenceViewHolder holder) {
super.onBindViewHolder(holder);
UsageView chart = (UsageView) holder.findViewById(R.id.data_usage);
if (mNetwork == null) return;
int top = getTop();
chart.clearPaths();
chart.configureGraph(toInt(mEnd - mStart), top);
calcPoints(chart);
chart.setBottomLabels(new CharSequence[] {
Utils.formatDateRange(getContext(), mStart, mStart),
Utils.formatDateRange(getContext(), mEnd, mEnd),
});
bindNetworkPolicy(chart, mPolicy, top);
}
// 根据系统的NetworkPolicy接口设置图表的属性
private void bindNetworkPolicy(UsageView chart, NetworkPolicy policy, int top) {
…
if (policy.limitBytes != NetworkPolicy.LIMIT_DISABLED) {
topVisibility = mLimitColor;
labels[2] = getLabel(policy.limitBytes, R.string.data_usage_sweep_limit, mLimitColor);
}
if (policy.warningBytes != NetworkPolicy.WARNING_DISABLED) {
chart.setDividerLoc((int) (policy.warningBytes / RESOLUTION));
float weight = policy.warningBytes / RESOLUTION / (float) top;
float above = 1 - weight;
chart.setSideLabelWeights(above, weight);
middleVisibility = mWarningColor;
labels[1] = getLabel(policy.warningBytes, R.string.data_usage_sweep_warning,
mWarningColor);
}
chart.setSideLabels(labels);
chart.setDividerColors(middleVisibility, topVisibility);
}
…
}
　　摘要：图表数据使用偏好指定收录图表使用视图的自定义布局，以替换系统的默认首选项布局，并通过业务相关的网络策略接口获取数据以填充图表以显示唯一的UI设置组件。
　　下拉首选项
　　public class DropDownPreference extends ListPreference {
private Spinner mSpinner; // 内部持有Spinner实例

public DropDownPreference(Context context, AttributeSet attrs, int defStyleAttr,
int defStyleRes) {
super(context, attrs, defStyleAttr, defStyleRes);
mContext = context;
mAdapter = createAdapter(); // 创建Spinner用的Adapter
updateEntries();
}
// 复写父类方法指定更改了布局的Adapter实例
protected ArrayAdapter createAdapter() {
return new ArrayAdapter(mContext, android.R.layout.simple_spinner_dropdown_item);
}

protected void onClick() {
mSpinner.performClick(); // Spinner处理点击事件
}
// 复写父类的数据源往Adapter里填充
public void setEntries(@NonNull CharSequence[] entries) {
super.setEntries(entries);
updateEntries();
}
private void updateEntries() {
mAdapter.clear();
if (getEntries() != null) {
for (CharSequence c : getEntries()) {
mAdapter.add(c.toString());
}
}
}
// 复写数据更新回调，通知Spinner刷新
protected void notifyChanged() {
super.notifyChanged();
mAdapter.notifyDataSetChanged();
}
// 复写绑定逻辑，将Spinner和数据绑定
public void onBindViewHolder(PreferenceViewHolder view) {
mSpinner = (Spinner) view.itemView.findViewById(R.id.spinner);
mSpinner.setAdapter(mAdapter);
mSpinner.setOnItemSelectedListener(mItemSelectedListener);
// 设置Spinner初始选中项目
mSpinner.setSelection(findSpinnerIndexOfValue(getValue()));
super.onBindViewHolder(view);
}
// 监听Spinner点击事件，将设置保存
private final OnItemSelectedListener mItemSelectedListener = new OnItemSelectedListener() {
@Override
public void onItemSelected(AdapterView parent, View v, int position, long id) {
if (position >= 0) {
String value = getEntryValues()[position].toString();
if (!value.equals(getValue()) && callChangeListener(value)) {
setValue(value);
}
}
}
…
};
}
　　总结
　　下拉首选项自定义是 UI 在单击后变为微调器，它自己的 UI 与普通首选项没有什么不同。
　　ListReference是系统提供的参考，点击后弹出一个带有ListView的对话框，与上述自定义要求类似。
　　因此，AOSP 选择从 ListPreference 继承并覆盖单击事件将处理从对话框到微调器弹出窗口的弹出窗口。同时，其他函数的覆盖数据的绑定切换到Spinner的数据处理。
　　注：实际上，此引用会更改其自己的布局。构造函数指定 dropdownPreferenceStyle 的默认属性，这将指定收录微调器控件的布局。只是将 Spinner 设置为隐藏在布局中，因此此引用与普通首选项没有显着差异。
　　错误报告首选项
　　public class BugreportPreference extends CustomDialogPreference {
…
protected void onPrepareDialogBuilder(Builder builder, DialogInterface.OnClickListener listener) {
// 指定自定义Dialog的布局
final View dialogView = View.inflate(getContext(), R.layout.bugreport_options_dialog, null);
…
// 监听采集LOG选项的点击事件
final View.OnClickListener l = new View.OnClickListener() {
@Override
public void onClick(View v) {
if (v == mFullTitle || v == mFullSummary) {
mInteractiveTitle.setChecked(false);
mFullTitle.setChecked(true);
}
if (v == mInteractiveTitle || v == mInteractiveSummary) {
mInteractiveTitle.setChecked(true);
mFullTitle.setChecked(false);
}
}
};
mInteractiveTitle.setOnClickListener(l);
mFullTitle.setOnClickListener(l);
mInteractiveSummary.setOnClickListener(l);
mFullSummary.setOnClickListener(l);
builder.setPositiveButton(com.android.internal.R.string.report, listener);
builder.setView(dialogView);
}
// 复写Dialog点击事件，OK的情况下按需调用采集LOG处理
protected void onClick(DialogInterface dialog, int which) {
if (which == DialogInterface.BUTTON_POSITIVE) {
final Context context = getContext();
if (mFullTitle.isChecked()) {
Log.v(TAG, "Taking full bugreport right away");
FeatureFactory.getFactory(context).getMetricsFeatureProvider().action(context,
MetricsEvent.ACTION_BUGREPORT_FROM_SETTINGS_FULL);
takeBugreport(ActivityManager.BUGREPORT_OPTION_FULL);
}…
}
}
// 封装的调用系统采集LOG函数
private void takeBugreport(int bugreportType) {
try {
ActivityManager.getService().requestBugReport(bugreportType);
} catch (RemoteException e) {
Log.e(TAG, "error taking bugreport (bugreportType=" + bugreportType + ")", e);
}
}
}
　　总结
　　BugreportPpreferences通过重写从CustomDialogPpreferences继承的布局和侦听逻辑来实现显示采集LOG设置条目的目的。
　　以上对典型系统以及设置 APP 提供的自定义偏好组件进行了分类、分析和总结，让我们对自定义原理有了清晰的认识。
　　让我们总结一下自定义首选项的方法。
　　自定义首选项方法 ■ 指定样式方法
　　为活动定义具有指定布局的样式。
　　例如：
　　
@style/MyPreferenceStyle
@layout/my_preference_layout
　　言论：
　　事实上，不仅 Ppreferences，例如 PreferenceFragment、PreferenceScreen、EditTextPreference 等都有自己的 sytle 属性。通过官网或源码找到对应的attr名称，APP可以灵活指定自己的风格。
　　■ 布局或JAVA调用方法
　　使用布局
　　标记或调用 setLayoutResource（）来指定您自己的布局。
　　例如：
　　

…
或
myPreferenceInstance.setLayoutResource(R.layout. my_preference_layout);
　　以上两种方法只适用于简单的UI自定义，不能应用于UI变化较大的复杂场景或需求。
　　■灵活定制复制系统的首选项组件
　　public class MyPreference extends Preference {
// 复写必要的构造函数。
// 用于布局里使用该Preference时使用
public MyPreference(Context context, AttributeSet attrs) {
// 可以参考父类指定默认的attr名
// 也可以指定自定义的attr，为方便APP在xml的灵活配置
this(context, attrs, xxx);
}
// 用于Java里手动创建Preference时使用
public DialogPreference(Context context) {
this(context, null);
}
// 复写必要的View绑定逻辑
// 继承自base包下Preference时使用
protected void onBindView(View view) {
…
}
// 继承自support包下Preference时使用
public void onBindViewHolder(PreferenceViewHolder view) {
…
}
// 复写点击事件(如果需要定制点击处理的话)
protected void onClick() {
…
}
// 复写一些特定的父类的处理(如果由需要的话)
// 比如SeekbarDialogPreference需要将dialog布局内icon隐藏
protected void onBindDialogView(View view) {
…
}
...
}
　　在实际开发过程中，我们可以根据业务需求寻找现成的 Ppreferred 组件，避免重建车轮。
　　如果没有现成的可用，请考虑通过样式或Java进行简单定制是否可以实现目标。
　　最后，我们只有继承了复制的方法，才能准确地达到我们的目的，当然，选择现有的具有类似需求的 Ppreferences组件进行复制，将达到事半功倍的效果。
　　成熟的解决方案:需求采集与研究
　　工作了七八年，职场给我最大的感悟就是创新就是未来，创新的前提是了解用户的需求。经过这么多年的编码和在网上的几年的沉浸，我总结了一些需求采集的方法>分享给大家。
　　1：需求分类采集>方法
　　采集>需求只是手段，目的是通过研究用户更好地满足需求
　　1.直接采集>和间接采集>——>主次需求
　　直接面对用户->一手需求；通过复述，第三方行业分析报告->二手需求
　　直接采集>：只有这样，产品本身和自己对产品的判断才能更接地气
　　间接采集>：需要考虑需求者和提议者是谁，是否被误解了
　　一般都是经过整理的，得出结论的效率更高。
　　2.说和做，定性和定量
　　用户访谈——《问卷调查》——《可用性测试》——《数据分析》
　　3. 是在真实场景中吗？
　　临场感，最好的需求是在真实场景的位置采集>
　　负面例子：
　　钓鱼智能浮标——实际用户钓鱼时不方便使用手机
　　地下车库寻车APP-无信号
　　4.与产品是否有互动
　　对于某些产品，用户想象中是否需要，与实际使用后是否需要完全不同。
　　电视需要，洗碗机需要
　　
　　潜在原因：不可靠的用户
　　解决方案：先简化实现，或者用人肉跑流程来验证、尝试、租用
　　经典示例：免费试用
　　二：一些实用的采集>方法
　　2.1 腾讯10/100/1000法：产品经理每个月要做10次用户调查，阅读100篇用户写的文章文章，处理1000个用户反馈
　　2.2 如有条件，新入职人员可到客服部轮岗数周至数月，或听客服电话半个月。
　　2.3 利用互联网、微博、百度等搜索引擎的大数据，会告诉我们很多用户痛点
　　三：用户，重新认识需求
　　3.1 需求的三个深度
　　意见和行为
　　目标和动机（更现实）
　　人性与价值观：
　　马斯洛的需求层次——本我、自我、超我。
　　层次越低的需求越笼统、僵化、工具化，越难以发光
　　更高层次的需求更细分（场景、时间、空间）
　　3.2 如何理解这种内部需求的战略需求
　　如何理解内部需求与狭隘用户需求的关系？
　　一个。提议者是泛化用户，所以这些需求必须考虑，但要判断优先级
　　湾。分清目的和手段。通过服务外部用户实现商业价值，满足外部用户价值是最终目标。组建团队只是实现目标的一种手段。
　　
　　为了满足自己的指标，伤害用户的 KPI：
　　提高优采云出勤率，改善北京空气质量，防止校车事故，防止学生在春节期间站着回家。
　　3.3 用户：从抽象到具体再到抽象
　　产品概念阶段，想象中的目标用户，核心用户；
　　求采集>舞台，看活人，听故事，找情；
　　在需求采集>之后，合并特性，定义角色，修改产品概念方向
　　工具：用户故事
　　两个典型用户：新手和专家
　　核心用户是典型的新手产品：电梯、公测、垃圾桶等用户量大的海量产品；电视、冰箱、洗衣机、2C产品
　　核心用户是专家的典型产品：少数用户，如专业仪器、乐器、单反、2B产品
　　四：产品原理及初衷
　　制定产品原则的前提是已经需要一个产品采集>并且资料充足
　　它是什么：整个产品团队必须达成一致的共识指南
　　元素：
　　1 目标用户分为几类，优先级是什么；
　　2 产品市场切入点最关键的场景是什么？最小可行产品必须满足哪些功能
　　3 一个产品要追求用户数量或用户质量，追求流量或利润，这些都必须收录在产品原则中。
　　4 人与内容哪个更重要？查看全部

直观:Preference组件探究之自定义Preference
　　在前面的文章中，我们从源代码中解释了首选项屏幕显示的原理。本文章描述了官方引用组件是如何实现的，以及我们如何自己自定义 PReference 组件。
　　首选项 UI 分析
　　包括两部分。首先是组件本身的 UI，然后是单击时显示的 UI。
　　例如：
　　我们知道系统提供了很多 Ppreferences组件供我们使用，大致如下。
　　某些组件是为 UI 自定义的
　　组件本身，有些是针对单击后显示的 UI 自定义的。
　　根据这种区别，这些组件分为以下两类。
　　■ 自定义首选项本身的UI
　　双状态首选项
　　不能直接使用的 AbstractClass 需要自定义子类才能使用
　　复选框首选项
　　继承自 TwoStatePpreferences，它显示了复选框的插件设置项
　　开关首选项
　　继承自 TwoStatePpreferences，它将插件显示为开关设置项
　　搜索栏首选项
　　显示拖动栏的设置项
　　■ 自定义点击后显示的UI
　　对话框首选项
　　不能直接使用的 AbstractClass 需要自定义子类才能使用
　　编辑文本首选项
　　继承自“对话框首选项”，单击以显示带有嵌入输入框的对话框的设置项
　　列表首选项
　　继承自“对话框首选项”，单击以显示嵌入在列表视图中的对话框的设置项
　　多选列表首选项
　　继承自对话框首选项，对话框的设置项，单击时显示嵌入的复选框
　　搜索栏对话框首选项
　　继承自对话框首选项，单击后将显示带有嵌入式拖动栏的对话框的设置项
　　卷首选项
　　继承自 SeekBarDialogPpreferences，单击后显示音量级别拖动栏的对话框的设置项
　　铃声偏好
　　覆盖点击
　　处理中，点击跳转到系统铃声设置页面的设置项
　　让我们以相对复杂的音量偏好为例，介绍系统如何实现自定义音量调整设置组件。
　　体积参考分析
　　扩展 android.preference.SeekBarDialogPreference
　　扩展 android.preference.DialogPreference
　　扩展 android.ppreferences.Ppreferences
　　示例效果：
　　让我们先来看看对话框弹出窗口是如何工作的。
　　对话框首选项
　　public abstract class DialogPreference extends Preference…{
public DialogPreference(
Context context, AttributeSet attrs, int defStyleAttr, int defStyleRes) {
super(context, attrs, defStyleAttr, defStyleRes);
final TypedArray a = context.obtainStyledAttributes(attrs,
com.android.internal.R.styleable.DialogPreference, defStyleAttr, defStyleRes);
…
mDialogLayoutResId = a.getResourceId(com.android.internal.R.styleable.DialogPreference_dialogLayout,
mDialogLayoutResId); // 从attr中读取布局ID。
a.recycle();
}
…
// 覆写onClick逻辑调用展示Dialog
protected void onClick() {
if (mDialog != null && mDialog.isShowing()) return;
showDialog(null);
}
protected void showDialog(Bundle state) {
// 创建Dialog并显示
mBuilder = new AlertDialog.Builder(context)
.setTitle(mDialogTitle)
.setIcon(mDialogIcon)
.setPositiveButton(mPositiveButtonText, this)
.setNegativeButton(mNegativeButtonText, this);
// 创建Dialog的内容View
View contentView = onCreateDialogView();
if (contentView != null) {
onBindDialogView(contentView); // 内容View的初始化
mBuilder.setView(contentView);
} else {
mBuilder.setMessage(mDialogMessage);
}
…
}
// 加载配置的dialog布局
// 可由dialogLayout标签或setDialogLayoutResource()指定
protected View onCreateDialogView() {
LayoutInflater inflater = LayoutInflater.from(mBuilder.getContext());
return inflater.inflate(mDialogLayoutResId, null);
}
// 用以准备Dialog的View视图，进行一些配置，子类可覆写更改UI
protected void onBindDialogView(View view) {
View dialogMessageView = view.findViewById(com.android.internal.R.id.message);
…
} }
　　那么SeekBar是如何适应的呢？
　　搜索栏对话框首选项
　　public class SeekBarDialogPreference extends DialogPreference {
…
public SeekBarDialogPreference(Context context, AttributeSet attrs) {
// 指定了名为seekBarDialogPreferenceStyle的默认attr给父类的构造函数
this(context, attrs, R.attr.seekBarDialogPreferenceStyle);★
}
…
}
　　★ 指定的默认属性如下所示。
　　
@style/Preference.DialogPreference.SeekBarPreference
…
　　默认属性中的 dialogLayout 标记指定的布局如下所示。
　　
@layout/preference_dialog_seekbar

　　如果应用未覆盖样式、布局和 setDialogLayoutResource（）中对话框的布局 ID，则 DialogPreference 构造函数将从默认属性加载收录 SeekBar 的布局。
　　最后，它与体积有什么关系？
　　卷首选项
　　public class VolumePreference extends SeekBarDialogPreference… {
public VolumePreference(Context context, AttributeSet attrs) {
// 指定的默认attr和父类一致，因为UI上它和父类完全相同
this(context, attrs, R.attr.seekBarDialogPreferenceStyle);
}

protected void onBindDialogView(View view) {
// 将SeekBar控件和SeekBarVolumizer组件产生关联
// 并启动SeekBarVolumizer
final SeekBar seekBar = (SeekBar) view.findViewById(R.id.seekbar);
mSeekBarVolumizer = new SeekBarVolumizer(getContext(), mStreamType, null, this);
mSeekBarVolumizer.start();
mSeekBarVolumizer.setSeekBar(seekBar);
…
// 设置KEY操作监听器并将SeekBar获取的焦点便于快速支持KEY处理
view.setOnKeyListener(this);
view.setFocusableInTouchMode(true);
view.requestFocus();
}
public boolean onKey(View v, int keyCode, KeyEvent event) {
// 监听硬件的音量+,-和静音键并向SeekBarVolumizer反映
boolean isdown = (event.getAction() == KeyEvent.ACTION_DOWN);
switch (keyCode) {
case KeyEvent.KEYCODE_VOLUME_DOWN:
if (isdown) {
mSeekBarVolumizer.changeVolumeBy(-1);
}
return true;
case KeyEvent.KEYCODE_VOLUME_UP:
if (isdown) {
mSeekBarVolumizer.changeVolumeBy(1);
}
return true;
case KeyEvent.KEYCODE_VOLUME_MUTE:
if (isdown) {
mSeekBarVolumizer.muteVolume();
}
return true;
…
}
}
// Dialog取消或者意外关闭(非OK BTN)的场合
protected void onDialogClosed(boolean positiveResult) {
super.onDialogClosed(positiveResult);
if (!positiveResult && mSeekBarVolumizer != null) {
mSeekBarVolumizer.revertVolume(); // 将已设置回滚
}
cleanup();
}
// Activity或者Fragment的onStop回调进入后台的时候执行
public void onActivityStop() {
if (mSeekBarVolumizer != null) {
mSeekBarVolumizer.stopSample(); // 将预览的铃声播发停止
}
}
// 处理一些意外状况，将SeekBarVolumizer重置，线程结束等
private void cleanup() {
getPreferenceManager().unregisterOnActivityStopListener(this);
if (mSeekBarVolumizer != null) {
final Dialog dialog = getDialog();
if (dialog != null && dialog.isShowing()) {
final View view = dialog.getWindow().getDecorView().findViewById(R.id.seekbar);
if (view != null) {
view.setOnKeyListener(null);
}
// Stopped while dialog was showing, revert changes
mSeekBarVolumizer.revertVolume();
}
mSeekBarVolumizer.stop();
mSeekBarVolumizer = null;
}
}
// SeekBarVolumizer中铃声预览播放时候的回调，供APP处理
public void onSampleStarting(SeekBarVolumizer volumizer) {
if (mSeekBarVolumizer != null && volumizer != mSeekBarVolumizer) {
mSeekBarVolumizer.stopSample();
}
}
// SeekBar上的拖动条数值发生变化时候的回调，供APP知晓程度
public void onProgressChanged(SeekBar seekBar, int progress, boolean fromTouch) {
// noop
}
// 外部导致系统音量发生变化的回调
public void onMuted(boolean muted, boolean zenMuted) {
// noop
}
…
}
　　此时，VolumePpreferences继承自SeekBarDialogPpreferences实现，以显示带有SeekBar的对话框组件。类在内部用于控制卷设置、预览、回滚、保存和还原。
　　值得一提的是SeekBarVolumizer处理的细节。
　　寻宝吧容积器
　　public class SeekBarVolumizer implements OnSeekBarChangeListener, Handler.Callback {
// 持有SeekBar实例并监听拖动条进度
public void setSeekBar(SeekBar seekBar) {
if (mSeekBar != null) {
mSeekBar.setOnSeekBarChangeListener(null);
}
mSeekBar = seekBar;
mSeekBar.setOnSeekBarChangeListener(null);
mSeekBar.setMax(mMaxStreamVolume);
updateSeekBar();
mSeekBar.setOnSeekBarChangeListener(this);
}

// 更新SeekBar进度
protected void updateSeekBar() {
final boolean zenMuted = isZenMuted();
mSeekBar.setEnabled(!zenMuted);

if (zenMuted) {
mSeekBar.setProgress(mLastAudibleStreamVolume, true);
} else if (mNotificationOrRing && mRingerMode == AudioManager.RINGER_MODE_VIBRATE) {
mSeekBar.setProgress(0, true);
} else if (mMuted) {
mSeekBar.setProgress(0, true);
} else {
mSeekBar.setProgress(mLastProgress > -1 ? mLastProgress : mOriginalStreamVolume, true);
}
}
// 音量调节逻辑开始，由Preference调用
public void start() {
if (mHandler != null) return; // already started
// 启动工作Thread
HandlerThread thread = new HandlerThread(TAG + ".CallbackHandler");
thread.start();
// 创建该Thread的Handler并在该线程里初始化铃声播放器实例
mHandler = new Handler(thread.getLooper(), this);
mHandler.sendEmptyMessage(MSG_INIT_SAMPLE);
// 监听系统音量的变化，变化交由上述线程的Handler处理
mVolumeObserver = new Observer(mHandler);
mContext.getContentResolver().registerContentObserver(
System.getUriFor(System.VOLUME_SETTINGS[mStreamType]),
false, mVolumeObserver);
// 监听系统音量，铃声模式变化的广播
mReceiver.setListening(true);
}
//音量调节逻辑结束，由Preference调用
public void stop() {
if (mHandler == null) return; // already stopped
postStopSample(); // 关闭铃声播放

// 注销内容监听，广播监听，Thread内Looper停止轮询消息等重置处理
mContext.getContentResolver().unregisterContentObserver(mVolumeObserver);
mReceiver.setListening(false);
mSeekBar.setOnSeekBarChangeListener(null);
mHandler.getLooper().quitSafely();
mHandler = null;
mVolumeObserver = null;
}
// 运行在工作线程的Handler回调
public boolean handleMessage(Message msg) {
switch (msg.what) {
case MSG_SET_STREAM_VOLUME:
…
break;
case MSG_START_SAMPLE:
onStartSample();
break;
case MSG_STOP_SAMPLE:
onStopSample();
break;
case MSG_INIT_SAMPLE:
onInitSample();
break;
default:
Log.e(TAG, "invalid SeekBarVolumizer message: "+msg.what);
}
return true;
}
// 初始化铃声播放，运行在工作Thread中
private void onInitSample() {
synchronized (this) {
mRingtone = RingtoneManager.getRingtone(mContext, mDefaultUri);
if (mRingtone != null) {
mRingtone.setStreamType(mStreamType);
}
}
}
// 通知工作Thread需要开始播放
private void postStartSample() {
if (mHandler == null) return;
mHandler.removeMessages(MSG_START_SAMPLE);
mHandler.sendMessageDelayed(mHandler.obtainMessage(MSG_START_SAMPLE),
isSamplePlaying() ? CHECK_RINGTONE_PLAYBACK_DELAY_MS : 0);
}
// 工作Thread响应开始播放
private void onStartSample() {
if (!isSamplePlaying()) {
// 执行Preference的回调
if (mCallback != null) {
mCallback.onSampleStarting(this);
}
synchronized (this) {
if (mRingtone != null) {
try {
mRingtone.setAudioAttributes(new AudioAttributes.Builder(mRingtone
.getAudioAttributes())
.setFlags(AudioAttributes.FLAG_BYPASS_MUTE)
.build());
mRingtone.play();
} catch (Throwable e) {
Log.w(TAG, "Error playing ringtone, stream " + mStreamType, e);
}
}
}
}
}
// 通知工作Thread停止播放
private void postStopSample() {
if (mHandler == null) return;
// remove pending delayed start messages
mHandler.removeMessages(MSG_START_SAMPLE);
mHandler.removeMessages(MSG_STOP_SAMPLE);
mHandler.sendMessage(mHandler.obtainMessage(MSG_STOP_SAMPLE));
}
// 工作Thread相应停止播放
private void onStopSample() {
synchronized (this) {
if (mRingtone != null) {
mRingtone.stop();
}
}
}
// UI线程的进度变化后处理，通知工作线程音量发生变化
public void onProgressChanged(SeekBar seekBar, int progress, boolean fromTouch) {
if (fromTouch) {
postSetVolume(progress);
}
// 回调Preference的处理
if (mCallback != null) {
mCallback.onProgressChanged(seekBar, progress, fromTouch);
}
}
// 向工作线程发出通知
private void postSetVolume(int progress) {
if (mHandler == null) return;
// Do the volume changing separately to give responsive UI
mLastProgress = progress;
mHandler.removeMessages(MSG_SET_STREAM_VOLUME);
mHandler.sendMessage(mHandler.obtainMessage(MSG_SET_STREAM_VOLUME));
}
// 开始拖动不作处理(音量变化由onProgressChanged通工作知线程去更新音量值)
public void onStartTrackingTouch(SeekBar seekBar) {
}
// 拖动停止时开始处理通知工作线程播放，因为需要预览暂时设置好的音量效果
public void onStopTrackingTouch(SeekBar seekBar) {
postStartSample();
}
// 预留了供APP调用用于手动预览音量效果和停止预览的接口
public void startSample() {
postStartSample();
}
public void stopSample() {
postStopSample();
}
// 供APP调用用于逐格调节音量的接口，比如系统的Volume+-按钮触发
// 将通知工作线程设置音量和播放效果
public void changeVolumeBy(int amount) {
mSeekBar.incrementProgressBy(amount);
postSetVolume(mSeekBar.getProgress());
postStartSample();
mVolumeBeforeMute = -1;
}
// 供APP调用用于设置是否静音的接口，比如系统的静音按钮触发
// 将通知工作线程设置音量和播放效果
public void muteVolume() {
if (mVolumeBeforeMute != -1) {
mSeekBar.setProgress(mVolumeBeforeMute, true);
postSetVolume(mVolumeBeforeMute);
postStartSample();
mVolumeBeforeMute = -1;
} else {
mVolumeBeforeMute = mSeekBar.getProgress();
mSeekBar.setProgress(0, true);
postStopSample();
postSetVolume(0);
}
}
// 定义在UI线程的Handler，用于更新SeekBar进度
private final class H extends Handler {
private static final int UPDATE_SLIDER = 1;
@Override
public void handleMessage(Message msg) {
if (msg.what == UPDATE_SLIDER) {
if (mSeekBar != null) {
mLastProgress = msg.arg1;
mLastAudibleStreamVolume = msg.arg2;
final boolean muted = ((Boolean)msg.obj).booleanValue();
if (muted != mMuted) {
mMuted = muted;
if (mCallback != null) {
mCallback.onMuted(mMuted, isZenMuted());
}
}
updateSeekBar();
}
}
}
public void postUpdateSlider(int volume, int lastAudibleVolume, boolean mute) {
obtainMessage(UPDATE_SLIDER, volume, lastAudibleVolume, new Boolean(mute)).sendToTarget();
}
}
// 通知UI线程更新SeekBar
private void updateSlider() {
if (mSeekBar != null && mAudioManager != null) {
final int volume = mAudioManager.getStreamVolume(mStreamType);
final int lastAudibleVolume = mAudioManager.getLastAudibleStreamVolume(mStreamType);
final boolean mute = mAudioManager.isStreamMute(mStreamType);
mUiHandler.postUpdateSlider(volume, lastAudibleVolume, mute);
}
}
// 监听到系统音量变化通知UI线程刷新
private final class Observer extends ContentObserver {
public Observer(Handler handler) {
super(handler);
}
@Override
public void onChange(boolean selfChange) {
super.onChange(selfChange);
updateSlider();
}
}
// 监听音量变化广播，必要时向UI线程发送刷新请求
private final class Receiver extends BroadcastReceiver {
…
public void onReceive(Context context, Intent intent) {
…else if (AudioManager.STREAM_DEVICES_CHANGED_ACTION.equals(action)) {
int streamType = intent.getIntExtra(AudioManager.EXTRA_VOLUME_STREAM_TYPE, -1);
int streamVolume = mAudioManager.getStreamVolume(streamType);
updateVolumeSlider(streamType, streamVolume);
} else if (NotificationManager.ACTION_INTERRUPTION_FILTER_CHANGED.equals(action)) {
mZenMode = mNotificationManager.getZenMode();
updateSlider();
}
}
}
}
　　总结上述过程。
　　SeekBarVolumizer的作用是将SeekBar与音量设置相关联，以便UI上的显示和设置的值保持一致。
　　由 SeekBar Volumizer 通过处理程序请求通过拖动 SeekBar 上的条或键触发的音量调整，以更新值、播放和停止值。
　　SeekBarVolumizer 监视系统音量，铃声由处理程序设置，以向 UI 线程发送 UI 刷新请求。
　　除了系统公开的偏好组件外，系统设置APP还自定义了许多组件。
　　设置自定义首选项分析

　　例如：
　　移动/Wi-Fi 使用情况屏幕显示数据使用图表图表数据使用情况首选项。
　　例如，单击“下拉列表首选项”，该首选项将在设置项目后弹出下拉列表。
　　例如，开发人员选项屏幕用于显示用于采集日志的错误报告首选项。
　　快速浏览一下上述首选项是如何自定义的。
　　图表数据使用首选项
　　public class ChartDataUsagePreference extends Preference {
public ChartDataUsagePreference(Context context, AttributeSet attrs) {
…
// 指定包含图表UsageView的自定义布局
setLayoutResource(R.layout.data_usage_graph);
}
// 采用的是support包的Preference
// 覆写了类似onBindView()的onBindViewHolder()
// 针对自定义布局内的UsageView做些初始化处理
public void onBindViewHolder(PreferenceViewHolder holder) {
super.onBindViewHolder(holder);
UsageView chart = (UsageView) holder.findViewById(R.id.data_usage);
if (mNetwork == null) return;
int top = getTop();
chart.clearPaths();
chart.configureGraph(toInt(mEnd - mStart), top);
calcPoints(chart);
chart.setBottomLabels(new CharSequence[] {
Utils.formatDateRange(getContext(), mStart, mStart),
Utils.formatDateRange(getContext(), mEnd, mEnd),
});
bindNetworkPolicy(chart, mPolicy, top);
}
// 根据系统的NetworkPolicy接口设置图表的属性
private void bindNetworkPolicy(UsageView chart, NetworkPolicy policy, int top) {
…
if (policy.limitBytes != NetworkPolicy.LIMIT_DISABLED) {
topVisibility = mLimitColor;
labels[2] = getLabel(policy.limitBytes, R.string.data_usage_sweep_limit, mLimitColor);
}
if (policy.warningBytes != NetworkPolicy.WARNING_DISABLED) {
chart.setDividerLoc((int) (policy.warningBytes / RESOLUTION));
float weight = policy.warningBytes / RESOLUTION / (float) top;
float above = 1 - weight;
chart.setSideLabelWeights(above, weight);
middleVisibility = mWarningColor;
labels[1] = getLabel(policy.warningBytes, R.string.data_usage_sweep_warning,
mWarningColor);
}
chart.setSideLabels(labels);
chart.setDividerColors(middleVisibility, topVisibility);
}
…
}
　　摘要：图表数据使用偏好指定收录图表使用视图的自定义布局，以替换系统的默认首选项布局，并通过业务相关的网络策略接口获取数据以填充图表以显示唯一的UI设置组件。
　　下拉首选项
　　public class DropDownPreference extends ListPreference {
private Spinner mSpinner; // 内部持有Spinner实例

public DropDownPreference(Context context, AttributeSet attrs, int defStyleAttr,
int defStyleRes) {
super(context, attrs, defStyleAttr, defStyleRes);
mContext = context;
mAdapter = createAdapter(); // 创建Spinner用的Adapter
updateEntries();
}
// 复写父类方法指定更改了布局的Adapter实例
protected ArrayAdapter createAdapter() {
return new ArrayAdapter(mContext, android.R.layout.simple_spinner_dropdown_item);
}

protected void onClick() {
mSpinner.performClick(); // Spinner处理点击事件
}
// 复写父类的数据源往Adapter里填充
public void setEntries(@NonNull CharSequence[] entries) {
super.setEntries(entries);
updateEntries();
}
private void updateEntries() {
mAdapter.clear();
if (getEntries() != null) {
for (CharSequence c : getEntries()) {
mAdapter.add(c.toString());
}
}
}
// 复写数据更新回调，通知Spinner刷新
protected void notifyChanged() {
super.notifyChanged();
mAdapter.notifyDataSetChanged();
}
// 复写绑定逻辑，将Spinner和数据绑定
public void onBindViewHolder(PreferenceViewHolder view) {
mSpinner = (Spinner) view.itemView.findViewById(R.id.spinner);
mSpinner.setAdapter(mAdapter);
mSpinner.setOnItemSelectedListener(mItemSelectedListener);
// 设置Spinner初始选中项目
mSpinner.setSelection(findSpinnerIndexOfValue(getValue()));
super.onBindViewHolder(view);
}
// 监听Spinner点击事件，将设置保存
private final OnItemSelectedListener mItemSelectedListener = new OnItemSelectedListener() {
@Override
public void onItemSelected(AdapterView parent, View v, int position, long id) {
if (position >= 0) {
String value = getEntryValues()[position].toString();
if (!value.equals(getValue()) && callChangeListener(value)) {
setValue(value);
}
}
}
…
};
}
　　总结
　　下拉首选项自定义是 UI 在单击后变为微调器，它自己的 UI 与普通首选项没有什么不同。
　　ListReference是系统提供的参考，点击后弹出一个带有ListView的对话框，与上述自定义要求类似。
　　因此，AOSP 选择从 ListPreference 继承并覆盖单击事件将处理从对话框到微调器弹出窗口的弹出窗口。同时，其他函数的覆盖数据的绑定切换到Spinner的数据处理。
　　注：实际上，此引用会更改其自己的布局。构造函数指定 dropdownPreferenceStyle 的默认属性，这将指定收录微调器控件的布局。只是将 Spinner 设置为隐藏在布局中，因此此引用与普通首选项没有显着差异。
　　错误报告首选项
　　public class BugreportPreference extends CustomDialogPreference {
…
protected void onPrepareDialogBuilder(Builder builder, DialogInterface.OnClickListener listener) {
// 指定自定义Dialog的布局
final View dialogView = View.inflate(getContext(), R.layout.bugreport_options_dialog, null);
…
// 监听采集LOG选项的点击事件
final View.OnClickListener l = new View.OnClickListener() {
@Override
public void onClick(View v) {
if (v == mFullTitle || v == mFullSummary) {
mInteractiveTitle.setChecked(false);
mFullTitle.setChecked(true);
}
if (v == mInteractiveTitle || v == mInteractiveSummary) {
mInteractiveTitle.setChecked(true);
mFullTitle.setChecked(false);
}
}
};
mInteractiveTitle.setOnClickListener(l);
mFullTitle.setOnClickListener(l);
mInteractiveSummary.setOnClickListener(l);
mFullSummary.setOnClickListener(l);
builder.setPositiveButton(com.android.internal.R.string.report, listener);
builder.setView(dialogView);
}
// 复写Dialog点击事件，OK的情况下按需调用采集LOG处理
protected void onClick(DialogInterface dialog, int which) {
if (which == DialogInterface.BUTTON_POSITIVE) {
final Context context = getContext();
if (mFullTitle.isChecked()) {
Log.v(TAG, "Taking full bugreport right away");
FeatureFactory.getFactory(context).getMetricsFeatureProvider().action(context,
MetricsEvent.ACTION_BUGREPORT_FROM_SETTINGS_FULL);
takeBugreport(ActivityManager.BUGREPORT_OPTION_FULL);
}…
}
}
// 封装的调用系统采集LOG函数
private void takeBugreport(int bugreportType) {
try {
ActivityManager.getService().requestBugReport(bugreportType);
} catch (RemoteException e) {
Log.e(TAG, "error taking bugreport (bugreportType=" + bugreportType + ")", e);
}
}
}
　　总结
　　BugreportPpreferences通过重写从CustomDialogPpreferences继承的布局和侦听逻辑来实现显示采集LOG设置条目的目的。
　　以上对典型系统以及设置 APP 提供的自定义偏好组件进行了分类、分析和总结，让我们对自定义原理有了清晰的认识。
　　让我们总结一下自定义首选项的方法。
　　自定义首选项方法 ■ 指定样式方法
　　为活动定义具有指定布局的样式。
　　例如：
　　
@style/MyPreferenceStyle
@layout/my_preference_layout
　　言论：
　　事实上，不仅 Ppreferences，例如 PreferenceFragment、PreferenceScreen、EditTextPreference 等都有自己的 sytle 属性。通过官网或源码找到对应的attr名称，APP可以灵活指定自己的风格。
　　■ 布局或JAVA调用方法
　　使用布局
　　标记或调用 setLayoutResource（）来指定您自己的布局。
　　例如：
　　

…
或
myPreferenceInstance.setLayoutResource(R.layout. my_preference_layout);
　　以上两种方法只适用于简单的UI自定义，不能应用于UI变化较大的复杂场景或需求。
　　■灵活定制复制系统的首选项组件
　　public class MyPreference extends Preference {
// 复写必要的构造函数。
// 用于布局里使用该Preference时使用
public MyPreference(Context context, AttributeSet attrs) {
// 可以参考父类指定默认的attr名
// 也可以指定自定义的attr，为方便APP在xml的灵活配置
this(context, attrs, xxx);
}
// 用于Java里手动创建Preference时使用
public DialogPreference(Context context) {
this(context, null);
}
// 复写必要的View绑定逻辑
// 继承自base包下Preference时使用
protected void onBindView(View view) {
…
}
// 继承自support包下Preference时使用
public void onBindViewHolder(PreferenceViewHolder view) {
…
}
// 复写点击事件(如果需要定制点击处理的话)
protected void onClick() {
…
}
// 复写一些特定的父类的处理(如果由需要的话)
// 比如SeekbarDialogPreference需要将dialog布局内icon隐藏
protected void onBindDialogView(View view) {
…
}
...
}
　　在实际开发过程中，我们可以根据业务需求寻找现成的 Ppreferred 组件，避免重建车轮。
　　如果没有现成的可用，请考虑通过样式或Java进行简单定制是否可以实现目标。
　　最后，我们只有继承了复制的方法，才能准确地达到我们的目的，当然，选择现有的具有类似需求的 Ppreferences组件进行复制，将达到事半功倍的效果。
　　成熟的解决方案:需求采集与研究
　　工作了七八年，职场给我最大的感悟就是创新就是未来，创新的前提是了解用户的需求。经过这么多年的编码和在网上的几年的沉浸，我总结了一些需求采集的方法>分享给大家。
　　1：需求分类采集>方法
　　采集>需求只是手段，目的是通过研究用户更好地满足需求
　　1.直接采集>和间接采集>——>主次需求
　　直接面对用户->一手需求；通过复述，第三方行业分析报告->二手需求
　　直接采集>：只有这样，产品本身和自己对产品的判断才能更接地气
　　间接采集>：需要考虑需求者和提议者是谁，是否被误解了
　　一般都是经过整理的，得出结论的效率更高。
　　2.说和做，定性和定量
　　用户访谈——《问卷调查》——《可用性测试》——《数据分析》
　　3. 是在真实场景中吗？
　　临场感，最好的需求是在真实场景的位置采集>
　　负面例子：
　　钓鱼智能浮标——实际用户钓鱼时不方便使用手机
　　地下车库寻车APP-无信号
　　4.与产品是否有互动
　　对于某些产品，用户想象中是否需要，与实际使用后是否需要完全不同。
　　电视需要，洗碗机需要
　　

　　潜在原因：不可靠的用户
　　解决方案：先简化实现，或者用人肉跑流程来验证、尝试、租用
　　经典示例：免费试用
　　二：一些实用的采集>方法
　　2.1 腾讯10/100/1000法：产品经理每个月要做10次用户调查，阅读100篇用户写的文章文章，处理1000个用户反馈
　　2.2 如有条件，新入职人员可到客服部轮岗数周至数月，或听客服电话半个月。
　　2.3 利用互联网、微博、百度等搜索引擎的大数据，会告诉我们很多用户痛点
　　三：用户，重新认识需求
　　3.1 需求的三个深度
　　意见和行为
　　目标和动机（更现实）
　　人性与价值观：
　　马斯洛的需求层次——本我、自我、超我。
　　层次越低的需求越笼统、僵化、工具化，越难以发光
　　更高层次的需求更细分（场景、时间、空间）
　　3.2 如何理解这种内部需求的战略需求
　　如何理解内部需求与狭隘用户需求的关系？
　　一个。提议者是泛化用户，所以这些需求必须考虑，但要判断优先级
　　湾。分清目的和手段。通过服务外部用户实现商业价值，满足外部用户价值是最终目标。组建团队只是实现目标的一种手段。
　　

　　为了满足自己的指标，伤害用户的 KPI：
　　提高优采云出勤率，改善北京空气质量，防止校车事故，防止学生在春节期间站着回家。
　　3.3 用户：从抽象到具体再到抽象
　　产品概念阶段，想象中的目标用户，核心用户；
　　求采集>舞台，看活人，听故事，找情；
　　在需求采集>之后，合并特性，定义角色，修改产品概念方向
　　工具：用户故事
　　两个典型用户：新手和专家
　　核心用户是典型的新手产品：电梯、公测、垃圾桶等用户量大的海量产品；电视、冰箱、洗衣机、2C产品
　　核心用户是专家的典型产品：少数用户，如专业仪器、乐器、单反、2B产品
　　四：产品原理及初衷
　　制定产品原则的前提是已经需要一个产品采集>并且资料充足
　　它是什么：整个产品团队必须达成一致的共识指南
　　元素：
　　1 目标用户分为几类，优先级是什么；
　　2 产品市场切入点最关键的场景是什么？最小可行产品必须满足哪些功能
　　3 一个产品要追求用户数量或用户质量，追求流量或利润，这些都必须收录在产品原则中。
　　4 人与内容哪个更重要？

整套解决方案:UI网页设计公司Bootstrap模板

采集交流 • 优采云发表了文章 • 0 个评论 • 91 次浏览 • 2022-10-31 14:41 • 来自相关话题

　　整套解决方案:UI网页设计公司Bootstrap模板
　　免费下载或者VIP会员资源可以直接商业化吗？
　　本站所有资源版权归原作者所有。此处提供的资源仅供参考和学习使用，请勿直接用于商业用途。如因商业用途发生版权纠纷，一切责任由用户承担。更多信息请参考VIP介绍。
　　提示下载完成但无法解压或打开？
　　
　　最常见的情况是下载不完整：可以将下载的压缩包与网盘容量进行对比。如果小于网盘指示的容量，就是这个原因。这是浏览器下载bug，建议使用百度网盘软件或迅雷下载。如果排除了这种情况，可以在对应资源底部留言，或者联系我们。
　　在资产介绍文章中找不到示例图片？
　　对于会员制、全站源代码、程序插件、网站模板、网页模板等各类素材，文章中用于介绍的图片通常不收录在相应的下载中材料包。这些相关的商业图片需要单独购买，本站不负责（也没有办法）找到来源。某些字体文件也是如此，但某些资产在资产包中会有字体下载链接列表。
　　付款后无法显示下载地址或无法查看内容？
　　
　　如果您已经支付成功但网站没有弹出成功提示，请联系站长提供支付信息供您处理
　　购买此资源后可以退款吗？
　　源材料是一种虚拟商品，可复制和传播。一经批准，将不接受任何形式的退款或换货请求。购买前请确认您需要的资源
　　超值资料:友情链接交换工具使用教程：爱链工具
　　友情链接交换工具教程：爱情链工具
　　日期：2020 年 11 月 1 日上午 9:30 浏览量：1,319 次
　　目录
　　爱链工具是爱站网络推出的友好链接交换工具。收录大量网站资源，软件功能比较齐全，使用方便，可以大大提高友情链接的建设。效率。下面简单介绍一下它的使用方法。
　　1.安装
　　首先我们需要安装它。Love Chain 工具是爱站工具包的功能之一。您可以直接搜索爱站工具包，然后安装、注册、登录即可使用。进入爱站工具包，然后点击兑换链接进入爱链工具。
　　
　　2.添加网站
　　打开爱链工具后，进入我的网站，然后点击添加网站。
　　在弹窗中输入网站的名称和网址，然后选择行业，输入关键词（一行一个，可添加多个），然后设置兑换要求。如果是新站，则没有限制。
　　网站添加网站后，会出现在我的网站中。
　　3.交换链接
　　
　　接下来我们进入交流大厅，选择和我们行业类似的网站，然后点击右边的应用交流。在弹出的窗口中，选择需要兑换的网站和关键词，然后点击申请兑换。
　　申请后，可以在申请列表中看到我们刚刚申请的网站，需要等待对方批准。
　　当对方同意后，我们最好把对方的链接加到我们的网站，这样更真诚，可以提高成功率，然后回到爱链工具的中心上链. 接下来我们只需要等待对方添加链接即可。
　　总结
　　友情链接建设是网站搭建之后最重要的任务，使用这个爱心链工具可以提高一些效率，但是不能一次交换太多链接，一般一天交换1-3个链接就可以了。查看全部

　　整套解决方案:UI网页设计公司Bootstrap模板
　　免费下载或者VIP会员资源可以直接商业化吗？
　　本站所有资源版权归原作者所有。此处提供的资源仅供参考和学习使用，请勿直接用于商业用途。如因商业用途发生版权纠纷，一切责任由用户承担。更多信息请参考VIP介绍。
　　提示下载完成但无法解压或打开？
　　

　　最常见的情况是下载不完整：可以将下载的压缩包与网盘容量进行对比。如果小于网盘指示的容量，就是这个原因。这是浏览器下载bug，建议使用百度网盘软件或迅雷下载。如果排除了这种情况，可以在对应资源底部留言，或者联系我们。
　　在资产介绍文章中找不到示例图片？
　　对于会员制、全站源代码、程序插件、网站模板、网页模板等各类素材，文章中用于介绍的图片通常不收录在相应的下载中材料包。这些相关的商业图片需要单独购买，本站不负责（也没有办法）找到来源。某些字体文件也是如此，但某些资产在资产包中会有字体下载链接列表。
　　付款后无法显示下载地址或无法查看内容？
　　

　　如果您已经支付成功但网站没有弹出成功提示，请联系站长提供支付信息供您处理
　　购买此资源后可以退款吗？
　　源材料是一种虚拟商品，可复制和传播。一经批准，将不接受任何形式的退款或换货请求。购买前请确认您需要的资源
　　超值资料:友情链接交换工具使用教程：爱链工具
　　友情链接交换工具教程：爱情链工具
　　日期：2020 年 11 月 1 日上午 9:30 浏览量：1,319 次
　　目录
　　爱链工具是爱站网络推出的友好链接交换工具。收录大量网站资源，软件功能比较齐全，使用方便，可以大大提高友情链接的建设。效率。下面简单介绍一下它的使用方法。
　　1.安装
　　首先我们需要安装它。Love Chain 工具是爱站工具包的功能之一。您可以直接搜索爱站工具包，然后安装、注册、登录即可使用。进入爱站工具包，然后点击兑换链接进入爱链工具。
　　

　　2.添加网站
　　打开爱链工具后，进入我的网站，然后点击添加网站。
　　在弹窗中输入网站的名称和网址，然后选择行业，输入关键词（一行一个，可添加多个），然后设置兑换要求。如果是新站，则没有限制。
　　网站添加网站后，会出现在我的网站中。
　　3.交换链接
　　

　　接下来我们进入交流大厅，选择和我们行业类似的网站，然后点击右边的应用交流。在弹出的窗口中，选择需要兑换的网站和关键词，然后点击申请兑换。
　　申请后，可以在申请列表中看到我们刚刚申请的网站，需要等待对方批准。
　　当对方同意后，我们最好把对方的链接加到我们的网站，这样更真诚，可以提高成功率，然后回到爱链工具的中心上链. 接下来我们只需要等待对方添加链接即可。
　　总结
　　友情链接建设是网站搭建之后最重要的任务，使用这个爱心链工具可以提高一些效率，但是不能一次交换太多链接，一般一天交换1-3个链接就可以了。

实用文章:ecms使用之文章内容调用

采集交流 • 优采云发表了文章 • 0 个评论 • 102 次浏览 • 2022-10-31 07:28 • 来自相关话题

　　实用文章:ecms使用之文章内容调用
　　[e：loop={“select * from [！db.pre！]ecms_show_every 其中 sid=“.$navinfor[id].” 按 ID 排序 DESC 限制 100“，100，24，0}]” 目标=“_blank” title=“”推荐项目框 type_blog clearfix“ data-url=”“ data-report-view=' {”ab“：”new“，”spm“：”1001.2101.3001.6650.5“，”mod“：”popu_387“，”extra“：”{\“highlightScore\”：0.0，\“utm_medium\”：\“distribute.pc_relevant.none-task-blog-2~default~ 博客推荐来自百度~费率-5-91648511-blog-56677038.pc_relevant_multi_platform_whitelistv4\”，\“dist_request_id\”：\“08_19900\”}“，“dist_request_id”：“08_19900”，“ab_策略”：“featuressortv4”，“index”：“5”，“strategy”：“2~default~BlogCommendFromBaidu~Rate”，“dest”：“”}'>
　　Ecms高级技能总结（1）。
　　
　　weixin_34407348的博客
　　10-18岁
　　
　　76
　　最近从事的一个英制cms项目，不断有一些新知识，这里梳理一下：一、英制cms程序扩展变量说明：1、列表模板变量说明：当前列 ID：$navclassid或$GLOBALS['navclassid']，通过这个变量可以输出这个列 id 的所有数据。例如：从 phome_enewsclass classid=$GLOBALS['....
　　推荐文章:织梦模板(dedecms) 文章页调用浏览次数(阅读量,访问量)
　　使用Dedecms建站时，在文章页面的信息页面上，调用文章浏览量的官方标签为：
　　{dede:field.click/}
　　这个标签调用静态视图数，也就是我们生成文章时随机生成的视图数。在这里，无论怎么刷新文章页面，浏览量都不会增加，用户体验很差。
　　网上有个解决办法，就是把调用标签换成：
　　
　　这样就可以动态调用查看次数文章，每次刷新查看次数都会增加一次，但是余斗用了之后发现了一个问题。每次页面加载到这个地方都会卡住一段时间，因为这是一个js调用。您必须每次请求服务器一次。这里的标签加载及时，肯定会卡在这里。余斗研究后给出最优解。
　　具体思路是：我们可以先定义一个数（鱼斗定义0）。网页先加载的时候，先加载我们预先确定的数字，然后通过网页的最后加载JS调用真实的点击次数。具体步骤如下：
　　1.在点击次数的位置用span标签定义点击次数
　　0次
　　2.修改Dede核心函数，在plus/count.php中找到如下代码
　　
　　echo "document.write('".$row['click']."');\r\n";
　　最后几行找到后，可以评论或者替换，看心情
　　echo'document.getElementById("countnum").innerHTML='.$row['click'];
　　3.在页面底部添加js代码
　　在网页底部添加js，可以完美解决加载浏览量时卡顿的问题。用户体验非常好。至此，实现了文章页面动态调用文章views。查看全部

　　实用文章:ecms使用之文章内容调用
　　[e：loop={“select * from [！db.pre！]ecms_show_every 其中 sid=“.$navinfor[id].” 按 ID 排序 DESC 限制 100“，100，24，0}]” 目标=“_blank” title=“”推荐项目框 type_blog clearfix“ data-url=”“ data-report-view=' {”ab“：”new“，”spm“：”1001.2101.3001.6650.5“，”mod“：”popu_387“，”extra“：”{\“highlightScore\”：0.0，\“utm_medium\”：\“distribute.pc_relevant.none-task-blog-2~default~ 博客推荐来自百度~费率-5-91648511-blog-56677038.pc_relevant_multi_platform_whitelistv4\”，\“dist_request_id\”：\“08_19900\”}“，“dist_request_id”：“08_19900”，“ab_策略”：“featuressortv4”，“index”：“5”，“strategy”：“2~default~BlogCommendFromBaidu~Rate”，“dest”：“”}'>
　　Ecms高级技能总结（1）。
　　

　　weixin_34407348的博客
　　10-18岁
　　

　　76
　　最近从事的一个英制cms项目，不断有一些新知识，这里梳理一下：一、英制cms程序扩展变量说明：1、列表模板变量说明：当前列 ID：$navclassid或$GLOBALS['navclassid']，通过这个变量可以输出这个列 id 的所有数据。例如：从 phome_enewsclass classid=$GLOBALS['....
　　推荐文章:织梦模板(dedecms) 文章页调用浏览次数(阅读量,访问量)
　　使用Dedecms建站时，在文章页面的信息页面上，调用文章浏览量的官方标签为：
　　{dede:field.click/}
　　这个标签调用静态视图数，也就是我们生成文章时随机生成的视图数。在这里，无论怎么刷新文章页面，浏览量都不会增加，用户体验很差。
　　网上有个解决办法，就是把调用标签换成：
　　

　　这样就可以动态调用查看次数文章，每次刷新查看次数都会增加一次，但是余斗用了之后发现了一个问题。每次页面加载到这个地方都会卡住一段时间，因为这是一个js调用。您必须每次请求服务器一次。这里的标签加载及时，肯定会卡在这里。余斗研究后给出最优解。
　　具体思路是：我们可以先定义一个数（鱼斗定义0）。网页先加载的时候，先加载我们预先确定的数字，然后通过网页的最后加载JS调用真实的点击次数。具体步骤如下：
　　1.在点击次数的位置用span标签定义点击次数
　　0次
　　2.修改Dede核心函数，在plus/count.php中找到如下代码
　　

　　echo "document.write('".$row['click']."');\r\n";
　　最后几行找到后，可以评论或者替换，看心情
　　echo'document.getElementById("countnum").innerHTML='.$row['click'];
　　3.在页面底部添加js代码
　　在网页底部添加js，可以完美解决加载浏览量时卡顿的问题。用户体验非常好。至此，实现了文章页面动态调用文章views。

完整的解决方案:基于Docker+Kubernetes，微服务容器化开发实战

采集交流 • 优采云发表了文章 • 0 个评论 • 95 次浏览 • 2022-10-29 22:14 • 来自相关话题

　　完整的解决方案:基于Docker+Kubernetes，微服务容器化开发实战
　　前言
　　微服务和 Docker 容器技术是分布式架构中常用的主流技术。结合 Kubemetes 强大的容器服务编排和调度能力，中小企业可以轻松快速地构建自己的分布式互联网架构系统。本文文章结合实际生产项目的架构重构过程和经验，详细介绍了从单体架构到微服务容器化分布式架构过渡的各个方面，主要包括先进的微服务开发和运维技术的穿梭选型， Spring Cloud 微服务开发，安装部署 Rancher 和 Kubemetes 生产离线环境，微服务容器化和服务编排，日志调用链采集和展示，基于Promethe的系统监控，以及微服务的持续集成等要点。**基于Spring Boot、Spring Cloud、Docker、Racher、Kubemetes等技术，主要提供微服务容器化生产环境从设计、开发、部署到运维的整体解决方案。
　　每一章都结合实际生产项目进行讲解。它特别适合将 Spring Cloud、Docker 和 Kubemetes 等技术应用到生产中的技术经理、架构师和开发人员。它也适用于学习微服务和容器化的入门级程序员。它也可以作为微服务、容器化运营商以及对相关技术感兴趣的人的参考。
　　由于文章篇幅较长，需要完整PDF文档的朋友可以点赞+转发后免费获取【点此】
　　第1章：单体架构和微服务架构从量变到质变从单体架构到微服务架构的演进，不仅是软件架构的变化，也是方法论和生产力的实质性提升本章主要介绍单体架构和微服务的优势架构的优缺点，以及微服务的设计原则和拆分原则
　　1.1 背景介绍
　　1.2 单体架构
　　1.3 微服务架构
　　1.4 微服务拆分
　　1.5 微服务开发原理
　　1.6 本章小结
　　第2章：Spring Boot微服务开发本章主要介绍微服务的概念、框架、开发和封装测试。首先详细介绍了 Dubbo 服务框架和 Spring Cloud 微服务框架，并介绍了这两个框架的概念和特点。并且对技术分支进行了详细的介绍和对比，然后给出了微服务开发和运营的技术核心全景，列出了当前微服务相关的主流技术。
　　2.1 微服务框架
　　2.2 技术栈选择
　　2.3 搭建开发环境
　　
　　2.4 编写框架代码
　　2.5 编写业务代码
　　2.6 封装测试
　　2.7 本章小结
　　第三章微服务运行环境搭建本章主要介绍微服务通用环境的搭建，包括开发环境、测试环境和生产环境。Spring Boot对应的配置文件分为dev、test、prod。主要区别在于第一个第三方服务IP地址、数据库地址、中间件地址、日志配置的区别
　　3.1 运行环境概述
　　3.2 搭建开发环境
　　3.3 搭建测试环境
　　3.4 搭建生产环境
　　3.5 切换运行环境
　　3.6 章节总结
　　第四章：Rancher和Kubernetes离线部署本章主要介绍如何下载微服务运行环境的安装文件，以及微服务运行环境Docker、Kubemetes和Rancher的离线安装。由于Docker镜像仓库Harbor涉及到CA证书，本章还介绍了CA证书的创建和生成过程。
　　第五章：日志采集本章介绍微服务系统的整体端到端日志采集，包括日志输出log采集日志采集处理、日志存储、日志展示. 首先，引入了基于 Filebeat 和 ELK 的 log采集模型，充分利用了 Elasticsearch 的全文检索能力和 Kibana 丰富的图形展示能力。其次介绍了基于Spring Boot的微服务日志输出配置，分为开发环境测试环境和生产环境，最后根据log采集模型，log采集log sink和分别介绍了日志显示。
　　
　　第6章：调用链跟踪本章首先介绍了调用链跟踪的概念，阐述了Trace Span对于服务调用的内涵，然后介绍了Spring Cloud调用链眼动追踪模型中的Sleuth组件和Zipkin组件，并介绍了Spring Cloud调用链跟踪模型；最后介绍了Sleuth+Zipkin调用链跟踪技术，在开发环境、测试环境和生产环境中的配置，以及存储在Elasticsearch组件中的调用链数据，并介绍了如何在Zipkin和Kibana链信息中图形化展示和检索调用
　　第7章：断路器本章首先介绍了微服务中断路器的概念，然后介绍了Spring Loud中断路器Hystrix的特点。最后介绍了熔断器相关的Maven依赖配置，熔断器代码编写的使用，熔断器的图形化展示和监控。
　　第八章：容器化与服务编排本章介绍了容器化、虚拟机、服务编排，重点介绍了生产环境中应用镜像的构建过程。映像包括父映像、基础映像和应用程序映像。基本建造方法。
　　第9章：系统监控本章首先对系统监控进行了概述，包括主机监控、安全监控、中间件监控、业务监控、容器监控等。然后介绍了Kubemetes集群常用的监控方案，通常基于Node Exporter ，Prometheus Grafana 监控系统。
　　第10章：持续集成部署本章简要介绍了持续生成和持续部署的概念，以及持续集成部署的模型，重点介绍了基于Kubemetes容器化平台的Rancher容器编排平台，以及基于CICD的生产实践在詹金斯管道上。
　　由于文章篇幅较长，需要完整PDF文档的朋友可以点赞+转发后免费获取【点此】
　　直观:优采云采集器：标准网数据采集
　　标准净数据采集
　　本文介绍如何使用标准网络优采云采集器采集数据信息包括名称、作者、内容等。
　　1. 插件安装
　　1. 先去优采云采集器
　　
　　官方网站（）下载优采云采集器谷歌插件。
　　2.单击浏览器工具栏右侧的按钮 - >更多工具 - >扩展。
　　3. 将下载的插件拖拽到”扩展“
　　页面，点击”添加扩展“，右侧插件栏中会出现”优采云“标识，即可安装插件，即可启动采集数据。
　　
　　二、数据采集的步骤
　　总结
　　今天就讲到这里，本文简要介绍如何使用标准网络的基本操作步骤优采云采集器采集优采云采集器提供了大量的功能，让我们可以快速方便地采集数据。查看全部

　　完整的解决方案:基于Docker+Kubernetes，微服务容器化开发实战
　　前言
　　微服务和 Docker 容器技术是分布式架构中常用的主流技术。结合 Kubemetes 强大的容器服务编排和调度能力，中小企业可以轻松快速地构建自己的分布式互联网架构系统。本文文章结合实际生产项目的架构重构过程和经验，详细介绍了从单体架构到微服务容器化分布式架构过渡的各个方面，主要包括先进的微服务开发和运维技术的穿梭选型， Spring Cloud 微服务开发，安装部署 Rancher 和 Kubemetes 生产离线环境，微服务容器化和服务编排，日志调用链采集和展示，基于Promethe的系统监控，以及微服务的持续集成等要点。**基于Spring Boot、Spring Cloud、Docker、Racher、Kubemetes等技术，主要提供微服务容器化生产环境从设计、开发、部署到运维的整体解决方案。
　　每一章都结合实际生产项目进行讲解。它特别适合将 Spring Cloud、Docker 和 Kubemetes 等技术应用到生产中的技术经理、架构师和开发人员。它也适用于学习微服务和容器化的入门级程序员。它也可以作为微服务、容器化运营商以及对相关技术感兴趣的人的参考。
　　由于文章篇幅较长，需要完整PDF文档的朋友可以点赞+转发后免费获取【点此】
　　第1章：单体架构和微服务架构从量变到质变从单体架构到微服务架构的演进，不仅是软件架构的变化，也是方法论和生产力的实质性提升本章主要介绍单体架构和微服务的优势架构的优缺点，以及微服务的设计原则和拆分原则
　　1.1 背景介绍
　　1.2 单体架构
　　1.3 微服务架构
　　1.4 微服务拆分
　　1.5 微服务开发原理
　　1.6 本章小结
　　第2章：Spring Boot微服务开发本章主要介绍微服务的概念、框架、开发和封装测试。首先详细介绍了 Dubbo 服务框架和 Spring Cloud 微服务框架，并介绍了这两个框架的概念和特点。并且对技术分支进行了详细的介绍和对比，然后给出了微服务开发和运营的技术核心全景，列出了当前微服务相关的主流技术。
　　2.1 微服务框架
　　2.2 技术栈选择
　　2.3 搭建开发环境
　　

　　2.4 编写框架代码
　　2.5 编写业务代码
　　2.6 封装测试
　　2.7 本章小结
　　第三章微服务运行环境搭建本章主要介绍微服务通用环境的搭建，包括开发环境、测试环境和生产环境。Spring Boot对应的配置文件分为dev、test、prod。主要区别在于第一个第三方服务IP地址、数据库地址、中间件地址、日志配置的区别
　　3.1 运行环境概述
　　3.2 搭建开发环境
　　3.3 搭建测试环境
　　3.4 搭建生产环境
　　3.5 切换运行环境
　　3.6 章节总结
　　第四章：Rancher和Kubernetes离线部署本章主要介绍如何下载微服务运行环境的安装文件，以及微服务运行环境Docker、Kubemetes和Rancher的离线安装。由于Docker镜像仓库Harbor涉及到CA证书，本章还介绍了CA证书的创建和生成过程。
　　第五章：日志采集本章介绍微服务系统的整体端到端日志采集，包括日志输出log采集日志采集处理、日志存储、日志展示. 首先，引入了基于 Filebeat 和 ELK 的 log采集模型，充分利用了 Elasticsearch 的全文检索能力和 Kibana 丰富的图形展示能力。其次介绍了基于Spring Boot的微服务日志输出配置，分为开发环境测试环境和生产环境，最后根据log采集模型，log采集log sink和分别介绍了日志显示。
　　

　　第6章：调用链跟踪本章首先介绍了调用链跟踪的概念，阐述了Trace Span对于服务调用的内涵，然后介绍了Spring Cloud调用链眼动追踪模型中的Sleuth组件和Zipkin组件，并介绍了Spring Cloud调用链跟踪模型；最后介绍了Sleuth+Zipkin调用链跟踪技术，在开发环境、测试环境和生产环境中的配置，以及存储在Elasticsearch组件中的调用链数据，并介绍了如何在Zipkin和Kibana链信息中图形化展示和检索调用
　　第7章：断路器本章首先介绍了微服务中断路器的概念，然后介绍了Spring Loud中断路器Hystrix的特点。最后介绍了熔断器相关的Maven依赖配置，熔断器代码编写的使用，熔断器的图形化展示和监控。
　　第八章：容器化与服务编排本章介绍了容器化、虚拟机、服务编排，重点介绍了生产环境中应用镜像的构建过程。映像包括父映像、基础映像和应用程序映像。基本建造方法。
　　第9章：系统监控本章首先对系统监控进行了概述，包括主机监控、安全监控、中间件监控、业务监控、容器监控等。然后介绍了Kubemetes集群常用的监控方案，通常基于Node Exporter ，Prometheus Grafana 监控系统。
　　第10章：持续集成部署本章简要介绍了持续生成和持续部署的概念，以及持续集成部署的模型，重点介绍了基于Kubemetes容器化平台的Rancher容器编排平台，以及基于CICD的生产实践在詹金斯管道上。
　　由于文章篇幅较长，需要完整PDF文档的朋友可以点赞+转发后免费获取【点此】
　　直观:优采云采集器：标准网数据采集
　　标准净数据采集
　　本文介绍如何使用标准网络优采云采集器采集数据信息包括名称、作者、内容等。
　　1. 插件安装
　　1. 先去优采云采集器
　　

　　官方网站（）下载优采云采集器谷歌插件。
　　2.单击浏览器工具栏右侧的按钮 - >更多工具 - >扩展。
　　3. 将下载的插件拖拽到”扩展“
　　页面，点击”添加扩展“，右侧插件栏中会出现”优采云“标识，即可安装插件，即可启动采集数据。
　　

　　二、数据采集的步骤
　　总结
　　今天就讲到这里，本文简要介绍如何使用标准网络的基本操作步骤优采云采集器采集优采云采集器提供了大量的功能，让我们可以快速方便地采集数据。

安全解决方案:分布式追踪工具

采集交流 • 优采云发表了文章 • 0 个评论 • 124 次浏览 • 2022-10-29 14:20 • 来自相关话题

　　安全解决方案:分布式追踪工具
　　云原生
　　应用安全检测 9.1.2.1 API 漏洞
　　API 的漏洞检测通常可以通过使用扫描程序执行定期漏洞扫描来执行。国内主要安全厂商提供扫描仪产品，如绿盟科技的远程安全评估系统（RSAS）和Web应用漏洞扫描系统（WVSS）。），除了，
　　我们还可以使用其他商业扫描仪，例如 AWVS（Acunetix Web Vulnerability Scanner）、AppScan、Burp Suite、Nessus 等。
　　9.1.2.2 针对 API 的攻击检测
　　面对 API 的威胁，目前使用传统的 API 网关进行防护。比如Kong、Zuul、Orange等都有自己的API安全解决方案
　　. 但是随着应用的云原生特性，出现了很多云原生的API网关，比如Kong、Ambassador、Gloo等，都可以基于Kubernetes进行部署。API网关虽然在一定程度上防御了应用程序的API威胁攻击，但其防护的是南北向流量，服务网格内部的东西向流量检测和防护并没有得到有效缓解。理想的解决方案应该是东西/南北方向的全面检测。
　　针对这一需求，业界已经制定了相应的解决方案，主要是云原生网关和Service Mesh的结合，其中Service Mesh负责东西向流量的检测和保护。对于服务网格，使用主流的 Istio 和 Kong。Kuma 的服务网格。
　　Istio 主要通过其内置的 Envoy 过滤器实现东西流量检测，而 Kuma 则依靠 Kong 的安全插件来实现相应的检测保护。笔者对比了Gloo+Istio、Ambassador+Istio、Kong+Kuma这三种方案的安全能力，比如
　　下表显示：
　　表 9.1 云原生环境下 API 保护方案的安全能力对比
　　|解决方案|Gloo+Istio|Ambassdar+Istio|Kong+Kuma|
　　|防护维度|东/南北|东/南北|东/南北|
　　|WAF支持|支持|支持|支持|
　　|访问控制|支持|支持|支持|
　　|授权机制|支持|支持|支持|
　　|认证机制|支持|支持|支持|
　　|证书管理|支持|支持|支持|
　　|网站锁定|不支持|不支持|不支持|
　　
　　|反爬虫|不支持|不支持|不支持|
　　|机器流量检测|不支持|不支持|支持|
　　|数据丢失防护|支持|不支持|不支持|
　　|CORS|支持|支持|支持|
　　|解决方案||Gloo+Istio|Ambassdar+Istio|Kong+Kuma|
　　|XSS||支持|不支持|不支持|
　　|CSRF||支持|支持|不支持|
　　|DDOS||支持|支持|不支持|
　　|黑白名单限制||支持|支持|支持|
　　|限速||支持|支持|支持|
　　|行为特征分析|AI|不支持|不支持|不支持|
　　|入侵检测||不支持|不支持|不支持|
　　|mTLS||支持|支持|支持|
　　从上表统计来看，Gloo+Istio 方案支持的安全项较多，Kong+Kuma 方案支持的安全项最少。
　　应用业务安全
　　上一篇从网络、应用等层面介绍了微服务面临的威胁。除此之外，微服务架构还面临着很多业务级的安全威胁。这些安全威胁往往影响业务的稳定运行，给业务系统带来经济损失。
　　业务安全问题分析
　　具体来说，应用面临的安全问题主要包括三类，分别是服务频率异常、服务参数异常、服务逻辑异常。我们以一个微服务架构的电子商务系统为例介绍业务安全。电子商务系统的典型流程如图 9.1 所示。
　　图 9.1 电子商务系统业务流程图
　　业务频率异常。频繁调用一个 API 或一组 API。如前所述，业务系统经常使用图形验证码来规避机器人刷机的操作。攻击者可以绕过验证码对应的微服务，直接操作订单，进而实现
　　
　　机器刷单，电商一扫而光。
　　业务参数异常。相关参数通常在 API 调用过程中传递。该参数的取值会根据不同的业务场景有不同的取值范围。例如，商品数量必须是非负整数，价格必须大于0等。如果API对相应参数的监控机制不完善，攻击者往往会通过输入异常参数造成业务系统损失。例如，在一个电子商务系统中，如果只在商品介绍服务中验证商品价格，而在订单管理和支付服务中没有验证商品价格，攻击者可以直接调用订单管理和支付服务的API对订单进行验证。价格修改为0元或负值，给业务系统造成损失。
　　业务逻辑异常。与前两种异常相比，这种异常通常更为隐蔽。攻击者使用某些方法使 API 调用的逻辑顺序异常，包括丢失或颠倒的关键调用步骤。例如，在电子商务系统中，攻击者可以利用该漏洞绕过支付步骤并直接交付订单。这样，就会出现业务逻辑中关键步骤缺失的情况。上述业务频率异常中的验证码绕过异常也是业务逻辑异常。
　　业务异常检测
　　针对上述业务级安全问题，基于基线的异常检测是一种比较有效的方法：首先建立正常业务行为和参数的基线，然后找出偏离基线的异常业务操作。基线的建立需要与业务系统相结合。特点和专家知识共同完成。
　　在电子商务系统中，业务参数基线主要是基于专家知识建立的。例如，商品的价格不仅与商品本身有关，还与时间和各种优惠活动有关。这样的基线需要操作和维护人员持续维护。对于业务逻辑基线的建立，业务系统正式上线后，其运行逻辑一般不会发生很大变化，异常运行的比例较小。因此，可以采集业务系统的历史运行数据，结合统计分析和机器学习的方法，建立业务逻辑基线。与手动方法相比，
　　为此，可以利用6.4.3中分布式跟踪工具采集获取的数据，针对上述三种业务异常场景设计并实现业务异常检测引擎，如图9.2所示。其中，采集模块主要用于采集业务系统的运行数据，训练模块主要用于训练业务系统的历史数据获取行为特征数据，检测模块主要用于对正在运行的业务系统进行异常检测。
　　图 9.2 业务异常检测引擎设计图
　　检测引擎中各部分的具体功能为：
　　分布式跟踪工具。主要是采集微服务业务系统运行时产生的数据。目前常用的开源分布式追踪工具有Jaeger和Skywalking，sidecar也可以采集对应数据。在测试系统上进行了采集实验后，与其他两个采集工具相比，Jaeger能够获取最多的数据字段，检测到最丰富的异常场景。但是，Jaeger 需要在业务系统的源代码中。代码中的检测对开发团队来说更具侵入性。相反，sidecar模式没有代码和镜像的侵入性，但是通过反向代理拦截流量的模式也决定了它无法获取丰富的上下文，比如6.3中的trace API调用关系树（TraceID）。3 无法获得。如何利用侵入性较小的采集工具采集的数据，实现覆盖更多场景的异常检测，还需要大量的后续工作。
　　数据过滤和集成模块。该模块的主要作用是过滤掉数据集中的脏数据，提取出能够代表业务系统行为的数据。在微服务下，能够代表业务系统行为的数据有API调用关系树、服务名、操作名、HTTP POST参数等。
　　数据训练模块。预处理后的历史数据用于通过机器学习或统计方法训练业务系统中的正常行为，生成与业务系统正常行为相匹配的特征数据。这里训练的先验知识是，我们认为业务系统中大量存在的行为是正常行为，数量少的行为是异常行为。在训练过程中，需要根据专家知识对训练结果的检验，不断调整训练模型的参数。
　　检测引擎。将业务系统当前数据与特征数据进行搜索匹配，采用序列相似度计算等方法
　　在特征数据库中找到与当前行为最匹配的特征数据。检测引擎需要比较特征数据和当前数据与基线的相似度。如果比较结果表明当前行为与正常行为的差异在基线限度内，则为正常行为，如果超过基线限度，则判定为异常行为。对于基线，首先要根据专家知识设定一个合理的初始基线，根据不同场景调整基线，或者使用无监督模型调整基线，或者由运维人员手动维护基线。
　　服务网格安全
　　在 3.4 节中，我们已经识别了服务网格的安全风险。本节我们将以 Istio 为例介绍服务网格的安全防护部分。
　　参考
　　绿盟云原生安全技术报告
　　链接
　　GB-T 39786-2021 信息安全技术信息系统密码应用基本要求
　　解决方案:怎么建立蜘蛛池？
　　蜘蛛池关键词在早期的 seo 行业非常流行。那个时候，我们总听说某boss做了一个蜘蛛池，在网站中锁定了大量的蜘蛛。可以说是取之不尽，用之不竭。我们不否认蜘蛛池一开始是有效的，但现在很少有人谈论它。我们认为只有两种情况，一是蜘蛛池无效，二是成本高，那么，如何搭建蜘蛛池呢？
　　1. 程序
　　蜘蛛池以网站模板为基础，制作成不断更新的样式，吸引蜘蛛不断抢网站。这是一个直接销售的蜘蛛池程序，但我们认为它很可能会被搜索引擎识别，因为蜘蛛池程序需要盈利，必须有不止一个出售，所以更容易被识别.
　　2. 战略
　　如果自己搭建，策略要合理使用，比如使用多个域名进行网站相互链接，然后用单个站点作为蜘蛛池程序，组成更大的蜘蛛池，其中蜘蛛池程序需要有自己的显示方法的主要目的是避免搜索引擎的识别。当然，这样做的最终结果是成本太高，使用时间不确定，取决于搜索引擎的识别周期。
　　3.使用
　　因此，我们不建议我们现在使用蜘蛛池进行 SEO。我们还是应该关注如何创造内容，如何提升网站的用户体验，提升网站的价值，自然用户访问量会增加，进而网站的整体质量> 将继续改进。走捷径做seo，现在能实现的概率越来越低。
　　做搜狗蜘蛛池，让SEO更简单。很多SEO优化者都在追求搜狗快收录、快排等捷径！搜狗蜘蛛池，一个既熟悉又陌生的词。我们知道，搜索引擎网页的收录完全依赖于蜘蛛的爬取和爬取。搜狗蜘蛛池使用多个服务器和站点域名，并使用常规内容站点来养大量蜘蛛。它为蜘蛛每天爬行提供了大量的内容。当某些链接需要收录时，将这些链接提交给服务器进入搜狗蜘蛛池，大量蜘蛛会快速抓取这些网址。目前搜狗蜘蛛池对收录有帮助。如果是百万页面的网站，可以考虑使用Spider Pool来提高收录的访问率。
　　蜘蛛池搭建：通常的蜘蛛池程序都是基于大量的站群构建的，主要表现在不同类型的网站上，有的是新闻站群，有的是网站目录站群。因此，蜘蛛池是基于大量网站目录的蜘蛛池。使用网站目录本身对网站有一定的推荐功能，收录的效果非常明显。，这也是搜狗SEO优化人员一直使用蜘蛛池的原因。
　　自动化采集，智能建站站群管理系统，站群软件让建站变得简单，整合数据采集器，轻松发布内容到任何网站。
　　智能换站：智能生成千城、关键词变电站站群，让海量内容推送到搜索引擎，最大化搜索概率。
　　
　　智能推送：每天可以主动向搜狗推送百万链接，同时主动向搜狗推送链接，有效保证新链接能被搜狗收录快速发现，加快百度发现速度，限制主动推送的推送次数。但是使用推送工具后，可以突破官方单站每天200次推送的限制，并且推送后的爬取速度更快，爬取更及时。
　　智能采集：智能采集主站的内容自动更新到子站，保证子站的内容可以不断更新。利用大数据，智能挖掘符合用户搜索习惯的相关关键词，并自动匹配子站，确保搜索引擎首页更多关键词。
　　智能链轮：各个子站相互链接，相互优化，保证网站有足够的内链。智能交换友情链接，吸引蜘蛛爬行，保证网站有足够的外链。
　　智能替换：智能替换分站内容，保证主要分站内容不重复。伪原创用于搜索引擎，适合采集大型网站。系统采用MIP移动加速技术，保证网站的访问速度。
　　目前蜘蛛池对收录还是有帮助的。如果是百万页的网站，可以考虑使用蜘蛛池来提高收录率，但是蜘蛛池的成本不低。蜘蛛池方案：每年几千台左右，站群服务器：每月1000台左右，视量而定，域名：每台20-50台左右，500个域名起。这种利用大平台向搜狗推送大量长尾关键词进行收录和排名，对于吸引蜘蛛收录有很好的促进作用。
　　只需购买蜘蛛池程序，购买好的服务器，并购买数百个域名。
　　谢谢你的邀请：
　　一般小蜘蛛池也要有100+的域名，独立服务器，多ip类型，二级域名都可以。
　　100+的域名一般都能看到效果，可以买其他不如pw的tk之类的。
　　为什么要使用专用服务器？百蜘蛛来的时候，非常吃服务器配置！硬盘驱动器经常飙升到 100%。
　　其实二级域名的效果并不是太明显，因为主站好，二级域名好用！如果您的主域名是垃圾。被二级域名吸引的蜘蛛还是太少，所以推荐使用主域名。
　　蜘蛛池模板需要优化。如果使用蜘蛛池自带的模板，大家都会做的不好。百度蜘蛛虽然是机器，但也能识别，所以要自己改模板。还有，随机文章，建议采集关注热点新闻，很多蜘蛛池都是小说。热门新闻百度蜘蛛喜欢。
　　
　　你需要时间来做一个蜘蛛池。不是说建好了蜘蛛池就可以高枕无忧了。如果你这么想，你的蜘蛛池最终会变得鸡肋。是的，当然，域名越多越好。我说的100+是给你看效果的。
　　不要说服务器IP。IP越多越好，因为都在同一个IP上，搜索引擎会判断你在做什么是站群，对你来说很容易掉。如何让蜘蛛池在短时间内生效，你可以发挥你的力量。前期外推、租用蜘蛛池、二级目录等都是不错的方法，但我强烈建议大家使用暗链中的一种技术（文暗链），暗链不易发现文字暗链是把你的链接放在高权重的网站上面，但是文字颜色设置为和背景颜色一样，这样别人看不到，但是蜘蛛可以爬到，蜘蛛会根据你的文字暗链去你的网站。该方法安全、稳定、有效。注意文字暗链并没有在代码中添加div隐藏或其他隐藏，而是将文字的颜色调整为与背景颜色相同。最好放在导航栏或者文章，效果绝对没话说。
　　也可以考虑过去租个蜘蛛池，给自己的蜘蛛送蜘蛛。. . 这种方法是可耻的。但我发现这是一种蜘蛛新蜘蛛池的好而快捷的方法。
　　首先权衡您自己的时间和资本投资成本。
　　链接池有两种玩法
　　部分是网链，那是因为博客论坛类一开始权重高，收录快，可以很好的引导蜘蛛；
　　另一部分是玩站群。这个投资比链轮高，因为服务器和域名都需要投资，好在做一个独立的IP站点，以防猜疑。有些是国外或香港服务器，不需要记录，网站使用较多的模板，内容通过采集或伪原创传递，如果可以在发布中使用工具，可以使用可以减少劳动力的工具
　　对黑帽了解不多。除非您特别熟悉搜索引擎蜘蛛算法，否则请说实话。
　　谢谢：虽然我听说过这个名字，但之前没有接触过，所以无法判断。如果我个人建议的话，最好用正式的手段来优化排名。效果虽然慢，但出现排名时会有成就。感觉。形式优化永远不会过时。蜘蛛池能用多久还是个未知数，所以推荐给白帽SEO。你知道蜘蛛池，说明你在这个行业有很多经验，对常规方法了如指掌。个人意见仅供参考。白帽SEO从业者山西seo
　　网站外部链接，是真的吗？
　　新做的蜘蛛池免费帮人做，提供知识
　　有人讨论过吗？查看全部

　　安全解决方案:分布式追踪工具
　　云原生
　　应用安全检测 9.1.2.1 API 漏洞
　　API 的漏洞检测通常可以通过使用扫描程序执行定期漏洞扫描来执行。国内主要安全厂商提供扫描仪产品，如绿盟科技的远程安全评估系统（RSAS）和Web应用漏洞扫描系统（WVSS）。），除了，
　　我们还可以使用其他商业扫描仪，例如 AWVS（Acunetix Web Vulnerability Scanner）、AppScan、Burp Suite、Nessus 等。
　　9.1.2.2 针对 API 的攻击检测
　　面对 API 的威胁，目前使用传统的 API 网关进行防护。比如Kong、Zuul、Orange等都有自己的API安全解决方案
　　. 但是随着应用的云原生特性，出现了很多云原生的API网关，比如Kong、Ambassador、Gloo等，都可以基于Kubernetes进行部署。API网关虽然在一定程度上防御了应用程序的API威胁攻击，但其防护的是南北向流量，服务网格内部的东西向流量检测和防护并没有得到有效缓解。理想的解决方案应该是东西/南北方向的全面检测。
　　针对这一需求，业界已经制定了相应的解决方案，主要是云原生网关和Service Mesh的结合，其中Service Mesh负责东西向流量的检测和保护。对于服务网格，使用主流的 Istio 和 Kong。Kuma 的服务网格。
　　Istio 主要通过其内置的 Envoy 过滤器实现东西流量检测，而 Kuma 则依靠 Kong 的安全插件来实现相应的检测保护。笔者对比了Gloo+Istio、Ambassador+Istio、Kong+Kuma这三种方案的安全能力，比如
　　下表显示：
　　表 9.1 云原生环境下 API 保护方案的安全能力对比
　　|解决方案|Gloo+Istio|Ambassdar+Istio|Kong+Kuma|
　　|防护维度|东/南北|东/南北|东/南北|
　　|WAF支持|支持|支持|支持|
　　|访问控制|支持|支持|支持|
　　|授权机制|支持|支持|支持|
　　|认证机制|支持|支持|支持|
　　|证书管理|支持|支持|支持|
　　|网站锁定|不支持|不支持|不支持|
　　

　　|反爬虫|不支持|不支持|不支持|
　　|机器流量检测|不支持|不支持|支持|
　　|数据丢失防护|支持|不支持|不支持|
　　|CORS|支持|支持|支持|
　　|解决方案||Gloo+Istio|Ambassdar+Istio|Kong+Kuma|
　　|XSS||支持|不支持|不支持|
　　|CSRF||支持|支持|不支持|
　　|DDOS||支持|支持|不支持|
　　|黑白名单限制||支持|支持|支持|
　　|限速||支持|支持|支持|
　　|行为特征分析|AI|不支持|不支持|不支持|
　　|入侵检测||不支持|不支持|不支持|
　　|mTLS||支持|支持|支持|
　　从上表统计来看，Gloo+Istio 方案支持的安全项较多，Kong+Kuma 方案支持的安全项最少。
　　应用业务安全
　　上一篇从网络、应用等层面介绍了微服务面临的威胁。除此之外，微服务架构还面临着很多业务级的安全威胁。这些安全威胁往往影响业务的稳定运行，给业务系统带来经济损失。
　　业务安全问题分析
　　具体来说，应用面临的安全问题主要包括三类，分别是服务频率异常、服务参数异常、服务逻辑异常。我们以一个微服务架构的电子商务系统为例介绍业务安全。电子商务系统的典型流程如图 9.1 所示。
　　图 9.1 电子商务系统业务流程图
　　业务频率异常。频繁调用一个 API 或一组 API。如前所述，业务系统经常使用图形验证码来规避机器人刷机的操作。攻击者可以绕过验证码对应的微服务，直接操作订单，进而实现
　　

　　机器刷单，电商一扫而光。
　　业务参数异常。相关参数通常在 API 调用过程中传递。该参数的取值会根据不同的业务场景有不同的取值范围。例如，商品数量必须是非负整数，价格必须大于0等。如果API对相应参数的监控机制不完善，攻击者往往会通过输入异常参数造成业务系统损失。例如，在一个电子商务系统中，如果只在商品介绍服务中验证商品价格，而在订单管理和支付服务中没有验证商品价格，攻击者可以直接调用订单管理和支付服务的API对订单进行验证。价格修改为0元或负值，给业务系统造成损失。
　　业务逻辑异常。与前两种异常相比，这种异常通常更为隐蔽。攻击者使用某些方法使 API 调用的逻辑顺序异常，包括丢失或颠倒的关键调用步骤。例如，在电子商务系统中，攻击者可以利用该漏洞绕过支付步骤并直接交付订单。这样，就会出现业务逻辑中关键步骤缺失的情况。上述业务频率异常中的验证码绕过异常也是业务逻辑异常。
　　业务异常检测
　　针对上述业务级安全问题，基于基线的异常检测是一种比较有效的方法：首先建立正常业务行为和参数的基线，然后找出偏离基线的异常业务操作。基线的建立需要与业务系统相结合。特点和专家知识共同完成。
　　在电子商务系统中，业务参数基线主要是基于专家知识建立的。例如，商品的价格不仅与商品本身有关，还与时间和各种优惠活动有关。这样的基线需要操作和维护人员持续维护。对于业务逻辑基线的建立，业务系统正式上线后，其运行逻辑一般不会发生很大变化，异常运行的比例较小。因此，可以采集业务系统的历史运行数据，结合统计分析和机器学习的方法，建立业务逻辑基线。与手动方法相比，
　　为此，可以利用6.4.3中分布式跟踪工具采集获取的数据，针对上述三种业务异常场景设计并实现业务异常检测引擎，如图9.2所示。其中，采集模块主要用于采集业务系统的运行数据，训练模块主要用于训练业务系统的历史数据获取行为特征数据，检测模块主要用于对正在运行的业务系统进行异常检测。
　　图 9.2 业务异常检测引擎设计图
　　检测引擎中各部分的具体功能为：
　　分布式跟踪工具。主要是采集微服务业务系统运行时产生的数据。目前常用的开源分布式追踪工具有Jaeger和Skywalking，sidecar也可以采集对应数据。在测试系统上进行了采集实验后，与其他两个采集工具相比，Jaeger能够获取最多的数据字段，检测到最丰富的异常场景。但是，Jaeger 需要在业务系统的源代码中。代码中的检测对开发团队来说更具侵入性。相反，sidecar模式没有代码和镜像的侵入性，但是通过反向代理拦截流量的模式也决定了它无法获取丰富的上下文，比如6.3中的trace API调用关系树（TraceID）。3 无法获得。如何利用侵入性较小的采集工具采集的数据，实现覆盖更多场景的异常检测，还需要大量的后续工作。
　　数据过滤和集成模块。该模块的主要作用是过滤掉数据集中的脏数据，提取出能够代表业务系统行为的数据。在微服务下，能够代表业务系统行为的数据有API调用关系树、服务名、操作名、HTTP POST参数等。
　　数据训练模块。预处理后的历史数据用于通过机器学习或统计方法训练业务系统中的正常行为，生成与业务系统正常行为相匹配的特征数据。这里训练的先验知识是，我们认为业务系统中大量存在的行为是正常行为，数量少的行为是异常行为。在训练过程中，需要根据专家知识对训练结果的检验，不断调整训练模型的参数。
　　检测引擎。将业务系统当前数据与特征数据进行搜索匹配，采用序列相似度计算等方法
　　在特征数据库中找到与当前行为最匹配的特征数据。检测引擎需要比较特征数据和当前数据与基线的相似度。如果比较结果表明当前行为与正常行为的差异在基线限度内，则为正常行为，如果超过基线限度，则判定为异常行为。对于基线，首先要根据专家知识设定一个合理的初始基线，根据不同场景调整基线，或者使用无监督模型调整基线，或者由运维人员手动维护基线。
　　服务网格安全
　　在 3.4 节中，我们已经识别了服务网格的安全风险。本节我们将以 Istio 为例介绍服务网格的安全防护部分。
　　参考
　　绿盟云原生安全技术报告
　　链接
　　GB-T 39786-2021 信息安全技术信息系统密码应用基本要求
　　解决方案:怎么建立蜘蛛池？
　　蜘蛛池关键词在早期的 seo 行业非常流行。那个时候，我们总听说某boss做了一个蜘蛛池，在网站中锁定了大量的蜘蛛。可以说是取之不尽，用之不竭。我们不否认蜘蛛池一开始是有效的，但现在很少有人谈论它。我们认为只有两种情况，一是蜘蛛池无效，二是成本高，那么，如何搭建蜘蛛池呢？
　　1. 程序
　　蜘蛛池以网站模板为基础，制作成不断更新的样式，吸引蜘蛛不断抢网站。这是一个直接销售的蜘蛛池程序，但我们认为它很可能会被搜索引擎识别，因为蜘蛛池程序需要盈利，必须有不止一个出售，所以更容易被识别.
　　2. 战略
　　如果自己搭建，策略要合理使用，比如使用多个域名进行网站相互链接，然后用单个站点作为蜘蛛池程序，组成更大的蜘蛛池，其中蜘蛛池程序需要有自己的显示方法的主要目的是避免搜索引擎的识别。当然，这样做的最终结果是成本太高，使用时间不确定，取决于搜索引擎的识别周期。
　　3.使用
　　因此，我们不建议我们现在使用蜘蛛池进行 SEO。我们还是应该关注如何创造内容，如何提升网站的用户体验，提升网站的价值，自然用户访问量会增加，进而网站的整体质量> 将继续改进。走捷径做seo，现在能实现的概率越来越低。
　　做搜狗蜘蛛池，让SEO更简单。很多SEO优化者都在追求搜狗快收录、快排等捷径！搜狗蜘蛛池，一个既熟悉又陌生的词。我们知道，搜索引擎网页的收录完全依赖于蜘蛛的爬取和爬取。搜狗蜘蛛池使用多个服务器和站点域名，并使用常规内容站点来养大量蜘蛛。它为蜘蛛每天爬行提供了大量的内容。当某些链接需要收录时，将这些链接提交给服务器进入搜狗蜘蛛池，大量蜘蛛会快速抓取这些网址。目前搜狗蜘蛛池对收录有帮助。如果是百万页面的网站，可以考虑使用Spider Pool来提高收录的访问率。
　　蜘蛛池搭建：通常的蜘蛛池程序都是基于大量的站群构建的，主要表现在不同类型的网站上，有的是新闻站群，有的是网站目录站群。因此，蜘蛛池是基于大量网站目录的蜘蛛池。使用网站目录本身对网站有一定的推荐功能，收录的效果非常明显。，这也是搜狗SEO优化人员一直使用蜘蛛池的原因。
　　自动化采集，智能建站站群管理系统，站群软件让建站变得简单，整合数据采集器，轻松发布内容到任何网站。
　　智能换站：智能生成千城、关键词变电站站群，让海量内容推送到搜索引擎，最大化搜索概率。
　　

　　智能推送：每天可以主动向搜狗推送百万链接，同时主动向搜狗推送链接，有效保证新链接能被搜狗收录快速发现，加快百度发现速度，限制主动推送的推送次数。但是使用推送工具后，可以突破官方单站每天200次推送的限制，并且推送后的爬取速度更快，爬取更及时。
　　智能采集：智能采集主站的内容自动更新到子站，保证子站的内容可以不断更新。利用大数据，智能挖掘符合用户搜索习惯的相关关键词，并自动匹配子站，确保搜索引擎首页更多关键词。
　　智能链轮：各个子站相互链接，相互优化，保证网站有足够的内链。智能交换友情链接，吸引蜘蛛爬行，保证网站有足够的外链。
　　智能替换：智能替换分站内容，保证主要分站内容不重复。伪原创用于搜索引擎，适合采集大型网站。系统采用MIP移动加速技术，保证网站的访问速度。
　　目前蜘蛛池对收录还是有帮助的。如果是百万页的网站，可以考虑使用蜘蛛池来提高收录率，但是蜘蛛池的成本不低。蜘蛛池方案：每年几千台左右，站群服务器：每月1000台左右，视量而定，域名：每台20-50台左右，500个域名起。这种利用大平台向搜狗推送大量长尾关键词进行收录和排名，对于吸引蜘蛛收录有很好的促进作用。
　　只需购买蜘蛛池程序，购买好的服务器，并购买数百个域名。
　　谢谢你的邀请：
　　一般小蜘蛛池也要有100+的域名，独立服务器，多ip类型，二级域名都可以。
　　100+的域名一般都能看到效果，可以买其他不如pw的tk之类的。
　　为什么要使用专用服务器？百蜘蛛来的时候，非常吃服务器配置！硬盘驱动器经常飙升到 100%。
　　其实二级域名的效果并不是太明显，因为主站好，二级域名好用！如果您的主域名是垃圾。被二级域名吸引的蜘蛛还是太少，所以推荐使用主域名。
　　蜘蛛池模板需要优化。如果使用蜘蛛池自带的模板，大家都会做的不好。百度蜘蛛虽然是机器，但也能识别，所以要自己改模板。还有，随机文章，建议采集关注热点新闻，很多蜘蛛池都是小说。热门新闻百度蜘蛛喜欢。
　　

　　你需要时间来做一个蜘蛛池。不是说建好了蜘蛛池就可以高枕无忧了。如果你这么想，你的蜘蛛池最终会变得鸡肋。是的，当然，域名越多越好。我说的100+是给你看效果的。
　　不要说服务器IP。IP越多越好，因为都在同一个IP上，搜索引擎会判断你在做什么是站群，对你来说很容易掉。如何让蜘蛛池在短时间内生效，你可以发挥你的力量。前期外推、租用蜘蛛池、二级目录等都是不错的方法，但我强烈建议大家使用暗链中的一种技术（文暗链），暗链不易发现文字暗链是把你的链接放在高权重的网站上面，但是文字颜色设置为和背景颜色一样，这样别人看不到，但是蜘蛛可以爬到，蜘蛛会根据你的文字暗链去你的网站。该方法安全、稳定、有效。注意文字暗链并没有在代码中添加div隐藏或其他隐藏，而是将文字的颜色调整为与背景颜色相同。最好放在导航栏或者文章，效果绝对没话说。
　　也可以考虑过去租个蜘蛛池，给自己的蜘蛛送蜘蛛。. . 这种方法是可耻的。但我发现这是一种蜘蛛新蜘蛛池的好而快捷的方法。
　　首先权衡您自己的时间和资本投资成本。
　　链接池有两种玩法
　　部分是网链，那是因为博客论坛类一开始权重高，收录快，可以很好的引导蜘蛛；
　　另一部分是玩站群。这个投资比链轮高，因为服务器和域名都需要投资，好在做一个独立的IP站点，以防猜疑。有些是国外或香港服务器，不需要记录，网站使用较多的模板，内容通过采集或伪原创传递，如果可以在发布中使用工具，可以使用可以减少劳动力的工具
　　对黑帽了解不多。除非您特别熟悉搜索引擎蜘蛛算法，否则请说实话。
　　谢谢：虽然我听说过这个名字，但之前没有接触过，所以无法判断。如果我个人建议的话，最好用正式的手段来优化排名。效果虽然慢，但出现排名时会有成就。感觉。形式优化永远不会过时。蜘蛛池能用多久还是个未知数，所以推荐给白帽SEO。你知道蜘蛛池，说明你在这个行业有很多经验，对常规方法了如指掌。个人意见仅供参考。白帽SEO从业者山西seo
　　网站外部链接，是真的吗？
　　新做的蜘蛛池免费帮人做，提供知识
　　有人讨论过吗？

细节内容:简历写着熟悉 Dubbo，居然连 Dubbo 线程池监控都不知道？

采集交流 • 优采云发表了文章 • 0 个评论 • 156 次浏览 • 2022-10-29 10:27 • 来自相关话题

细节内容:简历写着熟悉 Dubbo，居然连 Dubbo 线程池监控都不知道？
　　程序员的成长之路
　　互联网/程序员/技术/数据共享
　　专注于
　　阅读这篇文章大约需要 8 分钟。
　　来自：互联网
　　Dubbo 是一个优秀的微服务框架。它以其高性能、易用性、易扩展性被广泛应用于互联网、金融保险、科技公司、制造、零售物流等领域。如今，Dubbo 框架已经成为互联网开发中比较常用的技术框架。
　　在 Dubbo 框架中，当客户端调用服务端时，请求到达服务端后，会有一个专门的线程池来接收参数并进行处理。因此，想要实现 Dubbo 的线程池监控，首先需要了解 Dubbo 底层对于业务线程池的实现原理。
　　Dubbo 底部线程池视图
　　我这里使用的框架是 Dubbo 2.7.8 版本，它通过一个名为 ExecutorRepository 的类来管理底层的线程池，该类负责在 Dubbo 中创建和管理线程池。通过这个扩展接口，我们可以获取到 Dubbo 实际运行的业务线程池对象。
　　具体处理逻辑部分如下：
　　package org.idea.dubbo.monitor.core.collect;
import org.apache.dubbo.common.extension.ExtensionLoader;
import org.apache.dubbo.common.threadpool.manager.DefaultExecutorRepository;
import org.apache.dubbo.common.threadpool.manager.ExecutorRepository;
import java.lang.reflect.Field;
import java.util.concurrent.ConcurrentMap;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.ThreadPoolExecutor;
/**
* @Author idea
* @Date created in 7:04 下午 2022/6/29
*/
public class DubboThreadPoolCollector {
 /**
 * 获取Dubbo的线程池
 * @return
 */
 public static ThreadPoolExecutor getDubboThreadPoolInfo(){
 //dubbo线程池数量监控
 try {
 ExtensionLoader executorRepositoryExtensionLoader = ExtensionLoader.getExtensionLoader(ExecutorRepository.class);
 DefaultExecutorRepository defaultExecutorRepository = (DefaultExecutorRepository) executorRepositoryExtensionLoader.getDefaultExtension();
 Field dataField = defaultExecutorRepository.getClass().getDeclaredField("data");
 dataField.setAccessible(true);
 ConcurrentMap data = (ConcurrentMap) dataField.get(defaultExecutorRepository);
 ConcurrentMap executorServiceConcurrentMap = data.get("java.util.concurrent.ExecutorService");
 //获取到默认的线程池模型
 ThreadPoolExecutor threadPoolExecutor = (ThreadPoolExecutor) executorServiceConcurrentMap.get(9090);
 return threadPoolExecutor;
 } catch (Exception e) {
 e.printStackTrace();
 }
 return null;
 }
}
　　好了，现在我们知道了如何在代码中实时查看 Dubbo 线程池的信息，那么接下来要做的就是如何采集这些线程池的数据，上报，最后上报通过图中显示的统计数据存储的数据。
　　下面，我们将根据采集展示数据，上报，展示三个链接。
　　采集数据
　　在采集的数据部分，有两种方式可以到采集，如下：
　　使用两种不同的模式采集得到的数据可能会有一些差异。以下是两种方法的比较：
　　通过实际业务场景分析，其实第二种方式的性能损失很小，甚至可以忽略不计，所以用这种方式来处理采集数据比较合适。
　　下面我们来看看如何用这种方式实现数据采集。
　　首先我们需要自己定义一个过滤器过滤器：
　　package org.idea.dubbo.monitor.core.filter;
import org.apache.dubbo.common.constants.CommonConstants;
import org.apache.dubbo.common.extension.Activate;
import org.apache.dubbo.rpc.*;
import org.idea.dubbo.monitor.core.DubboMonitorHandler;
import java.util.concurrent.ThreadPoolExecutor;
import static org.idea.dubbo.monitor.core.config.CommonCache.DUBBO_INFO_STORE_CENTER;
/**
* @Author idea
* @Date created in 2:33 下午 2022/7/1
*/
@Activate(group = CommonConstants.PROVIDER)
public class DubboRecordFilter implements Filter {
 @Override
 public Result invoke(Invoker invoker, Invocation invocation) throws RpcException {
 ThreadPoolExecutor threadPoolExecutor = DubboMonitorHandler.getDubboThreadPoolInfo();
 //请求的时候趣统计线程池，当请求量太小的时候，这块的数据可能不准确，但是如果请求量大的话，就接近准确了
 DUBBO_INFO_STORE_CENTER.reportInfo(9090,threadPoolExecutor.getActiveCount(),threadPoolExecutor.getQueue().size());
 return invoker.invoke(invocation);
 }
}
　　DUBBO_INFO_STORE_CENTER 的代码如下所示：
　　并在dubbo的spi配置文件中指定：
　　dubboRecordFilter=org.idea.dubbo.monitor.core.filter.DubboRecordFilter
　　当提供者添加这个过滤器时，如果有请求到达服务器，就会通过这个过滤器触发采集操作。
　　package org.idea.dubbo.monitor.core.collect;
import org.idea.dubbo.monitor.core.bo.DubboInfoStoreBO;
import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;
/**
* Dubbo数据存储中心
*
* @Author idea
* @Date created in 11:15 上午 2022/7/1
*/
public class DubboInfoStoreCenter {
 private static Map dubboInfoStoreBOMap = new ConcurrentHashMap();
 public void reportInfo(Integer port, Integer corePoolSize, Integer queueLength) {
 synchronized (this) {
 DubboInfoStoreBO dubboInfoStoreBO = dubboInfoStoreBOMap.get(port);
 if (dubboInfoStoreBO != null) {
 boolean hasChange = false;
 int currentMaxPoolSize = dubboInfoStoreBO.getMaxCorePoolSize();

 int currentMaxQueueLength = dubboInfoStoreBO.getMaxCorePoolSize();
 if (corePoolSize > currentMaxPoolSize) {
 dubboInfoStoreBO.setMaxCorePoolSize(corePoolSize);
 hasChange = true;
 }
 if (queueLength > currentMaxQueueLength) {
 dubboInfoStoreBO.setMaxQueueLength(queueLength);
 hasChange = true;
 }
 if (hasChange) {
 dubboInfoStoreBOMap.put(port, dubboInfoStoreBO);
 }
 } else {
 dubboInfoStoreBO = new DubboInfoStoreBO();
 dubboInfoStoreBO.setMaxQueueLength(queueLength);
 dubboInfoStoreBO.setMaxCorePoolSize(corePoolSize);
 dubboInfoStoreBOMap.put(port, dubboInfoStoreBO);
 }
 }
 }
 public DubboInfoStoreBO getInfo(Integer port){
 return dubboInfoStoreBOMap.get(port);
 }
 public void cleanInfo(Integer port) {
 dubboInfoStoreBOMap.remove(port);
 }
}
　　注意这个采集类只会保存一段时间的采集数据，然后周期性的重置。
　　这样做的原因是利用这张图统计指定时间段内的最大线程数和队列数，然后在上报存储中心时清除这些峰值数据。
　　关于 DubboInfoStoreCenter 对象的定义，我把它放在了一个叫 CommonCache 的类中，如下：
　　package org.idea.dubbo.monitor.core.config;
import org.idea.dubbo.monitor.core.store.DubboInfoStoreCenter;
/**
* @Author idea
* @Date created in 12:15 下午 2022/7/1
*/
public class CommonCache {
 public static DubboInfoStoreCenter DUBBO_INFO_STORE_CENTER = new DubboInfoStoreCenter();
}
　　所以在上面的过滤器中，我们可以通过静态类引用直接调用它的采集接口。
　　好了，现在作为一个整体，我们实现了过滤器中实时的采集线程池数据，并暂时存储在一个map表中，这个map的数据主要是记录了一段时间的采集器角色内要使用的峰值线程池。
　　那么接下来，我们来看看reporter模块主要是做什么的。
　　报告数据
　　在上报数据之前，最重要的是选择合适的存储组件。首先，要上报的数据量并不大。我们可以将采集的时间设置为15秒，然后设计一个任务给采集每隔15秒上报一次dubbo线程池的数据。那么，一天需要上报 5,760 份报告。如果一次上报并存储一条记录，那么一天需要存储的数据不是很多。
　　另外，存储的业务数据也不需要保存太久。一般存储一周就够了，所以我最终选择了Redis来做这个存储。
　　每次我们实际关注的主要是三个数据字段。我将它们的定义组织成以下对象：
　　package org.idea.dubbo.monitor.core.bo;
/**
* @Author idea
* @Date created in 7:17 下午 2022/6/29
*/
public class ThreadInfoBO {
 private Integer activePoolSize;
 private Integer queueLength;
 private long saveTime;
 public Integer getActivePoolSize() {
 return activePoolSize;
 }
 public void setActivePoolSize(Integer activePoolSize) {
 this.activePoolSize = activePoolSize;
 }
 public Integer getQueueLength() {
 return queueLength;
 }
 public void setQueueLength(Integer queueLength) {
 this.queueLength = queueLength;
 }
 public long getSaveTime() {
 return saveTime;
 }
 public void setSaveTime(long saveTime) {
 this.saveTime = saveTime;
 }
 @Override
 public String toString() {
 return "ThreadInfoBO{" +
 ", queueLength=" + queueLength +
 ", saveTime=" + saveTime +
 '}';
 }
}
　　然后会启动一个线程任务，每隔 15 秒会执行一轮上报数据：
　　package org.idea.dubbo.monitor.core.report;
import com.alibaba.fastjson.JSON;
import org.idea.dubbo.monitor.core.bo.DubboInfoStoreBO;
import org.idea.dubbo.monitor.core.bo.ThreadInfoBO;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.CommandLineRunner;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import static org.idea.dubbo.monitor.core.config.CommonCache.DUBBO_INFO_STORE_CENTER;
/**
* @Author idea
* @Date created in 12:13 下午 2022/7/1

*/
public class DubboInfoReportHandler implements CommandLineRunner {
 @Autowired
 private IReportTemplate reportTemplate;
 private static final Logger LOGGER = LoggerFactory.getLogger(DubboInfoReportHandler.class);
 public static ExecutorService executorService = Executors.newFixedThreadPool(1);
 public static int DUBBO_PORT = 9090;
 @Override
 public void run(String... args) throws Exception {
 executorService.submit(new Runnable() {
 @Override
 public void run() {
 while (true) {
 try {
 Thread.sleep(10000);
 DubboInfoStoreBO dubboInfoStoreBO = DUBBO_INFO_STORE_CENTER.getInfo(DUBBO_PORT);
 ThreadInfoBO threadInfoBO = new ThreadInfoBO();
 threadInfoBO.setSaveTime(System.currentTimeMillis());
 if(dubboInfoStoreBO!=null){
 threadInfoBO.setQueueLength(dubboInfoStoreBO.getMaxQueueLength());
 threadInfoBO.setActivePoolSize(dubboInfoStoreBO.getMaxCorePoolSize());
 } else {
 //这种情况可能是对应的时间段内没有流量请求到provider上
 threadInfoBO.setQueueLength(0);
 threadInfoBO.setActivePoolSize(0);
 }
 //这里是上报器上报数据到redis中
 reportTemplate.reportData(JSON.toJSONString(threadInfoBO));
 //上报之后，这里会重置map中的数据
 DUBBO_INFO_STORE_CENTER.cleanInfo(DUBBO_PORT);
 LOGGER.info(" =========== Dubbo线程池数据上报 =========== ");
 } catch (Exception e) {
 e.printStackTrace();
 }
 }
 }
 });
 }
}
　　这种情况下需要注意的是，Dubbo应用的线程池上报任务要等整个SpringBoot应用启动成功后再触发，否则可能会出现一些数据不准确的情况。所以在定义Bean初始化线程的时候，我选择了CommandLineRunner接口。
　　如果你仔细看代码，你可能会看到这样一个类：
　　org.idea.dubbo.monitor.core.report.IReportTemplate
　　这个类定义了数据报告器的基本动作，下面是它的具体代码：
　　package org.idea.dubbo.monitor.core.report;
/**
* 上报模版
*
* @Author idea
* @Date created in 7:10 下午 2022/6/29
*/
public interface IReportTemplate {
 /**
 * 上报数据
 *
 * @return
 */
 boolean reportData(String json);
}
　　实现类部分如下所示：
　　package org.idea.dubbo.monitor.core.report.impl;
import org.idea.dubbo.monitor.core.report.IReportTemplate;
import org.idea.qiyu.cache.redis.service.IRedisService;
import org.springframework.stereotype.Component;
import javax.annotation.Resource;
import java.time.LocalDate;
import java.util.concurrent.TimeUnit;
/**
* @Author idea
* @Date created in 7:12 下午 2022/6/29
*/
@Component
public class RedisTemplateImpl implements IReportTemplate {
 @Resource
 private IRedisService redisService;
 private static String queueKey = "dubbo:threadpool:info:";
 @Override
 public boolean reportData(String json) {
 redisService.lpush(queueKey + LocalDate.now().toString(), json);
 redisService.expire(queueKey + LocalDate.now().toString(),7, TimeUnit.DAYS);
 return true;
 }
}
　　这里我使用列表结构来存储这些数据指标，设置一个一周的过期时间，最终存储到redis之后的格式如下：
　　数据显示
　　好了，现在我们已经完成了对线程池的监控，我们只需要设计一个管理控制台，从缓存中提取上报的数据并显示页面。
　　实现的逻辑比较简单，只需要定义统计图表所需的数据结构，然后在控制器中返回即可，如下图所示：
　　显示的最终效果如下：
　　随着dubbo接口请求量的变化，统计图可以展示dubbo线程池的数据变化。如果想让统计图实时显示数据，只需要在js中写一个定时调用的函数即可。
　　这里我使用 echart 插件来渲染图表。我选择最简单的统计图表类型。也可以根据自己的具体需求在echart官网选择合适的模型进行渲染。官网地址：
　　推荐文章:织梦主动推送插件-解决网站没有收录，网站关键词没有排名
　　SEO从业者其实每天都挺忙的，不断更新网站内容，寻求更好的外链，思考如何拦截流量，如何争取更好的排名。但是，很多站长都遇到过这个问题。他们努力了几个月，名次在几十位之外徘徊，不知道接下来要做什么。当局是粉丝，旁观者是清楚的。事实上，当我们跳出工作时，我们会发现很多问题。下面博主将与大家分享解决关键词无排名的五项法则。
　　1、搜索引擎主动推送功能的作用是什么？
　　考虑以下两点：
　　1.可以被百度搜索引擎爬虫及时发现
　　如果我们在发布文章后主动将链接提交给百度搜索引擎爬虫，岂不是可以缩短百度搜索引擎爬虫发现你网站新链接的时间？这样，新发布的页面可以最快的时间百度收录。
　　2.还可以保护原创
　　世界文章是大抄袭，你讨厌那些抄袭者吗？明明是我自己写的原创文章，却被别人网站抄了，没什么。但是那些抄袭的文章，他们的排名居然比你高，你不生气吗？
　　3.如何快速创建原创内容
　　使用的织梦采集伪原创百度推送插件只需简单几步即可轻松采集内容数据。对织梦采集执行简单设置。完成后，织梦采集会根据用户设置的关键词将内容和图片进行高精度匹配，可选择保存在本地。您也可以选择伪原创后发布，提供方便快捷的内容采集伪原创发布服务！！
　　
　　和其他织梦采集这个织梦采集相比，基本没有门槛，也不需要花很多时间去学习正则表达式或者html标签，只需一分钟即可上手，只需输入关键词即可实现采集（织梦采集也具备关键词采集的功能)。一路挂断！设置任务自动执行采集伪原创发布和推送任务。
　　几十万个不同的cms网站可以统一管理。一个人维护数百个网站文章更新也不是问题。这类织梦采集发布插件工具也配备了很多SEO功能，通过采集伪原创软件发布时也可以提升很多SEO方面。
　　例如：网站主动推送（让搜索引擎更快发现我们的网站）自动匹配图片（文章如果内容中没有图片，会自动配置相关图片）设置自动下载图片和将它们保存在本地或第三方（让内容不在对方的外部链接中）。自动内链（让搜索引擎更深入地抓取你的链接）、前后插入内容或标题，以及网站内容插入或随机作者、随机阅读等，形成“高原创 ”。定期发布（定期发布文章让搜索引擎准时抓取你的网站内容）
　　这些SEO小功能不仅提高了网站页面原创的度数，还间接提升了网站的收录排名。通过软件工具直接监控管理文章采集发布和百度推送状态，不再需要每天登录网站后台查看。目前博主亲测软件是免费的，可以直接下载使用！
　　二、外链量
　　(1) 质量是否太低？
　　很多朋友每天都需要花费大量的时间在外链的建设上，不管他们的网站和论坛怎么先发链接，久而久之，你的外链其实很脆弱，很多人容易接受外部链接。链上的网站或者论坛，根本就没有被搜索引擎收录大写，甚至很多网站和论坛，不管你发多少外链，都没有更新，无人管理就可以了，这将无济于事。，所以外部链接的质量非常重要。一个好的外链不仅能给你的网站带来好的排名，还能带来流量，所以朋友们在外链的建设中要多注意质量是否足够高。, 没有价值。
　　(2) 数量多还是少？
　　一些SEO从业者在对新站点进行排名时遵循“内容为王，外链为王”，他们都在X宝或某些链接中将网站换成自己的网站。购买数十万个反向链接是没有意义的，甚至是危险的。搜索引擎看到你是一个新站点，一夜之间弹出了数百个反向链接，他们会判断你是在作弊。, 有被 K 的风险。
　　当然，外部链接太少，跟不上节奏，效果不佳。有的朋友的外链建设是三天钓两天晒网。没有规则，也没有圈子。如果你有五个高质量的反向链接，从长远来看，你的网站反向链接的数量和质量都会相当可观，当然排名也会上升。
　　
　　3、内链合理吗？
　　内链是优化网站体验的好方法，目的是满足用户的二次需求，就像加班的电梯扶手旁边为什么放一堆零食，目的就是刺激消费。
　　内部链接的建设一定要有理有据，不能太多也不能太少。从用户体验的角度来看，关键词可以做到哪些，哪些位置最适合做内链，是不是比简单的图文更胜一筹？文字更有吸引力。所有的SEO从业者都需要从用户的角度认真地建立自己的网站内链。分析内链是否合格，可以从跳出率入手。如果你的内链跳出率很高，那么你应该考虑一下内链是否有问题。
　　4. 关键词是否堆叠
　　很多站长把网站关键词散布在网站里面，是为了让自己的网站快速排名，这对于关键词排名不足也很重要杀手，关键词的堆叠对网站内容的语法有一定的影响。其次，搜索引擎也会认为你在作弊。有时候他们不仅不会给你排名，还会用K站来警告你！
　　5. 内容质量
　　“内容为王”这句话是对的，即使你的网站SEO优化不是那么好，但如果你能写出精彩的内容，你的网站流量自然而然，排名更上一层楼必要的。所以不要让自己网站被垃圾文章和一大堆伪原创填满，自己写一些原创的内容，百度蜘蛛喜欢捡新鲜的，只要你能喂它，你的网站必须有排名和流量。
　　6. 网站结构
　　如果以上四项都做好了，那么就需要分析一下你的网站结构是否对SEO优化不友好，比如标题、关键词、描述是否需要改。是不是网站的栏目设置不合理，是不是网站导航的排列有问题，是不是网站的代码太繁琐等等。网站内部结构问题。
　　网站排名由许多因素组成。我们的 SEO 从业者需要从每个细节分析他们的网站问题。. 看完这篇文章，如果觉得不错，不妨采集一下，或者发给需要的朋友同事。关注博主，每天为你展示各种SEO经验，打通你的二线任命和主管！查看全部

细节内容:简历写着熟悉 Dubbo，居然连 Dubbo 线程池监控都不知道？
　　程序员的成长之路
　　互联网/程序员/技术/数据共享
　　专注于
　　阅读这篇文章大约需要 8 分钟。
　　来自：互联网
　　Dubbo 是一个优秀的微服务框架。它以其高性能、易用性、易扩展性被广泛应用于互联网、金融保险、科技公司、制造、零售物流等领域。如今，Dubbo 框架已经成为互联网开发中比较常用的技术框架。
　　在 Dubbo 框架中，当客户端调用服务端时，请求到达服务端后，会有一个专门的线程池来接收参数并进行处理。因此，想要实现 Dubbo 的线程池监控，首先需要了解 Dubbo 底层对于业务线程池的实现原理。
　　Dubbo 底部线程池视图
　　我这里使用的框架是 Dubbo 2.7.8 版本，它通过一个名为 ExecutorRepository 的类来管理底层的线程池，该类负责在 Dubbo 中创建和管理线程池。通过这个扩展接口，我们可以获取到 Dubbo 实际运行的业务线程池对象。
　　具体处理逻辑部分如下：
　　package org.idea.dubbo.monitor.core.collect;
import org.apache.dubbo.common.extension.ExtensionLoader;
import org.apache.dubbo.common.threadpool.manager.DefaultExecutorRepository;
import org.apache.dubbo.common.threadpool.manager.ExecutorRepository;
import java.lang.reflect.Field;
import java.util.concurrent.ConcurrentMap;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.ThreadPoolExecutor;
/**
* @Author idea
* @Date created in 7:04 下午 2022/6/29
*/
public class DubboThreadPoolCollector {
 /**
 * 获取Dubbo的线程池
 * @return
 */
 public static ThreadPoolExecutor getDubboThreadPoolInfo(){
 //dubbo线程池数量监控
 try {
 ExtensionLoader executorRepositoryExtensionLoader = ExtensionLoader.getExtensionLoader(ExecutorRepository.class);
 DefaultExecutorRepository defaultExecutorRepository = (DefaultExecutorRepository) executorRepositoryExtensionLoader.getDefaultExtension();
 Field dataField = defaultExecutorRepository.getClass().getDeclaredField("data");
 dataField.setAccessible(true);
 ConcurrentMap data = (ConcurrentMap) dataField.get(defaultExecutorRepository);
 ConcurrentMap executorServiceConcurrentMap = data.get("java.util.concurrent.ExecutorService");
 //获取到默认的线程池模型
 ThreadPoolExecutor threadPoolExecutor = (ThreadPoolExecutor) executorServiceConcurrentMap.get(9090);
 return threadPoolExecutor;
 } catch (Exception e) {
 e.printStackTrace();
 }
 return null;
 }
}
　　好了，现在我们知道了如何在代码中实时查看 Dubbo 线程池的信息，那么接下来要做的就是如何采集这些线程池的数据，上报，最后上报通过图中显示的统计数据存储的数据。
　　下面，我们将根据采集展示数据，上报，展示三个链接。
　　采集数据
　　在采集的数据部分，有两种方式可以到采集，如下：
　　使用两种不同的模式采集得到的数据可能会有一些差异。以下是两种方法的比较：
　　通过实际业务场景分析，其实第二种方式的性能损失很小，甚至可以忽略不计，所以用这种方式来处理采集数据比较合适。
　　下面我们来看看如何用这种方式实现数据采集。
　　首先我们需要自己定义一个过滤器过滤器：
　　package org.idea.dubbo.monitor.core.filter;
import org.apache.dubbo.common.constants.CommonConstants;
import org.apache.dubbo.common.extension.Activate;
import org.apache.dubbo.rpc.*;
import org.idea.dubbo.monitor.core.DubboMonitorHandler;
import java.util.concurrent.ThreadPoolExecutor;
import static org.idea.dubbo.monitor.core.config.CommonCache.DUBBO_INFO_STORE_CENTER;
/**
* @Author idea
* @Date created in 2:33 下午 2022/7/1
*/
@Activate(group = CommonConstants.PROVIDER)
public class DubboRecordFilter implements Filter {
 @Override
 public Result invoke(Invoker invoker, Invocation invocation) throws RpcException {
 ThreadPoolExecutor threadPoolExecutor = DubboMonitorHandler.getDubboThreadPoolInfo();
 //请求的时候趣统计线程池，当请求量太小的时候，这块的数据可能不准确，但是如果请求量大的话，就接近准确了
 DUBBO_INFO_STORE_CENTER.reportInfo(9090,threadPoolExecutor.getActiveCount(),threadPoolExecutor.getQueue().size());
 return invoker.invoke(invocation);
 }
}
　　DUBBO_INFO_STORE_CENTER 的代码如下所示：
　　并在dubbo的spi配置文件中指定：
　　dubboRecordFilter=org.idea.dubbo.monitor.core.filter.DubboRecordFilter
　　当提供者添加这个过滤器时，如果有请求到达服务器，就会通过这个过滤器触发采集操作。
　　package org.idea.dubbo.monitor.core.collect;
import org.idea.dubbo.monitor.core.bo.DubboInfoStoreBO;
import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;
/**
* Dubbo数据存储中心
*
* @Author idea
* @Date created in 11:15 上午 2022/7/1
*/
public class DubboInfoStoreCenter {
 private static Map dubboInfoStoreBOMap = new ConcurrentHashMap();
 public void reportInfo(Integer port, Integer corePoolSize, Integer queueLength) {
 synchronized (this) {
 DubboInfoStoreBO dubboInfoStoreBO = dubboInfoStoreBOMap.get(port);
 if (dubboInfoStoreBO != null) {
 boolean hasChange = false;
 int currentMaxPoolSize = dubboInfoStoreBO.getMaxCorePoolSize();

int currentMaxQueueLength = dubboInfoStoreBO.getMaxCorePoolSize();
 if (corePoolSize > currentMaxPoolSize) {
 dubboInfoStoreBO.setMaxCorePoolSize(corePoolSize);
 hasChange = true;
 }
 if (queueLength > currentMaxQueueLength) {
 dubboInfoStoreBO.setMaxQueueLength(queueLength);
 hasChange = true;
 }
 if (hasChange) {
 dubboInfoStoreBOMap.put(port, dubboInfoStoreBO);
 }
 } else {
 dubboInfoStoreBO = new DubboInfoStoreBO();
 dubboInfoStoreBO.setMaxQueueLength(queueLength);
 dubboInfoStoreBO.setMaxCorePoolSize(corePoolSize);
 dubboInfoStoreBOMap.put(port, dubboInfoStoreBO);
 }
 }
 }
 public DubboInfoStoreBO getInfo(Integer port){
 return dubboInfoStoreBOMap.get(port);
 }
 public void cleanInfo(Integer port) {
 dubboInfoStoreBOMap.remove(port);
 }
}
　　注意这个采集类只会保存一段时间的采集数据，然后周期性的重置。
　　这样做的原因是利用这张图统计指定时间段内的最大线程数和队列数，然后在上报存储中心时清除这些峰值数据。
　　关于 DubboInfoStoreCenter 对象的定义，我把它放在了一个叫 CommonCache 的类中，如下：
　　package org.idea.dubbo.monitor.core.config;
import org.idea.dubbo.monitor.core.store.DubboInfoStoreCenter;
/**
* @Author idea
* @Date created in 12:15 下午 2022/7/1
*/
public class CommonCache {
 public static DubboInfoStoreCenter DUBBO_INFO_STORE_CENTER = new DubboInfoStoreCenter();
}
　　所以在上面的过滤器中，我们可以通过静态类引用直接调用它的采集接口。
　　好了，现在作为一个整体，我们实现了过滤器中实时的采集线程池数据，并暂时存储在一个map表中，这个map的数据主要是记录了一段时间的采集器角色内要使用的峰值线程池。
　　那么接下来，我们来看看reporter模块主要是做什么的。
　　报告数据
　　在上报数据之前，最重要的是选择合适的存储组件。首先，要上报的数据量并不大。我们可以将采集的时间设置为15秒，然后设计一个任务给采集每隔15秒上报一次dubbo线程池的数据。那么，一天需要上报 5,760 份报告。如果一次上报并存储一条记录，那么一天需要存储的数据不是很多。
　　另外，存储的业务数据也不需要保存太久。一般存储一周就够了，所以我最终选择了Redis来做这个存储。
　　每次我们实际关注的主要是三个数据字段。我将它们的定义组织成以下对象：
　　package org.idea.dubbo.monitor.core.bo;
/**
* @Author idea
* @Date created in 7:17 下午 2022/6/29
*/
public class ThreadInfoBO {
 private Integer activePoolSize;
 private Integer queueLength;
 private long saveTime;
 public Integer getActivePoolSize() {
 return activePoolSize;
 }
 public void setActivePoolSize(Integer activePoolSize) {
 this.activePoolSize = activePoolSize;
 }
 public Integer getQueueLength() {
 return queueLength;
 }
 public void setQueueLength(Integer queueLength) {
 this.queueLength = queueLength;
 }
 public long getSaveTime() {
 return saveTime;
 }
 public void setSaveTime(long saveTime) {
 this.saveTime = saveTime;
 }
 @Override
 public String toString() {
 return "ThreadInfoBO{" +
 ", queueLength=" + queueLength +
 ", saveTime=" + saveTime +
 '}';
 }
}
　　然后会启动一个线程任务，每隔 15 秒会执行一轮上报数据：
　　package org.idea.dubbo.monitor.core.report;
import com.alibaba.fastjson.JSON;
import org.idea.dubbo.monitor.core.bo.DubboInfoStoreBO;
import org.idea.dubbo.monitor.core.bo.ThreadInfoBO;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.CommandLineRunner;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import static org.idea.dubbo.monitor.core.config.CommonCache.DUBBO_INFO_STORE_CENTER;
/**
* @Author idea
* @Date created in 12:13 下午 2022/7/1

*/
public class DubboInfoReportHandler implements CommandLineRunner {
 @Autowired
 private IReportTemplate reportTemplate;
 private static final Logger LOGGER = LoggerFactory.getLogger(DubboInfoReportHandler.class);
 public static ExecutorService executorService = Executors.newFixedThreadPool(1);
 public static int DUBBO_PORT = 9090;
 @Override
 public void run(String... args) throws Exception {
 executorService.submit(new Runnable() {
 @Override
 public void run() {
 while (true) {
 try {
 Thread.sleep(10000);
 DubboInfoStoreBO dubboInfoStoreBO = DUBBO_INFO_STORE_CENTER.getInfo(DUBBO_PORT);
 ThreadInfoBO threadInfoBO = new ThreadInfoBO();
 threadInfoBO.setSaveTime(System.currentTimeMillis());
 if(dubboInfoStoreBO!=null){
 threadInfoBO.setQueueLength(dubboInfoStoreBO.getMaxQueueLength());
 threadInfoBO.setActivePoolSize(dubboInfoStoreBO.getMaxCorePoolSize());
 } else {
 //这种情况可能是对应的时间段内没有流量请求到provider上
 threadInfoBO.setQueueLength(0);
 threadInfoBO.setActivePoolSize(0);
 }
 //这里是上报器上报数据到redis中
 reportTemplate.reportData(JSON.toJSONString(threadInfoBO));
 //上报之后，这里会重置map中的数据
 DUBBO_INFO_STORE_CENTER.cleanInfo(DUBBO_PORT);
 LOGGER.info(" =========== Dubbo线程池数据上报 =========== ");
 } catch (Exception e) {
 e.printStackTrace();
 }
 }
 }
 });
 }
}
　　这种情况下需要注意的是，Dubbo应用的线程池上报任务要等整个SpringBoot应用启动成功后再触发，否则可能会出现一些数据不准确的情况。所以在定义Bean初始化线程的时候，我选择了CommandLineRunner接口。
　　如果你仔细看代码，你可能会看到这样一个类：
　　org.idea.dubbo.monitor.core.report.IReportTemplate
　　这个类定义了数据报告器的基本动作，下面是它的具体代码：
　　package org.idea.dubbo.monitor.core.report;
/**
* 上报模版
*
* @Author idea
* @Date created in 7:10 下午 2022/6/29
*/
public interface IReportTemplate {
 /**
 * 上报数据
 *
 * @return
 */
 boolean reportData(String json);
}
　　实现类部分如下所示：
　　package org.idea.dubbo.monitor.core.report.impl;
import org.idea.dubbo.monitor.core.report.IReportTemplate;
import org.idea.qiyu.cache.redis.service.IRedisService;
import org.springframework.stereotype.Component;
import javax.annotation.Resource;
import java.time.LocalDate;
import java.util.concurrent.TimeUnit;
/**
* @Author idea
* @Date created in 7:12 下午 2022/6/29
*/
@Component
public class RedisTemplateImpl implements IReportTemplate {
 @Resource
 private IRedisService redisService;
 private static String queueKey = "dubbo:threadpool:info:";
 @Override
 public boolean reportData(String json) {
 redisService.lpush(queueKey + LocalDate.now().toString(), json);
 redisService.expire(queueKey + LocalDate.now().toString(),7, TimeUnit.DAYS);
 return true;
 }
}
　　这里我使用列表结构来存储这些数据指标，设置一个一周的过期时间，最终存储到redis之后的格式如下：
　　数据显示
　　好了，现在我们已经完成了对线程池的监控，我们只需要设计一个管理控制台，从缓存中提取上报的数据并显示页面。
　　实现的逻辑比较简单，只需要定义统计图表所需的数据结构，然后在控制器中返回即可，如下图所示：
　　显示的最终效果如下：
　　随着dubbo接口请求量的变化，统计图可以展示dubbo线程池的数据变化。如果想让统计图实时显示数据，只需要在js中写一个定时调用的函数即可。
　　这里我使用 echart 插件来渲染图表。我选择最简单的统计图表类型。也可以根据自己的具体需求在echart官网选择合适的模型进行渲染。官网地址：
　　推荐文章:织梦主动推送插件-解决网站没有收录，网站关键词没有排名
　　SEO从业者其实每天都挺忙的，不断更新网站内容，寻求更好的外链，思考如何拦截流量，如何争取更好的排名。但是，很多站长都遇到过这个问题。他们努力了几个月，名次在几十位之外徘徊，不知道接下来要做什么。当局是粉丝，旁观者是清楚的。事实上，当我们跳出工作时，我们会发现很多问题。下面博主将与大家分享解决关键词无排名的五项法则。
　　1、搜索引擎主动推送功能的作用是什么？
　　考虑以下两点：
　　1.可以被百度搜索引擎爬虫及时发现
　　如果我们在发布文章后主动将链接提交给百度搜索引擎爬虫，岂不是可以缩短百度搜索引擎爬虫发现你网站新链接的时间？这样，新发布的页面可以最快的时间百度收录。
　　2.还可以保护原创
　　世界文章是大抄袭，你讨厌那些抄袭者吗？明明是我自己写的原创文章，却被别人网站抄了，没什么。但是那些抄袭的文章，他们的排名居然比你高，你不生气吗？
　　3.如何快速创建原创内容
　　使用的织梦采集伪原创百度推送插件只需简单几步即可轻松采集内容数据。对织梦采集执行简单设置。完成后，织梦采集会根据用户设置的关键词将内容和图片进行高精度匹配，可选择保存在本地。您也可以选择伪原创后发布，提供方便快捷的内容采集伪原创发布服务！！

　　和其他织梦采集这个织梦采集相比，基本没有门槛，也不需要花很多时间去学习正则表达式或者html标签，只需一分钟即可上手，只需输入关键词即可实现采集（织梦采集也具备关键词采集的功能)。一路挂断！设置任务自动执行采集伪原创发布和推送任务。
　　几十万个不同的cms网站可以统一管理。一个人维护数百个网站文章更新也不是问题。这类织梦采集发布插件工具也配备了很多SEO功能，通过采集伪原创软件发布时也可以提升很多SEO方面。
　　例如：网站主动推送（让搜索引擎更快发现我们的网站）自动匹配图片（文章如果内容中没有图片，会自动配置相关图片）设置自动下载图片和将它们保存在本地或第三方（让内容不在对方的外部链接中）。自动内链（让搜索引擎更深入地抓取你的链接）、前后插入内容或标题，以及网站内容插入或随机作者、随机阅读等，形成“高原创 ”。定期发布（定期发布文章让搜索引擎准时抓取你的网站内容）
　　这些SEO小功能不仅提高了网站页面原创的度数，还间接提升了网站的收录排名。通过软件工具直接监控管理文章采集发布和百度推送状态，不再需要每天登录网站后台查看。目前博主亲测软件是免费的，可以直接下载使用！
　　二、外链量
　　(1) 质量是否太低？
　　很多朋友每天都需要花费大量的时间在外链的建设上，不管他们的网站和论坛怎么先发链接，久而久之，你的外链其实很脆弱，很多人容易接受外部链接。链上的网站或者论坛，根本就没有被搜索引擎收录大写，甚至很多网站和论坛，不管你发多少外链，都没有更新，无人管理就可以了，这将无济于事。，所以外部链接的质量非常重要。一个好的外链不仅能给你的网站带来好的排名，还能带来流量，所以朋友们在外链的建设中要多注意质量是否足够高。, 没有价值。
　　(2) 数量多还是少？
　　一些SEO从业者在对新站点进行排名时遵循“内容为王，外链为王”，他们都在X宝或某些链接中将网站换成自己的网站。购买数十万个反向链接是没有意义的，甚至是危险的。搜索引擎看到你是一个新站点，一夜之间弹出了数百个反向链接，他们会判断你是在作弊。, 有被 K 的风险。
　　当然，外部链接太少，跟不上节奏，效果不佳。有的朋友的外链建设是三天钓两天晒网。没有规则，也没有圈子。如果你有五个高质量的反向链接，从长远来看，你的网站反向链接的数量和质量都会相当可观，当然排名也会上升。
　　

　　3、内链合理吗？
　　内链是优化网站体验的好方法，目的是满足用户的二次需求，就像加班的电梯扶手旁边为什么放一堆零食，目的就是刺激消费。
　　内部链接的建设一定要有理有据，不能太多也不能太少。从用户体验的角度来看，关键词可以做到哪些，哪些位置最适合做内链，是不是比简单的图文更胜一筹？文字更有吸引力。所有的SEO从业者都需要从用户的角度认真地建立自己的网站内链。分析内链是否合格，可以从跳出率入手。如果你的内链跳出率很高，那么你应该考虑一下内链是否有问题。
　　4. 关键词是否堆叠
　　很多站长把网站关键词散布在网站里面，是为了让自己的网站快速排名，这对于关键词排名不足也很重要杀手，关键词的堆叠对网站内容的语法有一定的影响。其次，搜索引擎也会认为你在作弊。有时候他们不仅不会给你排名，还会用K站来警告你！
　　5. 内容质量
　　“内容为王”这句话是对的，即使你的网站SEO优化不是那么好，但如果你能写出精彩的内容，你的网站流量自然而然，排名更上一层楼必要的。所以不要让自己网站被垃圾文章和一大堆伪原创填满，自己写一些原创的内容，百度蜘蛛喜欢捡新鲜的，只要你能喂它，你的网站必须有排名和流量。
　　6. 网站结构
　　如果以上四项都做好了，那么就需要分析一下你的网站结构是否对SEO优化不友好，比如标题、关键词、描述是否需要改。是不是网站的栏目设置不合理，是不是网站导航的排列有问题，是不是网站的代码太繁琐等等。网站内部结构问题。
　　网站排名由许多因素组成。我们的 SEO 从业者需要从每个细节分析他们的网站问题。. 看完这篇文章，如果觉得不错，不妨采集一下，或者发给需要的朋友同事。关注博主，每天为你展示各种SEO经验，打通你的二线任命和主管！

解决方案:SpringCloud 分布式日志采集方案

采集交流 • 优采云发表了文章 • 0 个评论 • 140 次浏览 • 2022-10-28 19:23 • 来自相关话题

　　解决方案:SpringCloud 分布式日志采集方案
　　春云分布式日志记录采集场景
　　IT 架构师联盟
　　2021-12-30 09：59
　　由于微服务体系结构中的每个服务可能分散在不同的服务器上，因此需要分布式日志记录解决方案。春云为跟踪服务提供组件侦查。它可以通过日志获取服务的依赖项。基于侦查，可以通过现有的日志记录工具实现分布式日志记录采集。
　　这里使用ELK，即弹性搜索，对数，基巴纳。
　　I. 侦探
　　第1步：侦探管理结束
　　侦探通常被放置在一个单独的项目中。您需要添加以下依赖项
　　io.zipkin.javagroupId>
　　zipkin-autoconfigure-uiartifactId>
　　运行时作用域>
　　依赖性>
　　io.zipkin.javagroupId>
　　zipkin-serverartifactId>
　　依赖性>
　　配置服务注册表的地址
　　尤里卡：
　　客户：
　　售后服务网址：
　　默认区域：：1111/尤里卡/
　　启动类联接服务发现的批注和 zipkin 的批注，如下所示
　　软件包网站;
　　导入组织弹簧框架，靴子，弹簧应用程序;
　　导入组织：弹簧框架，靴子，自动配置，弹簧靴应用程序;
　　导入组织.弹簧框架工作.cloud.client.discovery.EnableDiscoveryClient;
　　import zipkin.server.EnableZipkinServer;
　　@EnableDiscoveryClient
　　@EnableZipkinServer
　　@SpringBootApplication
　　公共类应用程序 {
　　公共静态空隙主（字符串[] 参数） {
　　弹簧应用程序运行（应用程序.class，参数）;
　　}
　　}
　　此时，微服务的地址已启动并访问，您可以看到zipkin的管理页面
　　步骤 2：托管微服务器
　　我们的其他微服务需要简单的配置并集成到 zipkin 的管理中
　　引入依赖项
　　组织弹簧框架.cloudgroupId>
　　Spring-cloud-starter-sleuthartifactId>
　　依赖性>
　　组织弹簧框架.cloudgroupId>
　　春天-云-侦探-拉链艺术 id>
　　依赖性>
　　添加以下配置
　　春天：
　　侦探：
　　采样：
　　百分比： 1
　　拉链：
　　基地网址：：9411
　　春季.侦探.sampler.百分比：此参数表示获取100%的日志，只有通过抓取日志才能知道依赖关系。但是，如果您始终对日志进行爬网，则会对性能产生影响，因此您可以自己进行配置。一般在开发环境中，该值设置为 1，生产环境视情况而定。
　　春季.zipkin.基网址：为第一步配置的拉链管理微服务的地址
　　现在分别启动服务注册表、网关、所需的微服务和侦查。
　　随意调用微服务
　　
　　打开网易新闻，看看精彩的图片
　　然后我们可以看到相关的跟踪日志
　　打开网易新闻，看看精彩的图片
　　同样，我们也可以看到微服务之间的依赖关系，这里我的服务-消费者-假装微服务是通过
　　网关，然后通过我的服务-消费者-假装微服务调用我的服务提供者微服务
　　打开网易新闻，看看精彩的图片
　　二、打造麋鹿
　　1.弹性搜索的安装和配置，因为之前文章已经引入了弹性搜索的单点，集群的安装，以及头部插件的安装。这里不作总结。
　　2.安装 kibana，无话可说，解压缩并运行它
　　3. 日志的安装可以解压缩
　　在配置下创建新的配置文件
　　输出 {
　　输入 {
　　中文 {
　　端口 => 4560
　　编解码器 => json_lines
　　}
　　}
　　输出 {
　　弹性搜索 {
　　hosts => [“192.168.160.66：9200”，“192.168.160.88：9200”，“192.168.160.166：9200”]
　　索引 => “应用程序”
　　}
　　}
　　其中端口是
　　端口号，编解码器以 JSON 格式表示，弹性搜索.hosts 表示弹性搜索的地址，即集群。
　　首先，您需要调用 bin 下的 logstash 命令，并通过 -f 指定配置文件
　　4. 使用奇巴纳
　　启动弹性搜索、头部、基巴纳和日志
　　创建索引应用日志
　　打开网易新闻，看看精彩的图片
　　将应用程序配置到 Kibana 中，并以索引模式输入我们的应用程序索引
　　打开网易新闻，看看精彩的图片
　　打开网易新闻，看看精彩的图片
　　最后，点击“创建”图标
　　单击菜单中的发现以查看日志
　　打开网易新闻，看看精彩的图片
　　三、日志配置
　　春云和日志存根都支持回溯，因此您需要为微服务配置相应的回溯-弹簧.xml
　　这里值得注意的是，在弹簧启动，对接弹簧中.xml在应用程序.yml之前加载。相反，我们需要在对数弹簧.xml中使用 spring.application.name。因此，我们需要在引导.yml中提及 spring.application.name 配置。
　　加载顺序为 bootstrap.yml， logback-spring.xml， application.yml
　　与正常的对数弹簧.xml相比，我们主要 spring.application.name、对数存根追加器来配置这些东西。
　　提供了一个对数弹簧.xml的示例
　　这里
　　源=“spring.application.name” />
　　值 =“%date [%thread] %-5级别 %logger{36} - %msg%n” />
　　真心>
　　${CONSOLE_LOG_PATTERN}pattern>
　　utf8charset>
　　编码器>
　　
　　追加器>
　　class=“net.logstash.logback.appender.LogstashTcpSocketAppender”>
　　192.168.160.66：4560目的地>
　　北京时间>
　　时间戳>
　　{
　　“严重性”：“%级别”，
　　“service”： “${弹簧应用程序名称：-}”，
　　“trace”： “%X{X-B3-TraceId：-}”，
　　“span”： “%X{X-B3-SpanId：-}”，
　　“可导出”： “%X{X-跨度导出：-}”，
　　“pid”： “${PID：-}”，
　　“线程”： “%线程”，
　　“类”： “%logger{40}”，
　　“休息”： “%消息”
　　}
　　模式>
　　模式>
　　提供程序>
　　编码器>
　　追加器>
　　主目录>
　　main.%d{yyyy-MM-dd}.logFileNamePattern>
　　30最大历史>
　　滚动政策>
　　%d{HH：mm：ss. SSS} [%thread] %-5level %logger{35} - %msg %nPattern>
　　编码器>
　　德布格尔维尔>
　　过滤器>
　　追加器>
　　根>
　　弹簧配置文件>
　　根>
　　弹簧配置文件>
　　配置>
　　我们将消息消息配置到其余字段中。
　　3. 查询日志
　　启动服务注册表、网关、所需的微服务和侦查。
　　例如，启动弹性搜索，头部，kibana，日志，运行任何服务
　　打开网易新闻，看看精彩的图片
　　这里输出一行日志，即我的服务提供者用户控制器的内容，该内容通过网关调用
　　打开网易新闻，看看精彩的图片
　　日食控制台输出日志
　　在基巴纳中搜索日志
　　打开网易新闻，看看精彩的图片
　　我们在 REST 字段中看到日志信息。此外，跟踪和跨度还可以追溯到整个微服务调用过程。此时，整个日志采集已完成。系统上线后，您只需要在弹性搜索中搜索每台服务器上每个微服务的日志内容即可。
　　打开网易新闻，看看精彩的图片
　　2021年十大热门建筑图表
　　一篇10，000字长的文章将带您了解什么是DevOps
　　企业架构与典型设计、业务领域设计
　　数字时代的敏捷架构（下载）。
　　架构基础：深入了解 Linux I/O 系统
　　技巧:介绍下帝国CMS采集关键字设置方法
　　具体操作流程如下：
　　1.系统设置-管理数据表-管理字段-添加字段
　　（字段名称：关键字字段ID：关键词字段类型：字符类型0-255字节长度：70存储表：主表前内容显示：勾选“用换行替换回车”）
　　2.系统设置-管理数据表-管理系统模型-修改-关键词
　　（检查：输入项+提交项+必填项+可添加+修改+采集项+内容模板+搜索项）
　　（在适当的地方插入报名表模板
　　关键词
　　
　　[!--关键词--]
　　)
　　（前台供款表格模板在适当的地方插入
　　关键词
　　[!--关键词--]
　　)
　　3.系统设置-备份/恢复数据-执行SQL语句
　　
　　输入“update phome_ecms_fill in your table name here set keyboard=keywords”
　　4.系统设置-基本设置-系统参数设置-信息设置-相关链接
　　（选择：“标题收录与关键字相同”）
　　5.系统设置-基本设置-数据更新中心
　　（更新“批量更新模型表”+“批量更新相关链接”）
　　总结：以上就是建站技术网为您整理整理的《帝国》关键字设置方法cms采集的全部内容。希望文章可以帮助大家解决帝国介绍cms采集程序开发中遇到的关键字设置方法问题。如果你觉得网站网站的内容还不错，欢迎向你的程序员朋友推荐网站网站。
　　报酬查看全部

　　解决方案:SpringCloud 分布式日志采集方案
　　春云分布式日志记录采集场景
　　IT 架构师联盟
　　2021-12-30 09：59
　　由于微服务体系结构中的每个服务可能分散在不同的服务器上，因此需要分布式日志记录解决方案。春云为跟踪服务提供组件侦查。它可以通过日志获取服务的依赖项。基于侦查，可以通过现有的日志记录工具实现分布式日志记录采集。
　　这里使用ELK，即弹性搜索，对数，基巴纳。
　　I. 侦探
　　第1步：侦探管理结束
　　侦探通常被放置在一个单独的项目中。您需要添加以下依赖项
　　io.zipkin.javagroupId>
　　zipkin-autoconfigure-uiartifactId>
　　运行时作用域>
　　依赖性>
　　io.zipkin.javagroupId>
　　zipkin-serverartifactId>
　　依赖性>
　　配置服务注册表的地址
　　尤里卡：
　　客户：
　　售后服务网址：
　　默认区域：：1111/尤里卡/
　　启动类联接服务发现的批注和 zipkin 的批注，如下所示
　　软件包网站;
　　导入组织弹簧框架，靴子，弹簧应用程序;
　　导入组织：弹簧框架，靴子，自动配置，弹簧靴应用程序;
　　导入组织.弹簧框架工作.cloud.client.discovery.EnableDiscoveryClient;
　　import zipkin.server.EnableZipkinServer;
　　@EnableDiscoveryClient
　　@EnableZipkinServer
　　@SpringBootApplication
　　公共类应用程序 {
　　公共静态空隙主（字符串[] 参数） {
　　弹簧应用程序运行（应用程序.class，参数）;
　　}
　　}
　　此时，微服务的地址已启动并访问，您可以看到zipkin的管理页面
　　步骤 2：托管微服务器
　　我们的其他微服务需要简单的配置并集成到 zipkin 的管理中
　　引入依赖项
　　组织弹簧框架.cloudgroupId>
　　Spring-cloud-starter-sleuthartifactId>
　　依赖性>
　　组织弹簧框架.cloudgroupId>
　　春天-云-侦探-拉链艺术 id>
　　依赖性>
　　添加以下配置
　　春天：
　　侦探：
　　采样：
　　百分比： 1
　　拉链：
　　基地网址：：9411
　　春季.侦探.sampler.百分比：此参数表示获取100%的日志，只有通过抓取日志才能知道依赖关系。但是，如果您始终对日志进行爬网，则会对性能产生影响，因此您可以自己进行配置。一般在开发环境中，该值设置为 1，生产环境视情况而定。
　　春季.zipkin.基网址：为第一步配置的拉链管理微服务的地址
　　现在分别启动服务注册表、网关、所需的微服务和侦查。
　　随意调用微服务
　　

　　打开网易新闻，看看精彩的图片
　　然后我们可以看到相关的跟踪日志
　　打开网易新闻，看看精彩的图片
　　同样，我们也可以看到微服务之间的依赖关系，这里我的服务-消费者-假装微服务是通过
　　网关，然后通过我的服务-消费者-假装微服务调用我的服务提供者微服务
　　打开网易新闻，看看精彩的图片
　　二、打造麋鹿
　　1.弹性搜索的安装和配置，因为之前文章已经引入了弹性搜索的单点，集群的安装，以及头部插件的安装。这里不作总结。
　　2.安装 kibana，无话可说，解压缩并运行它
　　3. 日志的安装可以解压缩
　　在配置下创建新的配置文件
　　输出 {
　　输入 {
　　中文 {
　　端口 => 4560
　　编解码器 => json_lines
　　}
　　}
　　输出 {
　　弹性搜索 {
　　hosts => [“192.168.160.66：9200”，“192.168.160.88：9200”，“192.168.160.166：9200”]
　　索引 => “应用程序”
　　}
　　}
　　其中端口是
　　端口号，编解码器以 JSON 格式表示，弹性搜索.hosts 表示弹性搜索的地址，即集群。
　　首先，您需要调用 bin 下的 logstash 命令，并通过 -f 指定配置文件
　　4. 使用奇巴纳
　　启动弹性搜索、头部、基巴纳和日志
　　创建索引应用日志
　　打开网易新闻，看看精彩的图片
　　将应用程序配置到 Kibana 中，并以索引模式输入我们的应用程序索引
　　打开网易新闻，看看精彩的图片
　　打开网易新闻，看看精彩的图片
　　最后，点击“创建”图标
　　单击菜单中的发现以查看日志
　　打开网易新闻，看看精彩的图片
　　三、日志配置
　　春云和日志存根都支持回溯，因此您需要为微服务配置相应的回溯-弹簧.xml
　　这里值得注意的是，在弹簧启动，对接弹簧中.xml在应用程序.yml之前加载。相反，我们需要在对数弹簧.xml中使用 spring.application.name。因此，我们需要在引导.yml中提及 spring.application.name 配置。
　　加载顺序为 bootstrap.yml， logback-spring.xml， application.yml
　　与正常的对数弹簧.xml相比，我们主要 spring.application.name、对数存根追加器来配置这些东西。
　　提供了一个对数弹簧.xml的示例
　　这里
　　源=“spring.application.name” />
　　值 =“%date [%thread] %-5级别 %logger{36} - %msg%n” />
　　真心>
　　${CONSOLE_LOG_PATTERN}pattern>
　　utf8charset>
　　编码器>
　　

　　追加器>
　　class=“net.logstash.logback.appender.LogstashTcpSocketAppender”>
　　192.168.160.66：4560目的地>
　　北京时间>
　　时间戳>
　　{
　　“严重性”：“%级别”，
　　“service”： “${弹簧应用程序名称：-}”，
　　“trace”： “%X{X-B3-TraceId：-}”，
　　“span”： “%X{X-B3-SpanId：-}”，
　　“可导出”： “%X{X-跨度导出：-}”，
　　“pid”： “${PID：-}”，
　　“线程”： “%线程”，
　　“类”： “%logger{40}”，
　　“休息”： “%消息”
　　}
　　模式>
　　模式>
　　提供程序>
　　编码器>
　　追加器>
　　主目录>
　　main.%d{yyyy-MM-dd}.logFileNamePattern>
　　30最大历史>
　　滚动政策>
　　%d{HH：mm：ss. SSS} [%thread] %-5level %logger{35} - %msg %nPattern>
　　编码器>
　　德布格尔维尔>
　　过滤器>
　　追加器>
　　根>
　　弹簧配置文件>
　　根>
　　弹簧配置文件>
　　配置>
　　我们将消息消息配置到其余字段中。
　　3. 查询日志
　　启动服务注册表、网关、所需的微服务和侦查。
　　例如，启动弹性搜索，头部，kibana，日志，运行任何服务
　　打开网易新闻，看看精彩的图片
　　这里输出一行日志，即我的服务提供者用户控制器的内容，该内容通过网关调用
　　打开网易新闻，看看精彩的图片
　　日食控制台输出日志
　　在基巴纳中搜索日志
　　打开网易新闻，看看精彩的图片
　　我们在 REST 字段中看到日志信息。此外，跟踪和跨度还可以追溯到整个微服务调用过程。此时，整个日志采集已完成。系统上线后，您只需要在弹性搜索中搜索每台服务器上每个微服务的日志内容即可。
　　打开网易新闻，看看精彩的图片
　　2021年十大热门建筑图表
　　一篇10，000字长的文章将带您了解什么是DevOps
　　企业架构与典型设计、业务领域设计
　　数字时代的敏捷架构（下载）。
　　架构基础：深入了解 Linux I/O 系统
　　技巧:介绍下帝国CMS采集关键字设置方法
　　具体操作流程如下：
　　1.系统设置-管理数据表-管理字段-添加字段
　　（字段名称：关键字字段ID：关键词字段类型：字符类型0-255字节长度：70存储表：主表前内容显示：勾选“用换行替换回车”）
　　2.系统设置-管理数据表-管理系统模型-修改-关键词
　　（检查：输入项+提交项+必填项+可添加+修改+采集项+内容模板+搜索项）
　　（在适当的地方插入报名表模板
　　关键词
　　

　　[!--关键词--]
　　)
　　（前台供款表格模板在适当的地方插入
　　关键词
　　[!--关键词--]
　　)
　　3.系统设置-备份/恢复数据-执行SQL语句
　　

　　输入“update phome_ecms_fill in your table name here set keyboard=keywords”
　　4.系统设置-基本设置-系统参数设置-信息设置-相关链接
　　（选择：“标题收录与关键字相同”）
　　5.系统设置-基本设置-数据更新中心
　　（更新“批量更新模型表”+“批量更新相关链接”）
　　总结：以上就是建站技术网为您整理整理的《帝国》关键字设置方法cms采集的全部内容。希望文章可以帮助大家解决帝国介绍cms采集程序开发中遇到的关键字设置方法问题。如果你觉得网站网站的内容还不错，欢迎向你的程序员朋友推荐网站网站。
　　报酬

解决方案:国内没有优秀的网站和技术提供了给你机会

采集交流 • 优采云发表了文章 • 0 个评论 • 446 次浏览 • 2022-10-28 08:18 • 来自相关话题

　　解决方案:国内没有优秀的网站和技术提供了给你机会
　　文章采集调用直接用api,可以去黄牛调采集，效率高，配置比较少，适合小白。想快速部署可以用黄牛采集来集成自己的程序。
　　这个就不得不提到百度了，呵呵，yahoo也是一样的，没有随意丢弃，
　　国内没有垄断性的资源和技术导致的结果，没有产品的规划，没有casebycase的去做。特别是做搜索业务的，单纯依靠机器学习、深度学习、db，效果不一定好。
　　
　　国内没有优秀的网站和技术提供了给你机会，如同你的网站本身就是海大虾的一个点，别人没法产生大量点。比如国内一定要使用cdn技术，又比如canonical等等，这都是中小网站被使用后收益上去，才进入专业的网站。
　　让每个人都能拿到优惠券。
　　目前百度蜘蛛还不支持采集呢...
　　国内目前不是特别方便，即使有的话，
　　
　　个人观点：1，是否具有c2c及小b站采集的基础？2，不同层次用户的受众需求点是否有明显差异，比如：如何解决点到为止？3，是否需要其他功能，如商家门户？综上：产品设计确定性需求点，有序发展！ps：没想到，接到知乎邀请的时候，有特别的感慨。百度分享可以更方便了，不过，
　　专门改一篇博客来回答这个问题。-bug.html一，为什么采集这么贵？——客户端和终端接收信息时用户体验不好。注意看一下，移动端、pc端与以往的web端的信息是基本不同的。对比来看，移动端用户每个页面的点击次数相比电脑端较低，由于用户看标题的习惯不同，用户通常更注重标题内容不看链接内容，所以以往收集的点击率要大大低于以往web端。
　　以上在两种产品中都有验证，点击率不仅是纯属注意力放在内容上导致的效率，也有不足道的地方，客户端的上传只支持一个文件，终端在收集和上传时都必须得联网。就意味着终端需要不停地点击，再上传，而客户端如果你不能适应它的快速点击而崩溃的话，就得吃bug亏了。二，是否有价值？——价值还是有，无非是人家不会分享罢了！1，是否有形成竞争吗？有的话，由于现在行业竞争基本上已经过半了，产品竞争力已经开始倾向于同质化、毛利化了，所以大家知道企业生产产品就是靠用户的注意力赚钱。
　　谁的产品有趣、有特色、或者带来了一个流量入口，谁就有市场。所以，最终的竞争的价值取决于谁对这个注意力入口有多需要。2，谁的产品与竞争对手有差异化、在用户心中占据创新优势的地位？这里要考虑的是竞争对手的定位，毕竟竞争对手可以对这个产品提出一些改良、优化建议的话，那这个竞争对。查看全部

　　解决方案:国内没有优秀的网站和技术提供了给你机会
　　文章采集调用直接用api,可以去黄牛调采集，效率高，配置比较少，适合小白。想快速部署可以用黄牛采集来集成自己的程序。
　　这个就不得不提到百度了，呵呵，yahoo也是一样的，没有随意丢弃，
　　国内没有垄断性的资源和技术导致的结果，没有产品的规划，没有casebycase的去做。特别是做搜索业务的，单纯依靠机器学习、深度学习、db，效果不一定好。
　　

　　国内没有优秀的网站和技术提供了给你机会，如同你的网站本身就是海大虾的一个点，别人没法产生大量点。比如国内一定要使用cdn技术，又比如canonical等等，这都是中小网站被使用后收益上去，才进入专业的网站。
　　让每个人都能拿到优惠券。
　　目前百度蜘蛛还不支持采集呢...
　　国内目前不是特别方便，即使有的话，
　　

　　个人观点：1，是否具有c2c及小b站采集的基础？2，不同层次用户的受众需求点是否有明显差异，比如：如何解决点到为止？3，是否需要其他功能，如商家门户？综上：产品设计确定性需求点，有序发展！ps：没想到，接到知乎邀请的时候，有特别的感慨。百度分享可以更方便了，不过，
　　专门改一篇博客来回答这个问题。-bug.html一，为什么采集这么贵？——客户端和终端接收信息时用户体验不好。注意看一下，移动端、pc端与以往的web端的信息是基本不同的。对比来看，移动端用户每个页面的点击次数相比电脑端较低，由于用户看标题的习惯不同，用户通常更注重标题内容不看链接内容，所以以往收集的点击率要大大低于以往web端。
　　以上在两种产品中都有验证，点击率不仅是纯属注意力放在内容上导致的效率，也有不足道的地方，客户端的上传只支持一个文件，终端在收集和上传时都必须得联网。就意味着终端需要不停地点击，再上传，而客户端如果你不能适应它的快速点击而崩溃的话，就得吃bug亏了。二，是否有价值？——价值还是有，无非是人家不会分享罢了！1，是否有形成竞争吗？有的话，由于现在行业竞争基本上已经过半了，产品竞争力已经开始倾向于同质化、毛利化了，所以大家知道企业生产产品就是靠用户的注意力赚钱。
　　谁的产品有趣、有特色、或者带来了一个流量入口，谁就有市场。所以，最终的竞争的价值取决于谁对这个注意力入口有多需要。2，谁的产品与竞争对手有差异化、在用户心中占据创新优势的地位？这里要考虑的是竞争对手的定位，毕竟竞争对手可以对这个产品提出一些改良、优化建议的话，那这个竞争对。

文章采集调用

话题描述

相关话题

最佳回复者

1 人关注该话题