解决方案:XYCMS教育培训学校建站系统 v2.6
优采云 发布时间: 2022-11-25 21:27解决方案:XYCMS教育培训学校建站系统 v2.6
XYCMS教育培训学校网站采用ASP+ACCESS开发,经过严格的多级测试,前后台源代码完整无误!
XYCMS教育培训学校网站V2.6---->V2.0更新内容:
1、修复后台添加新闻后跳转的bug。
2.修复后台左侧导航栏兼容性问题
XYCMS教育培训学校网站功能简述:
学校信息管理:包括基本信息管理、学生网上报名信息管理、问答中心信息管理
新闻中心管理:管理新闻信息内容、管理相关分类、增删改查
教师团队管理:管理团队成员和上传缩略图
" />
学习资料管理:网站下载资料管理,可进行添加、修改、删除等相关操作
开课信息管理:发布一些最新的开课信息,可以修改和删除
学生作品管理:添加学生作品信息,上传缩略图,修改删除操作
招聘信息管理:发布部分最新招聘信息
就业指导信息管理:发布一些就业指导信息,可以修改和删除
招生简章信息管理:发布部分招生简章信息,可修改删除
培训项目信息管理:介绍学校培训课程、培训项目,后台可修改删除
广告管理:添加广告信息,后台管理
*敏*感*词*管理:发布部分*敏*感*词*信息,并上传缩略图
" />
系统设置:设置与系统相关的基本信息,如网站名称、企业信息等基本信息。可以管理是否关闭网站,是否审核注册,是否审核留言
LOGO/图片图片管理:首页LOGO管理,可以设置长宽
安全管理:查看相关非法操作记录,查询攻击IP地址,自动封IP,管理SQL信息
安全设置:根据需要设置一些安全过滤信息
首页菜单管理:可以增删菜单信息,打开窗口,是否显示,是头部导航还是底部导航栏
管理员管理:对超级管理员信息进行管理,可以进行添加、删除、修改等操作
后台登录目录:admin/
用户名、密码:均为admin
后台路径:admin/,用户名,密码:admin
解决方案:潘云凤:哈啰智能创意项目的系统架构与实现
01
智能创意商业背景
首先简要介绍行业现状,然后介绍哈啰的业务特点和能力部署。
一、经营情况
以淘宝、拼多多等APP的营销广告为例。对于同一个用户的同一个广告活动,文案、引导按钮、背景图片的样式和颜色都随着每次请求而不断变化,即展示在用户面前。创造力是一种经过时间磨练的创造力。这样的丰富已经不是手工设计能满足的了。而是通过算法对创意元素进行混合排序,准确捕捉和预测用户的内容兴趣。
行业内的智能创意项目大致可以归纳为三个部分。
① 内容生成
对于内部营销和广告,如果只能靠人工设计和创意,素材库会非常稀缺,用户疲劳度高,设计成本高。你好正面临这样的情况。内容生成技术可以总结如下:
seq2seq 结构广泛用于机器翻译和标题生成等任务。原创
模型是由两个 RNN 组成的编码器-*敏*感*词*框架。编码器部分将有序的句子按照时间编码成隐层向量,然后汇总生成中间语义向量。Decoder是它的逆过程,一个一个预测下一个词。该模型的准确率依赖于中间语义向量的信息,对长句的预测不友好。因此,注意力可以用来寻找预测中权重更高的词。
vae模型也是基于encoder-decoder结构。不同之处在于该结构使用浅层学习模型。与seq2seq等判别模型相比,生成模型旨在生成与原创
数据具有相同分布的样本。如果场景对生成文本的多样性要求高,可以选择vae模型。
结合了*敏*感*词*和判别器的优点,GAN 在很长一段时间内(在预训练模型出现之前)成为生成任务的主流。原则上,判别器负责对样本进行分类,而*敏*感*词*则负责生成接近真实数据分布的样本,用来“欺骗”判别器。但实际上GAN的训练难度大,难以收敛,可能会出现梯度消失等问题。
由于无标签数据相对容易获取,使用预训练模型训练出相对优秀的初始值,然后对下游任务进行fine-tune已经成为目前NLP任务的主流形式,超大型预训练模型GPT等应运而生。预训练模型应用简单,效果显着,所以哈尔滨选择了这个模型来生成创意素材。
② 内容理解
这部分的概念很宽泛,其目的可以狭义地理解为对素材的提取和抽象。技术方法也非常广泛,包括文本图像分类、图像质量检测、视频质量检测和各种嵌入提取技术。哈尔滨内部创作素材多为文字或图片,所以我们没有视频质量检测环节。
③创意优化
有了足够多的想法,将想法提炼、提炼出来后,需要精准的分发给每个用户。这部分技术与推荐系统有较大的重叠,主要使用了ctr预估模型和冷启动优化策略。
2. 智慧创意业务的特点
哈尔滨在终端(横幅、弹窗)和外部终端(推送、短信)中应用智能创意。样式繁多,但内容却有非常鲜明的特点:
当用户点击广告banner时,会跳转到二级页面(活动登陆页面,业务线首页)。存在的问题是,如果算法针对每条业务线定制ideas,工作量会很大,因此smart ideas迫切需要一个平台化的系统来覆盖各个场景的业务。
3. 我们做了什么
聪明的想法项目有两个目的:
工作内容分为四个部分:
--
02
体系结构
第二部分是产品架构和算法架构。
终端内的广告投放系统和终端外的短信投放系统将运用智能创意。它涉及许多业务领域。目前已达到单车、助力车、顺风车、*敏*感*词*等九大业务线,兼容几乎所有的Ports(安卓、ios支付宝小程序、微信小程序和h5页面等)。
" />
上图是创意平台的整体链接图,橙色部分是算法部分的工作。创意文案特征标签提取、素材库场景调取、用户内容画像创作、创意赛马模型。
--
03
系统构建
1.素材库
我们将图片库和文案库统一管理在一个素材库中,设计一些访问机制,并提供文案推荐工具辅助创意设计的运营。
2.标签肖像
我们构建了一个标签库来优化表示副本。这些标签可以用作召回和排名模型中的特征,也可以在合规案例中结合用户兴趣向用户展示。
3.内容标注
当一种新材料进入材料库时,我们需要对其进行分类。
我们首先需要了解什么是小样本迁移学习。立项之初,我能拿到的广告样本数量很少,可能只有几千个,而且还收录
很多内容样本,同质性非常高,属于典型的小样本。为了充分利用业界现有的*敏*感*词*模型预训练知识,我们需要进行迁移学习。迁移学习的三种方式:
①业务背景
hello 内容标签的业务背景与 ugc 内容类别不同。ugc内容是用户生成的内容,而我们需要标注的是内部广告。标注的维度往往是抽象的,与场景有很强的相关性。比如根据场景,广告会分为新人、召回、促销等,根据兴趣又分为买卡、优惠券、积分、红包。有美食、生活、旅游等等。类别标注主要用于召回模型和后续排序模型的特征库构建。
② 选型
我选择了 Google 的 albert 预训练模型进行微调。albert模型一般被认为是轻量级的bert。bert其实就是transformer的encoder部分。它有一个12层的神经网络,是一个深而窄的模型。我们知道bert模型本身并不是分类器。我们现在将其用于类别内容标签。与其用bert模型做分类,不如用bert模型做特征向量提取器,后面跟着分类器做分类。建模过程如下:
将中文样本转化为token列表,再结合tag、地理位置等信息组成训练样本。进入transformer encoder层,然后得到token vectors(单个词的向量表示),当然我们也可以取bert的CLS向量表示。在我的项目中,这两种方式在效果上没有明显区别。然后接一个全连接层,再接一个softmax,得到多分类的结果。如果你需要用多属性标记副本,那么你需要使用多标签分类。其网络结构与多分类基本相同。你只需要做一些小的调整,将交叉熵从 softmax 更改为 sigmoid,然后将输出概率更改为 sigmoid。
③建模难点
建模的难点主要是短文本。刚才大家可以看到,我们的广告内容基本都在11个字符以内,也就是说分类难度比较高,所以理想情况下,可以用模型做一个end-to-end的分类。但之后我们还是采取了一些策略,最终的分类准确率基本可以稳定在95%左右。
4.召回策略
①业务线召回。同一业务线常用的文案会被召回,但这些文案的适用性不高。由于同一业务线的共同文案可能属于不同的活动,需要运营人员手动添加或删除。
②类别回忆。因为我们的系统是面向操作的,所以我们允许操作来操作我们的算法结果。因此,当我们标记完所有内容后,就可以调出指定类别的文案了。
③顶部召回。点击率高,但疲劳后容易被模型降级。
③手动配置召回。并不是所有的广告,算法都能提前得到它的详细内容,所以一些时效性强的任务,比如通知任务,可能还是需要手动配置文案,所以我们也增加了手动配置的入口。
5.创意赛马模型
①商业背景。创意赛马模式的商业背景是为用户优化最适合的创意元素。
" />
②型号选择。主要采用ctr预估中常用的gbm模型。同时对于新点子,我们采用了E&E探索的机制,即新点子有一定的概率被推荐,概率与用户的点击和曝光(正负反馈)相关。
③建模困难。缺乏创意维度特征,创意特征不易描述。我们不是电商行业,所以广告素材没有自己的产品属性,也不容易自动采集。我们只能依靠手动配置。立项之初,我们只是特征化了创意ID等一些基本信息,召回的次数比较少。经过严格的合规审查,最终只能召回几十条甚至十几条广告。
为什么要使用树模型?可能大家觉得树模型有点低,或者为什么不使用深度模型,因为智能创意平台处于0~1的构建阶段,在布局量的过程中qps变化很大,并且深度模型的开销使得算法不得不做相应的调整。做一些性能调优,深度模型会在以后的迭代中考虑。
如果被召回的广告太少怎么办?我为热点和自下而上的项目设计了可靠的召回机制。在保证用户体验的前提下,我尽量召回,我会定期回顾监控数据,对召回策略做出相应的修正。这就给操作学员留下了灵活的操作范围。算法成熟后,算法的有效性将逐步放大。
上图主要介绍了特征处理的工作。一开始创意维度的特征只有创意id,其他的没有埋没在集合中。后来得到了资源的id,业务线的特征,图片的id,文案的内容。我们采用多模态特征提取的方法,得到广告文案和图片的向量表示。这些特征变成了比较重要的特征,然后会做一些交集,主要是用户行为和创意维度的交集。窗口的行为顺序特征。
6.系统显示
下面是智能创意系统的演示。因为系统是内部的,所以在前端并没有特别吸引人的地方,但是该有的功能都有了。现在我们可以看到操作调整的粒度是非常灵活的。可以调整任意文案元素的颜色粗细等配置,然后还可以选择一些动态词包给用户发送通知和广告文案,甚至可以使用文案推荐功能来扩大文案数量回忆,从而为文案优化带来更大的空间。这套东西建成之后,可以说我们实现了一个全自动的贴标、存储、配送系统。
然后说说效果。该系统已在各业务线分别进行测试,充分验证和价值计算后上线使用。
橙色是算法的效果,可以看出提升幅度在200~300%。因为我们是按业务线和任务来测试的,所以指标的跨度比较大,但是基本上都得到了提升。目前该系统可覆盖9条业务线60%的流量,已成为我们主流的投放方式之一。功能基本涵盖所有风格、所有端口、所有表现形式。那么在营收增长方面,我们主要统计了两轮的卡售广告营收增长,单次UV营收增长了32%左右,还是非常明显的。
--
04
一点点想法
第一点,我们没有解决物资匮乏的问题。如果材料只有几千块怎么办?未来可能会进行一些文本生成工作,但我们不会特别积极地进行全自动化生成。我们可能会先在一些业务线尝试一下,因为文本生成对句子的流畅度要求非常高。低资源场景下的短文本生成是目前业界的难题。我们只能选择一些电商场景来尝试,比如酒店业务,可能会生成/提取一些产品标题来提高产品转化率,或者提取一些属性标签。方便用户按各种维度筛选。
第二点,虽然我们使用了copywriting embedding和image embedding的一些特征,但是用户和创意的交集不够,没有很好的描述创意维度的特征,缺乏从中提取元素信息的能力广告的整个图像。我需要进一步学习。
低三分,图片同质化很严重,除了人工审核没有更靠谱的审核机制。当我们的图片素材丰富的时候,一定要有图片分类和算法质量测试的能力。这些方向的迭代可能会在以后进行。
--
05
问答
Q1:pre-train在当前样本量下是否有效?
A1:我之前也尝试过一些基线模型。与预训练模型相比,那些基线模型明显优于预训练模型。大家可以看到我的文字内容并不少见,还是一些常用的句子。所以我选择的coverage应该够用,至少token的coverage要够用。之前也尝试过textcnn等一些baseline方法,bert模型还是会有所提升。
Q2:文案、图片等创意素材是否由运营上传?有没有对应的生成工具能力?您是否尝试过对图像素材进行特征提取?
A1:图片素材确实是运营上传的。这是以后迭代的方向。我们仍然无法实现自动生成图片的能力。
运行中会有一些历史模板,但是我们会对历史模板进行一些处理,比如我们会在模板中填充一些动态词包,对模板中的词进行改写。这些能力是可用的。但是如果你说的是那种自动生成,完全依赖语料生成,我们目前已经做了一些尝试,但是流畅度还达不到直投的要求,所以以后会在这方面做进一步的开发.
对于图像素材的特征提取,我们简单的使用计算机视觉模型得到图像的embedding,但是可以说也是一个baseline模型,只是没有赋予计算机视觉特别强大的能力。也是我刚才说的滞后的一个方向。因为我不是搞cv的,以后可能会用到计算机视觉的一些能力来提取图像特征。
Q3:smart ideas运营介入的时间点是在idea generation模型运行之前,还是在模型运行之后?操作在其中的作用和作用是什么?
A3:里面有两个最大的操作功能。第一个功能是配置活动,即一个广告任务不仅有展示的文案和图片,还需要对内部落地页进行操作和配置。所以一开始需要配置一些活动权限。需要选择启用算法,算法会自动调用一些模板。当然,如果他要加一些材料,等我们的模型生成之后,他就会加进去。我们模型生成的东西会落到素材库里,然后让操作者选择;操作人员也可以手动编写一些模板,放到素材库中,这些都会落到素材库中,以后可以重复使用。所以,
Q4:模型标注过程是为了预估广告素材的点击率吗?
A4:内容标注流程的作用之一就是可以为后期的排序提供一些特征。比如我们可以把它的分类放到排序模型中。它还在召回策略中起着关键作用。比如运营的任务指标是吸引新用户,那么他就需要选择一些相关的标签作为召回,这样展示的文案才能更符合业务目标。