解决方案:【浙商互联网】AIGC之AI绘画: 技术与应用双突破,生产力变革在即

优采云 发布时间: 2022-11-24 00:33

  解决方案:【浙商互联网】AIGC之AI绘画: 技术与应用双突破,生产力变革在即

  投资要点

  AI绘画是AIGC的一个重要应用分支。近两年,扩散模型等关键技术取得突破,技术实用性显着提升,技术向生产力转化的机遇出现。随着Stable Diffusion等应用破圈,用户接受度和参与度不断提高,适用行业不断扩大。B端和AIGC+3D未来的商业化潜力值得期待。

  □发展进入快车道,迎来向生产力转变的拐点

  2022年被称为AIGC元年。8月,参赛者凭借AI绘画《太空歌剧院》获得科罗拉多州无绘画基础新锐数字艺术家大赛一等奖,引发热议。Stable Diffusion、Midjourney等AI绘画应用将这项技术推向了民用领域,输出效果在几个月内得到了直观的提升。被设计师和游戏工作室广泛用于辅助制作,生产力革命即将来临。

  □ 关键技术取得突破,图像生成效率显着提升

  AI绘画基于深度学习技术。生成对抗网络GAN配合可比语言-图像预训练算法CLIP,解决跨模态问题,支持文本生成图像;而AI绘画的实际操作可以分为四个步骤:加噪、去噪、还原图片和绘画。随着图像遮罩建模MIM、特征处理器Transformer、扩散模型Diffusion Model和神经辐射场NeRF的出现,在以上四个环节发挥作用,AI“作画功力”得到显着提升。未来,我们预计深度学习领域有两大趋势:大模型和通用人工智能。

  □商业化前景广阔,B端、3D或成突破口

  AI绘画产品不断丰富,体验不断提升,已经拥有良好的用户基础。但目前AI绘画产品的营收或利润都很少,相关产品目前的变现方式也比较单一。对于普通C端用户来说,缺乏更高性价比的商业应用场景,付费意愿不强。现有的赋能收费项目侧重于为速度或增加清晰度付费,变相弥补现有的使用限制。我们相信:

  □产业链初具规模,上下游已成蓝海

  在产业链层面,AI绘画涉及硬件、NLP、算法算力、应用、数据提供和处理等多个环节。开发蓝海领域。

  具体到投资标的:

  □风险提示

  1)AI绘画相关技术发展不尽如人意;2)商业化扩张的进度和效果不及预期;3)AI绘画涉及的作品侵权、明星肖像侵权风险。

  文本

  1 发展进入快车道,迎来向生产力转变的拐点

  1.1 AI绘画是AIGC的重要应用分支

  AIGC不仅是一种内容分类方法,也是一种内容生产方法,或者说是内容自动生成技术的集合。AIGC全称Al-Generated Content,是指基于生成对抗网络GAN和*敏*感*词*预训练模型等人工智能技术,通过现有数据寻找规则,通过生成相关内容的生产方式。适当的泛化能力。

  AIGC作为一种全新的内容生产方式,潜力无限,我们目前正处于向AIGC的过渡阶段。根据a16z的说法,内容生态的发展可以分为四个阶段:Professional-Generated Content (PGC)、User-Generated Content (UGC),以及AI辅助生成内容和AI生成内容(AI-Generated Content,AIGC) ). 目前我们还是以一、二阶段为主,三阶段为辅的局面。

  最常见的是按模态划分 AIGC。AIGC可以分为音频生成、文本生成、图像生成、视频生成以及图像、视频和文本之间的跨模态生成。其中,跨模态生成需要重点关注。事实上,通用人工智能(AGI)概念的出现,反映了很多人工智能界人士认为,未来人工智能的基础模型将是跨模态的,也就是使用相同的模型用于生成不同类型的内容,包括但不限于文本、图像、视频等。

  AI绘画是AIGC的一个重要应用分支。在AI绘画工具中,用户可以通过输入不同的词汇,如不同的艺术家风格、构图、颜色、透视法和修饰符,得到相应的画作。目前,相关生成工具比较成熟,使用方便,生成结果直观,易于传播。一些成果在效率和质量上都有不错的表现,着实打动了广大内容生产者和消费者,进入了主流视野。

  上图是AI绘画领域的一个标志性事件。2022年8月,在美国科罗拉多州举办的新兴数字艺术家大赛中,参赛者提交了AIGC画作《太空歌剧院》。荣获大赛“数码艺术/数码修图”组别一等奖,引发热议。

  1.2 从今年起,按下AIGC发展的加速键

  PGC和UGC的发展给我们带来了内容生产和消费前所未有的繁荣。AIGC的崛起是生产力创新的结果,也是从消费者的实际需求中诞生的。它具有广阔的想象空间和重大的意义。

  我们将AIGC的发展分为四个阶段:

  早期萌芽期:AIGC现阶段仅限于小规模实验。在 20 世纪 80 年代中期,IBM 基于隐马尔可夫模型 (HMM) 创建了声控打字“Tangora”。虽然对AIGC进行了一些初步的尝试,但由于种种因素,实际产出的效果与智能内容创作的水平相去甚远。

  沉淀积累期:AIGC逐渐从实验走向实用。软件方面,2006年深度学习算法取得重大突破;硬件方面,图形处理单元(GPU)、张量处理单元(TPU)等算力设备性能持续提升;在数据方面,互联网使用数据规模的迅速扩大,为各种人工智能算法提供海量训练数据,使人工智能的发展取得了重大进展。2007年,纽约大学人工智能研究员罗斯古德温组装的人工智能系统写下了世界' 首部完全由人工智能创作的小说,通过记录和感知公路旅行中的所见所闻。2012年,微软公开展示了一款全自动同声传译系统。它基于深度神经网络(DNN),通过语音识别、语言翻译、语音合成等技术,将英语说话人的内容自动生成中文语音。

  快速发展期:众多关键模式已经形成,形成规模基础。2017年,AI图像生成、唇型视频自动生成、图像高清化、图像编辑、图像风格迁移、wavnet语音合成等技术快速发展。2018年出现了预训练语言模型,减少了标注的需要和成本。2019年,随着生成对抗网络(GAN)的逐渐成熟,AIGC技术研究迎来关键拐点。DeepMind发布了DVD-GAN模型生成连续视频,在草地、广场等清晰场景中表现良好。. 2020年,自监督学习将成为行业主流,模型的规模和复杂度将不断增加。其中Open AI发布的CPT3很有代表性。

  腾飞破圈期:AIGC概念伴随AI绘画应用出圈。2022年,技术上扩散生成模型将得到广泛研究和应用,文本生成图像模型可以准确把握文本信息进行创作。商业化基础已经初步建立,*敏*感*词*互联网巨头和独角兽已经走到尽头。Open AI更新了DALL-E-2,可以创建相应的极优质卡通、写实、抽象等多种画风。正是Stability.ai推出的Stable Diffusion,最终将AIGC的创建推向了普通人。可由个人电脑驱动,输出效果将在数月内直观提升。

  1.3 将技术转化为生产力的机会

  2022年被称为AIGC元年。这一年,AIGC取得了里程碑式的成果,引起了市场广泛而热烈的关注。我们认为主要因素有:

  2 关键技术取得突破,图像生成效率显着提升

  2.1 GAN+CLIP解决跨模态问题

  2.1.1 生成对抗网络GAN——image-to-image generation

  GAN(Generative Adversarial Nets,生成对抗网络)在2014年提出后,是*敏*感*词*和判别器之间的世代博弈。*敏*感*词*根据输入数据生成图像并将其混合到原创

数据中,然后将其发送给鉴别器进行区分。判别器基于二元分类网络,将*敏*感*词*生成的图像作为负样本,将真实图像作为正样本。双方的训练过程交替进行,对抗过程使得*敏*感*词*生成的图像越来越逼真,判别器的判别能力也越来越强。

  GAN 存在三个缺点:

  GAN 对输出结果的控制较弱,容易出现随机图像。在这方面,CGAN 通过将无监督 GAN 变成半监督或监督模型来为训练增加目标,而 DCGAN 通过缩小 CNN 的监督学习和无监督学习之间的差距,使训练过程更加稳定和可控。

  GAN生成的图像分辨率低。为此,PGGAN 逐渐向*敏*感*词*和鉴别器网络添加层,以提高生成图像的空间分辨率。StyleGAN 可以生成极其逼真的图像数据并实现高级特征。可控;

  由于GAN需要使用鉴别器来判断生成的图像是否与其他图像属于同一类别,这导致生成的图像是对现有作品的模仿和微调,无法通过文本提示生成新的图像,所以引入了 CLIP。

  2.1.2 可比语言图像预训练算法CLIP——文本到图像生成

  CLIP(ContrastiveLanguage-Image Pre-training)是OpenAI于2021年提出的多模态预训练算法,建立在NLP(Natural Language Processing,自然语言理解)和CV(Computer Vision,计算机视觉)相结合的基础上。该算法使用标记的“文本-图像”数据对进行训练。对文本进行模型训练,对图像进行模型训练,不断调整参数,使输出的文本特征集与图像特征集相匹配。

  

  CLIP方法具有结构简单、训练速度快、效果好等优点。CLIP具有很好的迁移学习能力,预训练模型在任何视觉分类数据集上都能取得很好的效果。并且该算法是Zero-Shoot,即不需要去新的数据集上训练也能得到好的结果。

  现在被广泛使用的StyleCLIP结合了StyleGAN和CLIP的特点。以往的StyleGAN语义控制发现方法需要人工检查、大量标注数据或预训练分类器,只能按照预设的语义方向对图像进行操作,严重限制了用户的创造力和想象力。添加未映射的方向需要大量手动工作或大量注释数据。StyleCLIP支持普通用户基于文本的直观语义图像操作,不局限于预设的操作方向。

  2.2 深度学习有助于提升AI绘画技能

  AI绘画的实际操作大致可以分为四个步骤:加噪、去噪、还原图片和绘画。其中,加噪声点就是加高斯噪声或关键词,是通过固定的公式来实现的。在这方面,快速更新和迭代的 MIM 方法非常出色。去噪是指仿生物视觉神经网络去噪过程中的学习(视角、颜色等)。目前,Transformer 正在取代 CNN 卷积神经网络成为主流方法。在还原图片和绘画方面,AI的“绘画功底”主要由扩散模型DiffusionModel和神经辐射场模型NeRF决定。

  2.2.1 Image Mask Modeling MIM——一种高效简单的预训练方法

  MIM(Masked Image Modeling,图像遮罩建模)是一种自监督表示学习算法。它的主要思想是对输入图像进行分块和随机mask操作,然后对mask区域进行一些预测,进而猜测整幅图像。Masked signal modeling在多个模型中得到应用和发展,如OpenAI的iGPT模型(通过mosaic对信号进行masking和转换)、ViT模型等。

  基于 MIM 的模型在广泛的不同类型和复杂性的视觉任务上实现了非常高的微调精度,使 AI 绘画从生成不完整图像到生成完整图像。MIM在几何/运动任务或语义较弱的细粒度分类任务中表现明显优于监督模型;对于监督模型擅长的任务(语义覆盖更好的语义理解任务),MIM模型仍然可以取得优异的成绩。具有竞争力的迁移性能。

  目前比较公认的MAE模型是何玉明对MIM优化产生的。MIM在预训练image encoder时,过于注重细节,失去了高维抽象能力。MAE的非对称encoder-decoder结构使得模型分工明确,encoder负责提取高维representations,decoder负责细粒度恢复;MAE 还对输入图像执行高尺度掩蔽。结合以上两种设计,结果用于训练大型模型:训练速度提高了三倍以上,同时保持了较高的准确率和良好的泛化能力。

  MAE广泛应用于人脸识别等诸多领域。例如,FaceMAE作为一种保护隐私的人脸识别范式,兼顾了人脸隐私和识别性能,可以适配任何人脸数据集,降低隐私泄露的风险。

  北京大学和香港大学研究人员于2022年5月提出的CAE模型,以及微软亚洲研究院提出的SimMIM,都是对MAE方法的改进。CAE更能挖掘编码器的潜力;SimMIM 简化了 MAE。他们学习的表示可以区分不同类别的对象。例如,看到猫的头可以预测它的身体部位,看到一小片天空可以预测它的周围也很可能是天空。

  2.2.2 Feature Processor Transformer——优化的自然语言处理模型

  Transformer是目前综合性能最好的特征提取器。该模型最初是在 2017 年的 Google 论文“Attention is All You Need”中创建的。它优于传统的 RNN 和 CNN 特征提取器。

  Transformer给视野带来了革命性的变化。它在视觉领域的目标检测、视频分类、图像分类和图像生成等多个领域取得了长足的进步。2020年10月,谷歌提出了Vision Transformer(ViT),这是Transformer应用于CV领域的杰出范例,在大数据集上的表现处于领先地位。2021年1月,OpenAI使用的DALL·E和CLIP模型都使用Transformer取得了不错的效果。前者可以直接根据本文生成图片,后者可以完成图片和文字类别的匹配。

  Transformer的研究刚刚起步,还有很大的研发空间。在研究领域,CNN的研究已经趋于成熟。考虑到模型成熟度和性价比,短期内不会淘汰CNN。

  现有的Visual Transformer参数和计算过多,内存占用超出可接受范围,效率有待提高。迫切需要为 CV 开发一种高效的 Transformer。

  现有的Visual Transformers通过将NLP中的Transformer结构应用于视觉任务,进行了一些初步的探索。未来针对CV的特性设计更适合视觉特性的Transformer会带来更好的性能提升。

  现有的 Visual Transformers 通常使用一个模型来完成一项任务。最近,有一些模型可以用一个模型完成多个任务,比如 IPT。我们期望未来有一个世界模型来处理全球任务。

  2.2.3 扩散模型——下一代图像生成的主流模型

  Diffusion Model是指扩散模型,其能力优于GAN,正在迅速崛起。相关研究最早可追溯到2015年,基础研究是2020年的“Denoising Diffusion Probabilistic Models”。2022年,借助AI绘画应用,扩散模型将在图像生成领域展现出突出实力.

  扩散模型的工作原理是通过不断添加高斯噪声来破坏训练数据,然后通过逆转该噪声过程来学习恢复数据。在一幅画中,衣服的图案、树叶、云彩等地方有很多细节的纹理,其实细节越多,越接近于随机噪声。对于这些地方,可能只需要几次高斯噪声(可以理解为高斯模糊)就可以破坏原来的模式,逼近正态分布。训练后,可以使用扩散模型将随机采样的噪声馈送到模型中,通过学习去噪过程来生成数据。两者都被赋予噪声 xT 以生成图像 x0。与GAN相比,Diffusion需要的数据更少,生成效果更好。

  扩散模型应用于七大应用方向,包括计算机视觉、自然语言处理、波形信号处理、多模态学习、分子图生成、时间序列和对抗学习。

  在AI绘画领域,除了DiscoDiffusion,最先进的文本生成图像系统OpenAI的DALL·E 2和Google的Imagen都是基于扩散模型。

  扩散模型仍在开发中,改进研究在采样速度提升、最大似然增强、数据泛化增强等方面不断推进。

  2.2.4 神经辐射场NeRF——顺应3D内容消费趋势

  NeRF(neuralimplicit representation)利用深度学习来完成计算机图形学中的3D渲染任务。该技术自2019年开始兴起,在NeRF获得2020年ECCV最佳论文后受到广泛关注。

  NerF 在很大程度上克服了样本特征有限的问题。此前,2D转3D生成领域也有GAN的尝试。比如20-21年英伟达推出的GANverse3D,可以自定义物体和交换背景。但由于GAN在对抗训练中仅限于样本特征,该模型只适用于车、马和鸟。

  NeRF 模型背后的基本原理是将场景的体积表示优化为由收录

位置和视图方向的连续 5D 坐标定义的矢量融合函数。具体来说,沿相机光线采样5D坐标合成图像,将场景表示参数化为全连接深度网络(MLP),通过5D坐标信息输出相应的颜色和体积密度值。

  NeRF对于虚拟人创作、3D训练环境构建、增强现实、网络游戏和电影特效等具有重要意义。自ECCV2020提出NeRF以来,NeRF模型也在生成范围、生成效果、甚至所需的基本数据。例如,先后支持光影变化效果、动态NeRF、类实时生成、全场景NeRF、单代模型、3D几何数据生成等。

  在AI绘画中,NeRF将场景表达为一个隐含的神经辐射场,在渲染时通过神经网络查询该位置的场景信息,生成新的透视图。直观来说,渲染就是用电脑模拟相机拍照,它们的结果就是生成一张照片。NeRF 将场景表示为空间中任意一点的体积密度和颜色值。借助NeRF形式的场景表示,可以对场景进行渲染,生成新视角的模拟图片。NeRF利用经典的体积渲染(volume rendering)原理来解决任何穿过场景的光线的颜色,从而渲染合成新的图像。

  NeRF之后,有人提出GRAF,引入GAN实现神经辐射场,利用Conditional GAN实现渲染内容的可控性。在 GRAF 之后,GIRAFFE 实现了合成。在 NeRF、GRAF 中,一个神经辐射场代表一个场景。在 GIRAFFE 中,一个神经辐射场只代表一个物体(背景也算作一个物体)。这样可以随意组合不同场景中的物体,改变同一场景中不同物体的相对位置,渲染生成更多训练数据中没有的新图像。

  NeRF未来的发展主要基于NeRF问题的改进。NeRF 的简单性有优点,但也带来了一些问题:

  1.计算量大导致耗时长:NeRF生成图像时,每个像素需要MLP深度模型进行近200次前向预测。虽然单次计算规模不大,但完成整幅图像渲染的计算量还是相当可观的,而NeRF对于每个场景的训练时间都比较长。在这方面,迭代的 Depth-supervised NeRF 可以实现更少的视图输入和更快的训练速度。

  2.Only for static scenes:对于不能扩展到动态场景的问题,主要结合单目视频,从单目视频中学习场景的隐式表示。神经场景流场将动态场景建模为外观、几何和 3D 场景运动的时变连续函数。该方法只需要一个已知相机姿势的单目视频作为输入。

  3、泛化能力差:NeRF不能直接推广到未见过的场景,这显然与人们泛化的目标背道而驰。因此,一些文章开始提高NeRF的泛化能力。GRF 学习 2D 图像中每个像素的局部特征,然后将这些特征投影到 3D 点,从而产生通用且丰富的点表示。与之类似的还有IBRnet、pixelNeRF等,核心思想是卷积和NeRF的结合。目前这种泛化还不够成熟,无法在复杂场景中取得理想的效果。

  4. 需要大量视图:NeRF方法虽然可以取得优秀的视图合成结果,但需要大量(数百)个视图进行训练,限制了其在现实中的应用。视角数量的改进目前仅限于相对封闭的测试环境,例如合成物体或单个物体。扩大其在实践中的可用性也是未来的一个主要方向。

  2.3 *敏*感*词*模型和人工智能引领发展方向

  我们观察到深度学习领域向前发展的两大趋势:大型模型和通用人工智能。

  2.3.1 大模型催生基石模型公司崛起

  在深度学习领域,模型越大越好。过去三年,人工智能模型的规模增长了1万多倍。

  每家公司都进入*敏*感*词*模型建设是不现实的,我们认为市场将被少数具有先发优势和成本优势的供应商所主导。作为行业领先者,OpenAI开发了GPT语言模型和DALL-E图像生成模型,并不断提升模型的复杂度和规模。OpenAI 在大型模型供应商方面也是实力雄厚的玩家,而其他公司则可以为其较低级别的模型买单。API 和其他服务。同时,大机型趋势也将为谷歌、亚马逊等云计算公司,以及英伟达等GPU厂商带来机遇。

  2.3.2 通用人工智能不只是想象

  人工智能技术分为弱人工智能、通用人工智能和超级人工智能三种模式。弱人工智能也叫狭义人工智能,是专攻某一领域的人工智能。比如在围棋中大放异彩的AlphaGo,就是一种弱人工智能。通用人工智能(Artificial General Intelligence,AGI)也称为强人工智能,或人类级别的人工智能。通用人工智能是指像人一样具有综合智能的计算机。他可以解决人类可以解决的智力问题。在 AIGC 领域,AI 模型将是多模式的,这意味着同一模型将用于文本、图像、视频等。

  

" />

  通用人工智能处理复杂情况的能力极具吸引力,但实现起来却极其困难。AIGC 可能是曙光。受技术、资源、应用方向等因素的限制,通用人工智能的发展短期内难以突破。AIGC的兴起,一方面可以提供一个相对具体具体的AGI应用空间范围,降低难度,举一反三;专业实力和资本的投入,有利于推动技术的演进。

  3 商业化前景广阔,B端、三维化或成突破口

  3.1 应用快速丰富,用户接受度高

  AI绘画产品不断丰富,体验不断提升。近两年,Disco Diffusion、MidJourney等AI绘画软件风靡海外,用于艺术创作。Stable Diffusion 通过各种渠道积累了超过 1000 万的日活跃用户,面向消费者的 DreamStudio 获得了超过 150 万的用户。在中国,2022年是AI绘画产品的井喷之年。文心一格、TIAMAT等产品均在今年推出。他们接受中文描述符输入,更了解中国文化审美和用户需求,积极利用小红书、微博等平台扩大影响力。

  AI绘画操作简化了很多次,大大降低了使用门槛,可以支持文字转图,图片转换,用文字修改图片等。上图中,我们取稳定扩散举个例子来展示一个更通用的AI绘画过程:

  1) 注册discord账号后登录Midjourney主页。

  2) 点击进入任意新手新手社区。

  3)向机器人输入“/image”指令,在提示后输入文字说明,完成后回车。

  4)等待一分钟即可获得完成的AI绘画。

  在用户认知层面,有相当一部分用户已经认识到AI绘画对人类工作的好处。根据6pen的调查,超过50%的用户认为AI绘画可以替代一部分,甚至完全颠覆目前的工作方式。随着越来越多的人接受和参与,AI绘画爱好者甚至开始形成自己的生态来反哺AI绘画的发展。他们形成了相关的社区传播技术,并将绘画过程称为“魔唱”。用户在社区中分享输入参数和输出结果。

  3.2 变现还在试用阶段,B端可能是切入点

  AI绘画产品目前收入或利润都很少。据南方财经报道,视觉中国官方披露,该公司拥有AIGC技术储备和物质资源,并已在元视界艺术网发表相关作品。相关作品确实可以产生收入,但比例很低。2022年上半年,元视界艺术网实现总收入约1500万元。Stable Diffusion 和 Midjourney 都尚未盈利。原因可能是以下因素:

  AI绘画的商业化还处于探索阶段,变现方式比较单一。大多数用户按创建次数或使用时间付费。常见的支付方式是订阅系统或按次付费。以几款主流AI绘画软件的商业模式为例:

  对于普通的C端用户来说,应用场景商业化相对划算,付费意愿有待提高。根据6pen的调研,60%的用户从未为AI绘画产品付费,其余40%的用户中,只有10%的人支付过100元以上。我们认为主要原因是:

  缺乏商业应用场景:普通大众使用AI绘画创作后,如果自己使用(比如用作头像)或者分享到社交媒体上,免费软件就够尝鲜了。但是,如果用于制图等用途,输出的作品会受到材料和技术的限制。为满足客户需求,仍需进行大量加工才能获得成品,性价比较低。《太空歌剧院》这部作品由AI生成后,设计师进行了数千次修改,历时近80个小时才完成。虽然有人在抖音上做壁纸账号,在闲鱼上卖说明,或者卖作品给包装厂,但这些还没有达到行业的高度,传播链条也很长。

  目前的AI绘画平台多为轻量级工具类应用,可操作的玩法和赋能服务相对有限。现有的赋能收费项目侧重于为速度或增加清晰度付费,或者类似于PromptBase,它创建了一个DALL-E 2和GPT-3提示词的在线交易平台,允许用户以1.99美元的价格买卖提示词。其中几项主要是变相弥补现有产品在成像速度、质量和精度方面的局限性。

  基于以上分析,我们认为B端变现路径更加多元和成熟。如果B端能够挖掘出更可行的商业模式,付费的可能性和水平会相对更高。B端可能会在以下几个方向产生收益:

  3.3 三维化开辟游戏、影视、VR等应用空间

  3D是AIGC视觉发展的必然趋势。从长期趋势来看,人们对未来元宇宙的期待是三维的、AI化的、开放的,AIGC+3D内容是可见的方式。中短期来看,AIGC+3D是丰富游戏、影视、VR等数字内容、降低制作成本的利器。

  3D内容制作借助AI绘画产品迅速普及。我们看到AIGC进入3D内容领域,有效降低了参与门槛,让全民参与3D内容的创作和消费,3D领域掀起了一股UGC的浪潮。我们相信,这将大大丰富3D内容创作的活力,正如视频拍摄和剪辑工具的普及推动视频内容产业的繁荣一样,3D内容创作产业也将迎来新的发展机遇。在AI绘画产品三维化方面,代表产品有Dream Fusion、Stable Diffusion、GET3D等,在各个场景都有应用实例,

  Dream Fusion 是 Google 的*敏*感*词* AI 图像模型 Imagen 结合 NeRF 的 3D 能力。DreamFusion训练的模型可以在任意角度、任意光照条件、任意3D环境下,根据给定的文字提示生成模型。整个过程不需要3D训练数据,也不需要修改图像扩散模型,完全依赖预训练的扩散模型作为先验。但是使用该项目的GitHub页面只允许你从一系列预设的文字提示中选择生成3D模型,并且不允许用户输入自己的文字描述,而且数字资产本身是低分辨率的。

  Dream Fusion 的在线画廊展示了一系列 .glb 格式的模型,适用于 AR 项目,或作为基础网格可以手动细化以进行更精细的工作。

  Stable Diffusion 最初是一个 2D 艺术生成工具。通过与Touch Designer可视化编程工具相结合,可以创建VR场景,并使用机器学习算法为这些场景生成文本查询对象。目前,已经在虚拟现实中成功创建了成熟的场景,并以 60 fps 的速度实时渲染。

  许多制造商已经在研究将AI创建的3D场景用于游戏制作,例如依赖程序生成的Roguelike游戏。未来开发者可能会直接将AI创造的场景作为游戏关卡,节省大量的游戏制作成本。

  GET3D 是 Nvidia 的一个模型,在对 2D 图像进行训练时,可以生成具有高保真纹理和复杂几何细节的 3D 形状。它生成明确纹理的 3D 网格,也就是说,它创建的形状是三角形网格的形式,如纸模型,覆盖有纹理材料。所以GET3D不仅可以生成各种高质量的模型,还可以将生成的模型导入到游戏引擎、3D建模器和电影渲染器中,进行编辑,将GET3D生成的模型导出到图形应用程序中,然后就可以应用逼真的灯光效果当模型在它所在的场景中移动或旋转时。

  基于GET3D,搭建了一个自动从照片生成3D模型的平台。在实际应用过程中,文物研究人员借助摄影测量技术实现文物三维数字化。工作人员只需按照建模拍照教程使用相机或手机采集照片,然后登录网站上传照片即可。云服务可以自动计算并生成高分辨率图像。精密 3D 模型。目前产品用于石窟寺勘察,平台上已有多款石窟寺模型。

  3.4 产业链初见规模,部分空缺成为蓝海

  中关村大数据产业联盟发布的《中国AI数字业务展望2021-2025》报告披露,到2025年,中国AI数字业务核心支柱产业链规模将达到1853亿元,复合增长率约为57.7 % 未来五年。其中,AI数字商业内容产业规模将达到495亿元,AIGC和AI绘画自然属于这一类。

  就AIGC和绘画而言,其产业链涉及硬件、NLP、算法算力、应用、数据提供和处理等多个环节,目前产业布局相对集中,领先于算法和应用开发环节,而产业链上下游还有很多可以开发的蓝海区域。

  与国外类似,主要参与者分为两类:1)相关行业具有一定规模的公司,多为龙头企业;2)创业公司。前者以百度为代表。8月,AI艺术创意辅助平台文心艺阁上线。它采用百度自主研发的工业级知识增强模型——文心模型。另一款AI绘画火爆产品TIAMAT,是一个初创团队。成立于2021年,一年内积累了可观的社区用户和商业客户,并获得了DCM数百万美元的天使轮融资。参考互联网发展史,未来大型企业很可能通过自研或收购的方式整合多种技术,提供更好的体验,打通不同场景,连接创作者、消费者、供应商等各方。我们相信产业集中度会不断提高,AIGC也会融入到元界复杂的体系中。

  4 基础设施亟待完善,发展风险与希望并存

  我国AIGC产业尚处于起步阶段,面临来自版权、伦理、社会等方面的困扰。

  一方面,AI绘画的强大能力引发了业内从业者的担忧甚至恐慌。通过海量数据和无穷无尽的深度学习,人工智能取得了突飞猛进的进步。在很短的时间内,就掌握了很多新画家需要练习数年的人体、透视、光影等技巧。具有威胁低级画师生存的能力。

  另一方面,批评者认为,人工智能创作没有情感和灵魂,很难与人类的艺术创作相提并论。而且,AI绘画还需要学习人类创作的素材,创作者反复修改文字内容,调整图形,才能获得相对满意的效果。这意味着AI绘画仍然依赖于人类的智慧和劳动,创作的主动权仍然掌握在人类手中,也就是说AI绘画其实是一个伪命题。

  此外,AI绘画涉及的作品侵权、明星肖像侵权等都是巨大的行业风险点。日本画界一直存在争议,不少画家公开表示禁止AI学习自己的作品。根据6pen对原创艺术家的调查,超过90%的原创艺术家持相对保留的态度,约37%的原创艺术家呼吁支付版权费或打标费。这也阻碍了AI绘画产生收益。AI模型训练中使用的大量素材可能收录

未经授权的版权归属明确的图像数据。模型是否应指明版权归属目前尚不清楚。因此,使用此类作品并从中获利很可能会给用户带来法律纠纷。

  但AI绘画也带来了新的希望。AI通过最新的AI技术,分析已故*敏*感*词*大师手冢治虫生前的*敏*感*词*作品,绘制出2020年的《手冢治虫新作》。

  我们相信,随着相关法律法规的完善,AIGC产业一定能够在内容创作领域找到适合自己的、合规的发展路径。

  5 建议遵循

  6 风险提示

  1)AI绘画相关技术发展不尽如人意;2)商业化扩张的进度和效果不及预期;3)AI绘画涉及的作品侵权、明星肖像侵权风险。

  欢迎互联网行业人士/一级市场投资人/二级市场投资人与我交流。如果你想加我微信,请在后台留言。

  解决方案:企业网站SEO优化排名的好处是什么?

  企业网站SEO优化排名有什么好处?

  传统企业网站建设上线后,才刚刚进入互联网行业。一些传统企业发现自己的网站排名很低,搜索时根本找不到自己的网站。他们需要阅读几十页才能看得清楚。因为新网站还没有被搜索引擎收录,自然排名会比较低,需要通过网站优化的方法来提高网站排名。现在越来越多的企业都在做网站优化,那么企业为什么要做网站优化呢?SEO优化的秘诀在于利用外部链接来提高网站权重的排名。

  企业网站SEO优化推广的必要性

  传统企业网站建设上线后,才刚刚进入互联网行业。一些传统企业发现自己的网站排名很低,搜索时根本找不到自己的网站。他们需要阅读几十页才能看得清楚。

  因为新网站还没有被搜索引擎收录,自然排名会比较低,需要通过网站优化的方法来提高网站排名。现在越来越多的企业都在做网站优化,那么企业为什么要做网站优化呢?有什么好处?

  什么是SEO优化

  搜索引擎优化是指优化网站的内部结构和外部条件,采用便于搜索引擎收录的合理方法,使网站对用户和搜索引擎更加有利,以利于搜索引擎收录和优先排序,以及最后达到增加网站访问量,增强网站宣传能力的目的。

  企业网站SEO优化推广的必要性

  1、网站曝光

  在网站上线初期,网站对用户一无所知,SEO的作用就是做一个推广者,不管用什么方法。高质量让网站曝光。可以说,该网站首先被收录到搜索引擎索引中,并尽快通过搜索审核期。

  2.人气

  当网站有足够的曝光度时,我们可以通过分析访问用户的数据来改进网站的不足。

  首先是增加曝光度。知名度最直接的体现就是网站的关键词排名,其中关键词可以是网站品牌、企业品牌、产品品牌等。当然,排名方式是自然排名或竞价排名,一个时间排名,一个快钱。他们的共同点是关键词精准,避开热点,寻找适合自己但搜索者足够多的关键词,做到人和钱的最大化。

  3.忠诚度

  在进入网站运营阶段之前,要坚持维护老、挖新的方针,增强老用户的忠诚度,挖掘新用户的资源。这时候SEO更倾向于服务化,网站新闻也应该是服务化的。在这个阶段,SEO基本上应该说到用户发现和交互的程度就结束了。

  SEO优化排名的好处

  1、网络信息快、快、无空间限制。可以提升企业品牌,树立企业形象,短时间内推向潜在客户。拥有一个公司的网站并对其进行优化以在搜索引擎中排名更高可以大大提高公司的知名度和美誉度。

  2、长期有效,成本低,SEO推广的寿命比竞价高。PPC、网络广告、竞价排名等停止后,这些渠道的流量也会停止。搜索引擎优化一旦投入使用,将长期有效。无需按点击付费,成本低。只要不作弊,排名就可以长期保持。

  3、让网站更有针对性,通过网站SEO推广获得的用户流量会更加精准。能够通过用户数据分析市场和受众。根据目标受众特点,有针对性地发布信息。搜索引擎优化可以帮助您直面竞争对手。

  使用技术手段进行SEO优化需要注意什么?

  SEO的基础是核心,还有很多详细的优化方法。任何有利于网站SEO的操作都可以视为SEO技术手段。对于很多参加过SEO培训的朋友,以及很多做过SEO*敏*感*词*内,这是一种非常片面甚至错误的观念。

  相反,通过技术手段优化SEO需要注意哪些细节?具体来说,网站的各种微调优化设置值得关注,典型的网站代码优化,网站结构搜索引擎友好,基本网站TKD设置,用户搜索的优质原创内容,以及大量其他网站为目标网站投票、引流等,增加网站自然点击等。

  

" />

  1. 关键词 分析

  关键词分析是SEO核心定位最重要的部分,如何从SEO的角度选择拓展挖掘关键词?关键词分析包括:用户需求分析、关键词关注度分析、竞争对手分析、关键词。

  关键词相关分析,关键词索引,关键词排序,关键词排名预测。

  使用技术手段进行SEO优化需要注意什么?

  2.网站结构分析

  简洁的网站结构符合搜索引擎爬虫的喜好,有利于SEO。站点结构分析包括:减少搜索引擎无法识别的代码(FLASH、JS、视频)、站点结构深度设计不利于优化、站点框架实现树状目录结构、站点导航和链接优化。

  3、原创内容是核心

  随着网络的发展,网络内容越来越多,技术也越来越成熟。SEO开始思考如何过滤掉大量重复的内容,让用户花更少的时间寻找自己想要的内容,从而提高SEO的用户体验。因此,原创内容越来越受到关注,重复的内容将被过滤掉,不再显示在搜索排名中。通过技术手段优化SEO一定是操作要点。

  4.高质量的外部链接发挥重要作用

  在互联网上,每个网站的每个页面都是一个节点,数以千万计的网站链接可以让搜索引擎更容易从内容到内容采集

内容。如果您的站点与其他站点的链接太少,请说明您的站点不在他们站点的范围内。而且搜索引擎访问你网站的机会比较小。同时,高质量的外部链接可以在搜索引擎中获得更高的推荐质量。您是否添加了高质量的外部链接?可主动提交至“爱互踩”等网站目录,“爱互踩”的自动推送功能可带动网站权重提升。

  5、网站内链建设是具体操作点

  虽然内容很新颖,但是外链也很充足。而且,内部链接更重要。在网站内部结构设计上,列表页和主题页要更加突出。例如,通过添加粗体、颜色、h 标签、大纲文本等来告诉搜索引擎您的页面有多重要。另外,网站设计扁平化,一般三级目录,首页/列表/内容页,每个页面必须相互链接,避免出现孤立的网页现象。

  6、原创软件推广

  原创软文推广一直是外链推广的最佳方式。在做外链的同时可以增加网站流量和品牌形象。

  软件的内容范围比较广,没必要写网站相关的内容,只要对别人有帮助,大家感兴趣,适当加上网站的链接和关键词在文章。

  在一些权重比较高的热门网站上发布软文,这样人气会很高,推广效果会更明显。

  而且搜索引擎更加智能,网站定期更新。使搜索引擎及时抓取内容,从而更能得到搜索引擎的青睐。最好每 12 小时更新一次网站。

  7.友情链接交换

  互动链接一直是网站排名优化的工作内容之一,缺一不可。一个高权重的友情链接不仅可以增加网站的权重,对排名也有很大的帮助,有时甚至可以直接跳转到首页。可见,朋友链是一个非常重要的外链。一般来说,在交换友情链接时,需要考虑以下因素:

  看看对方的pr值是不是比你低。考虑到交换友链的出发点,您不会与PR以下的网站交换友链。检查对方网页的索引状态。一般来说,找一个有索引量的网站作为友情链接。查看对方的快照更新。看对方是否及时更新,最新采集

。观察对手的链条。包括外链和友链。一般超过30个好友链接就不会再交换了,因为没有意义。看对方采集

的外链数量。一般选择多个网站交换外链。查看对方网站是否被处罚。如果是这样,交换链接是不必要的,

  找一些权重高的友情链接平台,输入网站关键词和链接,可以是外链,也可以让别人找到你,增加交换友情链接的选择。

  8.网站流量分析

  从SEO的流量分析,分析网站的页面访问量,其结果指导下一步的SEO策略,同时对网站用户体验的优化具有指导意义。推荐使用谷歌的流量分析工具和百度的流量统计工具。

  

" />

  利用外部链接提高网站排名

  在搜索引擎优化领域,都说内链为王,外链为王。虽然百度推出了新的算法来降低外链对SEO排名的影响,但不得不承认的是,到目前为止,外链在网站关键词排名中仍然扮演着比较重要的角色,原因就是外链投票是决定网站权重的因素之一,很难找到比外部链接更好的评价因素。

  通过站外权重投票,亚马逊类目使得站内权重更高。优化相对简单,好的内容可以提升用户体验,实现转化。看看你的外链,如何建立高质量的外链

  SEO优化的秘诀在于利用外部链接来提高网站权重的排名。

  外链是搜索引擎判断网站权重的标准之一。丰富的外链资源可以帮助您轻松提高搜索引擎的权重,让您的网站更好的被收录和排名。对于个人网站来说,原创文章的数量是很难增加的,这时候外链就成为了一个比较关键的因素。因此,促进外部链接建设的重要性怎么强调也不为过。但是,在外链建设中,必须遵循几个原则,才能事半功倍,否则可能适得其反,甚至适得其反。

  1.质量胜于数量

  质量大于数量,你买了很多外链不好的,跟高质量的外链是没法比的。不要以外部链接的数量来衡量你的工作,把质量放在首位,否则将是徒劳的。尤其反对利用外链群发者群发垃圾外链。这可能会产生短期影响,但可能会导致您的网站长期处于降级状态。外链原则其实就是针对刻意外链的建设,也是新站、小站不得已的做法。如果是真正以优质原创内容取胜的网站,甚至可能不需要推送网站目录去人工搭建外链,所以不要盲目搭建,适度的外链就够了。

  2.难度越大,价值越高

  SEO优化的实际操作者都知道,无论是原创内容还是外链,都是非常困难、费时费力的。外部链接不能保证有输入就会有输出。获得好的外链更是难上加难。但总的来说,链接越难越好。与首选网站目录类似,对外部链接的审核非常严格,所以一旦你成功地留在上面,其影响将远远大于在普通论坛上发布的外部链接。

  SEO 永远不应该因为第一次接触被拒绝而气馁而放弃。你经常从高权重的博客、新闻站点和聚合目录中获取链接,并且你需要多次联系对方。有时候不能上来求链接,而是要先和对方交好,互相帮助,有了一定的友情之后再去求链接,这样就可以变得很自然了。

  一些高权重的网站不接受友情链接,只有在对方认识你、信任你之后才会给你提供单向链接。这个过程可能需要几个月的时间,而且越难获得越好。

  3. 基于内容

  高质量的内容可以带来高质量的链接,因为高质量的文章往往很容易被转发。这是一种由内而外的链接构建策略。总之,如果想让对方链接到你的网站,你必须要为对方网站的用户提供有价值的内容,而最重要的是提供高质量的内容。天下没有免费的午餐,更没有优质的内容。获得的链接只能是交换链接和购买链接。

  4.内容相关性

  内容相关性是寻找有效外部链接时要考虑的重要标准之一。对彼此而言,内容相关的网站价值高于不相关的网站,同行业网站之间的外链质量非常高,效果会最大化。所以重要的是要有很多人在其他同行的博客上发帖,互相交流,互相支持,成为这个行业的积极参与者。无所谓的话,分类没问题,但效果不好。

  5.外部链接的通用性

  一般的网站不可能有好的链接,也没有一般甚至质量差的链接。制作外链时,大致应使外链的构成自然、随意、广泛,健康正常。否则很可能被搜索引擎认为是故意的,最终达不到效果。做外链时要注意网站类型的多样性,博客、论坛、聚合目录等类型不能掉以轻心。

  分类目录不要要求太多权重,各种权重都有,新老站都可以。如果网站的外链全部来自高权重页面,就会很可疑。以常识来看,主要的链接恐怕都是购买链接。做外链的时候也要注意,不要老是链接自己的主页,内页和首页都应该。锚文本不能一成不变地使用一个词,而应该在多种情况下突出重点。

  6.深度链接

  深度链接不仅使外部链接的构成更加自然,而且对内部页面的权重影响更大。有一个现象就是微页目录网站的首页权重值很好。按照一般情况,一级分类的权重值应该离首页只有一级。其实不一定,很多一级分类页面的权重值为零。从排名能力的角度来看,这些类别页面似乎并没有获得传递给内部链接的所有权重。如果分类页面本身也有外链,那么排名能力和权重也会相应提高

  七、稳步增长

  外链一定要牢记稳步增长,不要急于求成,尤其是新站。如果你的网站突然在一夜之间增加了大量的外链,很容易被搜索引擎认定为作弊,得不偿失。不要做这些不必要的突袭。对于真正对用户有用的网站,自助网站目录外的链接会随着时间的推移平稳增加,很少有大幅波动。学会合理分配精力,控制时间,每个月增加一点,坚持下去。为此,SEO优化外链建设要制定计划,明确目标,有步骤、有规律地添加外链,才能取得良好的效果。

  原文来自:企业网站SEO优化排名有什么好处?

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线