解决方案:中英文双语言网站该如何做SEO优化
优采云 发布时间: 2022-11-19 16:11解决方案:中英文双语言网站该如何做SEO优化
一般来说,第一个
中英文网站SEO优化的目标不是在搜索引擎中占据第一,而是使用合理的搜索引擎。吸引潜在用户到网站,这些?荣碧?与用户?搜索关键词匹配,中英文网站优化包括三个。级别的含义:用户优化(网站结构设计)、搜索引擎优化、网站运营推广优化。
中英文网站优化设计?不仅仅是搜索引擎优化,而是呃?对网站推广的影响非常明显和直接,因此更容易引起注意,同时在相关网站设计中英文网站优化。因为真正的中英文网站优化不仅仅是搜索引擎优化,更是用户引导的优化策略。
1. 中英文双语网站设计对于
用户来说,看网站是一种视觉享受,对于网站建设专业人士来说,网站设计
作为一种视觉语言,要注意布局和布局,虽然首页的设计不等同于平面设计,但它们有很多相似之处,应该充分利用和借鉴,英文网站建设要通过文字和图文的空间结合,表达和谐美感,应该知道文字图形的哪一段应该落在哪里, 为了使整个网页生动起来。
1、中英文双语网站的字体设计与页面美化
英文网站建设与中文的区别不仅仅是中文的使用和英文的区别,因为中文字形很复杂,而且中文字体设计
在电脑上比较落后,这使得中文网站比英文网站设计难度更大,不管中文字体的特殊性,简单地照搬英文页面的设计方法,往往会降低中文的易读性。
在英文网站的建设中,固定字体大小为
被称为“冻结字体大小”,使用固定大小的字体大小是一个明显的错误,很多交互设计专家对此做过研究,使用相对字体大小比较正确,因此,中文网站文字也是设计相对字体大小的,这种做法主要集中在中文版英文网站的设计上, 但对于中文来说,相对字体大小并没有预期的那么好。
很多字体大小的中文无法清晰显示,例如:10px Arial 字体显示英文清晰,但 10px 宋中文变成黑疙瘩;比如20px英文大而清晰,但20px中文会出现明显的锯齿,笔画粗细不均匀,我在《如何让页面文字更舒适阅读》一文中讨论过中文字体大小,12px、14px、16px(或18px)显示中文是理想的,其实12px-16px大小的宋体显示效果不错, 一些英文网站中文版根据英文原版的相对字体大小设计,一个不好的结果是,无论用户如何调整浏览器的“文字大小”选项,都无法使网站上的所有文字都清晰(即在12px-16px范围内)。
此外,斜体是英语中常用的表达方式,对于英语用户来说,“斜体”和“粗体”
频率几乎相同,从微软Office系列软件的设计中我们可以看到,“粗体”功能“B”按钮和“斜体”功能“I”按钮都放在了易于点击的位置。
但是,汉语自古以来就没有斜体的概念,也许是因为现代革命者的书写和草书给我们留下了太深刻的印象,让我们很容易接受斜体的表达方式。
网页的浏览主要是基于显示器的,所以斜体中文是一种非常糟糕的表达方式,但这种糟糕的方式是在复制英文网站的过程中不假思索地采取的。
然后字体太小英文版网站上经常会出现太小的文字,
如前所述,英文字体可以清晰地以10px的大小显示,在中文版的设计中,只是机械地复制英文版的设计,将文字翻译成中文,而且还采用10px的风格,显示效果很不理想。
2、中英文双语网站默认语言显示
现在很多人都想面向自己的网站国际化,网站也改版为中英文双语展示,一般做中英文双语网站都有习惯,进入网站时默认语言是中文,所以这里我有不同的看法,因为如果你是外贸网站,更国际化的定位, 为什么不尝试进入网站默认语言是英语?
" />
如果有外国朋友登录你的外贸网站,而你网站的默认语言是中文页面,这样很多国外客户会觉得你的网站很不专业,所以导致你的网站慢慢衰落
所以易启邦建议中英文双语外贸网站最好默认语言为英文,哪怕是国内朋友,如果是搜索进入你的外贸网站,那么至少是和外贸业务相关的人员,这些人有这个需求, 那基本也懂英语,即使英语比较差,只要能听懂语言切换,大体上明白是什么意思,这样你就不用担心中国客户觉得你不专业,但你也可以给客户一种网站面向世界的感觉,你会觉得你的网站很大,很值得信赖。
2. 中英文双语网站现场搜索引擎优化
如果你有一个中英文双语网站,首先的工作就是代码,但是记住代码不应该改一样,搜索引擎的选择也很重要,一般做中文都是用百度优化的,用谷歌做英文来优化的,在这里,Yiqibang也整理了一些要点给大家写下面:
1.中文 页面标题关键词嵌入其中,关键词要用“_”分隔,因为百度的默认分隔符是“_”。英文
页面标题填写英文关键词并用“分隔,因为英文Google的默认分隔符是”,“。2.中文页面元中的关键词和
描述与英文网站元中的关键词和描述相同,唯一的区别是一个是中文,一个是英文的,所以中文页面元中不要出现英文,
且不出现在英文页面元中文中(详情请详见Yiqibang《如何做好网页元标签的SEO优化设置》的相关介绍)。
3、无论中英文页面的图片如何,都必须在其中添加ALT,并且ALT必须嵌入关键词中,每张图片只需要嵌入一个关键词。
4.无论中英文页面如何,每个页面都必须有一个辅助导航,因此必须添加辅助导航的每个页面,只要将中英文差异分开即可。
5、友谊链接交流 对于不同语言的友好链接交流,即使英文网站出现中文友情链接也可以,但最好
是英文的,所以最好用同一种语言做友谊链接交换,如果没有,可以添加中文友情链接,每页最好每天交换2个友情链接。
6、至做中英文双语网站的SEO优化,
Yiqibang提醒大家记住这个原则:中文主要是针对百度优化的,英文网站主要是针对谷歌优化的,此外,谷歌比百度更重视链接,英文网站的SEO优化一定要注意链接的力量,尤其是内部链接(因为这是大多数SEOer忽略的地方)。
7、不管是什么网站,只要你做SEO排名一定要有文章,在更新文章的时候,Yiqibang有一个建议,先更新中文页面,然后用谷歌翻译翻译再更新英文页面,如果你的英文足够好,那么你自己翻译最好,因为谷歌翻译有时候可能会有错误, 所以最好自己翻译。
而无论是中文还是英文文章更新都要把关键词嵌入里面,关键词密度在8%左右,有人不明白8%是什么意思,简单来说,就是整篇文章要计算一下,8%整篇文章出现一次关键词就可以了,并添加锚文本链接(具体可以看易启邦的相关介绍“网站文章中最好添加多少锚文本”), 如果你做中文页面,添加页面第一页的地址,如果是英文页面,添加英文页面第一页的地址,不要乱,如果乱七八糟,就很难排名。
以上就是网站的优化,
虽然看起来很简单,但大家应该知道,如果要做一个双语网站,就意味着一个域名做两个网站,所以网站中权的重要划分是明确的,所以无论是改代码还是更新文章,中英文页面的权重都要分开, 如果集中,那么可能只有一种中文语言可以做搜索引擎。
3. 中英文双语网站站外搜索引擎优化
如果你说你这样做中文非站,那就很简单了,如果你说你做英文页面异地,
" />
那就有点难了,而且要做好也不是很容易,所以在做英文页面的时候,应该改变一些做中文页面的方法,所以Yiqibang这里把中英文分开:
1. 站外SEO工作中文页面中文
页面站外工作大家并不陌生,一般做中文站外就是获取反向链接,然后提高网站在搜索引擎中的排名,所以在做中文的时候,一般有以下几种方法:
(1)发帖到各种大型门户网站,或者一些权重比较高的论坛、帖子吧,嵌入网站的链接地址和关键词,每天发送30条消息。
(2)撰写一些高质量的原创软文
,向一些权重较高的原创网站投稿,并嵌入网站的链接地址和关键词。
(3)回答问答栏目,每天回答20个,记得认真回答,并嵌入网站的链接地址和关键词。
(4)注册网站的友好链接交流平台。
(5)喜欢一些热点帖子,嵌入网站的链接地址和关键词。
2. 英文页面的场外SEO工作
英语
和中文页面不一样,做英文最重要的是看别人怎么做,一般步骤如下:(
1)在谷歌上找到找到帖子的网站,然后发到本站做好相关外部链接(详情请详见易启邦《SEO新手做英文网站外部链接建设的误区与解决方案》相关介绍)。
(2) 使用网站查看与您一样关键词在这些网站上发布的网站。
(3)找一个英文原创网站进行软文推广,可以用谷歌翻译,但一般通过的比较少。
(4) 向 Google 的合作伙伴发布信息,并添加指向其网站的链接。
(5)使用群发工具进行英文发帖,但Yiqibang不建议使用黑帽方式。
以上是中英文网站外的工作,如果你这样做了你的网站排名会很快,而且这些方法已经实践过,请随意使用。
一汽邦评论:
SEO优化归根结底是为了提升用户体验和搜索引擎体验,为用户提供最好的内容和服务才是
最基本也是最重要的,对于中英文双语网站来说,能针对不同的访问者以最快的速度展示相应的页面和内容才是最佳的用户体验,所以这就需要我们从细节入手,从SEO的角度做好网站的优化。
解决方案:特写|人工智能背后的人
在大多数人眼中,人工智能是一个有点“科幻”的词,代表小说和电影中看起来和人类相似,或温柔或冷酷的机器人。
更熟悉一点,这种印象变成了冷GPU阵列,复杂的多层神经网络和一长串专有名词。除了工程师之外,科学家也是可以访问它们的人。
也许这种印象需要再次刷新——人工智能真的需要大量的“人工”。
一
今年刚满30岁的秦娇,几个月前刚离开呼叫中心,加入了一家“数据处理”公司。虽然她跨行业,但并不觉得两份工作有什么区别,他们按照甲方的要求和自己的工作节奏,把人手安排到一个又一个项目中。
公司成立才不到一年,目前大部分业务都是给数据贴标签,即根据项目方的要求手动标注和标注图片、视频和语音内容。标记后的数据将被AI公司用于训练算法模型,然后应用于图像识别和语音识别等不同领域。
通常,标记的数据越准确和越大,模型就越好。当然,产品会更好地工作。
一旦要求质量,每个人的产出就不多了。普通技术人员每天可以注释 40 张图像,前提是只需要对图片中的对象进行构图、分类和上下文化。当涉及到复杂的细节时,例如描绘建筑物的边缘,每天 10 个是极限。
图像是一种简单的注释方法
但是,需要处理的数据订单往往以“万”来衡量。最新要求是 60,000 张图像,在 7 天内完成。理论上,这个订单需要214个人一起工作7天,而秦娇手头不到100人,其中一些人还要完成其他项目。好几次,秦娇摆出一副不耐烦的眼神看着电话那头,“你告诉他,你想让我死吗?
与收录
1500 万张标记图像的数据集 ImageNet 相比,只有 60,000 张图像的项目规模很小。但大多数人可能很难想象,来自167个国家的48,940名工人花了两年时间清理,分类和标记通过互联网采集
的近10亿张图像,以达到这个收录
1500万张图像的数据集。所需的时间和人力远远无法与普通项目相提并论。
凭借海量和开源数据,ImageNet迅速成为研究图像识别的首选。从Andrew Ng到Jeff Dean,参与该领域的研究人员都使用了ImageNet。然而,ImageNet 也有其自身的弱点,例如标记框大、标记方法少、偶尔出现错误,难以用于训练算法模型用于实际应用。
AI公司必须尽最大努力积累更详细、更准确的数据,符合自己的应用方向。在初创公司聘请工程师的需求中,有时会包括“采集
注释数据的能力”。某种程度上,高质量的标注数据决定了一家AI公司的竞争力。
虽然互联网确实催生了海量的内容,但给这种需要耐心和专注的“小事”贴上标签,暂时就靠人们的帮助了。
二
在专业数据标签公司出现之前,众包平台往往是大多数公司的选择。
更灵活的众包被认为可以适应不稳定的数据需求,而且成本更低。某知名数据众包平台声称拥有5000多名数据标注专家,一天可处理200多万条数据,可“提供稳定的数据标注服务”。
数据
标注是所有数据众包平台的核心业务,此外还有数据清洗、数据采集
等但是,从单人数据
比例(400个数据/人)单日可推断,其标注质量可能不如声称的那么可靠。由于参与众包标注的工人众多,专业背景和工作能力参差不齐,“采集
到的标注内容存在噪音甚至错误,不能直接作为正确的标注”早已不争的事实。如何解决众包平台的质量缺陷,成为近年来博士、硕士论文的课题之一。
通过数据交换购买标记的数据包也是一种选择。但问题似乎又回到了为什么人工智能公司给自己的数据贴标签:不同的应用需要不同的数据内容,甚至不同的标注方法。
秦娇目前所在的公司,正瞄准这个市场——人工智能公司需要的数据必须根据自己的需求进行定制,保证标注的质量,而且数量还是非常大的。大多数人工智能公司本身和众包平台都无法同时满足这三个要求,因此专业的数据标签公司应运而生。
这家“数据处理”公司的一楼和二楼都是负责标记数据的员工。为了满足不同订单的需求,将员工分为不同的群体:
一些小组负责勾勒出画面中人体的关节点,将复杂的瑜伽姿势抽象成点和线,可以用来训练识别人体的模型;
" />
有的群体要在路况图片中对车辆、*敏*感*词*、自行车和行人进行构图,并标注行驶方向和是否有障碍物,多用于训练智能安防*敏*感*词*的识别能力;
有的组需要一一精确地描绘建筑物的边缘,并在静止图片中将建筑物逐一划分并用不同的色块标记,这多用于自动驾驶中车辆对环境的感知;
一些公司正在将雷达扫描的3D障碍物线减少到真实物体中,例如建筑物和绿树,这些物体将用于训练雷达数据和现实世界的相关性。
标记
工作有时并不简单,例如这种关联标记
除了图片,还有员工负责视频标注。他们需要从每个视频中获取 10 帧,并在接下来的两帧中标记对象方向和坐标的变化。这些数据可用于训练机器对物体相干性的感知,或预测物体位置的变化。
与大多数制造业类似,这里的每个集团都有自己的经理。经理之上是项目经理,然后是秦娇这样的少数高层经理。员工“制作”的内容将由质检员进行验证,所有内容经合格后方才会交付给项目方。严格的流程和管理体系,确保标签效率和质量稳定。
“很多人认为大数据就是一个呼叫中心,我们开发的大数据和别人不一样,只有我们整个贵州做数据整理。”对于公司目前做的生意,秦娇很是自豪。
事实上,这些结构化数据将成为企业在这一波人工智能浪潮中的基础。它不仅帮助他们提高模型的准确性,提高产品的可靠性,甚至影响他们的发展轨迹和融资过程。
三
“数据”的位置“
处理”公司距离“大数据之城”贵阳50多公里,是只接受科技公司的“数字小镇”。入住率不高,再加上位置偏僻,人迹罕至,公园非常安静。
小镇大多是这样色彩缤纷的尖头建筑,绿树成荫,非常安静
有趣的是,尽管它位于山区,但镇上隔壁有一所大型职业学校,其学生构成了公司的主要员工来源。除了上课,学生每天有6个小时左右的工作时间,“易管、兢兢业业”是秦娇对这些学生的评价。
设立职业学校的目的是通过教育扶贫,所以大部分学生来自贫困山区,学校会提供大量的补贴和奖学金。在数据处理公司*敏*感*词*赚到的钱不仅够生活,而且一些学生还贡献了部分钱来补贴他们的家庭。偶尔,这份工作也能成为职业跳板,“我们的学生踏实耐劳,有的去北京实习,是因为熟悉标签工作认真,反馈回来说他们比同样实习的北京大学生要好很多。
学校走廊的墙上有许多类似的学生案例。“贫困”、“双重死亡”和“残疾”等词不可避免地收录
在描述学生学前条件的文本中。在一张照片中,父亲、母亲和学生坐在围墙建筑的木地板上,身后昏暗的空间里没有任何装饰品;在另一张照片中,学生搂着生病的弟弟;还有一张面无表情的学生坐在床状区域的照片,背景是贴着黑白报纸的墙。后来,他们都通过努力改变了自己和家人的命运。
“数据处理”公司的首席运营官李政也非常确定这份工作可以给学生带来的机会和回报。但比起秦娇对数据标签行业的信心,他就有些担心了。毕业于北京航空航天大学的他清楚地意识到,现阶段的数据标注仍然是一个劳动密集型行业,与南方工厂没有什么不同。学生只是在装配线上处理来料的一个环节,处于价值链的底部。只有向前迈出一步,找到深入行业的商业模式,才能从已经开始升温的数据处理行业中脱颖而出。
经过近一年的探索,李政拓展了包括数据采集
在内的多项业务。所谓数据采集,是指对符合项目方要求的人像照片进行独立拍摄,比如一个人正面、45度、60度、佩戴各种装饰品的照片。这些图片可用于训练计算机在不同状态下相同人脸识别的准确性和相关性,这是大多数专注于人脸的计算机视觉公司的需求。
有时,数据采集
要求中也规定了表达式
在它建立的工作室里,“数据处理”公司已经完成了几个订单。主角们当然还是学生,他们一个个排队进入摄影棚,按要求摆姿势,拍几张照片,然后戴上口罩、墨镜、帽子继续拍摄。一组照片往往收录
10多张照片,一天可以拍摄100多组。与自己采集
或拍照的安全公司相比,这种标准流程和足够数量的样本(一所学校至少有一千名学生)确实具有竞争力。
此外,他们还可以进行小语种的语料库采集
。地处西南,靠近*敏*感*词*,当地的人际链和频繁的业务往来可以提供很多便利。“
光做合同加工肯定是不够的,”李政很坚定,“我们最近在培训一些懂技术的技术人员,能更好地与项目组沟通,更好地描述需求,这样我们才能更好地满足他们。
四
“贴标签真的很辛苦。”一提到“数据标注”四个字,华院数据首席科学家尹祥志忍不住咧嘴一笑。
" />
几个月前,华源数据刚刚举办了一场大数据应用大赛,其中包括通过行车记录仪的图像识别复杂图像中的动物和恢复驾驶操作场景。在“通过商店货架图像自动计算产品的货架份额”测试中,他们拍摄了1,600多张真实的货架图片作为原创
数据。
比赛的目的是通过不到2000个“小数据样本”来实现图像识别,而这往往需要大量样本才能实现。为了让比赛的难度不那么“”,他们还在“贴上精标”后为选手们提供了货架图片——所谓贴标,就是货架上每包零食和方便面,都要沿着边缘小心翼翼地分开。
图片左侧是从真实货架照片中挖出的类似商品的碎片;右侧是货架上不同产品的标签,每个灰度对应一个产品
“深度学习最大的问题是样本的数量,在这里我们实际上测试了如何通过小样本学习。应对这一挑战的诀窍之一是通过从提供的边缘裁剪原创
1,000 张图像来减少错误,将它们惩罚到数十万张,并根据这些增强的图像对它们进行建模。细粒度标记不仅有助于解决样本稀疏的问题,而且还激发了过去需要数十万张图像来训练模型的模式。
然而,精细标注并非易事,一千多张图片的标注花了12个人半个多月的时间,负责标注工作的团队成员“几乎崩溃”。如果有人能承担复杂标注的“分解”工作,善于满足复杂标注需求,人工数据标注能成为一个长期发展的行业吗?
“近期的需求还是很大的,”尹祥志想了一会儿,“但这个行业可能只有5年了,大家都在想各种方法,比如开源,比如小样本学习本身。
除了小样本学习,人们也在思考自己能不能合成数据。图像识别领域的研究人员正试图使用图形方法来生成与真实训练图像非常相似的逼真图片。从理论上讲,这种方法可以直接用注释产生大量数据,但能否“真实”需要图形的进步。
ImageNet的创建者李飞飞也意识到了精细注释的力量,并正在从事一项名为“视觉基因组”的工作。视觉基因组有更多更窄的框,更详细的名词标签,以及位置和动作关系。目前视觉基因组中有108,000张图像。
对于数据标注的小麻烦,每个从业者都有自己的看法。有人隐瞒,把话题变成互联网是最大的数据集;但其实大家都知道,采集
到的数据是不能直接使用的。有人坦言,很多数据需要学生*敏*感*词*标注或者依靠自己的员工,对质量的不满促使一些企业干脆成立了数据标注部门;还有人透露,如果使用对关键词,还可以在淘宝上找到很多外包商。
不过大家或多或少都乐观地认为,5年后就不需要那么多人力了,无监督学习、小样本、自动数据生成将发挥更大的作用。
但那些经过人们辛苦打烙,像艺术品一样精致的带注释的图片,5年后,电脑真的不再需要了吗?
五
在知乎里,“大公司里有没有人专门负责给数据标注?在问题下,有21个答案。来自大公司的受访者表示,他们已经“动员整个部门标记数万张照片”或“在劳动力成本相对较低的分支机构安排工作”。小公司“将数据交给隔壁满是女性的部门”或“省钱并自己标记”。除此之外,移交给外包公司是最常见的选择。招聘
板上发布的工作要求也可以一瞥。在智联中输入“数据标注”,可以找到60个直接相关的职位。 可以找到近 400 人,包括管理外包团队等相关职位。豆瓣群和以打工为主题的*敏*感*词*也开始招募*敏*感*词*,从写软文
、小说、荧屏评论,带数据标注。
看来,在人工智能行业火爆、大量创业公司涌现的当下,数据标注是一门好生意。
2009年,张同和在《打工女孩》中描写了一群离开家乡,独自来到东莞工作的女孩。他们只有十八九岁,甚至还*敏*感*词*,就离开学校,日夜在工厂工作。流水线上的女工不知道自己在生产什么,也不知道自己的工作“秋喜”(QC)是“质检”。无论是工作还是生活环境都相当恶劣,即使晚上去小吃街改善生活,也往往缺乏精神娱乐。
但与农民工的刻板印象不同,他们既不短视也不沮丧。他们不在乎15个人共用一个房间,50个人共用一个浴室。占据他们脑海的是,攒够钱买房需要多长时间?我如何获得晋升或只是跳到更有前途的职位?剩下的几个周末是学习计算机,英语还是其他东西?
与*敏*感*词*的“资本主义的悲哀”不同,工人在脱离生产后失去了满足和幸福,“分离”不一定改变他们的社会地位,而是改变他们的思想。花在制作上的时间并不代表制作者本人,更重要的是钱花在哪里,他们学到了什么技能,以及它如何改变他们。
“我们手中的iPod,我们脚上的耐克,我们肩上的教练,无形中改变了数百万人的工作,婚姻,生活和思想。
也许数据标记也是如此。先讨论这个行业存在的合理性,以及能否长期发展,能给从业者带来的变化,已经足够令人兴奋了。
但我们不能忘记这些人的努力。尽管他们毁容了,但他们从未被提及。
这
标题图片显示了亚马逊众包平台AMT平台的一名工作人员Kristy Milland,该平台目前拥有约50万名数据标签工人。文中,秦娇和李政均为化名