关键词自动采集、短网址*敏*感*词*好像是这个公司
优采云 发布时间: 2021-04-14 19:07关键词自动采集、短网址自动切词、短网址*敏*感*词*
好像是这个公司:。开发是@王成老师,原型是leox,核心应该是百度,除此以外其他公司应该没有开发能力吧。
主要是url规范
1)短网址的生成系统
2)短网址与长网址的转换
3)关键词的智能化过滤
4)短网址的多平台推广
5)智能短网址的定制化开发
phpwind是一个基于url规范的产品,其特点是灵活,支持各种地址规范,上述几点最直观的体验还是在编辑器上面,实在是比较方便。
楼上说的x-hansx-hans-tools都很赞,不过这个只是理论上,在实际应用时,由于是国外的产品,有几个很大的问题,第一中文网站多,一旦引起bug就不容易定位问题在哪里;第二语言壁垒问题,比如你在x-hans里注释了中文,一样的就得翻译成英文才能保证api质量;第三国内网站多,x-hans会抽风,造成不稳定。现在,github出了一个x-hans-tools,可以解决上面的几个问题。
用过百度手动扒带地址的短网址,感觉特别慢,一般都是200kb/s左右,国内的api服务百度不开放,第三方很难爬;美国人好像搞了个wordpress的一个项目,使用url规范实现。
国内的产品(目前版本)是swire(js)转换,url转换,url转换(排序过滤,词云过滤)。跟国外的没什么不同。