免规则采集器列表算法(大数据杀熟中的“熟”已经不单单局限于)
优采云 发布时间: 2022-03-20 08:13免规则采集器列表算法(大数据杀熟中的“熟”已经不单单局限于)
Junction News 假期快到了。在南京工作的姜女士本打算回哈尔滨老家探望父母,但在网上购买机票时,却发现有“小事”。同一航班、同一班次,用蒋女士自己的账号购买,比用同事的账号购买要贵几百元。“前段时间,我频繁搜索几条回家的路线,应该是被大数据‘扼杀’了。”
为有高消费能力的人推荐高价产品。同一行程不同用户网约车平台显示的车费不一样……现实生活中,很多人都感觉像蒋老师一样被“监视”、“涨价”,这是为什么呢?会不会出现杀戮现象?算法如何调整商品的价格?如何有效保护个人信息安全?《科技周刊》记者邀请相关专家为大家解答。
为什么同一程的*敏*感*词*票价不同?
同时,同一起点、同一目的地,不同手机使用打车软件跳出的价格也不一样;购买外卖平台的会员以为每次点外卖都能省不少钱,但实际上外卖总价比不外卖要高。会员“悄悄”高多了……很多人在不知不觉中被大数据“割韭菜”了。从最早向老客户推销高价,到个性化推送下的精准“杀戮”,大数据杀戮在日益激烈的竞争中越来越隐蔽。“大数据熟练度是指对于同样的产品或服务,老客户看到的价格比新客户贵很多的现象。但同样的商品或服务以不同的价格出售给不同消费者的销售模式仍然存在。网络平台制定的极其复杂的销售策略,让普通消费者无法通过数百种价格组合来明确实际合理的价格。在这种情况下,普通人很难注意到“价格歧视”的现象。东南大学网络空间安全学院副教授宋玉波解释说,大宗商品价格的波动通常收录很多因素。以在线打车平台为例,每次出行的定价是根据乘客定位、实时路况、预估里程和时长计算得出的。在如此复杂的价格计算系统中,
“也就是说,相对独立的交易模式,让平台可以‘钻空子’。” 将部分用户收取的额外费用补贴给新用户或为自己的平台运营,无异于“拆东墙补西”。然而,近年来,被大家诟病的大数据杀戮现象为何频频发生?对此,宋宇波认为,主要原因有两个:算法的设计和实现是技术人员的主观判断和行为,使用方式导致差异化判断,是现实中无法回避的问题。“在整个处理过程中,这种商业模式会对价格敏感的用户进行商业促销,实际上造成不同用户的区别对待,造成不公平的消费交易;另一方面,这种精细化的营销模式被滥用,即在营销过程中,公司不是简单地针对特定的价格敏感用户进行价格促销,而是同时人为地为不了解价格的用户抬高价格。对价格不敏感。与统一定价相比,差异化定价行为可以提高商家的利润。“无论是技术还是商业策略,大数据都会被企业自觉或不自觉地使用,这也是杀戮现象频频发生的原因。” 宋宇博说道。这实际上导致不同用户被区别对待,造成不公平的消费交易;另一方面,这种精细化的营销模式被滥用,即在营销过程中,公司不是简单地针对特定的价格敏感用户进行价格促销,而是同时人为地为不了解价格的用户抬高价格。对价格不敏感。与统一定价相比,差异化定价行为可以提高商家的利润。“无论是技术还是商业策略,大数据都会被企业自觉或不自觉地使用,这也是杀戮现象频频发生的原因。” 宋宇博说道。这实际上导致不同用户被区别对待,造成不公平的消费交易;另一方面,这种精细化的营销模式被滥用,即在营销过程中,公司不是简单地针对特定的价格敏感用户进行价格促销,而是同时人为地为不了解价格的用户抬高价格。对价格不敏感。与统一定价相比,差异化定价行为可以提高商家的利润。“无论是技术还是商业策略,大数据都会被企业自觉或不自觉地使用,这也是杀戮现象频频发生的原因。” 宋宇博说道。在营销过程中,公司并不是简单地针对特定的价格敏感用户进行价格促销,而是同时对价格不敏感的用户进行人为的提价。与统一定价相比,差异化定价行为可以提高商家的利润。“无论是技术还是商业策略,大数据都会被企业自觉或不自觉地使用,这也是杀戮现象频频发生的原因。” 宋宇博说道。在营销过程中,公司并不是简单地针对特定的价格敏感用户进行价格促销,而是同时对价格不敏感的用户进行人为的提价。与统一定价相比,差异化定价行为可以提高商家的利润。“无论是技术还是商业策略,大数据都会被企业自觉或不自觉地使用,这也是杀戮现象频频发生的原因。” 宋宇博说道。
我们如何被算法“标记”?
在网购的过程中,很多人都有这样的感叹——“它怎么知道我要买这个?” 在实时刷新的“猜你喜欢”榜单中,最懂你的“人”往往伤你最深。大数据为何能“见人做饭”,实现“精准杀戮”?答案是:用户画像。宋宇波告诉《科技周刊》记者,用户画像是指通过采集各类用户相关信息,识别出用户各种高度精细化特征的人工智能算法。“每个特征描述用户的一个维度,用户画像多维度描述用户,实现对用户的精准定位。” “用户画像也叫用户信息标注,它采集用户的社会属性、消费习惯、偏好特征等维度数据,然后描述用户或产品的特征和属性,并分析这些特征以挖掘潜在价值信息,从而抽象出用户信息的全貌,可以看作是大数据在企业中的应用。基础是精准投放和个性化推荐的基础。”李云介绍,用户画像的构建过程主要包括数据采集、行为建模和画像构建,而用户画像的核心是“给用户贴标签” ”。用户的每一个具体信息都被抽象成标签,这些标签用来具体化用户的形象,从而为用户提供有针对性的服务。其中,“标注”的方式其实有很多种。李云解释说,一种有效的方法是将产品或品牌标签“倒转”给消费者,根据每个消费者的行为累积不同的标签权重,依靠权重进行标签校准,动态生成准确的用户标签。例如,某用户消费某品牌产品超过1万元,或在某品牌产品前停留20分钟以上,可以总结出其特征偏好、品牌偏好以及对应的消费水平。“另外,更常规的做法是根据年龄、性别、地区、收入水平等明显的标签对整体用户群体进行分类,也就是‘人口属性标签’。” 李云说,这种方式虽然在一定意义上能够为用户画像提供更准确的参考,但对于洞察用户的实际需求,向用户推荐产品或服务的核心价值并无多大帮助。消费者购买力评价也是一种常用的“标注”方式,即根据用户的点击、采集、加载、购买等行为,同时综合考虑用户年龄、*敏*感*词*等基本属性、工作性质等来推断用户的消费能力。. “消费能力通常是一个动态属性,会根据用户当前的行为进行调整。” 宋宇博说道。但对于深入了解用户的实际需求,向用户推荐产品或服务的核心价值,帮助不大。消费者购买力评价也是一种常用的“标注”方式,即根据用户的点击、采集、加载、购买等行为,同时综合考虑用户年龄、*敏*感*词*等基本属性、工作性质等来推断用户的消费能力。. “消费能力通常是一个动态属性,会根据用户当前的行为进行调整。” 宋宇博说道。但对于深入了解用户的实际需求,向用户推荐产品或服务的核心价值,帮助不大。消费者购买力评价也是一种常用的“标注”方式,即根据用户的点击、采集、加载、购买等行为,同时综合考虑用户年龄、*敏*感*词*等基本属性、工作性质等来推断用户的消费能力。. “消费能力通常是一个动态属性,会根据用户当前的行为进行调整。” 宋宇博说道。即根据用户的点击、采集、加载、购买等行为,同时综合考虑用户的年龄、*敏*感*词*、工作性质等基本属性来推断用户的消费能力。. “消费能力通常是一个动态属性,会根据用户当前的行为进行调整。” 宋宇博说道。即根据用户的点击、采集、加载、购买等行为,同时综合考虑用户的年龄、*敏*感*词*、工作性质等基本属性来推断用户的消费能力。. “消费能力通常是一个动态属性,会根据用户当前的行为进行调整。” 宋宇博说道。
卸载后重装能避免“杀”吗?
当我们很长时间没有使用某个平台时,有时会收到来自该平台的短信,而且大部分内容都是礼包,希望我们可以再次使用。对此,有网友建议,长时间使用某个平台后,可以将平台卸载重装,从而触发平台的“客户流失预警”,获得与新人一样的优惠价格。这种方法可行吗?“每个平台都有自己设计的算法,可能会有更强调平台卸载的行为模式,但这应该只是决策的因素之一,通常不会占主导地位。” 宋宇波介绍,算法会采集大量的用户特征综合判断,不会仅仅基于特定的行为模式,所以这种卸载软件再下载重新安装的方法效果不大。在大数据时代,利用人工智能、机器学习算法等技术实现信息采集、判断分析和预测的应用越来越广泛。算法要想做出更准确的判断,提供更精细的服务,必然涉及到大量个人信息的采集。如何更好地避免大数据杀戮?源头治理至关重要。8月20日,十三届全国人大常委会第三十次会议表决通过《《中华人民共和国个人信息保护法》,其中明确禁止杀戮大数据;管理条例(征求意见稿)》指出,用户可以选择关闭算法推荐服务。随着中国网民突破 10 亿大关,算法显然面临着更严格的监管。“由于线上消费者只能被动接收平台呈现的信息,很难与其他用户进行信息交流。在一定程度上,这样的现实场景成为商家获利的温床。” 李云建议,个人用户在网上购物时需要加强防范。,及时关注市场价格变化,与他人沟通比较价格,
新华日报交点记者 谢世涵
图片来源视觉中国