excel抓取网页数据(数据导出简述业务流程数据插入中间表,走产品流程)
优采云 发布时间: 2022-02-07 03:06excel抓取网页数据(数据导出简述业务流程数据插入中间表,走产品流程)
制作示例:水壶数据导出
简述业务流程数据插入中间表,经过产品流程kettle从中间表中获取需要抓取的结果,根据抓取结果获取对应的数据数据处理,导入目标表,删除中间表,走产品流程
所有产品工艺这里不详述,仅针对水壶部分
**kettle 获取需要从中间表中取出的结果
**
配置kettle数据库连接
#loc4
loc4/type=javax.sql.DataSource
loc4/driver=oracle.jdbc.driver.OracleDriver
loc4/url=jdbc:oracle:thin:@127.0.0.1:1521:aaa001
loc4/user=system
loc4/password=a1234
JNDI配置的url需要注意数据库是否为rac
loc4/url=jdbc:oracle:thin:@127.0.0.1:1521:aaa001
最后:服务名称或使用/实例名称。这里,在oracle中部署rac集群的时候,需要注意服务名和实例名的区别,配置后需要测试
使用表格输入控件抓取中间表格的数据
注意所选数据库的连接,以及测试结果
根据抓取结果获取对应数据
使用数据库连接控件连接数据表
将预排序操作的结果作为参数
数据处理
结果值转换值映射器控件
可以选择默认值,默认不会更改字段名,保留原字段名
如果该字段为空且需要对应的结果,则需要插入一条源值为空的记录
使用 Modified javascript Value 控件修改结果值
脚本函数可参考函数示例,可提前测试结果
注意控件名称,使用后及时调试
逻辑判断控制开关/案例
多行到多列行非规范化器控制
注意type的值的添加
导入目标表
因为勺子是一个界面类软件,所以主要的操作都放在了截图里。对于这个相对简单的流程,这些控件已经满足了大部分的需求。关于修改后的javascript控件中的一些操作,在实际生产中,我直接使用sql中的函数进行处理,这里特意展示一下。. 两人的角色不同。如果业务简单,两者都可以实现,但是如果面对不同的数据库,可以通过控件实现对不同数据库的操作。这方面要看生产需求和开发习惯。