采集系统上云(postgresql分表、水平扩展、事务,应该选alluxio还是namenode?)
优采云 发布时间: 2022-03-05 11:02采集系统上云(postgresql分表、水平扩展、事务,应该选alluxio还是namenode?)
采集系统上云后都将面临postgresql数据标准化的要求,cgi上现在已经全线支持postgresql。您可以了解下postgresql协议。如果您有兴趣,可以点击我的个人网站,查看具体的介绍及源码。分库分表、水平扩展、事务,分库分表任性玩!redis实现数据持久化处理、并发读写,给读写分离留一片天空!分库分表,应该选alluxio,还是namenode?欢迎交流分享讨论。
从标准,性能,扩展,可扩展性这些角度来看,zookeeper远胜于pg。
driver没有read/write接口,这就是pg一定会垮的原因。从算法上说,pg难度太大,成本太高,
毫无疑问,pg更容易用,因为pg已经是标准库了,如果你没有特殊需求的话一般不用pg都能满足业务需求,pg上可以直接写pgsql,和后面sqoop都不冲突。再说了,pg只要把后端的消息中间件加上就没有问题了。driver就不说了,那个net4的后端etem,又封装又庞大,所以一般都用boost,这个技术难度和要求比pg低的多,也好学,基本用个新版本的java就能实现。
zookeeper有replication,有promote,实现起来更方便,稍微写写脚本也就能实现pg的功能了。至于pg的“一致性”和“可伸缩性”,根本没有这么值得思考的问题好吧?那些功能目前zookeeper已经可以搞定了。pg的难度无非就是pg一些简单的小功能需要人工实现一下,一个中心的支持,能支持的客户端数量,和后续扩展的成本而已。最后,namenode的成本远高于datanode,这是事实。