成熟的解决方案:阿里千万实例可观测采集器 - iLogtail 正式开源

优采云 发布时间: 2022-11-04 07:14

  成熟的解决方案:阿里千万实例可观测采集器 - iLogtail 正式开源

  11月23日,阿里巴巴正式开放可观察数据采集器iLogtail。作为阿里巴巴内部可观察数据采集的基础设施,iLogtail承载了阿里巴巴集团的采集工作和蚂蚁的日志、监控、跟踪、事件等可观察数据。iLogtail运行在服务器、容器、K8s、嵌入式等各种环境中,支持采集上百个可观察数据。目前有千万级安装量,每天都有采集几十PB的数据可用。观测数据广泛应用于在线监控、问题分析/定位、运营分析、安全分析等各种场景。

  - iLogtail 和可观察性

  可观察性并不是一个全新的概念,而是从 IT 系统中的监控、故障排除、稳定性构建、运行分析、BI、安全分析等逐渐演变而来的。与传统监控相比,可观察性是最重要的。进化就是采集尽可能多的可观察数据类型,以达到白盒化的目的。iLogtail的核心定位是可观察数据的采集器,可以提供尽可能多的采集类型的可观察数据,帮助可观察平台创建各种上层应用场景。

  阿里可观测数据的挑战采集

  对于可观察数据采集,有很多开源代理,例如Logstash、Filebeats、Fluentd、Collectd、Telegraf等,这些代理的功能非常丰富,这些代理的组合可以用于一定的用途扩展,基本可以满足各种内部数据的采集需求。但是,由于性能、稳定性、管控能力等一些关键挑战无法解决,我们最终选择了自己发展:

  1、资源消耗:目前阿里巴巴有数百万台主机(物理机/虚拟机/容器),每天产生数十PB的可观察数据。每1M的内存减少和每1M/s的性能提升对我们来说非常重要。资源节约量巨大,节约成本可能上百万甚至上千万。目前很多开源代理的设计更注重功能而不是性能,在现有开源代理的基础上进行改造基本上是不可能的。例如:

  2、稳定:稳定是一个永恒的话题。数据采集的稳定性不仅要保证数据本身采集的准确性,还需要保证采集的代理不能影响业务应用,否则影响将是灾难性的。在稳定性构建方面,除了Agent本身的基本稳定性外,还有很多开源Agent尚未提供的特性:

  3、可控:可观察数据的应用范围很广,几乎所有的业务、运维、BI、安全等部门都会用到,而且一台机器也会产生各种数据,同一台机器产生的数据会有也被多个部门的人使用它。例如,在 2018 年,我们计算出平均一个虚拟机上有 100 多种不同类型的数据。采集,10 多个不同部门的人需要使用这些数据。除了这些,还有很多其他的企业级特性需要支持,比如:

  基于以上背景和挑战,我们从2013年开始逐步优化和完善iLogtail,解决性能、稳定性、可控性等问题,并经历了阿里巴巴双十一、双十二、春晚红包等多个项目次。的测试。目前iLogtail支持Logs、Traces、Metrics等各类数据的统一采集。核心功能如下:

  三 iLogtail 发展历程

  秉承阿里人朴实的特点,iLogtail的命名也非常简单。我们一开始的预期是有一个统一记录尾日志的工具,所以叫Logtail。之所以加上“i”,主要是因为当时使用了inotify的技术。,可以控制日志采集的延迟毫秒,所以最后叫iLogtail。从2013年开始研发以来,iLogtail的整个开发过程大致可以分为三个阶段,分别是飞天5K阶段、阿里巴巴集团阶段和云原生阶段。

  

  1飞天5K舞台

  作为中国云计算领域的里程碑,2013年8月15日,阿里巴巴集团正式运营5000台(5K)服务器规模的“飞天”集群,成为国内第一家自主研发*敏*感*词*通用计算平台。全球首家提供5K云计算服务能力的公司。

  飞天5K项目从2009年开始,逐步从30台发展到5000台,不断解决系统的规模、稳定性、运维、容灾等核心问题。而iLogtail就是在这个阶段诞生的。最开始是为了解决5000台机器的监控、问题分析、定位(今天这个词叫“可观察性”)。在从 30 到 5000 的跃迁中,可观察到的问题有很多挑战,包括单机瓶颈、问题复杂性、故障排除的难易程度和管理复杂性。

  在 5K 阶段,iLogtail 从本质上解决了从单机、小规模集群到*敏*感*词*运维监控的挑战。这个阶段iLogtail的主要特点是:

  2 阿里小组赛

  iLogtail在阿里云飞天5K项目中的应用解决了日志统一采集和监控的问题。当时阿里巴巴集团、蚂蚁等还缺乏统一可靠的日志采集系统,所以我们开始将iLogtail作为一个集团推广,蚂蚁的日志采集基础设施。从5K等相对独立的项目,到全集团的应用,都不是简单的复制,而是要面对更多的部署、更高的要求和更多的部门:

  百万级运维问题:此时阿里巴巴和蚂蚁都有超过百万的物理机和虚拟机。我们希望只有 1/3 的人力可以操作和管理一个稳定性更高的百万级 Logtail:iLogtail 一开始,采集 的数据主要用于排查问题。集团广泛的应用场景对日志的可靠性要求越来越高,比如计费计量数据、交易数据,也需要满足双十一、双十二的要求。等待大数据流量的压力测试。多部门多团队:从服务5K团队到近1000个团队,不同的团队会使用不同的iLogtail,一个iLogtail也会被多个不同的团队使用,

  经过几年与阿里巴巴集团和蚂蚁同学的合作,iLogtail在多租户和稳定性方面取得了长足的进步。现阶段iLogtail的主要特点有:

  日志顺序保存采集方案原理(详见《iLogtail技术分享(一):轮询+Inotify组合下的日志顺序保存采集方案》)

  多租户隔离整体流程(详见《iLogtail技术分享(二):多租户隔离技术+双十一实战效果》)

  3 云原生阶段

  随着阿里所有IT基础设施的全面云化,以及iLogtail产品SLS(日志服务)在阿里云上的正式商用,iLogtail已经开始全面拥抱云原生。从阿里巴巴内部商业化和对外各行各业提供服务来看,iLogtail挑战的重点不是性能和可靠性,而是如何适应云原生(容器化、K8s、适应云环境),如何做到兼容开源协议,如何处理碎片化需求。这个阶段是 iLogtail 增长最快的时期,经历了很多重要的变化:

  

  iLogtail Kubernetes log采集原理(详见《Kubernetes log采集原理解析》)

  iLogtail插件系统的整体流程(详细请参考《iLogtail插件系统介绍》)

  四 开源背景及期望

  封闭自建的软件永远跟不上时代的潮流,尤其是在云原生时代,我们坚信开源是iLogtail最好的发展战略,也是释放其最大价值的途径。iLogtail作为可观察领域最基础的软件,已经开源,我们希望与开源社区一起共建,不断优化,努力成为世界一流的可观察数据采集器。对于iLogail未来的发展,我们期待:

  与其他开源采集软件相比,iLogtail在性能和资源使用上具有一定的优势。与开源软件相比,在千万级部署和每天几十PB数据的规模下,内存和年存储容量减少了100TB。1亿个CPU核心小时。我们也希望这个采集软件能够为更多的企业提升资源效率,实现可观测数据的“共同繁荣”采集。目前iLogtail还只是在阿里巴巴和少数云企业中(虽然有几万,但是面对全球数百万的企业,这个数字还是很小的),场景比较少. 我们希望有更多不同行业、不同特点的公司可以使用iLogtail,对数据源、处理和输出目标提出更多要求,丰富iLogtail支持的上下游生态。性能和稳定性是 iLogtail 最基本的追求。我们也希望通过开源社区吸引更多优秀的开发者共同打造iLogtail,不断提升这个可观察数据采集器的性能和稳定性。

  链接摘要:

  1)阿里官方开源可观察数据采集器iLogtail:

  2)《iLogtail技术分享(一):轮询+Inotify组合下的日志顺序保存采集方案》:

  3)《iLogtail技术分享(二):多租户隔离技术+双十一实战效果》:

  4)《Kubernetes日志采集原理解析》:

  5) 《iLogtail插件系统介绍》:%26designs/Overview.md

  作者 | 元一

  原文链接:

  最佳实践:宝塔实测搭建PHP校园疫情防控系统源码

  大家好,我是审稿人,欢迎来到网络审稿。

  本期为大家带来一个PHP校园疫情防控系统源码。

  运行环境文字搭建教程下载源码,给宝塔添加站点,创建数据库,导入school.sql数据库文件,将后台代码压缩上传到宝塔根目录网站,修改根目录.env和/config/database.php文件中的数据库信息网站运行目录指向public,伪静态设置如下规则:

  location / {

if (!-e $request_filename){

<p>

rewrite ^(.*)$ /index.php?s=$1 last; break;

}

}</p>

  .后台地址:域名/用户/登录后台默认账号密码:admin 123456 功能介绍:

  本系统功能包括师生角色权限、大数据图表展示、扫码进出校园、校园出行记录、二维码生成、学生管理、网站管理、学生打卡打卡-in 和其他功能。

  系统测试截图

  

  获取方法

  //ceping.club/761.html

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线