Skip to end of metadata
Go to start of metadata

Q1:请教个kvm 的问题, dell 2950服务器. cpu虚拟化已经开启了, cpuinfo里面也能看到, 但是dmesg中搜索不到kvm. 命令行提示主机不支持 虚拟化选项。

A1:kvm提示不支持虚拟化,原因我看有人总结了:BIOS设置或版本升级一下,qemu-kvm模块,ssl安装或版本升级一下yum -y install qemu-kvm openssl openssl-devel python-virtinst libvirt libvirt-python virt-manager libguestfs-tools bridge-utils virt-install。

A2:主板开启CIP虚拟化,但cpu本身不支持。


Q2:1. 内网信息安全管控 都怎么做的?

A1:Dlp。

A2:rms微软的, 或者用一些第三方的桌面管控工具, 或者vdi。

A3:安全加密网关+机器绑定。


Q3.1:动作里的这个红框的作用是什么?

A:这个动作持续时间,整个时间段都在做这个动作。


Q3.2:是这个小时内这个动作一直在操作吗, 比如我发短信的动作他会一直发吗?

A:是的,整个动作流程会重复一个小时,你设置告警出发条件确认就好了,确认了就不继续发了。


Q4:这个一直显示 不知道怎么解决?

A:看日志,日志里面有失败原因。


Q5:为什么报警里面有空格 使用宏的时候就是截取空格前面的部分?这个ITEM.VALUE1中包含空格,然后我通过脚本接的时候只拿到了空格前面的部分。

A1:空格要转译的, 空格在shell里 个特殊字符 需要转译, $2 含有空格 特殊字符需要转译。

A2:传递参数包含空格的话加个双引号,这个动作为什么会触发两次,,执行了两次脚本。

A3:你在动作里面定义不同的操作的内容进行区分, 区分告警,恢复,确认的内容不一样。


Q6:谁了解表结构?

A:非一次性的工作,一般建议用api,要不然版本升级后会可能会很麻烦。


Q7:同一个监控项有时成功有时失败?直接send数据上去,不知道是不是与发送的数据量大有关, 感觉也不是数量的问题。

A1:你看下周期, 应该是发的太频繁了, 默认最快响应30秒, 也就是说你的服务端监听进程是不是都被跑满了。

A2:定时处理好数据放在临时文件里,定时去取。

A3:可以换个思路,服务器发起get,在执行脚本,你的脚本执行一次5分钟才能抓完数据,有点慢,监控项周期调大点,还是用send好一些。


Q8:连接不上zabbix数据库 知道什么原因?密码在配置文件中还是不行。

A1:你服务器上边直接用你配置文件里边写的账号密码手动连接试试.

A2:php和zabbix的都要写,还要重启。


Q9:pgAdmin上用用户名和密码是可以连接的,这是不是表示在服务器上连接是成功的了 ,这就是日志,但是不知道什么原因。

A1:要给zabbix数据库赋权限。

A2:看到关键词了?permission denied 说了权限不足,那么增加权限。


Q10: 用Zabbix默认的key,监控mysql5.6不出图知道是什么原因?

A1:看模板里面的监控项 右边的是不是启用还是不支持, 如果是启动,用zabbix-get看下数据有没有, 看下这个脚本的用户和组。

A2:是用root用户启动的,其他的主机也是这样启动的,服务端用zabbix_get可以调用命令查看zabbix客户端的mysql版本。

A3:切换到Zabbix用户,看有没有权限,启动agent的时候是用root账号执行的,但是抓出来进程是Zabbix。

A4:你用services的方式启动服务的时候,使用service里面配的用户启动的。配的zabbix就是zabbix,把mysql环境变量配进bashrc-profile去。


Q11.1: 请教下,server端和mysql数据库不在同一台服务器上,我zabbix_server.conf里面已经设置好dbhost地址,但是我在web端配置mysql的时候还是报错,防火墙什么都已经关了,这个问题有碰到过么?

A1:使用命令可以连接mysql -h **** -u zabbix –p。

Q11.2:那应该是看mysql服务器的/etc/my.cnf还是server端的/etc/my.cnf?端口也正常, 没有找到zabbix.conf.php这个配置文件, 没有配过

A1:测试端口是否正常.

A2:登陆一下 你的Zabbix web界面不就知道了吗,没有的话,有提示, 还会自动生成一个,拿下来 放到发布目录。

A3:zabbix 启动日志呢,一般启动失败都是因为 连接数据库的问题。执行下这两个命令就好了 setenforce 0 getenforce。


Q12:Zabbix怎么做到内网非法DHCP服务器报警?

A:恐怕 是你配置的问题,交换机上可以配置信任那个dhcp服务器。


Q13:请问下unreachable for 5 minutes怎么频繁上报?

A:如果被监控端正常,可能是zb_server到服务器的,网络有问题。


Q14:Trigger触发事件后,清除的时候不调用action的问题吗?action的Recovery Message已经勾选了,其他的清除事件都可以正常触发action。权限看了也没有问题,还可能会有其他的原因吗?

A:什么叫清除?是故障恢复么?根据个人经验,zabbix的告警动作没出过错,错的都是配置的人。


Q15:有做过snmp 监控交换机的模版?发现自带的监控的东西挺多了 只想监控流量跟 staus 状态,而且自带的 全部的口都监控上了 我要的是监控 口就行了 其它的过滤掉。

A:可以改改自带。


Q16:Docker zabbi启动不起来,是搭建好没有正常监控起来 ?

A:搞清楚 docker网络再说,127.0.0.1 是什么意思。


Q17.1:几个contain网络是如何的127.0.0.1 是指server呢 还是agent?

A1:你这是不同的contain每个container 有自己的ip不是127。

A2:如果是一台server和agent就可以用127,因为这个需要自动发现。

Q17.2:怎么设置?

A1:先搭建server之后再安装agent。

Q17.3:server和agent都是本机 他们之间互相通信也是需要操作网络通信的吗?

A:它们都在本机,网络通讯也需要走标准协议,只不过不经过外网口,也就是说docker与本机的网络实际上是隔离的 他们之间需要建立container 网络通信。

A2:docker我觉得最简单也是问题最严重的应该是host网络,因为复制的宿主机的网络模式,宿主机的网络模式在容器中都可以看到,这种网络模式跨宿主机的网络通信比较简单,跨宿主的容器通信overlay模式貌似还不错。

A3:你说的是桥模式吧,主机模式好像不能跟其他宿主机通信吧
基于Docker run创建docker容器时,可以使用--net选项指定容器的网络模式,Docker默认有一下四种网络模式':
1)host模式:
默认docker容器运行会分配独立的networknamspace隔离子系统,基于host模式,容器将不会获得一个独立的networknamespace,而是和宿主机共用一个network namespace,容器将不会虚拟出自己的网卡等信息,而是使用宿主机的IP和端口
2)container模式
其实container模式,其实就是容器之间共享一个networknamespace,而不是和宿主机共享,也就是说新创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享网络环境,同样,两个容器除了网络方面相同之外,其他的包括文件系统,进程列表等还是隔离的,
3)None模式:
None模式与其他模式都不同,这种模式docker容器会拥有自己独立的networknamespace,但是呢,并不会为docker容器进行任何网络配置,也就是说,该docker容器没有网络信息,需要手动自定义等,我们可以借助pipwork工具为docker容器指定IP信息等;
4)Bridge桥接模式
bridge模式是docker默认的网络模式,该模式宿主机会为每一个容器自动分配一个networknamespace,默认会将docker容器连接到一个虚拟网桥交换机docker0上,
调整了 docker run --name zabbix-agent -e ZBX_HOSTNAME="server-agent" -e ZBX_SERVER_HOST="zabbix-server" --link zabbix-server-mysql:zabbix-server -d zabbix/zabbix-agent模式,正常使用了。


Q18:监控 图形中的时间和系统时间不一样怎么解决?服务器时间和php.ini都设置为亚太上海时区了,日期对了时间却是07:11。

A1:检查下server和对应agent的系统时间。

A2:设置服务器时间。


Q19:docker下安装的zabbix server+agent 已经成功监控,怎么设置报警和邮件告知,还得需要在docker下面操作吗?

A:告警是触发器的动作,邮件告知要设置邮件参数。


Q20:1. 监控MS SQL 需要在服务器上安装agent吗?模板中的ps脚本怎么搞?难道需要把Zabbix装在windows平台吗?

A:zbx-agent 有windows版本的。


Q21:Zabbix4.0升级至4.2时说需要替换web文件,但是在网上找到的文档都说是替换nginx的文件,我这里没有安装nginx,用的是apache,请问替换web需要替换那些文件?我看官方文档里说是url变了,但是我/var/www/html目录下是没有东西的,之前4.0的时候就是空的。

A:因为zabbix 4 里面 支持javascript 处理 item。


Q22:外部的sh脚步怎么调用docker里面的数据库?

A1:这样应该可以 docker exec CONTAINER_NAME "COMMADN",是调用mysql,docker里面的 。mysql

A2:可以使用host模式 把端口映射出来就OK了。


Q23.1:Zabbix主机添加加密大家用的那种方式呢?1).PSK还是证书加密,两种加密的优缺点呢 2).可以同时使用两种方式加密吗?

A:我记得只能配置一种。最终是对TCP链接进行加密,会让完成正常通信链接慢很多,除非特别需要,一般内网通讯能不加就不加,浪费服务器资源。 再说了如果是内网,人家都已经能在你环境内抓包了,你还有什么不能让人家看得

Q23.2:是的,我想使用PSK加密的方式,因为Zabbix机器部署在了云主机上,所以领导说为了安全看看能不能做一个加密处理,请问在哪里可以看出加密后链接会很慢呢?还有你们对Zabbix安全设置是如何做的呢?

A:1、加密后链接建立变慢是因为:开启加密后,会针对每一次数据传输的tcp连接建立过程增加加密协商过程。
2、被监控设备也都在同一个云上的vpc吗?如果不是,网络稳定的问题比是否加密更严重,网络不稳定,数据收集异常,会让误告把运维烦死。
3、安全措施,云上安全组限制入网IP、变更监听端口到非10050-10052(agent、proxy/server、java-gateway),或者索性使用vpn,将server与proxy间建立vpn隧道交互数据(因为vpn是加密通信通道了,tcp链接就没必要再加密了)。


Q24:有知道是什么原因?

root@9965c05e6445:/var/lib/zabbix# zabbix_get -s 172.17.0.4 -p 10050 -k "MySQL.Threads-connected"

zabbix_get [630]: Get value error: cannot connect to [[172.17.0.4]:10050]: [111] Connection refused

A:看下agent的配置文件server有没有加ip。


Q25: 有人遇到这种情况吗?

A1:数据库的账号密码配的不对吧。

A2:userparameter的命令是否正确, 执行的命令,看上去没有用密码登录,相关信息如下。


Q26:zabbix有用UDP端口?

A:应该不用,snmp是udp端口。


Q27: 有试过在zabbix上用agent监控模式直接读取linux服务器上的系统日志 这操作吗? 有什么模板可用?

A:日志内容还是分析,logrt函数就提供日志服务功能。


Q28:有对windows用户登陆做监控?配置成1才报警

A:触发器是表达式返回结果的布尔值,ture代表触发
{Template OS Windows:eventlog[Security,,"Success Audit",,^4624$,,skip].nodata(60s)}=1,这个是抓登陆日志,nodata nodata为真是1 日志不存在的成立的话返回1,这个表达式{Template OS Windows:eventlog[Security,,"Success Audit",,^4624$,,skip].nodata(60s)}=1,就是日志不存在时报警 按理应该是日志在60s内存在,就报警,应该是nodata为假时报警。


Q29:vcenter6.7,Zabbix能支持吗?

A:采用snmp进行监控。


Q30:字体都改了,为什么图形还是显示不了中文?


Q31:切换到Zabbix用户,手动执行脚本未报错,会是哪方面的原因导致的?

A:一个是权限,一个可能是脚本里面的环境变量。


Q32:怎样自动发现windows进程cpu.mem吗?

A:powershell输出json。


Q33:Zabbix监控sql server有什么好的模板么?

A:MySQL的percona模板。


Q34:Zabbix监控exsi的raid/磁盘在线有什么好的模板么?搞了有几天了。ipmi和uuid的方法基本都监控到了,就是没有磁盘。snmp我在exsi的管理卡来了snmp v3 在zabbix server还需要配置什么吗 snmpwalk看不到exsi远程管理卡的信息。关于监控远程exsi的raid/磁盘在线情况,有什么思路可以提示吗?

A:一般都是开启snmp,配置这个模板。


Q35:proxy代理方式为什么Zabbix可用性显示为红色的?

A:看报错是链agentd的问题。


Q36:原先的proxy服务器换掉了,232那台,换了新的proxy,59那台,proxy的hostname一样,为什么一直报错呢?

A:是232那台的proxy进程没停。虽然我把proxy卸载了,但是进程还在。


Q37:为什么页面上设置数据更新时间为3秒,web上图形中显示的数据变化曲线是4秒变化,然而进mysql-zabbix查数据,显示却是数据间隔了6秒?

A:这个应该在模板中设置的。


Q38:linux centos 7 64位,应该下载哪个agent?


Q39:{#SNMPINDEX}这个变量类型是什么?最大取值是多少? 现在发现取不到8位数?

A:这个是取index的,不是取数值的。


Q40:zabbix监控redis中每个key的数量和写入量有没有好的办法?

A:shell。


Q41:配置了一条监控触发器。这个监控项会一直curl一些url的响应时间,报警条件是超过阈值和curl不通的情况下报警,现在有一个现象就是,这个监控项目在刚才114dns的问题上取不到数据,返回为空,导致我的zabbix没有报警,我刚刚用了触发器的nodate表达式也测试了一下,好像也不行,想问一下有什么好的建议?

A:抓不到数据一定就是用nodata()。


Q42:这个监控只能用文档上这些key吗,能自己加吗,比如hypervisor的cpu ready?

A1:用userparameter解决。

A2:有了这个性能计数器,虚拟化层的都能得到。


Q43:zabbix4.0如何升级zabbix4.2?


Q44:怎么解决,清理缓存还是不行?

A:强制刷新,ctrl+F5。


Q45:有人用zabbix4.2了吗?对环境有啥要求吗?

A1::劝你们先不要升级。

A2:拿你应该先升级到3.2 版本再说,那你应该先考虑 升级lnmp环境 再说。


Q46:用Zabbix监控jmx,添加默认模板后有些监控项不支持 然后用jmxclient测试后发现有些参数没有 比如GarbageCollector 还有MemoryPool。然而我想监控jvm的垃圾回收 怎么办?

A:自己配key值吧,模版里面有些key不适用。需要自己找到对应的bean。 你观察下jmx模板里面的键值,然后看下 https://www.jianshu.com/p/803d3608c83f 这篇文章,你会发现jmx配的参数就是各种ObjectName和Mbean,然后你找到GC和MP等你需要的tomcat参数的Mbean,type什么的配进去就行。


Q47:Zabbix 可以监控海康威视的录像机和摄像头状态吗?

A:海康威视设备产品带有snmp 可以实现的。


Q48:监控数据库MySQL报错:

Value "ERROR 1044 (42000): Access denied for user 'zabbix'@'localhost' to database 'ping'

0" of type "string" is not suitable for value type "Numeric (unsigned)"

ERROR 1044 (42000): Access denied for user 'zabbix'@'localhost' to database 'ping'

A:第一、检查你的数据库机器可以ping命令,第二尝试使用mysql -u zabbix -p的登陆数据库检查数据库是否正常


Q49:IPMI监控不到数据,怎么办?

A:第一点先后台确认是否硬件设备的IPMI协议有这些sensor名称。第二找到正确的IPMI协议获取正确的seneor名称。


Q50:请问有谁知道qyapi.weixin.qq.con的全部ip啊,微信报警老是漏报?

A1:域名后的ip肯定是不固定的,就算你暂时能稳定,也会有变得风险,你可以写个脚本,实时获取当前域名解析的ip

A2:访问域名就可以了,跟ip没有关系,漏报就查漏报的问题。


Q51:Zabbix能使用ad域账户登录吗?

A:配LDAP就行了,端口和bind不是标准的,正确定位到就行,Ad里必须要有admin用户,端口好像不是389。


Q52:zabbix[wcache, values, all] 这个简直采集的数据默认单位为什么是M?

A1:可能是转换过的,你可以去最新数据里面确认一下。

A2:请先查看官网文档


Q53:Zabbix 负载均衡 有人做过吗 ,就是 web 用Nginx 做负载均衡 mysql用mysqlrouter 做负载均衡和读写分离,一方面是负载均衡 一方面也有高可用?

A:高可用用keepalived,:nginx的upstream倒是也可以,架构这东西要看具体使用场景,对于zabbix,就找个虚拟机做就行,定期的备份虚拟机就好了,web负载lvs+kp这一般都是应用系统了,你要是怕监控断了不告警,那就用代理,或者异地多点监控。


Q54:使用Zabbix4.0 通过API查询告警信息,查询的账号只能是超级管理员才有数据吗,以前3.0是一般人员就可以了,不知道哪位大神遇见过这个问题?

A:可能是权限问题。


Q55.1:端口呢?之前nat模式可以登录 我改成桥接了,电脑防火墙和linux的都关了。

A:地址变了吧,桥和nat访问的地址应该是不一样的啊,telnet ip 80试试。

Q55.2:地址变了 我用的是桥接的地址 可以ping通 但是登不了web?

A:登陆服务器,看看iptables或者firewall。

Q55.3:单纯的域名也是正常的、但是域名加端口就不行了

A:我这边的zabbix是标准的rpm包,我自己做了一个nginx的反向代理,配置了https和http重定向+ca证书。你试试这个可以不http://ait-shanghai.chinalliances.com:8090/Orion/SummaryView.aspx?ViewID=1。上面是ip 下面url,我建议你抓下包看看,这个截图是ie,火狐 chrome safari和opera 都是一片白,这个网站是不是有waf。或者查一下 web服务器的安全设置,是不是某些请求被限制了,我也发现个小问题,我的url里面放http 就访问不了,我这个问题是因为 在https的连接中,发起了http请求,浏览器认为是弹出不可信窗口,会有拦截提示。


Q56:我这边取消http就更新不了,无法更新聚合图形。

A:hrl必须补全http,url,带http或者https才叫url,不带这个前缀的叫域名,百度现在是强制https 用http会被重定向,163 支持http和https,你还是找web服务器的安全选项吧,或者抓包分析。


Q57:升级完4.2之后,监控,看历史数据,告警等其他功能都没有问题。就是感觉php-fpm跟不上了。。首页一直刷不出来,php cpu还占的特高。调了些php-fpm的参数,但还是有问题。有人遇到过这个问题么?

A1:可以看到swap被大量使用,性能会好就怪了。数据量大监控项多,一定要分而治之,高负载只能用多台机器去分散压力。

A2:横向扩展会更好一些的,垂直不是太好的。许多问题不好判断的。


Q58:有谁玩过Zabbix故障自愈的,检测到某个服务挂了自动执行一个脚本来启动服务。

A:那不就是动作么,告警关联动作。

A2:action里面的condition了解下,可以选择登录对应主机执行命令。


Q59:在operations里面添加要执行的脚步,文档中的icmpping默认值,怎么去查?点击默认值表后,要login?

A:icmpping,就是默认的key。


Q60:这里SQL查询有两句,不能出结果。是不是要把USER 默认DB设置成SPM_P用一句查询才可以?

A:spm_p.表名。


Q61:现在一台 1c2g 一个模版监控了19台交换机。出现这个是不是负载太高了?改了Cache 好了,你们一般Cache 一般设置的多少?

A:cache free大于80%。


Q62:Zabbix-proxy与server网络短暂不通,这段时间proxy收集的监控数据,就不会汇报到server里面,哪位碰到过 proxy为主动模式?

A:主动模式 你就要解决网络质量的问题 最好采用BGP 多线的那种。


Q63:我自定义一个监控项手动运行ssl_certificate可以获取到值 在zabbix server获取不到值?

A:想办法把前后的空格都去掉 执行完后,就只剩数值,没有空格和换行,就可以了 不是这个问题?那重启一下AGENT。


Q64:需要在zabbix上监控远程exsi主机的raid或者磁盘是否在线/运行状态,通过ipmi目前获取的信息不少,可是没有关于磁盘的。通过exsi主机的uuid方式获取到的也是一样没有磁盘信息。大家还有别的做法吗?

A:ipmi里面应该是有的 我记得ipmi有四个模块 你可以仔细看看。

A2:有些硬件管理模块支持snmp,也可以试一下。


Q65:虚拟机重启之后docker怎么无法找到容器 怎么启动?

A:docker start 你docker --help看下命令的结构。


Q66:有人有用zabbix监控网站的在线人数及每天的登陆人数吗?

A:nginx的并发请求就有。


Q67:我用服务器访问就是1,我在浏览器访问一下,然后值就变成4了。(图)

A:nginx的status值了解下。


Q68:无法判断 那个是change,哪个是unchaged?(图)

A:绿色是change的,黄色unchange。


Q69:域林到底怎么理解?

A:域林由域树组成,哪怕只有一颗域树还是域林,关系类似根域和域名的关系,域林是域的最高级别。


Q70:内网掩码16位的。每次有了dhcp,Zabbix可以做到局域网非法dhcp服务报警吗?

A:交换机上可以配置,信任那个dhcp服务器。


Q71:为什么这个进程每天都是这两个时间会高一点,是系统有配置 吗,管家我知道每小时删除时会占用高,但这个不知道是什么原因了?(图)

A:监控windows证书。


Q72:为什么显示的是24线程呢?(图)

A:ht超线程技术。



Q73:某个zabbix agent可以同时配置为主动模式和被动模式吗?然后此监控主机的某个模板里的一部分监控项配置为主动模式,一部分配置为被动模式?

A:可以。


Q74:zabbix可不可以实现对多台浙江大华和海康威视网络硬盘录像机,每个硬盘录像机里面都有四块硬盘,要求 可以每天快速检查一遍硬盘录像机里面每块硬盘的好坏。现在的方法是每星期抽一天时间,通过网页进入每台硬盘 录像机里面看硬盘好坏。效率很低?

A:海康只支持海康的,大华只支持大华的。


Q75:怎么在debian9下纯内网先搭建web服务器在搭建zabbix?

A:在官网下载好安装包,搭个本地apt 源,开个虚拟机,把yum cache配置为1,安装一遍把所有缓存的包复制到正式环境就可以安装了。


Q76:Zabbix每天自动清理历史监控数据有办法解决吗?

A:数据不会每天清理,清理也是趋势。有几种可能:1.做了分区表 2.自己写的历史数据存储就是1天 3.你连的Zabbix 不是用的这个


Q77:Zabbix-server监控自带的Template DB MySQL操作,报错unsupported item key处理',docker安装的zabbix可以使用这个模板吗?

A:修改配置那是在构建容器的时候指定变量,不是到容器里面去执行命令,你看下hub.docker里面容器那个docker有介绍开放了哪些变量,如果没开放的就需要怒根据他的dockerfile自己加变量进去。


Q78:在监控程序的情况下除了端口,error日志这些方式之外,如何去配置监控项和触发器,来监控这个程序不处理业务.背景是这样的:今天有发现故障,从外部程序日志分析看是我们的程序无法提供服务,但是检查我们的程序发现都正常运行,zabbix也没任何告警,待运维人员分析我们的程序日志,发现没有业务日志打印,只是打印一些类似心跳日志的东西

A1:B/S架构的可以考虑web monitoring,内外都做服务可用性监测。

A2:监控程序日志。


Q79:只做了监控程序的端口。今天的现象是,四台机器的程序全hang住了,程序正常跑着,也没error日志,但是就是不处理业务。

A:比如一个接口的请求,可以在外部节点请求检测,内部也可以做检测。这样出问题的时候,很快就可以定位问题。这个需要开发的配合,比如我请求一个关键接口,需要给我返回正确结果,接口的响应代码,请求速度,服务可用性,并不单单是端口在不在,进程在不在,而是你提供的服务是否可用。模拟用户使用服务,达到监控目的。


Q80:started to fail (ZBX_TCP_READ() timed out) ,agent 出現這種情況 屬於什麽問題啊,升級到 4.2 后 agent 總是出現這個?

A:看看是不是server conf里面的timeout 超时了。


Q81:https://www.vultr.com/ JMX在linux端怎么配置吗?

A:java Dcom.sun.management.jmxremote.port=10000 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false -XX:MetaspaceSize=128m -XX:MaxMetaspaceSize=128m -Xms700m -Xmx700m -Xmn700m -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintHeapAtGC -Xss700k -XX:-UseAdaptiveSizePolicy -XX:SurvivorRatio=8 -XX:+UseConcMarkSweepGC -XX:+UseCMSCompactAtFullCollection -XX:CMSFullGCsBeforeCompaction=0 -XX:+UseCMSInitiatingOccupancyOnly -XX:CMSInitiatingOccupancyFraction=70 -XX:+CMSScavengeBeforeRemark -XX:+HeapDumpOnOutOfMemoryError -jar ${DFILE} --server.port=${PORT} >/dev/null 2>&1 &
主要是这个三个
Dcom.sun.management.jmxremote.port=10000 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=f
启动以后现在本地Telnet下看看能不能访问这个端口
如果没有问题,就看先iptable防护墙有没有开启。


Q82:请问下Zabbix配置好后,原来是即时触发的,但今天不知道何故每次总是要过2分钟后再触发。测试触发条件是即时触发,但现在变成要过2分钟后才能触发。

A:触发延迟,看日志,是不是压力过大导致的。


Q83::如何察看日志是否压力过大?至强8核 8G内存 才监控百多台电脑,就没什么性能问题吧。

A:有没有性能问题看nvps,不是看台数,准备说看的是zabbiz自监控,主页上就有
,就是看你多少监控项。


Q84:Zabbix4.2怎么和timescaledb结合来使用?

A1:用es吧,es 也可以做时序数据库的功能。

A3:ES不太适合做实时监控,太慢了,想快的话管理成本挺高的。最适合做数据分析。

A4:时序数据库 在做深度监控比对的时候,能实现或者说做的更多,主机 vps 这些 用zbx 做基础监控都要比 其它来的更方便。


Q85:https://www.jianshu.com/p/b3a261d1502bPrometheus vs Zabbix,我觉得里面说的挺多不对的,谁能反驳一下吗?

A1:不赞同,其它的也没有太多毛病,自动化不代表 图形化管理的弱化。

A2:实时监控prometheus还是挺不错的,需要与grafana对接显示的界面才好看点,但是要考虑集群与存储,存储可以采用远端存储influxdb。


Q86:Zabbix用在虚拟机的监控的多吗?

A:Zabbix用在虚拟机的监控真的有点大材小用的味道,Zabbix后期性能瓶颈在数据库上面,需要根据公司的实际场景进行数据库规划。

A2:这个红框没错,zbx的监控维度本来就是已主机维度去做的


Q87:我们要上NFV,用的是openstack,所以要考虑改用prometheus。

A1:这个看个人理解和使用吧,我之前的实际上是把host和hostgroup当标签用的。每个应用也是一个host,和主机不冲突。只是这样就不好用主动式了。

A2:以应用维度去做 不是不可以,但可能不是最合适的,只要不是太多的云和k8s之类的,还是安心用Zabbix吧。

A3:k8s的集成,是因为……k8s和prometheus是一家的。


Q88:Zbx把housekeeper 开启,修改历史数据存储周期,监控到的历史数据依旧被每天清理掉了。超过一天的都变成趋势数据了,周期为1小时.24小时内的数据都是存的历史数据,谁能帮看看吗。我在前端设置的历史数据保存周期为30天,实际只能保存一天,一天外的数据都变成了趋势数据。不知道有办法调整没?管家里面配置的


Q 89:日志报错,谁能告诉我该怎么做吗?

A:没有找到主机路由,检查服务器和客户机之间的网络和端口连通性。防火墙挡住了。


Q90:4.6版本,使用logrt同时监控两个日志,两个日志都是追加更新,如果只是一个日志更新没问题,但是一旦切换到另外一个日志时都会从头读取

A1:logrt 没用过 类似rsyslog的东西么,看了下文档,貌似logrt一个监控项检查一个日志把,你要多个,貌似要创建多个监控项。

A2:可以用正则匹配多个的。


Q91:这个拒绝连接是什么原因?

A:感觉像是你的tomcat的启动进程里面看看设置。

  • No labels