
Python 实现资源水位巡检
背景 资产的全生命周期管理过程中,监控告警和巡检都是不可缺失的两个组成部分。 监控告警适用于资源故障后的提醒,…

Docker 配置镜像加速
本文介绍了两种镜像加速服务来解决国内 Docker 镜像拉取速度慢的问题。一种是通过部署 Registry 和配置 Nginx 反向代理,另一种是使用socks等网络层代理方式实现加速。

WireGuard 组网方案
背景 之前在企业级环境中,对于物理隔离的不同网络,使用了基于 IPSEC 协议的 VPN 方式进行组网。…

Prometheus 统计月度流量
当前环境中使用 node_exporter 采集服务器流量指标,但在 Grafana 中绘制指定自然周期的流量数据遇到困难,原因主要是 Prometheus 的时间序列数据库(TSDB)模型和滑动窗口查询机制。这使得 Prometheus 只能提供实时监控和近期趋势信息,而缺乏固定时间边界的聚合功能。
因此,为了实现按自然周期(月)统计流量,并且解决计数器重置问题,可以依赖外部工具 vnStat 来记录网络接口流量。vnStat 是一个轻量级的网络流量监控工具,可以生成流量报告。结合 node_exporter 自定义指标收集流量数据,通过定时任务运行 Shell 脚本,利用 vnStat 提取数据并输出为 Prometheus 可读格式,从而完成需求。
文章中包括了安装 vnStat 的步骤、常用命令以及如何通过 shell 脚本与 node_exporter 集成。这一方法有效填补了直接采集流量指标无法满足的需求,能够准确为自然周期内的数据提供监控支持。

Java进程OOM排查
本文介绍了一台运行Java进程的服务器发生了Out of Memory(OOM)异常导致Java虚拟机(JVM)崩溃的故障排查过程。服务器配置包括Ubuntu 20.04操作系统、Intel Xeon E7-4820 8核CPU和32GB内存。分析JVM生成的错误日志(hs_err_pid*.log)发现,崩溃原因是本地内存分配失败,提示系统物理内存或交换空间不足,或者Java堆(Heap)设置导致本机堆内存分配受阻。日志中列出可能原因和解决方案,如减少系统内存负载、增加物理内存或交换空间、调小JVM堆大小(-Xmx/-Xms)、减少Java线程数或线程堆栈大小(-Xss),以及调整代码缓存等参数。还提及了Java压缩指针(CompressedOops)模式可能限制本机堆内存增长。总结内容为定位JVM OOM故障时应关注系统和JVM参数设置,合理调整内存相关配置以避免本机内存分配失败。

华为云服务器迁移小记
写在前面 从工作了7年的公司离职,回到了老家还是做运维岗,不过公司和业务形态天差地别。 刚来1天就接到一个迁移…

华为云服务器迁移小记
写在前面 从工作了7年的公司离职,回到了老家还是做运维岗,不过公司和业务形态天差地别。 刚来1天就接到一个迁移…

高性能内网穿透 Rathole
更新记录 2024-01-22 前段时间在使用 Rathole 中,遇到了带宽能够打满,但是 http 响应极…