公有云 – OPS HUB

点击查看二维码获取站长微信

Kubernetes 云原生监控 Kube-Prometheus

背景在 Kubernetes 的生态系统中，Prometheus 已经成为监控的事实标准。然而在实际环境中，…

公有云 CDN 成本控制

背景近日陆续出现了两次 CDN 带宽异常现象： CDN 域名解析已从 A云提供商切换到 B云提供商数日，…

Linux 华为云创建鲲鹏 + 麒麟OS 服务器

背景部分业务因信创合规要求，需要使用 Kylin OS + 鲲鹏CPU。大部分公有云并不会提供 Kylin…

公有云 跨云跨 region 迁移方案论证

背景我司有海外业务，没有自建IDC机房，使用了例如AWS、华为、阿里等公有云。受到包括但不限于以下因素：政…

公有云 甲骨文云 (Oracle Cloud) 开启IPV6

VCN 处理 1、给 VCN 附加IPV6 ‍ 2、VCN 路由表添加路由 …

公有云 基于华为云云连接实现全流量代理出海

背景站内文章：使用 socks5 代理网络流量曾提到过，怎么使用 socks5 来实现应用侧的代理出海加速…

公有云 公有云 aksk 安全访问最佳实践

背景近日发生了公有云 aksk 泄露的问题。导致部分 bucket 被暴露在公网。就此事件的补救措施是更换泄…

公有云 公有云之磁盘热扩容

背景云服务器的磁盘扩容是常见的运维场景，已经操作过很多次。公有云厂商对于云服务器的磁盘，通常都支持热扩容，…

腾讯云 腾讯云 TDSQL 安全组问题修复

问题业务反馈，从公司办公网无法访问腾讯云的某个 TDSQL 实例，但是从其他之前添加过白名单的公网IP出口…

华为云 华为云VPN 连接中断故障解决

华为云新加坡ecs上的VPN多次断开导致两个VPC通信异常，通过在俄罗斯一台VM部署长ping脚本进行隧道保活和隧道中断后的重协商解决问题。

编程

Python 实现资源水位巡检

背景资产的全生命周期管理过程中，监控告警和巡检都是不可缺失的两个组成部分。监控告警适用于资源故障后的提醒，…

Grafana 解析 json 数据

2024-08-20

WordPress 性能优化-Redis篇

2023-09-05

WordPress 页面加载性能数据

2023-09-05

WordPress 编写插件实现自动汇总超链接

2023-09-03

个人微信接收夜莺告警消息

2023-09-02

容器

Docker 配置镜像加速

本文介绍了两种镜像加速服务来解决国内 Docker 镜像拉取速度慢的问题。一种是通过部署 Registry 和配置 Nginx 反向代理，另一种是使用socks等网络层代理方式实现加速。

云原生监控 Kube-Prometheus

2024-12-07

Jenkins 流水线构建镜像发布

2024-11-15

Docker 部署的 Jenkins 调用 Docker 客户端

2024-11-15

Harbor 镜像仓库部署

2024-11-13

Ubuntu20.04 安装 nvidia 驱动

2023-11-09

网络

WireGuard 组网方案

‍ 背景之前在企业级环境中，对于物理隔离的不同网络，使用了基于 IPSEC 协议的 VPN 方式进行组网。…

基于华为云云连接实现全流量代理出海

2024-04-09

Windows10 使用 SSTap 配置全局代理

2024-03-08

家宽开启 IPV6

2024-01-13

高性能内网穿透 Rathole

2023-12-21

家宽建站的几种方式

2023-08-23

可观测性

Prometheus 统计月度流量

当前环境中使用 node_exporter 采集服务器流量指标，但在 Grafana 中绘制指定自然周期的流量数据遇到困难，原因主要是 Prometheus 的时间序列数据库（TSDB）模型和滑动窗口查询机制。这使得 Prometheus 只能提供实时监控和近期趋势信息，而缺乏固定时间边界的聚合功能。

因此，为了实现按自然周期（月）统计流量，并且解决计数器重置问题，可以依赖外部工具 vnStat 来记录网络接口流量。vnStat 是一个轻量级的网络流量监控工具，可以生成流量报告。结合 node_exporter 自定义指标收集流量数据，通过定时任务运行 Shell 脚本，利用 vnStat 提取数据并输出为 Prometheus 可读格式，从而完成需求。

文章中包括了安装 vnStat 的步骤、常用命令以及如何通过 shell 脚本与 node_exporter 集成。这一方法有效填补了直接采集流量指标无法满足的需求，能够准确为自然周期内的数据提供监控支持。

新一代日志分析：VictoriaLogs

2025-01-09

Prometheus 集成 Nginx 监控

2025-01-06

Grafana 备份、迁移与升级

2025-01-02

使用 Redis Exporter 监控 Redis

2024-12-31

使用 MySQL Exporter 监控MySQL

2024-12-31

Linux

本文记录了一起服务器被入侵执行挖矿程序的安全事件。事件初起时，管理员发现服务器负载异常上升，经排查发现/tmp/.xim-unix/javae进程非正常业务程序，而是恶意挖矿进程。借助阿里云提供的安全工具，进一步确认了入侵源、入侵方式和执行命令。入侵命令通过Base64编码传递，解码后调用curl下载并执行了远程脚本。该脚本内容涉及清理其他与挖矿相关的进程（如Kinsing、xmrig等）、删除或修改定时任务和特殊配置文件，以维持持续的挖矿活动。文章详细描述了从发现报警、定位异常进程、调用云安全工具到解析恶意脚本的整个处理经过，并总结了入侵手法和对应的修复措施，提醒管理员关注服务器安全和漏洞防护。

Java进程OOM排查

2025-07-30

服务器故障迁移并虚拟化

2025-06-30

AI助手 LobeChat

2025-02-27

开源搜索引擎 SearXNG

2025-02-27

开源统一身份认证系统：CasDoor

2025-02-05

Windows

rime 输入法配置

本文作者基于对个人信息安全和隐私保护的重视，详细介绍了开源输入法框架Rime（小狼毫/鼠须管/中州韵）的使用与配置。作者指出，主流输入法厂商如搜狗存在严重隐私泄露风险（如“云控下发模块”事件），用户输入和剪切板数据被无底线收集和滥用。相比之下，Rime坚持本地化设计，用户数据不上传云端，无广告及数据分析，完全掌控在用户手中，极大保障个人隐私安全。文章还强调Rime高度可定制，允许用户自由设置输入方案、词库和界面，虽有较高上手门槛，但对于重视数据主权的用户，这种自由与安全值得投入。

具体操作部分，作者以Windows平台“小狼毫”和Android平台“雨燕输入法”为例，介绍了下载安装、小狼毫微軟输入法风格主题配置，以及如何导入第三方优化词库（白霜词库）和个人历史词库（将搜狗输入法词库转为Rime格式导入）。通过这些步骤，用户可在保障隐私的前提下，体验精准、个性化的中文输入环境。总体而言，文章展示了采用开源输入法框架Rime替代商业输入法的完整思路和实操方法，实现了对个人数据的有效保护和输入体验的提升。

华为云服务器迁移小记

2025-05-21

Windows 备份方案

2024-11-25

Windows 10 关闭自动更新

2024-10-17

Windows 10 禁用默认快捷键

2024-07-30

Windows 批量终止进程实现加速

2024-04-30

公有云

服务器被入侵执行挖矿程序

阿里云ACP认证

2025-08-13

华为云服务器迁移小记

2025-05-21

CDN 成本控制

2024-11-08

华为云创建鲲鹏 + 麒麟OS 服务器

2024-11-04

跨云跨 region 迁移方案论证

2024-10-22

建站

高性能内网穿透 Rathole

更新记录 2024-01-22 前段时间在使用 Rathole 中，遇到了带宽能够打满，但是 http 响应极…

wordpress 站点切换域名

2023-10-18

webdav 部署和使用

2023-10-06

WordPress 性能优化-Redis篇

2023-09-05

WordPress 页面加载性能数据

2023-09-05

WordPress 编写插件实现自动汇总超链接

2023-09-03