排查新购腾讯云服务器(Ubuntu系统)运行卡顿的问题,可以从以下几个方面逐步排查和优化:
一、确认是否为硬件或网络问题
1. 检查服务器配置
- 登录腾讯云控制台,确认购买的实例规格(CPU、内存、带宽、磁盘IO性能)。
- 是否为共享型实例(如 t5/t6 实例),这类实例有 CPU 积分限制,长时间高负载会降频导致卡顿。
✅ 建议:查看“实例监控”中的 CPU 使用率曲线。若 CPU 使用率突增后被限制(如长期低于10%但响应慢),可能是 CPU 积分耗尽。
2. 检查网络延迟与带宽
- 使用
ping和traceroute测试到服务器的延迟:ping your-server-ip traceroute your-server-ip - 检查内网/公网带宽是否受限:
- 控制台查看“带宽利用率”。
- 使用
iftop或nethogs查看实时流量:sudo apt install iftop -y sudo iftop
二、系统资源使用情况排查
1. 查看 CPU、内存、磁盘使用情况
# 查看整体资源占用
top
# 或更直观的工具
htop # 需安装:sudo apt install htop
重点关注:
- CPU 使用率是否接近100%
- 内存是否耗尽(Swap 是否频繁使用)
- Load Average(平均负载)是否过高(如 > 核心数)
2. 检查磁盘 I/O 性能
# 安装 iotop 查看磁盘读写
sudo apt install iotop
sudo iotop
# 查看磁盘空间和 inode 使用
df -h
df -i
⚠️ 若磁盘使用率接近100%,或 I/O wait(%wa in top)很高,说明磁盘成为瓶颈。
3. 检查系统日志
# 查看是否有异常报错
dmesg | tail -50
journalctl -xe --since "1 hour ago"
关注 OOM(内存溢出)、I/O 错误、硬件警告等。
三、软件和服务层面排查
1. 检查是否有异常进程
ps aux --sort=-%cpu | head -10 # 查看高CPU进程
ps aux --sort=-%mem | head -10 # 查看高内存进程
注意是否有:
- 未知进程(如X_X程序)
- 多个重复服务占用资源
- Web 服务(Nginx/Apache/Node.js)无限制地创建子进程
2. 检查定时任务和后台服务
crontab -l # 当前用户的定时任务
sudo crontab -l # 系统级定时任务
systemctl list-units --type=service --state=running
3. 检查是否存在病毒或X_X木马
-
安装安全扫描工具:
# ClamAV(基础杀毒) sudo apt install clamav sudo freshclam sudo clamscan -r / # rkhunter(后门检测) sudo apt install rkhunter sudo rkhunter --check -
手动检查异常端口:
netstat -tulnp | grep :[可疑端口] ss -tulnp
常见X_X端口:3333, 4444, 5555, 7777, 8888 等连接到矿池 IP。
四、系统配置优化建议
1. 关闭不必要的服务
sudo systemctl disable snapd # 如未使用 snap
sudo systemctl disable ModemManager
# 根据实际需要关闭其他服务
2. 调整文件句柄和进程数限制
编辑 /etc/security/limits.conf:
* soft nofile 65535
* hard nofile 65535
* soft nproc 65535
* hard nproc 65535
3. 优化 Swap 使用(如有必要)
如果内存小(如1G),可增加 Swap:
sudo fallocate -l 1G /swapfile
sudo chmod 600 /swapfile
sudo mkswap /swapfile
sudo swapon /swapfile
添加到 /etc/fstab 永久生效。
4. 调整内核参数(进阶)
编辑 /etc/sysctl.conf,加入:
vm.swappiness=10
net.core.somaxconn=1024
fs.file-max=100000
然后执行:
sudo sysctl -p
五、腾讯云平台相关检查
1. 查看云监控数据
登录腾讯云控制台 → 云服务器 CVM → 目标实例 → “监控信息”:
- CPU 使用率
- 内存使用率(需安装 agent)
- 磁盘 IO 吞吐
- 网络出入带宽
注意:默认可能不开启内存监控,需手动安装监控插件。
2. 检查安全组和防火墙
- 安全组是否放行了必要端口?
- 本地是否启用了
ufw或iptables导致响应变慢?sudo ufw status sudo iptables -L -n -v
3. 尝试重启实例
有时临时性卡顿可通过重启解决:
- 在控制台“重启”实例(非强制关机)。
六、快速诊断脚本(推荐)
运行以下命令快速获取系统状态:
echo "=== CPU & Load ==="; uptime; echo
echo "=== Memory ==="; free -h; echo
echo "=== Disk Space ==="; df -h; echo
echo "=== Top 5 CPU Processes ==="; ps aux --sort=-%cpu | head -6; echo
echo "=== Top 5 Memory Processes ==="; ps aux --sort=-%mem | head -6; echo
echo "=== Network Connections ==="; ss -tuln; echo
echo "=== Recent Logs ==="; dmesg | tail -20
七、总结排查流程图
开始
↓
检查云服务器规格(CPU/内存/带宽)
↓
查看控制台监控(CPU、网络、磁盘IO)
↓
登录系统执行 top/htop 查资源
↓
→ 高CPU? → 找出进程 → 杀掉或优化
↓
→ 高内存? → 检查是否有泄漏或启用Swap
↓
→ 高I/O? → 检查磁盘使用 + iotop
↓
→ 网络慢? → 检查带宽、安全组、本地防火墙
↓
→ 有异常进程? → 扫描病毒、清除X_X程序
↓
→ 仍卡顿? → 考虑升级配置或联系腾讯云技术支持
联系腾讯云支持
如果以上步骤无法解决,可:
- 登录 腾讯云工单系统
- 提交“云服务器性能问题”工单,提供:
- 实例ID
- 卡顿时间段
- 截图或监控数据
- 已执行的排查步骤
通过以上系统化排查,通常可以定位并解决 Ubuntu 云服务器卡顿问题。如为新手,建议优先检查 CPU积分限制 和 是否中X_X病毒,这两个是最常见原因。
云小栈