如何自己免费创建网站,上海小程序开发哪家好,淮安市建设局网站,网站备案还是域名备案常用运维故障排查命令 一、 网络诊断 (Network)二、 系统状态与资源 (System Resources)三、 进程与性能分析 (Process Performance)四、 日志排查 (Logging)五、 安全与权限 (Security Permission)**高级组合与排查思路** 这是一份精心整理的运维故障排查命…常用运维故障排查命令一、 网络诊断 (Network)二、 系统状态与资源 (System Resources)三、 进程与性能分析 (Process Performance)四、 日志排查 (Logging)五、 安全与权限 (Security Permission)**高级组合与排查思路**这是一份精心整理的运维故障排查命令清单涵盖网络、系统、进程、性能、日志和安全等核心场景并附有简明解释和常用参数。一、 网络诊断 (Network)ping- 测试主机连通性ping -c 4 8.8.8.8发送4个包后停止ping -I eth0 目标IP指定网卡发送traceroute/tracepath/mtr- 追踪数据包路径traceroute www.baidu.commtr --report www.google.com动态实时追踪更强大netstat- 查看网络连接、路由表、接口统计旧版部分系统已淘汰netstat -tunlp查看所有监听端口及进程netstat -rn查看路由表ss-netstat的现代替代品速度更快ss -tunlp功能同netstat -tunlpss -s查看套接字统计摘要dig/nslookup- DNS 查询dig www.example.com A查询A记录dig 8.8.8.8 example.com MX指定DNS服务器查询MX记录nslookup www.example.com交互式查询nmap- 端口扫描和网络探测nmap -sT -p 1-1000 目标IPTCP连接扫描常用端口nmap -sU -p 53,161 目标IPUDP端口扫描nmap -O 目标IP尝试识别操作系统tcpdump- 命令行网络抓包分析tcpdump -i eth0 port 80抓取eth0网卡80端口的包tcpdump -i any host 192.168.1.1 -w file.pcap抓取特定主机的包并保存tcpdump -n -vvv禁用主机名解析显示更详细信息telnet/nc(netcat)- 测试TCP/UDP端口连通性telnet 目标IP 端口测试TCP端口是否开放nc -zv 目标IP 端口快速测试TCP端口nc -u 目标IP UDP端口测试UDP端口curl/wget- HTTP/HTTPS 请求与下载curl -I http://example.com仅获取HTTP头部curl -v http://example.com显示详细连接过程curl -X POST -d ‘data’ http://api发送POST请求wget --spider --timeout5 URL模拟爬虫检查URL可达性iptables/firewall-cmd(firewalld)- 防火墙规则查看iptables -L -n -v查看所有规则数字显示端口/IPfirewall-cmd --list-all查看firewalld所有区域和规则二、 系统状态与资源 (System Resources)top/htop- 动态查看进程和系统资源占用top经典工具按P按CPU排序M按内存排序htoptop的增强版色彩丰富支持鼠标操作uptime- 查看系统运行时间与平均负载输出示例12:30:00 up 30 days, 1:23, 2 users, load average: 0.05, 0.10, 0.15free- 查看内存使用情况free -h以人类可读的单位显示如G、Mfree -m以MB为单位显示df- 查看磁盘空间使用情况df -h人类可读格式df -i查看inode使用情况防止“磁盘有空间但无法创建文件”的问题du- 查看目录/文件占用的磁盘空间du -sh /var/log/查看/var/log目录的总大小du -h --max-depth1 /home查看/home下第一级子目录大小vmstat- 报告虚拟内存、进程、CPU活动等统计信息vmstat 2 5每2秒采样一次共采样5次iostat- 查看CPU统计和磁盘I/O情况iostat -dx 2显示扩展磁盘统计每2秒刷新iostat -c仅显示CPU使用率sar- 系统活动报告器历史性能数据查询sar -u 1 3查看CPU使用率每秒1次共3次sar -b 1 3查看I/O和传输速率sar -r查看内存使用历史sar -n DEV查看网络接口历史流量三、 进程与性能分析 (Process Performance)ps- 显示当前进程状态快照ps aux显示所有用户的所有进程详细信息ps -ef标准格式ps -eo pid,ppid,cmd,%mem,%cpu --sort-%cpu | head按CPU使用率排序并显示前几名pstree- 以树状图显示进程关系pstree -p显示PIDlsof- 列出打开的文件和进程lsof -i :8080查看谁在占用8080端口lsof /var/log/syslog查看谁在打开这个日志文件lsof -p PID查看指定进程打开的所有文件strace/ltrace- 系统调用/库调用追踪strace -f -p PID追踪一个正在运行的进程及其子进程strace -e open,read,write command追踪命令的特定系统调用ltrace command追踪库函数调用pidstat- 监控进程资源占用CPU、内存、IOpidstat -u 2 5每2秒报告一次各进程CPU使用共5次pidstat -d报告进程IO情况perf- Linux性能分析工具功能强大较复杂perf top实时显示消耗CPU最多的函数/符号perf record -g -p PID记录进程的性能数据生成火焰图数据四、 日志排查 (Logging)tail- 查看文件尾部内容tail -f /var/log/syslog实时追踪日志增长tail -n 100 /var/log/nginx/error.log查看最后100行head- 查看文件头部内容head -n 20 /var/log/boot.log查看文件前20行grep- 强大的文本搜索工具grep “error” /var/log/app.log搜索包含“error”的行grep -E “error|fail” /var/log/app.log使用正则搜索error或failgrep -C 3 “keyword” file显示匹配行前后各3行内容tail -f logfile | grep --line-buffered pattern实时过滤日志流journalctl- 查询systemd日志适用于使用systemd的系统journalctl -f实时追踪所有日志journalctl -u nginx.service查看指定服务的日志journalctl --since “2023-10-01” --until “2023-10-02”按时间范围查询journalctl -p err只看错误级别以上的日志五、 安全与权限 (Security Permission)last/lastb- 查看用户登录记录和失败尝试last查看所有成功登录历史lastb查看失败的登录尝试lsattr/chattr- 查看/修改文件扩展属性lsattr filename查看文件特殊属性如i不可修改、a只追加chattr i file给文件加上不可修改属性防止误删chattr -i file移除不可修改属性高级组合与排查思路“黄金命令组合”当服务不可用时一个典型的排查链条是curl/wget测试服务自身HTTP响应telnet/nc测试端口可达性ping测试网络层连通性traceroute定位网络中断点如果前三步在本地通远端不通 - 检查安全组/防火墙iptables -L/firewall-cmd --list-all如果端口被占用 -ss -tunlp | grep :端口或lsof -i :端口如果服务进程崩溃 -journalctl -u 服务名或tail -f /var/log/服务日志如果服务器负载高 -top-pidstat -u -p 高CPU进程PID-strace -p PID或perf磁盘I/O瓶颈iostat -dx 1看%util和await同时用iotop定位哪个进程在大量读写。内存泄漏free -h观察可用内存持续下降用ps aux --sort-%mem或smem找嫌疑进程再用valgrind开发环境或pmap -x PID分析进程内存映射。掌握这些命令并理解它们背后的原理你将能系统性地诊断和解决绝大多数运维故障。建议在测试环境中多加练习形成自己的排查“肌肉记忆”。