0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Linux网络故障排查流程

马哥Linux运维 ? 来源:马哥Linux运维 ? 2025-08-06 17:56 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Linux网络故障排查:从ping到traceroute的诊断流程

"网络又断了!"作为运维工程师,这句话是不是很熟悉?当用户报告网络问题时,你的第一反应是什么?慌张?还是胸有成竹地打开终端?

今天分享一套系统化的网络故障排查流程,让你从"网络小白"进阶为"网络诊断专家"。

故障现象识别

网络故障通常表现为以下几种症状:

? 网站无法访问

? 应用响应缓慢

? 间歇性连接中断

? 数据传输超时

关键问题:如何快速定位问题根源?

标准化诊断流程

第一步:基础连通性检查(ping命令)

# 检查本地回环
ping 127.0.0.1

# 检查网关连通性 
ping $(ip route | grep default | awk'{print $3}')

# 检查DNS解析
ping baidu.com
ping 8.8.8.8

诊断要点

? 丢包率超过5%需要关注

? 延迟超过100ms可能存在网络拥塞

? 无法ping通网关说明本地网络配置有问题

第二步:路由路径分析(traceroute)

# Linux系统
traceroute google.com

# 如果traceroute不可用,使用mtr
mtr --report --report-cycles 10 google.com

输出解读技巧

traceroute to google.com (142.250.191.14), 30 hops max, 60 byte packets
1 192.168.1.1 (192.168.1.1) 1.234 ms 1.123 ms 1.456 ms
2 10.0.0.1 (10.0.0.1) 15.678 ms 16.789 ms 17.234 ms
3 * * * (请求超时)
4 8.8.8.8 (8.8.8.8) 45.123 ms 44.567 ms 43.890 ms

?第3跳出现星号:可能是防火墙阻止ICMP或设备故障

?延迟突然增大:该节点可能存在拥塞

?某一跳持续超时:重点排查该网络设备

第三步:端口连通性测试

# 检查特定端口
telnet target-host 80
nc -zv target-host 443

# 批量端口扫描
nmap -p 80,443,22,3306 target-host

第四步:DNS解析验证

# 查看DNS配置
cat/etc/resolv.conf

# 手动DNS查询
nslookup example.com
dig example.com

# 查看域名解析过程
dig +trace example.com

常见DNS问题

? 解析超时:DNS服务器响应慢

? NXDOMAIN:域名不存在

? 解析结果错误:DNS污染或配置错误

高级诊断技巧

网络接口状态检查

# 查看网络接口状态
ip addr show
iplinkshow

# 检查网络统计信息
cat/proc/net/dev
ss -tuln # 查看监听端口

防火墙规则排查

# iptables规则检查
iptables -L -n -v

# 查看连接跟踪
cat/proc/net/nf_conntrack | grep target-ip

路由表分析

# 查看路由表
ip route show
route -n

# 添加临时路由测试
ip route add target-network via gateway-ip

实战案例分析

案例1:Web服务访问缓慢

症状:用户反馈网站打开很慢

排查步骤

1.ping web-server- 延迟正常

2.telnet web-server 80- 连接成功但响应慢

3.ss -tuln | grep :80- 发现大量CLOSE_WAIT状态连接

结论:应用层问题,需要优化Web服务器配置

案例2:间歇性网络中断

症状:每隔几分钟网络就断一次

排查步骤

1.mtr --report target-host- 发现某一跳丢包率30%

2.traceroute -I target-host- 使用ICMP协议测试

3. 联系ISP确认链路状态

结论:运营商链路不稳定

效率提升工具

自动化诊断脚本

#!/bin/bash
# network-check.sh
TARGET=${1:-"8.8.8.8"}

echo"=== 网络诊断报告 ==="
echo"目标地址:$TARGET"
echo"检查时间:$(date)"
echo

echo"1. 基础连通性测试:"
ping -c 4$TARGET

echo-e"
2. 路由路径分析:"
traceroute$TARGET

echo-e"
3. DNS解析测试:"
nslookup$TARGET

echo-e"
4. 本地网络配置:"
ip addr show | grep -A 2"state UP"

监控告警设置

# 使用watch持续监控
watch -n 5'ping -c 1 critical-server && echo "OK" || echo "FAILED"'

# 结合zabbix或prometheus进行自动化监控

最佳实践建议

1. 建立标准化流程

? 制定详细的故障排查SOP

? 记录常见问题的解决方案

? 建立故障处理知识库

2. 工具箱准备

# 必备网络工具安装
yum install -y net-tools traceroute telnet nmap mtr
# 或者在Ubuntu/Debian上
apt-get install -y net-tools traceroute telnet nmap mtr

3. 日志分析习惯

# 系统日志检查
tail-f /var/log/messages | grep -i network
journalctl -u NetworkManager -f

# 网络相关日志
dmesg | grep -i network

4. 性能基线建立

? 记录正常情况下的网络指标

? 定期进行网络性能测试

? 建立告警阈值

故障预防策略

网络健康检查清单

? 定期检查网络设备状态

? 监控带宽使用率

? 检查DNS解析性能

? 验证备用链路可用性

? 更新网络设备固件

自动化监控脚本

#!/bin/bash
# daily-network-check.sh
HOSTS=("8.8.8.8""114.114.114.114""your-critical-server.com")
LOG_FILE="/var/log/network-health.log"

forhostin"${HOSTS[@]}";do
 ifping -c 3$host> /dev/null 2>&1;then
   echo"$(date):$host- OK">>$LOG_FILE
 else
   echo"$(date):$host- FAILED">>$LOG_FILE
   # 发送告警邮件或短信
   echo"$hostis unreachable"| mail -s"Network Alert"admin@company.com
 fi
done

深入学习资源

推荐工具进阶

?Wireshark:数据包分析神器

?iftop:实时流量监控

?nethogs:按进程显示网络使用情况

?tcpdump:命令行抓包工具

学习路径建议

1. 掌握TCP/IP协议栈基础

2. 熟悉Linux网络配置

3. 学习网络安全基础

4. 实践自动化运维

总结

网络故障排查是运维工程师的核心技能之一。通过标准化的诊断流程:

ping → traceroute → 端口测试 → DNS验证 → 深入分析

你可以快速定位大部分网络问题。记住,工具只是手段,思路才是关键

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    88

    文章

    11531

    浏览量

    214720
  • 网络故障
    +关注

    关注

    0

    文章

    31

    浏览量

    8729

原文标题:【5分钟定位90%网络故障】Linux神级排查组合拳:从ping到traceroute的诊断流程

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    网络发展看无线网络故障排查需求

    ,应用的多终端协同化是大势所趋,关键应用效率提升通过移动应用方式实现也是大势所趋。无线网络技术倒退是实际情况,无线网络的物理介质脆弱是实际情况,无线网络不可视也是实际情况。要求无线网络
    发表于 11-04 20:51

    集中式网络故障诊断

    集中式网络故障诊断
    发表于 08-08 14:22

    无线网络故障排查要点解析

      无线网络故障排查是我们本文将要为大家讲解的内容。从四个方面来切入我们的主题。包括:是否属于硬件问题
    发表于 10-15 17:35 ?1379次阅读

    网络故障节点的判断技巧

      利用交换机说明一定位网络故障节点的方法和技巧   一、将交换机的故障日志作为第一手材料
    发表于 11-23 10:57 ?1978次阅读

    笔记本网络故障排除

    电子发烧友为您提供了笔记本网络故障排除,帮助你解决 笔记本 出现网络故障时对您的干扰,希望对您有所帮助!
    发表于 07-11 16:11 ?195次下载
    笔记本<b class='flag-5'>网络故障</b>排除

    朗讯ATM网络故障案例分析

    朗讯ATM网络故障案例分析
    发表于 09-05 09:22 ?3次下载

    智能网络故障管理系统

    当前网络故障管理系统正朝着自动化智能化的方向发展。为了提高传统网络故障管理系统的智能化水平,基于专家系统规则引擎Jess和SNMP协议,设计了一个智能网络故障管理系统。该系统可实时监控被管网络
    发表于 11-11 15:47 ?4次下载
    智能<b class='flag-5'>网络故障</b>管理系统

    判断网络故障的方法介绍

    这是一个很复杂的东西。系统:一般TCP/IP协议如果出现故障的话,网络肯定是会出现问题了。还有可能就是对用户管理出现了问题。有时候防火墙的设置也会影响网络网络分析系统进行
    的头像 发表于 09-17 09:24 ?4480次阅读

    比较常见的网络故障应该如何解决

    网络故障是最容易出现的,也是比较难解决的问题,尤其是经常跟电脑及交换机打交道的朋友。
    的头像 发表于 04-06 12:13 ?5893次阅读

    网络故障排查思路和处理方法

    网络故障是最容易出现的,且难以解决的问题。本文提供的网络故障排查思路和处理方法,可解决日常工作中大部分网络问题。
    发表于 10-31 09:14 ?1.2w次阅读

    Linux服务器常见的网络故障排查方法

    日常工作中我们有时会遇到服务器网络不通问题,导致服务器无法正常运行。要想解决服务器网络故障问题,通常要先进行网络故障排查,这里以Linux
    的头像 发表于 04-14 15:47 ?3479次阅读

    常用linux网络排查命令

    今天浩道跟大家分享linux网络运维中常见的命令,掌握好这些命令,在排查故障时将会游刃有余!
    发表于 06-25 10:49 ?1028次阅读

    网络故障排查手段总结

    ,能让快速定位网络故障。先整理了我个人常用的网络排障工具给大家。此类工具很多,但是能找到适合自己的,上手也容易的 需要我们自己多使用,多琢磨。
    的头像 发表于 11-27 15:31 ?1093次阅读

    OSI七层模型在网络故障排查中的应用

    OSI(Open Systems Interconnection)七层模型在网络故障排查中扮演着至关重要的角色。它提供了一个系统的框架,使得网络技术人员可以逐层分析并定位网络故障。以下
    的头像 发表于 11-24 11:01 ?1803次阅读

    光通信网络故障排除技巧

    光通信网络以其高速、大容量和抗干扰性在现代通信系统中占据着举足轻重的地位。然而,随着网络规模的扩大和复杂性的增加,故障排除成为了网络维护中的一项重要任务。 1.
    的头像 发表于 01-23 09:42 ?947次阅读