IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    Golang 中的 EOF 与 read: connection reset by peer 错误深度剖析

    whrss (whrss9527@gmail.com)发表于 2024-08-07 08:30:33
    love 0

    引言

    在 Golang 网络请求中,我们经常会遇到两种常见的错误:EOF 和 read: connection reset by peer。这两个错误虽然看似相似,但实际上有着本质的区别。这篇文章将深入探讨这两种错误的原因、区别以及如何优雅的处理它们。

    错误原因解析

    EOF 错误

    首先,让我们看看 Golang 标准库中对 EOF 的定义:

    
    // EOF is the error returned by Read when no more input is available.
    
    // (Read must return EOF itself, not an error wrapping EOF,  
    
    // because callers will test for EOF using ==.)
    
    // Functions should return EOF only to signal a graceful end of input.
    
    // If the EOF occurs unexpectedly in a structured data stream,
    
    // the appropriate error is either ErrUnexpectedEOF or some other error
    
    // giving more detail.  
    
    var EOF = errors.New("EOF")
    
    

    从注释中我们可以看出:

    1. EOF 表示没有更多的输入可用。

    2. 函数应该只在输入优雅结束时返回 EOF。

    3. 如果在结构化数据流中意外发生 EOF,应该返回 ErrUnexpectedEOF 或其他更详细的错误。

    connection reset by peer 错误

    在 Golang 源码中,connection reset by peer 对应的错误码是 “ECONNRESET”。在 Linux 和类 Unix 系统上,ECONNRESET 错误码表示连接被对端重置。

    模拟错误场景

    为了更好地理解这两种错误,我们可以通过代码来模拟这些场景。

    服务端代码

    
    package main
    
    
    
    import (
    
        "errors"
    
        "log"
    
        "net"
    
        "net/http"
    
        "os"
    
        "time"
    
    )
    
    
    
    func handler(w http.ResponseWriter, r *http.Request) {
    
        conn, _, err := w.(http.Hijacker).Hijack()
    
        if err != nil {
    
            log.Printf("无法劫持连接: %v", err)
    
            return
    
        }
    
        defer conn.Close()
    
    
    
        // 通过注释或取消注释下面这行来切换错误类型
    
        // conn.(*net.TCPConn).SetLinger(0)
    
    }
    
    
    
    func main() {
    
        server := &http.Server{
    
            Addr:         ":8788",
    
            Handler:      http.HandlerFunc(handler),
    
            ReadTimeout:  5 * time.Second,
    
            WriteTimeout: 5 * time.Second,
    
            IdleTimeout:  5 * time.Second,
    
            ErrorLog:     log.New(os.Stderr, "http: ", log.LstdFlags),
    
        }
    
    
    
        listener, err := net.Listen("tcp", server.Addr)
    
        if err != nil {
    
            log.Fatalf("无法监听端口 %s: %v", server.Addr, err)
    
        }
    
        defer listener.Close()
    
        log.Printf("服务器在端口 %s 上等待连接...", server.Addr)
    
    
    
        if err = server.Serve(listener); err != nil && !errors.Is(err, http.ErrServerClosed) {
    
            log.Fatalf("服务器启动失败: %v", err)
    
        }
    
    }
    
    

    客户端代码

    
    func TestHttpRequest(t *testing.T) {
    
        reqUrl := "http://localhost:8788"
    
        req, err := http.NewRequest("GET", reqUrl, nil)
    
        if err != nil {
    
            t.Fatalf("创建请求失败: %v", err)
    
        }
    
        client := &http.Client{}
    
        resp, err := client.Do(req)
    
        if err != nil {
    
            t.Logf("请求错误: %v", err)
    
            return
    
        }
    
        defer resp.Body.Close()
    
    }
    
    

    在服务端代码中,通过注释或取消注释 conn.(*net.TCPConn).SetLinger(0) 这行代码,我们可以模拟两种不同的错误场景:

    1. 当这行代码被注释时,客户端会收到 EOF 错误。

    2. 当这行代码未被注释时,客户端会收到 read: connection reset by peer 错误。

    错误原因分析

    EOF 错误

    EOF 错误通常表示连接被对端优雅地关闭。这是一个正常的网络行为,表示数据传输已经完成。在 TCP 协议中,这对应于正常的四次挥手过程:

    1. 服务器发送 FIN 包。

    2. 客户端回应 ACK 包。

    3. 客户端发送 FIN 包。

    4. 服务器回应 ACK 包。

    connection reset by peer 错误

    connection reset by peer 错误表示连接被对端强制关闭。这通常是由于以下原因之一:

    1. 对端进程崩溃。

    2. 网络异常。

    3. 对端主动选择立即断开连接(如使用 SetLinger(0))。

    在这种情况下,TCP 连接没有经过正常的四次挥手过程,而是直接发送了 RST(重置)包。

    实际应用场景分析

    EOF 错误的常见场景

    1. 对端完成数据发送后正常关闭连接。

    2. 长连接超时被服务器主动关闭。

    3. 读取固定长度的数据流结束。

    connection reset by peer 错误的常见场景

    1. 服务器进程崩溃或被强制终止。

    2. 网络设备(如防火墙)主动断开连接。

    3. 服务器配置了短的 keep-alive 超时时间,客户端尝试使用已关闭的连接。

    如何处理这两种错误

    处理 EOF 错误

    1.对于预期的 EOF(如读取到文件末尾),可以正常处理,不需要特别的错误处理逻辑。

    
    data, err := reader.Read(buffer)
    
    if err == io.EOF {
    
        // 正常结束,处理完成的数据
    
        return
    
    } else if err != nil {
    
        // 处理其他错误
    
        return err
    
    }
    
    

    2.对于非预期的 EOF,应该进行错误处理和日志记录。

    
    if err == io.ErrUnexpectedEOF {
    
        log.Printf("意外的 EOF: %v", err)
    
        // 进行错误恢复或重试逻辑
    
    }
    
    

    处理 connection reset by peer 错误

    1.实现重试机制。

    
    func retryableHttpGet(url string, maxRetries int) (*http.Response, error) {
    
        var resp *http.Response
    
        var err error
    
        for i := 0; i < maxRetries; i++ {
    
            resp, err = http.Get(url)
    
            if err == nil {
    
                return resp, nil
    
            }
    
            if !strings.Contains(err.Error(), "connection reset by peer") {
    
                return nil, err
    
            }
    
            time.Sleep(time.Second * time.Duration(i+1))
    
        }
    
        return nil, fmt.Errorf("最大重试次数已达到: %w", err)
    
    }
    
    

    2.优化连接池配置。

    
    client := &http.Client{
    
        Transport: &http.Transport{
    
            MaxIdleConns:        100,
    
            MaxIdleConnsPerHost: 100,
    
            IdleConnTimeout:     90 * time.Second,
    
        },
    
        Timeout: 10 * time.Second,
    
    }
    
    

    3.使用断路器模式。

    
    import "github.com/sony/gobreaker"
    
    
    
    cb := gobreaker.NewCircuitBreaker(gobreaker.Settings{
    
        Name:        "HTTP GET",
    
        MaxRequests: 3,
    
        Interval:    5 * time.Second,
    
        Timeout:     30 * time.Second,
    
        ReadyToTrip: func(counts gobreaker.Counts) bool {
    
            failureRatio := float64(counts.TotalFailures) / float64(counts.Requests)
    
            return counts.Requests >= 3 && failureRatio >= 0.6
    
        },
    
    })
    
    
    
    resp, err := cb.Execute(func() (interface{}, error) {
    
        return http.Get("http://example.com")
    
    })
    
    

    最佳实践

    1. 日志记录:详细记录错误发生的上下文,包括时间、请求详情等。

    2. 监控告警:设置合理的阈值,当错误率超过预期时及时告警。

    3. 错误分类:区分预期和非预期的错误,采取不同的处理策略。

    4. 优雅降级:在遇到网络问题时,实现服务的优雅降级,保证核心功能可用。

    5. 代码 review:检查是否有不当的连接处理逻辑,如强制关闭连接等。

    总结一下

    理解 EOF 和 connection reset by peer 错误的区别和处理方法,对于构建健壮的网络应用至关重要。EOF 通常表示正常的连接关闭,而 connection reset by peer 则可能指示更严重的问题。通过合理的错误处理、重试机制和监控,我们可以大大提高应用的可靠性和用户体验。

    在实际开发中,要根据具体的应用场景和需求,选择适当的错误处理策略。同时,持续监控和分析这些错误,可以帮助我们及时发现和解决潜在的问题,提高系统的整体稳定性。



沪ICP备19023445号-2号
友情链接