Hi3536网络应用调优

目录

1. 为什么UDP接收或发送会丢包?

2. 使用 socket 接口时,如何正确工作在非阻塞模式下? 

3. TOE 使能及使用注意事项

4. TOE 模式下使用 socket 接口时的注意事项  


1. 为什么UDP接收或发送会丢包?

  • 用户态应用程序在接收 UDP 数据时(单播或组播报文),同时进行其它有延时的操作(如写码流数据到 USB 存储设备),应该程序将延迟接收 UDP 数据包,而 socket 默认接收缓存只有108544Byte,这样可能会使 socket 接收缓存满,无法接收新的 UDP 数据包,出现丢包现象。可在内核下通过执行下面命令进行确认:
    cat /proc/net/snmp | grep Udp

    如果 RcvbufErrors 字段增加较多,说明确实是 socket 接收缓存满导致的丢包。以下命令可以增加接收缓冲区大小(设置为 20,000,000 字节 (即 20 MB),解决以上问题。

    echo 20000000 > /proc/sys/net/core/rmem_max
    echo 20000000 > /proc/sys/net/core/rmem_default
    echo 20000000 > /proc/sys/net/core/netdev_max_backlog
    

    这样做的目的是提高网络传输性能,特别是在处理大量数据流时。这种改动,需要根据实际码流发送速度和接收程序的延时进行参数调优。

  • UDP 发送可能会丢包,一种原因是 CPU 发送 UDP 报文的速率超过了网卡 MAC 的发包速率,导致网卡MAC的发送缓冲队列满,引起了丢包。可以在内核下通过执行下面命令进行确认: 
    ifconfig eth0

    Hi3536网络应用调优_第1张图片如果打印的信息中 TX dropped 和 overruns 值基本相等,都增加较多说明是网络MAC的发送缓冲队列满导致的丢包。以下命令可以减小发送缓冲区,让CPU发包速率慢一点,解决以上问题。

    echo 20000 > /proc/sys/net/core/wmem_max
    echo 20000 > /proc/sys/net/core/wmem_default
    

    这种改动,需要根据码流发送速率和丢包率的要求进行参数调优。

2. 使用 socket 接口时,如何正确工作在非阻塞模式下? 

在网络编程中对于一个网络句柄会遇到阻塞IO 和非阻塞IO 的概念, 这里对于这两种 socket 先做一下说明: 

阻塞IO:socket 的阻塞模式意味着必须要做完IO 操作(包括错误)才会返回。

非阻塞IO:非阻塞模式下无论操作是否完成都会立刻返回,需要通过其他方式来判断具体操作是否成功。

对于一个 socket 是阻塞模式还是非阻塞模式有两种方式来处理:

  • 方法1:fcntl 设置;用 F_GETFL 获取 flags,用 F_SETFL 设置 flags | O_NONBLOCK; fcntl 函数可以将一个 socket 句柄设置成非阻塞模式: 
    flags = fcntl(sockfd, F_GETFL, 0);           //获取文件的flags值
    fcntl(sockfd, F_SETFL, flags | O_NONBLOCK);  //设置成非阻塞模式

    设置之后每次对于 sockfd 的操作都是非阻塞的。

    flags  = fcntl(sockfd, F_GETFL, 0);           //获取文件的flags值
    fcntl(sockfd, F_SETFL, flags & ~O_NONBLOCK);  //设置成阻塞模式

    设置之后每次对于sockfd 的操作都是阻塞的。

  • 方法2:recv、send 系列的参数 (读取、发送时,临时将 sockfd 或 filefd 设置为非阻塞)。 recv、send 函数的最后有一个 flag 参数可以设置成 MSG_DONTWAIT,临时将 sockfd 设置为非阻塞模式,而无论原有是阻塞还是非阻塞。
    recv(sockfd, buff, buff_size, MSG_DONTWAIT);  //非阻塞模式的消息发送
    send(scokfd, buff, buff_size, MSG_DONTWAIT);  //非阻塞模式的消息接受
    

3. TOE 使能及使用注意事项

TOE 模块(TCP Offload Engine,TCP 卸载引擎) 同时实现两个网络接口数据的接收和发送,可以工作在 10/100/1000Mbit/s 模式下,支持半双工和全双工工作模式,提供 MII、RMIIRGMII 接口。TOE 模块能够通过硬件部分实现 TCP/IP 加速处理的功能,不但能够提升网络接口的吞吐量,还可以显著的降低 CPU 占用率。

  • Hi3536 网口默认使用的是 bypass 功能,使能 TOE 功能只需要如下操作即可:

    修改文件系统的 /etc/init.d/S81toe 启动脚本:

    insmod /hitoe/stmmac.ko 注释掉;

    再将下列三句话使能,打开 TOE 功能:

    echo 8192 > /proc/sys/vm/min_free_kbytes
    echo 200 > /proc/sys/vm/vfs_cache_pressure
    insmod /hitoe/stmmac.ko hitoe=1

    由于这里保留空间增大了,相应的 bootargsMEM 的配置也要相应的增大,否则会出现内存不够用的情况。

  • Hi3536 GMAC 每次使用 TOE 发送数据时,需要大块连续的物理内存,但是内核中大块连续内存的数量非常少。因此在使用前需要做如下处理,确保能够分配到足够多的物理内存。下述处理只是简单的举例,具体的数值需要根据业务场景使用的连接数来决定。
    echo 8192 > /proc/sys/vm/min_free_kbytes
    echo 200 > /proc/sys/vm/vfs_cache_pressure

    min_free_kbytes 表示最小保留内存的大小,缺省值为 8192vfs_cache_pressure 表示设置了虚拟内存回收 directoryi-node 缓冲的倾向,缺省值为 100,推荐设置为 200,因为该参数的值越大,回收的倾向越严重。这样 TOE 就会有更多的物理内存使用。Hi3536 ETH 使用时如果网口出现内存分配不足的情况下可以在 shell 下进行如下设置:echo 16384 > /proc/sys/vm/min_free_kbyte,增大最小保留内存。

  • TOE 不支持选择性重传功能,而内核默认打开了网络模块的选择性重传,为了 Hi3536TOE 模式下能与对端设备协商一致,需要关闭选择性重传:
    echo 0 > /proc/sys/net/ipv4/tcp_sack
  • TOE 接收描述子个数可以配置,默认 4096,消耗 8MB 内存(每个描述子 2K)。补充说明:个数可以根据内存大小或应用场景配置。CPU 压力越大,网络压力越大,则配置描述子大可以提高性能,其他情况下可以减少配置,一般简单场景 256 即可,可以节省内存,配置范围 256~8192。配置方法举例:
    insmod stmmac.ko hitoe=1 tnk_rx_fifo=4096
  • 增加 socket 选项,可以通过 setsocketopt 来实现某个 socket 是否使用 TOE 功能,目前默认每个 socket 都使能 TOE。实现方法:在具体的业务 socket 层代码中定义如下宏:
    #define SO_TOE_ENABLE 76

    在创建 socket 连接的代码实现中添加 TOE 使能开关:

    int val = 0; /* DISABLE TOE : val = 0 ENABLE TOE: val = 1*/
    int len = sizeof(int);
    setsockopt(sockfd, SOL_SOCKET, SO_TOE_ENABLE, &val, len);
  • 增加 socket 选项,可以通过 getsockopt 来获取某个 socket 是否处于 tcp 连接加速状态。实现方法:在具体的业务 socket 层代码中定义如下宏:

    #define SO_TOE_STATE 77

    当用户创建并使用 socket 后,用户可以通过如下代码在任意时刻获取 tcp 连接的加速状态:

    int val;
    int len = sizeof(int);
    getsockopt(sockfd, SOL_SOCKET, SO_TOE_STATE, &val, &len);

    如果返回的 val 值为 1,说明 tcp 连接处于加速状态,如果返回的 val 值为 0,说明 tcp 连接处于非加速状态。

  • 增加对所有连接默认是否开启 TOE 加速的支持。如果用户希望默认所有连接不开启 TOE 加速,仅当主动通过 setsockopt 设置某条连接开启 TOE 时,这条连接才开启 TOE 加速特性,那么用户可通过内核文件系统 /proc 下的参数来进行设置。其中,/proc/sys/tnk/tnk_tcp_gmac0_enable 是网口 0 口的 TOE 使能开关,/proc/sys/tnk/tnk_tcp_gmac1_enable 是网口 1 口的 TOE 使能开关,向该 proc 节点写 1 表示所有连接默认开启 TOE 加速,写 0 表示所有连接默认不开启 TOE 加速。如果用户希望网口 0 默认所有连接不开启 TOE 加速,使用命令如下:
    echo 0 >/proc/sys/tnk/tnk_tcp_gmac0_enable

    这样,网口 0 所有连接默认都不会开启 TOE 加速,客户可以通过 setsockopt 来使能某条 socket 进入 TOE 加速。

4. TOE 模式下使用 socket 接口时的注意事项  

  • TOE 模式下,不管是阻塞模式还是非阻塞模式,协议处理是由硬件完成的,当出现内核 buffer满时,都会给上层应用返回 EAGAIN,而在 Bypass 模式下,如果是阻塞模式,则出现内核 buffer 满时,不会返回 EAGAIN,而阻塞继续发送!
  • 另外经过查询得知 send 的返回值是这样处理的:阻塞模式与非阻塞模式下,send 返回值 < 0 && (errno == EINTR || errno == EWOULDBLOCK || errno == EAGAIN) 表示暂时发送失败,需要重试,如果 send 返回值 <= 0, && errno != EINTR && errno != EWOULDBLOCK && errno != EAGAIN 时,连接异常,才需要关闭。
  • 因此,建议应用程序在调用 send 时,若返回值 < 0 && (errno == EINTR || errno == EWOULDBLOCK || errno == EAGAIN) 应该延时等待一段时间再重新尝试发送,而不要直接调用 close 断开连接,则不会出现此问题。

你可能感兴趣的:(海思芯片开发,单片机,嵌入式硬件)