WebRTC-nack机制详解

# 1.NACK的含义

丢包重传(NACK)是抵抗网络错误的重要手段。NACK在接收端检测到数据丢包后,发送NACK报文到发送端;发送端根据NACK报文中的序列号,在发送缓冲区找到对应的数据包,重新发送到接收端。NACK需要发送端,发送缓冲区的支持。

WebRTC中支持音频和视频的NACK重传。我们这里只分析nack机制,不分析jitterbuffer或者neteq的更多实现。

# 2.WebRTC中NACK请求发送的条件

这里以视频为例。

下面是webrtc中接收端触发nack的条件,我们看下nack_module.cc文件中OnReceivedPacket的实现。

```

void NackModule::OnReceivedPacket(const VCMPacket& packet) {

  rtc::CritScope lock(&crit_);

  if (!running_)

    return;

  //获取包的seqnum

  uint16_t seq_num = packet.seqNum;

  // TODO(philipel): When the packet includes information whether it is

  //                retransmitted or not, use that value instead. For

  //                now set it to true, which will cause the reordering

  //                statistics to never be updated.

  bool is_retransmitted = true;

  //判断第一帧是不是关键帧

  bool is_keyframe = packet.isFirstPacket && packet.frameType == kVideoFrameKey;

//拿到第一个包的时候判断,把第一个包的seqnum赋值给最新的last_seq_num,如果是关键帧的话,插入到关键帧列表中,同时把initialized_设置为true

  if (!initialized_) {

    last_seq_num_ = seq_num;

    if (is_keyframe)

      keyframe_list_.insert(seq_num);

    initialized_ = true;

    return;

  }

  if (seq_num == last_seq_num_)

    return;

//判断有无乱序,乱序了,如来1,2,3,6包,然后来4包,就乱序了,就把4从nack_list中去掉,不再通知发送端重新发送4了

  if (AheadOf(last_seq_num_, seq_num)) {

    // An out of order packet has been received.

    //把重新收到的包从nack_list中移除掉

    nack_list_.erase(seq_num);

    if (!is_retransmitted)

      UpdateReorderingStatistics(seq_num);

    return;

  } else {

  //没有乱序,如1,2,3,6包,就把(3+1,6)之间的包加入到nack_list中

    AddPacketsToNack(last_seq_num_ + 1, seq_num);

    last_seq_num_ = seq_num;

    // Keep track of new keyframes.

    if (is_keyframe)

      keyframe_list_.insert(seq_num);

    // And remove old ones so we don't accumulate keyframes.

    auto it = keyframe_list_.lower_bound(seq_num - kMaxPacketAge);

    if (it != keyframe_list_.begin())

      keyframe_list_.erase(keyframe_list_.begin(), it);

    // Are there any nacks that are waiting for this seq_num.

    //从nack_list 中取出需要发送 NACK 的序号列表, 如果某个 seq 请求次数超过 kMaxNackRetries = 10次则会从nack_list 中删除.

    std::vector nack_batch = GetNackBatch(kSeqNumOnly);

    //LOG(LS_INFO) << "nack_batch size[" << nack_batch.size() << "].";

    //在 NackModule 中触发使用 NackSender::SednNack 发送 NACK 请求

    if (!nack_batch.empty())

      nack_sender_->SendNack(nack_batch);

  }

}

```

我们继续跟踪流程看下AddPacketsToNack函数的实现

```

void NackModule::AddPacketsToNack(uint16_t seq_num_start,

                                  uint16_t seq_num_end) {

  //LOG(LS_INFO) << "AddPacketsToNack. "

  //            << "start seq[" << seq_num_start

  //            << "],end seq[" << nack_list_.lower_bound(seq_num_end - kMaxPacketAge);

  nack_list_.erase(nack_list_.begin(), it);

  // If the nack list is too large, remove packets from the nack list until

  // the latest first packet of a keyframe. If the list is still too large,

  // clear it and request a keyframe.

  uint16_t num_new_nacks = ForwardDiff(seq_num_start, seq_num_end);

  if (nack_list_.size() + num_new_nacks > kMaxNackPackets) {

    while (RemovePacketsUntilKeyFrame() &&

          nack_list_.size() + num_new_nacks > kMaxNackPackets) {

    }

    if (nack_list_.size() + num_new_nacks > kMaxNackPackets) {

      nack_list_.clear();

      LOG(LS_WARNING) << "NACK list full, clearing NACK"

                        " list and requesting keyframe.";

    //触发关键帧请求

      keyframe_request_sender_->RequestKeyFrameNack();

      return;

    }

  }

  for (uint16_t seq_num = seq_num_start; seq_num != seq_num_end; ++seq_num) {

    NackInfo nack_info(seq_num, seq_num + WaitNumberOfPackets(0.5),

                      clock_->TimeInMilliseconds());

    RTC_DCHECK(nack_list_.find(seq_num) == nack_list_.end());

    nack_list_[seq_num] = nack_info;

  }

  //LOG(LS_INFO) << "nack_list size[" << nack_list_.size() << "]";

}

```

我们可以看到AddPacketsToNack()函数主要实现了:

nack_list 的最大容量为 kMaxNackPackets = 1000, 如果满了会删除最后一个 KeyFrame 之前的所有nacked 序号, 如果删除之后还是满的那么清空 nack_list 并请求KeyFrame。

我们继续跟踪流程,我们看下GetNackBatch函数实现

```

std::vector NackModule::GetNackBatch(NackFilterOptions options) {

  bool consider_seq_num = options != kTimeOnly;

  bool consider_timestamp = options != kSeqNumOnly;

  int64_t now_ms = clock_->TimeInMilliseconds();

  std::vector nack_batch;

  auto it = nack_list_.begin();

  //LOG(LS_INFO) << "nack_list size[" << nack_list_.size() << "]";

  while (it != nack_list_.end()) {

    bool delay_timed_out =

        now_ms - it->second.created_at_time >= kDefaultSendNackDelayMs;

        //只考虑时间模式

        //当前序号是第一次发送(本地记录的send_at_time == -1)

        //当前最新收到的包序号在这个需要发送NAKC的序号的后面(避免当前还在收之前没收到的包)

//比如当前最新收到100, 当前检测是否需要发送NACK的序号为小于等于100的才满足条件, 比如 99

    if (delay_timed_out && consider_seq_num && it->second.sent_at_time == -1 &&

        AheadOrAt(last_seq_num_, it->second.send_at_seq_num)) {

      nack_batch.emplace_back(it->second.seq_num);

      ++it->second.retries;

      it->second.sent_at_time = now_ms;

      //从nack_list 中取出需要发送 NACK 的序号列表, 如果某个 seq 请求次数超过 kMaxNackRetries = 10次则会从nack_list 中删除

      if (it->second.retries >= kMaxNackRetries) {

        LOG(LS_WARNING) << "Sequence number " << it->second.seq_num

                        << " removed from NACK list due to max retries.";

        //从nack_list_列表中移除

        it = nack_list_.erase(it);

      } else {

        ++it;

      }

      continue;

    }

    //只考虑时间模式

    //发送nack的条件变成,该序号上次发送NACK的时间到当前时间要超过1个RTT(该序号一次也没发送过NACK(send_at_time == -1)也满足

    if (delay_timed_out && consider_timestamp && it->second.sent_at_time + rtt_ms_ <= now_ms) {

      nack_batch.emplace_back(it->second.seq_num);

      ++it->second.retries;

      it->second.sent_at_time = now_ms;

      if (it->second.retries >= kMaxNackRetries) {

        LOG(LS_WARNING) << "Sequence number " << it->second.seq_num

                        << " removed from NACK list due to max retries.";

        it = nack_list_.erase(it);

      } else {

        ++it;

      }

      continue;

    }

    ++it;

  }

  return nack_batch;

}

```

从上面GetNackBatch函数我们可以知道,获取nack_list存在2种控制逻辑。

# 3.WebRTC中处理NACK请求的实现

1. 首先是正常的 RTCP 处理流程: RTCPReceiver 中解析处理RTCP, 在 rtcp_receiver.cc中的TriggerCallbacksFromRtcpPacket函数中处理不同的RTCP消息.

2. 如果nackSequenceNumbers.size大于0,则触发 RtpRtcp 对象的ModuleRtpRtcpImpl::OnReceivedNack 处理流程。

我们看下OnReceivedNACK/rtp_rtcp_imp.cc函数

```

void ModuleRtpRtcpImpl::OnReceivedNACK(

    int64_t id, const std::list& nack_sequence_numbers) {

    //将丢包的序号 记录到PacketLossStats, 获取RTT后进入 RTPSedner.OnReceivedNack.

  for (uint16_t nack_sequence_number : nack_sequence_numbers) {

    send_loss_stats_.AddLostPacket(nack_sequence_number);

  }

  if (!rtp_sender_.StorePackets() ||

      nack_sequence_numbers.size() == 0) {

    return;

  }

  // Use RTT from RtcpRttStats class if provided.

  int64_t rtt = rtt_ms();

  if (rtt == 0) {

    rtcp_receiver_.RTT(rtcp_receiver_.RemoteSSRC(), NULL, &rtt, NULL, NULL);

  }

  rtp_sender_.OnReceivedNACK(id, nack_sequence_numbers, rtt);

}

```

我们继续跟踪流程,看下rtp_sender.cc下OnReceivedNACK()函数

```

void RTPSender::OnReceivedNACK(int64_t id,

                                const std::list& nack_sequence_numbers,

                                int64_t avg_rtt) {

  TRACE_EVENT2(TRACE_DISABLED_BY_DEFAULT("webrtc_rtp"),

              "RTPSender::OnReceivedNACK", "num_seqnum",

              nack_sequence_numbers.size(), "avg_rtt", avg_rtt);

  const int64_t now = clock_->TimeInMilliseconds();

  uint32_t bytes_re_sent = 0;

  uint32_t target_bitrate = GetTargetBitrate();

    //比特率限制检查

  // Enough bandwidth to send NACK?

  if (!ProcessNACKBitRate(now)) {

    LOG(LS_INFO) << "NACK bitrate reached. Skip sending NACK response. Target "

                << target_bitrate;

    return;

  }

  for (std::list::const_iterator it = nack_sequence_numbers.begin();

      it != nack_sequence_numbers.end(); ++it) {

    const int32_t bytes_sent = ReSendPacket(id, *it, 5 + avg_rtt);

    if (bytes_sent > 0) {

      bytes_re_sent += bytes_sent;

    } else if (bytes_sent == 0) {

      // The packet has previously been resent.

      // Try resending next packet in the list.

      continue;

    } else {

      // Failed to send one Sequence number. Give up the rest in this nack.

      LOG(LS_WARNING) << "Failed resending RTP packet " << *it

                      << ", Discard rest of packets";

      break;

    }

    // Delay bandwidth estimate (RTT * BW).

    if (target_bitrate != 0 && avg_rtt) {

      // kbits/s * ms = bits => bits/8 = bytes

      size_t target_bytes =

          (static_cast(target_bitrate / 1000) * avg_rtt) >> 3;

      if (bytes_re_sent > target_bytes) {

        break;  // Ignore the rest of the packets in the list.

      }

    }

  }

  if (bytes_re_sent > 0) {

    UpdateNACKBitRate(bytes_re_sent, now);

  }

}

```

我们继续看下ReSendPacket()函数重新发送数据的实现

```

int32_t RTPSender::ReSendPacket(int64_t id, uint16_t packet_id, int64_t min_resend_time) {

  size_t length = IP_PACKET_SIZE;

  uint8_t data_buffer[IP_PACKET_SIZE];

  int64_t capture_time_ms;

//从缓存包中去获取数据包

  if (!packet_history_.GetPacketAndSetSendTime(packet_id, min_resend_time, true,

                                              data_buffer, &length,

                                              &capture_time_ms)) {

    // Packet not found.

    LOG(LS_INFO) << "ReSendPacket not found.seq[" << packet_id << "].";

    return 0;

  }

//如果开启平滑发送的话

  if (paced_sender_) {

    RtpUtility::RtpHeaderParser rtp_parser(data_buffer, length);

    RTPHeader header;

    if (!rtp_parser.Parse(&header)) {

      assert(false);

      return -1;

    }

    // Convert from TickTime to Clock since capture_time_ms is based on

    // TickTime.

    int64_t corrected_capture_tims_ms = capture_time_ms + clock_delta_ms_;

    paced_sender_->InsertPacket(

        id, RtpPacketSender::kNormalPriority, header.ssrc, header.sequenceNumber,

        corrected_capture_tims_ms, length - header.headerLength, true);

    return length;

  }

  int rtx = kRtxOff;

  {

    rtc::CritScope lock(&send_critsect_);

    rtx = rtx_;

  }

  //重新发送数据

  if (!PrepareAndSendPacket(id, data_buffer, length, capture_time_ms,

                            (rtx & kRtxRetransmitted) > 0, true)) {

    return -1;

  }

  return static_cast(length);

}

```

3.通过上面我们可以知道,RTPSender中完成在PacketHistory中查找需要发送的RTP seq, 并决定重发时间. 重发也需要经过重发的比特率限制的检查. RTPSedner 初始化话时可以配置是否使用(PacedSend, 均匀发送), 最后检查重发格式(RtxStatus() 可以获取是否使用 RTX 封装)后使用 RTPSedner::PrepareAndSendPacket进行立即重发. 如果是使用 PacedSend, 则使用 PacedSender::InsertPacket 先加入发送列表中, 它的process会定时处理发送任务.

你可能感兴趣的:(WebRTC-nack机制详解)