1、首先,信号覆盖的强度是第一位的,所有优化操作方式都以满足信号强度为基础。目标覆盖区域的信号覆盖强度要求不低于-65dBm。
2、RSSI:终端到AP的信号强度
3、同时关注AP侧检测的RSSI强度,一般RSSI大于30为良好,低于20为较差。
4、信道规划和功率调整将是WLAN网络的首要的、最先实施的优化方法。
5、例如使用2.4G频段时,可以使用1、6、11三个非重叠信道构建WLAN网络。
6、同时信道规划调整需要考虑三维空间的信号覆盖情况,无论是水平方向还是垂直方向都要做到无线的蜂窝式覆盖;最大可能的避免同楼层和上下楼层间的同频干扰。
7、建议频段带宽都采用20MHZ
8、如果AP太过密集时,比如3-4米一个,可以间隔使用2.4G和5G频率,合适的调整功率,同时信道蜂窝部署。
9、5.8G可用信道为:149、153、157、161、165。
10、5.2G的可用信道:36、40、44、48、52、56、60、64
11、由于国家使用雷达环境中会与52、56、60、64信道冲突,因此常规模式下建议避开这些雷达信道,以免出现无线终端接入问题。
12、思科的5G频段我采用的频宽是80MHZ
13、覆盖半径大概为15-20米。
14、在WLAN-AP部署密集时(高密场景下),为了避免干扰,降低AP的发射功率(默认是:最大功率)
15、5G不建议穿墙,不过可以根据环境测试,如果开启后墙后终端能接入;可以根据功率实际调整。
16、可调整天线角度来避免干扰
17、在AP中查看无线终端连接的信号强度,无线终端连接到该AP的信号强度,RSSI大于30信号良好,低于20信号较差。
18、如果AP密集时,适当考虑降低AP的发射功率,不然AP功率大会导致终端漫游时不能离开原AP导致信号弱、网络卡顿、丢包。
19、Rx/Tx rate:和终端的协商速率,如果为1M/2M/6M,第一是没关闭RRM低速率,第二是终端连接到AP的信号弱(速率低可能是AP的问题也可能是终端的问题,也可能是终端距离远时没有漫游导致的。),信号越弱、速率越低;同一环境下不同终端的速率都不同。
20、测试时,可以自己连接WIFI后,走到离AP较远的距离,查看这个AP下自己终端的RSSI值,可以根据此信息适当调整发射功率,也可以在手机用APP查看信号db值,通过db值查看漫游效果和信号接入强度。
21、建议将无线用户划分到一个独立的VLAN内。
22、建议开启无线用户VLAN内二层隔离功能
23、同一VLAN内,来自无线客户端的广播、组播报文会向所有放通该VLAN的AP上广播,而且在空间介质中广播报文通常使用最低速率进行发送。当广播报文比较多时,会占用较多的空口资源,在一定程度上影响到整个网络应用。
24、加了vlan内隔离的命令,默认无线终端只能和网关进行二层互通,无线终端和无线终端不能在二层通信。
25、禁止有线用户(permit-mac允许的mac地址除外)发送广播、组播报文给无线用户。
26、不建议无线服务模板下的用户隔离,这样无法防止有线客户端将广播报文发送到无线客户端。
27、关闭RRM低速率
28、大量无线AP管理报文和广播报文以低速率传输,如果测速时带宽一会快一会慢,可能是使用了低速率。
29、开启无线客户端限速!
30、AP的带宽是有限的,单个用户带宽占用过高会造成网络堵塞。
31、Portal配置用户闲置切断功能(当AC作为接入设备,承载Portal认证业务时,如果服务器侧没有设置用户的闲置切断功能,会导致终端下线后,用户认证表项长期在设备上存在,如果此时终端重新接入,并获取到了新的IP地址,就有可能出现冲突,导致无法认证通过,此外大量的残留表项还会消耗设备的资源,因此无特殊需求的情况下,强烈建议开启设备上用户的闲置切断功能。时长至少小于DHCP租约一半!)
32、建议加密方式设置为RSN+CCMP,不推荐使用TKIP或者WEP加密方式,这两种加密方式只能协商到54Mbps;无法发挥无线网络的高速率性能。
33、开启频谱导航的目的是为了优先5G用户的接入,只有同时开启了2.4G频段和5G频段才有用。
34、关闭广播probo探测响应
35、WLAN有两种探测机制:
一种为无线终端被动的侦听Beacon帧之后,根据获取的无线网络情况,选择AP建立连接;
另外一种为无线终端主动发送Probe request帧探测周围的无线网络,然后根据获取的Probe Response帧获取周围的无线网络信息,之后选择AP建立连接。
36、根据Probe Request帧(探测请求帧)是否携带SSID,可以将主动扫描分为两种:
*广播方式的Probe探测,客户端发送Probe Request帧(Probe Request中SSID为空,也就是SSID IE的长度为0);
*单播方式的Probe探测,客户端发送Probe Request帧(携带指定的SSID)。
而大部分的无线终端都不会指定要连接的SSID,这样就造成了无线终端会发送大量广播Probe Request探测,造成所有接收到该帧的AP设备都会回应Probe Response帧,而这些帧都使用低速率进行发送,会消耗一定的空口资源,因此,可以考虑关闭广播Probe探测功能,使AP针对SSID为空的探测请求不进行回复,有效降低空口的消耗,使整个WLAN网络性能得到一定的提升。
37、单播Probe request报文,即报文中携带服务的SSID。
该功能影响漫游体验,对于医院查房等漫游要求较高的地方不建议开启,开启后可能导致客户端漫游时连不上。
38、禁止弱信号接入,配合主动触发弱信号断开重连使用。
39、注意:
1、禁止弱信号终端接入需要考虑场景覆盖信号强度情况,如场景覆盖信号强度偏弱,可能导致终端无法正常接入。
2、如果终端接入后信号强度发生变化低于门限,AP也不会主动踢掉终端,但是如果断开后再次连接则无法成功;建议配合终端弱信号断开重新建立连接。
40、建议关闭LDPC功能
41、建议查看空口利用率
42、通过命令查看,AP的5G射频目前处于正常状态,当CtlBusy高于60%时,则表示该射频繁忙。
43、例如RxBusy平均80,TxBusy小于5。此种情况属于典型的WLAN内部干扰,即同频AP之间互相可见,竞争一个信道介质,导致空口利用率RX方向异常偏高。解决的办法包括合理的信道规划、功率规划、关闭RRM低速率、关闭广播Probe应答和调大Beacon帧间隔、二层隔离等。
44、RxBusy和TxBusy相差不多,RxBusy+TxBusy总和达到80以上
例如RxBusy平均50,TxBusy平均40左右。此种情况下一般体验尚可,如果仍有终端上网慢,最有可能的原因是无线CPE数量过多,或者部分CPE业务量较大,占用了过多带宽。建议开启终端限速或者扩容增加AP解决。
45、RxBusy+TxBusy总和达到80以上。例如TxBusy平均80,RxBusy小于5。此种情况说明AP下行方向发包受阻。在室外应用中较为常见。发生这类故障时,一般伴随着client verbose信息中TX协商速率低,即AP发送给STA的帧经常丢失,进而降速重传,最后导致AP发送的帧都是低速帧。低速帧会大量消耗空口资源,进而导致STA体验集体变差。遇到这种情况,可以先观察该AP下的STA信号强度。
46、还有一种导致空口体验差的情况是存在非WLAN干扰,但非WLAN干扰存在的证据不明显。从空口利用率上看,当CtlBusy大大超出RxBusy和TxBusy总和时,可以认为是非WLAN干扰存在的一个证据。常见的非WLAN干扰源有如无线摄像头、靠的太近的3G/4G基站等(室外AP要求与3/4G基站天线距离保持在5米以上)。
47、当怀疑存在非WLAN干扰时,可以用排除法来证明。即先排除周边的WLAN干扰源,比如关闭周边AP,并使用omnipeek抓包发现无法抓取WiFi报文。如果此种情况下仍然存在CtlBusy异常高,可以作为外部干扰存在的证据。
48、无线WLAN干扰定位故障的思路是:先区分是非WLAN的干扰还是同频干扰,再通过不同的手段优化。排查方法可以通过检查AP空口利用率是否具有显著的非WLAN干扰特点,再通过滤波器、频谱分析仪、检查现场环境等方法验证。
一般来说因为2.4G相对于5G存在公用频段使用多、可用信道少、终端数量大等特点,所以反馈的绝大部分无线干扰是2.4G频段的干扰。
49、登录到AP上进入隐藏模式查看2.4G射频各信道(1、6、11)的空口利用率信息是否过高,CtlBusy的值是否高于60%。 如果更换多种信道(包括3、8、13类的非常规信道)后发现各信道状况类似即可初步判断是非WLAN的干扰。如果更换多种信道(包括3、8、13类的非常规信道)后发现空口利用率过高只出现在指定信道,则判断为同频干扰。
50、查看AP当前信道空口利用率中RxBusy过高随之带来CtlBusy的数值也很高,这种情况在更换多种不同的信道后效果出现明显变化,即只有指定的某个或几个信道出现空口利用率过高就可以判断当前环境存在WLAN的同频干扰。
51、WLAN同频干扰是同一个信道上其他WLAN设备产生的干扰,换个角度看也不算干扰,说是空口竞争更为公平。WLAN同频干扰,表现在空口利用率的RxBusy很高,但不会那么凑巧的所有信道都存在一样程度的干扰。因此我们只需要更换信道,看看空口利用率是否有明显区别,尤其是一些偏门信道比如3、8、13这样的,如果空口利用率不高,则说明之前那个信道受到的就是WLAN同频干扰。
52、确认现场存在同频干扰后可以通过下面几种方式来进行优化:
*协调资源关闭或降低周围WLAN设备的信号
*调整AP的信道
在无法改动环境的情况下,调整信道是最简单可靠的方式,选择个空闲信道即可。如果常用的1、6、11信道都忙,那么不妨选择3、8、13这样的信道。
53、通过option命令来提高信道利用率:
在AP radio或者AP组下配置option channel-reuse-optimization这条配置,其功能是降低信道利用率,本质是忽视弱信号。配置这条命令后,可以看到空口利用率Rxbusy会下降。配置的阈值越小,Rxbusy下降的越厉害。既然是忽视弱信号,那么显而易见这就要求连接到AP上的client的RSSI需要足够高。如果还要照顾那些RSSI只有20多的终端,那么这条命令就不能使用了。即开启该命令的前提条件要求终端的RSSI值足够高,一般建议在30以上。
适用场景范围一般包括:AP覆盖密度较大的场景,比如办公区,一个AP只需要负责方圆半径10米范围的client,RSSI足够高;或者室外AP连接CPE的场景,双方都是大功率加定向天线,RSSI也是有保障的。
option channel-reuse-optimization阈值建议配置6或者5,配置后应当仔细判断是否产生副作用,比如用户无法接入、性能反而下降之类的。如果还要继续配置更小,谨慎对待。
option channel-reuse-optimization enable level 6
54、通过WMM来调整报文优先级:
通过配置WMM,如下优化WMM竞争参数,应用在radio下。优化WMM竞争参数的目的,是提高AP和client竞争空口的能力。802.11协议对于不同优先级报文建议了不同的空口竞争能力,能力越高越有机会优先使用空口发送报文。默认情况下,绝大多数报文都是按照普通优先级处理的。以上配置,是把AP和client的所有报文都提高到了高优先级。
注:如果其他的WLAN设备也都是经过调整使用最高优先级的竞争参数,那大家又是相同起跑线了。该命令提高体验的前提是周围其他wlan设备使用默认的报文优先级。
55、空口利用率中数据是否具有典型非WLAN干扰特征:
除了WLAN的同频干扰外,无线局点中也常常遇到一些非wlan的干扰,对2.4G影响最大的非WLAN干扰常见于4G的干扰。比如2320-2370MHz(移动),2300-2320MHz(联通),2370-2390MHz(电信),这些4G频段都是紧挨着WLAN的2.4G,如果信号源接近AP,通常都会对WLAN的2.4G产生影响,并且影响是相当的大。还有一些非WLAN干扰是完全处于2.4G的,比如微波炉、无绳电话、蓝牙、无线摄像头等,但根据经验看,这些干扰总体上对WLAN的影响相对来说还是要小的多。而有些设备看似工作在与wlan完全不相干的频段但由于其功率过大并且距离我们wlan设备较近,从而对电磁波产生一定的干扰继而影响wlan的无线传输,但一般这种干扰的影响都是非常弱的,不会是首要干扰源。
56、典型的非WLAN干扰具有两种体现:第一种是AP当前信道空口利用率中CtlBusy的数值远大于TX与RX之和,一般差值大于30%。
第二种是AP当前信道空口利用率Rxbusy异常高。并且两种情况更换信道状况相似。以上情况即为非WLAN干扰的典型特征。
例如:通过命令查看,当前AP的空口利用率CtlBusy已经大于60%,属于信道繁忙,且CtlBusy的数值远大于TX与RX之和,更换信道后情况类似。
例如:通过命令查看,当前AP的空口利用率Rxbusy异常高,导致CtlBusy随之增高,且更换信道后效果类似。
57、通过使用专业无线勘测仪器频谱分析仪配合高性能天线对现场无线环境进行勘测,尤其是2.4G临近频段的信号波动。如果有较为强烈的电磁波信号,可以判断临近有较为强烈的干扰源。
58、通过在现有AP上加装滤波器,通过对比加装前后的空口利用率来确认非WLAN干扰源。
滤波器属于有源设备,需要加装在AP与天线之间,通过过滤固定频段的电磁波来达到屏蔽干扰的效果,市面上滤波器的规格参差不齐,一般选取过滤2.4Ghz临近频段的滤波器为宜。
现场条件允许的情况下,可以考虑在AP上加装滤波器来过滤特定频段的干扰,来降低空口利用率。但一般适用于AP数量不多的小型局点。
59、通过对现场的观察,如果AP部署的临近有明显的非WLAN干扰源比如运营商天线或微波炉等,尤其是无线使用问题出现前后环境有变动比如运营商开了4G,则可以判断现场存在非WLAN的无线干扰。可以通过关闭或降低干扰源的信号对比AP的信道利用率来确认是否存在干扰。
如果属于该情况,且设备具备可以移动的条件下,可以通过移动AP、天线、干扰源的方式,达到从物理上远离干扰源,从而根本上降低对无线设备的干扰。 此外也可以考虑更换不同型号的WLAN芯片以及不同型号的AP,抵御非WLAN的干扰能力也是不同的。可以有针对性的更换AP进行对比测试,一般来说新款性的AP抗干扰性会强一些。
60、无线终端丢包排查:
故障排查的思路为:
(1)测试无线终端的丢包率;
通过Ping操作测试当前网络丢包的类型,判断是随机性时断时通,还是连续有规律的丢包。
从目前的协议分析和实际应用来看,无线网络无法实现真正的零丢包。空口利用率正常、无干扰的情况下,3%以内的无规律丢包是可以接受的范围。
(2)判断AC连接AP的有线网络是否存在丢包问题;
如果AC不作为网关,则需要在无线终端上Ping AC的IP地址进行测试
如果Ping网关异常但是Ping AC正常,则需要排查AC至网关的二层网络是否正常。
如果Ping网关和AC均异常,则需要排查有线网络丢包。
(3)判断无线终端能否正常连接到网络、获取IP地址;
排查无线接入问题
(1) 排查无线终端配置
*检查终端无线网卡是否正常打开。
*检查是否在终端服务中开启无线服务,例如Windows操作系统中,要开启Wireless Zero Configuration。
*检查无线终端是否工作在正常的无线终端模式,如果错误的设置成AP模式则无法作为无线终端使用。
*检查无线终端是否关联正确的SSID。
(2)在AC上通过命令display wlan client查看无线终端是否关联到AP。
排查DHCP问题
在无线终端上查看无线终端是否获取到正确的IP地址,例如,在PC上执行:开始>运行>输入cmd回车,通过命令ipconfig/all,在手机或者PAD上在网络状态中查看IP地址获取情况。
(4)判断无线终端状态、空口利用率、空口质量、底噪是否正常;
通过命令display wlan client verbose查看,可以确认无线终端是否正常上线。
(1)SM power save表示无线终端省电模式状态,当无线终端处于休眠状态则Ping延时会比较大,一般会大于Beacon间隔时间。
(2)RSSI表示AP收到的无线终端信号强度,信号强度应该尽量达到30之上。无线用户的信号强度RSSI偏低(低于25),则需要分析一下该用户状态以及对整个网络的影响,尽量提高无线用户的信号强度,可以通过调整天线、增加AP的方式改善信号覆盖。
(3)Rx/Tx Rate,如果Rx Rate始终保持在较低速率(例如1、2、11),通常说明空口环境不是特别好、甚至丢包比较多,需要进行空口的分析(例如信道占用情况、确认网络流量),适当进行流量控制或者无线用户的限速。
(4)Online time表示用户在线时间,如果时间比较短,而该用户已经长时间使用无线网络,需要考虑该用户是否出现过漫游,可以适当的调整这台客户端连接的AP的发射功率减少用户的漫游,或者将网卡的漫游主动性调低。
AP上查看底噪是否正常
通过命令display ar5drv radio calibration查看底噪信息,当Value值高于-80的时候就需要警惕,可借助仪器分析原因。
可以使用黄马甲测试仪,IEEE 802.11b/g版本及以上的黄马甲是支持用户检查和确定AP和RSSI信号电平、全频谱扫描等内容。或者使用频谱仪频谱(Spectrum)模式可以对测试点进行频谱与干扰分析。
(5)通过收集Debug信息分析问题原因。
如果无线终端可以抓包则不需要空口抓包,如果是说明、证明问题,则需要进行空口抓包,如果无线终端不支持抓包,则需要进行空口抓包。
无线终端抓包推荐使用Wireshark/Ethereal进行抓包,需要注意的是:
(1)为了便于抓包分析,可以在无线客户端Ping固定大小的报文,例如130bytes。
(2)提供抓包信息时,收集抓包信息后一定要提供无线客户端的MAC地址和IP地址。
(3)报文分析时可以根据报文大小,确定是否每一个Ping Request报文都很快有Ping Reply回应消息。
(4)如果无线终端和空口均进行抓包,可以通过Ping报文的序列号进行匹配分析,确定两个抓包的相对时间进行对比分析,确定延时情况和报文丢失情况。
(5)在无线笔记本上使用Ethereal进行抓包。
空口抓包
可以使用Omnipeek/Airmagnet进行空口抓包,需要注意的是:
(1)抓包工具不一定能够将所有的空口报文都抓上来,也就是在分析过程中要充分考虑到可能偶尔有报文接收不上来的情况;
(2)无论使用哪种工具进行抓包,一定要选择当前无线终端所在的信道进行抓包;
(3)Ping有两个方向,一个为Ping Request从无线终端到AP,另外一个为Ping Reply从AP到无线终端;
(4)为了报文方便分析,可以Ping指定大小的报文,例如130bytes;特别对于加密接入的客户端一定要采用Ping固定长度的报文。
抓包结果分析
(1)如果收不到ACK确认(无线终端没有发送ACK,或者AP没有收到无线终端发送的ACK),则会进行报文重传。
(2)AP设备默认重传次数为5次,无线终端重传次数不定,与无线终端型号有关。
(3)如果抓包中连续出现多个相同的重传报文,而没有ACK报文,说明该报文可能丢失。
(4)根据报文的MAC地址,可以确定是AP到无线终端丢失还是无线终端到AP丢失。
如果无线终端在线则直接通过命令行查询当前AP地址,然后通过AC Ping AP判断AC到AP的有线网络链路状态:
(1)通过命令display wlan client中的AP name字段查找当前无线终端所连接AP的名称。
(2)通过命令display wlan ap查看无线终端当前连接AP的IP地址。
例如:通过命令查看,可以确认AP1的IP地址为192.168.1.6,在线时长为22个小时,如果在线时间很短,则证明AP注册存在问题,需要关注排查AP注册存在的问题。
(3)在AC上Ping AP的IP地址,观察网络质量,可以确认AC到AP这段有线网络是否正常。
如果无线终端不在线则排查有线网络丢包
通过逐级Ping、抓包方式明确具体丢包的位置,再检查二层、三层网络配置是否符合规范。