第一次华为无线组网开局

因为无业游民的状态,有机会参与学长的弱电施工项目(仓库类),作为乙方网络工程师,对项目的网络(主要是无线)部分开局。

网络拓扑:

第一次华为无线组网开局_第1张图片
华为示例拓扑

除了IP使用不同外,在核心交换机上接入了一台服务器

是的,就是这么简单一个组网,也遇到很多问题。

Day1:7点半上海出发到天津,因为暴雨中间停了一个小时,所以下午15:30左右才到天津西,到现场已经16:00了。

首先,第一个问题来了:没有预定方案,在后来的工作中发现,这一问题影响挺大。现场有三种终端,均需要接入网络:搬运机器人、分拣站PC、服务器。要求三者均可访问外网,可互访,不能同网段,外网走甲方的工作网。

此时AC\POE\核心交换机(以下简称核心)都在仓库的机柜里。

先把设备调通吧,为了调试方便,每台设备都创建了vlan和vlanif100-102,IP记录在表格,方便查看。

AC配置管理vlan100,业务vlan101,开启dhcp,为vlan100创建dhcp地址池192.168.0.0/24。

POE交换机配置AP连接口绑定vlan100,加入vlan100-101,与核心连接的接口绑定vlan1,加入vlan1,100-102。

核心交换机配置与POE和AC连接的接口绑定vlan1,加入vlan1,100-102,开启dhcp,为vlan101、vlan102创建接口地址池(192.168.10.0/24、192.168.11.0/24)。

因为所有设备已经上机架、上吊顶了,所以配置完成后AP应该很快上线,结果没有。检查了几遍配置没啥问题啊,最终求助华为售后,给出的判断是:AP和AC的软件版本号可能不匹配。

第二个问题来了:没有console线(工具不齐全),为啥呢?因为我这是第一次华为设备开局,命令都不知道,打算一路web到底的。而AP默认fit模式无法访问web,只能通过console或AC来查看版本号,那现在没上线AC也管不了,必须要console。

此时已经到了下班点,施工人员撤出,明日再战。

Day2:9点左右赶到现场,我方现场管理通知:AP的事不着急,今天先让服务器访问外网,我们IT要配置。

溜达一圈,机房和仓库之间光纤通信,但是机房设备没有光口。核心带光口,而且我们带了足够的模块。

此时,把核心拆到了机房,仓库还留着AC和POE交换机。

网管给了一套IP、网关、DNS,从光猫里拉条线出来(财主有多IP)。创建个vlan,vlanif,然后添加一条静态路由就行了。嗯,因为不熟悉这个操作,我默默想着方案……这时候新的要求来了:“你们这个设备能做端口映射吗?”,交换机端口映射?好像不能吧?没有nat。

怎么办,首先想到的是直接用他们机房的防火墙/路由设备好了。可是,可是这时候又来了一条通知:“经过我们开会商量,最终决定我们设备和他们工作网分离,我方设备专用一条线路,不涉及工作网,之前给的那个IP就是公网IP,拿去用”。此时,甲方防火墙只剩下一个接口,如果添加IP并单独配置路由给我们用,端口不足。如果把防火墙网关上调一级,或许端口可以少用些,但是方案不太好出,而且势必要做大量的配置。

此时,出现如下讨论:“防火墙呢?我们采购单没有防火墙吗?我怎么记得以前项目都有防火墙的”“被XX总划了,说是通过甲方网络出去,用不到这个”“我们再买个?”………………

这个时候天又黑了,又到了下班的时候,撤退。

Day3:9点到现场,事情有了新进展,设备不买了,我们就用甲方那个闲置的cisco2900Series。趁此机会找网管要根console线,你配cisco必须有吧。心中窃喜:“有console可以蹭了”。

因为cisco我摸都没摸过,请了外援远程配置。

为了调试方便,又让施工的大哥把AC也挪到了机房。这下仓库只剩下POE交换机了,拆了装又花费些功夫。

这就是第三个问题:第三方参与设备配置。为啥这也算一个问题,因为他不止配了cisco,还配了服务器的网络,还修改了核心交换机的部分配置。而这些内容,我们双方没有及时沟通。

我则是找另一个外援给我解决AP上线的问题。当然,我已经提前把所有我掌握的信息告诉了他,包括“华为售后的初步判断是软件版本不匹配”。从上午11点,整到下午三点,这位同志终于还是没能从我的配置中发现什么问题……还是请师傅拆一个AP拿过来看版本吧。

这个时候cisco已经配了IP,开了Telnet,可以从公网配置,空出了console。最终,确认AC比AP的软件低了一个大版本。由于工作用的这台笔记本不太给力,单单一个升级操作就花费了30分钟,升级后AP正常上线。

而下面要解决的问题就是终端上网的问题,IT同仁给服务器上网的方式是服务器、cisco都使用vlan1(默认),配置为同网段,虽然添加了“目的:0.0.0.0 掩码:0.0.0.0 下一跳:192.168.100.1 出口:vlan1”的静态路由,但我非vlan1的终端仍然无法访问外网。

此时外援就发挥不了作用了,把我的dhcp删、改、建N多遍,我也不知道他“弄啥哩”,完了还说“你这配置太复杂了,干嘛要这么配”。没效果就重启设备回退,三番两次后配置服务器的同仁一通抱怨“你们没事老重启核心交换机干什么,下次能不能提前说一声”。最终,这位外援因为快下班了,晚上有饭局,结束了支持。

最终解决问题的是供应商的售后技术支持,原因也很简单:cisco不自动生成反向路由(不知道是不是大厂路由设备都这样),之前服务器配置人员添加的反向只包含了那台服务器“ip route 192.168.100.254 255.255.255.0 192.168.100.2”。扩大反向路由的范围“ip route 192.168.0.0 255.255.0.0 192.168.100.2”,修改后发现还是不能访问外网,但能ping通公网地址(cisco wan口)。通过查看运行配置,发现有access-list 1 permit ,但条目中只包含服务器所在网段。将其他两个vlan网段添加进来后,可以正常访问外网。

至此,网络连通问题已经全部得到解决,剩下的就是对无线调优和冗余配置清理的工作了。

截止下班,对无线网络进行了配置,包括ssid、密码、功率、信道调优计划、智能漫游

Day4:直奔仓库,剩下的内容比较无趣,主要介绍几个概念吧,部分是跟华为售后要的资料。

首先讲AP的功率,AP功率不宜过高,根据安装密度来说,安装密度高要降低功率,安装密度低要提高功率。

如果安装密度高,功率就要调低一些。否则终端会认为信号一直很好,无需漫游,被动的成为假粘性终端。容易造成AP负载不平衡,1AP有难,多AP围观。影响实际传输效果,而且长期的高功率运行,也势必造成AP的加速老化。

如果安装密度低,功率就要调高些。否则覆盖范围太小,边缘终端连接困难,频繁断开。当然,功率调高也有一个度,毕竟通信是双方的,只加强AP侧发射功率,而终端发射功率低,反而提升了终端的信道占用率,拖慢AP整体性能。比如AP功率高,而终端功率低,终端感觉“这WIFI信号不错嘛~”,结果实际传输效果很差,甚至连接都困难。就好像AP对终端拿高音喇叭喊话,终端那个报纸卷筒吼。终端接收AP信号正常,而AP收不到终端的回应,也不能正常通信。

所以功率这个问题,跟AP的安装有很大关系,这个就需要方案设计人员根据AP性能来规划。当然,还要结合常见终端的无线性能。

再来讲终端的智能漫游。漫游分主动和被动,终端自行判断周围热点信号强度,自主断开重连的叫主动漫游。AC判断终端接收不同AP的信号强度、信噪比及与当前AP通信的信道占用率,发送解除关联帧,让终端漫游到邻居AP的,叫被动漫游。漫游主动性差的叫粘性终端,比如说某设备连接了AP1,后来远离AP1,到了AP2附近,明明AP2信号要好很多,可该设备仍坚持连接AP1。

华为无线的智能漫游功能分三部分:根据SNR智能漫游、根据信道占用率智能漫游、根据SNR弱信号踢出

SNR值由当前信号强度和底噪换算得出,根据接收到的终端报文,分析出该终端RSSI,减去底噪,得出当前终端连接的SNR。比如终端信号强度-70dBm,底噪-100dBm,算下来SNR值就是30dB。

根据SNR智能漫游有三个值可以设置,智能漫游阈值、信号差值高阈值、信号差值低阈值。

智能漫游阈值是分割两种漫游方案的界限。比如说“智能漫游阈值”设为35dB,那么,当终端SNR高于35dB时,终端与两个AP之间的SNR差值高于“信号差值高阈值”ap才会发送解除关联帧,让终端断开或漫游到其他AP。当终端SNR低于35dB,终端与两个AP之间的SNR差值高于“信号差值低阈值”,才会触发漫游。

一般来说“信号差值高阈值”要设置的比“信号差值低阈值”大一些。当前SNR高于阈值,说明信号很好,尽量不漫游。当前SNR低于阈值,说明信号质量不够好,要寻找漫游时机,比现在这个好一点就换。

根据速率智能漫游,也很有必要。由于无线网的特性,终端信号强度低会占用更多频宽来满足自己的传输需要,导致其他终端可用资源减少,表面看来就是AP承载能力下降。此时将弱信号设备踢出,让其退网或重新连接信号较好的AP,既能提升终端数据传输质量,又恢复了AP的承载能力。

最后还有一个功能,就是自动隐藏SSID。当AP负载达到一定程度时不再广播SSID,这在高密度覆盖中非常有用,可以有效避免因为负载过高造成的AP性能不足和网络质量下降。负载较低的AP才广播SSID,为终端提供服务。

当这些内容都配置好,就已经中午吃饭了。然而此时,项目经理反馈分拣台PCping服务器是公网IP在回应。最终排查结果是:服务器配置的网关为192.168.100.1,这个IP是cisco路由器的lan口,之前服务器能上网,是因为它绕过了核心交换机配置的静态路由,直接用vlan1为默认vlan的特性,通过cisco上网。所以,当我们使用分拣台PCping服务器时,路径是分拣台→核心交换机→服务器→cisco→核心交换机→分拣台。将服务器网关配置为192.168.100.2(核心交换机Vlan1的Vlanif)即恢复正常。

这就是第三方参与设备配置的弊端,他只保证了他自个的联网问题,跟你互联不互联就无所谓了。不过还好,他只管自己,就不会大肆修改你的方案,影响有限,好排查。

下午又修改了vlan101(无线终端)的网关,关掉了对应的DHCP,这样,接入wlan的设备需要手动配置IP信息才能访问网络。关掉了AP的2.4G功能,因为周围2.4G设备太多,干扰严重,不如单用5G。当然,也要根据情况操作,像之前昆山的项目,把周围无线清空,只保留我们的无线覆盖,也挺好。

在等待项目经理验收的时间里,梳理网络设备的配置,整的更有条理一点并记录下来,cisco的running-config也copy下来,方便生成管理文档。最终生成的文档内容有各网络设备的管理员账号密码表、vlan和vlanif、dhcp状态/配置详情、静态路由情况、每端口配置详情/连接情况、设备位置。并另附文件夹,包含各设备操作手册、AP点位图。唯一遗憾的是手头没有好用的拓扑图画图软件,没有提供拓扑。以前一直是用cisco的packet tracer,心疼自己电脑空间,暂时不装了,等下次任务再考虑吧。

至此,我的第一次华为无线组网开局算是结束了。

对于这次任务,我还是有很多感触的。从辞职后一直呆在家里,唯一的收入来源大概就是作为网络工程师给学长的项目做支持。上一次给了1000,这次给了2000,他总说给的还不够,但我很知足了,毕竟他的项目回款都挺慢,现金流很缺,关键是每个项目我都只是做网络调试,算下来差不多500/day,跟我之前给某仓修一天电脑相当了,而且还比那个轻松。至于辞职后学的python,只是端午时候给学弟公司爬了些数据,给了好多礼品。什么养生壶啊、粽子啊等等端午节福利来了一套,被小学弟戏称为用新技能得到的第一桶金。

任何时候,能拿到钱,都是很开心的。在这次任务中,每天不停的学习、实战,对各种网络概念又加深了理解。之前遇到难以理解的问题,都迎刃而解。在这种忙碌中,我更好的理解了vlan、vlanif、路由、SNR等概念,也和世面主流网络设备有了更多接触。每天晚上回到酒店,没时间打王者荣耀,而是联系华为售后,要案例、要名词解释。甚至在想要不考个华为得了,顺便把cisco的也考了。真的,忙起来,才会发现时间不够用,大家一个项目,不可能下班都走了,给你留在机房摸索。如果积累不够,太耽误事。当然,最重要的是,克服了console的恐惧,以前总觉得麻烦,命令行不好背。实际工作中就会发现:大家都是查手册,没几个人能全记下,知道常用的就行了。今天特意下载了S5720交换机的命令行参考,单目录就有127页,详情超过7700页,慢慢看吧。

我的目标是成为一名自由职业者,虽然现在很困难,但总是要努力的啊。如果一直保持这种战斗状态,没理由不成功~~~

你可能感兴趣的:(第一次华为无线组网开局)