12306余票查询比淘宝库存查询复杂多少?

文章纯属个人猜测,和12306木有任何关系,咱也没到能接触这种大架构网站的级别。

 在论证这些之前先大概罗列一下国内列车(包括传统火车,动车,高铁)行情。3

1:车站,全国大大小小的列车客运站大约3000的数量,

2:车次,开通的列车车次两年前约3700个班次,现在预估4000左右;

3:座位 ,动车组车厢二等座约80人,一般一组8个箱,约600个座位,还有两组串联16节车厢的情况,超过1000个座位。

     还有普通列车接近20节车厢的,差不多2000座位。

4:列车停靠站,一般的停靠站数量动车组多的由20+,列车就更多,有停靠50+的车站,查询到的最多的班次停靠站有62个。

5:列车票,最多提前预定30个工作日。

从数据量上来说,提供查询的最大化座位量 4000(车次)*800(平均车次座位数量)*30(最长预售天数)=96,000,000;

根据报道2019年春运的40天,全国铁路累计发送旅客4.1亿人次,所以这个96,000,000应该超出了实际情况不少。

停靠站数量目前来说查询到最长的是62个,如果按平均每次停站5分钟,那如果60个停靠站,全程的旅途停站的时间达到5个小时。

而这个时间从北京出发开往上海的车子早就到站返回了,预估可以预见的未来,不会有超过60个停靠站的车次出现。所以,

每一个座位的余票情况可以用一个64位的数字来表示。那这个数据量大约是96,000,000*8(64位数字)约为 768,000,000;

小于768M,都没到一个G。所以对于查询余票的计算可以抛开IO和数据库的影响,直接内存中运行。

如何计算:停靠站最多60,我们以中位数来算,即使停靠30个站,可售卖的票种类也有C(30,2)=600种。与列车平均座位数量800在数量上相当。

所以在计算余票时,大概率事件,需要比对每一个座位的余票数量,即使做优化,能达到的效率不会高多少。

举个列子从南宁往广州的动车。按平均800个座位,客户下了一个查询从南宁去梧州的座位余票(1111000.。。。途径平南,滕县两站所以4个1)

则必须与800个座位的每个64位数字求与,累计为零结果数量,才知余票情况。

而相对的,淘宝的库存查询可以直接取数,所以如果淘宝库存查询的事件复杂度为基准,那余票查询的时间复杂度是它的800*N倍(因为有循环控制,累加的存在所以有N>3);

所以余票查询的时间复杂度是淘宝库存查询复杂度的至少2400倍。

那是不是意味着余票查询系统需要的硬件成本比淘宝高上前倍?其实这也未必,前面说了,余票系统数据量比较小,可直接内存计算。两个情况合计起来,凭我现在的经验

也做不出推断,只能说它的时间计算复杂度确实是淘宝的数千倍。至于需要什么样的硬件,之后有时间,在上代码测试下结果。

 

 

 

 

 

 

 

     

你可能感兴趣的:(12306余票查询比淘宝库存查询复杂多少?)