阿里天池odps_SQL查看更多数据

  一不小心就入了天池的“坑”,感觉天池比赛是你机器学习数据挖掘理论结合实际很好的平台。但是缺点就是入门比较麻烦,最好有个大神或者最起码做过几次比赛的人能带你,不然入门真的很麻烦。可惜天池比赛上有很多常年参加的大牛选手都喜欢和相同水平的人组队(可以理解),而且他们相互加过QQ,组群讨论,所以想进他们的圈子还是很难的。
  不说那么多了,赶快进入正题。在阿里比赛的时候一般会有初赛和复赛,复赛会在阿里自己的平台上进行预测(不排除宣传自己平台的嫌疑,但是平台用惯了还不错,尤其是机器学习模型,还是挺有趣的)。在平台上要用的是odps_SQL,这应该是阿里结合SQL形成的自己的数据库处理语言,它和一般的SQL还是有区别的。

举个例子,介绍一下背景

我们有一个表lc_airport_gz_flights,有三列,分别是A,B,C。并且C中是时间数据,如:
2016/9/10 23:40:06

2016/10/17 23:41:14
那么我们想看C中2016/10/16的所有数据怎么办?如果你想全部显示出来,那么可能到2016/10/5就到10000条了,平台显示不出来。那么我们这样解决:
  

select * from lc_airport_gz_flights where C like '2016/10/16%' 

这样就把所有的2016/10/16日的时间数据显示出来了。
当然如果想显示多个日期,例如2016/10/15,2016/10/16,2016/10/17,还可以用另一种方法:

select * from airport_gz_flights where substr(C,6,5) = '10/15' or substr(C,6,5) = '10/16' or substr(C,6,5) = '10/17'

你可能感兴趣的:(机器学习)