Datawhale——城市管理大数据算法模型(DCIC)专题组队学习——task01

Datawhale——城市管理大数据算法模型(DCIC)专题组队学习——task01_第1张图片

运行时候遇到的问题与解决方法

  • 安装folium后无法import——更换python的kernel后可以import,怀疑是之前的环境里装了太多?
  • 安装geohash后无法import——找到库将Geohash改为geohash,修改文件夹下的init.py文件中的from geohash—>from .geohash
  • 如下报错

Datawhale——城市管理大数据算法模型(DCIC)专题组队学习——task01_第2张图片

将for循环里的

folium.Marker(
    data[0, ::-1]
).add_to(m)

改为

folium.Marker(
    location=list(data[0, ::-1])).add_to(m)

对baseline的解读

Datawhale——城市管理大数据算法模型(DCIC)专题组队学习——task01_第3张图片

baseline提供了两种计算潮汐的思路

  • 使用Geohash计算:

单车流量统计,归类入流量和出流量,可以计算得到每个位置的留存流量

统计各个街道的潮汐情况,我们可以先把街道信息提取,然后通过已知的停车面积计算密度

得到潮汐情况最严重的道路:

  • 经纬度距离计算:

使用sklearn中的NearestNeighbors,设置haversine距离,计算最近停车点。

通过分析具体停车位置的热度,找到目前共享单车的问题所在(由数据到问题)

  1. 并不是所有的车都听到了停车点,有一些车停到了距离停车点较远的距离
  2. 有一些停车点有潮汐现象,有的不存在潮汐现象

通过对问题的分析,比如潮汐现象,远距离停车点等等,分割大问题到小问题(站在To C的角度考虑)

  • for example:

如果乘客到了一个潮汐停车点A,如何对乘客进行引导呢?

  1. 推荐的停车点B应该和A距离不远;
  2. 推荐的停车点B应该没有潮汐情况;
  3. 也需要考虑到跨街道和横穿马路的情况;

接下来思考如何用工具:比如我们机器学习的方法,来解决问题(从问题到方案)

可能的改进方向

  1. 近邻非潮汐停车点需要综合推荐,不能总是推荐一个,否则会导致出现新的潮汐点;
  2. 近邻非潮汐停车点推荐需要考虑到交通情况,如街道信息、具体位置信息;
  3. 近邻非潮汐停车点推荐需要全局调度,也可以具体分析周中和周五两种情况;

比赛的感受和收获

1、解决方案第一,机器学习方法只是其中的一部分,问题是什么,以什么样的思路去解决,是更需要思考的地方

2、数据使用将问题显化,而技术架构是解决思路的投射。对于一个任务来说,设计demo的首要性不言而喻,也就是说其实撰写好demo和技术文档是成功的第一步。

你可能感兴趣的:(Datawhale_learn,机器学习,大数据,python)