自己记录 渔船 数据 分析

https://tianchi.aliyun.com/dataset/dataDetail?dataId=50009

描述
本赛题基于位置数据对海上目标进行智能识别和作业行为分析,要求选手通过分析渔船北斗设备位置数据,得出该船的生产作业行为,具体判断出是拖网作业、围网作业还是流刺网作业。初赛将提供11000条(其中7000条训练数据、2000条testA、2000条testB)渔船轨迹北斗数据。
数据列表
• 数据名称上传日期大小下载
• hy_round1_train_20200102.h52020-01-11178.70MB
• hy_round1_testA_20200102.h52020-01-1148.77MB
文档
本赛题基于位置数据对海上目标进行智能识别和作业行为分析,要求选手通过分析渔船北斗设备位置数据,得出该船的生产作业行为,具体判断出是拖网作业、围网作业还是流刺网作业。初赛将提供11000条(其中7000条训练数据、2000条testA、2000条testB)渔船轨迹北斗数据。
初赛提供11000条渔船北斗数据,数据包含脱敏后的渔船ID、经纬度坐标、上报时间、速度、航向信息,由于真实场景下海上环境复杂,经常出现信号丢失,设备故障等原因导致的上报坐标错误、上报数据丢失、甚至有些设备疯狂上报等。
渔船ID:渔船的唯一识别,结果文件以此ID为标示
x: 渔船在平面坐标系的x轴坐标
y: 渔船在平面坐标系的y轴坐标
速度:渔船当前时刻航速,单位节
方向:渔船当前时刻航首向,单位度
time:数据上报时刻,单位月日 时:分
type:渔船label,作业类型 原始数据经过脱敏处理,渔船信息被隐去,坐标等信息精度和位置被转换偏移。
选手可通过学习围网、刺网、拖网等专业知识辅助大赛数据处理。

import pandas as pd
import os
#usr/bin/python3.4

-- coding: utf-8 --

df = pd.read_csv(r’E:\machineLearning\data\fishing\hy_round1_train_20200102\0.csv’,encoding=‘utf8’,engine=‘python’)
path = r’E:\machineLearning\data\fishing\hy_round1_train_20200102’
result = df1 = pd.DataFrame(columns = df.columns)
for i in os.listdir(path):
s=os.path.join(path,i)
currentdf = pd.read_csv(s,encoding=‘utf8’,engine=‘python’)

print(currentdf.index)

print(currentdf.columns)
result = pd.concat([result, currentdf])
print(result.columns)

print(result.columns)

y = result[‘type’]

x = result.drop(‘type’,axis=1)

print(x.columns)

你可能感兴趣的:(机器学习)