科大讯飞软件股份有限公司(2020/06——2020/10) 实习岗位:NLP算法实习生
1. Mxengine-Lite深度学习框架转换工具
项目描述:做一个能把tensorflow和pytorch的常用op转换成公司的Mxengine-Lite框架op的转换工具,节约项目中转换模型重构代码的时间,提升效率。
我的工作:
(1) 根据tensorflow和pytorch源码里常用op的实现方式,在Mxengine-Lite引擎C++源码里添加常用的tensor计算代码,重新编译后提供给python端构建计算流图。
(2) 完成python端bert、cnn、gru、lstm、fc等常见op的计算流图和模型参数从tensorflow和pytorch到Mxengine-Lite的转换,完成了工具的封装以及使用说明文档。
四川川大智胜软件股份有限公司(2018/04——2020/06) 实习岗位:研发实习生
1. 军民航飞行情报报文智能转换系统
项目描述:将XML格式的军航报文转换成Json格式的民航报文,让管制员制定更好的空域调配方案减少军民航飞机飞行冲突。
我的工作:
(1) 依据报文规范针对报文数据不同标签字段制定转换规则,包括正则表达式和通用规则方法。
(2) 采用多线程方式和线程安全的队列处理UDP网络数据包的接收和发送过程。
(3) 参与设计了报文转换Oracle数据库表,编写了python增删查改数据库的代码模块工具。
(4) 编写了不同操作系统下python调用具有网络收发功能的C++版本的Netifi动态链接库工具包。
(5) 利用Pyinstaller进行项目打包编译和部署,后期项目的维护。
(6) 项目的联调和测试。
2. 基于Seq2Seq模型的民航报文航路字段自动纠错项目
项目描述:针对语义出错的民航航路报文利用seq2seq翻译模型进行纠错任务,提高管制员工作效率。
我的工作:
(1) 利用正则表达式和规则从原始报文和AFTN报文中提取航路字段数据。
(2) 从AIRCN全球航路查询系统中利用python爬虫爬取缺失的航路数据。
(3) 搭建Seq2Seq+Attention+Beam search模型用于报文纠错。
(4) 和基于规则的报文纠错做对比,提升了28%的准确率。
(5) 集成C++的Netifi动态链接库完成网络收发任务。
(6) 使用多线程处理整个报文数据纠错任务。
3. 基于LSTM的军民航空域动态管理协同决策子系统
项目描述:根据雷达的飞行目标航迹信息数据,判断它是无人机还是民航飞机,为决策系统提供辅助信息。
我的工作:
(1) 对雷达传回的航迹信息进行数据清洗和预处理,通过论文中雷达经纬度坐标转换公式编写C++代码计算得到曲率、挠率特征,最终提取了距离、方位、俯仰、航向、经度、纬度、高度、曲率、挠率这九个特征。
(2) 利用PCA降维和Seaborn工具包进行飞行目标在三维空间的飞行轨迹可视化分析。
(3) 利用决策树方法和深度学习LSTM模型进行了分类实验,通过对比得出LSTM在分类准确率、精确率和召回率上都高于决策树,最终采用了LSTM模型。
(4) 定义模型调用接口,集成到军民航空域动态管理项目系统中。
4. 基于transformer模型的民航告警信息专业语料的中英文翻译项目
项目描述:针对民航告警信息的专业语料基于transformer进行中英文翻译任务,提升管制员工作效率。
我的工作:
(1) 从提供的告警信息文本中进行数据处理和清洗得到模型训练模型样本。
(2) 从github上下载transformer模型代码进行一些微调以适应这个任务。
(3) 模型训练和测试,准确率比利用规则的翻译高了3%左右。
成都佳发安泰股份有限公司(2016/04——2017/04) 工作岗位:嵌入式工程师
1. 屏蔽终端防作弊无线组网通讯项目
我的工作:
(1) 用C语言和STM32芯片对设备进行迭代开发,解决了设备采用无线组网通信的方式被本身多个频段射频信号所干扰的问题。
成都优芯微电子(2017/12——2018/04) 工作岗位:嵌入式工程师
1. 动感单车项目
我的工作:
(1) 通过多个传感器测量出的单车速度和人体心率数据,利用STM8主控芯片控制单车挡位,并通过RS232串口将数据发送给上位机处理来控制显示屏画面的播放速度。
业余时间做的一些小项目:
微博文本情绪分类(BiLSTM、CNN、Incepition)
信号与系统值预测(BiLSTM)
短期风电功率值预测(GRU)
猫眼电影分析(Python爬虫、C++的Qt界面)