大学生毕业论文题目写作风格赏析

引言

每到大学生毕业论文开题的时间,为了选择不落俗套的题目而抓耳挠腮。本文以2022届计算机学院的毕业论文为研究对象,以可视化的方式归纳分析不同专业的论文题目写作风格及研究方向。

运行环境

数据格式为CSV,共671条,字段信息有:论文题目、关键词、专业名称。专业包括有信息工程,教育技术学,数字媒体技术,物联网工程,计算机科学与技术,软件工程和通信工程。

  • Jupyter Notebook
  • Plotly Express
  • Pkuseg 中文分词工具包
  • Pandas

写作风格分析

各专业论文题目统计

图例中各统计指标表示含义:
median:标题长度的中位数
mean:平均标题长度
min:标题最短字符数
max:标题最长字符数
其中字符数的统计含中文,英文(每个字母计量一个单位)和标点符号(如《》)。
大学生毕业论文题目写作风格赏析_第1张图片

  1. 先敲重点,列表 (见后)中的题目有哪些亮点?

列表题目中均含有英文专有名词,但是首字母小写是错误写法。除了x86这样约定俗成的专有名词之外,其他英文单词均需要首字母大写!首字母大写!首字母大写!有些甚至是全部大写,如MVC,STM32,PRA。

import pandas as pd
pd.options.mode.chained_assignment = None  # default='warn'
file_path=r'2022--计信毕业论文.csv'
df=pd. read_csv (file_path,encoding='utf-8-sig',low_memory=False)

df = df.dropna(subset=['论文题目'])#去除论文题目为空的数据行

mask = (df['题目分词'].apply(lambda x:any( c[0].islower() for c in x.split()))) #查找首字母小写的英文单词
df=df[mask][['证书专业名称','论文题目']]

df
index 证书专业名称 论文题目
1 通信工程 基于python-opencv的人脸识别算法设计与实现
206 通信工程 基于javaweb的在线考试系统
209 通信工程 基于springboot的新冠数据查询
  1. 标题的最短长度统计,除了数字媒体技术专业(10个字符),其他专业的标题最短长度接近(7个字符)。

  2. 标题的最长长度统计,计算机科学与技术专业以42个字符的标题长度独占鳌头,其他专业的标题最长长度都在30个字符左右。

  3. 各专业论文标题的平均长度和中位数值接近,说明标题长度分布合理,无较大落差。

  4. 教育技术学专业的论文平均长度明显大于其他专业,主要是该专业针对具体的课程进行研究,因此书名号《》和课程名在论文标题中占比较高。

  5. 最长长度的论文题目

index 证书专业名称 论文题目
494 计算机科学与技术 基于SpringBoot和mybatis-plus框架的校园食堂订餐系统的设计与实现
  1. 较短长度的论文题目
index 证书专业名称 论文题目
190 通信工程 5G技术研究
467 计算机科学与技术 农产品销售商城
502 物联网工程 低代码开发平台
573 信息工程 净水器控制系统

各专业论文数量分布

大学生毕业论文题目写作风格赏析_第2张图片

各专业论文题目的Top15关键词分布

先整体了解Top15关键词在所有专业的分布情况

大学生毕业论文题目写作风格赏析_第3张图片

  1. 上图看出,除了教育技术学专业外,关键字“基于”,“系统”,“设计”,“实现”在各其他专业均占很大的比例,一方面说明工科学生的动手能力都是杠杠的,另一方面也反映出大家喜欢拿Web或桌面系统的开发实现作为自己的毕业选题,如果想让自己的毕设不落俗套,就尽量选择其他的研究重点。
  2. 除了研究内容上有变化外,毕业题目的用词也避免缺乏新意。推荐清华大学人工智能研究院的产品万词王,可以根据意思反向查找词语,可以避免表达形式的单一性。
  3. 教育技术学专业的毕业生多用的关键词是:教学、信息、应用等,这些反映学生侧重信息技术在教育教学中的应用。

关注公众号“乐享Python”,获取更多教育数据分析资料。再看看各个专业中的Top15关键词的分布:
大学生毕业论文题目写作风格赏析_第4张图片
大学生毕业论文题目写作风格赏析_第5张图片
大学生毕业论文题目写作风格赏析_第6张图片

大学生毕业论文题目写作风格赏析_第7张图片
大学生毕业论文题目写作风格赏析_第8张图片
大学生毕业论文题目写作风格赏析_第9张图片
大学生毕业论文题目写作风格赏析_第10张图片

from collections import Counter
import pandas as pd
file_path=r'毕业论文-2.csv'
df=pd. read_csv (file_path,encoding='utf-8-sig',low_memory=False)

df = df.dropna(subset=['论文题目'])#去除论文题目为空的数据行
grouped = df.groupby('证书专业名称')

lst_df=[]

for name, group in grouped:
    lst=[]
    for x in group['题目分词'].values.tolist():
        lst.extend(x.split())
    # #第一种方法
    # d={i:lst.count(i) for i in set(lst)}
    # df_group=pd.DataFrame(d.items(), columns=['word', 'count'])

    #第二种方法
    d=dict(Counter(lst))
    df_group=pd.DataFrame(d.items(), columns=['word', 'count']) 
    df_group['name']=name
    lst_df.append(df_group)
df = pd.concat(lst_df)
df


#pivot_cht_html(df,'data.html')

论文题目列表

index 证书专业名称 论文题目
1 通信工程 基于python-opencv的人脸识别算法设计与实现
206 通信工程 基于javaweb的在线考试系统
209 通信工程 基于springboot的新冠数据查询
338 通信工程 基于python的车牌识别系统设计与实现
435 通信工程 基于springboot+netty的网络通信系统
438 通信工程 基于springBoot+netty的网络通讯软件设计与实现
461 通信工程 基于python的信号与系统实验教学平台设计与实现
30 软件工程 基于java的房屋租赁系统的设计与实现
181 软件工程 基于android的网上购物APP微信小程序的开发与实现
256 软件工程 基于uni-app的电影计划小程序的设计与实现
422 软件工程 基于x86架构的宏内核操作系统的实现
11 计算机科学与技术 基于ssm框架的选课系统的设计与开发
41 计算机科学与技术 基于springboot的后台管理系统
44 计算机科学与技术 基于springboot的办公自动化系统设计与实现
90 计算机科学与技术 基于web的美妆商城的设计与实现
99 计算机科学与技术 基于springboot和微信小程序的点餐系统设计与实现
108 计算机科学与技术 基于web的社区宠物诊疗系统
132 计算机科学与技术 基于springboot的学校教材订购系统的设计与实现
135 计算机科学与技术 基于springboot的流浪动物管理系统的设计与实现
136 计算机科学与技术 基于java的学生选课系统的设计与实现
167 计算机科学与技术 基于ssm的医院在线预约系统的开发
175 计算机科学与技术 基于python的新冠疫情实时数据统计及可视化
216 计算机科学与技术 基于web的在线竞价系统的设计与实现
240 计算机科学与技术 基于排序算法的回合制游戏《thunderclap》的设计与开发
287 计算机科学与技术 基于web的小型酒店管理系统的设计与实现
316 计算机科学与技术 基于Bloom filter的视频过滤系统的设计和实现
342 计算机科学与技术 基于java的在线商城的设计与实现
349 计算机科学与技术 基于ssm的基层党员之家建设平台
358 计算机科学与技术 基于MVC模式的web图书管理系统设计与实现
360 计算机科学与技术 fec算法在实时数据传输中的应用设计与实现
363 计算机科学与技术 基于java微服务在线视频教育系统设计与开发
365 计算机科学与技术 基于unity3D的移动增强现实与人机交互技术设计与实现
366 计算机科学与技术 基于linux操作系统的聊天软件的设计与开发
374 计算机科学与技术 基于python的高校网络舆情分析系统设计与实现
395 计算机科学与技术 基于python的贪吃蛇游戏设计
415 计算机科学与技术 基于springboot技术的足球场管理系统的设计与实现
417 计算机科学与技术 基于python的疫情数据分析和可视化的设计与实现
430 计算机科学与技术 基于python的食品推荐系统设计
443 计算机科学与技术 基于unity3D引擎的射击游戏开发与实现
494 计算机科学与技术 基于SpringBoot和mybatis-plus框架的校园食堂订餐系统的设计与实现
523 计算机科学与技术 一种分布式定时调度中间件My-trigger的设计与实现
525 计算机科学与技术 基于maven+SSM架构一站式城镇商品一体化web服务
526 计算机科学与技术 统计云与rpa应用研究
527 计算机科学与技术 基于统计人才队伍培养模式的创新与rpa应用研究
531 计算机科学与技术 中国国民经济核算体系与rpa应用研究
532 计算机科学与技术 统计监督职能研究与rpa应用研究
560 计算机科学与技术 基于web的作业系统设计与实现
572 计算机科学与技术 基于web的学生宿舍管理系统
600 计算机科学与技术 基于ssm的校园点餐系统设计
602 计算机科学与技术 基于uni-app单词学习系统的研究与设计
606 计算机科学与技术 基于ssm猫咖管理系统设计与实现
608 计算机科学与技术 基于ssm的电影票订购系统的实现
610 计算机科学与技术 基于springboot的房屋租赁管理系统设计与实现
648 计算机科学与技术 基于app的奶茶点单系统的设计与实现
649 计算机科学与技术 基于vue和node.js外卖平台设计与开发
652 计算机科学与技术 基于springboot的电影订票购票系统的设计与实现
202 物联网工程 基于vue超市商品管理系统
238 物联网工程 基于java的图书管理系统的设计与实现
385 物联网工程 基于opencv的人脸识别系统的设计与实现
396 物联网工程 基于thinkphp的个人博客的设计
397 物联网工程 基于jsp的排课系统的设计与实现
398 物联网工程 基于python的外卖平台的数据可视化
626 物联网工程 基于python的商品销售管理系统的设计与实现
627 物联网工程 基于ssm的校园流浪猫管理系统的设计与实现
628 物联网工程 基于java web的校园每日疫情通报系统设计与实现
629 物联网工程 基于vue.js的购物网站设计与实现
630 物联网工程 基于ssm的水果商城系统的设计与实现
639 物联网工程 基于web的题库管理系统设计与实现
250 数字媒体技术 转描技术在二维动画《king》中的应用研究
484 教育技术学 基于steam理念的初中信息技术课程教学设计与研究
485 教育技术学 基于steam的高中人工智能教学设计研究–以黄石X中为例
488 教育技术学 基于mpython的高中创客教学设计与实践研究
293 信息工程 基于stm32的智能路灯管理系统
541 信息工程 基于python爬虫的新闻管理系统开发
575 信息工程 基于python进行的web自动化测试
667 信息工程 python可视化国内疫情大数据分析

你可能感兴趣的:(课程案例,资源分享,python,pandas)