Buckletime

Python案例实操3-电影数据分析

一、读取数据
二、数据处理
- 1.索引重命名
- 2.合并数据集
- 3.选取子集
- 4.缺失值处理
- 5.数据格式转换
三、数据分析及可视化
- 1.电影类型随时间变化趋势图
- 2.统计电影分类情况
- 3.电影类型与利润的关系
- 4.Universal Pictures 和 Paramount Pictures 公司电影发行数据对比
- 5.改编电影和原创电影的对比情况
- 6.电影时长与电影票房及评分的关系
- 7.电影关键词分析

本案例数据来源于 kaggle 上的 Movie数据集，主要研究以下几个问题：

电影类型如何随着时间的推移发生变化的？
统计电影分类的情况?
电影类型与利润的关系？
Universal 和 Paramount 两家影视公司的对比情况如何？
改编电影和原创电影的对比情况如何？
电影时长与电影票房及评分的关系？
分析电影关键字

实战开始：

一、读取数据

creditlist = pd.read_csv(r'E:\WorkSpaces\Python\data\tmdb\tmdb_5000_credits.csv')
movielist = pd.read_csv(r'E:\WorkSpaces\Python\data\tmdb\tmdb_5000_movies.csv')

二、数据处理

1.索引重命名

# 修改 creditlist中的列索引 字典格式{'old','new'}，inplace=True表示在原数据上修改
creditlist.rename(columns={'movie_id': 'id', 'crew': 'directors', 'cast': 'actors'}, inplace=True)
# 修改 movielist中的列索引
movielist.rename(
    columns={'original_language': 'language',
             'production_companies': 'companies', 'production_countries': 'countries'}, inplace=True)

2.合并数据集

合并数据集，注意列索引保持一致

# 数据合并 键指定 id 和 title
databoth = pd.merge(creditlist, movielist, on=['id', 'title'])

3.选取子集

选取子集，选择我们需要的列

# 筛选特征值（目标值）
# ['电影名称', '类型','语言', '导演','主演','首映日期','电影时长（分钟）','平均评分','评论次数','关键词','制作公司列表','制作国家列表','预算（美元）','收入（美元）','浏览次数']
datalist = pd.DataFrame(databoth,
                        columns=['title', 'genres', 'language', 'directors', 'actors', 'release_date', 'runtime',
                                 'vote_average', 'vote_count', 'keywords', 'companies',
                                 'countries', 'budget', 'revenue', 'popularity'])

4.缺失值处理

少量缺失值可进行手动赋值处理，大量缺失值可使用dropna()删除或者fillna()替换

# 检测缺失值 isnull() + sum()
res_null = pd.isnull(datalist).sum()
print('缺失值检测结果：\n', res_null)
# 检测到release_date 有一条为空，runtime有两条为空
# 针对方式：手动填充，找出具体的电影名称，自己查找相关信息
# a、确定bool数组
mask = datalist.loc[:, 'release_date'].isnull()
mask2 = datalist.loc[:, 'runtime'].isnull()
# b、根据bool数组来获取缺失值位置的电影名称
movie_name = datalist.loc[mask, 'title']
movie_name2 = datalist.loc[mask2, 'title']
print('缺失上映日期的电影名称为：\n', movie_name)	
# 4553    America Is Still the Place
# Name: title, dtype: object
print('缺失电影时长的电影名称为：\n', movie_name2)
#  2656    Chiamatemi Francesco - Il Papa della gente
# 4140                   To Be Frank, Sinatra at 100
# Name: title, dtype: object
# c 、 填充
datalist.loc[mask, 'release_date'] = '2014-06-01'
datalist.iloc[2656, datalist.columns.get_indexer(['runtime'])] = 94
datalist.iloc[4140, datalist.columns.get_indexer(['runtime'])] = 81

5.数据格式转换

# 以类型为例 [{"id": 28, "name": "Action"}, {"id": 12, "name": "Adventure"}, {"id": 14, "name": "Fantasy"}, {"id": 878, "name": "Science Fiction"}]
# 转换成 Action,Adventure,Fantasy,Science Fiction 格式

def data_format(datas):
    """
    数据格式转换
    :param datas: 数据
    :return: 转换之后的数据
    """
    name_list = []
    # 遍历 列表
    for item in datas:
        # 如果item存在
        if item:
            movie_type = item['name']
            name_list.append(movie_type)

    return ','.join(name_list)

# --电影类型 格式转换--
print('电影类型：\n', datalist.loc[:, 'genres'])  # json数据类型
# json.loads # 可以将json转化为python类型
# 将 datalist.loc[:, 'genres'] 由 json类型转化为 python类型
datalist.loc[:, 'genres'] = datalist.loc[:, 'genres'].transform(json.loads)
# 调用方法 疑问？这里是怎么调用方法的，参数怎么传的
datalist.loc[:, 'genres'] = datalist.loc[:, 'genres'].transform(data_format)
print('电影类型 转换之后的结果：\n', datalist.loc[:, 'genres'])

# 其他字段转换类似，此处不再重复展示...

三、数据分析及可视化

1.电影类型随时间变化趋势图

思路：

在每行数据后追加所有电影类型列，初始值为0
遍历每一部电影的’genres’列，把分类包含在该列中的值置为1
分组并按照类型求和

# 将 release_date 转化为 pandas支持的时间序列
datalist.loc[:, 'release_date'] = pd.to_datetime(datalist.loc[:, 'release_date'])
# 获取 发行年份
datalist.loc[:, 'release_year'] = datalist.loc[:, 'release_date'].dt.year

# 进行字符串分割
temp_list = [i.split(",") for i in datalist["genres"]]
# 获取电影的分类，并去重
typelist = np.unique([i for j in temp_list for i in j])
# 发现typelist中有空值，删除空元素''
typelist = np.delete(typelist, typelist == '')
for column in typelist:
    # 先增加所有电影类型列，初始值为0
    datalist.loc[:, column] = 0
    # 构建bool数组
    mask = datalist.loc[:, 'genres'].str.contains(column)
    # 修改
    datalist.loc[mask, column] = 1

# 按照发行年份进行分组，统计各个电影各个年份的数量
res = datalist.groupby('release_year')[typelist].sum()
print(res)

# 绘图
# 创建画布
plt.figure()
# 默认不支持中文 ---修改RC参数
plt.rcParams['font.sans-serif'] = 'SimHei'
# 增加字体之后变得不支持负号，需要修改RC参数让其继续支持负号
plt.rcParams['axes.unicode_minus'] = False
# 构建横轴数据
x = res.index
for movie_type in res.columns:
    # 构建纵轴数据
    y = res[movie_type]
    # 绘制折线图
    plt.plot(x, y)
# 增加标题
plt.title('电影类型随时间变化趋势图')
# 设置图例
plt.legend(res.columns, fontsize='x-small')
# 设置纵轴名称
plt.ylabel('数量')
# 设置横轴名称
plt.xlabel('年份')
# 增加网络曲线
plt.grid(True, alpha=0.2)
# 保存图片
plt.savefig('./电影类型随时间变化趋势图.jpg')
# 展示
plt.show()

2.统计电影分类情况

思路
1、创建一个全为0的dataframe，列索引置为电影的分类，temp_df
2、遍历每一部电影，temp_df中把分类出现的列的值置为1
3、求和

# 创建一个全为0的dataframe, 行大小为电影数据列表的行数，列大小为全部电影类型的数量（去重后），用于统计每种类型的电影数量
temp_df = pd.DataFrame(np.zeros([datalist.shape[0], typelist.shape[0]], dtype=int), columns=typelist)
# 遍历每一部电影，temp_df中把分类出现的列的值置为1
for i in range(datalist.shape[0]):
    # temp_list[i] ['Action','Adventure','Animation']
    # 通过行列索引值进行赋值
    temp_df.iloc[i, temp_df.columns.get_indexer(temp_list[i])] = 1

# 求和、绘图
temp_df.sum().sort_values().plot(kind="pie", figsize=(20, 8), fontsize=10, autopct="%.2f", title='电影分类情况统计')
# 默认不支持中文 ---修改RC参数
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.savefig('电影分类情况统计.jpg')

3.电影类型与利润的关系

对比各种电影类型的平均利润 —柱状图
Music —> profit — sum / music 电影的数量 count ===>平均每一个music电影的利润

# 计算 利润
datalist.loc[:, 'profit'] = datalist.loc[:, 'revenue'] - datalist.loc[:, 'budget']
print('利润：\n', datalist.loc[:, 'profit'])

# 构建一个list来存储各种类型电影的平均利润
movie_type_profit = []
# 遍历 所有的 电影类型
for column in typelist:
    # column : 各种电影类型
    # 确定bool数组 ---为True的电影，属于mtype类型
    mask = datalist.loc[:, column] == 1
    # 筛选 column 类型电影 --该类型电影利润的平均值
    mean_profit = datalist.loc[mask, 'profit'].mean()
    # 加入到 movie_type_profit
    movie_type_profit.append(mean_profit)

print(typelist)
print(movie_type_profit)
# 创建series
res_series = pd.Series(data=movie_type_profit, index=typelist).sort_values()
# 绘图
res_series.plot(kind="barh", figsize=(20, 8), fontsize=10, title='电影类型和利润关系图', ylabel='电影分类')
# 默认不支持中文 ---修改RC参数
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.savefig('电影类型和利润关系图.jpg')

4.Universal Pictures 和 Paramount Pictures 公司电影发行数据对比

1）Universal Pictures 和 Paramount Pictures 公司电影发行量对比

对’companies’列数据进行处理，判断是否包含Universal Pictures 或 Paramount Pictures公司

# 先增加两列数据  两家公司发行的电影数量
datalist.loc[:, 'Universal Pictures'] = 0
datalist.loc[:, 'Paramount Pictures'] = 0
# 判断 ---bool数组，包含Universal Pictures公司
mask1 = datalist.loc[:, 'companies'].str.contains('Universal Pictures')
# 修改
datalist.loc[mask1, 'Universal Pictures'] = 1

# 判断 --bool数组，包含Paramount Pictures公司
mask2 = datalist.loc[:, 'companies'].str.contains('Paramount Pictures')
# 修改
datalist.loc[mask2, 'Paramount Pictures'] = 1

# 发行量计算
res_pie = datalist.loc[:, ['Universal Pictures', 'Paramount Pictures']].sum()

# 绘图
res_pie.plot(kind="pie", figsize=(20, 8), fontsize=10, autopct="%d", title='电影发行量对比图')
# 默认不支持中文 ---修改RC参数
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.savefig('电影发行量对比图.jpg')

2）分析 Universal Pictures 和 Paramount Pictures 两家影视公司电影发行量随时间变化的趋势

按照 release_year分组，对发行数量求和

# 查看两家公司发行量随时间变化趋势
# 按照 release_year分组，统计两家公司每年的发行数量
res_line = datalist.groupby(by='release_year')[['Universal Pictures', 'Paramount Pictures']].sum()
res_line.plot(figsize=(20, 8), fontsize=20, title='发行量随时间变化趋势')
plt.ylabel('发行量')
plt.xlabel('时间')
plt.savefig('发行量随时间变化趋势.jpg')

5.改编电影和原创电影的对比情况

如何确定电影是改编的？还是原创的呢？
与电影相关的关键字 keywords
如果在这里是根据小说改编的 base on novel/fairy tale/…
只要出现 base on 这个字眼就说明是改编的

# 先增加一列
datalist.loc[:, 'not_original'] = '原创'
# 确定bool数组，如果是改编的，那就将 not_original 修改为'not_original'
mask = datalist.loc[:, 'keywords'].str.contains('based on')
# 修改
datalist.loc[mask, 'not_original'] = '改编'

# 按照是否原创进行分组，统计原创电影的平均预算、收入、利润
# 计算 利润
datalist.loc[:, 'profit'] = datalist.loc[:, 'revenue'] - datalist.loc[:, 'budget']
res_not_original = datalist.groupby('not_original')[['budget', 'revenue', 'profit']].mean()
print('res_not_original\n', res_not_original)

# 绘图
res_not_original.plot(kind="bar", figsize=(20, 8), fontsize=20, title='原创与改编电影预算、收入、利润对比柱状图')
# 默认不支持中文 ---修改RC参数
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.ylabel('美元')
plt.xlabel('原创或改编')
plt.savefig('原创与改编电影预算、收入、利润对比柱状图.jpg')

6.电影时长与电影票房及评分的关系

按照电影时长分组，查看不同电影时长的平均票房、平均评分
1、自定义时长分组
2、进行离散化
3、分组聚合，对票房和评分进行求均值

print('查看电影时长、票房、评分：\n', datalist.loc[:, ['runtime', 'revenue', 'vote_average']].head())
#  1、自定义时长分组
bins = [0, 60, 90, 120, 150, 180, 210, 240]
# 2、数据离散化
datalist.loc[:, 'runtime'] = pd.cut(x=datalist.loc[:, 'runtime'],
                                    bins=bins,
                                    include_lowest=True)
# 3、分组聚合，对票房和评分进行求均值
res_runtime = datalist.groupby('runtime')[['revenue', 'vote_average']].mean().sort_values(
    by=['revenue', 'vote_average'])
print('res_runtime:\n', res_runtime)

# 绘图 指定评分列vote_average使用右y轴（子图）
ax = res_runtime.plot(secondary_y=['vote_average'], figsize=(10, 5), title='不同时长的电影票房、评分的对比柱状图')
ax.set_xlabel('时长（分钟）')
ax.set_ylabel('票房（美元）')
ax.right_ax.set_ylabel('评分')  # 右y轴的标签
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.savefig('不同时长的电影票房、评分的对比柱状图.jpg')

7.电影关键词分析

生成电影关键词词云

from wordcloud import WordCloud, STOPWORDS

keywords_list = []
    for x in datalist['keywords']:
        keywords_list.append(x)
    str_key = ''.join(keywords_list)
    str_key.replace('\'s', '')
    # 设置停用词
    stopwords = STOPWORDS
    stopwords.update(['based', 'film'])
    # 封装词云
    wc = WordCloud(
        background_color="white",
        font_path="simkai.ttf",  # 字体 C:\Windows\Fonts
        stopwords=stopwords
    )
    wc.generate_from_text(str_key)
    # 绘制图片
    plt.figure(figsize=(10, 5))
    plt.imshow(wc)
    plt.axis("off")  # 不显示坐标轴
    plt.savefig(r'电影关键词.jpg')

参考文章：https://blog.csdn.net/markshui/article/details/108214328

10个必备Python调试技巧：从pdb到单元测试的开发效率提升指南 deephub python 单元测试机器学习人工智能开发语言
在Python开发过程中，调试是一项核心技能。无论是初级开发者还是资深工程师，掌握高效的调试技巧都能显著提升开发效率。本文将介绍10个实用的调试方法，帮助开发者更有效地定位和解决问题。1、Python内置调试器pdb的应用Python的内置调试器pdb是一个功能强大的调试工具。它能够在程序执行过程中设置断点，检查变量状态，并支持单步调试。importpdbdefbuggy_function(a,b
【python】for 循环的嵌套应用 ClearStari99 Python python 开发语言
目录：while循环的基础语法while循环的基础案例while循环的嵌套应用while循环的嵌套案例for循环的基础语法for循环的嵌套应用循环中断：break和continue综合案例学习目标：掌握for循环的嵌套使用for循环的嵌套同while一样，for循环也支持嵌套使用生活中的嵌套循环：每天都去向小美表白直到成功为止每次表白的流程是送10朵玫瑰然后表白程序中的嵌套for循环：for临时变
【python】if elif else语句 ClearStari99 Python python 开发语言
目录布尔类型和比较运算符if语句的基本格式ifelse语句ifelifelse语句判断语句的嵌套实战案例学习目标掌握ifelifelse语句进行多条件判断的语法思考某些场景下，判断条件不止一个，可能有多个。这种需求能用Python实现吗？ifelifelse语句可以实现ifelifelse语句生活中的判断：如果1动作如果2动作如果N动作否则动作程序中的判断：if条件1:条件1满足应做的事情条件1满
Python Pandas 数据 GroupBy 分组操作详解：分组、聚合与遍历敲代码不忘补水一起学 Python pandas python numpy matplotlib 开发语言数据分析大数据
PythonPandas数据GroupBy分组操作详解：分组、聚合与遍历本文详细介绍了Pandas中数据分组（GroupBy）的常用操作，包括按单列和多列分组、分组后的数据访问与聚合计算。通过实例讲解了如何使用groupby()方法对数据进行分组，并展示了如何使用first()、last()等方法获取分组后的特定数据。此外，还介绍了如何使用agg()方法进行多种聚合计算，如求和、均值和标准差，及如
第20篇：Python 开发进阶：使用Django进行Web开发详解猿享天开 python从入门到精通 python django 开发语言
第20篇：使用Django进行Web开发内容简介在上一篇文章中，我们深入探讨了Flask框架的高级功能，并通过构建一个博客系统展示了其实际应用。本篇文章将转向Django，另一个功能强大且广泛使用的PythonWeb框架。我们将介绍Django的核心概念，包括项目与应用结构、模型与数据库迁移、管理后台、模板与静态文件管理，以及如何将Django应用部署到生产环境。通过详细的代码示例和实战项目，您将
【python】list（列表）的遍历 ClearStari99 Python python 开发语言
目录数据容器入门数据容器：list（列表）list（列表）的遍历数据容器：tuple（元组）数据容器：str（字符串）数据容器的切片数据容器：set（集合）数据容器：dict（字典、映射）数据容器的通用操作综合案例学习目标掌握使用while循环，遍历列表的元素掌握使用for循环，遍历列表的元素列表的遍历-while循环既然数据容器可以存储多个元素，那么，就会有需求从容器内依次取出元素进行操作。将容
Protocol buffers--python简介以及安装与使用冰雪满天 Python Protocol
简介：以下引用自官方首页文档：ProtocolbuffersareGoogle'slanguage-neutral,platform-neutral,extensiblemechanismforserializingstructureddata–thinkXML,butsmaller,faster,andsimpler.Youdefinehowyouwantyourdatatobestructur
工业数据分析：解锁工厂数字化的潜力 Echo_Wish Python进阶数据分析数据挖掘
工业数据分析：解锁工厂数字化的潜力引言工业数据分析是工业4.0时代的核心技术之一。从生产设备的传感器数据，到供应链的物流信息，工业环境中每天都会产生海量数据。这些数据蕴藏着巨大的潜力，能够帮助企业优化生产流程、降低运营成本、提高产品质量。然而，如何高效地收集、分析并应用这些数据，是许多企业面临的挑战。本文将结合实例与代码，带你了解工业数据分析的核心思路和技术实现。一、工业数据的特点工业数据有以下几
Python Connect OracleDB ddttoop Python3 WorkTools
Python连接Oracle数据库原文链接：https://blog.csdn.net/xinyuzxx/article/details/81703625cx_Oraclecx_Oracle模块是Python连接Oracle数据库的模块，在Python中，如果要连接Oracle，必须先安装cx_Oracle模块。cx_Oracle的下载地址：https://pypi.python.org/pypi
python打包opencv为exe可执行程序 AIOT魔法师 YOLOv5和YOLOv11 opencv python 计算机视觉
网上很多教程但是呢，每次运行起来打包出来的exe，都会报错，多数是提示找不到cv2的库，或者说让安装opencv，例如下面这种：解决方案如下：1、使用opencv-python的版本为：pipinstall-ihttps://pypi.douban.com/simple/opencv-python==4.3.0</
Python 18.3 async/await weixin_34221332 python
async/await用asyncio提供的@asyncio.coroutine可以把一个generator标记为coroutine类型，然后在coroutine内部用yieldfrom调用另一个coroutine实现异步操作。为了简化并更好地标识异步IO，从Python3.5开始引入了新的语法async和await，可以让coroutine的代码更简洁易读。请注意，async和await是针对c
详解Python Google Protocol Buffer 职场亮哥
本篇主要介绍如何在Python语言中使用GoogleProtocolBuffer（后续都简写为PB），包括以下几个部分：为什么要使用PB？安装GooglePB自定义.proto文件编译.proto文件解析目标py文件序列化和反序列化更复杂的Message动态编译为什么要使用PB？PB（ProtocolBuffer）是Google开发的用于结构化数据交换格式，作为腾讯云日志服务标准写入格式。因此用于
Python 安装库报错 “python setup.py egg_info did not run successfully.“ SmallerFL 其他问题 fix Mac 环境设置安装 Python相关 python 开发语言人工智能 nlp
文章目录1.Python安装库报错2.问题解决3.参考1.Python安装库报错有时Python用pipinstall安装库的时候会报错，pythonsetup.pyegg_infodidnotrunsuccessfully.，我在安装deepspeed报错示例如下：Preparingmetadata(setup.py)...errorerror:subprocess-exited-with-er
【AI技术】Edge-TTS 国内使用方法一者仁心 AI AI编程 TTS
介绍：TTS软件效果里，微软推出的免费使用的Edge-TTS平台是效果比较好的，但是目前该平台开始对国内阻止使用了。这里给大家和我一样使用该python库的小伙伴一个临时的解决方法。提示：建议大家还是要么迁移到国内的收费平台或者是一些免费的开源框架（paddlespeech、gpt-sovits）解决方案：这个TTS服务在Edge浏览器中其实也有嵌入，并且国内一样可以使用，经过和官方的访问地址对比
2023第十四届蓝桥杯Python大学生A组真题？（真题+附链接）大C爱编程蓝桥杯职场和发展
第十四届蓝桥杯大赛软件赛省赛Python大学A组试题A:特殊日期本题总分：5分【问题描述】记一个日期为yy年mm月dd日，统计从2000年1月1日到2000000年1月1日，有多少个日期满足年份yy是月份mm的倍数，同时也是dd的倍数。【答案提交】这是一道结果填空的题，你只需要算出结果后提交即可。本题的结果为一个整数，在提交答案时只填写这个整数，填写多余的内容将无法得分。试题B:分糖果本题总分：5
PyOxidizer：现代Python应用打包与分发工具胡霆圣
PyOxidizer：现代Python应用打包与分发工具PyOxidizerAmodernPythonapplicationpackaginganddistributiontool项目地址:https://gitcode.com/gh_mirrors/py/PyOxidizerPyOxidizer是一个用于生成内嵌Python解释器的二进制文件的实用工具，主要使用Rust编程语言开发，同时也包含一
将Python程序打包为Windows可执行文件格式 CherylNatsu Python 技术文档 python windows extension microsoft parsing exe
花一天时间随便找了几篇文章入门Python，并且写了几个Python小程序想和朋友分享一下顺便推荐这个很棒的编程语言，但是遗憾的是朋友的电脑没有安装Python，而且还是用Windows系统，所以最好的办法是把Python程序转换为Windows上的可执行文件。首先要下载“适当版本“的Python：http://www.python.org/getit/还需要一个叫py2exe的程序：http:/
Streamlit，一个超强的 Python 应用开发库！一行玩python python 开发语言
大家好，我是“一行”。今天，我们要来聊一个非常酷的Python库——Streamlit。如果你有过构建Web应用的经验，或者你对快速搭建交互式应用感兴趣，那么Streamlit会是一个非常棒的工具。它可以让你用极少的代码，快速创建出功能强大且美观的Web应用。无论你是数据分析师、机器学习工程师，还是Python初学者，Streamlit都能帮你轻松实现数据可视化、模型展示等功能。今天我们就从基础开
python 开发app 三希 python 开发语言
在Python中开发应用程序（通常指的是移动应用）有多种方法。以下是两种常见的技术栈：KivyKivy是一个开源Python库，用于快速开发跨平台的触控应用。它支持Android、iOS、Windows、MacOS和Linux。以下是使用Kivy开发的基本步骤：1.安装Kivy:在命令行中使用pip安装Kivy：pipinstallkivy2.创建你的应用:创建一个简单的Python文件，比如ma
在Python中实现一个简单的社交媒体应用清水白石008 Python题库 python python 媒体开发语言
在Python中实现一个简单的社交媒体应用社交媒体应用是现代互联网的重要组成部分，允许用户分享信息、交流和互动。在这篇博文中，我们将使用Python构建一个简单的社交媒体应用，涵盖用户注册、发布动态、评论和查看动态等基本功能。我们将使用Flask框架作为后端，SQLite作为数据库，前端使用HTML和Bootstrap进行简单的界面设计。一、项目准备1.环境设置首先，确保你已经安装了Python和
Python的那些事第二篇：编程界的“交通规则”基本语法与编程的“食材”和“容器”数据类型与变量暮雨哀尘 Python的那些事 python vscode visual studio pycharm 开发语言 windows
摘要Python以其简洁易懂的语法和强大的功能，成为了编程界的“小白福音”。本文将带你从Python的基本语法入手，深入探讨标识符命名规则、缩进的重要性、注释的使用，以及数据类型与变量的定义和操作。通过幽默的语言和丰富的实例代码，我们将一步步揭开Python的神秘面纱，让你在轻松愉快的氛围中掌握这门强大的编程语言。1.Python基本语法1.1标识符命名规则在Python的世界里，标识符就像是给变
【使用PyQt创建美观和功能丰富界面】 Dreams°123 pyqt microsoft python
使用PyQt创建美观和功能丰富界面-适用于APP一、基本概念与环境搭建二、布局管理三、部件使用与定制四、信号与槽机制深入应用五、样式表（stylesheet）和主题应用一、基本概念与环境搭建安装PyQt使用以下命令安装PyQt：pipinstallPyQt5（如果使用Python3）。理解信号与槽机制信号（Signal）：是对象发出的事件通知，例如按钮的点击、文本框内容的改变等。槽（Slot）：是
python+selenium获取cookie session_Python3+Selenium获取session和token供Requests使用教程 weixin_39997695 session
#!/usr/bin/python3#coding:utf-8importtimefromseleniumimportwebdriverfromselenium.webdriver.support.waitimportWebDriverWaitfromselenium.webdriver.supportimportexpected_conditionsasECfromselenium.webdri
python聊天软件_python开发简单的聊天工具 weixin_39644139 python聊天软件
python太强大了，以至于它什么都可以做，哈哈，开个玩笑。但是今天要讲的真的是一个非常神奇的应用。使用python写一个聊天工具其实大家平时用的QQ类似的聊天工具，也是使用socket进行聊天，只是它还包含了更加复杂的功能。基本原理是一样的。python实现聊天功能，主要用到了socket模块。下面直接上实例吧server端importsockets=socket.socket()#建立sock
Centos安装python3详细教程 Circle square 自学 python centos linux
文章目录Centos安装python3详细教程1、先查看系统python的位置在哪儿2、下载python3的包之前，要先安装相关的依赖包，用于下载编译python3：3、默认的centos7是没有安装pip，先添加epel扩展源4、安装pip5、用pip装wget6、用wget下载python3的源码包，或者自己先下载好，上传到服务器再安装，如果网络快可以直接安装7、编译python3源码包，解压
nvdia triton server运行pt文件滑稽的柴犬神经网络机器学习 python
tritonserver默认都是tensorrt推理。但也会出现有操作不支持，导致无法转模型为engine的情况。可以选择直接运行pytorch的pt文件，以下为操作步骤。1.pytorch后端环境编译步骤原理是使用pytorchC++API运行pt文件模型。安装依赖项apt-getinstallpatchelfrapidjson-devpython3-dev构建NGC的PyTorch容器。例如，
ES聚合分析原理与代码实例讲解 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
ES聚合分析原理与代码实例讲解作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着大数据时代的到来，企业级应用需要处理的数据量呈爆炸式增长。如何从海量数据中快速、高效地提取有价值的信息，成为了数据分析和处理领域的重要课题。Elasticsearch（简称ES）作为一种高性能、可扩展的全文搜索引擎，在处理海量数据、进行高效数
【小黑送书—第十八期】＞＞让工作自动化起来！无所不能的Python(文末送书） 2401_84302628 程序员自动化 python 运维
随着我国企业数字化和信息化的深入，企业对办公自动化的效率和灵活性要求越来越高。Python作为一种开源的软件应用开发方式，通过提供强大丰富的库文件包，极大地简化了应用开发过程，降低了技术门槛。Python开发有哪些优势、挑战以及实践方法呢？一、Python是办公自动化的重要工具在我们的日常工作中，有不少工作是重复的，例如不少办公文档的处理工作等，这些重复工作如果用Python来实现办公自动化，效率
2024年网络安全最全让工作自动化起来！无所不能的Python(1) 2401_84281638 程序员自动化 python 运维
1.3.2多攒代码71.3.3学会并且精通代码调试81.3.4伤其五指不如断其一指8第2章Python的工作环境102.1Python工作环境的构成102.1.1Python的核心软件102.1.2Anaconda112.1.3IDE工具122.2安装过程中的常见问题122.3Python中的两种解释器132.4包的安装202.4.1在线安装202.4.2离线安装212.5Pycharm中的解释器
【Python进阶】5步掌握Pandas数据结构，你真的学会了吗？墨瑾轩 Python入门~精通 python pandas 数据结构
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣5步掌握Pandas数据结构，你真的学会了吗？引言❓亲爱的小伙伴们，你们有没有遇到过这样的情况：在处理结构化数据时，总是觉得Python内置的列表和字典不够灵活？别担心，今天我们就来一场“Pandas数据结构大挑战”，手把手教你如何使用Pandas的两大核心数
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

Python案例实操3-电影数据分析