明柳梦少

Pandas数据处理：清洗与处理

本文素材来源于towardsdatascience技术博客网站，经本人编辑首发于CSDN，仅供技术分享所用，不作商用。

原文地址：https://towardsdatascience.com/data-handling-using-pandas-cleaning-and-processing-3aa657dc9418

Mastering Pandas to Deal with ‘Dirty Data’

作者：Saptashwa

在做一些老的Kaggle项目练习时，我意识到在应用机器学习算法之前准备数据文件需要花费很多时间。这篇文章是之前一篇文章的后续，让初学者快速学习并掌握Pandas，以进阶到更高level的数据处理技术大神。让我们开始吧！

对于这篇文章，我使用IMDB电影数据集来涵盖最相关的数据清理和处理技术。我们可以先了解下这个数据集的有关信息，如下所示：

movies_df = pd.read_csv("movie_metadata.csv")
print "data-frame shape: ", movies_df.shape
>>> data-frame shape: (5043, 28)

所以，数据集有5043行，28列，我们可以检查列名：

print "column names: ", movies_df.columns.values

>>> column names:
['color' 'director_name' 'num_critic_for_reviews'
'duration'
 'director_facebook_likes' 'actor_3_facebook_likes'
'actor_2_name'
 'actor_1_facebook_likes' 'gross' 'genres'
'actor_1_name' 'movie_title'
 'num_voted_users' 'cast_total_facebook_likes'
'actor_3_name'
 'facenumber_in_poster' 'plot_keywords'
'movie_imdb_link'
 'num_user_for_reviews' 'language' 'country'
'content_rating' 'budget'
 'title_year' 'actor_2_facebook_likes' 'imdb_score'
'aspect_ratio'
 'movie_facebook_likes']

在我们应用一些机器学习算法进行预测之前，让我们说’imdb_score’，我们需要更多地调查数据集位，因为它不像Boston House Data-Set那样那么好处理。首先，我将讨论如何处理丢失的数据。

处理缺失数据：DataFrame.isna()，DataFrame.fillna()

我们可以使用pandas.DataFrame.isna()检测像object这样的数组的缺失值。这将返回一个布尔相同大小的对象，其中NA值（如None或numpy.NaN）将映射为True，其他所有值都映射为False。这与pandas.DataFrame.isnull()的功能完全相同。

print“null values：\ n”，
print movies_df.isna（）

以上命令返回以下输出

我们可以通过再增加一个.sum()命令来提取相关信息，而不是简单使用判断True/False输出整个data-frame的数据缺失情况。有了这个，我们可以找到每列的缺失值总数。

print movies_df.isna().sum()

>>>
color 19
director_name 104
num_critic_for_reviews 50
duration 15
director_facebook_likes 104
actor_3_facebook_likes 23
actor_2_name 13
actor_1_facebook_likes 7
gross 884
genres 0
actor_1_name 7
movie_title 0
num_voted_users 0
cast_total_facebook_likes 0
actor_3_name 23
facenumber_in_poster 13
plot_keywords 153
movie_imdb_link 0
num_user_for_reviews 21
language 12
country 5
content_rating 303
budget 492
title_year 108
actor_2_facebook_likes 13
imdb_score 0
aspect_ratio 329
movie_facebook_likes 0
dtype: int64

添加另一个.sum()将返回整个数据集中的空值数。

print "total null values: ",
movies_df.isna().sum().sum()

>> total null values: 2698

删除包含NA的行的最简单方法之一是删除不管是所有列都包含NA还是只有某一列包含NA的行。让我们从删除任何列中包含NA值的行开始。

clean_movies_df = movies_df.dropna(how='any')
print "new dataframe shape: ", clean_movies_df.shape
print "old dataframe shape: "

得到：

>>>
new dataframe shape: (3756, 28)
old dataframe shape: (5043, 28)

可以看到，在删除任何列中包含NA值的行会导致将近1300行减少。这对于具有较少行数的数据集影响非常大，因为其中丢弃具有任何缺失值的所有行可能使我们失去必要的信息。在这种情况下，我们可以使用pandas.DataFrame.fillna()，利用指定的方法填充NA/NaN值。例如，最简单的一种方法是用一些固定值填充所有NA/NaN，例如0。

movies_df.fillna(value=0, inplace = True)

当然，我们可以选择一些特定的列，然后使用DataFrame.fillna()进行固定值填充，而不是所有列的缺失值都用0填充。

movies_df[['gross', 'budget']] = movies_df[['gross',
'budget']].fillna(value=0)

对于“object” 格式的列，例如“language”列，我们可以使用“no info”之类的单词来填充缺少的条目。

movies_df['language'].fillna("no info", inplace=True)

另一个填充缺失值的方法是ffill方法，它能够将上一个有效观察值赋给下一个。类似的是bfill方法，它将使用下一个观察值来填补空缺值。

movies_df['language'].fillna(method='ffill',inplace=True)

另外，还有一种有效的方法是使用列的平均值来填充缺失值，如下所示：

movies_df['budget'].fillna(movies_df[budget].mean(),inplace=True)

有关如何使用Pandas处理缺失值的更多详细信息，您可以查看Pandas用户指南文档关于缺失数据处理的相关章节。

DataFrame中的重复数据处理：DataFrame.duplicated()

除了数据缺失外， DataFrame中还可能存在重复的行。要查找数据集是否包含重复行，我们可以对所有列或某些选定列使用Pandas DataFrame.duplicated()。pandas.Dataframe.duplicated()返回表示重复行的布尔系列值。让我们首先找到这部电影数据集中有多少重复行。

duplicate_rows_df = movies_df[movies_df.duplicated()]
print "number of duplicate rows: ", duplicate_rows_df.shape

>>>
number of duplicate rows: (45, 28)

可以看到，在每列中都有45行存在重复元素的数据。当然，我们也可以对重复列进行查询：

duplicated_rows_df_imdb_link=movies_df[movies_df.duplicated(['movie_imdb_link'])]
print duplicate_rows_df_imdb_link.shape

>>>
(124, 28)

因此，movie_imdb_link列中有124个案例的imdb链接完全相同。另一种检查是否有相同元素的方法是使用pandas.Series.unique()。让我们来看看：

print len(movies_df.movie_imdb_link.unique())
>>>
4919

也就是说，无重复imdb链接的总行数为4919。如果您注意到之前重复链接为124，那么加上它们，则会得到（4919 + 124 = 5043）的总行数。为了更好的分析数据，我们很有必要选择无重复的行进行处理。因此，至少我们可以在所有列中删除具有相同值的行。我们可以简单地使用pandas.DataFrame.drop_duplicates()进行如下处理：

print "shape of dataframe after dropping duplicates",
movies_df.drop_duplicates().shape

>>>
shape of dataframe after dropping duplicates (4998,28)

数据分箱：pandas.cut（）

另一种非常重要的数据处理技术是数据分桶或者分箱（data bucketing 或data binning）。我们将在这里举一个对IMDb-score使用pandas.cut()方法进行分箱的示例。基于[0.,4.,7.,10.]四个门槛得分值，我想将电影按照其实际得分放在不同的桶中[‘shyyyte’, ‘moderate’, ‘good’]（实际意义为：['烂电影，‘还行的电影’，‘好看的电影’]）。你可以理解得分在0-4之间的电影将被放入’shyyyte’的桶中，依次类推。我们可以使用以下代码行完成此操作：

op_labels = ['shyttte', 'moderate', 'good']
category = [0.,4.,7.,10.]
movies_df['imdb_labels'] =pd.cut(movies_df['imdb_score'], labels=op_labels, bins=category, include_lowest=False)

这里创建了一个包含标签’imdb_labels’的新列，让我们来看看它。

print movies_df[['movie_title', 'imdb_score','imdb_labels']][209:220]

>>>
 movie_title imdb_score imdb_labels
209 Rio 2 6.4 moderate
210 X-Men 2 7.5 good
211 Fast Five 7.3 good
212 Sherlock Holmes:.. 7.5 good
213 Clash of the... 5.8 moderate
214 Total Recall 7.5 good
215 The 13th Warrior 6.6 moderate
216 The Bourne Legacy 6.7 moderate
217 Batman & Robin 3.7 shyttte
218 How the Grinch.. 6.0 moderate
219 The Day After T.. 6.4 moderate

如果要更详细的学习 pandas.cut() 方法，请查看相对应文档。

数据集中的异常值检测：

在探索性数据分析（EDA）的大部分时间，异常值(也称为离群值，Outliers)检测是一个重要的部分，因为一些特别的features中的异常值可能会扭曲真实情况，因此我们在数据分析时，不能将异常值和其他值一样同等对待处理。具体来说，当我们想要应用机器学习算法进行预测时，异常值可能会造成严重破坏。不过话说回来，异常值有时也可以帮助我们进行异常检测。那么，我们来看看如何使用Pandas来检测这个特定data-frame中的异常值。

Seaborn Box Plot：

箱形图是一种基于中位数，四分位数和异常值可视化数据分布的标准方法。可能你已经知道这些quantities到底是什么，但我仍然在下图中做了简短的回顾。

我们可以使用python的数据可视化库Seaborn来绘制这样的箱形图。让我们使用box plot来绘制电影海报中的演员数量分布。

sns.boxplot(x=movies_df['facenumber_in_poster'],
color='lime')
plt.xlabel('No. of Actors Featured in Poster',
fontsize=14)
plt.show()

运行上面的代码后，结果如下图所示：

让我们看看哪部电影的电影海报中有最多的演员（面孔）数量。

print movies_df[['movie_title','facenumber_in_poster']].iloc[movies_df['facenumber_in
_poster'].idxmax()]

>>>
movie_title 	500 Days of Summer
facenumber_in_poster 	43

因此，电影“500 Days of Summer”中有最多的面孔（43）。我们再利用pandas.DataFrame.describe()方法，看看此列’facenumber_in_poster’的基本统计详细信息。

print movies_df['facenumber_in_poster'].describe()

>>>
count 5030.000000
mean 1.371173
std 2.013576
min 0.000000
25% 0.000000
50% 1.000000
75% 2.000000
max 43.000000

有了这些，你就能更好的弄清楚刚才Box Plot图中的数据含义了。

Z Score和异常值

Z score是一个无量纲的数，表示数据点与平均值的标准偏差。Z score简单可以定义为：Z =（X-μ）/σ，其中μ是总体均值，σ是标准偏差，X是总体中的一个元素。

为了绘制上图，我使用了正态分布numpy.random.normal()。在正态分布中，几乎所有的值 - 大约99.7％，落在平均值的3σ偏差内（对于此处的图，μ= 0）。我们使用Z score拒绝异常值的方法是考虑Z score 3个单位内的数据点。这可以使用“non object”类型数据对所有列进行scipy.stats，如下所示。

1.检查data-frame中所有列的数据类型(DataFrame.dtypes)

print "data types: \n", movies_df.dtypes
>>>
data types:
color object
director_name object
num_critic_for_reviews float64
duration float64
director_facebook_likes float64
actor_3_facebook_likes float64
actor_2_name object
actor_1_facebook_likes float64
gross float64
genres object
actor_1_name object
movie_title object
num_voted_users int64
cast_total_facebook_likes int64
actor_3_name object
facenumber_in_poster float64
plot_keywords object
movie_imdb_link object
num_user_for_reviews float64
language object
country object
content_rating object
budget float64
title_year float64
actor_2_facebook_likes float64
imdb_score float64
aspect_ratio float64
movie_facebook_likes int64

2.使用DataFrame.select_dtypes创建一个列中不含“object”类型的新data-frame

print "shape before :", movies_df.shape
movies_df_num = movies_df.select_dtypes(exclude=['object'])
print "shape after excluding object columns: ", movies_df_num.shape

>>>
shape before : (3756, 28)
shape after excluding object columns: (3756, 16)

3.从每列中选择位于Z score的3个单位内的元素

movies_df_Zscore =movies_df_num[(np.abs(stats.zscore(movies_df_num))<3).all(axis=1)]
print "shape after rejecting outliers: ",movies_df_Zscore.shape

>>>
shape after rejecting outliers: (3113, 16)

我们可以通过再次绘制’facenumber_in_poster’的box plot图来检查上述步骤的效果。在这里，我们可以明显看到去除异常值后的figure4与figure2的差异（figure2中的box plot图，我们考虑的是’facenumber_in_poster’列中的所有元素）。

以上这些是可用于数据分析和应用机器学习算法进行预测前的数据预处理的一些方法。对数据集进行有效的预处理，能够让后续的数据分析更加全面。我希望这篇文章能帮助您。更多关于机器学习的代码可在我的Github(suvoooo/Machine_Learning)上找到。

python文件导入另外个文件 LedMetallica python 开发语言
我整理的一些关于【Python】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/Hpqqk2如何在Python中导入文件在Python编程中，文件的导入是一个常见而重要的操作。通过导入其他Python文件的功能，我们可以重用代码、组织项目结构、提升代码的可读性和可维护性。本文将带你逐步了解如何实现Python文件的导入，并提供必要的代码示例和详细解释。
docker运行容器命令 redis 指定端口 big maom~~ docker redis eureka 容器运维
我整理的一些关于【Docker】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://edu.51cto.com/surl=QsXoR2使用Docker运行Redis容器并指定端口的详细指南本文旨在帮助初学者理解如何使用Docker来运行Redis容器，并指定端口。Docker是一个开源平台，允许开发者将应用和其依赖打包成一个标准的单元——容器。通过使用Docker，开发者可以确保
mysql给现有账号分配库只读权限仙灵女巫伊芙琳 mysql 数据库
我整理的一些关于【MySQL】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/yOSbkRMySQL用户权限分配：给现有账号分配只读权限在日常数据库管理中，用户权限的管理是一个非常重要的环节。特别是在MySQL数据库中，我们often需要对现有账号进行权限的设置与修改，以确保数据的安全性和合理性。在这篇文章中，我们将讨论如何给现有账号分配数据库的只读权
docker 删除指令乔丂亓 docker eureka 容器运维云原生
我整理的一些关于【Docker】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/xltfov学习如何使用Docker删除指令Docker是一个流行的容器化平台，能够简化应用程序的部署、扩展和管理。但是，很多新手在使用Docker时可能会遇到一些基本操作的困惑，比如如何删除Docker中的容器、镜像等。在本篇文章中，我将详细讲解Docker删除指令的使用
FFmpeg拉流教程 zxz520zmg QT入门 Qt For Android c++
FFmpeg拉流教程做了一个项目学习下FFmpeg拉流的过程。在此记录下。开发环境：QT：MSVC201764bit和Qtforandroid（跨平台）FFmpeg：4.4.2一、.pro的配置（此处贴出我的示例，请根据自己的环境配置）：win32{INCLUDEPATH+=$$PWD/ffmpeg/includeLIBS+=$$PWD/ffmpeg/bin/avdevice.lib\$$PWD/
Android arcgis加载在线底图 Angie洛林 android arcgis
我整理的一些关于【信息系统】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://edu.51cto.com/mic-position/757.html在Android中使用ArcGIS加载在线底图ArcGIS是Esri提供的一套强大的地理信息系统（GIS）解决方案，支持多种平台，包括Android。本文将介绍如何在Android应用中使用ArcGIS加载在线底图，并配有相关代码示
idea 配置并运行python 鬼龙寺 intellij-idea python java ide 开发语言
我整理的一些关于【CI】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/xltfov使用IntelliJIDEA配置并运行Python项目在当今的编程世界中，选择合适的集成开发环境（IDE）对提高开发效率至关重要。IntelliJIDEA是一款强大的IDE，它不仅支持Java，还通过插件扩展支持Python等其他编程语言。本篇文章将指导读者如何在Int
Mongodb主从模式最佳方案 Christian Bai mongodb 数据库
我整理的一些关于【Java】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/bLN8S1MongoDB主从模式最佳方案MongoDB是一款开源的文档型数据库，被广泛应用于许多现代应用中。其强大的性能和灵活的数据结构使得它特别适合处理大数据和高并发访问。本文将介绍MongoDB的主从模式，并提供最佳方案和示例代码，帮助你更好地理解这种模式的运作原理。什么
《苍穹外卖》项目学习记录-Day10订单状态定时处理蝴蝶不愿意学习 java
利用Cron表达式生成器生成Cron表达式1.处理超时订单查询订单表把超时的订单查询出来，也就是订单的状态为待付款，下单的时间已经超过了15分钟。//select*fromorderswherestatus=?andorder_timeupdateorderscancel_reason=#{cancelReason},rejection_reason=#{rejectionReason},canc
python 根据元素值获取span 大紫菜 python java android javascript 数据库
我整理的一些关于【网页内容,HTML,python】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/eDOcp1用Python根据元素值获取在实际的网页开发与数据抓取中，我们经常需要根据元素的值来获取对应的HTML标签，比如。本文将教你如何用Python实现这一功能。本文将详细阐述整个处理的流程，并展示具体的代码示例。流程概览下面是根据元素值获取的主要
R语言安装zip包毕崇亮 r语言开发语言
我整理的一些关于【管理】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/eDOcp1如何在R语言中安装zip包作为一名刚入行的开发者，你可能对R语言中的包管理有些困惑。今天，我将带你一步步了解如何在R语言中安装zip包，并通过简单的示例帮助你掌握这一技能。安装包可以让你使用更丰富的功能与工具，所以这是一项非常重要的基础技能。安装zip包的流程在开始之前
GitHub热门开源项目李小白杂货铺计算机技术杂谈 github
文章目录GitHub高级搜索GitHub秘籍GitHub开源项目排行榜热门开源项目学习类、资料类freeCodeCampfree-programming-bookscoding-interview-universityawesomedeveloper-roadmapsystem-design-primerYou-Dont-Know-JSCS-Notesjavascript-algorithmsbu
docker desktop compose文件叫我八吧 docker 容器运维
我整理的一些关于【Docker】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/f2PFnNDockerDesktop与Compose文件使用指南Docker是现代应用程序开发和部署的重要工具。它能够将应用及其所有依赖打包到一个轻量级的、可移植的容器中。DockerDesktop是Docker的图形界面客户端，提供了一个简化的用户体验，使得你可以更方便
如何设计一个合理的vue前端项目架构叫我阿柒啊 vue.js 前端架构
在前端开发中，我学习的是vue的开发路线。在最初的学习中，除了学习理论知识，还有就是看一些开源项目学习如何将vue应用到实际开发中。合理的项目架构设计是项目成功的基础之一。一个好的架构不仅可以提升代码的可读性和可维护性，还能提高开发效率，并降低项目的长期维护成本。所以，本文将以构建项目为起点，探讨如何设计关于vue的前端架构。1.项目初始化1.1创建项目vue不是在IDE中创建项目，而是使用工具在
Javaweb入门-Maven项目学习（Day2）半截詩 JavaWeb maven 学习 java
（一）Maven坐标maven中的坐标是资源的唯一标识，可以通过坐标唯一定义资源位置*使用坐标来定义项目或引入项目中需要的依赖*Maven坐标主要组成*groupld:定义当前Maven项目隶属组织名称（通常是域名的反写，eg:com.Ap）*artifactld:定义当前Maven项目的名称*version:定义当前项目版本号。（二）依赖传递传递依赖需要在pom.xml中指明版本，架包名称和gr
docker builds not a command Zack Snyder docker eureka 容器运维云原生
我整理的一些关于【Docker】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/xltfov理解Docker和构建过程中的命令问题：处理“dockerbuildsnotacommand”错误Docker是一种流行的容器化技术，它允许开发者将应用程序及其所有依赖项打包到一个标准化的单元（容器）中，确保应用在任何环境中都能一致地运行。然而，在使用Docke
ubuntu安装Redis详细教程开机重启大熊苏尔 ubuntu redis linux 运维服务器
我整理的一些关于【Ubuntu】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/f2PFnNUbuntu安装Redis详细教程（开机自动重启）在这篇文章中，我将带你通过一个详细的过程，帮你在Ubuntu系统上安装Redis，并设置为开机自动启动。下面我们将通过一个表格概述整个流程，然后深入每一步的具体操作。整体流程步骤操作1更新系统包2安装Redis3
SQLite的入门级项目学习记录（二）深蓝海拓 SQLite学习笔记 sqlite 学习数据库
再补充一些基础知识：并行操作的问题1、可以多游标同时运行SQLite，对于同一个连接sqlite3.connect(db_file)，可以同时创建多个游标，每个游标都是独立的，可以执行各自的SQL命令序列。importsqlite3#创建数据库连接conn=sqlite3.connect('example.db')#创建第一个游标cursor1=conn.cursor()cursor1.execu
12306项目学习笔记（框架篇Base） Rainyocode 学习
首先学习的是基础框架ApplicationContextHolderApplicationContextHolder提供了一种静态方式来访问Spring容器中的Bean，适用于某些特定场景，如工具类和框架集成。在12306项目中由于我们引入了RocketMQ消息队列，这些库的对象通常不是Spring管理的，无法直接使用@Autowired注入，所以需要ApplicationContextHolde
StringRedisTemplate 删除某key开头的 qq_27327261 bootstrap 前端 html
StringRedisTemplate删除某key开头的原创mob64ca12e732bb2024-03-1204:13:15©著作权文章标签数据Redis甘特图文章分类Redis数据库阅读数94我整理的一些关于【数据】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/eDOcp1用StringRedisTemplate删除某key开头的数据在使用Red
如何学习单片机：从入门到精通的全面指南嵌入式大圣学习单片机嵌入式硬件
摘要本文旨在为初学者提供一份系统的单片机学习指南，涵盖了从基础知识到进阶应用的各个方面。文章首先介绍了单片机的基本概念和架构，帮助读者理解单片机的工作原理和常见的单片机型号。接着，文章详细讲解了如何选择适合的单片机及其开发工具，并提供了一些入门和进阶学习的实用建议，如如何熟悉开发环境、掌握C语言编程、使用定时器和中断、以及如何实现串行通信。在进阶部分，文章强调了通过实际项目学习的重要性，建议读者从
polardb for mysql 安装精致男孩富贵 mysql 数据库
我整理的一些关于【MySQL,SQL】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://edu.51cto.com/surl=QDW3g3PolarDBforMySQL安装指南PolarDBforMySQL是阿里云推出的一款高性能云数据库，兼具了MySQL的全面兼容性，并在性能与可扩展性上进行了优化。本文将详细介绍PolarDBforMySQL的安装流程，并提供相应代码示例，帮
springboot项目学习-瑞吉外卖（1）两仪式quq spring boot 学习 java 瑞吉外卖
第一天任务如下：建立基本架构完成登录、退出功能注意：本博客没有使用网上教程里的mybatis-plus，使用的是mybatis；数据库连接池也没有使用教程里的druid，使用的是spring自带的连接池基本架构common包：存放的通用类R，用来给前端返回Json格式的数据config包：存放配置类，在今天的任务中主要解决静态资源路径映射问题controller包entity包：存放实体类mapp
从别人的开源项目学习并吸收经验，然后逐步搭建自己的Java项目是一个很好的学习方法如饥似渴的rocky Java开发 Java后台开发 web开发 java 开源
从别人的开源项目学习并吸收经验，然后逐步搭建自己的Java项目是一个很好的学习方法。以下是一些建议的步骤，帮助你从0开始搭建并不断完善自己的Java项目，直至达到高可靠、高稳定、高并发、高数据安全，并可以拆分为微服务的大型高质量项目：选择合适的开源项目：寻找与你感兴趣的技术领域或业务场景相关的开源项目。查看项目的文档、活跃度、社区支持情况等，确保项目有足够的参考价值。学习项目架构：仔细研究项目的整
有方机器人 STM32智能小车项目学习笔记1 枫-琳 stm32 学习有方机器人单片机笔记 Keil
今天开始学习有方机器人--智能小车项目，正点原子部分的学习先放一放，还是小车更有吸引力哈哈。新建工程及工程模板搭建新建工程须知目前常用的STM32的开发方式主要有基于寄存器编程、基于标准库函数编程、基于HAL库编程这三种。寄存器版本---最高效，最直接，需要对STM32内部结构十分了解，难度系数大，新手学习不推荐。标准库函数版本--直接使用ST官方提供的封装好的库函数进行编程，库函数把配置寄存器的
2023-10-12 阅来悦好_ba43
司春丽工作日志10.11书香浸润童心，阅读滋养智慧。一本绘本读出百种滋味，一幅画面隐含辽阔世界。为了更好地探索绘本阅读教学的方法和策略，丰富绘本教学的实践经验，我们二年级绘本阅读项目组已开展两周了。我们以课程板块为载体，整合学生阅读、研究性学习以及学科实践活动，实现跨学科学习。在各项项目学习中，激发学生的学习兴趣，培养学生的自主探究、小组合作、审美情趣、表达交流等多方面的能力。想象总是美好的。为了
Django实战：部署项目【资产管理系统】，Django完整项目学习研究（项目全解析，部署教程，非常详细）梦断南楼 Django学习和实践 django 学习数据库
导言关于Django，我已经和大家分享了一些知识，考虑到一些伙伴需要在实际的项目中去理解。所以我上传了一套Django的项目学习源码，已经和本文章进行了绑定。大家可以自行下载学习，考虑到一些伙伴是初学者，几年前，编者也是从初学者一路学习到现在。当时，很希望有一套完整的项目源码去理解，更好地学习。当得到了源码，却又不会部署，或者不会处理报错，为此，我编写了这篇文章。打开项目首先，我们需要解压并使用P
百度AI人脸识别与检测六：学生人脸识别打卡签到系统之班级的增删查陈一月的编程岁月百度AI人脸检测与识别《百度AI人脸识别与检测》Python 百度人脸识别学生人脸识别打卡签到系统
《百度AI人脸识别与检测》专栏为项目专栏，从零到一，从无到有开发一个学生人脸识别签到系统；主要用到的技术有百度开放平台中的人脸检测、人脸识别、Python图形界面开发PyQt5、线程的管理、以及通过python调用百度接口实现人脸检测、百度开放平台中人脸检测技术文档的理解等，由浅入深、由局部到整体的一个项目学习过程，如果你想对人脸识别感兴趣，对python的图形界面设计感兴趣，可以订阅本专栏，因为
百度AI人脸识别与检测七：学生人脸识别打卡签到系统之学生人脸信息的添加陈一月的编程岁月百度AI人脸检测与识别《百度AI人脸识别与检测》Pyhton 百度学生人脸识别打卡签到系统
《百度AI人脸识别与检测》专栏为项目专栏，从零到一，从无到有开发一个学生人脸识别签到系统；主要用到的技术有百度开放平台中的人脸检测、人脸识别、Python图形界面开发PyQt5、线程的管理、以及通过python调用百度接口实现人脸检测、百度开放平台中人脸检测技术文档的理解等，由浅入深、由局部到整体的一个项目学习过程，如果你想对人脸识别感兴趣，对python的图形界面设计感兴趣，可以订阅本专栏，因为
web基础阶段的小兔鲜儿项目学习况几 web前端前端学习 css
小兔鲜儿1.所用素材2.项目文件介绍3.index页面的基本骨架4.思路：先写外面大盒子和版心，由外往内写5.源码：6.代码的一些命名1.所用素材素材链接，点我跳转：https://download.csdn.net/download/angrynouse/872281512.项目文件介绍favicon.ico图标直接放在项目根目录下images文件夹：项目中固定的图片，即logo样式修饰图片up
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio