查尔斯-狩乃

Python数据分析2-pandas入门和实战

2.1pandans数据结构

2.1.1创建Series数据

2.1.2创建DaraFrame属性

2.1.3索引对象

2.2pandas索引操作

2.2.1重新索引

2.2.2更换索引

2.2.3索引和选取

1 不通过函数选取行列

2 选取DataFrame数据的行和列

3 布尔选择

2.2.4操作行和列

1.增加

2.删除

3.修改

2.3pandas数据运算

2.3.1算数运算

2.3.2函数应用和映射

2.3.3排序

2.3.4汇总与统计

2.3.5唯一值和值计数

2.4层次化索引

2.4.1层次化索引简介

2.4.2重排分级顺序

2.4.3统计汇总

2.5pandas可视化

2.5.1线形图

2.5.2柱状图

2.5.3直方图和密度图

2.5.4散点图

2.6综合示例-小费数据集

2.6.1数据分析流程

2.6.2数据来源

2.6.3定义问题

2.6.4数据清洗

2.6.5数据探索

2.1pandans数据结构

pandas又两个基本得数据结构:Series和Dataframe

2.1.1创建Series数据

Series数据结构类似于一维数组,但它是由一组数据(各种Numpy数据类型)和一组对应得索引组成。通过一组列表数据即可产生最简单得Series数据,如图

Series数据:索引在左边，值在右边。可以看出，如果没有指定一组数据作为索引的话，Series数据会以0到N-1（N为数据的长度）作为索引，也可以通过指定索引的方式来创建Series数据，如图

Series有values和index属性，可返还值数据的数组形式和索引对象，如图

Series与普通的一维数组相比，其具有索引对象，可通过索引来获取Series的单个或一组数值，如图

Series运算都会保留索引和值之间的链接，如图

Series数据中的索引和值一一对应，类似于Python字典数据，所以也可以通过字典数据来创建Series，如图

由于字典结构是无序的，因此返回的Series也是无序的，这里依旧可以通过index指定索引的排列顺序，如图

Series数据和索引都有name属性，这样我们可以给Series定义名称，让Series具有可读性

2.1.2创建DaraFrame属性

DataFrame数据是Python数据分析最常用的数据，无论是创建的数据或外部数据，我们首先想到的都是如何将其转换为DataFrame数据，原因是DataFrame数据为表格型数据。说道表格型数据，多数人想到的可能是Excel表格，本节将会把DataFrame与Excel两种数据进行对比。

在Excel中，在单元格中输入数据即可创建一张表格。对于DataFrame数据而言，需要用代码实现，创建DataFrame数据的办法有很多，最常用的是传入数组、列表、或元祖组成的字典。如图

返回的数据如上图，DataFrame数据有行索引和列索引，行索引类似于Excel表格中每行的编号（没有指定索引的情况下），列索引类似于Excel表格的列名（通常也可称为字段）。

由于字典是无序的，因此可以通过columns指定列索引的排列顺序。如图

当没有指定索引的情况下，会使用0到N-1（N为数据的长度）作为行索引，这里也可以使用其他数据作为索引，如图

使用嵌套字典的数据也可以创建DataFrame数据，如图

下表提供列部分常用的为创建DataFrame数据可传入的数据类型

类型	使用说明
二维ndarray	数据矩阵，可传入行列索引
由数组、列表或元组组成的字典
由Series组成的字典	每个Series为一列，Series索引合并为行索引
嵌套字典
字典或Series列表	各项成为DataFrame一行，字典键或Series索引成为DataFrame列索
由列表或元组组成的列表	‘’引类似于”二维数组’

如果df为某班级学生的信息，通过设置DataFrame的index和columns的name属性，可以将这些信息显示出来，如图

通过Values属性可以将DataFrame数组转换为二维数组，如图

注：各列数据类型不同，返回的数组会兼顾所有的数据类型

2.1.3索引对象

Series的索引和DataFrame的行和列索引都是索引对象，用于负责管理轴标签和元数据，如图

索引对象是不可以修改的，如果修改就会报错，如图

索引对象类似于数组数据，其功能也类似于一个固定大小的合计，如图

2.2pandas索引操作

本节将针对Series和DataFrame数据，讲解Series和DataFrame索引操作的方法，通过将他们与Excel数据的类比，讲解DataFrame数据的选取与操作。

2.2.1重新索引

前面说过，索引对象是无法进行修改的，本节所说的重新索引并不是给索引重新命名，而是多索引重新排序，如果某个索引值不存在的话，就会引入缺失值，首先来看下Series重新排序后的索引，如图

对于DataFrame数据来说，行和列索引都是可以重新索引的，如图

重新索引列需要使用columns关键字，如图

下表为reindex函数的各参数使用说明

类型	使用说明
index	用于索引的新序列
method	填充缺失值的方法
fill_value	缺失值填充
limit	最大填充量

2.2.2更换索引

在DataFrame数据中，如果不希望使用默认行索引的话，可以在创建的时候通过index参数来设置行索引。有时候我们希望将列数据作为索引，这时可以通过set_index方法来实现如下图

与set_index方法相反的方法时reset_index

下面说一个实际的例子。对于Excel而言，排序之后，行索引并不会发生变化（依旧是从1开始计数），而对DataFrame数据，排序之后其行索引会改变，如图

这里获取成绩倒数两位同学的数据的话，需要记住其单独的索引。但当数据量大的时候，想查看多维排序过后的数据时，这种做法是很不方便的。我们可以通过恢复索引，对数据进行排序。如下图，原索引可通过drop参数进行删除。

2.2.3索引和选取

在数据分析中，选取需要的数据进行处理和分析是很重要的。在Excel表格中，通过鼠标点选或者扩选可以轻松地选取数据，而在pandas数据中，需要通过索引来完成数据的选取工作。

Series数据的选取较为简单，使用方法类似于Python的列表，这里不仅可以通过0到N-1（N是数据长度）来进行索引，同时也可以通过设置好的索引标签来进行索引。如下图

1 不通过函数选取行列

切片运算与python列表略有不同，如果是利用索引切片，其尾端是被包含的，如下图

DataFrame数据的选取更复杂些，因为它是二维数组，选取列和行都有具体的使用方法。

通过两个中括号，可以获取多个列的数据，如下图

注：选取列不能用切片，因为切片用于选取行数据

2 选取DataFrame数据的行和列

df_1.loc[[index],[colum]]通过标签选取数据

df_1.iloc[[index],[colum]]通过位置选取数据

3 布尔选择

以df2为例子，筛选出性别为famale的数据，这时就需要用布尔选择来完成。与数组布尔索引类似，既可以使用布尔选择，那么同样也适用于不等号（！=）等逻辑运算符

2.2.4操作行和列

在数据分析中，常用的基本操作为增删改查，在前面的内容中查已经详细讲解过了

1.增加

以df数据为例，该班级转来一个新生，需要在原有数据的基础上增加一行数据。可以通过append函数传入字典结构数据即可，如下图

这些学生都是2018级的，这里我们新建一列用于存放该信息。为一个不存在的列赋值，即可创建一个新列。

如果要新增的列中的数值不一样时，可以传入列表或数组结构数据进行赋值，如图

2.删除

如果王五同学转学列，class字段没有用列，就需要删除其信息。通过drop方法可以删除指定轴上的信息。

3.修改

这里的改指的是行和列标签的修改，通过rename函数，可完成由于某些原因导致的标签录入错误的问题

2.3pandas数据运算

本节将针对Series和DataFrame数据，详细讲解二者的算数运行和函数的应用，这在数据分析中很重要！

2.3.1算数运算

pandas的数据对象在进行算数运算时，如果有相同索引对则进行算数运算，如果没有则会引入缺失值，这就是数据对齐。

对于DataFrame数据而言，对齐操作会同时发生在行和列上，如图

DataFrame和Series数据在进行运算时，先通过Series的索引匹配到相应的DataFrame列索引上，然后沿行向下运算（广播），如图

2.3.2函数应用和映射

在数据分析时，常常会对数据进行较复杂的数据运算，这时需要定义函数。定义好的函数可以应用到pandas数据中，其中有三种方法：map函数，将函数套用在Series的每个元素中，apply函数，将函数套用到DataFrame的行与列上：applymap函数，将函数套用到DataFrame的每个元素上。

如图，需要把price列的“元”字去掉，这时就需要用到map函数，如图

apply使用方法如下

注：lambda为匿名函数，和定义好的函数一样，可以节省代码量

applymap函数可以作用于每个元素，便于对整个DataFrame数据进行批量处理，如图

2.3.3排序

在Series中，通过sort_index函数可对索引进行排序，默认情况为升序，如图

通过sort_values方法可对值进行排序

对于DataFrame数据而言，通过指定轴方向，使用sort_index函数可对行或列索引进行排序（添加参数axis=1/0）。要根据列进行排序，可以通过sort_values函数，把列名传给by参数即可

2.3.4汇总与统计

在DataFrame数据中，通过sum函数可以对每列进行求和汇总，与Excel中的sum函数类似，如图

指定轴方向，通过sum函数可按行汇总

describe方法可对每个数值型列进行统计，经常用于对数据的初步观察时使用，如图

2.3.5唯一值和值计数

在Series中，通过unique函数可以获取不重复的数组，如图

通过values_counts方法可统计没个值出现的次数，如图

2.4层次化索引

层出化索引时pandas重要的功能之一，本节将简单讲解层次化索引的创建过程和使用方法

2.4.1层次化索引简介

简单地说，层次化索引就是轴上有多个级别索引，如下图，为创建一个层次化索引的Series对象

该索引对象为MultiIndex对象，如图

层次化索引的对象，索引和选取操作都很简单，如下图

对于DataFrame数据而言，行和列索引都可以转换为层次化索引

2.4.2重排分级顺序

通过swaplevel方法可以对层次化索引进行重排，如图

2.4.3统计汇总

在层次话索引的pandas数据进行统计汇总时，可以通过level参数指定在某层次上进行汇总统计

这里的运算又点拗口，大家仔细想想就能够理解。

2.5pandas可视化

pandas库中继承了matplotlib中的基础组件，让绘图更加简单。

2.5.1线形图

线形图通常用于描绘两组数据之间的趋势。例如，销售行中月份与销量之间的趋势情况：金融行中股票收盘价与时间序列之间的趋势。

pandas库中的Series和DataFrame中都有绘制各类图标的plot方法，默认情况绘制的是线形图。首先创建一个Series对象

注：%matplotlib inline为魔法函数，使用该函数绘制的图片会直接显示在Notebook中

通过s.plot方法可以绘制线形图，如下图。从图中可以看出，Series的索引作为X轴，值作为Y轴。

通过DataFrame数据的plot方法可以为各列绘制一条线，并会给其创建好图例。首先创建DataFrame数据，如下图

关于pandas绘图的参数，会在实际案例中具体介绍。

2.5.2柱状图

柱状图长绘制各类别之间的关系。例如，班级中男生和女生的分布状况，某零售店个商品的购买数量分布情况。通过绘制pandas绘制柱状图很简单，只需要在plot参数中添加kind=‘bar’，如果类别比较多，可以绘制水平柱状图（kind='bar'）

首先，创建一个DataFrame数据的学生信息表格，如果需要分析班级男女比例是否平衡，这时候就可以使用柱状图，通过value_counts计数，获取男女计数的Series数据，进行绘制柱状图

对于DataFrame数据而言，每一行的值都会成为一组，如下图

设置plot函数的stacked参数可以绘制堆积柱状图，如下图

2.5.3直方图和密度图

直方图用于频率分布，y轴可为数值或者比率。直方图在统计分析中是经常使用的，绘制数据的直方图，可以看出其大概分布规律。例如，某班级的身高情况一般是服从正态分布，即高个子和矮个子人较少，大部分都是在平均身高左右。

可通过hist方法绘制直方图

注：通过设置grid参数可在图表中添加网格，bins参数是将值分为多少个段，默认为10

核密度估计（Kernel Density E身体马特，KDE）是对真实密度的估计，其过程是将数据的分布近似为一组核（如正态分布）。通过plot函数的kind=‘kde’可进行绘制，如图

2.5.4散点图

散点图主要用来表现数据之间的规律。例如，身高和体重之间的规律。下面创建一个DataFrame数据，然后绘制散点图

2.6综合示例-小费数据集

本节主要讲解数据分析的基本流程，对小费数据集进行数据的分析与可视化

2.6.1数据分析流程

数据分析流程通常情况下分为5步。

（1）收集数据。在这一步中，需要对收集的数据有一定的认知，对个字段的含义和背景知识都要有着足够的理解。

（2）定义问题。根据各组的行业和业务知识，对数据定义多个待解决的问题。

（3）数据清洗与整理。由于各种问题，获取的数据不够“干净”，需要通过各种手段对数据进行清洗与整理，一边得到准确的分析结果。

（4）数据探索。通过可视化等手段，对数据进行分析和探索，得出结论

（5）数据展示。这部分用于输出，或撰写数据分析报告、或汇报给上级、或绘制PPT。

以上只是基本的数据分析流程，会根据实际情况的不同略有不同。例如，在实际工作中，第（1）步和第（2）步会有所颠倒，首先明确目标，然后再根据目标收集数据：再数据探索方面，也会使用数据挖掘等技术实现更具复杂和有实际操作意义的模型。

2.6.2数据来源

小费数据来源与Python第三方库Seaborn（用于绘图）中自带的数据，加载该数据集(需要先把数据集下载到本地)

注：head函数会返回5条数据，也可指定返回数据行数。

众所周知，在西方国家的服务行业中，顾客会给服务员一些小费。该小费数据为餐饮行业收集的数据。total_bill列为消费总金额，tip为小费金额，sex为顾客性别，smoker为顾客是否抽烟，day为小费的星期，time为聚餐的时间段，size为聚餐人数

2.6.3定义问题

本次分析中，围绕小费数据提出几个问题：小费金额与消费总金额是否存在相关性？性别、是否吸烟、星期几、中/晚餐和小费金额是否有一定的关联？小费金额占消费总金额的百分比是否服从正态分布？

2.6.4数据清洗

首先对数据进行简单描述，看是否有缺失值或者异常值

通过结果可以看出，总共有244条数据，通过统计暂时看不出是否有缺失值。通过打印数据的info信息可以看出每列数据的类型和缺失值，本例中的小费数据集没有任何缺失值如下图

注：本数据集非常的“干净”，数据清洗的内容在后面将会详细讲解。

2.6.5数据探索

首先对小费金额与消费总额进行分析，看看他们之间是否存在关联，通过下面的代码绘制散点图

从图中可以看出，小费金额与消费总金额存在这正相关关系，即消费越高，给的小费越多，这是比较合理的。

我们来看下性别不一样是否会影响小费的金额。这里使用柱状图，通过布尔选择男女，对消费数据进行平均后绘制柱状图，具体操作如下

水平柱状图显示，女性小费金额少于男性小费金额。

注意：这种通过类别汇总的方法比较麻烦，后面讲解了groupby方法会简单许多。

其他字段与小费的关系也是类似的方法。例如，日期与小费的关系，由于观察数据时只看到前5行数据，，通过unique函数看下日期的唯一值有哪些

日期平均小费柱状图如下图，可以看出，周六周日的小费比周四周五的高

最后我们来分析以下小费百分比的分布状况，这里小费总金额为小费的金额和聚餐所花费的金额，通过DataFrame算数运算，新建一列，用于存储小费百分比

直方图如图所示，可以看出基本符合正态分布，但也有几个异常点。

你可能感兴趣的:(Python数据分析,python,big,data,数据结构)

Django学习笔记 mengmwng Django django 学习笔记
学习视频来源：最新Python的web开发全家桶代码仓库：https://gitee.com/m_engmeng/django-learning1.创建项目Django中项目会有一些默认的文件和文件夹1.1在终端打开终端进入某个目录(项目放在哪里)输入命令——创建项目(最后一个参数是项目名)django-adminstartprojectmysite继续输入——创建app（最后一个参数是app所处
【python GUI编码入门-04】使用Tkinter实现拖放操作：打造交互式GUI的秘诀木头左 python办公自动化 python
哈喽，大家好，我是木头左！理解拖放操作的基础在开始编码之前，需要了解拖放操作的基本概念。简单来说，拖放是一种用户通过鼠标移动对象（如文件、图标或窗口中的组件）并将其放置在新位置的操作。在Tkinter中，这涉及到几个关键步骤：捕获拖动事件、更新对象位置以及处理放置事件。环境搭建与基础组件确保你的Python环境中安装了Tkinter。大多数Python发行版默认包含Tkinter，但如果没有，你可
算法：数据结构与算法（总结）鲲鹏飞九万里算法算法数据结构 java
数据结构与算法文章目录数据结构与算法一、数据结构1.1BST、AVL、Red-BlackBST1.2Trie字典树、LRUCache、布隆过滤器1.3Union-find并查集1.4数组ArrayList、链表LinkedList、跳表SkipList跳表[Skiplist](https://gitee.com/lf-ren/java-re-new-builder/blob/master/proj
Pygubu：Tkinter界面设计的得力助手牧怡泳
Pygubu：Tkinter界面设计的得力助手pygubuAsimpleGUIbuilderforthepythontkintermodule项目地址:https://gitcode.com/gh_mirrors/py/pygubuPygubu，一个专为Python开发者打造的轻量级GUI构建器，采用Python编程语言实现。它简化了基于Tkinter模块的图形用户界面的创建过程，让快速原型设计和
python3+TensorFlow 2.x 基础学习（一）刀客123 python学习 tensorflow 学习人工智能
目录TensorFlow2.x基础1、安装TensorFlow2.x2、TensorFlow2.x基础概念2、1EagerExecution2、2TensorFlow张量（Tensor）3、使用Keras构建神经网络模型3、1构建Sequential模型3、2编译模型1、Optimizer（优化器）2、Loss（损失函数）3、Metrics（评估指标）3、3训练模型3、4评估模型3、5预测4、使用
数据结构基础之《（16）—链表题目》 csj50 数据结构数据结构
一、链表问题1、对于笔试，不用太在乎空间复杂度，一切为了时间复杂度2、对于面试，时间复杂度依然放在第一位，但是一定要找到空间最省的方法二、快慢指针逻辑：慢指针一次走1步快指针一次走2步当快指针走完的时候，慢指针应该来到中点的位置1、输入链表头节点，奇数长度返回中点，偶数长度返回上中点2、输入链表头节点，奇数长度返回中点，偶数长度返回下中点3、输入链表头节点，奇数长度返回中点前一个，偶数长度返回上中
数据结构与算法再探（二）栈与队列的应用刀客123 数据结构与算法数据结构算法
目录栈应用举例std::stack的基本操作：队列实现栈c++版单队列方式python3应用实例（一）：括号匹配C++栈C++非栈方式python实现实例(二）：后缀表达式求值c++实现python实现队列的应用队：std::queue基本操作栈实现队列队列应用举例：1、约瑟夫问题数组实现：队列实现：双向链表2、单调队列-滑动窗口里的最大值C++python3总结栈应用举例栈是操作受限的线性表，典
【SpringBoot 】dynamic 动态数据源配置连接池（转） binqian spring spring boot 数据库 oracle
前言在复杂的业务场景中，我们经常需要使用多数据源来满足不同的数据访问需求。DynamicDatasource为我们提供了一种灵活切换不同数据源的解决方案。但是多数据源配置连接池以及说明文档都是收费的。本篇博文将详细介绍如何配置和优化DynamicDatasource的连接池，包括Druid和HikariCP，以及如何根据项目需求进行选择。连接池配置连接池是数据库连接管理的核心组件，它可以显著提高数
C++ 字符串格式化的两种方法 Shinobi_Jack c++开发语言
字符串是大家常用的数据结构，经常会用的输入、输出的序列化（格式化）以下两种方法：1、使用sprintf标准方法2、使用format方法（实现格式化输入）sprintftest.cc#include#include#include#include#include#includeusingnamespacestd;stringformat(constchar*fmt,...){charbuf[1024
JS-Web API -day04 玩三国杀玩的 JS javascript 开发语言 ecmascript
一、日期对象1.1实例化日期对象实例化：new关键字获得当前时间constdata=newDate()获得指定时间constdata1=newDate('2024-5-108:30:00')1.2日期对象方法常见的时期对象方法：getFullYear()、getMonth()、getDate()、getDay()、getHours()、getMinutes()、getSeconds()，返回的数字
[Windows][Python] GUI设计 BennyCP [跨平台语言]Python
MakeaGUIonWindowsXSetuppythonInstallpipcurlhttps://bootstrap.pypa.io/get-pip.py-oget-pip.pypythonget-pip.pyInstallPyinstallerpipinstallPyInstallerWriteaGUIcodeimportwxapp=wx.App()win=wx.Frame(None,tit
动态规划详解-最小路径和问题【python】数据分析螺丝钉 LeetCode刷题与模拟面试动态规划算法 leetcode python 数据结构
作者介绍：10年大厂数据\经营分析经验，现任大厂数据部门负责人。会一些的技术：数据分析、算法、SQL、大数据相关、python欢迎加入社区：码上找工作作者专栏每日更新：LeetCode解锁1000题:打怪升级之旅python数据分析可视化：企业实战案例备注说明：方便大家阅读，统一使用python，带必要注释，公众号数据分析螺丝钉一起打怪升级1.问题介绍和应用场景最小路径和问题是一个常见的动态规划问
【MYSQL】mysql 常用命令 roman_日积跬步-终至千里常用命令 mysql 数据库
文章目录1.数据库管理命令2.表管理命令3.数据操作命令4.数据查询进阶5.用户与权限管理6.使用脚本操作数据库1.数据库管理命令--查看所有数据库SHOWDATABASES;--创建数据库CREATEDATABASE数据库名;--选择数据库USE数据库名;--删除数据库DROPDATABASE数据库名;2.表管理命令--查看所有表SHOWTABLES;--查看表结构DESCRIBE表名;--或S
数据结构与算法再探（六）动态规划刀客123 数据结构与算法动态规划算法
目录动态规划(DynamicProgramming,DP)动态规划的基本思想动态规划的核心概念动态规划的实现步骤动态规划实例1、爬楼梯c++递归（超时）需要使用记忆化递归循环2、打家劫舍3、最小路径和4、完全平方数5、最长公共子序列6、0-1背包问题总结动态规划(DynamicProgramming,DP)释义：动态规划是一种解决复杂问题的优化方法，通过将大问题拆解成小问题，逐步解决小问题，最终得
Python使用 try-except 捕获与处理异常大数据张老师 Python程序设计 python
使用try-except捕获与处理异常在Python中，try-except语句是用于捕获和处理异常的主要工具。当程序运行过程中发生错误时，try-except结构可以有效地防止程序崩溃，并允许开发者为错误提供适当的解决方案。这种机制非常适合用来处理那些不可预测的情况，例如用户输入错误、文件丢失或计算错误等。通过使用try-except结构，程序可以在出现错误时继续运行，而不是突然终止。这种方式可
python----try-except语句吉730 大数据
try:#将可能出现问题的代码，放到try的代码块中num01=int(input("number01:"))num02=int(input("number02:"))result=num01/num02exceptValueError:#except错误类型:捕获异常并解决问题print("字母和字符无法转成数字，请下次注意")exceptZeroDivisionErrorase:#ase:接收
用Python打造精彩动画与视频，6.3 项目案例分析蝴蝶江湖 python 开发语言
6.3项目案例分析在这一节中，我们将通过具体的项目案例，深入探索Manim的潜力，并展示如何使用Manim创建复杂且富有表现力的动画。这些案例将涵盖数学、物理以及其他科学领域，帮助您更好地理解和应用Manim。6.3.1案例一：展示数学定理frommanimimport*classPythagoreanTheorem(Scene):defconstruct(self):#创建一个直角三角形tria
python学opencv|读取图像（四十四）原理探究：bitwise_and()函数实现图像按位与运算西猫雷婶人工智能 opencv 人工智能计算机视觉
【1】引言前序学习进程中，已经掌握了两张图片按位与操作的基本技巧：python学opencv|读取图像（四十三）使用cv2.bitwise_and()函数实现图像按位与运算-CSDN博客【2】cv2.bitwise_and()函数实现图像按位与运算原理【2.1】图像运算在前述学习过程中，我们只是使用了cv2.bitwise_and()函数，其实未曾深入探究其根本原理。为实现原理探索，直接使用彩色图
python如何代替arduino_用电脑Python控制Arduino weixin_39980809
python指令：importserial#导入串口通讯库importtimeser=serial.Serial("com4",9600,timeout=1)demo1=b"0"demo2=b"1"while1:c=input('请输入指令:')if(c=='0'):ser.write(demo1)if(c=='1'):ser.write(demo2)Arduino指令voidsetup(){Se
python和arduino哪个好_Arduino各开发板的比较 weixin_39796855
本帖最后由亚伦安娜于2017-2-2616:18编辑查了好久，发现除了奈何等等几位大神总结过arduino各板子之间的性能、差异，没有很新的分析文章，在此斗胆写一篇测评。亚伦安娜写以方便刚刚开始学Arduino的朋友买到合适的开发板。Arduino系列开发板实在太多，本人水平不高、能力有限，仅以9款开发板进行说明，有错误的地方请给予支出，万分感谢。不是数据控的可以直接看最后的总结，数据资料大部分来
python实现websocket_基于Python实现WebSocket握手过程 weixin_39757040
importsocketimportbase64importhashlibdefget_headers(data):“””将请求头格式化成字典:paramdata::return:“””header_dict={}data=str(data,encoding=’utf-8′)header,body=data.split(‘\r\n\r\n’,1)header_list=header.split(‘
用python做一个上位机串口通信_使用python指令控制Arduino控件 weixin_39631261
当我们实现两个代码之间的通信时，使用串口通信是非常方便的，比如使用python指令控制Arduino控件的开关。这里有两个重要的环节：串口通信和上位机控制。一、串口通信串行接口简称串口，也称串行通信接口或串行通讯接口（通常指COM接口），是采用串行通信方式的扩展接口。串行接口(SerialInterface)是指数据一位一位地顺序传送，其特点是通信线路简单，只要一对传输线就可以实现双向通信（可以直
如何实现 Handy Control DataGrid 全选功能东百牧码人状态模式
如何实现HandyControlDataGrid全选功能在使用HandyControl的DataGrid控件时，经常会有全选的需求。今天我们就结合一段代码，详细介绍如何实现HandyControlDataGrid的全选功能。代码实现前端XAML代码代码解释DataGrid是主要的表格控件，ItemsSource绑定到TrendTagCollection，这是数据源集合。DataGridCheckB
python 异常 try-except句型 tanyjin Python python 异常
1.句型try:表达式1（如果表达式，可以成功执行，则执行，跳到finally语句）exceptExpectErrorType,Argument:（表达式1没有做成功，且正好是ExpectErrorType的错误情况，则执行）表达式2（如何处理这种异常情况）else:（trysucc&&上面except语句任一满足）之外的情况处理方法.....finally:....无论什么情况都会的处理2.ex
2021-10-08 用Python写的Linux下的转换word的docx文件为pdf文件，并使用Docker容器自动化部署 Amoor123 值得收藏的Python小技巧 docker python linux
文档层级完整项目资源代码先上源代码程序的基本思路是在数据库中存储文件名和他的MD5信息，校验这两个数据，如果数据库里面没有就转换，如果有就不转换，如果文件名有但MD5不同，就要删除原有的数据条目，避免word文档回到旧版本时转换不了importsubprocess#fromwin32com.clientimportgencache#fromwin32com.clientimportconstant
python模块websockets，浏览器与服务器之间的双向通信局外人LZ python python 开发语言
一、简介WebSocket是一种在Web浏览器和服务器之间进行实时双向通信的协议。它通过建立一条持久的连接，允许服务器主动向客户端推送数据，实现实时性和双向通信的能力。与传统的HTTP请求-响应模式不同，WebSocket提供了一个长时间运行的连接，可以在客户端和服务器之间进行双向通信。这意味着服务器可以主动向客户端发送数据，而不需要客户端发起请求。这种实时性和双向通信的特性使得WebSocket
Python_time库、直接动手 #Python python time
time库1.预知：单行动态刷新刷新的关键是\r刷新的本质是：用后打印的字符覆盖之前的字符不能换行：print()需要被控制要能回退：打印后光标回退之前的位置\r例：importtimeforiinrange(101):print(“\r{:3}%”.format(i),end=“”)time.sleep(0.1)#end=””表示将字符串最后的默认”/n”变成””(空),即不会换行2.定义:ti
python之time库 qq_44659804 python python 开发语言
python之time库time库time.strftime()的格式化示例time.time()示例time.localtime()示例time.gmtime()示例time.ctime()示例time.asctime()示例time.strftime()示例time.strptime()示例time.sleep()time库Python中内置了一些与时间处理相关的库，如time、datatim
influxdb jwolf2 other
influxdb是目前比较流行的时间序列数据库,常用于存储监控数据,日志等数据，基本语法类似sql1.基本安装，其它参数参考https://hub.docker.com/_/influxdbdockerrun-d-p8086:8086-v/home/influxdb/data:/var/lib/influxdb--nameinfluxdbinfluxdb8086为HTTPAPI数据端口,8083管
Pandas读写JSON文件的终极指南与实战技巧read_json、to_json 步入烟尘 Python超入门指南全册 pandas json python 文件处理实战技巧
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl