能思想的苇草2

利用python进行数据分析学习笔记1(数据清洗和准备)

处理缺失数据

创建一个含缺失值的Series

string_data = pd.Series(['aardvark', 'artichoke', np.nan, 'avocado'])
string_data.isnull()

通过isnull方法返回一个布尔型Series，缺失值显示为True。

通过索引可以将非缺失值设置为缺失值

string_data[0] = None

处理缺失数据的函数

dropna，除去缺失数据

fillna，用指定值填充缺失值

isnull，返回布尔型对象，缺失值显示True，其他显示False

notnull，isnull的否定式

滤除缺失数据

from numpy import nan as NA    #从numpy模块中可以引入缺失值。
data = pd.Series([1,NA,3.5,NA,7])    #创建含缺失值的Series
data.dropna()    #去除Series中的缺失值

data[data.notnull()]    #与data.dropna()等价

对DataFrame对象，dropna方法默认丢弃所有含有缺失值的行。

data = pd.DataFrame([[1., 6.5, 3.], [1., NA, NA],
                    [NA, NA, NA], [NA, 6.5, 3.]])
cleaned = data.dropna()

传入参数how='all'则只除去整行都是NA的行。

cleaned = data.dropna(how='all')

传入参数axis=1或者axis='columns'则会改为逐列删除。

data = pd.DataFrame([[1., NA, 3.], [1., NA, NA],
                    [2, NA, NA], [3, NA, 3.]])
cleaned = data.dropna(axis=1)
cleaned2 = data.dropna(axis=1,how='all')

dropna的thresh参数，如设置thresh=2，表示如果某行至少有2个非缺失值时将该行保留下来

df = pd.DataFrame(np.random.randn(7,3))    #创建一个7行3列的DataFrame
df.iloc[:4,1] = NA    #将数据框列1的前四行设置为缺失值
df.iloc[:2,2] = NA    #将数据框列2的前两行设置为缺失值

df.dropna(thresh=2)   #行数据有两个及以上非缺失值时将保留该行

df.dropna(thresh=3)   #行数据有三个及以上非缺失值时将保留该行

填充缺失数据

Series和DataFrame都有fillna方法可以填充缺失数据

df.fillna(0)

fillna()方法可以传入字典，实现对不同列的缺失值用不同的值进行填充

df.fillna({1:0.5,2:0})    #列1的缺失值用0.5来填充，列2的缺失值用0来填充

若传入inplace=True参数，则可以实现就地修改(慎用)

df.fillna(0,inplace=True)

fillna传入method='ffill'参数，缺失值会以上方非缺失值为参数进行填充。

df = pd.DataFrame(np.random.randn(6, 3))
df.iloc[2:, 1] = NA
df.iloc[4:, 2] = NA

df.fillna(method='ffill')

传入limit参数可以限制填充缺失值数量。

df.fillna(method='ffill',limit=2)    #限制一列只能填充两个缺失值

可以利用fillna实现许多别的功能，如用平均值来填充缺失值。

data = pd.Series([1,NA,3.5,NA,7])
data.fillna(data.mean())

fillna的参数：value、method、axis、inplace、limit

数据转换

移除重复数据

data = pd.DataFrame({'k1':['one','two'] * 3 + ['two'],'k2':[1,1,2,3,3,4,4]})

创建含重复数据的DataFrame。

duplicated()方法返回一个布尔型Series，重复值标记为True。

drop_duplicates()方法可以删去重复值。

duplicated和drop_duplicates都是默认判断全部列，也可以指定部分列。

data['v1'] = range(7)    #增加一列
data.drop_duplicates(['k1'])    #仅对k1列进行判断

默认情况下保留的是第一个出现的值组合，传入参数keep = 'last'则保留最后一个

利用函数或映射进行数据转换

data = pd.DataFrame({'food': ['bacon', 'pulled pork', 'bacon',
                              'Pastrami', 'corned beef', 'Bacon',
                              'pastrami', 'honey ham', 'nova lox'],
                     'ounces': [4, 3, 12, 6, 7.5, 8, 3, 5, 6]})

创建一个DataFrame

现在要添加一列表示food列的来源，先编写一个映射。

meat_to_animal = {
  'bacon': 'pig',
  'pulled pork': 'pig',
  'pastrami': 'cow',
  'corned beef': 'cow',
  'honey ham': 'pig',
  'nova lox': 'salmon'
}

food列中有大写有小写，先用str.lower()方法全部变成小写。

lowercased = data['food'].str.lower()

在DataFrame中创建一个新列aminal

data['aminal'] = lowercased.map(meat_to_animal)

右边表示将lowercased的每个元素到字典meat_to_animal中找到映射值，返回映射值的Series。

将上面的步骤合并简化

data['food'].str.lower().map(meat_to_animal)

替换值

data = pd.Series([1,-999,2,-999,-1000,3])    #创建一个Series
data.replace(-999,np.nan)    #将其中的-999用缺失值来替换，非原地修改

被替换值和替换值都可以传入多个，通过列表形式传入。

传入的参数可以是字典，键表示被替换值，值表示替换值。

重命名轴索引

data = pd.DataFrame(np.arange(12).reshape((3, 4)),
                    index=['Ohio', 'Colorado', 'New York'],
                    columns=['one', 'two', 'three', 'four'])
transform = lambda x:x[:4].upper()
data.index.map(transform)

将data.index中每个元素作为参数传入transform函数中，即取每个元素的前四位并最大值。

可以将返回值赋值给index，对DataFrame的行索引进行就地修改

data.index = data.index.map(transform)

通过rename方法可以在原索引的基础上进行修改。

data.rename(index=str.title,columns=str.upper)

此代码表示将行索引每个元素首字母大写化，其余字母小写，列索引所有字母大写化，就地修改。

index和columns参数可以传入字典，字典的键是原索引，值是新索引。

data.rename(index={'OHIO': 'INDIANA'},
            columns={'three': 'peekaboo'})

将指定原索引改为新索引，非原地修改。

传入inplace参数可以原地修改。

data.rename(index={'OHIO': 'INDIANA'}, inplace=True)

离散化和面元划分

现在有一组年龄数据

ages = [20, 22, 25, 27, 21, 23, 37, 31, 61, 45, 41, 32]

要将数据分为18-25，26-35，35-60及60以上的几个面元，通过pandas的cut方法可以实现。

bins = [18,25,35,60,100]    #划分列表
cats = pd.cut(ages,bins)

给出了每个数字所在的区间合起来的列表。

返回的对象有一个codes属性，返回各个元素所在区间的顺序的列表。

如第一个元素20所在区间是18-25，该区间是第一个区间，所以用0表示。

categories属性返回所有区间。

value_counts属性计算各个区间分别有多少个元素。

默认情况下区间是左开右闭，可以通过在cut方法中传入参数right=False可以改为左闭右开。

cats = pd.cut(ages, bins,right=False)

cut方法中有个labels参数，传入一个列表，其中的元素可以作为区间的名称。

group_names = ['Youth', 'YoungAdult', 'MiddleAged', 'Senior']
pd.cut(ages,bins,labels=group_names)

可以向cut方法传入需要分隔的区间个数而不是具体边界，程序会自动计算出区间大小。

data = np.random.rand(20)
pd.cut(data,4,precision=2)

将data数组分为4块，precision表示限定小数为两位。

qcut()方法是分位数切割方法。

data = np.random.randn(1000)
cats = pd.qcut(data,4)

表示将数据分为4块，每块的数据数量都是250个，即四分位。

通过pd.value_counts()方法统计各区间的数据数量。

可以自定义每块数据的数量，如传入列表[0,0.1,0.5,0.9,1.]作为参数，表示将数据分为四块，第一块占总数量的十分之一，第二块和第三块各占总数量的五分之二，最后一块占总数量的十分之一。

cats = pd.qcut(data, [0, 0.1, 0.5, 0.9, 1.])
pd.value_counts(cats)

检测和过滤异常值

data = pd.DataFrame(np.random.randn(1000,4))
data.describe()

创建一个DataFrame，共四列，每列1000个数据，对DataFrame进行描述统计。

假如想找出某列中绝对值大小超过3的值

col = data[2]
col[np.abs(col) > 3]

传入一个布尔型数组作为索引。

要选出全部含有超过3或-3的值的行，可以在布尔型DataFrame中使用any方法

data[(np.abs(data) > 3).any(1)]

返回结果的每行中都有绝对值大于3的值，np.abs(data)>3返回的是布尔型DataFrame，对这个返回结果再执行any(1)，表示筛选出行中有绝对值大于3的数值，返回布尔型Series。将这个布尔型Series作为data的索引，取出所有布尔值为True的值。

将值限制在区间-3~3之间

data[np.abs(data) > 3] = np.sign(data) * 3
data.describe()

第一行代码将data数据中绝对值大于3的数据设为3或-3。

sign方法根据数据是正、负、零，分别返回+1，-1，0。

np.sign(data).head()

排列和随即采样

numpy.random.permutation函数可以实现对Series或DataFrame的列的排列工作，随机重排序。通过需要排列的轴的长度调用permutation，可产生一个表示新顺序的整数数组。

df = pd.DataFrame(np.arange(5 * 4).reshape((5,4)))
sampler = np.random.permutation(5)

sampler是将0-4随机排列的数组。

使用take函数对DataFrame的行进行重排序，顺序使用sampler

df.take(sampler)

可以看到行索引的顺序发生了改变。

如果不想用替换的方式选取随机子集，可以用sample方法，非原地修改

df.sample(n=3)

sample(n=3)表示在df中随机取三行。

要通过替换的方式产生样本(允许重复选择)，传入参数replace=True。

choices = pd.Series([5, 7, -1, 6, 4])
draws = choices.sample(n=10, replace=True)

计算指标/哑变量

比如现在有一个三分类的分类变量A、B、C，设两个变量将这三个分类用数字表示，A用0,0表示，B用1,0表示，C用0,1表示。

程序中稍有不同，K个分类，会派生出k列矩阵。

df = pd.DataFrame({'key': ['b', 'b', 'a', 'c', 'a', 'b'],
                   'data1': range(6)})
pd.get_dummies(df['key'])

a用1,0,0表示，b用0,1,0表示，c用0,0,1表示。

如果想给列索引加一个前缀，可以通过get_dummies方法中的prefix参数实现

dumies = pd.get_dummies(df['key'],prefix='key')
df_with_dummy = df[['data1']].join(dummies)    #选取df中的指定列，和dumies合并

若DataFrame中的某行同属于多个分类会比较复杂

mnames = ['movie_id', 'title', 'genres']
movies = pd.read_table('datasets/movielens/movies.dat', sep='::',
                        header=None, names=mnames)    #读取数据，选择无数据头，用外部列表作为列名
movies[:10]    #取数据的前十行

可以看到genres列中有多个电影类型。

将所有类型放到一个list中。

all_genres = []
for x in movies.genres:
    all_genres.extend(x.split('|'))
genres = pd.unique(all_genres)

zero_matrix = np.zeros((len(movies),len(genres)))    #创建多行多列的全0数组
dummies = pd.DataFrame(zero_matrix,columns=genres)    #根据数组创建DataFrame，列名是genres中的元素

gen = movies.genres[0]    #取出movies的genres列的第一行数据
gen.split('|')    #拆分
dummies.columns.get_indexer(gen.split('|'))    #返回拆分结果在dummies的列名中的排行

for i, gen in enumerate(movies.genres):
    indices = dummies.columns.get_indexer(gen.split('|'))
    dummies.iloc[i, indices] = 1

举个例子，将movies的genres列的第一行的电影类型对应的dummies中的列改为1。

例如genres列中第一行的电影类型是Animation、Children's，Comedy，上面的代码就是将dummies中的第一行对应的三列的数值改为1。

通过join方法将movies数据和加前缀的dummies数据合并起来

movies_windic = movies.join(dummies.add_prefix('Genre_'))
movies_windic.iloc[0].head(10)    #取第一行的前十列看看

结合get_dummies和诸如cut之类的离散化函数。

np.random.seed(12345)    #设随机种子为12345
values = np.random.rand(10)    #取10个在0-1之间的随机数字
bins = [0,0.2,0.4,0.6,0.8,1]
pd.get_dummies(pd.cut(values,bins))

pd.cut(values,bins)表示按bins的区间给values的值分区间

get_dummies是计算哑变量用的函数。

字符串操作

字符串对象方法

字符串split方法可以根据分隔符拆分字符串，返回列表

val = 'a,b, guido'
val.split(',')

split常与strip一起用，以除去空白符。

pieces = [x.strip() for x in val.split(',')]

用加法将子字符串用::连接起来，这种方法不常用。

first,second,third = pieces
first + '::' + second + '::' + third

更常用的方法是join方法。

'::'.join(pieces)

通过in方法判断某字符串中是否包含某字符。

通过index方法查找指定字符的位置，如果字符不存在会返回异常。

通过find方法查找指定字符位置，如果不存在则返回-1。

replace方法，将指定字符替换成其他字符。

python常用字符串方法

count，返回某字符在字符串中出现的次数。

endswith,startswith，判断字符串是否以某字符开头。

join，将某字符作为连接列表中多个字符串的分隔符

index，在字符串中找某字符的位置。

find同上。

rfind，找某字符在字符串中最后一次出现的位置，没有则返回-1。

replace，替换字符。

strip、rstrip、lstrip，去除空白符，换行符，制表符。

split，将字符串按某字符进行分隔。

lower，upper，将字符串小写化和大写化。

ljust、rjust，设定最低宽度限制，不足的用空格或者其他字符填充。

正则表达式

现有一个字符串，其中每几个字母间有若干个空格，现在要根据若干个字符进行拆分。

import re
text = "foo    bar\t baz  \tqux"
re.split('\s+',text)

\s+表示一个或多个空白符。

可以将匹配规则做成可重用对象。

regex = re.compile('\s+')
regex.split(text)

如果希望得到匹配regex的所有模式，可以使用findall方法

返回所有匹配的结果。

match和search跟findall的功能类似，findall是返回字符串中所有匹配项，search是返回第一个匹配项，match很严格，只匹配字符串的首部。

下面是对邮箱字符串的匹配。

text = """Dave [email protected]
Steve [email protected]
Rob [email protected]
Ryan [email protected]
"""
pattern = r'[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,4}'    #匹配规则
regex = re.compile(pattern,flags=re.IGNORECASE)    #将匹配规则做成可重用对象，flags参数表示大小不敏感

使用findall将得到所有的邮箱。

regex.findall(text)

search会返回第一个匹配到的邮箱

regex.search(text)

结果只是告诉我们匹配对象在原字符串中起始和结束的位置。

m = regex.search(text)
text[m.start():m.end()]

regex.match将返回None，因为它只匹配出现在字符串开头的模式。

print(regex.match(text))

sub方法可以将匹配到的模式替换为指定字符串，返回得到的新字符串。

print(regex.sub('REDACTED',text))

如果想将匹配到的电子邮件地址分成三部分，用户名，域名和域名后缀，将匹配规则中指定区域用()括起来即可。

pattern = r'([A-Z0-9._%+-]+)@([A-Z0-9.-]+)\.([A-Z]{2,4})'
regex = re.compile(pattern, flags=re.IGNORECASE)
regex.findall(text)

m = regex.match('[email protected]')
m.groups()

match方法和search方法返回的结果都能用groups()方法，但findall()方法返回的不行，因为它返回的是一个元组列表。

sub还能通过\1、\2这样的形式访问匹配项的分组。

print(regex.sub(r'Username:\1,Domain:\2,Suffix:\3',text))

pandas的矢量化字符串函数

data = {'Dave': '[email protected]', 'Steve': '[email protected]',
        'Rob': '[email protected]', 'Wes': np.nan}    
data = pd.Series(data)    #根据字典创建一个Series
data.isnull()    #使用isnull方法返回一个Series，缺失值显示True，非缺失值显示False

data.str.contains('gmail')

通过Series的str.contains方法检查元素是否含有指定字符串。

也可以使用正则表达式

data.str.findall(pattern,flags=re.IGNORECASE)

取出data中的每个元素进行匹配，findall方法返回list。

matches = data.str.match(pattern,flags=re.IGNORECASE)

使用str.get方法可以获取列表元素。

matches.str.get(1)    #获取列表的第二个元素
matches.str[0]    #获取列表的第一个元素

因为matches中的数据是布尔值，所以取元素都是0缺失值。

因为data的数据是字符串，所以str[:5]选取前五个字符

还有更多pandas字符串方法。

以上内容主要出自：https://www.jianshu.com/p/ac7bec000dad

你可能感兴趣的:(python)

python基于Django的旅游景点数据分析及可视化的设计与实现 7blk7 qq2295116502 python django 数据分析
目录项目介绍技术栈具体实现截图Scrapy爬虫框架关键技术和使用的工具环境等的说明解决的思路开发流程爬虫核心代码展示系统设计论文书写大纲详细视频演示源码获取项目介绍大数据分析是现下比较热门的词汇，通过分析之后可以得到更多深入且有价值的信息。现实的科技手段中，越来越多的应用都会涉及到大数据随着大数据时代的到来，数据挖掘、分析与应用成为多个行业的关键,本课题首先介绍了网络爬虫的基本概念以及技术实现方法
python strip()函数牛也唱歌
strip函数原型声明：s为字符串，rm为要删除的字符序列.只能删除开头或是结尾的字符或是字符串。不能删除中间的字符或是字符串。s.strip(rm)删除s字符串中开头、结尾处，位于rm删除序列的字符s.lstrip(rm)删除s字符串中开头处，位于rm删除序列的字符s.rstrip(rm)删除s字符串中结尾处，位于rm删除序列的字符注意：1.当rm为空时，默认删除空白符（包括'\n','\r',
用python执行js代码：PyExecJS库详解数据知道 2025年爬虫和逆向教程 python javascript 爬虫数据采集 nodejs
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录1.介绍和安装1.1PyExecJS介绍1.2安装JavaScript运行时1.3安装PyExecJS2.PyExecJS的基本使用2.1执行简单的JavaScript代码2.2使用外部JavaScript文件2.3先编译、后调用2.4传递参数和获取返回值3.PyExecJS的高级功能3.1指定JavaScript运行时3.2处理异步JavaSc
Python中strip()函数详细讲解甯公子_ Python入门程序 python 开发语言算法
strip()是Python中字符串（str）对象的一个内置方法，用于去除字符串开头和结尾的空白字符（包括空格、换行符、制表符等）。它不会修改字符串中间的空白字符。语法str.strip([chars])str：需要处理的字符串。chars（可选）：指定要去除的字符集合。如果未指定，默认去除空白字符（包括空格、换行符\n、制表符\t等）。返回值返回一个新的字符串，去除了开头和结尾的指定字符。常见用
利用Python爬虫获取淘宝商品评论：实战案例分析数据小爬虫@ API python 爬虫开发语言
在数字化时代，数据的价值日益凸显，尤其是对于电商平台而言，商品评论作为用户反馈的重要载体，蕴含着丰富的信息。本文将详细介绍如何利用Python爬虫技术获取淘宝商品评论，包括代码示例和关键步骤解析。淘宝商品评论的重要性淘宝商品评论不仅对消费者购买决策有着重要影响，而且对于商家来说，也是了解市场需求、改进产品和服务的重要途径。因此，获取并分析淘宝商品评论数据，对于电商运营和市场分析具有重要意义。Pyt
Python 自动探索性数据分析库———KLib 若木胡 tools python 数据分析开发语言
Python自动探索性数据分析库——KLib一、引言在当今数据驱动的时代，数据分析师和科学家们面临着海量的数据需要处理和分析。探索性数据分析（EDA）作为数据处理流程中的关键环节，旨在帮助人们快速理解数据的特征、分布、相关性等重要信息，从而为后续的深入分析、建模以及决策提供坚实的基础。Python以其丰富的生态系统和强大的功能在数据分析领域占据着重要地位，而KLib则是其中一款专注于自动探索性数据
源码篇：python生成《蔬菜店销售数据分析报告》案例 IT小本本 python python 数据分析开发语言
本文将通过Python实现一个完整的蔬菜销售数据分析项目，涵盖数据生成、清洗、分析及可视化全流程。我们将利用模拟数据生成技术创建90天的销售记录，通过Pandas进行数据处理，结合Matplotlib和Seaborn实现多样化的可视化图表，并最终生成动态交互报告。一、数据生成：模拟真实销售场景为了模拟真实的蔬菜销售数据，我们设计了包含10种蔬菜（白菜、土豆、西红柿等）的90天销售记录。数据生成逻辑
[附源码]Python计算机毕业设计SSM基于B-S的心理健康管理系统（程序+LW) Python、JAVA毕设程序源码 java 开发语言
环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：SSM+mybatis+Maven+Vue等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.IDE环境：
5-1 使用ECharts将MySQL数据库中的数据可视化上课的牛马实训大数据
方法一：使用PythonFlask框架搭建API对于技术小白来说，使用ECharts将MySQL数据库中的数据可视化需要分步骤完成。以下是详细的实现流程：一、技术架构‌后端服务‌：使用PythonFlask框架搭建API（简单易学，适合新手）数据库连接‌：通过Python的pymysql库连接MySQL前端可视化‌：HTML+JavaScript+ECharts数据流向‌：MySQL数据库→Pyt
绕过 reCAPTCHA V2/V3：Python、Selenium 指南 qq_33253945 python selenium javascript 网络爬虫爬虫算法
前言验证码（CAPTCHA）技术已经存在许多年，尽管它的有效性一直备受争议，但许多网站仍然依赖它来保护资源。尤其是Google推出的reCAPTCHA系列，一直是验证码领域的佼佼者。本文将详细介绍如何绕过reCAPTCHAV2和V3，并提供实用的代码示例。详情请见：解决验证码recaptcha、cloudflare、incapsula1.什么是reCAPTCHA？reCAPTCHA是Google推
CSP-J备考冲刺必刷题（C++） | AcWing 11 背包问题求方案数热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】AcWing：11.背包问题求方案数-AcWi
python数据可视化绘制图表（直方图，饼图圆环图，散点或气泡图，误差棒图） 2224070304 信息可视化 python 数据分析
一，直方图#先导入模块importnumpyasnp importmatplotlib.pyplotasplt#准备50个随机的数据scores=np.random.randint(0,100,50)#绘制直方图plt.hist(scores,bins=8,histtype='stepfilled')plt.show()其中，scores为数组（可为单个或多个的数列)bins=8,表示矩形的条数为
用Python实现SFM 薄辉 python opencv 计算机视觉人工智能图像处理
SFM(结构化光流法)是一种用于解决三维重建问题的方法，它可以根据许多二维图像和它们之间的相对位置，估计出三维场景的深度和摄像机的姿态。在Python中，你可以使用OpenCV库来实现SFM。下面是一个简单的例子，展示了如何使用OpenCV库的cv2.sfm_create函数来实现SFM：importcv2#读入图像，存入列表images中images=[]foriinrange(1,11):im
使用Python轻松拆分PDF，每页独立成文件 AI航海家(Ethan) python python pdf
使用Python轻松拆分PDF，每页独立成文件嗨，各位PDF爱好者！如果你曾经有想要拆分一个大PDF文件的想法，让每一页都成为独立的文件，那么这篇博客就是为你准备的！我们将使用Python中的一个非常强大的库–PyPDF2，把这些需求变得简单易行。PyPDF2登场首先，我们需要安装PyPDF2库。如果你还没有安装，别担心，只需要在终端运行以下命令：pipinstallPyPDF2安装好了吗？下面我
决策树算法及其python实例 m0_74831463 算法决策树 python
一、决策数的概念什么是决策树算法呢？决策树（DecisionTree）是一种基本的分类与回归方法，本文主要讨论分类决策树。决策树模型呈树形结构，在分类问题中，表示基于特征对数据进行分类的过程。它可以认为是if-then规则的集合。每个内部节点表示在属性上的一个测试，每个分支代表一个测试输出，每个叶节点代表一种类别二、决策树的构造1、决策树的构造步骤输入：训练集D={(21,11),(z2,32),
探索Sfm-python: 一款强大的计算机视觉库缪昱锨Hunter
探索Sfm-python:一款强大的计算机视觉库去发现同类优质开源项目:https://gitcode.com/在计算机视觉领域，Sfm-python是一个值得关注的开源项目，它以简洁高效的Python接口提供结构化从运动（StructurefromMotion,SfM）算法。如果你对3D重建、图像匹配或地理定位有兴趣，那么这个项目将是你不可或缺的工具。让我们一起深入了解一下它的技术细节、应用场景
Python Textract库：文本提取程序员喵哥 python 开发语言
更多Python学习内容：ipengtao.comTextract是一个强大的Python库，用于从各种文件格式中提取文本。无论是PDF、Word文档、Excel电子表格、HTML页面还是图像，Textract都能有效地提取其中的文本内容。Textract通过集成多种开源工具和库，实现了对多种文件格式的支持，使得文本提取变得简单而高效。本文将详细介绍Textract库的安装、主要功能、基本操作、高
python学智能算法（八）|决策树西猫雷婶人工智能 python学习笔记机器学习 python 决策树开发语言
【1】引言前序学习进程中，已经对KNN邻近算法有了探索，相关文章链接为：python学智能算法（七）|KNN邻近算法-CSDN博客但KNN邻近算法有一个特点是：它在分类的时候，不能知晓每个类别内事物的具体面貌，只能获得类别，停留在事物的表面。为了进一步探索事物的内在特征，就需要学习新的算法。本篇文章就是在KNN的基础上学习新算法：决策树。【2】原理分析在学习决策树执之前，需要先了解香农熵。本科学控
freecad嵌入工作台黄河里的小鲤鱼软件开发建模 python
1Introduction导言FreeCADcanbeimportedasaPythonmoduleinotherprogramsorinastandalonePythonconsole,togetherwithallitsmodulesandcomponents.It’sevenpossibletoimporttheFreeCADuserinterfaceasapythonmodulebutwi
家用笔记本换装centos7当服务器全流程吕域服务器 windows 电脑 centos
目录1、安装centos7系统硬件准备软件和镜像准备制作启动盘2、网络连接和ssh远程登陆centos7连接网络ssh远程登陆3、笔记本闭盖不休眠（7*24小时可用）4、定时开关机（省电、保护电脑）5、配置开发环境（此处以python为例，非必要项，示需求安装）1、安装centos7系统硬件准备老旧淘汰笔记本一台（新笔记本不合算，舍不得）一个大于8G的U盘网线一根（后续联网用）软件和镜像准备软件U
python 函数—文档、类型注释和内省想知道哇 python python 开发语言
Python文档、类型注释和内省目录引言函数文档docstring的使用help()函数类型注释基本类型注释复杂类型注释内省技术基本内省方法inspect模块的高级内省综合示例建议引言Python提供了丰富的文档和内省机制，使开发者能够编写自解释的代码并在运行时检查对象属性。本教程详细介绍了函数文档、类型注释和内省技术。函数文档docstring的使用Python使用三引号字符串（'''或"""）
奇异值分解（SVD）文弱_书生乱七八糟神经网络人工智能
奇异值分解(SVD)介绍奇异值分解(SVD)，这是最强大的矩阵分解技术之一。SVD广泛应用于机器学习、数据科学和其他计算领域，用于降维、降噪和矩阵近似等应用。与仅适用于方阵的特征分解不同，SVD可以应用于任何矩阵，使其成为一种多功能工具。在这里煮啵将分解SVD背后的理论，通过手动计算示例进行分析，并展示如何在Python中实现SVD。在本节结束时，您将清楚地了解SVD的强大功能及其在机器学习中的应
python异步--asyncio HWQlet python python异步编程
在python2.x和python3.x早期版本的时候，协程的主流实现方法是gevent，这个我之前讲过asyncio在python3.4后内置在python中了，在后面还有async/await，更后面有aiohttp，flask实现就有参照aiohttpasync和await分别又来替换早期协程的asyncio.coroutine和yieldfrom。从此以后，协程就是python中一个新的语
Python异步编程 - asyncio库孤寒者 Python全栈系列教程 python 异步编程 asyncio yield 协程
目录：每篇前言：异步IOPython中的异步编程实现方式：协程Python传统协程示例：实现生产者-消费者模型消费者：生产者：运行流程：整体流程：传统协程——>现代协程：asyncio库async/await每篇前言：作者介绍：【孤寒者】—CSDN全栈领域优质创作者、HDZ核心组成员、华为云享专家Python全栈领域博主、CSDN原力计划作者本文已收录于爬虫必备前端技术栈专栏：《爬虫必备前端技术栈
python输出星号等腰三角形_python打印直角三角形与等腰三角形实例代码 weixin_39644139 python输出星号等腰三角形
python打印直角三角形与等腰三角形实例代码前言本文通过示例给大家详细介绍了关于python打印三角形的相关，分享出来供大家参考学习，下面话不多说了，来一起看看详细的介绍吧1、直角三角形#i控制行数j控制*的个数foriinrange(5):i+=1forjinrange(i):print('*',end='')#end=‘'输出空格print()/2、等腰三角形row=int(input('p
python绘制等边三角形的代码_Python打印等边三角形 weixin_39621178
示例1:#!/usr/bin/python#-*-coding:UTF-8-*-#根据输入打印rows=int(raw_input('pleaseinputnumber:'))#等边三角形foriinrange(0,rows+1):forjinrange(0,rows-i):print"",j+=1forkinrange(0,2*i-1):ifk==0ork==2*i-2ori==rows:ifi
Python写倒三角森之林 python
4.(程序题)编程显示如下所示的三角形图案。要求程序运行时，输入一个正整数，显示该整数行高度的三角形图案。#############h=int(input("请输入高度："))foriinrange(h):forjinrange(i,h):print("#",end="")forrinrange(0,i):print("",end="")print("")
python+flask计算机毕业设计基于Android平台的景区移动端旅游软件系统（程序+开题+论文） Node.js彤彤程序 python flask 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景随着移动互联网技术的飞速发展，智能手机已成为人们日常生活中不可或缺的一部分，特别是在旅游领域，移动端应用以其便捷性、实时性和个性化服务的特点，极大地改变了人们的旅游体验方式。当前，旅游市场日益繁荣，游客对于旅游信息获取、行程规划、景点导航、票务预订及个性化服务的需
ALO蚁狮优化算法：从背景到实战的全面解析 der丸子吱吱吱智能优化算法 ALO算法
目录引言背景2.1蚁狮优化算法的起源2.2自然启发式算法的背景2.3ALO的发展与应用原理3.1蚁狮的生物行为3.2ALO的数学建模3.3算法流程与关键步骤实战应用4.1函数优化问题4.2工程优化案例4.3组合优化与约束优化代码实现与结果分析5.1Python代码实现5.2实验设计与结果分析5.3性能评估与优化建议学习资源6.1工具推荐6.2网站与文献资源6.3ALO与AI结合的方法结论1.引言在
全面掌握Python：从安装到基础再到进阶的系统学习之路（附代码，建议新手收藏） der丸子吱吱吱 python 学习开发语言新手入门代码
Python，作为一种现代化的高级编程语言，因其简洁易懂的语法和强大的功能，成为了数据科学、人工智能、Web开发等多个领域的首选语言。在这篇文章中，我们将从大学课本的结构来详细介绍Python，帮助大家从零基础开始，逐步深入掌握Python的各个方面。目录第一章：Python简介与安装1.1Python语言概述1.2安装Python1.3Python的开发环境1.4第一个Python程序第二章：基
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt