子佩青青

从零开始学R（四）——常用命令：帮助，文件导入与导出与基本操作

R的常用命令

R的命令非常多，但是有一些命令是非常常用的，在这里我做一个汇总，便于大家使用。（Tips：关于下载和安装R的package以及工作目录的获得与设置命令在第二篇已经聊过，此时就不再赘述了，详见从零开始学R（二）——R语言基础）

1、帮助命令

R是一款很优秀的统计软件，这样评价的一个重要原因是，使用者可以通过R自身来学习R。例如，如果我们想要了解数据框转换命令as.data.frame()，我们可以输入如下代码

help("as.data.frame") 
?"as.data.frame"

在RStudio中，我们可以在右下角（前提是没有调整过RStudio的布局）的界面得到这个函数的具体信息，包括它的描述(Description)，使用方法(Usage)，语句(Arguments)，细节(Details)以及参考文献(References)等。有时候对于有些命令，我们可能阅读上述信息之后还是不熟悉，此时我们可以使用example()函数来让R为我们做出示范，这就是为什么我们能够利用R进行自学的原因。

对于部分函数来说，帮助命令中的引号可以省略，但是由于一些函数中存在特殊字符，此时就必须使用引号。比如?>的运算结果就会出错，而?">"则会显示出>函数的帮助页面。

如果我们不太清楚我们想要找的函数的名字是什么，但是我们知道这个函数是用来做什么的，我们可以采用模糊搜索。比如我们想了解，什么函数能够帮助我们生成一个多元正态分布的随机变量函数，我们就可以使用如下命令

help.search("multivariate normal")
??"multivariate normal"

有时候我们可能想了解一个package的用法，虽然我在这里推荐小伙伴们直接去CRAN寻找相关package的介绍文件，但是我们也可以在R中直接去搜索，了解基本信息

help(package = "package.name")

2、表格型文件的导入与导出

使用R的数据分析师或者数据科学家通常是对现实世界的某些数据进行分析，因此，在完成数据收集后，我们需要将所收集到的数据导入的R中进行整理与分析。我们在这里重点介绍一些常用的文件导入方式。

CSV文件

CSV（Comma-Separated Values）文件一种表格存储类型的文件，数据之间采用逗号（或其他字符）进行分隔。R的通用package（R自带）中有读取csv文件的命令

data <- read.csv("working directory/name.csv")
data <- read.csv2("working directory/name.csv")

第一个命令的分隔符默认为逗号","，第二个命令的分隔符默认为分号";"。
此外，我们还可以用另一个命令来读取csv文件

data <- read.table("working directory/name.csv",
                   sep = ",")

这个命令是用来读取表格的命令，sep参数是分隔符，一般csv文件是逗号，所以这里用逗号。

RDS文件

RDS（Report DataSource File）文件也可以利用R的通用package直接打开，不过这个文件类型的普及率并不是很高，在一些公开数据中有时会发现这种类型的数据

data <- readRDS("working directory/name.rds")

Excel文件

微软的Excel其实也能很好地进行数据分析与数据可视化，当然我们也可以用R对Excel文件进行读取与处理，但是这时我们就需要安装新的packagereadxl

install.packages(readxl)
library(readxl)
data <- read_xls("working directory/name.xls")
data <- read_xlsx("working directory/name.xlsx")

其他数据软件的文件

数据分析软件很多，在这里我们介绍两个常用的数据分析软件：SPSS和stata。SPSS导出的数据是.sav后缀，stata导出的数据是.dta后缀，读取这两种类型的文件也需要下载一个新的packageforeign

install.packages(foreign)
library(foreign)
data <- read.spss("working directory/name.sav")
data <- read.dta("working directory/name.dta")

但是，foreign这个package中，只能读取stata12及以下版本导出的数据，而对于stata13及以上版本的数据是无法识别的，此时又需要一个新的packagereadstata13

install.packages(readstata13)
library(readstata13)
data <- read.dta13("working directory/name.dta")

文件导出

表格型数据的以csv格式进行导出较为方便

write.table(name, file = "file.csv", sep = ",")

题外话

由于R是一款开源软件，因此同一功能会有很多不同的package和命令来实现，比如haven以及readr也都是能够用来读取相关数据文件的package。所以小伙伴们在使用的时候，只需要选择自己熟悉的命令即可。

此外，由于大数据技术，机器学习与人工智能算法的飞速发展，很多非结构性数据，比如文本，图片，音频数据等都成为数据分析的对象，但由于我在这里仅介绍一些基本的内容，更进阶的内容我会在以后以专题形式向大家做介绍。

3、基本操作

这里所说的基本操作指的是对向量、矩阵和数据框等数据存储对象的操作。

length()

length()函数顾名思义是用来查看对象的长度。
对于向量来说，这个函数可以查看向量的长度；
对于矩阵来说，这个函数可以查看矩阵元素的数量；
对于数据框来说，这个函数可以查看变量个数。

dim()

dim()函数是dimension，可以查看对象的维度数据，结果是一个包含维度数据的一维向量。
对于矩阵来说，这个函数可以查看矩阵的行数和列数；
对于数据框来说，这个函数可以查看数据框的观测值数量和变量个数。

str()

str()函数是structure，可以查看对象的结构数据
对于向量来说，向量是一维结构，因此这个函数可以查看向量中元素的存储类型和具体情况；
对于矩阵来说，这个函数可以查看矩阵中元素的存储类型和具体情况；
对于数据框来说，这个函数可以查看数据框中每个变量的存储类型、观测值数量和变量个数。

summary()

summary()函数可以将某个对象的情况进行整理并呈现出来
对于向量来说，这个函数可以查看向量的长度和元素的存储类型；
对于矩阵和数据框来说，这个函数可以查看这两个对象每一列的均值、最小值、四分位数、中位数和最大值。

typeof(),mode()和class()

typeof()和mode()函数都可以用来查看对象的存储类型，但是其中有一些小区别，比如，如果对象是数值的话，前者会输出integer或double，而后者则会输出numeric。

而class()则是查看目标对象的类属性（比如经典的白马非马辩论，马指一个类，而白马指一个具体的存在），因此如果我们对矩阵和数据框使用class()函数的话，我们得到的结果就是"matrix"和"data.frame"而不是其中的变量类型。

all()和any()

这两个函数是逻辑判断函数，检验向量、矩阵以及数据框中的元素是否全部all()或者任一any()满足某个条件

> x <- 1:10
> any(x > 8)
[1] TRUE
> any(x > 100)
[1] FALSE
> all(x > 8)
[1] FALSE
> all(x > 0)
[1] TRUE

which()和subset()

which()用来筛选向量中满足一定条件的元素的位置
subset()用来筛选向量中满足一定条件的元素

> x <- 5:10
> which(x^2 < 49)
[1] 1 2 
> subset(x^2 < 49)
[1] 5 6

但是这二者和从零开始学R（三）——基本计算提到的中括号筛选的区别在于对缺失值的处理，比较下面两个案例

> x <- c(1:3, NA, 4)
> x[x > 3]
[1] NA 4
> subset(x, x > 3)
[1] 4
> which(x > 3)
[1] 4

基本的统计量

mean(x)       #均值
weighted.mean(a,wt)
              #加权均值，a是对象向量，wt是权重向量
median(x)     #中位数
sd(x)         #标准差
var(x)        #方差
sum(x)        #累加求和
prod(x)       #累乘求积
cumprod(x)    #输出每一次累乘的结果
rnorm(n, mean = x, sd = y)
#随机生成一个样本量为n，服从均值为x，标准差为y的正态分布样本
rbinom(n, x, y)
#随机生成一个样本量为n，服从次数为x，成功概率为y的二项分布样本

尽管有单独计算的命令，但是正如前文所说，例如summary()就可以计算出很多的统计量。

今天就说到这里啦

你可能感兴趣的:(数据分析)

第二十五篇 SQL优化杀手锏：用分析函数让你的查询快如闪电随缘而动，随遇而安 SQL之道——从入门到精通数据库 sql
目录一、初识分析函数：外卖骑手的一天1.1真实工作场景二、分析函数三板斧（超直观对比表）三、手把手教学：5大核心函数详解️3.1排名三剑客（班级成绩单案例）3.1.1ROW_NUMBER()：唯一学号式排名3.1.2RANK()：运动会颁奖式排名3.1.3DENSE_RANK()：电梯楼层式排名3.2时间旅行函数（股票分析案例）3.3滑动窗口函数（疫情数据分析）四、性能优化三大绝招（让老板眼前一亮
Python在股票数据分析中的应用有哪些？如何用Python获取股票数据并进行可视化财云量化 python炒股自动化量化交易程序化交易 python python股票数据分析数据获取可视化股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
Python 数据分析实战：电商平台用户行为洞察与营销策略优化萧十一郎@ python python 数据分析开发语言
目录一、案例背景二、代码实现2.1数据收集与导入2.2数据探索性分析2.3数据清洗2.4数据分析2.4.1用户行为随时间的变化2.4.2商品关联分析2.4.3用户购买转化率分析2.4.4用户价值分析（RFM模型）三、主要的代码难点解析3.1数据收集与导入3.2数据清洗-时间戳处理3.3数据分析-商品关联分析3.4数据分析-用户购买转化率分析3.5数据分析-用户价值分析（RFM模型）四、可能改进的代
用Java爬虫轻松获取微店店铺所有商品信息数据小爬虫@ java 爬虫开发语言
在当今电商蓬勃发展的时代，微店作为一个轻量级且功能强大的电商平台，吸引了众多商家和消费者。无论是进行市场调研、数据分析，还是寻找热门商品，获取微店店铺的所有商品信息都是一项极具价值的任务。然而，手动浏览和整理这些信息显然是低效且容易出错的。幸运的是，通过编写Java爬虫程序，我们可以高效地完成这一任务。本文将详细介绍如何利用Java爬虫获取微店店铺的所有商品信息。一、为什么选择Java爬虫？Jav
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案优享智库大模型数据要素数据治理数据仓库主数据零售
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案更多参考公众号：优享智库引言项目背景与意义数字化转型目标与期望实施方案概述零售行业现状及挑战实体零售行业现状数字化转型面临的挑战市场需求与趋势分析大模型与数据要素赋能策略大模型技术及应用场景数据要素采集、整合与治理赋能策略制定与实施路径数字化转型关键技术与解决方案人工智能技术及应用大数据分析与挖掘技术云计算、物联网等技术支持定制化解决方案设计
批量安装 Python 库的脚本：提高python学习效率的第一步（附源码） TAGRENLA Interesting python project python 学习开发语言
批量安装Python库批量安装Python库的脚本：提高数据分析效率的一步（附源码）批量安装脚本前提条件使用pip：Python包管理工具批量安装脚本查看当前python解释器中安装的所有的库批量安装Python库的脚本：提高数据分析效率的一步（附源码）在现代数据分析领域，Python已成为一个不可或缺的工具。为了进行数据处理、分析、可视化和建模等任务，Python社区涌现出了众多强大的库和工具。
MDX语言的设备管理穆骊瑶包罗万象 golang 开发语言后端
设备管理中的MDX语言应用引言设备管理是在各行各业中都至关重要的一环，尤其是在制造业、物流业、以及信息技术等领域。设备的正常运行直接关系到企业的生产效率和经济效益。随着信息技术的不断发展，现代企业越来越依赖数据来优化设备管理。而MDX（MultidimensionalExpressions）语言作为多维数据库查询的标准语言，能够有效支持设备管理中的数据分析和决策支持。本文将深入探讨MDX语言在设备
金融时间序列分析（Yahoo Finance API实战）闲人编程 Python数据分析实战精要金融 yfinance 时间序列波动率数据归一化数据分析 Dash
这里写目录标题金融时间序列分析（YahooFinanceAPI实战）1.引言2.项目背景与意义3.数据集介绍4.GPU加速在数据处理中的应用5.交互式GUI设计与加速处理6.系统整体架构7.数学公式与指标计算8.完整代码实现9.代码自查与BUG排查10.总结与展望金融时间序列分析（YahooFinanceAPI实战）1.引言在当今金融市场中，时间序列数据分析是理解股票、指数以及其他金融产品走势的重
Python在数据处理中的应用：从入门到精通程之编 python 信息可视化开发语言
活动发起人@小虚竹想对你说：这是一个以写作博客为目的的创作活动，旨在鼓励大学生博主们挖掘自己的创作潜能，展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴，那么，快来参加吧！我们一起发掘写作的魅力，书写出属于我们的故事。我们诚挚邀请你参加为期14天的创作挑战赛！在当今数字化时代，数据处理已成为各个领域不可或缺的一部分。无论是企业决策、科学研究还是日常的个人数据分析，掌握高效的
京准电钟推荐：智能交通系统NTP时间同步服务设计方案北京华人开创公司时钟系统 NTP时间同步卫星同步时钟 ntp 时钟同步时间同步网络授时网络校时
京准电钟推荐：智能交通系统NTP时间同步服务设计方案京准电钟推荐：智能交通系统NTP时间同步服务设计方案针对智能交通系统的NTP（NetworkTimeProtocol）时间同步方案设计，需确保交通设备（如信号灯、摄像头、传感器、服务器等）的时间高度一致，以提高系统协同效率和数据分析准确性。以下是完整的方案框架：一、需求分析同步精度核心设备（如信号控制机、边缘服务器）需达到**毫秒级（1-10ms
Python开发合并多个PDF文件互联网搬砖老肖 AI Python 原力计划 python pdf java
前言在我们的工作中，可能有以下场景需要用到合并多个PDF：文档归档：在企业或组织中，常常需要将相关的文档（如合同、报告、发票等）合并为一个PDF文件，以便于归档和管理。报告生成：在学术研究或项目管理中，研究人员或项目经理可能需要将多个研究报告、数据分析或项目进展文档合并为一个完整的报告，以便于分享和展示。电子书制作：作者或出版商在制作电子书时，可能需要将多个章节或部分合并为一个PDF文件，以便于读
使用 Python 爬取高德地图交通数据并进行数据分析（完整教程） Python爬虫项目 python 数据分析数据库 selenium 爬虫开发语言 beautifulsoup
一、引言在现代交通系统中，交通数据是进行智能交通管理、交通流量预测和交通规划的重要依据。高德地图（Amap）作为国内最权威的地理和交通信息平台之一，提供了丰富的开放API，允许开发者访问包括实时交通路况、路线规划、地理编码等各种数据。本教程将使用Python构建一个完整的爬虫程序，调用高德地图API，解析和存储交通数据，并通过数据分析和可视化深入挖掘交通流量特征。二、高德地图API简介2.1高德地
数据分析面试全攻略：项目经验篇代码CC 数据分析（包括各种面试题）数据分析面试 python
引言：为什么项目经验是数据分析面试的“敲门砖”？在数据分析岗位的面试中，项目经验是最核心的竞争力证明。HR视角：80%的面试官会通过项目细节判断候选人的真实能力技术视角：项目是数据清洗、建模分析、业务落地的综合体现误区警示：单纯罗列工具名称（如Python/SQL）≠具备实战能力本文将系统讲解如何用STAR法则包装项目、如何选择高含金量数据集、以及如何通过和鲸社区快速积累实战经验。文末提供10个可
MySQL批量数据处理与事务管理 Mr数据杨 Python 数据分析师 mysql 数据库
MySQL是一种广泛应用的关系型数据库管理系统，尤其在数据分析和业务逻辑处理方面具有重要地位。在数据量庞大的业务场景中，批量数据处理和事务管理是提高效率和保障数据一致性的重要手段。掌握高效的批量数据操作方法与事务管理技巧，不仅能够提升操作性能，还能有效降低数据处理的出错率。本教程将深入介绍MySQL数据分析中的批量数据处理与事务管理技巧，覆盖批量数据导入与更新、事务一致性与隔离级别等关键知识，帮助
数据分析：数据的存储结构、数据类型、数据集成技术、存储模型、查询语言、API、驱动器等 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介数据分析是一个复杂的工程，需要用到多个数据库、数据表、数据文件等数据集成资源。不同的数据集成环境（如分布式系统、异构数据库）会影响数据分析的效率和效果。在进行数据分析时，首先要确定数据集成方案、选择合适的数据模型和索引策略，以及评估各种解决方案之间的优劣。因此，掌握数据的存储结构、数据类型、数据集成技术、存储模型、查询语言、API、驱动器等关键信息对数据分析工作
热门AI创作助手推荐【第一期】量子星澜文心一言 AI写作 chatgpt
星游AI创作助手人工智能在现代科技中的应用非常广泛，涵盖了诸多领域，包括但不限于以下几个方面：1.语音识别和自然语言处理：人工智能技术被广泛应用于语音识别和自然语言处理领域，例如智能助手、翻译系统、语音交互系统等。2.机器学习和数据分析：人工智能的机器学习算法被用于数据分析、预测建模、用户个性化推荐等领域，帮助企业做出更准确的商业决策。3.计算机视觉：人工智能在计算机视觉领域的应用包括图像识别、视
Python 爬虫体验心得：使用 requests 与 Spider 开启数据探索之旅爱搬砖的程序猿. python 网络爬虫
一、引言在当今数字化信息爆炸的时代，互联网上蕴含着海量的数据资源。对于开发者、数据分析师等人群而言，如何高效地从网页中提取所需数据成为一项关键技能。Python凭借其丰富的第三方库和简洁易懂的语法，成为了开发网络爬虫的首选语言。其中，requests库为我们处理HTTP请求提供了便捷的方式，而Scrapy框架中的Spider则可以帮助我们构建复杂的爬虫逻辑。本文将带领大家逐步学习如何使用reque
【2025】基于springboot+vue的汽车销售试驾平台（源码、万字文档、图文修改、调试答疑）千里码aicood java spring boot vue.js 汽车
基于SpringBoot+Vue的汽车销售试驾平台通过整合前后端技术，实现了汽车销售和试驾预约的信息化和智能化。系统为管理员和用户提供了丰富的功能，提升了客户体验和销售效率，增强了数据分析能力，为汽车销售行业的发展提供了新的途径。系统功能结构如图所示：基于SpringBoot+Vue的汽车销售试驾平台研究背景随着汽车市场的竞争日益激烈，消费者在购车前对车辆的了解和试驾需求不断增加。传统的汽车销售模
Python----数据分析（Pandas四：一维数组Series的统计计算，分组和聚合）蹦蹦跳跳真可爱589 数据分析 Python pandas python 数据分析
一、统计计算1.1、count用于计算Series中非NaN（非空）值的数量。importpandasaspds=pd.Series([1,2,None,4,None])count_non_na=s.count()print(count_non_na)1.2、sumsum()函数会计算所有值的总和。Series.sum(axis=None,skipna=True,numeric_only=None
Python----数据分析（Pandas三：一维数组Series的数据操作：数据清洗，数据转换，数据排序，数据筛选，数据拼接）蹦蹦跳跳真可爱589 数据分析 Python python 数据分析 pandas
一、数据清洗1.1、dropna()删除包含NaN值的行。series.dropna(axis=0,inplace=False)描述说明axis可选参数，用于指定按哪个轴删除缺失值。对于Series对象，因为它是一维数据结构，只有一个轴，所以此参数默认值为0，且一般不需要修改这个参数（在处理DataFrame时该参数才有更多实际意义，如除，axis=1表示按列删除）。inplace可选参数，用于指
如何用Python绘制柱状图堆叠图？上官美丽技术分享 python 开发语言
在数据分析和可视化的过程中，柱状图是一种非常常用的图表类型。它能清晰地展示不同类别之间的比较。而堆叠柱状图则是在此基础上，能够展示各个部分在整体中的占比！今天，我们来聊聊如何使用Python绘制堆叠柱状图，帮助你更好地理解数据。我们将使用一个非常流行的库：Matplotlib。准备工作首先，你需要确保安装了Matplotlib库。如果还没有安装，可以通过以下命令来安装：pipinstallmatp
TK矩阵：提高多账号管理效率的利器 m0_74891046 矩阵
随着TikTok的火爆，越来越多的人开始利用这个平台进行内容创作和社交互动。无论是个人创作者、品牌方，还是营销公司，TikTok都提供了巨大的机会，但同时也带来了运营上的挑战，尤其是在管理多个账户时。每个账号的维护、内容发布、互动和数据分析，都需要耗费大量的时间和精力。TK矩阵是为了应对这些挑战而推出的一款工具，它为需要操作多个TikTok账号的用户提供了一种更高效、更安全的管理方式。基于云技术和
Python3 【项目实战】深度解析：赛跑成绩统计分析工具李智 - 重庆 Python 精讲精练 -从入门到实战 python 案例学习编程技巧时间处理项目实战
Python3【项目实战】深度解析：赛跑成绩统计分析工具一、项目概述1.开发背景：田径比赛的成绩统计需要快速准确的计算选手成绩，传统人工计时和统计效率低且易出错。本工具通过程序化处理赛跑数据，自动计算各选手成绩及整体统计指标，主要应用于：学校运动会成绩实时统计田径锦标赛的自动化成绩公示运动员训练数据分析2.技术定位：时间数据处理与统计计算的典型案例字典数据结构的实践应用面向过程编程的教学范例二、项
智慧运维与物联网技术在地铁车辆段的应用项目罗博深
本文还有配套的精品资源，点击获取简介：随着物联网技术的广泛应用，智慧运维系统通过传感器、大数据分析、云计算等技术集成，提升了地铁车辆段的运维效率和安全性。该系统可以实时监控设备状态、预测故障、提供智能决策支持、优化维护策略，并降低运营成本，同时提高乘客安全。其应用拓展至整个地铁线路，乃至与城市交通系统协同，展现了智慧运维对公共交通系统现代化的贡献。1.物联网技术基础与应用物联网（Interneto
毕业论文如何进行自查？ kexiaoya2013 论文笔记论文阅读 AIGC
又到了一年的毕业季，论文提交也进入了倒计时。不少同学在最后关头才发现论文存在各种问题。与其事后补救，还不如提前进行论文自查。一、内容自查1、核心要素是否完整检查论文标题是否简洁明确，摘要是否概括了研究目的、方法、结论，关键词是否精准覆盖了主题。2、逻辑是否清晰连贯从引言到结论，需层层递进。引言需说明研究背景与意义，主体章节需有明确的研究方法、数据分析和讨论，结论应总结成果并提出展望，避免与正文内容
MySQL数据库笔记艽掵猫数据库 mysql 笔记
一、数据库基础概念1.数据库定义数据库：统一管理、长期存储、有组织的相关数据集合。特征：数据按模型组织（冗余小、独立性高、易扩展、可共享）。2.实际应用数据存储：高效管理大量结构化数据。数据管理：增删改查（CRUD）与权限控制。数据分析：整合数据源，支持决策。3.常见数据库系统数据库特点MySQL开源、高性能、易用，适用于Web应用。Oracle企业级、高可靠，支持大型应用。SQLServer微软
深入解析LTE-A到5G的系统消息架构与功能演进罗博深
本文还有配套的精品资源，点击获取简介：系统消息是移动通信网络中，UE与网络间信息交换的核心，涵盖了网络状态、服务信息与系统配置。文章深入分析了4GLTE-A到5G网络中系统消息的组成、作用及其演进，包括MIB和SIBs的功能与内容，以及5G对系统消息的优化和新技术的引入，如动态调度、网络切片和针对物联网设备的特定参数配置。5G系统消息还通过机器学习和大数据分析实现智能化分发，增强了网络灵活性、智能
23章9节：分层随机抽样及其在R语言中的实现与验证 DAT｜R科学与人工智能用R探索医药数据科学 r语言开发语言 r-4.2.1 机器学习人工智能算法
在统计学和数据科学的实际工作中，抽样方法始终扮演着至关重要的角色。如何从庞大的总体中获取具有代表性的样本，一直是数据分析过程中需要面对的核心问题之一。分层随机抽样作为一种常用的抽样方法，因其能够针对总体中的不同亚群体（层）进行有针对性的抽样，从而提高样本代表性、降低抽样误差，被广泛应用于社会调查、市场研究、医学试验等各个领域。本文旨在系统地阐述分层随机抽样的理论基础、抽样方法及其在R语言中的实现，
房产租赁数据分析与可视化学习只是用户态数据分析信息可视化数据挖掘
【实训目的】通过本次实训，要求了解Python用于数据可视化的常用包：matplotlib、seaborn、pyecharts等基本使用，及各种图形的使用。【实训环境】 Jupyter环境、Pandas、NumPy、Matplotlib。【实训内容】 1.数据统计与分析方面的可视化； 2.数据分析与预测方面的可视化； 3.数据多类型的可视化。本次实验以温州市三区房屋租赁数据（res
机器学习算法实战——天气数据分析（主页有源码）喵了个AI 机器学习实战机器学习算法数据分析
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.引言天气数据分析是气象学和数据科学交叉领域的一个重要研究方向。随着大数据技术的发展，气象数据的采集、存储和分析能力得到了显著提升。机器学习算法在天气数据分析中的应用，不仅能够提高天气预报的准确性，还能为气候研究、灾害预警等提供有力支持。本文将介绍机器学习在天气数据分析中的应用，探讨
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他