装不满的克莱因瓶

R语言入门看这一章就够了（上）

目录

一、R的基础

1.1、R的安装

1.2、牛刀小试

1.3、线性关系实例

1.4、工作空间

1.5、R包的使用

包的安装

结果的重用

二、R数据集

2.1、向量

2.2、矩阵

2.3、数组

2.4、数据框

2.5、列表

三、R的常用命令

四、list列表详解

五、数据源导入方法

5.1、键盘输入

5.2、从文本文件导入

5.3、导入Excel数据

六、访问MYSQL数据库

一、R的基础

1.1、R的安装

提示：想要R语言和RStudio安装包的私信我。

第一步：双击安装包

第二步：一直下一步，选择安装路径

这里最好不要放到C盘，也不要有中文路径，空格路径。

第三步：一直无脑下一步，等待安装即可

第四步：双击桌面R图标

1.2、牛刀小试

我们来编写一段代码：

x <- rnorm(3)
x

第一句代码表示随机生成3个数字赋值给变量x。

第二句代码表示获取变量x。

1.3、线性关系实例

> age <- c(1,3,5,2,11,9,3,9,12,3)   # 年龄数据集
> weight <- c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2,6.1)  # 体重数据集
> 
> mean(weight) # 体重平均数
[1] 7.06
> sd(weight) # 体重标准差
[1] 2.077498
> cor(age,weight) # 年龄和体重的线性关系
[1] 0.9075655
> plot(age,weight) # 画图表示关系
>

1.4、工作空间

就是代码和文档都放在哪个目录下了，最好一个项目一个工作空间。

> getwd() # 获取你所在的工作空间
[1] "C:/Users/DELL/Documents"

如果你不喜欢这个目录，你可以通过setwd("c:/Users/')去修改。

1.5、R包的使用

R自带了一系列默认包（包括base、datasets、graphics、methods等等），它们提供了种类繁多的默认函数和数据集。

包的安装

比如我想安装名为car的包，使用如下命令：

install.packages("car")

这时他会提示你使用哪个镜像来下载，我们当然要选国内的镜像了，这样下载速度会快。

下载完需要把car包绑定到我们的环境下：

library(car)

我们输入一行命令测试一下：

> head(mtcars)

出现这个结果就代表安装car包成功了。

结果的重用

R语言的结果可以很好的保存，并且可以作为下一次使用的参数传进去。

比如：

> result <- lm(mpg~wt, data=mtcars) # 做线性拟合
> plot(result)

二、R数据集

按照某种格式来创建数据集，是任何数据分析的第一步。

（1）选择一种数据结构来存储。

（2）将数据输入或导入到这个数据结构中。

R拥有许多用于存储数据的对象类型，包括向量、矩阵、数组、数据框和列表。

2.1、向量

其实就是一个一维数组，而且里面的元素必须是相同类型的。

比如：

> a <- c(1,2,3,4,5,6)  # 创建一个向量数据集，里面都是相同类型的
> a
[1] 1 2 3 4 5 6
> 
> a[2]  # 通过下标取出相应的元素
[1] 2
> a[5]
[1] 5
>

2.2、矩阵

是二维数据，并且元素类型必须一致。

比如：

> y <- matrix(5:24, nrow=4, ncol=5)  #创建5-24位数字，4行5列的矩阵数据集
> y
     [,1] [,2] [,3] [,4] [,5]
[1,]    5    9   13   17   21
[2,]    6   10   14   18   22
[3,]    7   11   15   19   23
[4,]    8   12   16   20   24
>

> x <- c(2,45,68,94)
> rnames <- c("R1","R2") # 创建矩阵行名
> cnames <- c("C1","C2") # 创建矩阵列名
> newMatrix <- matrix(x, nrow=2, ncol=2, byrow=TRUE, dimnames=list(rnames,cnames))
> newMatrix
   C1 C2
R1  2 45
R2 68 94
>

2.3、数组

与矩阵相似，但它的维度是大于2的。

比如：

> dim1 <- c("A1","A2","A3")
> dim2 <- c("B1","B2")
> dim3 <- c("C1","C2","C3","C4")
> d <- array(1:24, c(3,2,4), dimnames=list(dim1,dim2,dim3)) # 生成4个矩阵，每一个都是3*2的格式
> d
, , C1

   B1 B2
A1  1  4
A2  2  5
A3  3  6

, , C2

   B1 B2
A1  7 10
A2  8 11
A3  9 12

, , C3

   B1 B2
A1 13 16
A2 14 17
A3 15 18

, , C4

   B1 B2
A1 19 22
A2 20 23
A3 21 24

>

获取数组里的元素：

> d[1,2,3]  # 取第3个矩阵里的第1行，第二列的数据
[1] 16
>

2.4、数据框

数据框中，可以存在不同类型的数据，比如下面的列表：

病人编号、入院时间、年龄都是数值类型的，后面糖尿病类型和病情都是字符串类型。

比如：

> patientID <- c(1,2,3,4) # 创建病人编号（第一列数据）
> age <- c(25,34,28,52) # 创建年龄（第二列数据）
> diabetes <- c("Type1", "Type2", "Type3", "Type2") # 创建糖尿病类型（第三列数据）
> status <- c("poor", "Improved", "Excllent", "poor") # 创建病情（第四列数据）
> patientsData <- data.frame(patientID, age, diabetes, status) # 创建数据框数据集
> patientsData # 打印
  patientID age diabetes   status
1         1  25    Type1     poor
2         2  34    Type2 Improved
3         3  28    Type3 Excllent
4         4  52    Type2     poor
> 
> patientsData[1:2] # 获取patientsData变量的第一列到第二列数据
  patientID age
1         1  25
2         2  34
3         3  28
4         4  52
> 
> patientsData[c("age")] # 获取patientsData变量的age那列数据
  age
1  25
2  34
3  28
4  52
> 
> patientsData$age # 获取patientsData变量的age那列数据
[1] 25 34 28 52
> 
> attach(patientsData) # 将变量绑定，以后就可以直接使用列名打印了，就不用$符号了
The following objects are masked _by_ .GlobalEnv:

    age, diabetes, patientID, status

> age
[1] 25 34 28 52
>

2.5、列表

创建列表：

> g <- "My first list"  # 创建字符串
> h <- c(12, 45, 43, 90) #创建向量数据集，里面是数值类型
> j <- matrix(1:10, nrow=2) # 创建矩阵数据集，1-10，两行
> k <- c("A", "B", "C") # 创建向量数据集，里面是字符串类型
> mylist <- list(g, h, j, k) # 创建列表数据集
> mylist
[[1]]
[1] "My first list"

[[2]]
[1] 12 45 43 90

[[3]]
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    3    5    7    9
[2,]    2    4    6    8   10

[[4]]
[1] "A" "B" "C"

> 
> mylist[[2]]  # 获取列表里第二个元素
[1] 12 45 43 90
> 
> mylist[[3]]  # 获取列表里第三个元素
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    3    5    7    9
[2,]    2    4    6    8   10
>

三、R的常用命令

（1）查询所有的变量

ls()

> ls()
character(0)
> data <- c(1,2,3)
> ls()
[1] "data"

（2）移除某个变量

rm(变量名)

> rm(data)
> ls()
character(0)

（3）获取向量长度

length(变量名)

> v <- c(1, 2, 3)
> length(v)
[1] 3

（4）获取变量所属类型

mode(变量名)

> v <- c(1, 2, 3)
> mode(v)
[1] "numeric"

（5）各种方式形成向量

seq(1, 10, 2)  # 生成一个从1开始到10结束，步长为2的向量

> x <- seq(1, 10, 2)
> x
[1] 1 3 5 7 9

rep(5, 10)  # 生成10个5的向量

> x <- rep(5, 10)
> x
 [1] 5 5 5 5 5 5 5 5 5 5

> x <- rep(1:3, 3)
> x
[1] 1 2 3 1 2 3 1 2 3

> x <- c(1, 20, 50, -5, -35, -80)
> x
[1]   1  20  50  -5 -35 -80
> x[x > 0]  # 获取大于0的向量
[1]  1 20 50
> x[x < -10 | x > 0]  # 获取小于-10或者大于0的向量
[1]   1  20  50 -35 -80
>

四、list列表详解

> mylist <- list(stud.id=1234, stud.name="Tom", stud.marks=c(12, 3, 14, 25, 19))  # 创建一个列表
> mylist  # 打印列表
$stud.id
[1] 1234

$stud.name
[1] "Tom"

$stud.marks
[1] 12  3 14 25 19

> mylist[[1]]  # 获取列表mylist的第一个元素值
[1] 1234
> mylist[[3]]  # 获取列表mylist的第三个元素值
[1] 12  3 14 25 19
> mylist[1]  # 获取列表mylist的第一个整元素值
$stud.id
[1] 1234

> mode(mylist[[1]])  # 获取列表mylist第一个元素的类型
[1] "numeric"
> mode(mylist[1])  # 获取列表mylist第一个整元素的类型
[1] "list"
> mylist$stud.id  # 和mylist[[1]]同理
[1] 1234
> names(mylist)  # 获取列表mylist的所有元素名
[1] "stud.id"    "stud.name"  "stud.marks"
> names(mylist) <- c("id", "name", "marks")  # 列表mylist里的元素改名
> mylist
$id
[1] 1234

$name
[1] "Tom"

$marks
[1] 12  3 14 25 19

> mylist$parents <- c("Mna", "Jutice")  # 为列表mylist增加新元素parents
> mylist
$id
[1] 1234

$name
[1] "Tom"

$marks
[1] 12  3 14 25 19

$parents
[1] "Mna"    "Jutice"

> mylist <- mylist[-4]  # 列表mylist删除第四个元素
> mylist
$id
[1] 1234

$name
[1] "Tom"

$marks
[1] 12  3 14 25 19

> other <- list(age=19, sex="male")  # 创建列表赋值给other变量
> lst <- c(mylist, other)  # 将列表mylist和列表other合并成一个列表赋值给lst
> lst
$id
[1] 1234

$name
[1] "Tom"

$marks
[1] 12  3 14 25 19

$age
[1] 19

$sex
[1] "male"

> unlist(lst)  # 将列表转为向量形式，方便循环遍历
    id   name marks1 marks2 marks3 marks4 marks5    age    sex 
"1234"  "Tom"   "12"    "3"   "14"   "25"   "19"   "19" "male"

解释一下unlist()函数：

比如向量我们很容易遍历，就是从1遍历到100，但是list的元素是可以多类型的，比如说list列表中第一个元素是向量，向量里又有1,2,3,4,5元素，那list列表第二个元素是矩阵，矩阵又包含二维数据，那么我们遍历就很麻烦，所以使用unlist函数先转为向量模式，再遍历就方便多了。

五、数据源导入方法

5.1、键盘输入

> mydata <- data.frame(age=numeric(0), gender=character(0), weight=numeric(0))  # 创建数据框，但里面元素只是定义了名字和类型，却没有数据
> mydata <- edit(mydata)  # edit的意思是我们要手动键盘录入数据

fix(mydata)和mydata <- edit(mydata)是等价的。

5.2、从文本文件导入

先看看数据，是一个叫person.txt的文件，内容是：

id,name,age,school
1,李白,20,哈尔滨工业大学
2,杜甫,30,哈尔滨工程大学
3,白居易,19,哈尔滨理工大学
4,杜牧,23,东北林业大学
5,李清照,27,东北农业大学

> mydata <- read.table("D:/Java/R/resources/person.txt", header=TRUE, sep=",", encoding="UTF-8")
> mydata
  id   name age         school
1  1   李白  20 哈尔滨工业大学
2  2   杜甫  30 哈尔滨工程大学
3  3 白居易  19 哈尔滨理工大学
4  4   杜牧  23   东北林业大学
5  5 李清照  27   东北农业大学

5.3、导入Excel数据

这个不能直接用read.table去读取Excel文件，得先把我们的Excel文件先另存为csv格式，这样就可以读取了。

我们的数据是这样的：

> mydata <- read.table("D:/Java/R/resources/student.csv", header=TRUE, sep=",", encoding="UTF-8")
> mydata
  ID   姓名 年龄         学校
1  1   李白   20     南京大学
2  2   杜甫   30     东南大学
3  3 白居易   40 南京理工大学

六、访问MYSQL数据库

install.packages("RODBC")

你可能感兴趣的:(数据分析,r语言,开发语言,1024程序员节,数据分析)

多查询分析中的并发处理实践 FADxafs python
在进行查询分析时，某些技术可能会生成多个查询。在这种情况下，我们需要记得执行所有查询并合并结果。本文将通过一个简单的示例（使用模拟数据）展示如何实现这一点。技术背景介绍在数据分析和信息检索领域，查询分析技术能够帮助我们生成和优化查询以提高搜索效率。然而，当同时生成多个查询时，处理这些查询并有效地合并结果就显得尤为重要。本次我们将使用langchain库来演示如何处理多查询情况。核心原理解析通过生成
Elixir语言的软件工程十二日后包罗万象 golang 开发语言后端
Elixir语言的软件工程引言在当今的软件工程领域，选择编程语言和技术栈是一个至关重要的决策。随着分布式系统、实时应用和高并发场景的需求日益增加，Elixir语言应运而生。Elixir是一种基于Erlang虚拟机（BEAM）的编程语言，兼具了Erlang的并发特性和灵活性，同时增加了现代编程语言的一些优雅和简洁的特性。本文将深入探讨Elixir语言在软件工程中的应用，包括其核心特性、生态系统、最佳
PHP语言的编程范式代码驿站520 包罗万象 golang 开发语言后端
PHP语言的编程范式引言PHP（PHP:HypertextPreprocessor）是一种广泛使用的开源脚本语言，特别适合于Web开发。虽然最初被设计用于生成动态网页，但随着技术的发展，PHP已逐渐演化为一种功能强大的编程语言，广泛应用于服务器端编程、命令行脚本以及桌面应用程序的开发。目前，PHP的应用范围涵盖了网站开发、数据分析、内容管理系统等多个领域。本文将深入探讨PHP语言的编程范式，包括面
Python气象数据分析：风速预报订正、台风预报数据智能订正、机器学习预测风电场的风功率、浅水模型、预测ENSO等小艳加油大气科学 python 人工智能气象机器学习
目录专题一Python和科学计算基础专题二机器学习和深度学习基础理论和实操专题三气象领域中的机器学习应用实例专题四气象领域中的深度学习应用实例更多应用Python是功能强大、免费、开源，实现面向对象的编程语言，在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能，这些优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Py
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点岑童嵘
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点【下载地址】泰坦尼克号生存分类数据集本仓库提供了一个经典的机器学习数据集——泰坦尼克号生存分类数据集。该数据集包含两个CSV文件：训练集和测试集。数据集主要用于训练和评估机器学习模型，以预测泰坦尼克号乘客的生存情况项目地址:https://gitcode.com/open-source-toolkit/35561项目介绍泰坦尼克号生存分类数
【Python】Tkinter电器销售有限公司销售数据分析（源码）【独一无二】不争不抢不显不露 python 数据分析开发语言
一、设计要求该项目创建一个数据分析软件，利用Tkinter和Matplotlib构建图形用户界面（GUI），读取和分析美迪电器销售有限公司销售数据。用户可以通过界面选择月份查看数据详情、生成销量图表并计算月总销量和年总销量。二、设计思路2.模块引入首先引入了所需的模块，包括Tkinter（用于GUI创建和管理）、ttk（Tkinter主题化控件）、messagebox（用于弹出消息框）、panda
基于R语言的DICE模型实践技术应用；评估气候变化对经济的影响以及不同减排政策的经济成本和效益 KY_chenzhao DICE模型 R语言气候变化
DICE模型是一个动态综合气候经济模型，由诺贝尔经济学奖得主WilliamNordhaus开发，用于评估气候变化对经济的影响以及不同减排政策的经济成本和效益。以下是一个关于DICE模型在气候变化影响评估中的实际应用案例，结合R语言代码进行讲解。实际案例：评估全球碳税政策的影响假设我们要评估一项全球碳税政策对经济增长、碳排放和气候变化的影响。我们将使用DICE模型的基本框架来进行分析。模型构建经济部
MDX语言的数据类型 BinaryBardC 包罗万象 golang 开发语言后端
MDX语言的数据类型详解引言MDX（多维表达式）是一种用于查询和操作多维数据集的查询语言，广泛用于数据分析和商业智能领域。MDX语言的设计旨在帮助用户高效地从多维数据库（如MicrosoftSQLServerAnalysisServices）中提取和分析数据。随着数据量的不断增加和数据结构的日益复杂，MDX提供了一种强大的方式来处理和分析这些多维数据。在MDX中，数据类型是理解和使用该语言的基础，
R语言的软件工程 BinaryBardC 包罗万象 golang 开发语言后端
R语言的软件工程1.引言随着数据科学的快速发展，R语言作为一种统计计算和图形绘制的编程语言，其在数据分析、可视化以及机器学习等领域的应用日益广泛。尽管R语言在数据处理上有其独特的优势，但要将其运用于大型项目和商业应用中，就需要遵循软件工程的原则。本篇文章将探讨R语言在软件工程中的应用，主要涵盖软件开发生命周期、代码规范、版本控制、测试和文档等方面。2.软件开发生命周期软件开发生命周期（SDLC）是
StarRocks Awards 2024 年度贡献人物开源
在过去一年，StarRocks在Lakehouse与AI等关键领域取得了显著进步，其卓越的产品功能极大地简化和提升了数据分析的效率，使得"OneData，AllAnalytics"的愿景变得更加触手可及。虽然实现这一目标的道路充满挑战且漫长，但我们并不孤单，因为有一群社区伙伴与我们并肩作战。每一位贡献者的代码提交和每一次的布道，都在推动着StarRocks社区向前发展。为了表达对这些贡献者的深深感
基于JAVA水果商城设计计算机毕业设计源码+数据库+lw文档+系统+部署柳下网络 java 开发语言 jvm
基于JAVA水果商城设计计算机毕业设计源码+数据库+lw文档+系统+部署基于JAVA水果商城设计计算机毕业设计源码+数据库+lw文档+系统+部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5.7/8.0源码地址：https
StarRocks on AWS Graviton3，实现 50% 以上性价比提升大数据数据库数据湖云计算云服务
在数据时代，企业拥有前所未有的大量数据资产，但如何从海量数据中发掘价值成为挑战。数据分析凭借强大的分析能力，可从不同维度挖掘数据中蕴含的见解和规律，为企业战略决策提供依据。数据分析在营销、风险管控、产品优化等领域发挥着关键作用,帮助企业提高运营效率、优化业务流程、发现新商机、增强竞争力。低成本高效率的完成对海量数据的分析，及时准确的释放数据价值，已成为企业赢得竞争优势的利器。StarRockson
对于编程零基础，第一个语言是 Python 的人有什么建议？ cda2024 python 开发语言
在当今数字化时代，编程已成为一项必备技能。无论你是想成为一名专业的软件开发人员，还是希望在数据分析、人工智能等领域有所建树，掌握一门编程语言都是至关重要的第一步。对于许多初学者来说，Python是一个理想的选择。它不仅语法简洁易懂，而且拥有强大的社区支持和丰富的库资源。那么，对于编程零基础且选择Python作为第一门语言的人，有哪些实用的建议呢？1.建立正确的学习心态1.1持之以恒学习编程并不是一
chatgpt赋能python：用Python安装Jupyter：让数据科学变得更加高效！ aijinglingchat ChatGpt python chatgpt jupyter 计算机
用Python安装Jupyter：让数据科学变得更加高效！对于数据科学家而言，jupyter是不可或缺的工具之一。它是一个基于web的交互式计算环境，可以帮助我们在Python中以一种轻松、方便、可交互的方式进行编程和数据分析。今天，我们将向您介绍在Python中如何安装jupyter。安装Python要安装jupyter，首先需要安装Python。如果您已经安装了Python，请跳到下一步。您可
Kylin入门教程 -龙川- 介绍学习笔记 kylin
引言ApacheKylin是一个开源的分布式分析引擎，提供Hadoop上的多维分析（OLAP）能力，使得超大规模数据集的实时查询和分析成为可能。它通过预计算数据立方体来加速查询，使得复杂查询可以在亚秒级响应。本文将详细介绍Kylin的基本概念、安装与配置、基本操作及高级功能，帮助你全面掌握这款强大的数据分析工具。第一部分：Kylin简介1.1什么是Kylin？Kylin是由eBay开发并捐赠给Ap
实战指南：使用Wireshark捕获并解密HTTPS数据包 md_1008 wireshark https 测试工具
在网络安全和数据分析领域，捕获和分析网络数据包是理解网络行为、诊断问题和进行安全审计的重要手段。HTTPS（HyperTextTransferProtocolSecure）作为现代Web通信的主要协议，通过SSL/TLS加密确保了数据的安全传输。然而，在某些情况下，如网络调试、安全测试或故障排除时，我们可能需要解密HTTPS数据包以查看其详细内容。本文将提供一份实战指南，教你如何使用Wiresha
AI赋能人力资源：效率提升新路径前端
引言人工智能(AI)正以前所未有的速度改变着各行各业，从自动驾驶到医疗诊断，AI的应用日益广泛。而人力资源领域，作为企业运营的核心环节，也正经历着AI带来的深刻变革。传统的人力资源管理面临诸多挑战，例如招聘效率低、候选人筛选精准度不足、员工培训成本高昂以及数据分析能力有限等。这些问题不仅影响企业的招聘速度和效率，也制约了企业的发展。为了应对这些挑战，越来越多的企业开始探索AI技术在人力资源领域的应
云原生周刊：K8s 生产环境架构设计及成本分析云计算
开源项目推荐KubeZoneNetKubeZoneNet旨在帮助监控和优化Kubernetes集群中的跨可用区（Cross-Zone）网络流量。这个项目提供了一种简便的方式来跟踪和分析Kubernetes集群中跨不同可用区的通信，帮助用户优化集群的网络架构、提高资源利用效率并减少网络延迟。通过实时监控和数据分析，KubeZoneNet能有效地识别跨可用区的网络瓶颈，并提供改进建议，以支持Kuber
【一点分享】Python数据分析（1）：Jupyterlab搭建，练习Python和Sql的神器。或许能用上 Python python sql mysql
在之前Mysql专栏分享过程中，一直用的Sequel客户端进行sql编写和说明注解，及时执行的结果不能保存，得写一条sql截图一次，麻烦。而Jupyterlab就可以很好解决这个问题，代码过程与执行结果都会相邻挨着保留，随时可以查看，导出或截图都非常方便。而且，Jupyterlab还天然支持Python环境，学Python甚是方便，单步执行和结果就是亮点。其他的shell等各种语言环境也可以安装插
如何抓取社交媒体上的公开用户信息：完整的Python爬虫教程与实战 Python爬虫项目媒体 python 爬虫 selenium 开发语言 ajax
引言社交媒体平台如Twitter、Instagram、Facebook和LinkedIn等，成为了现代社会中获取信息、表达观点、社交互动的主要场所。通过社交媒体，用户分享个人信息、兴趣、活动以及与他人的互动数据，极大地丰富了网络世界的内容。在数据分析、市场研究、舆情监控等领域，抓取社交媒体上的公开用户信息是非常重要的任务。对于很多数据科学家、市场分析师、爬虫开发者来说，如何高效地抓取社交媒体平台的
基于Python的股市数据爬取与分析：从实时行情到历史数据的完整教程 Python爬虫项目 2025年爬虫实战项目 python 数据挖掘开发语言爬虫 oracle 人工智能
引言股市投资是一项具有高度风险和回报的活动，实时行情和历史数据的获取是股市分析和决策的基础。随着数据科学和爬虫技术的迅速发展，许多投资者和分析师通过编写Python爬虫来获取股市数据，进行数据分析、技术分析和预测。无论是获取实时股市行情，还是分析股票的历史数据，Python都能为我们提供强大的工具支持。本篇博客将为你提供一个完整的股市数据爬取与分析教程，介绍如何利用Python爬虫获取实时股市行情
python爬虫短视频平台数据抓取：抓取视频和评论 Python爬虫项目 2025年爬虫实战项目 python 爬虫音视频网络爬虫开发语言
随着短视频平台如抖音、快手、TikTok等的兴起，越来越多的内容创作者和观众通过短视频平台分享和观看视频内容。短视频平台包含了丰富的数据，如视频内容、评论、点赞数、分享数等，这些数据对市场分析、用户行为分析、视频推荐算法等方面具有重要意义。抓取这些数据可以帮助我们获取平台的动态信息，为数据分析提供基础。本文将详细介绍如何使用Python编写爬虫抓取短视频平台上的视频和评论数据，包括技术栈选择、爬虫
minio免费文件管理器（windows版本），若依RuoYi-Vue-Plus框架使用，有需要的可以下载，因为官网下载特别慢程序员WANG 工具 windows vue.js 容器
MinIO是一款开源的对象存储系统，它提供类似AmazonS3的云存储服务，适用于各种规模的企业。MinIO设计为高性能、安全且易于使用，适合存储大量的非结构化数据，如图片、文档、视频以及大数据分析中的日志文件等。在本案例中，我们关注的是Windows版本的MinIO，它被集成到了若依RuoYi-Vue-Plus框架中，以实现文件管理功能。若依RuoYi-Vue-Plus是一个基于Vue.js的现
一个.NET开源、性能优异的Excel数据读取库 dotNET跨平台 excel
项目介绍Sylvan.Data.Excel是一个开源、免费、跨平台的.NET库，专注于读取和写入Excel数据文件。支持多种文件格式，并提供高效的数据访问和数据绑定功能。该库在.NET生态系统中是读取Excel数据文件的最快且内存分配最低的库之一。使用场景适用于需要从Excel文件中读取数据并进行进一步处理（如数据分析、报告生成等）的应用程序。适用于需要将数据从数据库或其他数据源导出到Excel文
SQL数据分析（简单版）编程星空扩展知识 sql 数据库
一、常见数据库分类（1）关系型数据库采用关系模型组织数据的数据库，以行和列的形式存储数据，形成数据表，一组数据表组成了数据库（2）非关系型数据库非关系型数据库在严格意义上不是一种数据库，应该是一种数据结构化存储方法的集合，可以是文档或者键值对等。二、数据库常用功能（1）表数据表是数据库中存储数据的基本组成单位，例如用户信息表、订单表、采购表等。（2）查询查询是数据库中应用最多的对象之一，最常用的功
水位监测系统|远程水位监测|水位自动监测 Susie酱科技自动驾驶物联网
计讯物联水位监测系统，远程自动化全方位实时监控。监测点部署包括：目标因子采集传感器及仪器仪表、无线采集通信终端-水利RTU、数据实时采集自动上报，管理人员可通过监控中心平台远程监控，动态掌握监测点水位信息，数据分析处理，为政策规划提供决策依据，异常数据告警提示避免水生态灾害。远程水位自动监测系统组成感知层：水位计、雨量计、流量计、工业摄像头、(水质检测仪)网络传输层：计讯物联水利RTU遥测终端应用
Pandas数据预处理——drop_duplicates()函数 Vous oublie@ python学习数据分析 python pandas 数据分析
Pandas是一个强大的数据分析工具，可以用于数据预处理、数据清洗、数据分析和可视化等多个领域。在数据预处理中，数据去重是非常重要的一个步骤。Pandas提供了drop_duplicates()函数来实现数据去重，可以根据指定的列或行进行去重操作。下面是使用drop_duplicates()函数实现数据去重的示例代码：importpandasaspd#读取csv文件df=pd.read_csv('
《数据关联的艺术：揭开MySQL与图数据库结合的高级可视化探索》墨夶数据库学习资料2 数据库 mysql
在这个信息爆炸的时代，企业和研究者们面临着从海量数据中挖掘有价值信息的巨大挑战。传统的关系型数据库如MySQL虽然擅长处理结构化数据，但在面对复杂的关系网络时显得力不从心。而图数据库以其独特的架构优势，能够高效地表示和查询实体之间的多层关系。当我们将这两种技术结合起来，并辅以强大的可视化工具时，便开启了一扇通往更深层次数据分析的大门。本文将深入探讨如何通过MySQL与图数据库的结合来实现高级可视化
Prometheus Alertmanager设置与告警规则配置详解范范0825 prometheus
PrometheusAlertmanager设置与告警规则配置详解Prometheus是一个开源的监控和告警系统，其设计理念是通过时间序列数据库存储指标数据，并通过多维数据模型和查询语言进行数据分析。Prometheus的告警系统由两部分组成：Prometheus服务器本身和Alertmanager。Alertmanager负责接收来自Prometheus的告警，执行通知的分发、抑制和聚合。本文将
Redis学习：从基础到应用的全面探索来恩1003 Redis redis 学习数据库
Redis学习资料Redis学习资料Redis学习资料在当今数字化时代，数据处理与存储的效率成为众多应用的关键所在。Redis作为一款高性能的内存数据库，凭借其独特的优势，在众多领域发挥着不可或缺的作用。无论是高并发的Web应用、实时数据分析，还是缓存机制的构建，Redis都展现出了卓越的性能。下面将为你详细介绍Redis的学习路径，助你从入门走向精通。一、Redis初相识：基础概念与安装Redi
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他