R语言学堂

《Advanced R》学习笔记 | Chapter3 Vectors

专注系列化、高质量的R语言教程

推文索引 | 联系小编 | 付费合集

本篇推文是学堂君学习第3章“Vectors”的笔记，原文链接是https://adv-r.hadley.nz/vectors-chap.html，可在文末“阅读原文”处直达。

通过本章的学习，我们可以更清晰地理解R语言中各种数据结构之间的关系。

3.1 Introduction
3.2 Atomic vectors
- 3.2.1 Scalars
- 3.2.2 Making longer vectors with c()
- 3.2.3 Missing values
- 3.2.4 Testing and coercion
3.3 Attributes
- 3.3.1 Getting and setting
- 3.3.2 Names
- 3.3.3 Dimensions
3.4 S3 atomic vectors
- 3.4.1 Factors
- 3.4.2 Dates
- 3.4.3 Date-times
- 3.4.4 Durations
3.5 Lists
- 3.5.1 Creating
- 3.5.3 Matrices and arrays
3.6 Data frames and tibbles
- 3.6.1 Creating
- 3.6.2 Row names
- 3.6.4 Subsetting
- 3.6.6 List columns
- 3.6.7 Matrix and data frame columns
3.7 NULL

3.1 Introduction

测试：如果读者能准确回答如下几个问题，就可以跳过本章的学习。

What are the four common types of atomic vectors? What are the two rare types?
What are attributes? How do you get them and set them?
How is a list different from an atomic vector? How is a matrix different from a data frame?
Can you have a list that is a matrix? Can a data frame have a column that is a matrix?
How do tibbles behave differently from data frames?

（答案见原文本章节末尾处。）

3.2 Atomic vectors

常见的4个原子向量类型是：逻辑类型、整型、双精度类型和文本类型（元素为字符串），整型和双精度合称数值型。

两种不常见的类型是复数型和原始型；复数在统计学中很少使用，原始型仅在处理二进制数据时使用，本章不会进一步讨论这两种类型。

《Advanced R》学习笔记 | Chapter3 Vectors_第1张图片

学堂相关推文：R语言的原子类型和数据结构

3.2.1 Scalars

标度（scalar）可以用来指示元素的类型：

逻辑值只有两个：TRUE和FALSE，分别简写为T和F；
双精度值的形式可以小数点（0.1234）、科学计数法（1.23e4）或十六进制（0xcafe）；此外还有三个特殊值：Inf、-Inf、NaN；
整型的值是整数，也可以是科学计数法和十六进制，为了区别双精度值，数字后面要加上字母L（1234L、1e4L、0xcafeL）；整型中不能包含分式；
文本的标志是其两侧的双引号"或单引号'。

3.2.2 Making longer vectors with c()

c()函数的名称是combine的缩写，通过合并单值或向量来创建更长的向量；多个原子向量使用c()函数合并后还是原子向量。

c(c(1, 2), c(3, 4))
## [1] 1 2 3 4

typeof()函数用来查看向量类型，length()函数用来查看向量长度。

3.2.3 Missing values

NA（“not applicable”的缩写）表示缺失值或未知值。通常情况下，NA参与大小比较或计算，得到的结果也是NA：

NA > 5
## [1] NA
10 * NA
## [1] NA
!NA
## [1] NA

也有例外：

NA ^ 0
## [1] 1
NA | TRUE
## [1] TRUE
NA & FALSE
## [1] FALSE

无法通过x == NA的形式判断变量的元素是否为NA：

x <- c(NA, 5, NA, 10)
x == NA
## [1] NA NA NA NA

正确方法是使用is.na()函数：

is.na(x)
## [1]  TRUE FALSE  TRUE FALSE

在技术层面缺失值存在4种类型的：NA（逻辑型）、NA_integer_（整型）、NA_real_ （双精度型）、NA_character_（文本型）。R语言根据情况自动使用相应的类型。

3.2.4 Testing and coercion

is.*()系列的函数可以用来判断变量是否是给定类型的向量：is.logical()、is.integer()、is.double()和is.character()等函数可以分别来判断逻辑型、整型、双精度型和文本类型的向量。

但是，is.vector()、is.atomic()、is.numeric()等函数不能简单地认为是用来判断向量、原子向量和数值向量的，具体见相应函数文档。

原子向量的元素必须为同一类型。当合并不同类型的元素时，按文本——双精度——整型——逻辑的优先级顺序转换到同一类型。

类型转换有时会自动进行，例如大部分数学运算会将对象转为数值型。

用户可通过as.*()系列函数主动转换原子向量的类型。

3.3 Attributes

因子向量、时间和日期向量、矩阵和数组是在原子向量的基础上，添加属性而形成的更复杂的向量。

3.3.1 Getting and setting

attr()函数可以设置、查看和修改对象的单个属性：

x <- c(1:3) 
attr(x, "attr1") <- "属性1"  
attr(x, "attr2") <- "属性2"  

attr(x, "attr1")
attr(x, "attr2")

attributes()函数可以一次性查看对象的所有属性：

attributes(x)

structure()函数可以同时设置对象的多个属性：

x <- structure(
  c(1:3),
  attr1 = "属性1",
  attr2 = "属性2"
)

attributes(x)

3.3.2 Names

names属性是由对象元素的名称组成的文本向量。设置该属性有3种方式：

# When creating it: 
x <- c(a = 1, b = 2, c = 3)

# By assigning a character vector to names()
x <- 1:3
names(x) <- c("a", "b", "c")

# Inline, with setNames():
x <- setNames(1:3, c("a", "b", "c"))

移除names属性有两种方式：

x <- unname(x)
names(x) <- NULL

3.3.3 Dimensions

虽然向量是一维结构的，但是由于它默认情况下没有dim属性，因此该属性为NULL。给向量添加dim属性后可以得到2维矩阵或多维数组。

通常情况下，我们一般使用使用matrix()和array()函数分别创建矩阵和数组：

x <- matrix(1:6, nrow = 2, ncol = 3)

y <- array(1:12, c(2, 3, 2))

也可以通过给原子向量添加dim属性来创建：

p <- 1:6
dim(p) <- c(3, 2)

q <- 1:12
dim(q) <- c(2, 3, 2)

3.4 S3 atomic vectors

class属性是向量最重要的属性之一，具有class属性的对象都是S3对象。以下4种S3向量都是在原子向量的基础上构建的：

因子向量（factor vector），记录分类数据；
日期向量（Date vector），记录日期数据（精确到天）；
POSIXct向量，记录日期-时间（date-time）数据（精确到秒或亚秒）；
difftime向量，记录时长（durations）数据。

《Advanced R》学习笔记 | Chapter3 Vectors_第2张图片

3.4.1 Factors

因子向量是在整型原子向量的基础上构建的，它有两个属性：

class属性是factor，这是区别于一般整型原子向量的特征；
levels属性，定义分类数据所有可能出现的类别。

x <- factor(c("a", "b", "b", "a"))
x
## [1] a b b a
## Levels: a b

typeof(x)
## [1] "integer"

attributes(x)
## $levels
## [1] "a" "b"
## 
## $class
## [1] "factor"

当数据所有可能出现的值是已知的时，比较适合用因子向量来储存，且允许类别在数据中不全部出现。因子向量和文本向量的元素都可以使用table()函数分类计数：前者会把未出现的类别也列举处理，后者仅列举出现的字符串：

sex_char <- c("m", "m", "m")
sex_factor <- factor(sex_char, levels = c("m", "f"))

table(sex_char)
## sex_char
## m 
## 3
table(sex_factor)
## sex_factor
## m f 
## 3 0

有序（ordered）因子向量又是特殊的因子向量，它的levels属性的元素顺序是有含义的。

基础包的一些函数，如read.csv()函数在加载数据时可能会默认将文本数据作为因子向量，设置参数stringsAsFactors = FALSE可以避免。

尽管因子向量与文本向量从外观上很相似，但它实际是整型向。一些文本分析的函数也可以用在因子向量上，如gsub()、grepl()函数会自动将其转为文本向量；而nchar()函数会报错。

3.4.2 Dates

日期向量是在双精度原子向量的基础上构建的。它有且仅有一个属性：class属性，值为Date。

today <- Sys.Date()

typeof(today)
## [1] "double"
attributes(today)
## $class
## [1] "Date"

日期向量元素对应的双精度值是该日期与1970年1月1日的间隔天数：

date <- as.Date("1970-01-02")
unclass(date)
## [1] 1

3.4.3 Date-times

base R储存时间数据有两种方式：POSIXct和POSIXlt。POSIX是“Portable Operating System Interface”（可移植操作系统接口）的缩写。“ct”表示日历时间（calendar time），“lt”表示地方时（local time）。

POSIXct向量是在双精度型向量的基础上构建的，对应的双精度值是该时间与1970年1月1日0时0分0秒的间隔秒数。

now_ct <- as.POSIXct("1970-01-01 01:00", tz = "Etc/GMT-8")
now_ct
## [1] "1970-01-01 01:00:00 +08"

unclass(now_ct)
## [1] -25200

tzone属性：

structure(now_ct, tzone = "Asia/Tokyo")
## [1] "2018-08-02 07:00:00 JST"
structure(now_ct, tzone = "America/New_York")
## [1] "2018-08-01 18:00:00 EDT"
structure(now_ct, tzone = "Australia/Lord_Howe")
## [1] "2018-08-02 08:30:00 +1030"
structure(now_ct, tzone = "Europe/Paris")
## [1] "2018-08-02 CEST"

3.4.4 Durations

时长数据也是在双精度型向量的基础上构建的，具有属性units：

one_week_1 <- as.difftime(1, units = "weeks")
one_week_1
## Time difference of 1 weeks

typeof(one_week_1)
## [1] "double"
attributes(one_week_1)
## $class
## [1] "difftime"
## 
## $units
## [1] "weeks"

one_week_2 <- as.difftime(7, units = "days")
one_week_2
## Time difference of 7 days

typeof(one_week_2)
## [1] "double"
attributes(one_week_2)
## $class
## [1] "difftime"
## 
## $units
## [1] "days"

3.5 Lists

列表是比原子向量更复杂的向量：它的每个元素可以是任意类型的。但从技术上将，列表元素实际上还是同一类型——“索引”。如2.3.3节介绍，列表元素只是其他对象的索引，而被引用的对象可以是任意类型的。

3.5.1 Creating

列表元素实际上只是索引，它不涉及将对象复制到列表的过程，因此很多情况下，它会比预想的要小：

lobstr::obj_size(mtcars)
## 7,208 B

l2 <- list(mtcars, mtcars, mtcars, mtcars)
lobstr::obj_size(l2)
## 7,288 B

列表元素本身还可以是列表，因此列表也被称为递归向量（recursive vector）：

l3 <- list(list(list(1)))
str(l3)
## List of 1
##  $ :List of 1
##   ..$ :List of 1
##   .. ..$ : num 1

使用c()和list()函数合并原子向量和列表的结果是不一样的：

l4 <- list(list(1, 2), c(3, 4))
l5 <- c(list(1, 2), c(3, 4))

str(l4)
## List of 2
##  $ :List of 2
##   ..$ : num 1
##   ..$ : num 2
##  $ : num [1:2] 3 4

str(l5)
## List of 4
##  $ : num 1
##  $ : num 2
##  $ : num 3
##  $ : num 4

3.5.3 Matrices and arrays

普通的列表没有dim属性。给列表定义dim属性后，可以得到list-matrices或list-arrays：

l <- list(1:3, "a", TRUE, 1.0)
dim(l) <- c(2, 2)

l
##      [,1]      [,2]
## [1,] integer,3 TRUE
## [2,] "a"       1

l[[1, 1]]
## [1] 1 2 3

作者特别提到这种数据结构对时空类型的数据分析特别有用。

3.6 Data frames and tibbles

数据框和tibble是在列表的基础上构建的更复杂的异质向量。

《Advanced R》学习笔记 | Chapter3 Vectors_第3张图片

数据框是由向量组成的列表，并且每个向量的长度是一样的。这种矩形结构，使得它兼具列表和矩阵的特点。

tibble本身也是数据框，来自tibble工具包（本书作者是开发者之一），但在一些细节上的处理与普通数据框不同，下文会有所介绍。

3.6.1 Creating

data.frame()和tibble()函数可以分别定义数据框和tibble。下面列举两者的不同点。

如果变量名称为非法名称，数据框会自动转换为合法名称，tibble允许以反引号的形式：

names(data.frame(`1` = 1))
## [1] "X1"

library(tibble)
names(tibble(`1` = 1))
## [1] "1"

如果变量长度不一致，二者会在某种情况下循环利用较短变量的元素使之与较长向量等长：数据框要求较长向量的长度必须是较短向量的整数倍，否则报错；tibble要求较短向量的长度为1，否则报错：

data.frame(x = 1:4, y = 1:2)
##   x y
## 1 1 1
## 2 2 2
## 3 3 1
## 4 4 2
data.frame(x = 1:4, y = 1:3)
## Error in data.frame(x = 1:4, y = 1:3) : 参数值意味着不同的行数: 4, 3

tibble(x = 1:4, y = 1)
## # A tibble: 4 x 2
##       x     y
##    
## 1     1     1
## 2     2     1
## 3     3     1
## 4     4     1
tibble(x = 1:4, y = 1:2)
## Error: Tibble columns must have compatible sizes.
## * Size 4: Existing data.
## * Size 2: Column `y`.
## ℹ Only values of size one are recycled.

tibble的变量在创建时就可以引用，数据框无此功能：

tibble(
  x = 1:3,
  y = x * 2
)

3.6.2 Row names

数据框可以设置行名，tibble不可以设置行名。当需要将前者转换为后者时，可以将行名作为变量：

as_tibble(df, rownames = "name")

3.6.4 Subsetting

作者认为数据框的取子集操作时有两个麻烦的地方：

使用df[, vars]提取的变量形式不是数据框，而是向量；df[, vars, drop = F]得到的变量形式才是数据框；
使用df$x的形式提取变量时，如果数据框中没有名称是x的变量，它会提取名称以x开头的列，如果还没有会返回NULL，这会让用户意识不到提取结果可能是错的或不存在的。

tibble对此做了改进：使用[可以直接提取到tibble形式的变量；只有当变量名称完全匹配时才能进行提取，否则报错。

3.6.6 List columns

数据框可以使用列表作为列，这样数据框一列内的元素也可以是不同类型的了。

类型为列表的列（下文简称“列表列”）在定义时需要使用I()函数：

data.frame(
  x = 1:3, 
  y = I(list(1:2, 1:3, 1:4))
)
##   x          y
## 1 1       1, 2
## 2 2    1, 2, 3
## 3 3 1, 2, 3, 4

或者是在数据框创建后，再添加列表列：

df <- data.frame(x = 1:3)
df$y <- list(1:2, 1:3, 1:4)
df
##   x          y
## 1 1       1, 2
## 2 2    1, 2, 3
## 3 3 1, 2, 3, 4

tibble可以像创建普通列一样创建列表列：

tibble(
  x = 1:3, 
  y = list(1:2, 1:3, 1:4)
)
## # A tibble: 3 × 2
##       x y        
##       
## 1     1 
## 2     2 
## 3     3

3.6.7 Matrix and data frame columns

数据框也可以使用矩阵和数据框作为列，定义方式和上文类似：

dfm <- data.frame(
  x = 1:3 * 10,
  y = I(matrix(1:9, nrow = 3))
)
dfm$z <- data.frame(a = 3:1, b = letters[1:3])

str(dfm)
## 'data.frame':    3 obs. of  3 variables:
##  $ x: num  10 20 30
##  $ y: 'AsIs' int [1:3, 1:3] 1 2 3 4 5 6 7 8 9
##  $ z:'data.frame':   3 obs. of  2 variables:
##   ..$ a: int  3 2 1
##   ..$ b: chr  "a" "b" "c"

3.7 NULL

NULL的长度恒为0，且没有任何属性。它主要有两个用途：

表示任意类型的空向量；
在定义函数时，作为非必须参数的默认值。

你可能感兴趣的:(r语言,学习,笔记,开发语言)

深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
rabbitmq笔记 java
消息可靠性rabbitmq向消费者投递消息后，有可能会丢失，有可能会重复投递。比如：投递过程网络故障消费者收到消息后宕机消费者接收到消息后处理不当导致异常...rabbitmq需要做的事：机制消费者确认机制消费者处理成功后需要通知发幂等性幂等性指同一个业务，执行一次或多次对业务状态的影响是一致的例如唯一消息id业务状态判断但是数据的更新往往不是幂等的，所以需要确保幂等性确保幂等性方法有两种方案唯一
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
Python 用户账户(让用户拥有自己的数据) 钢铁男儿 Python 从入门到精通 python 数据库 sqlite
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
Python 用户账户(让用户能够输入数据) 钢铁男儿 Python 从入门到精通 python 数据库 sqlite
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
安卓编译安装python_一文了解如何在安卓系统上安装Pydroid 3并进行编码 weixin_39916681 安卓编译安装python
由于Pydroid3集成开发环境(IDE)，因此可以用Python进行可移植的编码。Pydroid是Python3的极简解释器，可让您执行较小的项目并在Android设备上进行最少的编码。如果您还想在没有PC的任何地方学习Python编程，同时在Android上为Python复制PC平台，那么Pydroid3是一个不错的应用程序。无论您是Python编程的新手还是专家，让我们看看使用Pydroid
mysql数据库学号数据类型_MySQL数据库学习笔记（二）----MySQL数据类型艾萨里昂之光 mysql数据库学号数据类型
【正文】上一章节中，我们学习了MySQL软件的安装，既然软件都装好了，现在就正式开始MySQL的基础知识的学习吧，即使是零基础，也要一步一个脚印。恩，首先要学习的就是MySQL的数据类型。一、数据类型：1、整型(xxxint)2、浮点型(float和double)3、定点数(decimal)4、字符串(char,varchar,xxxtext)5、二进制数据(xxxBlob)6、日期时间类型二、数
《Hello 算法》火了！！！一本写给算法初学者的入门算法书籍遇码分享算法 hello hello算法算法书籍
曾经也放出豪言壮语，决心要刷遍力扣上的所有算法题目。然而现实就很快啪啪的打脸。不知道多少人和我有过一样的经历。在读到《Hello算法》的序中，作者靳宇栋给了我们一个“台阶”。随后就表达了针对我们的现状，他特地写了《Hello算法》这本书，代表广大算法初学者表示感激涕零。《Hello算法》为什么适合入门动画图解、一键运行的数据结构与算法教程全书采用动画图解，内容清晰易懂、学习曲线平滑，引导初学者探索
笔记本Win7系统无线网名称显示乱码解决方案 mmoo_python windows
笔记本Win7系统无线网名称显示乱码解决方案在使用Windows7操作系统的笔记本电脑时，用户可能会遇到无线网络名称显示乱码的问题。这一问题不仅影响了用户识别无线网络的便利性，还可能阻碍正常的网络连接。本文将详细介绍解决这一问题的方法，帮助用户恢复无线网名称的正常显示。具体解决方法1.打开控制面板首先，我们需要进入Windows7的控制面板。可以通过点击开始菜单，然后在搜索框中输入“控制面板”来快
Win11显示不出WiFi列表？全面解决方案来了 mmoo_python windows
Win11显示不出WiFi列表？全面解决方案来了在使用Windows11操作系统时，连接WiFi网络无疑是日常工作中最基本也是最关键的需求之一。然而，不少用户却遇到了一个棘手的问题：WiFi列表无法显示，导致无法找到并连接可用的WiFi网络。这一问题不仅影响了用户的正常使用体验，还可能对工作和学习造成不小的困扰。本文将深入分析这一问题的可能原因，并提供多种有效的解决方法，帮助你轻松应对Win11显
mysql笔记 m0_67015473 mysql 笔记
mysql日志分析错误日志日志默认开启，查询showvariableslike“%error_log%”，日志存在于/var/log/mysqld.log二进制日志日志默认开启，记录所有的DDL(Create等)和DML(insert等)，但不包括数据查询（SELECT、SHOW)语句作用：灾难时的数据恢复mysql的主从复制查询showvariableslike“%log_bin%”，日志存在于
学习笔记——GPU 鹤岗小串 gpu算力分布式信息与通信系统架构硬件架构运维笔记
本文为学习笔记，故只对知识点依据自己的理解作概要总结，方便以后复习激活记忆。注：本文中GPU的讲解以A100型号为例，V100跟A100的架构差别不大也可适用，但是其他架构可能会有所出入。一、GPU硬件结构NVIDIAA100GPU的硬件结构HBM2：显存MemoryController：负责控制HBM2和L2Cache之间的通信High-SpeedHub：GPU总线，将NVLink、PCIE、E
【QT入门】 Qt槽函数五种常用写法介绍不吃~香菜 QT入门 qt 开发语言槽函数信号槽
声明：该专栏为本人学习Qt知识点时候的笔记汇总，希望能给初学的朋友们一点帮助(加油！)往期回顾：【QT入门】实现一个简单的图片查看软件-CSDN博客【QT入门】图片查看软件(优化)-CSDN博客【QT入门】lambda表达式(函数)详解-CSDN博客【QT入门】Qt槽函数五种常用写法介绍一、信号槽基本概念Qt的信号槽是一种用于处理事件和通信的机制，是Qt框架中的一个重要特性。信号槽机制使得对象之间
【QT入门】qmake和cmake的简单区别不吃~香菜 QT入门 qt 开发语言学习 qmake cmake
声明：该专栏为本人学习Qt知识点时候的笔记汇总，希望能给初学的朋友们一点帮助(加油！)往期回顾：【QT入门】Windows平台下QT的编译过程-CSDN博客【QT入门】VS2019+QT的开发环境配置-CSDN博客【QT入门】VS2019和QTCreator如何添加第三方模块-CSDN博客【QT入门】qmake和cmake的简单区别qmake和cmake是两种常用的构建工具，用于自动化构建C++项
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
Matlab实现SSA-HKELM麻雀算法（SSA）优化混合核极限学习机多变量回归预测的详细项目实例 nantangyuxi MATLAB 算法 matlab 回归人工智能数据挖掘开发语言深度学习
目录Mstlsb实她TTS-HKFLM麻雀算法（TTS）优化混合核极限学习机多变量回归预测她详细项目实例1项目背景介绍...1项目目标她意义...1目标...1意义...2项目挑战及解决方案...2挑战...2解决方案...3项目特点她创新...3创新点...3特点...4项目应用领域...4应用领域...4项目效果预测图程序设计及代码示例...5项目模型架构...6数据预处理...6混合核极限学
客服机器人怎么才能精准的回答用户问题？玩人工智能的辣条哥 AI面试机器人客服机器人
环境：客服机器人问题描述：客服机器人怎么才能精准的回答用户问题？解决方案：客服机器人要精准回答用户问题，需综合技术、数据和用户体验等多方面因素。以下是关键策略和步骤：1.精准理解用户意图自然语言处理（NLP）技术分词与实体识别：提取关键词（如“订单号”“退货”）和实体（如时间、地点）。意图分类：通过机器学习模型（如BERT、Transformer）将问题归类（如“售后”“支付”）。上下文理解记录对
C++学习：六个月从基础到就业——C++基础语法回顾：数据类型、变量与常量 superior tigre C++学习：六个月从基础到就业 c++学习
C++学习：六个月从基础到就业——C++基础语法回顾：数据类型、变量与常量本文是"C++学习：六个月从基础到就业"系列的第一篇技术文章，主要回顾C++的基本数据类型、变量定义和常量使用，为后续深入学习打下基础。查看完整系列目录了解更多内容。引言编程的本质是对数据的处理，而数据类型、变量与常量是任何编程语言的基础构建块。在C++中，对这些基础概念的深入理解不仅能让我们编写出正确的代码，还能帮助我们编
如何一键修改MDK代码风格以及error in include chain (cmsis_armcc.h): expected identfieror报错解决方法 superior tigre 单片机单片机 stm32 嵌入式硬件
目录一、修改MDK代码风格的两种方法1.直接设置2.替换global.prop文件，一键设置二、errorinincludechain(xxxxxxx.h):expectedidentfieror等报错的解决方法一、修改MDK代码风格的两种方法最近在学习某原子stm32的HAL库视频，被教学代码的风格深深吸引，感觉keil默认代码风格是越看越别扭，所以决定自己修改一下代码的格式，总结了两种方法，这
读书笔记五 ---大数据之路--数仓分层 qq_38215991 big data 大数据
数据分层在流式数据模型中,数据模型整体上分为五层。ODS层跟离线系统的定义一样,ODS层属于操作数据层,是直接从业务系统采集过来的最原始数据（进行了数据清洗）,包含了所有业务的变更过程,数据粒度也是最细的。在这一层,实时和离线在源头上是统一的,这样的好处是用同一份数据加工出来的指标,口径基本是统一的,可以更方便进行实时和离线问数据比对。例如:原始的订单变更记录数据、服务器引擎的访同日志。（原始数据
C#入门学习记录（五）轻松掌握条件分支与循环语句 FAREWELL00075 c#学习前端
前言编程就像给计算机写一份"烹饪指南"，而条件分支和循环就是这份指南中的关键指令。想象你要教机器人做蛋糕：条件分支："如果没有鸡蛋了，就去超市买"（做决定）循环："重复搅拌面糊100次"（重复动作）本文会用简单易懂的语言和比喻，带你掌握C#中这两个核心概念。新手友好，放心食用！一、条件分支：让程序学会"做选择"1.if-else语句（基础版选择器）if(今天下雨){Console.WriteLin
从零开始学习 Go 语言九班长 Golang 学习 golang 后端开发语言 gin
Go语言（又称Golang）是由Google开发的一种静态强类型、编译型、并发型编程语言。它以其简洁的语法、高效的并发支持和强大的标准库而闻名，非常适合开发高性能的服务器端应用、分布式系统和云计算工具。本文将从零开始，详细介绍如何学习Go语言，涵盖基础语法、核心概念、并发编程、工具链和实战项目等内容。1.Go语言简介1.1Go语言的特点简洁易学：语法简洁，学习曲线平缓。高效编译：编译速度快，生成的
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵 Ronin-Lotus 程序代码篇深度学习篇深度学习矩阵人工智能线性代数
文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
统一的视频动作模型三谷秋水计算机视觉机器学习人工智能计算机视觉深度学习机器学习人工智能
25年3月来自斯坦福大学的论文“UnifiedVideoActionModel”。统一的视频和动作模型对机器人技术具有重大意义，其中视频为动作预测提供丰富的场景信息，而动作为视频预测提供动态信息。然而，有效地结合视频生成和动作预测仍然具有挑战性，当前基于视频生成的方法在动作准确性和推理速度方面难以与直接策略学习的性能相匹配。为了弥补这一差距，引入统一的视频动作模型（UVA），它联合优化视频和动作预
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
侯捷 C++ 课程学习笔记：深入掌握 C++ 高阶特性 —— 实践与心得分享清水白石008 C++学习笔记课程教程 c++学习笔记
侯捷C++课程学习笔记：深入掌握C++高阶特性——实践与心得分享自从开始接触侯捷C++系列精品课程以来，我对C++语言有了全新的认识与深入理解。这套课程不仅系统地梳理了C++的基础知识，更从实际案例中展示了许多高阶特性和工程实战技巧。作为一名长期从事C++开发的专业人士，我深深感受到侯捷老师讲解中那种由浅入深、逻辑严密的魅力，也正是这种教学风格让我在短时间内掌握了不少难以琢磨的知识点。今天，我将结
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
java队列实现限流_如何使用队列实现微服务限流算法？纽太普 java队列实现限流
队列在平时开发中可能是出现频率最高的数据结构之一了，但是大部分情况下，我们都是用别人已经实现好的，比如kafka，比如redis里的list，以至于让人怀疑为什么还要去学习队列呢？希望今天的内容可以给你一些启发。什么是队列为了整个文章的完整性，我们还是来介绍一下什么是队列。我们举个生活中常见的案例，假设你在周杰伦的奶茶店买奶茶，由于人很多，为了保持公平和秩序，你被要求排队，最先来的人排到最前面，这
一文说清预训练与微调：AI的双重训练法则 TGITCIC AI-大模型的落地之道人工智能深度学习
什么是预训练？预训练是大型语言模型训练的第一步。它在资金和计算能力的支持下，通过深入分析大量的文本数据，使模型建立起语言的基本构架。在这一阶段，模型通过学习海量的书籍、文章和网页，识别出语言的语法、句法和词汇规律。这就如同一名学生接受通识教育，他并没有专注于某一门学科，而是获取了多方面的知识。自回归语言建模和掩码语言建模是预训练中常见的两种方法。前者在逐步构建文本的连贯性时，通过预测下一单词的方式
HTML5实现左右滑动数据变化 ice_junjun HTML 左右滑动
在HTML中怎么样实现左右滑动？代码附上Bootstrap实例-下拉菜单（Dropdowns）-->-->欢迎登陆页面！这是一个超大屏幕（Jumbotron）的实例。学习更多-->响应式表格布局产品付款日期状态产品123/11/2013待发货产品210/11/2013发货中产品320/10/2013待确认产品420/10/2013已退货产品123/11/2013待发货产品210/11/2013发货
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默