Buttercups

Pandas处理数据遇到的问题与解决

前言

主要记录自己pandas处理数据遇到的一些困难，基础非常薄弱，希望能越来越熟练

Next：set_index与reindex的区别

问题描述
经常会遇到

更改index
将某一个column的信息设置为index（例如股票数据处理中，经常会遇到某一个column为日期）
按照指定的index重新拍累dataframe

问题解决

pd.set_index能够将DataFrame中的某一column设置为索引。如果传入的是column列表，则设置多层索引。
pd.reindex的作用是根据new_index重新排列DataFrame，且如果新的new_index中含有原index未含有的索引，则会创建新的行，且对应的行的值全部是Nan，当然，可以选择在reindex( )传入method参数来解决这一点，例如：method='ffill'

注意，set_index, reindex, sort_index的区别

set_index是将原本就存在的某一列或者某几列设置为索引，以构建索引（或者多层索引）
reindex是将原来的DataFrame按照现如今新给出的index进行排序，可能会造成df数据的扩充，也可能会造成缺失值，需要进行处理
sort_index是不改变现有的index，只是将他们按照升序或者降序，重新排列数据，但如果数据不是升序或者降序，而是特殊的序列，则需要用reindex进行排序了

Next: 读入DataFrame时的数据类型问题

1. 指定读取csv文件时的数据类型

问题描述
在通过pd.read_csv( )方法读入csv数据时，如果未指定data_type，那么该方法会按照默认设置读入数据，有时候会将string字符串形式保存的数字读成float或者int的数据类型。
例如，我的trade_date是以字符串形式保存的，但是读入的时候默认变成了整数形，从而导致我按照字符串的index来reindex时，整个DataFrame的数据全部变为了Nan

解决方法
在读入数据的时候，通过pd.read_csv( )设置参数 dtype={'trade_date' : 'string'}，就可以了；当然，如果要以数值的形式读入，设置dtype={'trade_date' : 'value'}，更改之后效果如下：

2.读取csv文件时，指定作为index的列

设置index_col=column_name即可，当设置为0时，默认不读取任何一列作为index

pd.read_csv(index_col=column_name)

Next: 读写DataFrame时的参数问题

1. 写入DataFrame时

header：这代表将DataFrame的第n行作为表头，设置为False代表无表头

df = pd.DataFrame()
df.to_csv(header=None or 0~len(index))

index：设置为True时，python会自动创造一个index，再次读入的时候，则会出现一个名称为unnamed的column，此column就是之前创造的，设置为False时，则不会创造此index
注意：如果之前读入DataFrame的时候，通过index_col=设置了index，则再次存入的时候，不要设置index=False，否则这会导致index的信息缺失！
index_label：设置index的名称，可以用df.index.name进行访问，如果没有设置，则会出现unnamed:0的情况

Next: DataFrame的合并，pd.merge()

问题描述
当通过tushare两个不同的接口获得了股票数据，pro.daily_basic获得了一些技术指标信息，pro.daily获得了每日股价信息，这两个dataframe中有重复的column，想把他们合并成一个dataframe，但同时合并相同的列，保留不同的列


可以看到，二者是含有共同的column的，例如trade_date, ts_code。
问题解决
直接使用pd.merge(df1, df2)即可，因为on参数在默认的设置下，其会自动根据两个dataframe相同的列数（值也要相同）来进行合并，因此，上述的trade_date, ts_code, close就全部被合并了，合并后的columns如下

可以看到，相同的column已经合并了，不同的column也得以保留

Next: Pandas追加写入Excel数据

问题描述
通过Excel追加写入文件的时候，创建writer = pd.ExcelWriter(path, mode='a')，但是却产生了如下报错：

ValueError: Append mode is note supported with xlsxwriter

问题解决
产生这样问题的主要原因是因为：现在已有的的写入excel模块包含openpyxl和xlsxwriter，pd.ExcelWriter方法中默认的模块是xlsxwriter，但此模块不支持append追加操作，因此我们只需要更改pd.ExcelWriter方法中的默认模块即可:

# 写法1
with pd.ExcelWriter(path, mode='a', engine='openpyxl') as writer:
	df1.to_excel(writer, sheet_name='this is the first')
	df2.to_excel(writer, sheet_name='this is the second')

# 写法2
writer = pd.ExcelWriter(path, mode='a', engine='openpyxl')
df1.to_excel(wirter, sheet_name)
writer.save()
writer.close()

具体，可以参照这篇博文

Next：获取Pandas的行

问题描述
调取Pandas的某一行

问题解决
一般来说有三种解决方式

# 方法1:一个一个调用
df.loc[index, column]

# 方法2:iloc
df.iloc[index_num, column]

# 方法3:这样的方法可以调用DataFrame的行，但是不能够对列进行选择，因此默认是调用了所有的列
df[index_range]

注意：loc和iloc方法都可以批量调用，传入的是list, ndarray都是可以的

df.loc[a_list, :]
df.loc[index_list, column_list]

Next：对DataFrame进行批量操作

问题描述
想对DataFrame的行进行批量数量操作

问题解决
如果操作都是 同质化 的话，那么可以直接通过loc,iloc批量定位元素，然后统一进行操作

a = pd.DataFrame([[1,1,1],[1,1,1]], index=['a','b'], columns=['a','b','c'])
a

# 输出
	a	b	c
a	1	1	1
b	1	1	1

批量操作，选中的元素统一加1

a.loc[['a','b'],['c','b']] += 1
a

# 输出

	a	b	c
a	1	2	2
b	1	2	2

Next：Pandas的逻辑索引

Pandas的逻辑索引是通过

元素的标量运算
Pandas的广播机制，将标量运算扩展到所有元素上
逻辑索引得到的结果为对应位置上的True（满足条件）或者False（不满足条件）

所以，如果逻辑运算不是针对标量运算的，那么将会报错，比如下面这样


# df如下
	index_code	con_code	in_date	out_date	industry_name
0	801780.SI	601998.SH	20140221	NaN	银行
1	801780.SI	601838.SH	20180207	NaN	银行
2	801780.SI	002958.SZ	20190402	NaN	银行
3	801780.SI	601860.SH	20190110	NaN	银行
4	801780.SI	601577.SH	20181010	NaN	银行

# 本意：筛选出符合条件的股票代码
df[df.con_code==['601998.SH','601838.SH']]

# 报错如下
Lengths must match to compare

Lengths must match to compare这是因为，con_codea这一栏的元素都是字符串，但是逻辑运算对比的是list列表和string，所以会出现长度不匹配的问题

同样，Pandas的逻辑索引中，可以支持多个逻辑判断关系，但是这些判断关系也是必须针对元素级别的对比，也就是被对比的元素都必须是同种类型的。
多个逻辑判断必须符合以下的代码语法

# 多个逻辑的索引
df[(condition1) | (condition2)]

# 注意：|代表或，如果有多个条件都满足则全部返回，如果只有一个条件满足则返回一个
df[(df.con_code=='601998.SH') | (df.con_code=='601838.SH')]
df[(df.con_code=='601998.SH') | (df.con_code=='SH')]

# out
	index_code	con_code	in_date	out_date	industry_name
0	801780.SI	601998.SH	20140221	NaN	银行
1	801780.SI	601838.SH	20180207	NaN	银行


	index_code	con_code	in_date	out_date	industry_name
0	801780.SI	601998.SH	20140221	NaN	银行

Next：pd.drop删除元素

问题解决
和np.delete类似，Pandas也有删除元素的方法，为pd.drop，其使用方法和numpy几乎是一样的，同样有axis等参数

注意：pd.drop的删除只能够是沿着轴产生的。当为DataFrame时，其一次只能够删除列，或者单独删除行。而当Series时，其能够直接对元素进行删除（因为在Series中，一列/行就是一个元素）

Next：Pandas的索引

有时候会弄混Pandas的索引，需要整理一下，总的来说，Pandas拥有三大类索引方式

标签索引，loc，通过输入loc[index, column]的方式进行索引
位置索引，iloc，通过输入iloc[row_index, col_index的方式进行索引
布尔索引，通过类似df[condition]的方式进行索引
其他索引
1. 切片索引，通过df[slice]的方式进行索引，用这种方式进行索引时，如果df.index为数值，则可能会产生一定的歧义。如果为非整数索引，例如index=['a','b','c']则不会产生歧义。例如：df[0:4]则是访问数据的前4行
2. 键索引，用于访问列，通过df[column_name]的方式进行索引，但是这种方式严格意义来说是访问列的。可以访问单列，也可以访问数个列。对于没有的列，会返回KeyError的错误。列名可以为字符串形式，例如df['stock_code']

Next：Pandas的赋值操作

描述
Pandas中有一种非常灵活，好用的赋值方式，其实质是运用了pandas的布尔索引方法，然后定位到True的位置并赋值，其语法操作为df[condition] = value

a = np.arange(12).reshape(4,3)
df = pd.DataFrame(a)
df.iloc[1,1] = np.nan
print(df)

# output
   0     1   2
0  0   1.0   2
1  3   NaN   5
2  6   7.0   8
3  9  10.0  11

通过df.isna()定位缺失值，然后通过布尔索引赋值

df[df.isna()] = 1
print(df)

# output
   0     1   2
0  0   1.0   2
1  3   1.0   5
2  6   7.0   8
3  9  10.0  11

通过condition逻辑运算定位元素，然后通过布尔索引赋值，这里使得值大于4的全部重新设置为10086


	0		1		2
0	0		1.0		2
1	3		1.0		10086
2	10086	10086.0	10086
3	10086	10086.0	10086

Next：Pandas的对齐机制

问题描述
在将两个df进行运算操作时，其合总后的DataFrame包含的行、列是两个df的并集。缺失的值会显示为np.ana，这个时候为了保证操作的正确无误，有两种方式进行弥补

在运算操作后通过np.where(.isna())进行检查，检查是否产生了nan值
将nan进行补足
- df.fillna()，直接进行补足
- 通过灵活算数方法进行算数运算，这些方法都是df对象的方法，其参数中可以设置对nan的填充值，例如：df1.add(df2, fill_value=10086)

Next：Pandas的排序

问题描述
有时候需要根据索引进行排序，例如处理股票时间序列的时候。有时候需要根据值进行排序。

问题解决

对于索引值排序，可以使用pd.sort_index方法，该方法也支持对象方法

a = pd.DataFrame(np.random.randint(0,2,(4,3)), index=['a','b','c','d'], columns=['hch','hqz','ls'])
print(a)

# output
   hch  hqz  ls
a    0    0   1
b    0    1   1
c    0    1   1
d    1    1   0

设置按照column进行排序，axis=0 or 1对应的是行或列，ascending 设置升序降序

a.sort_index(axis=1, ascending=True)

# output

	hch	hqz	ls
a	0	0	1
b	0	1	1
c	0	1	1
d	1	1	0

对值进行排序，通过pd.sort_values方法，该方法最重要的是by参数，其能够根据某个列的值进行排序。当然by=list输入多个列也是可行的，对于前一个列中相等的元素，其会继续根据下一个列进行排序

a.sort_values(by=['hch', 'hqz'])

# output
# 可以看到，再hch和hqz的列中，元素值大大小都是按照升序进行排列的
	hch	hqz	ls
a	0	0	1
b	0	1	1
c	0	1	1
d	1	1	0

Next：统计Pandas中的数量信息

问题描述
有时候会遇到如下问题：

统计pandas中究竟有哪些数，集合是什么
统计pandas中数出现的频率，需要画出分布图
需要统计一些数据是否存在于dataframe中，如果存在的话，又是在哪里

问题解决
其实pandas有很好的函数可以解决这些问题，分别是

unique函数，用于返回dataframe值的集合，返回Series
values_count函数，用于统计每个数值究竟出现了多少次
isin函数，用于统计特定的数值是否出现在了了df之中，除此之外，isin函数还可以用来生成mask矩阵，例如在训练的时候，那些为nan的值则不需要贡献loss

案例1：从前，如果要统计函数值的集合，不知道这个方法时，我的做法很笨拙，如下

a = pd.DataFrame(np.random.randint(0,2,(4,3)))

   0  1  2
0  1  1  1
1  0  1  0
2  0  0  0
3  1  1  1

# 首先将其dataframe的 值 转换为Series
values = a.values.reshape(-1)
values = a.values.ravel()
unique_val = set(values)  # 转换为集合
count = dict()  # 构建字典
for value in unique_val:
    count[value] = np.count_nonzero(values==value) # 统计频次

print(count)

# output
{0: 4, 1: 8}

可以看到，这种方法真的非常的笨拙，现在的方法两步就可以做成，但需要注意：pd.values_count方法只能够对1维数组进行操作，所以在进行操作前需要先转换维度

values = np.unique(a)  # 获得数值的集合
count = pd.value_counts(a.values.ravel())  # 统计频率
print(count, type(count)) 

# output
# count是一个Sereis，键是数值，值是数值出现的频率
1    8
0    4
dtype: int64 <class 'pandas.core.series.Series'>

可以看到，这种方法明显简单很多很多

案例2：查看数据是否存在于数组dataframe之中，如果存在，具体在什么位置，可以运用isin的方法，这种方法的好处是能够同时查找多个值是否在dataframe之中！！

a = pd.DataFrame(np.random.randint(0,4,(4,3)))
print(a)

# output
   0  1  2
0  3  2  2
1  0  2  2
2  0  3  3
3  0  3  1

# 运用isin方法进行查找
values = [1,2]  # 待查找元素
bull_mat = a.isin(values)  # 进行查找，返回的是一个布尔值矩阵，如果对应位置的元素是需要被查找的元素，则返回True
loc = np.where(bull_mat)  # 获得定位！
print(bull_mat)
print(loc)

# output
       0      1      2
0  False   True   True
1  False   True   True
2  False  False  False
3  False  False   True  # 布尔矩阵，是否为待查找目标值

(array([0, 0, 1, 1, 3]), array([1, 2, 1, 2, 2]))  # 位置

当然，如果只是为了查找单个元素的话，完全可以通过np.where[condition]的方法进行查找。np.where[a==1]就是获得了元素为1的位置

当然，isin方法的作用还不止于此，例如其还可以获得mask矩阵（本质就是多值查找）

a = pd.Series(np.arange(12,).reshape(-1))
a

# output
0    0
1    1
2    2
3    3
4    4
5    5
6    6
7    7
dtype: int64


# 通过isin获得布尔值矩阵
a.isin([1,2])  # 1，2的位置，True定位

# output
0     False
1      True
2      True
3     False
4     False
5     False
6     False
7     False
8     False
9     False
10    False
11    False
dtype: bool

# 转换为数值
a.isin([1,2]) + 0

# output
0    0
1    1
2    1
3    0
4    0
5    0
6    0
7    0
dtype: int64

这样，我们就找到了数值的定位

Next：apply与applymap操作

问题描述
之前不了解，当要执行同一种性质的操作的时候，傻傻的用for循环去循环dataframe，依次执行，这样子效率比较低

问题解决
Pandas提供了apply, applymap操作，支持灵活的对每一行/列，甚至每个元素执行操作。当然，在DataFrame进行一些比较基本的数值运算时，用此方法可能显得有些多此一举，因为我们完全可以通过numpy中的数值操作，但是如果是一些其他类型的元素操作，字符串操作，那么这种方法就会很方便

面对数值操作时，比如下面，对每一行求min_max_norm

a = np.arange(12).reshape(3,4)
a

# output
	0	1	2	3
0	0	1	2	3
1	4	5	6	7
2	8	9	10	11

# min_max_norm
diff = lambda x: (x - x.min())/(x.max()-x.min()) # 标准化
a.apply(diff, axis=1)  # 对每一行进行标准化

# output

	0	1			2			3
0	0.0	0.333333	0.666667	1.0
1	0.0	0.333333	0.666667	1.0
2	0.0	0.333333	0.666667	1.0

当然，完全也可以这样

data = (data-data.min(axis=1))/(data.max(axis=1)-data.min(axis=1))

如果是对非数值元素进行运算，那么applymap的优势就体现出来了，例如在下面，我想知道每个元素的字符串长度都是多少

a = pd.DataFrame([['hch', 'hqz']]*2)
a

len_is = lambda x: len(x)
a.applymap(len_is)

add = lambda x: x+'loves each other'
a.apply(add, axis=0)

# output
	0	1
0	hch	hqz
1	hch	hqz

	0	1
0	3	3
1	3	3

	0						1
0	hch loves each other	hqz loves each other
1	hch loves each other	hqz loves each other

真的非常好用啊！

当然，要注意，apply, applymap仅仅只是dataframe的映射操作，而Index, Series这两个对象也有对应的映射操作方法，其语法都是map，这个的话以后遇到会慢慢说

Series的map操作除了接受匿名函数，还接受字典作为输入，当以字典为输入时，输出的就是键值对对应的值

Next：缺失值的填充fillna, dropna, isna系列

Next：重复值的操作，duplicate, drop_duplicates

Next：替代值操作，replace

问题描述
不用再继续用data[condtion] = value，这样非常笨拙，应该用data.replace(values, new_values)操作

Next：归一化

问题描述
数据的归一化

问题解决
以min max norm为例，如果是对每一列作归一化，方法如下：

df 
norm_df = (df - df.min(axis=0))/(df.max(axis=0)-df.min(axis=0))

但是，如果是对每一行做min max norm归一化，这种方法就会错误，因为他违反了numpy的广播机制。df.max(axis=1)最后产生的是一个形状为(rows, )的一维素组，根据广播机制

不满足后缘维度相同
后缘维度不为1

因此无法进行广播机制，会产生报错，这个时候有两种做法

扩充维度，将变形后的df维度变为二维，且最后一个维度为1
用apply函数

df 

# method 1 
min_ = df.min(axis=1).reshape(-1,1)
max_ = df.max(axis=1).reshape(-1.1)
df - min_ / max_ - min_

# method 2 
norm = lambda x: x.min() / x.max() - x.min()
df.apply(norm, 1, df)

以上，问题完美解决

你可能感兴趣的:(我的笔记)

“麦大夫”也碰瓷儿。知心家教静静读书会
一只“麦大夫”——金灿灿、滚滚圆、胖墩墩的一只、十六星瓢虫，大清早光临了我的笔记本。不，是我来到了他们的绿色家园。我舍不得它走掉，想让他多待一会儿。我就用手轻轻的，蹑手蹑脚地堆了它一下，他立刻一动不动，变成了标本状。任你用笔尖触它，拨弄它，它也不动。想起在跟一个小朋友谈“推动”一次时，孩子说，推也不一定动哦！这个爱动脑筋的小宝贝！孩子的世界、孩子的脑筋是多么奇特呀！这些可爱的小精灵！|星瓢虫，大清
【网络】 arp 命令得到网段内所有物理设备ip DFminer linux 网络运维
我的笔记本和NVIDIAJetsonOrin都位于同一个192.168.1.x的网段内，我想远程访问Orin，但我不知道orin的ip方法1:使用arp命令打开命令提示符：按下Win+R键，打开“运行”对话框。输入cmd并按Enter键打开命令提示符。使用arp命令：在命令提示符中输入arp-a并按Enter键。结果：试了两个动态地址，第二个就是我要找的
最有效的学习是有目的的练习【学习篇】静水闲观
我今天开始阅读《刻意练习》，按照三栏笔记法做了一些笔记，然后又想写一些故事，于是就有了下面这篇文章。春节在家时，除了陪父母，我一般都在自己房间里看书写字，所以邻居们基本不太能见着我。有一天，老爸到我房间来看我的笔记本说：“我看看你都写些什么？”老爸读过几年小学，能认一些字，但是看了几眼就不再看了。为了满足老爸的好奇，我跟老爸解释：“写作能赚钱，但是我现在还在初学写作的阶段，还需要练习。”老爸是非常
2022-05-22 【导师班第五天学习感悟】一鹿相伴
2022年5月18日至5月22日，为期五天四晚的导师班钉钉课程圆满结束！非常感谢纪琼导师以及心时代的全体员工，为了满足我们学员的学习需求，通过线上和线下相结合的方式，让我们有幸足不出户就可以学完导师班的所有课程。纪琼导师绘声绘色、诙谐幽默、金句频出、有理有据、引古论今、案例分析的授课风格让我记忆深刻，个人感觉线上上课的感觉一点也不亚于线下上课的感觉！我翻来覆去看看我的笔记本，满满的知识内容代表纪琼
IMX6ULL开发板通过网线直连PC机进行TFTP、NFS进行网络调试 Terry.Z_1009 Linux linux ubuntu
硬件平台：正点原子imx6ull阿尔法开发板应用背景：1、首先我的笔记本是连得无线网，即处于联网状态。2、办公桌周围没有网口，路由器又比较远，所以不好使用网线连接路由器，再连接开发板进行网络下载。所以，使用PC与开发板通过网线直连，在PC机上创建网桥进行桥接。一、PC端win7系统设置：如下图：此时会出现网桥然后基于正点原子的驱动教程，进行NFS下载，或者TFTP下载2022/04/11以上方法，
linux java 无法执行二进制文件,linux – Logstash – 找不到任何可执行文件的java二进制文件... 红护 linux java 无法执行二进制文件
我的笔记本电脑上安装了一个虚拟机上的ELK.弹出菜单正在运行../bin/logstash-flogstash-filter.conf给出以下错误找不到任何可执行的java二进制文件.请在您的PATH中安装java或设置JAVA_HOME.我尝试设置JAVA_HOME和$PATH,但仍然存在问题.我错过了什么吗？whichjava/usr/bin/javajava-versionjavaversi
学期总结及暑期计划 ahannd
学期总结时间过得很快，转眼间我就要大三了，而在刚刚过去的一学期中，我又干了些什么、收获了什么，有哪些值得我去反思呢？先说说我干了些什么，其实我觉得我这学期的学习态度比上学期认真了很多，不论是专业课还是通识课，基本都是坐前排认真听讲当然也有时候会犯迷糊，注意力不集中啥的，不过我的笔记也比之前认真了很多。除了学校内的课程，我依旧是在课外的CPA补习班上课，像这学期我们的课程是CPA会计，但是这次应为补
牛人巍巍昆仑分享《五年早起晨型人，走过的那些坑》——科学无忧早起的方法之我的笔记慧玥
一、早起的好处，好多成功人士都是早起者，80%的人都有早起的习惯。真的就不用说了，高效，清醒，践行过半年早起，把一天安排的学习任务完成，整个人都清爽，干一些自己喜欢的事情，慢慢的读书，慢慢的喝茶。。。二、早起五大坑：1、早起必须有明确的目标，没有目标就别早起了，没有任何意义。早起的目标在前一天晚上确定好该干什么，现在是每天打卡，日更，不去为了打卡而打卡，真的想去学一些什么，宝贝再大一些时，早起，现
2018-03-21 zhchhhemmm
我的笔记关于Chromium源文章地址源代码语言结构Chromium分为三个主要部分（不包括其他库）：浏览器，渲染器和Webkit。浏览器：主流程，代表所有UI和I/O.渲染器：是由浏览器驱动的（通常）每个选项卡子流程.webkit：一个开源的浏览器引擎，它拥有清晰的结构、极快的渲染速度.（好像现在还有一个基于webkit的Blink引擎）解决方案文件解决方案文件是chrome/chrome.sl
完成对话於莺
儿子：我真想打迈克尔一巴掌！父亲：哦？(蹲下来，注视着孩子)儿子：我真想狠狠地打他那张肥脸！父亲：看样子你很生气儿子：你知道那个坏家伙干了什么吗？在车站他无缘无故抢走我的笔记本，扔到垃圾桶箱里。父亲：嗯。儿子：我猜他怀疑是我在美术教室把他捏的鸟弄碎的。父亲：这样。儿子：是啊。他哭的时候，一直盯着我。父亲：嗯。儿子：但不是我弄的。真的不是我。父亲：我相信你，孩子。儿子：我不是故意的。那个蠢德彼把我推
周六随笔萌柳青青
《一》昨天给学生布置家庭作业，他看到桌子上放着我的一本笔记本，然后指着我的笔记本跟我说:“我回去要做家庭作业，小倩老师回去也要做家庭作业”！我笑着对他说:“回去好好做作业”！小孩子的世界很简单，想法也很单纯。他会毫无保留地跟你分享他所看到或者所认为的一切。《二》其实，简单一点看世界，你会发现，简单自有它存在的意义。很多人说:“越长大越孤单”。而我却发现，越长大，越喜欢简单！七彩的画作固然让人惊艳，
我的笔记（7.21） Shopgirl
①“生于忧患死于安乐”的道理我们都懂。但孟子的字面意思，是说你经历的所有逆境和困难，都是因为老天想要磨练你，想要把你打造成一个更强的人，而故意安排的。这些事儿不是无缘无故发生的，它们就好像是游戏里的关卡一样是为你精心设计的……这不就等于说“一切都是最好的安排”吗？当然大多数现代人不至于做这种字面上的理解，但我想说的是，这里面有个根深蒂固的思维偏误。这句话的理解就是别总想着有什么事情是为你安排的，凡
意外的被无事生非凌朵
昨天下午五点多，快要下班了，孩子老师发来一个文件，要求打印。家里是有打印机的，可是电脑被老大带到学校了；我的笔记本被同事借走了，回家的路上也没有打印店。其实，别的同事很多都是在办公室里打印孩子的复习资料的，这都是众所周知的。别的科室也是在我们这里打印各种文件的，大家谁都司空见惯。我不想在学校打，主要是因为打印机在我们小领导边上，这是个抽风的人，脑回路清奇，我实在懒得理他！一般我都是提着笔记本回家打
今天冬至，祝你冬至快乐！ Shally_e8e2
2020/12/21今天冬至，祝你冬至快乐！你有没有吃饺子呀？好冷，我现在躲在被窝写日记。你可能不知道，其实我9:40已在床上准备睡觉了，然后翻了一下我的笔记本，我上周六上了一节基金课，做的笔记，很乱，又有划掉的，字很丑。因为那时我边听课边快速的记下来，没有时间好好写。这不，我的强迫症又犯了，就想好好重抄一遍，整好看点……没想到这个决定，花了我将近40分钟的时间，抄了整整三页纸。你知道冬天写字很慢
听了一节家庭教育讲座碎雨花
今天听了一节家庭教育讲座，其中讲到亲子沟通的内容，感觉还不错。以下是我的笔记：沟通：沟者渠也，通者连也。沟通本身的意思是借助某种渠道使双方能够通连。通者不痛，痛者不通。没有回应的沟通就是说教，是低效的。沟通三大法宝：闭嘴、文字、肢体语言。男孩子的爸爸要多用右手拍拍儿子，说一句：有儿子没儿子就是不一样。父子感情重在义。女孩子的妈妈要多拥抱女儿，说一句：有个女儿真好呀！母女感情重在情。让亲子关系转为兄
36岁开始做读书博主：没你想像的那么容易大脚的思想
之前我的笔记里面提到我通过读书收到出版社寄书和变现了，很多人来问我怎么做读书博主，自己也想做副业变现。如果说做书博主简单：你读了书去发了笔记分享就可以算是一个读书博主了。但是要做一个能变现的好博主，根据我做几个月的读书博主经验来说，也没想像中那么容易！1、职场之外需要把时间都花在阅读上我做读书博主后，除了工作时间和必须带孩子时间，我几乎都在阅读。早上5点起床除了写作就是读书，上下班路上听书，下班回
NCCL源码解析: 共享内存连接的建立 Happy_Enger NCCL NCCL SHM nvidia P2P
文章目录前言概括详解1.shmCanConnect()2.shmSendSetup3.shmRecvSetup前言NCCL源码解析总目录我尽量在每个函数之前介绍每个函数的作用，建议先不要投入到函数内部实现，先把函数作用搞清楚，有了整体框架，再回归到细节。习惯：我的笔记习惯：为了便于快速理解，函数调用关系通过缩进表示，也可能是函数展开，根据情况而定。如下//调用proxyConnInitNCCLCH
NCCL源码解析: P2P 连接的建立 Happy_Enger NCCL NCCL nvidia CUDA
文章目录前言概括详解ncclTransportP2pSetup()前言NCCL源码解析总目录我尽量在每个函数之前介绍每个函数的作用，建议先不要投入到函数内部实现，先把函数作用搞清楚，有了整体框架，再回归到细节。习惯：我的笔记习惯：为了便于快速理解，函数调用关系通过缩进表示，也可能是函数展开，根据情况而定。如下//调用proxyConnInitNCCLCHECK(proxyConnInit(peer
润忻21天跨年魔力打卡D11早.正月初八《感恩日记》尧安妈咪呀
1.感恩阳光透过窗帘照进我家。2.感恩暖气让我们家如此温暖。3.感恩水让我们可以洗漱。4.感恩昨日老公陪着去拜年。5.感恩老公对我的包容。6.感恩孩子们一如既往的可爱。7.感恩小鸟在屋外叽叽喳喳，告诉我们春天来了。8.感恩昨日一个熟人提供的合作机会。9.感恩我的笔记本电脑给我带来工作的便利。10.感恩身边一切的发生。
黄丽红日精进97/105 做自己小太阳
感恩感恩元宵节露露的祝福和分享感恩今日份好吃的饭菜感恩晚上网速支持我看了央视直播感恩今日份超额完成了学习任务感恩师兄把我的笔记分享朋友圈感恩朋友对我困惑的倾听见1.晚上因为没有芒果和爱奇艺会员没有追湖南卫视的元宵节目（因为电视机出现问题），所以看了央视的元宵节目，不得不说很震撼，央视主要和疫情有关，每一个朗诵和歌曲带给很大震撼。白衣天使在这个时候熠熠生辉，作为一个医学生，为他们感到骄傲！2.和朋友
润忻21天跨年魔力打卡D8感恩日记敏的宁静花园
1.感恩没有闹钟提醒的自动醒来，谢谢谢谢谢谢。2.感恩枕边人，谢谢谢谢谢谢。3.感恩手机可以完成打卡，可以完成与方方面面的沟通。谢谢谢谢谢谢。4.感恩日益便捷的网络，谢谢谢谢谢谢。5.感恩越来越笃定的自己。谢谢谢谢谢谢。6.感恩我的床和床品，谢谢谢谢谢谢。7.感恩我的笔记本和笔，谢谢谢谢谢谢。8.感恩可以同步运动练习的视频号，谢谢谢谢谢谢。9.感恩有缘助力的所有个案。谢谢谢谢谢谢。10.感恩润忻大
统计图表在线配置服务-百度 SugarBI的学习笔记快看那个人学习笔记
最近，有个产品要支持统计图表在线可配置，这样，当用户有新增统计指标的需求时，运维人员通过界面化配置，就可以增加统计指标了，不用开发写代码，画页面了。上网查了下相关的组件，感觉百度的SugarBI的还不错，简单又相对便宜。现将使用方法整理如下，方便日后开发使用。我的笔记截图，看不懂没关系，我自己能看懂就行了，这个是面向我自己的笔记。官网的截图整理如下：1.创建“数据源”。通过这个步骤，连接你要查询的
今日反思 Shirley赖
下午送老大上学回来，我开始计划写一篇反思文章。我先翻看了渔樵书友关于写反思提升自己的文章，然后找出笔记本做笔记。我喜欢她提出的九宫格反思日记法。写完笔记，我又想起《好好思考》里也有关于做笔记的内容，于是找到书，叫做“五星笔记法”。我都在笔记本里做好笔记。然后我又想起还有个“高维打低维”的说法很有意思。又找出来写在我的笔记本上。凯利公式，对投资创富，是个经典公式。我也把公式和巴菲特的解释，举例说明写
民情日记—092 册名花
2018年7月14日星期六今天在村委会加班。为了迎接国家林业总局的脱贫攻坚督查工作。县脱贫攻坚指挥部发文，要更换所有建档立卡户的门牌卡和明白卡，要做到精准扶贫。虽然门牌卡前久才换过。今天的任务是完成电子版的门牌卡和明白卡。我先把团委挂钩的三十户门牌卡和明白卡完成，并上报审核。然后帮助其他人完成全村的。虽然在村委会的人多，但是工作进度慢。因为只有两台电脑，除了我的笔记本。傍晚，脱贫攻坚指挥部工作人员
webpack 我的笔记 lessonSam
webpack快速入门教程测试文档见github记得star哦1、了解Webpack相关什么是webpackWebpack是一个模块打包器(bundler)。在Webpack看来,前端的所有资源文件(js/json/css/img/less/...)都会作为模块处理它将根据模块的依赖关系进行静态分析，生成对应的静态资源五个核心概念Entry：入口起点(entrypoint)指示webpack应该使
随性生活 3125a11b83ab
为了赶到12点前睡觉，和女儿聊了几句，就忘了我的笔记，，今天的目标补起来，两篇。虽说随性，没人监督，答应了就是答应了的。期望坚持后我的变化。我在12年就读了北大EMB班，认识了一群可爱的兄弟姐妹，这几年的忙碌，就很少有聚会。借着留音别墅的开业，聚了一小部分。这是南山自己的一栋私人别墅，装修完了有八百平米，为什么叫留音别墅，我想因为女主人爱好音乐的缘故，这别墅还有一个名叫乡村姑姑，这也是时代的产物，
中医养生 hanxuerping
其实一直比较关注养生这一块的话题，之前买了徐文兵的中医养生的课件，这本书是无意之中在kindle里边看到了，看评价还不错，比较全面的描述中医跟养生的关系，平日里起居该注意的，然后药食同源，要对不同体质的影响，这类书籍我就是摘抄书本笔记了，因为也没法发表自己的观点，想要养生的朋友可以看看我的笔记，我记得比较简单了点，看的时候还是得结合自己的身体状况去吸收知识，对平日里一些不好的饮食起居习惯还是有纠正
CS144--Chapter0--wsl2+docker环境搭建 9MarkZhang9 #计算机网络 docker 容器运维 websocket http tcp/ip
我的笔记本配置荣耀magicbook16，容量是500G，芯片是R7-5800由于笔记本容量较小，因此考虑这个方案，对于台式机用户，建议可以直接用虚拟机或者双系统。前言斯坦福官网给出的方法是用他们的镜像（基于Ubuntu23.10）进行实验，但是国内访问他们的镜像的速度着实感人，同时无意间看到一位互联网知己写了这篇文章（友情链接），这篇文章写的非常nice，但是里面缺少了有关于使用windows中
Java学习笔记2024/1/28 Angus1648 学习笔记 java
前言:我的学习方法就是边学边记笔记，大笔记就是写博客，小笔记就是代码的注释，在笔记当中，我加入了绝大部分自己的见解，拒绝生搬硬照，我认为这才是真正的笔记，有自己的理解，有自己的灵魂，而不是一味地CtrlcCtrlv。如果你们想借鉴我的笔记，温馨提示：一定要看注释，我的思考过程就在注释当中。最后送大家两句话：1.学我者生，似我者寄（去搜它的意思）2.你看懂了，不去写，其实你还是不懂。1.运算符(还没
大家一起来学c++入门吧~ power 雀儿 c++专区 c++学习
我们今天是第一天，就简单先认识一下c++的最最最基本的吧~内容并不多接下来的寒假，我会不断更新有关c++学习的经历和我的笔记，关注我，我们一起从零开始！首先，它是面向对象的程序设计方法，从同类对象中抽象出共性，形成类。同类对象的数据原则上只能用本类提供的方法进行处理。类通过封装将接口与实现分离开来，通过接口与外界联系。我们先来写第一个c++程序#includeusingnamespacestd;i
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方