python爬虫人工智能大数据

Pandas中文官档~基础用法6

呆鸟云：“这一系列长篇终于连载完了，还请大家关注 Python 大咖谈，这里专注 Python 数据分析，后期呆鸟还会给大家分享更多 Pandas 好文。”

数据类型

大多数情况下，pandas 使用 Numpy 数组、Series 或 DataFrame 里某列的数据类型。Numpy 支持 float、int、bool、timedelta[ns]、datetime64[ns]，注意，Numpy 不支持带时区信息的 datetime。

Pandas 与第三方支持库对 Numpy 类型系统进行了扩充，本节只介绍 pandas 的内部扩展。如需了解自行编写与 pandas 配合的扩展类型，请参阅扩展类型，参阅扩展数据类型了解第三方支持库提供的扩展类型。

下表列出了 pandas 扩展类型，参阅列出的文档内容，查看每种类型的详情。

数据种类	数据类型	标量	数组	文档
带时区的日期时间	`DatetimeTZ`	`Timestamp`	`arrays. DatetimeArray`	Time zone handling
类别型	`Categorical`	(无)	`Categorical`	Categorical data
时间段	`Period`	`Period`	`arrays. PeriodArray`	Time span representation
稀疏数据	`Sparse`	(无)	`arrays. SparseArray`	Sparse data structures
时间间隔	`Interval`	`Interval`	`arrays. IntervalArray`	IntervalIndex
空整型	`Int64...`	(无)	`arrays. IntegerArray`	Nullable integer data type

此表要横屏看

Pandas 用 object 存储字符串。

虽然， object 数据类型能够存储任何对象，但应尽量避免这种操作，要了解与其它支持库与方法的性能与交互操作，参阅对象转换。

DataFrame 的 dtypes 属性用起来很方便，以 Series 形式返回每列的数据类型。

In [328]: dft = pd.DataFrame({'A': np.random.rand(3),
   .....:                     'B': 1,
   .....:                     'C': 'foo',
   .....:                     'D': pd.Timestamp('20010102'),
   .....:                     'E': pd.Series([1.0] * 3).astype('float32'),
   .....:                     'F': False,
   .....:                     'G': pd.Series([1] * 3, dtype='int8')})
   .....: 

In [329]: dft
Out[329]: 
          A  B    C          D    E      F  G
0  0.035962  1  foo 2001-01-02  1.0  False  1
1  0.701379  1  foo 2001-01-02  1.0  False  1
2  0.281885  1  foo 2001-01-02  1.0  False  1

In [330]: dft.dtypes
Out[330]: 
A           float64
B             int64
C            object
D    datetime64[ns]
E           float32
F              bool
G              int8
dtype: object

要查看 Series 的数据类型，用 dtype 属性。

In [331]: dft['A'].dtype
Out[331]: dtype('float64')

Pandas 对象单列中含多种类型的数据时，该列的数据类型为可适配于各类数据的数据类型，通常为 object。

# 整数被强制转换为浮点数
In [332]: pd.Series([1, 2, 3, 4, 5, 6.])
Out[332]: 
0    1.0
1    2.0
2    3.0
3    4.0
4    5.0
5    6.0
dtype: float64

# 字符串数据决定了该 Series 的数据类型为 ``object``
In [333]: pd.Series([1, 2, 3, 6., 'foo'])
Out[333]: 
0      1
1      2
2      3
3      6
4    foo
dtype: object

DataFrame.dtypes.value_counts() 用于统计 DataFrame 里各列数据类型的数量。

In [334]: dft.dtypes.value_counts()
Out[334]: 
float32           1
object            1
bool              1
int8              1
float64           1
datetime64[ns]    1
int64             1
dtype: int64

多种数值型数据类型可以在 DataFrame 里共存。如果只传递一种数据类型，不论是通过 dtype 关键字直接传递，还是通过 ndarray 或 Series 传递，都会保存至 DataFrame 操作。此外，不同数值型数据类型不会合并。示例如下：

In [335]: df1 = pd.DataFrame(np.random.randn(8, 1), columns=['A'], dtype='float32')

In [336]: df1
Out[336]: 
          A
0  0.224364
1  1.890546
2  0.182879
3  0.787847
4 -0.188449
5  0.667715
6 -0.011736
7 -0.399073

In [337]: df1.dtypes
Out[337]: 
A    float32
dtype: object

In [338]: df2 = pd.DataFrame({'A': pd.Series(np.random.randn(8), dtype='float16'),
   .....:                     'B': pd.Series(np.random.randn(8)),
   .....:                     'C': pd.Series(np.array(np.random.randn(8),
   .....:                                             dtype='uint8'))})
   .....: 

In [339]: df2
Out[339]: 
          A         B    C
0  0.823242  0.256090    0
1  1.607422  1.426469    0
2 -0.333740 -0.416203  255
3 -0.063477  1.139976    0
4 -1.014648 -1.193477    0
5  0.678711  0.096706    0
6 -0.040863 -1.956850    1
7 -0.357422 -0.714337    0

In [340]: df2.dtypes
Out[340]: 
A    float16
B    float64
C      uint8
dtype: object

默认值

整数的默认类型为 int64，浮点数的默认类型为 float64，这里的默认值与系统平台无关，不管是 32 位系统，还是 64 位系统都是一样的。下列代码返回的结果都是 int64：

In [341]: pd.DataFrame([1, 2], columns=['a']).dtypes
Out[341]: 
a    int64
dtype: object

In [342]: pd.DataFrame({'a': [1, 2]}).dtypes
Out[342]: 
a    int64
dtype: object

In [343]: pd.DataFrame({'a': 1}, index=list(range(2))).dtypes
Out[343]: 
a    int64
dtype: object

注意，Numpy 创建数组时，会根据系统选择类型。下列代码在 32 位系统上将返回 int32。

In [344]: frame = pd.DataFrame(np.array([1, 2]))

向上转型

与其它类型合并时，要用到向上转型，这里指的是从现有类型转换为另一种类型，如int 变为 float。

In [345]: df3 = df1.reindex_like(df2).fillna(value=0.0) + df2

In [346]: df3
Out[346]: 
          A         B      C
0  1.047606  0.256090    0.0
1  3.497968  1.426469    0.0
2 -0.150862 -0.416203  255.0
3  0.724370  1.139976    0.0
4 -1.203098 -1.193477    0.0
5  1.346426  0.096706    0.0
6 -0.052599 -1.956850    1.0
7 -0.756495 -0.714337    0.0

In [347]: df3.dtypes
Out[347]: 
A    float32
B    float64
C    float64
dtype: object

DataFrame.to_numpy() 返回多个数据类型里用的最多的数据类型，这里指的是输出结果的数据类型是适用于所有同质 Numpy 数组的数据类型。这里会强制执行向上转型。

In [348]: df3.to_numpy().dtype
Out[348]: dtype('float64')

astype

astype() 方法显式地把一种数据类型转换为另一种，默认返回的是复制数据，就算数据类型没有改变也会执行复制操作，copy=False 可以改变默认操作模式。此外，如果 astype 无效会触发异常。

向上转型一般都会遵循 numpy 的规则。如果操作中涉及两种不同类型的数据，返回的将是更通用的那种数据类型。

In [349]: df3
Out[349]: 
          A         B      C
0  1.047606  0.256090    0.0
1  3.497968  1.426469    0.0
2 -0.150862 -0.416203  255.0
3  0.724370  1.139976    0.0
4 -1.203098 -1.193477    0.0
5  1.346426  0.096706    0.0
6 -0.052599 -1.956850    1.0
7 -0.756495 -0.714337    0.0

In [350]: df3.dtypes
Out[350]: 
A    float32
B    float64
C    float64
dtype: object

# 转换数据类型
In [351]: df3.astype('float32').dtypes
Out[351]: 
A    float32
B    float32
C    float32
dtype: object

用 astype() 把一列或多列转换为指定类型。

In [352]: dft = pd.DataFrame({'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9]})

In [353]: dft[['a', 'b']] = dft[['a', 'b']].astype(np.uint8)

In [354]: dft
Out[354]: 
   a  b  c
0  1  4  7
1  2  5  8
2  3  6  9

In [355]: dft.dtypes
Out[355]: 
a    uint8
b    uint8
c    int64
dtype: object

0.19.0 版新增。

astype() 通过字典指定哪些列转换为哪些类型。

In [356]: dft1 = pd.DataFrame({'a': [1, 0, 1], 'b': [4, 5, 6], 'c': [7, 8, 9]})

In [357]: dft1 = dft1.astype({'a': np.bool, 'c': np.float64})

In [358]: dft1
Out[358]: 
       a  b    c
0   True  4  7.0
1  False  5  8.0
2   True  6  9.0

In [359]: dft1.dtypes
Out[359]: 
a       bool
b      int64
c    float64
dtype: object

用 astype() 与 loc() 为部分列转换指定类型时，会发生向上转型。

loc() 尝试分配当前的数据类型，而 [] 则会从右方获取数据类型并进行覆盖。因此，下列代码会产出意料之外的结果：

In [360]: dft = pd.DataFrame({'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9]})

In [361]: dft.loc[:, ['a', 'b']].astype(np.uint8).dtypes
Out[361]: 
a    uint8
b    uint8
dtype: object

In [362]: dft.loc[:, ['a', 'b']] = dft.loc[:, ['a', 'b']].astype(np.uint8)

In [363]: dft.dtypes
Out[363]: 
a    int64
b    int64
c    int64
dtype: object

对象转换

Pandas 提供了多种函数可以把 object 从一种类型强制转为另一种类型。这是因为，数据有时存储的是正确类型，但在保存时却存成了 object 类型，此时，用 DataFrame.infer_objects() 与 Series.infer_objects() 方法即可把数据软转换为正确的类型。

In [364]: import datetime

In [365]: df = pd.DataFrame([[1, 2],
   .....:                    ['a', 'b'],
   .....:                    [datetime.datetime(2016, 3, 2),
   .....:                     datetime.datetime(2016, 3, 2)]])
   .....: 

In [366]: df = df.T

In [367]: df
Out[367]: 
   0  1          2
0  1  a 2016-03-02
1  2  b 2016-03-02

In [368]: df.dtypes
Out[368]: 
0            object
1            object
2    datetime64[ns]
dtype: object

因为数据被转置，所以把原始列的数据类型改成了 object，但使用 infer_objects 后就变正确了。

In [369]: df.infer_objects().dtypes
Out[369]: 
0             int64
1            object
2    datetime64[ns]
dtype: object

下列函数可以应用于一维数组与标量，执行硬转换，把对象转换为指定类型。

`to_numeric()`，转换为数值型

In [370]: m = ['1.1', 2, 3]

In [371]: pd.to_numeric(m)
Out[371]: array([1.1, 2. , 3. ])

`to_datetime()`，转换为 datetime 对象

In [372]: import datetime

In [373]: m = ['2016-07-09', datetime.datetime(2016, 3, 2)]

In [374]: pd.to_datetime(m)
Out[374]: DatetimeIndex(['2016-07-09', '2016-03-02'], dtype='datetime64[ns]', freq=None)

`to_timedelta()`，转换为 timedelta 对象。

In [375]: m = ['5us', pd.Timedelta('1day')]

In [376]: pd.to_timedelta(m)
Out[376]: TimedeltaIndex(['0 days 00:00:00.000005', '1 days 00:00:00'], dtype='timedelta64[ns]', freq=None)

如需强制转换，则要加入 error 参数，指定 pandas 怎样处理不能转换为成预期类型或对象的数据。errors 参数的默认值为 False，指的是在转换过程中，遇到任何问题都触发错误。设置为 errors='coerce' 时，pandas 会忽略错误，强制把问题数据转换为 pd.NaT（datetime 与 timedelta），或 np.nan（数值型）。读取数据时，如果大部分要转换的数据是数值型或 datetime，这种操作非常有用，但偶尔也会有非制式数据混合在一起，可能会导致展示数据缺失：

In [377]: import datetime

In [378]: m = ['apple', datetime.datetime(2016, 3, 2)]

In [379]: pd.to_datetime(m, errors='coerce')
Out[379]: DatetimeIndex(['NaT', '2016-03-02'], dtype='datetime64[ns]', freq=None)

In [380]: m = ['apple', 2, 3]

In [381]: pd.to_numeric(m, errors='coerce')
Out[381]: array([nan,  2.,  3.])

In [382]: m = ['apple', pd.Timedelta('1day')]

In [383]: pd.to_timedelta(m, errors='coerce')
Out[383]: TimedeltaIndex([NaT, '1 days'], dtype='timedelta64[ns]', freq=None)

error 参数还有第三个选项，error='ignore'。转换数据时会忽略错误，直接输出问题数据：

In [384]: import datetime

In [385]: m = ['apple', datetime.datetime(2016, 3, 2)]

In [386]: pd.to_datetime(m, errors='ignore')
Out[386]: Index(['apple', 2016-03-02 00:00:00], dtype='object')

In [387]: m = ['apple', 2, 3]

In [388]: pd.to_numeric(m, errors='ignore')
Out[388]: array(['apple', 2, 3], dtype=object)

In [389]: m = ['apple', pd.Timedelta('1day')]

In [390]: pd.to_timedelta(m, errors='ignore')
Out[390]: array(['apple', Timedelta('1 days 00:00:00')], dtype=object)

执行转换操作时，to_numeric() 还有一个参数，downcast，即向下转型，可以把数值型转换为减少内存占用的数据类型：

In [391]: m = ['1', 2, 3]

In [392]: pd.to_numeric(m, downcast='integer')   # smallest signed int dtype
Out[392]: array([1, 2, 3], dtype=int8)

In [393]: pd.to_numeric(m, downcast='signed')    # same as 'integer'
Out[393]: array([1, 2, 3], dtype=int8)

In [394]: pd.to_numeric(m, downcast='unsigned')  # smallest unsigned int dtype
Out[394]: array([1, 2, 3], dtype=uint8)

In [395]: pd.to_numeric(m, downcast='float')     # smallest float dtype
Out[395]: array([1., 2., 3.], dtype=float32)

上述方法仅能应用于一维数组、列表或标量；不能直接用于 DataFrame 等多维对象。不过，用 apply()，可以快速为每列应用函数：

In [396]: import datetime

In [397]: df = pd.DataFrame([
   .....:     ['2016-07-09', datetime.datetime(2016, 3, 2)]] * 2, dtype='O')
   .....: 

In [398]: df
Out[398]: 
            0                    1
0  2016-07-09  2016-03-02 00:00:00
1  2016-07-09  2016-03-02 00:00:00

In [399]: df.apply(pd.to_datetime)
Out[399]: 
           0          1
0 2016-07-09 2016-03-02
1 2016-07-09 2016-03-02

In [400]: df = pd.DataFrame([['1.1', 2, 3]] * 2, dtype='O')

In [401]: df
Out[401]: 
     0  1  2
0  1.1  2  3
1  1.1  2  3

In [402]: df.apply(pd.to_numeric)
Out[402]: 
     0  1  2
0  1.1  2  3
1  1.1  2  3

In [403]: df = pd.DataFrame([['5us', pd.Timedelta('1day')]] * 2, dtype='O')

In [404]: df
Out[404]: 
     0                1
0  5us  1 days 00:00:00
1  5us  1 days 00:00:00

In [405]: df.apply(pd.to_timedelta)
Out[405]: 
                0      1
0 00:00:00.000005 1 days
1 00:00:00.000005 1 days

各种坑

对 integer 数据执行选择操作时，可以很轻而易举地把数据转换为 floating 。pandas 会保存输入数据的数据类型，以防未引入 nans 的情况。参阅对整数 NA 空值的支持。

In [406]: dfi = df3.astype('int32')

In [407]: dfi['E'] = 1

In [408]: dfi
Out[408]: 
   A  B    C  E
0  1  0    0  1
1  3  1    0  1
2  0  0  255  1
3  0  1    0  1
4 -1 -1    0  1
5  1  0    0  1
6  0 -1    1  1
7  0  0    0  1

In [409]: dfi.dtypes
Out[409]: 
A    int32
B    int32
C    int32
E    int64
dtype: object

In [410]: casted = dfi[dfi > 0]

In [411]: casted
Out[411]: 
     A    B      C  E
0  1.0  NaN    NaN  1
1  3.0  1.0    NaN  1
2  NaN  NaN  255.0  1
3  NaN  1.0    NaN  1
4  NaN  NaN    NaN  1
5  1.0  NaN    NaN  1
6  NaN  NaN    1.0  1
7  NaN  NaN    NaN  1

In [412]: casted.dtypes
Out[412]: 
A    float64
B    float64
C    float64
E      int64
dtype: object

浮点数类型未改变。

In [413]: dfa = df3.copy()

In [414]: dfa['A'] = dfa['A'].astype('float32')

In [415]: dfa.dtypes
Out[415]: 
A    float32
B    float64
C    float64
dtype: object

In [416]: casted = dfa[df2 > 0]

In [417]: casted
Out[417]: 
          A         B      C
0  1.047606  0.256090    NaN
1  3.497968  1.426469    NaN
2       NaN       NaN  255.0
3       NaN  1.139976    NaN
4       NaN       NaN    NaN
5  1.346426  0.096706    NaN
6       NaN       NaN    1.0
7       NaN       NaN    NaN

In [418]: casted.dtypes
Out[418]: 
A    float32
B    float64
C    float64
dtype: object

基于 `dtype` 选择列

select_dtypes() 方法基于 dtype 选择列。

首先，创建一个由多种数据类型组成的 DataFrame：

In [419]: df = pd.DataFrame({'string': list('abc'),
   .....:                    'int64': list(range(1, 4)),
   .....:                    'uint8': np.arange(3, 6).astype('u1'),
   .....:                    'float64': np.arange(4.0, 7.0),
   .....:                    'bool1': [True, False, True],
   .....:                    'bool2': [False, True, False],
   .....:                    'dates': pd.date_range('now', periods=3),
   .....:                    'category': pd.Series(list("ABC")).astype('category')})
   .....: 

In [420]: df['tdeltas'] = df.dates.diff()

In [421]: df['uint64'] = np.arange(3, 6).astype('u8')

In [422]: df['other_dates'] = pd.date_range('20130101', periods=3)

In [423]: df['tz_aware_dates'] = pd.date_range('20130101', periods=3, tz='US/Eastern')

In [424]: df
Out[424]: 
  string  int64  uint8  float64  bool1  bool2                      dates category tdeltas  uint64 other_dates            tz_aware_dates
0      a      1      3      4.0   True  False 2019-08-22 15:49:01.870038        A     NaT       3  2013-01-01 2013-01-01 00:00:00-05:00
1      b      2      4      5.0  False   True 2019-08-23 15:49:01.870038        B  1 days       4  2013-01-02 2013-01-02 00:00:00-05:00
2      c      3      5      6.0   True  False 2019-08-24 15:49:01.870038        C  1 days       5  2013-01-03 2013-01-03 00:00:00-05:00

该 DataFrame 的数据类型：

In [425]: df.dtypes
Out[425]: 
string                                object
int64                                  int64
uint8                                  uint8
float64                              float64
bool1                                   bool
bool2                                   bool
dates                         datetime64[ns]
category                            category
tdeltas                      timedelta64[ns]
uint64                                uint64
other_dates                   datetime64[ns]
tz_aware_dates    datetime64[ns, US/Eastern]
dtype: object

select_dtypes() 有两个参数，include 与 exclude，用于实现“提取这些数据类型的列” （include）或 “提取不是这些数据类型的列”（exclude）。

选择 bool 型的列，示例如下：

In [426]: df.select_dtypes(include=[bool])
Out[426]: 
   bool1  bool2
0   True  False
1  False   True
2   True  False

该方法还支持输入 NumPy 数据类型的名称：

In [427]: df.select_dtypes(include=['bool'])
Out[427]: 
   bool1  bool2
0   True  False
1  False   True
2   True  False

select_dtypes() 还支持通用数据类型。

比如，选择所有数值型与布尔型的列，同时，排除无符号整数：

In [428]: df.select_dtypes(include=['number', 'bool'], exclude=['unsignedinteger'])
Out[428]: 
   int64  float64  bool1  bool2 tdeltas
0      1      4.0   True  False     NaT
1      2      5.0  False   True  1 days
2      3      6.0   True  False  1 days

选择字符串型的列必须要用 object：

In [429]: df.select_dtypes(include=['object'])
Out[429]: 
  string
0      a
1      b
2      c

要查看 numpy.number 等通用 dtype 的所有子类型，可以定义一个函数，返回子类型树：

In [430]: def subdtypes(dtype):
   .....:     subs = dtype.__subclasses__()
   .....:     if not subs:
   .....:         return dtype
   .....:     return [dtype, [subdtypes(dt) for dt in subs]]
   .....:

所有 Numpy 数据类型都是 numpy.generic 的子类：

In [431]: subdtypes(np.generic)
Out[431]: 
[numpy.generic,
 [[numpy.number,
   [[numpy.integer,
     [[numpy.signedinteger,
       [numpy.int8,
        numpy.int16,
        numpy.int32,
        numpy.int64,
        numpy.int64,
        numpy.timedelta64]],
      [numpy.unsignedinteger,
       [numpy.uint8,
        numpy.uint16,
        numpy.uint32,
        numpy.uint64,
        numpy.uint64]]]],
    [numpy.inexact,
     [[numpy.floating,
       [numpy.float16, numpy.float32, numpy.float64, numpy.float128]],
      [numpy.complexfloating,
       [numpy.complex64, numpy.complex128, numpy.complex256]]]]]],
  [numpy.flexible,
   [[numpy.character, [numpy.bytes_, numpy.str_]],
    [numpy.void, [numpy.record]]]],
  numpy.bool_,
  numpy.datetime64,
  numpy.object_]]

注意：Pandas 支持 category 与 datetime64[ns, tz] 类型，但这两种类型未整合到 Numpy 的架构里，因此，上面的函数没有显示。

精选好文：

你可能感兴趣的:(Pandas中文官档~基础用法6)

一直在追梦的路上随梦起航
自大学毕业至今，始终如一地在追逐梦想的征程路上奔波，似乎不敢懈怠。怕自己的一时疏忽而与机遇失之交臂。其实，对于我们来说，所谓的奔波，不是朝九晚五工作中身体上的透支、也不是背着超出体能负荷量的行李爬山涉水、更不是为了生计而在风雨兼程中的奔波劳碌。而它是实现梦想过程中必经之路的一个代名词，对于每个人来说再熟悉不过的人生测试，从童年到少年到青年，每个阶段的升华都通过它来步步向前，就因为它，美好的童年时光
《红楼梦》之杨藏本（梦稿本）（之五）青埂峰下有情郎zjy
《红楼梦》之杨藏本（梦稿本）（之五）青埂峰下有情郎zjy文化领域创作者此处所谓“改本”及“兰墅定本”，应是相指1791年以后的程、高排印本而言，后面将再提到此点。在第103回第二页，有红笔勾抹一处，并添一“后”字。这是杨藏本中第三次出现红笔字。此外抄本中很多地方都有“杨继振”或“又云”的印鉴。这些印鉴多半都是表示在各册中原抄本起讫之处。检视杨藏本通篇文字，原抄本最初似乎是经过两道工序。第一道是一行
计算机视觉算法实战——关键点检测
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.引言关键点检测（KeypointDetection）是计算机视觉领域中的一个重要研究方向，旨在从图像或视频中检测出具有特定语义信息的关键点。这些关键点通常代表了物体的特定部位或特征，例如人体的关节、面部特征点、车辆的轮子等。关键点检测在姿态估计、动作识别、目标跟踪、三维重建等任务中
C回调函数基础用法
定义：回调函数是通过函数指针传递给另一个函数的函数，这个被传进去的函数将在某个时刻被“回调”调用。换句话说：你定义一个函数A把函数A的地址（即函数指针）作为参数传给函数B函数B在合适的时机调用A（即“回调”）作用：用于“动态行为”、插件机制、自定义逻辑注入，非常常见于库函数、操作系统、图形界面、信号处理等场景。回调函数=把函数指针作为参数传进去，在“合适时机”通过这个指针调用你传进去的函数。cod
php 二维数组按照指定的字段作为key Carver大脸猫后端笔记【PHP】php 开发语言
在PHP中，如果你有一个二维数组，并希望使用其中某个字段的值作为新数组的键（key），可以使用array_column()和array_combine()，或者使用foreach循环来实现。✅示例：使用array_column()和array_combine()假设你有如下二维数组：$data=[['id'=>1,'name'=>'Alice'],['id'=>2,'name'=>'Bob'],[
Tableau日常分析小技巧(2):数值中空值处理 Tableau日常小技巧
在日常分析中，我们常遇到数据源度量字段中有空值，那么，遇到这种情况我们如何在Tableau中做数据处理呢？数据源比较简单，如下图所示：将数据源导入TableauDesktop中，同时将类别放入‘行功能’,将销售额放入标记框文本中如图所示：表格中出现的空值是我们数据源中的缺失值，有两种方法可以处理缺失值方法一：使用zn()函数zn()函数表达式为zn(expression)表示如果表达式不为null
C++ Primer Plus 第6版中文版清晰有书签PDF+源代码
内容提要：C++是在C语言基础上开发的一种集面向对象编程、通用编程和传统的过程化编程于一体的编程语言，是C语言的超集。《C++PrimerPlus中文版》由StehpenPrata著，张海龙、袁国忠译：是根据2003年的ISO/ANSIC++标准编写的。通过大量短小精悍的程序详细而全面地阐述了C++的基本概念和技术。全书分为18章和10个附录，分别介绍了C++程序的运行方式、基本数据类型、复合数据
“希望是比钻石更珍贵的，在当下最需要的东西”，袁明辉《六项精进》打卡学习273天 YuanWelldon
流浪地球流浪地球姓名：袁明辉公司：宁波惠尔顿婴童安全科技股份有限公司364期学员组别：利他一组403期志工组别:谦虚一组宁波盛和塾8月月度学习会《用数字经营企业》志工宁波盛和塾道盛哲学全国企业家践行成果发表会志工【知～学习】背诵《六项精进大纲》3遍，共761遍。背诵《大学》3遍，共761遍。【经典名句分享】今天开启2019年农历新年计划一、修身1、背诵《般若波罗蜜多心经》0遍，共808遍2、陪女儿
乱了全乱了/亲情账户开通第347天情雪儿
践行中……生活被打乱了一、和母亲一起带孩子因为疫情，放假了，待在家想要做任何事情也做不了，只能带孩子。如果把两个孩子推给母亲一个人带，而我安心学习，也是一件不可能的事情，所以只能两个人一起带。在放假一周的时间里，慢慢从不适应到适应了当下的日子，逐渐趋于正常生活，但一个电话打破了一切。二、一个熟悉的电话电话铃响起，是侄子打来的，自从侄子从新疆姑姑家回来，一直没有见到母亲，所以非常想念母亲。侄子:奶奶
前缀和与差分（免费）（一维+二维，超详细） fjj20140622 算法 c++前缀和
一.一维前缀和一、核心概念‌定义‌前缀和是一种预处理技术，通过构建数组prefix[]，其中prefix[i]表示原数组arr前i个元素的和。例如：原数组：[1,3,5,7,9]前缀和数组：[1,4,9,16,25]（prefix[2]=1+3=4）数学表达‌递推公式：prefix[i]=prefix[i-1]+arr[i-1]（下标从1开始）区间和计算：sum[l,r]=prefix[r]-pr
博弈算法
有一种很有意思的游戏，就是有物体若干堆，可以是火柴棍或是围棋子等等均可。两个人轮流从堆中取物体若干，规定最后取光物体者取胜。这是我国民间很古老的一个游戏，别看这游戏极其简单，却蕴含着深刻的数学原理。下面我们来分析一下要如何才能够取胜。（一）巴什博奕（BashGame）：只有一堆n个物品，两个人轮流从这堆物品中取物，规定每次至少取一个，最多取m个。最后取光者得胜。显然，如果n=m+1，那么由于一次最
中原焦点团队网络中级第19期吕娟坚持分享第333天我心安然无恙
2020年3月24号约练收获本周第一，二次，总第26，27次。初21课程复盘咨询流程:关系，目标，资源，一小步。平常多读书，有些知识也许短时间用不上，但是，可以先储存着。知识有时候用不上，属功利心太强了。生活中并不缺少美，只是缺少发现美的眼睛。授之以鱼，不如授之以渔，不如授之以欲。有些家长是灭欲的。(自以为是，还不愿承认)有时候家长会说:我吃的盐比你吃的米都多。问题是你吃的盐是多年前的盐，不是现在
成长锦囊[82]：心理咨询师在个人成长中如何设定目标？素心人生设计
Q：素心，在进行个人自我成长时，我要如何确定设定自己的成长目标？心理咨询师小雨正在学习认知行为疗法技术，想要更熟练精通这个心理技术，也想要进行认知行为咨询师的自我成长，前来咨询。@素心人生设计：我们进入到个人成长的模块2：解析问题，为改变做准备。这个模块的目标是帮助你发现更多挑战性问题，并明确你希望这个问题如何改变。今天为大家分享识别优势、设定目标、优化目标和制定达成策略。在上一部分我们有了五因素
2018.6.30 今日份鸡汤沉不住气小姐
能通过后天努力得到的东西，就不要抱怨先天没给你了啊！因为抱怨没有用，还只会徒增烦恼。不如像这样给自己打打鸡汤，反而更利于撑下去。
晨间日记2021-2-03 蚊蚊幸福妈妈联盟
活在当下，少说多做，知行合一早睡早起5：30～10：30英语+家庭+经络【今日青蛙】点亮自己的明灯早上:大礼拜走路上班上午:上班小组作业中午:午休下午:上班晚上:潘多拉小组会经络【优秀是一种习惯，让开心成为一种习惯】事业～每天听1课~6/音频~2健康～跑步人脉～无家庭～锻炼理财～节制支出学习～潘多拉休闲～听歌心灵～大礼拜114
Win7 Hiberfil.sys pagefile.sys
调整和删除Win7休眠文件Hiberfil.sys释放C盘为了节省系统分区的硬盘空间，Windows7在计算机转入休眠之前，可以将内存数据进行0－50%比率的压缩，从而将Hiberfil.sys减小为物理内存大小的50%－100%。这个百分比可以通过POWERCFG命令配合-H-SIZE参数进行设置。首先要用管理员身份打开命令提示符如在物理内存容量12GB的Windows7计算机中，如果以管理员权
2023-03-21 卯金刀_fafd
师家大院中国大院看山西，山西的大院是非常多的，在山西全省各地都有分布，山西原何能出这么多私家大院，这离不开“晋商”，在明清时期，山西是中国最富有的省份之一，山西的商人富甲天下，晋商的兴起，首先是明朝"开中制"政策的实施，为晋商的发展提供了契机。明代沈思孝在《晋录》里的描述，广为研究者所征引:"平阳、泽、潞，豪商大贾甲天下，非数十万不称富。"其次，山西矿产资源丰富，手工业和加工制造业当时已初具规模，
【读书笔记】《Effective Modern C++》第二章：auto
《EffectiveModernC++》第二章：auto一、为何提倡使用autoC++11引入auto关键字，让编译器根据初始化表达式自动推导变量类型。在以下场景中，auto能简化代码、提升可维护性：减少冗长类型：泛型库、迭代器、函数返回类型经常写出极长的类型声明，使用auto可大幅精简。提高泛型代码可移植性：当底层容器或迭代器类型改变时，不必修改所有变量声明。减少拷贝错误：在使用右值和移动语义时
如果目前什么都不能做，就暂且先把自己交给生活七汐子
在生活中，我们都想成为主宰者，让生活按照自己的想法进行，于是，我们定下很多目标，计划，实施步骤以及做好完成记录，可是，在很多时候，我们在和生活较真时，往往是惨不忍睹，要么输得很惨，要么赢得很惨，前者是没有坚持计划，半途而废既浪费时间也浪费了精力；后者是完成了计划，却也在坚持中体无完肤。虽然骨子里的我们并不喜欢过着一种忙忙碌碌的生活，不喜欢成为一个碌碌无为的人，不喜欢半途而废，不喜欢被理想的自己抛弃
【人脸识别】FROM：提升遮挡状态下的人脸识别效果姚路遥遥人脸识别深度学习计算机视觉人工智能遮挡人脸识别损失
论文题目：《End2EndOccludedFaceRecognitionbyMaskingCorruptedFeatures》论文地址：https://arxiv.org/pdf/2108.09468v3.pdf代码地址：https://github.com/haibo-qiu/from1.前言人脸识别技术已经取得了显著的进展，主要归功于以下三个因素:lossfunctions:Centerlos
中原焦点团队网络初级第30期杨明霞分享第40天 54dea169dd4d
在咨询过程中，SFBT咨询师于当事人乃是一个治疗的团队，相互合作并一起进行实验。咨询师只是通过顾问角色及合作伙伴的关系，来协助当事人达成所欲的目标。SFBT咨询师对当事人怀有真诚好奇的心，尊重接纳当事人的各种知觉，视当事人为一独立完整的个体，鼓励当事人重视与信任自己体验生活的知觉与方式。SFBT咨询师是邀请的专家，是一个协助当事人辨识自己目标、优势与所欲改变方向的专家，是一个创造改变脉络，却不主导
高仿NB鞋在哪里买,推荐10个购买渠道桃朵桃朵
对于购买高仿NB鞋的需求，我理解您对高品质和真实感的追求。以下是我为您推荐的一些购买渠道：咨询加微信：FB2260(下单赠送精美礼品)1.品牌官方网站：一些知名运动品牌会在其官方网站上提供高仿鞋的销售信息，您可以关注官方微博或微信公众号等社交媒体平台了解最新动态。2.大型购物网站：如淘宝、京东等购物网站也提供了大量的高仿鞋销售信息，您可以在搜索框中输入关键词进行查找。但请注意，在选择时需要查看商品
VSCode中文显示乱码问题 Mind_lch C++学习笔记 c++学习笔记
1.中文显示乱码这是个很常见的问题，所以帮别人配置的时候一般也会帮忙搞一下首先点击左下角的齿轮按钮，打开Settings（设置）在搜索框中输入ecoding,然后如图把Encoding改成GBK（原来应该是UTF-8）设置完之后编辑有中文的文件就不会显示乱码啦！
stm32--软件模拟IIC GPL_6083 stm32 嵌入式硬件单片机
一、IIC基于stm32F103软件模拟IIC。IIC_SCL和IIC_SDA分别复用PB6和PB7IO口。二、具体代码1.头文件#ifndef__IIC_SW_H#define__IIC_SW_H//GPIOxODR和IDR寄存器地址映射#defineGPIOA_ODR_Addr(GPIOA_BASE+0x0C)//0x4001080C#defineGPIOB_ODR_Addr(GPIOB_BA
C++继承与组合的区别蓬莱道人 C/C++
1、继承与组合2、继承和组合的使用场景3、继承和组合的区别4、继承和组合的优缺点（1）继承的优缺点（2）组合的优缺点1、继承与组合C++程序开发中，设计孤立的类比较容易，设计相互关联的类却比较难，这其中会涉及两个概念，一个是继承(Inheritance)，一个是组合（Composition）。因为二者有一定的相似性，往往令程序员混淆不清。类的组合和继承一样，是软件重用的重要方式。组合和继承都是有效
2020.2.19工作总结Morial 雨滴教育Morial
1.中午视频会议0.5h今天周老师分享了细节的重要性，学到了要速度，还要效能。2.会议提前安排，发到家长群0.5h图片发自App3.雨滴日报制作0.5h4.课程内容交接，ppt修改，跟bibi沟通1h5.反馈表制作，视频剪辑，文字编辑1h今天学了第三单元的新课，重新编辑一些6.三节线上课4h6:00-7:00图片发自App这节课比上周好很多，孩子们表现的都非常好，今天跟bibi沟通，上课互动时间少
出国不出国之公民教育海豚沁M
今天看了公民教育的一部分内容，完全颠覆了我对北美国家对于尊重认识，原来一句玩笑话:你的屁真臭，在北美的公民教育体系中就是不尊重的表现，要接受time-out惩罚，而且还是算比较严重的惩罚。回望我们身边，别说孩子，大人都有时候会说这样的玩笑话，可是在北美教育体系中，这就是品德教育的核心内容。
渣土车识别漏检率高？陌讯算法实测降 90% 2501_92487936 目标跟踪人工智能计算机视觉目标检测算法智慧城市
在城市建筑垃圾运输管理中，渣土车的合规性监测一直是行业痛点。传统视觉算法在复杂工况下常常出现误判——阴雨天车牌识别模糊、夜间车灯眩光导致车型误分类、不同品牌渣土车混检时准确率骤降。某市政管理局的统计显示，采用传统方案时，日均漏检率高达23%，由此引发的违规倾倒投诉占比超60%。技术解析：从单模态到多特征融合的突破传统渣土车识别多依赖单一目标检测模型（如FasterR-CNN），其核心缺陷在于：特征
【日精进打卡第31天】扬州方圆__周亮
扬州方圆~~周亮【知～学习】复习水利考试基本知识《六项精进》3遍。累积93遍《大学》3遍。累积93遍【经典名句分享】积善行，思利他【行～实践】一、修身：（对自己个人）1、学习永无止境。二、齐家：（对家庭和家人）1、整理内务。三、建功：（对工作）1、在家休息。｛积善｝：发愿从2018年4月29日起2019年4月29日内完成730件善事。今日2善，累计62善。【省～觉悟】1、考试时间临近，抓紧复习，其
考场/工厂违规用机难捕捉？3维度优化方案部署成本直降40% 2501_92487762 视觉检测计算机视觉算法目标检测
开篇痛点工业场景中传统玩手机识别面临三重挑战：小目标检测（手机平均像素占比<0.5%）、遮挡干扰（人手/物体遮挡率超60%）、实时性要求（需200ms内响应）。某安检企业反馈，开源YOLOv5在车间场景误报率高达34%。技术解析：双流特征融合架构陌讯算法创新性融合双路径特征（图1）：#陌讯核心代码逻辑（简化版）defdual_path_fusion(backbone):shallow_path=C
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri