BIT_mk

Titanic-知识记录

current_directory = os.getcwd()
print(current_directory)

可以通过os.getcwd()获取当前工作目录的路径

pd.read_csv()和pd.read_table()的不同

pd.read_csv()和pd.read_table()都是Pandas库中用于读取文本文件的函数，但它们在默认参数和行为上有一些不同。

默认参数：
- pd.read_csv()的默认参数为sep=','，即默认使用逗号作为列之间的分隔符。
- pd.read_table()的默认参数为sep='\t'，即默认使用制表符作为列之间的分隔符。
行为：
- pd.read_csv()可以处理以逗号或其他指定分隔符分隔的文本文件。
- pd.read_table()可以处理以制表符或其他指定分隔符分隔的文本文件。

tsv'和'.csv'的不同

.tsv（Tab-Separated Values）是使用制表符（\t）作为列分隔符的文本文件格式。
.csv（Comma-Separated Values）是使用逗号（,）作为列分隔符的文本文件格式。

什么是逐块读取？为什么要逐块读取呢？

逐块读取（Chunking）是一种将大型数据集分成较小块进行逐个读取和处理的技术。它是处理大型数据集时常用的一种策略。

逐块读取的原理是将数据分割成多个较小的部分，每次读取和处理其中一部分，而不是一次性读取整个数据集。这样做的目的有几个原因：

内存效率：对于大型数据集，一次性加载整个数据集可能会导致内存不足的问题。逐块读取可以将数据集分成较小的块，每次只加载一部分数据到内存中，减少内存的占用。
提高性能：逐块读取可以提高数据处理的效率。处理大型数据集时，一次性读取整个数据集可能需要较长的加载时间。而逐块读取可以在读取和处理每个块时并行执行操作，从而减少整体处理时间。
处理数据流：某些情况下，数据可能以流的形式不断产生，而不是一次性存在于文件或内存中。逐块读取可以处理这种数据流，逐个读取和处理到达的数据块。

在实际应用中，逐块读取可以通过迭代器或分块读取方法来实现。Pandas库中的read_csv()函数可以使用chunksize参数来指定逐块读取的块大小，并返回一个可迭代的数据块对象。每个数据块都可以按需处理，以减少内存占用和提高性能。

chunker(数据块)是什么类型？用for循环打印出来出处具体的样子是什么？

chunker（或数据块对象）是一个可迭代的对象

for chunk in chunker:
    print(chunk)

header参数

header参数是pd.read_csv()函数中的一个可选参数，用于指定哪一行作为列名行。

header参数可以取以下值：

None：表示没有列名行。数据将被解析为列索引的整数序列。
0：表示第一行是列名行。
整数值（如n）：表示第n行是列名行。
列名列表：传入一个字符串列表作为列名。列表的长度应与数据的列数相匹配。

df.head()

df.head()是一个Pandas DataFrame对象的方法，用于显示DataFrame的前几行数据，默认显示前5行。

dataframe对象

DataFrame对象是Pandas库中的一种数据结构，它提供了一种二维的、标记的数据结构，类似于表格或电子表格的形式。

DataFrame由行和列组成，每一列可以包含不同的数据类型（例如数值、字符串、布尔值等）。它类似于一个二维的表格，每列有一个唯一的列名，每行有一个唯一的索引。

DataFrame的主要特点包括：

标签索引：DataFrame的行和列都可以使用标签进行索引，可以通过标签轻松访问和操作数据。
灵活的数据操作：DataFrame提供了多种方法来操作和处理数据，包括数据筛选、切片、分组、合并等功能。
处理缺失值：DataFrame内置了处理缺失值的方法，可以轻松地处理和填充缺失的数据。
数据对齐：DataFrame可以根据行和列的索引自动对齐数据，使数据的操作更加方便和准确。
丰富的功能和工具：Pandas库为DataFrame提供了许多功能和工具，例如统计分析、数据可视化、数据导入和导出等。

DataFrame对象是Pandas库中最常用的数据结构之一，它提供了方便且高效的方式来处理和分析结构化数据。可以通过pd.DataFrame()函数创建DataFrame对象，也可以通过读取外部文件（如CSV、Excel等）获得DataFrame对象。

df.info()

查看数据信息

df.isnull().head()

判断是否为空值

保存数据

df.to_csv('train_chinese.csv')

series

Series是Pandas库中的一种数据结构，它是一维标记的数组，类似于带有标签的列表。

Series由两部分组成：索引（index）和值（values）。索引是一组标签，用于唯一标识Series中的每个元素，而值则是相应的数据。

Series的主要特点包括：

一维结构：Series是一维的数据结构，类似于一个带有索引的数组。
标签索引：每个值都有一个与之关联的索引标签，通过索引可以快速定位和访问对应的值。
不同数据类型：Series可以包含不同的数据类型，如整数、浮点数、字符串、布尔值等。
向量化操作：Series支持向量化操作，可以对整个Series进行快速的数值计算和操作。
缺失值处理：Series提供了对缺失值的处理方法，例如通过NaN（Not a Number）表示缺失值。
自动对齐数据：在进行数据操作时，Series会自动根据索引对齐数据，使得操作更加方便和准确。

可以使用pd.Series()函数创建Series对象，传递一个列表或数组作为数据，并可以选择性地指定索引。此外，许多Pandas函数和操作返回的结果也是Series对象。

dataframe和series的例子

查询每列的名称

查询船票信息这列的值--两种方式

删除多余列的方式

使用del关键字：可以使用del关键字直接从DataFrame中删除列。例如：
```
del test_1['a']
test_1.head(3)
```
使用pop()方法：pop()方法可以删除指定列，并返回删除的列作为一个Series对象。例如：
```
removed_col = df.pop('列名')
```
使用drop()函数并指定columns参数：可以使用drop()函数来删除多个列，通过指定columns参数传递要删除的列名列表。例如：
```
df = df.drop(columns=['列名1', '列名2', ...])
```
使用布尔索引：可以通过布尔索引选择要保留的列，而忽略其他列。例如：
```
columns_to_keep = ['列名1', '列名2', ...] df = df[columns_to_keep]
```

将['PassengerId','Name','Age','Ticket']这几个列元素隐藏，只观察其他几个列元素

df.drop(['PassengerId','Name','Age','Ticket'],axis=1).head(3)

axis参数的作用

在Pandas中，axis参数可以取两个值：

axis=0：表示沿着行的方向进行操作。当指定axis=0时，drop()方法将删除指定的行。
axis=1：表示沿着列的方向进行操作。当指定axis=1时，drop()方法将删除指定的列。

如果想要完全的删除你的数据结构，使用inplace=True，因为使用inplace就将原数据覆盖了

df.drop(['PassengerId','Name','Age','Ticket'], axis=1, inplace=True)

在这种情况下，原始的DataFrame将被修改，删除了指定的列，不再包含这些列。这样可以避免创建新的DataFrame对象，节省内存空间。

需要注意的是，使用inplace=True参数时要谨慎，因为就地修改是不可逆的，无法恢复到原始数据结构。因此，在使用inplace=True时，建议在操作前确保对数据结构的修改是正确和符合预期的。

以"Age"为筛选条件，显示年龄在10岁以下的乘客信息。

以"Age"为条件，将年龄在10岁以上和50岁以下的乘客信息显示出来，并将这个数据命名为midage

midage = df[(df['Age'] > 10) & (df['Age'] < 50)]

将midage的数据中第100行的"Pclass"和"Sex"的数据显示出来

midage = midage.reset_index(drop=True)

midage.reset_index()：reset_index()方法用于重置DataFrame对象的索引。它会创建一个新的DataFrame对象，其中包含原始DateFrame的值，并为每个值分配一个默认的整数索引，并将原来的索引作为新的列添加到DataFrame中。
drop=True：drop=True参数是reset_index()方法的一个可选参数，用于指定是否丢弃原来的索引列。当设置为True时，将丢弃原来的索引列，仅保留新的整数索引列。如果设置为False，则保留原来的索引列作为新的列。

使用loc方法将midage的数据中第100，105，108行的"Pclass"，"Name"和"Sex"的数据显示出来

midage.loc[[100,105,108],['Pclass','Name','Sex']]

使用iloc方法将midage的数据中第100，105，108行的"Pclass"，"Name"和"Sex"的数据显示出来

midage.iloc[[100,105,108],[3,4,5]]

对比iloc和loc的异同

异同点如下：

索引类型：
- iloc使用基于整数的位置索引，通过传递整数索引值来选择数据。例如，df.iloc[0]选择第一行的数据。
- loc使用基于标签的索引，通过传递标签值来选择数据。例如，df.loc[0]选择标签索引为0的行的数据。
索引范围：
- iloc使用基于0的整数索引范围，可以使用切片或整数列表来选择多个连续或不连续的行或列。例如，df.iloc[1:5]选择索引为1到4的行。
- loc使用基于标签的索引范围，可以使用切片或标签列表来选择多个连续或不连续的行或列。例如，df.loc[1:5]选择标签索引为1到5的行。
用法：
- iloc主要用于基于位置进行选择和索引，适用于对行和列进行数值索引的情况。
- loc主要用于基于标签进行选择和索引，适用于对行和列进行标签索引的情况。

数据清洗简述

我们拿到的数据通常是不干净的，所谓的不干净，就是数据中有缺失值，有一些异常点等，需要经过一定的处理才能继续做后面的分析或建模，所以拿到数据的第一步是进行数据清洗，本章我们将学习缺失值、重复值、字符串和数据转换等操作，将数据清洗成可以分析或建模的样子。

缺失值观察

(1) 请查看每个特征缺失值个数

df.info()

df.isnull().sum()

(2) 请查看Age， Cabin， Embarked列的数据以上方式都有多种方式，所以建议大家学习的时候多多益善

df[['Age', 'Cabin', 'Embarked']].head(3)

对缺失值进行处理

(1)处理缺失值一般有几种思路

检索空缺值用np.nan,None以及.isnull()哪个更好，这是为什么？如果其中某个方式无法找到缺失值，原因又是为什么？

在Pandas中，np.nan和None都用于表示缺失值。对于检索空缺值，一般使用.isnull()方法。

np.nan是NumPy库中定义的特殊值，用于表示缺失值或不可用值。它通常在Pandas中被用作缺失值的标识。可以使用np.isnan()函数来检测np.nan值。
None是Python中的空值对象，常用于表示缺失值或未知值。在Pandas中，当将Python的None值用于Series或DataFrame时，Pandas会自动将其转换为np.nan。
.isnull()方法是Pandas的DataFrame和Series对象的方法，用于检测缺失值。它返回一个布尔值的DataFrame或Series，指示哪些元素是缺失值（为True）。

通常情况下，推荐使用.isnull()方法来检索缺失值，原因如下：

一致性：.isnull()方法适用于Pandas的DataFrame和Series对象，提供了一致的方式来检测缺失值，无论是使用np.nan还是None表示。
灵活性：.isnull()方法可以与其他Pandas函数和方法（如过滤、填充等）结合使用，方便进行数据清洗和处理。
兼容性：.isnull()方法可以检测多种类型的缺失值，包括np.nan和由None转换的np.nan。

如果某个特定方式无法找到缺失值，可能是因为以下原因：

当使用其他方式（如直接比较等）时，可能无法正确处理np.nan值或None值，导致无法准确检测缺失值。
在特定情况下，数据中的缺失值可能以其他形式表示，而不是np.nan或None。这可能导致使用.isnull()方法时无法找到缺失值。

在读取数值列的数据后，空缺值的数据类型通常会被解析为float64。在这种情况下，使用None进行索引可能无法准确地找到缺失值，因为None通常被解析为object类型。

相比之下，使用np.nan作为缺失值的表示更加适用于数值列，因为np.nan是专门用来表示缺失值的浮点数。在处理数值数据时，通常使用np.nan来标记缺失值，并进行相应的缺失值处理操作。

当使用np.nan时，可以使用.isnull()方法来检测缺失值。.isnull()方法会正确地识别出np.nan值，并返回一个布尔值的DataFrame或Series，指示哪些元素是缺失值（为True）。

df.dropna().head(3)

使用dropna()方法删除包含缺失值的行

dropna()

axis：指定删除的轴方向。默认值为0，表示删除包含缺失值的行；设置为1表示删除包含缺失值的列。
how：指定删除的方式。可选值包括：
- 'any'：如果行或列中存在任何缺失值，则删除。
- 'all'：只有当行或列中的所有元素都是缺失值时才删除。
subset：指定需要进行缺失值检查的列或行的子集。可以传递一个列名或多个列名组成的列表。默认值为None，表示检查所有列或行。
thresh：指定每行或每列至少要包含的非缺失值数量。当非缺失值数量低于该阈值时，对应的行或列将被删除。
inplace：指定是否对原始DataFrame进行就地修改。默认值为False，表示返回一个新的DataFrame对象；设置为True时，将就地修改原始DataFrame。

import pandas as pd

# 创建DataFrame对象
data = {'A': [1, 2, None, 4],
        'B': [5, None, None, 8],
        'C': [9, 10, 11, 12]}
df = pd.DataFrame(data)

# 删除包含缺失值的行
df.dropna(axis=0, how='any', subset=['A', 'B'], inplace=True)

print(df)

df.fillna(0).head(3)

fillna(0)：fillna()方法用于填充缺失值。在这个例子中，使用参数0表示将缺失值填充为0。

fillna()

value：指定用于填充缺失值的值。可以是一个具体的数值、字符串、字典或Series对象。常见的取值包括数字（如0、1）、字符串（如'Unknown'）或列的平均值等。
method：指定用于填充缺失值的方法。常用的取值包括：
- 'pad'或'ffill'：使用前一个非缺失值进行前向填充。
- 'backfill'或'bfill'：使用后一个非缺失值进行后向填充。
axis：指定填充的轴方向。默认为0，表示沿着索引的垂直方向（按列填充）。设置为1时，表示沿着列的水平方向（按行填充）。
inplace：指定是否对原始DataFrame进行就地修改。默认为False，表示返回一个新的填充后的DataFrame对象；设置为True时，将就地修改原始DataFrame。
limit：指定在连续缺失值的情况下，要填充的最大连续缺失值数量。

import pandas as pd

# 创建含有缺失值的DataFrame
data = {'A': [1, None, 3, None, 5],
        'B': [None, 'x', 'y', None, 'z']}
df = pd.DataFrame(data)

# 填充缺失值为0
filled_df = df.fillna(0)

# 使用前向填充方法填充缺失值
ffilled_df = df.fillna(method='ffill')

# 沿着行的方向，使用前一个非缺失值进行填充
filled_df_along_axis = df.fillna(method='ffill', axis=1)

print(filled_df)
print(ffilled_df)
print(filled_df_along_axis)

查看数据中的重复值

df[df.duplicated()]

duplicated()方法用于检测DataFrame中的重复行。默认情况下，它会检查所有列，并将重复的行标记为True，非重复的行标记为False。

对整个行有重复值的清理

df = df.drop_duplicates()
df.head()

特征观察与处理

我们对特征进行一下观察，可以把特征大概分为两大类：
数值型特征：Survived ，Pclass， Age ，SibSp， Parch， Fare，其中Survived， Pclass为离散型数值特征，Age，SibSp， Parch， Fare为连续型数值特征
文本型特征：Name， Sex， Cabin，Embarked， Ticket，其中Sex， Cabin， Embarked， Ticket为类别型文本特征。

数值型特征一般可以直接用于模型的训练，但有时候为了模型的稳定性及鲁棒性会对连续变量进行离散化。文本型特征往往需要转换成数值型特征才能用于建模分析。

任务一：对年龄进行分箱（离散化）处理

(1) 分箱操作是什么？

分箱操作，也称为离散化或区间划分，是将连续的数值数据分割成离散的区间或箱子的过程。它将连续的数值范围划分为不同的间隔或区间，将数据映射到相应的区间中。

分箱的主要目的是将连续的数值数据转化为离散的分类变量，以便更好地理解和分析数据。通过将数据分组到不同的箱子中，可以发现数据的分布特征、提取统计信息，并减少数据的噪声和复杂性。

在分箱操作中，需要选

择适当的分箱策略和方法。常见的分箱方法包括等宽分箱和等频分箱：

等宽分箱（等距分箱）：将数据范围均匀地划分为固定数量的箱子，每个箱子的宽度相等。这种方法适用于数据分布均匀的情况，但可能无法准确地捕捉到数据的分布特征。
等频分箱：将数据分为具有相同数量观测值的箱子，以确保每个箱子内的观测数量大致相等。这种方法适用于处理数据分布不均匀的情况，可以更好地捕捉到数据的分布特征。

df['AgeBand'] = pd.cut(df['Age'], 5, labels=[1, 2, 3, 4, 5])

pd.cut()

x：要进行分箱操作的数据。可以是一维的Series对象或NumPy数组。
bins：指定分箱的方式。可以传递整数、序列或标量。常见的取值包括：
- 整数：表示要将数据划分为等宽的指定数量的箱子。
- 序列：表示要使用自定义的箱子边界，序列中的值指定每个箱子的边界。
- 标量：表示要使用指定的算法来计算箱子的数量和边界。
labels：指定分箱后每个箱子的标签。可以是一个列表或数组，用于标识每个分箱区间的名称或类别。
right：指定分箱区间的闭合方式。默认为True，表示右闭合（包含右边界），False表示左闭合（不包含右边界）。
include_lowest：指定是否将最小值包含在第一个箱子中。默认为False，表示不包含最小值。
precision：指定分箱边界的精度。默认为0，表示保留整数精度。

import pandas as pd

data = [1, 3, 5, 2, 4, 6, 8, 7, 9, 10]
bins = [0, 3, 6, 9, 10]

# 执行分箱操作
result = pd.cut(data, bins, labels=['Low', 'Medium', 'High', 'Very High'])

print(result)

对文本变量进行转换

(1) 查看文本变量名及种类

series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)

value_counts()是Pandas中的一个函数，用于计算一个Series中每个唯一值的频数。它返回一个新的Series对象，其中索引是唯一值，而值是对应的频数。

series：要计算频数的Series对象。

参数:

normalize：默认为False。如果设置为True，则返回频数的相对频率，而不是绝对频数。
sort：默认为True。如果设置为True，则按频数进行排序。如果设置为False，则不进行排序。
ascending：默认为False。如果设置为True，则按频数升序排序。如果设置为False，则按频数降序排序。
bins：仅适用于数值数据。如果指定了bins参数，则将数值数据分箱，并计算每个箱子的频数。
dropna：默认为True。如果设置为True，则排除缺失值（NaN）并计算非缺失值的频数。如果设置为False，则包括缺失值并计算缺失值的频数。

unique()获取包含唯一值的数组，nunique()获取包含唯一值的个数

将类别文本转换为数字

方法一：

方法二：

方法三 :

map()方法

series.map(arg, na_action=None)

arg：可以是一个字典、函数或可迭代对象。用于指定映射关系或转换规则。
- 字典：将字典的键作为原始值，字典的值作为映射结果。
- 函数：将函数应用于每个元素，并将结果作为映射结果。
- 可迭代对象：根据可迭代对象中的顺序依次映射每个元素。
na_action：可选参数，用于指定处理缺失值（NaN）的方式。默认为None，表示保留缺失值。可设置为ignore，表示忽略缺失值。

df[feat + "_labelEncode"] = lbl.fit_transform(df[feat].astype(str))

astype() 是 Pandas 中的一个方法，用于将 Series 或 DataFrame 中的数据转换为指定的数据类型。

lbl.fit_transform()

fit_transform() 是 LabelEncoder 类中的一个方法，用于对数据进行拟合（fit）和转换（transform）的组合操作。它常用于将分类特征转换为数值编码。

将类别文本转换为one-hot编码

for feat in ['Age', 'Embarked']:
    x = pd.get_dummies(df[feat], prefix=feat)
    df = pd.concat([df, x], axis=1)
df.head()

从纯文本Name特征里提取出Titles的特征(所谓的Titles就是Mr,Miss,Mrs等)

df['Title'] = df.Name.str.extract('([A-Za-z]+)\.', expand=False)

使用concat方法：将数据train-left-up.csv和train-right-up.csv横向合并为一张表，并保存这张表为result_up

list_up = [text_left_up,text_right_up]
result_up = pd.concat(list_up,axis=1)
result_up.head()

使用concat方法：将train-left-down和train-right-down横向合并为一张表，并保存这张表为result_down。然后将上边的result_up和result_down纵向合并为result

list_down = [text_left_down, text_right_down]
result_down = pd.concat(list_down, axis=1)
result_down.head()

result = pd.concat([result_up, result_down], axis=0)
result.head()

使用DataFrame自带的方法join方法和append：完成任务二和任务三的任务

使用Panads的merge方法和DataFrame的append方法：完成任务二和任务三的任务

result_up = pd.merge(text_left_up,text_right_up,left_index=True,right_index=True)
result_down = pd.merge(text_left_down,text_right_down,left_index=True,right_index=True)
result = resul_up.append(result_down)
result.head()

left_on 和 right_on：可选参数，表示左右 DataFrame 中用于合并的列名。当左右DataFrame 中的列名不同时，可以使用这两个参数指定各自的列名。
left_index 和 right_index：可选参数，默认为 False，表示是否使用索引进行合并。如果设置为 True，则表示使用索引进行合并，而不使用列名。

将我们的数据变为Series类型的数据

unit_result=text.stack().head(20)
unit_result.head()

DataFrame.stack() 函数，它用于将 DataFrame 进行堆叠操作，将列标签转换为行索引，生成一个多层次索引的 Series。

import pandas as pd

data = {'Name': ['John', 'Alice', 'Bob'],
        'Age': [25, 30, 22],
        'City': ['New York', 'London', 'Paris']}

df = pd.DataFrame(data)

# 将 DataFrame 进行堆叠操作
stacked_series = df.stack()

print(stacked_series)

输出结果：

0  Name         John
   Age            25
   City     New York
1  Name        Alice
   Age            30
   City       London
2  Name          Bob
   Age            22
   City        Paris
dtype: object

groupby机制：和SQL里group by的机制一样

计算泰坦尼克号男性与女性的平均票价

df  = text['Fare'].groupby(text['Sex'])
means = df.mean()
means

统计泰坦尼克号中男女的存活人数

survived_sex = text['Survived'].groupby(text['Sex']).sum()
survived_sex

计算客舱不同等级的存活人数

survived_pclass = text['Survived'].groupby(text['Pclass']).sum()
survived_pclass

agg（）

在 Pandas 中，agg() 函数用于对 DataFrame 或 Series 进行聚合计算，它允许你同时应用多个聚合函数（如求和、均值、最大值、最小值等）来对数据进行汇总或统计。

这些运算可以通过agg()函数来同时计算。并且可以使用rename函数修改列名。

text.groupby('Sex').agg({'Fare': 'mean', 'Pclass': 'count'}).rename(columns=
                            {'Fare': 'mean_fare', 'Pclass': 'count_pclass'})

统计在不同等级的票中的不同年龄的船票花费的平均值

text.groupby(['Pclass','Age'])['Fare'].mean().head()

得出不同年龄的总的存活人数，然后找出存活人数最多的年龄段，最后计算存活人数最高的存活率（存活人数/总人数）

survived_age = text['Survived'].groupby(text['Age']).sum().head()

找出存活人数最多的年龄段

survived_age[survived_age.values==survived_age.max()]

survived_age.values==survived_age.max()：这部分代码执行一个比较操作，检查 survived_age 中的每个值是否等于存活人数最多的年龄段的幸存者的年龄。返回的结果是一个布尔类型的数组，其中值为 True 表示对应位置的年龄与存活人数最多的年龄相同，值为 False 表示不相同。

_sum = text['Survived'].sum()

print("sum of person:"+str(_sum))

precetn =survived_age.max()/_sum

print("最大存活率："+str(precetn))

你可能感兴趣的:(数据分析,数据分析)

基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
数据分析常用指标名词解释及计算公式走过冬季学习笔记数据分析大数据
数据分析中有大量常用指标，它们帮助我们量化业务表现、用户行为、产品健康度等。下面是一些核心指标的名词解释及计算方式，按常见类别分类：一、流量与用户规模指标页面浏览量名词解释：用户访问网站或应用时，每次加载或刷新一个页面就算一次PV。它衡量的是页面被打开的总次数。计算方式：PV=∑(所有页面被加载的次数)(通常由埋点或日志直接统计)独立访客数名词解释：在特定时间范围内（如一天、一周、一月），访问网站
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
python-pandas数据分析+案例分析
文章目录前言一、汽车销售数据可视化分析1.各年度汽车总销量及环比，各车类、级别车辆销量及环比2.车辆销售规模及环比、不同价位车销量及环比3.各车系、厂商、品牌车销量及环比，市占率及变化趋势4.品牌、车类、车型、级别的各top销量二、地质灾害航空公司客户价值分析1.原始数据存在少量的缺失值和异常值前言一、汽车销售数据可视化分析1.各年度汽车总销量及环比，各车类、级别车辆销量及环比importnump
数据分析案例-电脑笔记本价格数据可视化分析3 艾派森数据分析信息可视化 python 数据分析数据挖掘电脑
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具
用Python做数据分析之数据统计学掌门 Python 数据分析大数据 python 数据分析人工智能
接下来说说数据统计部分，这里主要介绍数据采样，标准差，协方差和相关系数的使用方法。1、数据采样Excel的数据分析功能中提供了数据抽样的功能，如下图所示。Python通过sample函数完成数据采样。2、数据抽样Sample是进行数据采样的函数，设置n的数量就可以了。函数自动返回参与的结果。1#简单的数据采样2df_inner.sample(n=3)3、简单随机采样Weights参数是采样的权重，
pandas销售数据分析
pandas销售数据分析数据保存在data目录消费者数据：customers.csv商品数据：products.csv交易数据：transactions.csvcustomers.csv数据结构：字段描述customer_id客户IDgender性别age年龄region地区membership_date会员日期products.csv数据结构：字段描述product_id产品IDcategory
Python数据分析：从入门到精通
引言在当今数据驱动的时代，数据分析已成为企业和组织做出明智决策的关键。Python作为一种强大的编程语言，因其简洁性和丰富的数据分析库而成为数据科学领域的首选工具。无论你是初学者还是有一定经验的数据分析师，本指南都将带你从入门到精通Python数据分析，掌握必备技能和最佳实践。数据分析的重要性与Python的角色数据分析涉及收集、处理和解释数据，以揭示模式、趋势和见解。它有助于解决复杂问题，优化业
数据分析框架和方法 XiaoQiong.Zhang 人工智能
一、核心分析框架(TheBigPictureFrameworks)描述性分析(WhatHappened?)目的：了解过去发生了什么，描述现状，监控业务健康。核心工作：汇总、聚合、计算基础指标(KPI)，生成报表和仪表盘。常用方法/指标：计数/求和/平均值/中位数：DAU/MAU，总销售额，客单价等。比率：转化率，点击率，流失率，毛利率等。分布：用户活跃度分布、订单金额分布、地域分布等。常用于理解群
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
【数据分析】多数据集网络分析：探索健康与退休研究中的变量关系生信学习者1 数据分析 (2025版)数据分析 r语言数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理函数网络分析画图保存图片总结系统信息介绍在医学和社会科学研究中，理解多个变量之间的复杂关系对于揭示潜在的病理生理机制和社会行为模式至关重要。本文介绍了一种基于R语言的网络分析方法，用于探索HRS（健康与退休研究）及其类似研究（CHARLS、ELSA、MHAS、SHARE）中的变
基于Python的旅游数据可视化应用
摘要本文详细介绍了一个功能完善的基于Python语言开发的旅游行业数据可视化分析应用系统。该系统采用Pandas这一强大的数据处理库进行数据清洗、转换和预处理工作，确保数据质量可靠。在可视化展示方面，系统整合了Matplotlib和Seaborn两大主流可视化库，通过丰富的图表类型直观呈现数据分析结果。特别值得一提的是，所有可视化图表均采用统一的绿色主题配色方案，这种设计不仅美观大方，更能突出体现
Pandas 学习教程 _pass_ Data-Alaysis pandas 信息可视化
目录定义基本操作一维数组操作二维数组操作数据选择过滤数据处理数据清洗数据转换数据分析排序分组聚合数据透视表高级操作合并数据时间序列处理自定义函数调用数据可视化集成数据导出和导入大数据分块处理定义全称：'paneldata'and'pythondataanalysis'Analy:Series(一维数据)、DataFrame(二维数据)主要应用：数据清洗：处理缺失数据、重复数据等数据转换：改变数据的
【kafka】在Linux系统中部署配置Kafka的详细用法教程分享景天科技苑 linux基础与进阶 shell脚本编写实战 kafka linux 分布式 kafka安装配置 kafka优化
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面应用开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，云原生K8S，Prometheus监控，数据分析，Django
动态时间规整（Dynamic Time Warping，DTW）介绍 EmorZhong 机器学习人工智能深度学习数据结构算法
在时序数据分析中，动态时间规整（DynamicTimeWarping，DTW）是一种经典的用于度量两个时间序列相似度的算法。它的核心价值在于解决了传统距离度量（如欧氏距离）在处理时间序列时的局限性——尤其是当序列存在时间错位（如节奏快慢不同）或长度差异时，仍能准确捕捉它们的“形状相似性”。一、为什么需要DTW？传统的距离度量（如欧氏距离）要求两个时间序列必须长度相同且时间点严格对齐。但实际场景中，
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
一文搞懂怎么入门大模型
在人工智能飞速发展的当下，大模型已然成为推动众多领域创新变革的核心力量。无论是在智能客服、内容创作，还是数据分析、科学研究等方面，大模型都展现出了令人瞩目的能力。对于渴望踏入大模型领域的初学者而言，构建一个系统且全面的入门路径至关重要。接下来，我们将以DeepSeek为例，详细阐述如何系统地入门大模型。一、理论基础：搭建认知框架在深入实践之前，理解大模型的基础理论是关键。大模型，通常指具有海量参数
从零到一：王者荣耀英雄数据采集与技能图谱异步爬虫实战程序员威哥爬虫 python 开发语言自动化 scrapy
引言：随着游戏行业的迅猛发展，王者荣耀作为一款深受玩家喜爱的手游，其英雄数据和技能信息成为了爬虫开发者研究的热点之一。通过抓取英雄数据并对技能图谱进行可视化，我们不仅能够更好地理解游戏数据，还可以为游戏爱好者或数据分析师提供一个有价值的数据分析平台。本篇文章将带你一步步实现王者荣耀英雄数据的采集与技能图谱的可视化，并使用异步爬虫技术提高爬取效率。我们将结合实际开发中的需求，深入讲解如何使用异步爬虫
【HTML网页】智能健康监测——全方位健康管理专家（包含网页源代码）
智能健康监测分析系统智能健康监测分析系统是一种基于物联网、大数据、人工智能等技术的综合性健康管理解决方案。它具有以下六大核心功能：实时监测系统通过智能传感器和可穿戴设备，实时采集用户的生理数据，例如心率、血压、血氧饱和度、血糖水平和睡眠质量等，确保用户随时掌握自己的身体状况。健康数据分析利用人工智能和大数据分析技术，系统对采集到的数据进行处理和分析，提取有价值的健康信息，如心率变异性、呼吸频率等，
【字节跳动】数据挖掘面试题0010：解释全国人均收入下降，各省份人均收入增加的现象，属于辛普森悖论（开放性问题）言析数智数据挖掘常见面试题辛普森悖论局部与整体分析差异归因数据分析面试题
文章大纲一、辛普森悖论的核心定义二、现象成因：加权平均中的“权重偏移”三、数学逻辑与案例说明1.数学表达式2.具体案例四、辛普森悖论的本质：忽略“混杂因素”的影响五、生活中常见的辛普森悖论案例及应对策略1.医疗疗法效果评估2.大学录取率的性别偏差3.篮球运动员投篮效率4.公司员工绩效与部门规模如何利用辛普森悖论？（数据分析中的价值）六、总结全国人均收入下降而各省份人均收入增加的现象，确实属于辛普森
大模型学习应用 6: Vercel 部署自动获取微信公众号文章获取项目大地之灯大模型应用与学习学习微信大模型应用开发 python github flask
大模型落地开发实战指南！请关注微信公众号：「AGI启程号」深入浅出，助你轻松入门！数据分析、深度学习、大模型与算法的综合进阶，尽在CSDN博客主页本文将详细介绍如何在Vercel平台上部署自动微信公众号文章获取项目，包括项目结构、代码实现、部署流程以及常见问题的解决方案。注意：本项目源代码github链接，可自行克隆到自己的代码仓库完成vercel部署，注意需要稳定ip输出（微信白名单需求），免费
ChatGPTNextChat项目重构计划（九）：NextChat 解析API路由处理逻辑 stream.ts
大模型落地开发实战指南！请关注微信公众号：「AGI启程号」深入浅出，助你轻松入门！数据分析、深度学习、大模型与算法的综合进阶，尽在CSDN博客主页目录一、文件作用概述二、导入模块与类型定义三、核心函数详细解析`fetch(url,options)`四、`fetch`函数详细步骤解析步骤1:检测Tauri环境并准备请求参数步骤2:创建数据流(`TransformStream`)步骤3:定义关闭数据流
x86架构CPU市场格局 InnoLink_1024 芯片架构硬件架构
x86架构的CPU市场是全球处理器市场的核心，涵盖PC（桌面端与移动端）、服务器和超算等领域，主要玩家为英特尔（Intel）和AMD。以下基于最新数据分析市场格局及各领域份额，辅以国产厂商动态。1.总体市场概况x86架构因其成熟的生态系统和强大的兼容性，在PC和服务器市场占据主导地位。根据2024年数据，x86架构在服务器CPU市场占约91%的份额，而ARM等其他架构（如华为鲲鹏、飞腾）占约8%，
Julia爬取数据能力及应用场景 q56731523 julia 开发语言
Julia是一种高性能编程语言，特别适合数值计算和数据分析。然而，关于数据爬取（即网络爬虫）方面，我们需要明确以下几点：虽然它是一门通用编程语言，但它的强项不在于网络爬取（WebScraping）这类任务。而且Julia的生态系统在爬虫方面还不够成熟和丰富。所以说Julia爬取数据后立即进行高性能的数据分析这点还是有一些优势。Julia虽然以高性能数值计算和数据分析见长，但它同样具备网络爬取（We
用Python的Chartify库，商业数据可视化效率提升13倍！忆愿 Python编程的脉动之声 python opencv 人工智能计算机视觉深度学习神经网络机器学习
文章目录为啥要用Chartify？安装那些事儿从零开始画图基础柱状图进阶折线图散点图与气泡图专业数据分析必备技能多维度分析时间序列分析高级可视化技巧自定义主题交互式特性批量图表生成性能优化技巧大数据集处理内存优化实战案例：销售数据分析系统数据可视化这事儿，搞过的都知道有多费劲。用matplotlib画个图要调半天参数，才能让图表看起来稍微顺眼一点；seaborn虽然画出来的图确实好看，但是配置项太
Python 机器学习核心入门与实战进阶 Day 8 - 数据建模与分析项目实战预备：项目规划与需求拆解蓝婷儿 python python 机器学习开发语言
✅今日目标理解数据分析/建模项目的一般流程练习项目需求理解与目标拆解明确后续模型评估指标与预期交付成果起草项目计划文档（可选写为Markdown）一、项目背景与题目建议（可选方向）项目名称简介学生成绩预测分析系统根据历史表现预测成绩是否达标、学科薄弱点等求职者简历筛选模型根据简历信息预测是否通过初筛电商用户购买预测系统分析用户行为数据预测是否购买公司销售数据趋势分析可视化+聚合分析：月销售趋势、区
从零开始：使用Python进行数据分析的基础指南热爱分享的博士僧 python 数据分析开发语言
引言在当今数据驱动的世界中，数据分析已成为各行各业不可或缺的技能。无论是商业决策、科学研究还是产品优化，掌握数据分析都能帮助我们更好地理解问题、发现规律并做出明智的判断。而Python作为一门简洁、强大且生态丰富的编程语言，已经成为数据分析领域的首选工具之一。本篇文章将带你从零开始，逐步了解如何使用Python进行基础的数据分析。无论你是完全没有编程经验的新手，还是有一定基础但想系统学习数据分析的
TensorBase开发者快速入门指南宗隆裙
TensorBase开发者快速入门指南tensorbasetensorbase/tensorbase:是一个现代的GPU加速的张量数据库。适合用于大规模数据分析和机器学习。项目地址:https://gitcode.com/gh_mirrors/te/tensorbase前言TensorBase是一个基于Rust构建的高性能时序数据库，专为大规模数据分析场景设计。本文将详细介绍如何搭建TensorB
R 语言数据框连接操作详解：join 与 merge 方法对比晚风keeper r语言开发语言学习笔记学习方法
在数据分析工作中，我们经常需要将多个数据集按照某些条件进行合并。R语言提供了多种数据框连接方法，本文将详细介绍如何使用dplyr包的join系列函数和基础R的merge函数进行数据框的各种连接操作，并对比它们之间的差异。一、数据框连接操作概述数据框连接是将两个或多个数据框按照某些共同的列或条件组合成一个新的数据框的过程。常见的连接类型包括：左连接（LeftJoin）：保留左数据框的所有行，匹配右数
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?