Ricardo_记忆心扉

DataWhale_动手学数据分析（第一章）

第一章：数据基本操作

Part1：数据载入及初步观察

1、载入数据

1.1 导入库，载入数据
1.2 每1000行为一个数据模块，逐块读取
1.3 将表头改成中文，index索引改为乘客ID

2、初步观察

2.1 查看数据的基本信息
2.2 表格前10行的数据和后15行的数据
2.3 判断数据是否为空，为空的地方返回True，有数据地方为 False

2.4 保存数据

Part2：pandas基础

3、知道数据叫什么

3.1 数据类型：DateFrame 和 Series
3.2 载入"train.csv"文件, 查看DataFrame数据的每列的项
3.3 查看"cabin"这个column的所有项 [有多种方法]
① 方法1：df['Cabin'].head(3)
② 方法2：df.Cabin.head(3)
3.4 加载文件"test.csv"，然后对比"train.csv"，看看有哪些多出的列，然后将多出的列删除
3.5 将['PassengerId','Name','Age','Ticket']这几个列元素隐藏，只观察其他几个列元素

4、筛选

4.1 以"Age"为筛选条件，显示年龄<10岁的乘客
4.2 以"Age"为条件，显示年龄在10岁以上和50岁以下的乘客信息，并将这个数据命名为midage
4.3 将midage数据中第100行的"Pclass"和"Sex"的数据显示出来
4.4 loc() 将 midage的数据第100，105，108行的"Pclass"，"Name"和"Sex"显示出来
4.5 iloc() 将midage数据第100，105，108行对应的"Pclass"，"Name"和"Sex"显示出来

Part3：探索数据分析

5、导入中文列表

5.1 利用Pandas对示例数据进行排序
5.2 按票价和年龄两列进行（降序排列）
5.3 计算两个DataFrame数据相加结果
5.4 计算出在船上最大的家族有多少人？
5.5 describe() 查看数据基本统计信息
5.6 查看泰坦尼克号数据集中 ‘票价’、‘父母子女’ 这列数据的基本统计数据

Part1：数据载入及初步观察

1、载入数据

1.1 导入库，载入数据

>>> import numpy as np
>>> import pandas as pd
>>> df = pd.read_csv('E:/python/titanic/train.csv')
>>> df.head(3)
Out[3]: 
   PassengerId  Survived  Pclass  ...     Fare Cabin  Embarked
0            1         0       3  ...   7.2500   NaN         S
1            2         1       1  ...  71.2833   C85         C
2            3         1       3  ...   7.9250   NaN         S

【思考】pd.read_csv() 和 pd.read_table() 的不同，了解一下’.tsv’和’.csv’的不同，如何加载这两个数据集？
CSV文件读写.

# tsv 数据格式：
>>> tf = pd.read_table('titanic/train.csv')
>>> tf

Out[22]: 
    PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
0    1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/...                             
1    2,1,1,"Cumings, Mrs. John Bradley (Florence Br...                             
2    3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,S...                             
3    4,1,1,"Futrelle, Mrs. Jacques Heath (Lily May ...                             
4    5,0,3,"Allen, Mr. William Henry",male,35,0,0,3...                             
..                                                 ...                             
886  887,0,2,"Montvila, Rev. Juozas",male,27,0,0,21...                             
887  888,1,1,"Graham, Miss. Margaret Edith",female,...                             
888  889,0,3,"Johnston, Miss. Catherine Helen ""Car...                             
889  890,1,1,"Behr, Mr. Karl Howell",male,26,0,0,11...                             
890  891,0,3,"Dooley, Mr. Patrick",male,32,0,0,3703...                             

[891 rows x 1 columns]

# csv 数据格式：
>>> df 
    PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
0    1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/...                             
1    2,1,1,"Cumings, Mrs. John Bradley (Florence Br...                             
2    3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,S...                             
3    4,1,1,"Futrelle, Mrs. Jacques Heath (Lily May ...                             
4    5,0,3,"Allen, Mr. William Henry",male,35,0,0,3...                             
..                                                 ...                             
886  887,0,2,"Montvila, Rev. Juozas",male,27,0,0,21...                             
887  888,1,1,"Graham, Miss. Margaret Edith",female,...                             
888  889,0,3,"Johnston, Miss. Catherine Helen ""Car...                             
889  890,1,1,"Behr, Mr. Karl Howell",male,26,0,0,11...                             
890  891,0,3,"Dooley, Mr. Patrick",male,32,0,0,3703...                             

[891 rows x 1 columns]

1.2 每1000行为一个数据模块，逐块读取

>>> chunker = pd.read_csv('titanic/train.csv', chunksize=1000)
>>> print(chunker)
<pandas.io.parsers.TextFileReader object at 0x000002E5A8697648>

【思考】什么是逐块读取？为什么要逐块读取呢？
使用pandas来处理文件的时候，经常会遇到大文件，而有时候我们只想要读取其中的一部分数据或对文件进行逐块处理。
1、读取文件中前部分
通过nrows参数，来设置读取文件的前多少行，nrows是一个大于等于0的整数。

 data = pd.read_csv('titanic/train.csv',nrows=5)

2、逐块读取文件

chunker = pd.read_csv('titanic/train.csv', chunksize=1000)

1.3 将表头改成中文，index索引改为乘客ID

>>> df = pd.read_csv('titanic/train.csv', names=['乘客ID','是否幸存','仓位等级','姓名','性别','年龄','兄弟姐妹个数','父母子女个数','船票信息','票价','客舱','登船港口'],index_col='乘客ID',header=0)
>>> df.head()
Out[13]: 
      是否幸存  仓位等级  ...    客舱 登船港口
乘客ID              ...           
1        0     3  ...   NaN    S
2        1     1  ...   C85    C
3        1     3  ...   NaN    S
4        1     1  ...  C123    S
5        0     3  ...   NaN    S

[5 rows x 11 columns]

2、初步观察

观察数据大小、有多少列，各列都是什么格式的，是否包含null等

2.1 查看数据的基本信息

>>> df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 891 entries, 1 to 891
Data columns (total 11 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   是否幸存    891 non-null    int64  
 1   仓位等级    891 non-null    int64  
 2   姓名      891 non-null    object 
 3   性别      891 non-null    object 
 4   年龄      714 non-null    float64
 5   兄弟姐妹个数  891 non-null    int64  
 6   父母子女个数  891 non-null    int64  
 7   船票信息    891 non-null    object 
 8   票价      891 non-null    float64
 9   客舱      204 non-null    object 
 10  登船港口    889 non-null    object 
dtypes: float64(2), int64(4), object(5)
memory usage: 83.5+ KB

2.2 表格前10行的数据和后15行的数据

>>> df.head(10)   #表格的前10行
Out[15]: 
      是否幸存  仓位等级  ...    客舱 登船港口
乘客ID              ...           
1        0     3  ...   NaN    S
2        1     1  ...   C85    C
3        1     3  ...   NaN    S
4        1     1  ...  C123    S
5        0     3  ...   NaN    S
6        0     3  ...   NaN    Q
7        0     1  ...   E46    S
8        0     3  ...   NaN    S
9        1     3  ...   NaN    S
10       1     2  ...   NaN    C

[10 rows x 11 columns]

>>> df.tail(15)  #表格的后15行
Out[16]: 
      是否幸存  仓位等级  ...    客舱 登船港口
乘客ID              ...           
877      0     3  ...   NaN    S
878      0     3  ...   NaN    S
879      0     3  ...   NaN    S
880      1     1  ...   C50    C
881      1     2  ...   NaN    S
882      0     3  ...   NaN    S
883      0     3  ...   NaN    S
884      0     2  ...   NaN    S
885      0     3  ...   NaN    S
886      0     3  ...   NaN    Q
887      0     2  ...   NaN    S
888      1     1  ...   B42    S
889      0     3  ...   NaN    S
890      1     1  ...  C148    C
891      0     3  ...   NaN    Q

[15 rows x 11 columns]

2.3 判断数据是否为空，为空的地方返回True，有数据地方为 False

df.isnull().head()
Out[17]: 
       是否幸存   仓位等级     姓名     性别     年龄  ...  父母子女个数   船票信息     票价     客舱   登船港口
乘客ID                                     ...                                    
1     False  False  False  False  False  ...   False  False  False   True  False
2     False  False  False  False  False  ...   False  False  False  False  False
3     False  False  False  False  False  ...   False  False  False   True  False
4     False  False  False  False  False  ...   False  False  False  False  False
5     False  False  False  False  False  ...   False  False  False   True  False

[5 rows x 11 columns]

【思考】对于一个数据，还可以从哪些方面来观察？找找答案，这个将对下面的数据分析有很大的帮助

df.notnull().head()   # 有数据地方为 True

2.4 保存数据

将你加载并做出改变的数据，在工作目录下保存为一个新文件train_chinese.csv

df.to_csv('titanic/train_chinese.csv')

Part2：pandas基础

3、知道数据叫什么

3.1 数据类型：DateFrame 和 Series

# Series类型
>>> sdata = {'Beijing': 35000, 'Tianjin': 71000, 'Shanghai': 16000, 'Chongqin': 5000}
>>> example_1 = pd.Series(sdata)
>>> example_1
Out[3]: 
Beijing     35000
Tianjin     71000
Shanghai    16000
Chongqin     5000
dtype: int64

# DataFrame类型
>>> data = {'state': ['Beijing', 'Beijing', 'Beijing', 'Tianjin', 'Tianjin', 'Tianjin'],
            'year': [2000, 2001, 2002, 2001, 2002, 2003],'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
>>> example_2 = pd.DataFrame(data)
>>> example_2
Out[3]: 
Beijing     35000
Tianjin     71000
Shanghai    16000
Chongqin     5000
dtype: int64

3.2 载入"train.csv"文件, 查看DataFrame数据的每列的项

>>> df = pd.read_csv('titanic/train.csv') 
>>> df.head(3)
Out[4]: 
   PassengerId  Survived  Pclass  ...     Fare Cabin  Embarked
0            1         0       3  ...   7.2500   NaN         S
1            2         1       1  ...  71.2833   C85         C
2            3         1       3  ...   7.9250   NaN         S
[3 rows x 12 columns]

>>> df.columns
Out[5]: 
Index(['PassengerId', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'SibSp',
       'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'],
      dtype='object')

3.3 查看"cabin"这个column的所有项 [有多种方法]

① 方法1：df[‘Cabin’].head(3)

>>> df['Cabin'].head(3)
Out[6]: 
0    NaN
1    C85
2    NaN
Name: Cabin, dtype: object

② 方法2：df.Cabin.head(3)

>>> df.Cabin.head(3)
Out[7]: 
0    NaN
1    C85
2    NaN
Name: Cabin, dtype: object

3.4 加载文件"test.csv"，然后对比"train.csv"，看看有哪些多出的列，然后将多出的列删除

>>> test = pd.read_csv('titanic/test.csv')
>>> test.head(3)

删除多余的列

# 删除多余的列
del test['a']

【思考】还有其他的删除多余的列的方式吗？

DataFrame对象.drop('str')  可以删除指定行、列索引

3.5 将[‘PassengerId’,‘Name’,‘Age’,‘Ticket’]这几个列元素隐藏，只观察其他几个列元素

df.drop(['PassengerId','Name','Age','Ticket'],axis=1).head(3)
Out[11]: 
   Survived  Pclass     Sex  SibSp  Parch     Fare Cabin Embarked
0         0       3    male      1      0   7.2500   NaN        S
1         1       1  female      1      0  71.2833   C85        C
2         1       3  female      0      0   7.9250   NaN        S
# 如果想要完全的删除你的数据结构，使用inplace=True，因为使用inplace就将原数据覆盖了，所以这里没有用

4、筛选

4.1 以"Age"为筛选条件，显示年龄<10岁的乘客

>>> df[df["Age"]<10].head(3)
Out[12]: 
    PassengerId  Survived  Pclass  ...    Fare Cabin  Embarked
7             8         0       3  ...  21.075   NaN         S
10           11         1       3  ...  16.700    G6         S
16           17         0       3  ...  29.125   NaN         Q

4.2 以"Age"为条件，显示年龄在10岁以上和50岁以下的乘客信息，并将这个数据命名为midage

>>> midage = df[(df["Age"]>10)& (df["Age"]<50)]
>>> midage.head(3)
Out[13]: 
   PassengerId  Survived  Pclass  ...     Fare Cabin  Embarked
0            1         0       3  ...   7.2500   NaN         S
1            2         1       1  ...  71.2833   C85         C
2            3         1       3  ...   7.9250   NaN         S
[3 rows x 12 columns]

4.3 将midage数据中第100行的"Pclass"和"Sex"的数据显示出来

>>> midage = midage.reset_index(drop=True)
>>> midage.head(3)
Out[14]: 
   PassengerId  Survived  Pclass  ...     Fare Cabin  Embarked
0            1         0       3  ...   7.2500   NaN         S
1            2         1       1  ...  71.2833   C85         C
2            3         1       3  ...   7.9250   NaN         S
[3 rows x 12 columns]

>>> midage.loc[[100],['Pclass','Sex']]
Out[17]: 
     Pclass   Sex
100       2  male

4.4 loc() 将 midage的数据第100，105，108行的"Pclass"，"Name"和"Sex"显示出来

>>> midage.loc[[100,105,108],['Pclass','Name','Sex']] #因为你主动的延长了行的距离，所以会产生表格形式
Out[15]: 
     Pclass                               Name   Sex
100       2  Byles, Rev. Thomas Roussel Davids  male
105       3           Cribb, Mr. John Hatfield  male
108       3                    Calic, Mr. Jovo  male

4.5 iloc() 将midage数据第100，105，108行对应的"Pclass"，"Name"和"Sex"显示出来

>>> midage.iloc[[100,105,108],[2,3,4]]
Out[16]: 
     Pclass                               Name   Sex
100       2  Byles, Rev. Thomas Roussel Davids  male
105       3           Cribb, Mr. John Hatfield  male
108       3                    Calic, Mr. Jovo  male

Part3：探索数据分析

5、导入中文列表

text = pd.read_csv('train_chinese.csv')
text.head()

5.1 利用Pandas对示例数据进行排序

# 构建一个DataFrame数据
frame = pd.DataFrame(np.arange(8).reshape((2, 4)), 
                     index=['2', '1'], 
                     columns=['d', 'a', 'b', 'c'])
# 表格2*4，行索引index，列索引colums
frame

# 对‘C’ column进行排序，降序
frame.sort_values(by='c', ascending=False)

# 对行index进行排序，升序
frame.sort_index() 

# 对列索引排序，排序
frame.sort_index(axis=1)

# 对列索引排序，降序
frame.sort_index(axis=1, ascending=False)

# 让任选两列数据 a、c 同时降序排序
frame.sort_values(by=['a', 'c'])

5.2 按票价和年龄两列进行（降序排列）

text.sort_values(by=['票价', '年龄'], ascending=False).head(50)   # 前50名

text.sort_values(by=['票价', '年龄'], ascending=False).tail(50)   # 后50名

可以发现票价最高的前50名乘客，存活率很大

5.3 计算两个DataFrame数据相加结果

frame1_a = pd.DataFrame(np.arange(9.).reshape(3, 3),
                     columns=['a', 'b', 'c'],
                     index=['one', 'two', 'three'])
frame1_b = pd.DataFrame(np.arange(12.).reshape(4, 3),
                     columns=['a', 'e', 'c'],
                     index=['first', 'one', 'two', 'second'])
frame1_a:
		a	b	c
one		0.0	1.0	2.0
two		3.0	4.0	5.0
three	6.0	7.0	8.0

frame1_b:
		a	e	c
first	0.0	1.0	2.0
one		3.0	4.0	5.0
two		6.0	7.0	8.0
second	9.0	10.0 11.0

frame1_a + frame1_b:
		a	b	c	e
first	NaN	NaN	NaN	NaN
one		3.0	NaN	7.0	NaN
second	NaN	NaN	NaN	NaN
three	NaN	NaN	NaN	NaN
two		9.0	NaN	13.0 NaN
'''DataFrame对应的位置数值进行了相加，不存在的位置返回了NaN'''

5.4 计算出在船上最大的家族有多少人？

max(text['兄弟姐妹个数'] + text['父母子女个数'])

5.5 describe() 查看数据基本统计信息

frame2 = pd.DataFrame([[1.4, np.nan], 
                       [7.1, -4.5],
                       [np.nan, np.nan], 
                       [0.75, -1.3]
                      ], index=['a', 'b', 'c', 'd'], columns=['one', 'two'])
frame2
	one  two
a	1.40 NaN
b	7.10 -4.5
c	NaN  NaN
d	0.75 -1.3

# 调用 describe 函数，观察frame2的数据基本信息
frame2.describe()
'''
count : 样本数据大小
mean : 样本数据的平均值
std : 样本数据的标准差
min : 样本数据的最小值
25% : 样本数据25%的时候的值
50% : 样本数据50%的时候的值
75% : 样本数据75%的时候的值
max : 样本数据的最大值
'''

5.6 查看泰坦尼克号数据集中 ‘票价’、‘父母子女’ 这列数据的基本统计数据

text['票价'].describe()

可以看出平均值=32 和 max=512，有着非常大的差距，标准差49.69，票价的波动也很大，整艘船的贫富差距是非常大的，

text['父母子女个数'].describe()

电影智能推荐系统风又起而叶落地 pandas
电影智能推荐系统背景介绍人们经常会在视频平台上观看影片，有时目标明确，想要观看某部电影，但有时仅仅是随机搜寻。如果视频平台可以利用基于物品的智能推荐系统，有效地从用户对其观看过的电影的评分中挖掘数据，便可以根据用户偏好的电影个性化地推荐更多类似的电影，优化用户体验，提高用户粘性，创造额外收入。分析步骤读取数据数据分析合并电影数据和评分数据计算每部电影的评分均值计算每部电影的“评分次数”创建数据透视
Python Pandas数据清洗与处理大数据张老师 Python程序设计 python pandas 开发语言
PythonPandas数据清洗与处理在进行数据分析时，原始数据往往包含了许多不完整、不准确或者冗余的信息。数据清洗与处理的任务就是将这些杂乱无章的数据清理干净，确保数据的准确性和一致性，从而为后续的分析工作打下坚实的基础。Pandas提供了强大的工具来帮助我们清洗和处理数据，尤其是在处理Series和DataFrame时，它能够高效地进行数据的筛选、填充、删除、替换等操作。本节将通过一些常见的数
基于大数据的电影数据分析可视化系统设计与应用 AI架构设计之禅大数据AI人工智能 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于大数据的电影数据分析可视化系统设计与应用作者：禅与计算机程序设计艺术1.背景介绍1.1大数据时代的电影行业随着互联网技术和数字化的发展,电影行业已经进入大数据时代。每天都有海量的电影相关数据在各个平台上生成,包括票房数据、评分数据、影评数据等。这些数据蕴含着巨大的价值,如果能够有效地分析和利用,将为电影行业的发展提供重要的决策支持。1.2电影数据分析与可视化的意义1.2.1洞察电影市场趋势通过
信息学奥赛c++语言:求分数序列和敲代码的八戒信息学奥赛c++c++算法开发语言数据结构
题目描述有一个分数序列q1/p1，q2/p2，q3/p3，q4/p4，q5/p5，....,其中q(i+1)=qi+pi，p(i+1)=qi，p1=1，q1=2。比如这个序列前6项分别是2/1,3/2,5/3,8/5,13/8,21/13,求这个分数序列的前n项之和。输入输入有一行，包含一个正整数n(n≤30)。输出输出有一行，包含一个浮点数，表示分数序列前n项的和，精确到小数点后4位。样例输入2
分享wind量化交易平台接口编程代码「已注销」 python 开发语言
相信做股票投资的的人对于wind应该很熟悉，它是一个比较高端的金融数据服务商，有很多人做数据分析之前，一定都需要到wind上看看相关资料，但是wind上面的信息非常多，如果可以通过量化交易接口进行筛选，操作起来就会方面很多了，今日我们就来分享一组wind量化交易平台接口的编程代码。importpandasaspdfromWindPyimport*fromdatetimeimport*importt
【实践】Python实现气象数据分析与可视化大数据张老师 Python程序设计信息可视化 python 数据分析可视化
一、项目需求在本节中，我们将明确“气象数据分析与可视化”项目的需求，定义项目的功能和目标，为后续的实现奠定基础。通过本项目，读者将学习如何使用Python的各种数据处理和可视化工具来分析和展示气象数据，从而掌握数据处理与可视化的核心技能。1.项目目标“气象数据分析与可视化”项目的目标是通过对历史气象数据的处理和分析，生成直观的图表和统计结果，帮助用户理解气象趋势并预测未来变化。项目的主要功能如下：
证券量化交易选择合适的编程语言 jcsx 量化 numpy pandas pyqt servlet javascript
在证券量化交易中，选择合适的编程语言至关重要，因为它直接影响到开发效率、运行速度和策略的灵活性。常用的编程语言有几个，它们各自有不同的优势和应用场景。以下是一些在量化交易中常用的编程语言：PythonPython是目前量化交易中最流行的编程语言之一，特别是在金融数据分析和模型开发中，广泛被使用。Python的流行主要有以下原因：数据处理能力：Python有非常强大的数据处理库，如pandas（数据
从零开始学设计模式(四)：工厂模式（Factory Pattern）江夏、 Java Java基础设计模式 java 工厂模式设计模式
作者平台：|CSDN：blog.csdn.net/qq\_4115394…|掘金：juejin.cn/user/651387…|知乎：www.zhihu.com/people/1024…|GitHub：github.com/JiangXia-10…|公众号：1024笔记本文大概11588字，读完共需25分钟定义工厂模式(FactoryPattern)也是Java中最常用的设计模式之一。这种类型的设
C++练习(5道) c++初学者ABC C++c++C++练习
今天来练习一下C++（有错请指出）1.练50.1查分程序题目描述尼克，格莱尔等5位同学进行了一次信息学测试，试编一程序，实现查分功能。先输入成绩，然后输入学号输入相应的成绩。输入a1∼a5的成绩，并输入学号1∼5。输出输出该学号成绩样例输入复制999899100923样例输出复制99思路：输入a数组，输入x，输出a[x-1];代码：#includeusingnamespacestd;intmain
2025美赛数学建模MCM/ICM选题建议与分析，思路+模型+代码灿灿数模数学建模
2025美赛数学建模MCM/ICM选题建议与分析,思路+模型+代码，详细更新见文末名片一、问题A：测试时间：楼梯的恒定磨损（ArchaeologicalModeling）适合专业：考古学、历史学、数学、机械工程难度：中等开放度：中等问题A让学生探索如何根据楼梯的磨损情况推断楼梯的使用情况。这个问题涉及到对磨损的定量分析，并通过历史记录推测使用模式。该题目适合对历史、考古以及机械磨损有兴趣的学生，尤
Python数据分析案例教程 kkchenjj 数据挖掘 python 数据分析信息可视化
Python数据分析案例教程Python在数据分析中的应用Python因其简洁的语法、强大的库支持以及广泛的社区资源，已成为数据分析领域的首选语言。它能够处理从数据清洗、数据可视化到机器学习模型构建的整个数据科学流程。本节将深入探讨Python在数据分析中的具体应用，包括但不限于数据清洗、数据探索、统计分析和预测建模。数据清洗数据清洗是数据分析的首要步骤，涉及处理缺失值、异常值、重复数据以及数据类
系统架构设计中的需求分析与建模 Evaporator Core 系统架构设计师软考信息系统项目管理师基础班系统架构需求分析
引言在系统架构设计的过程中，需求分析是至关重要的一步。需求分析不仅决定了系统的功能和非功能需求，还为后续的设计和开发提供了基础。一个成功的系统架构设计必须建立在对需求的深刻理解之上。本文将深入探讨需求分析的方法与建模技术，帮助读者掌握如何通过有效的需求分析来指导系统架构设计。第一章：需求分析的重要性需求分析是系统架构设计的起点，它的目的是明确系统的功能需求、非功能需求以及约束条件。功能需求描述了系
Python全网最全基础课程笔记(十三)——作用域，跟着思维导图和图文来学习，爆肝2w字，无数代码案例！长风清留扬最新Python入门基础合集 python 笔记学习作用域面试跳槽改行学it
本专栏系列为Pythong基础系列，每篇内容非常全面，包含全网各个知识点，非常长，请耐心看完。每天都会更新新的内容，搜罗全网资源以及自己在学习和工作过程中的一些总结，可以说是非常详细和全面。以至于为什么要写的这么详细：自己也是学过Python的，很多新手只是简单的过一篇语法，其实对于一个知识点的底层逻辑和其他使用方法以及参数详情根本不是很了解，这就导致学完很容易忘记，而且在实战过程中也是半知半解，
Python全网最全基础课程笔记(三)——所有运算符+运算符优先级长风清留扬最新Python入门基础合集开发语言 python 运算符 Python基础 numpy pandas pip
本专栏系列为Pythong基础系列，每天都会更新新的内容，搜罗全网资源以及自己在学习和工作过程中的一些总结，可以说是非常详细和全面。以至于为什么要写的这么详细：自己也是学过Python的，很多新手只是简单的过一篇语法，其实对于一个知识点的底层逻辑和其他使用方法以及参数详情根本不是很了解，这就导致学完很容易忘记，而且在实战过程中也是半知半解，所以自己就尽量写的详细些，让需要的人能更了解Python的
金融数据有哪些，有用的股票API接口数据 nance99 金融 python git
一、金融数据有哪些，有用的股票API接口行情数据金融大数据是为金融机构、个人投资者以及金融应用开发者提供专业的数据和行情报价API服务，满足不同用户在投资过程中丰富多样的行情数据分析和投资研究，以API接口形式为用户提供行情数据API服务，提供的数据包括市场行情、财报、宏观等，还有基于文本分析的股票关联数据。对金融机构或者投资者而言，金融数据是企业财富。实时数据对企业成功至关重要，股票行情数据种类
微信小程序-点餐（美食屋）02开发实践你我哈微信小程序微信小程序小程序美食 html php
目录概要整体架构流程（一）用户注册与登录（二）菜品浏览与点餐（三）订单管理（四）后台管理部分代码展示1.index.wxml2.list.wxml3.checkout.wxml4.detail.wxml小结优点概要01篇让我们成功搭建开发环境，现在让我们着手开发“美食屋”点餐系统了。下面，我会用PHP和MySQL实现系统核心功能，像用户注册登录、展示和管理菜品，以及处理订单。快一起动手，让“美食屋
【技术点】用SQL语言操作关系型数据库Mysql中的数据（有练习资料） ^Mark_Zhang^ 后端开发数据库 sql mysql
用SQL语言操作关系型数据库Mysql中的数据一、增删改查增数据删数据改数据查数据二、触发器三、视图练习题目链接前言：之前操作的时候大多时候都是用GPT生成的sql语句（有一说一真的实用），但是缺少自己完整独立完成sql语句书写的能力，直到学校课程上到了数据库原理才意识到好像真的需要认真学一下这些sql语句了，另外为了方便各位练习达到学习效果，如果想要答案可以私我单独发。一、增删改查增删改查，也称
全面解析物联网信息安全知识体系无声远望
本文还有配套的精品资源，点击获取简介：本资料集详细介绍物联网信息安全的多个重要方面，包括基础概念、数学基础、数据安全与隐私保护、集成安全技术、安全分析、防护策略和身份认证。从基本的物联网安全概念到深度探讨密码学基础，再到数据保护技术，再到全面的系统安全设计，安全分析，防御措施以及身份验证技术，这些内容将为研究者、开发者和管理者提供物联网安全的全面视角。1.物联网信息安全基础概念在现代技术不断发展的
网络安全态势感知：企业数字化转型的 “安全密钥” 知白守黑V 安全运营网络安全态势感知网络
在数字经济飞速发展的当下，网络安全已经成为企业平稳运营的关键所在。从大型企业的数据泄露事故，到中小企业遭遇的各类网络攻击，网络安全威胁无处不在。而网络安全态势感知产品，作为应对复杂网络威胁的关键技术，正逐渐成为企业守护数字资产的“智慧大脑”。一、态势感知：全景掌控，精准防御你可以把网络安全态势感知想象成企业网络的“超级侦察兵”。它借助大数据分析、机器学习这些先进技术，就像是拥有了超级强大的“洞察力
JCYZ H3CNE-RS+ ZiminLi 网络
JCYZH3CNE-RS+2024041320240414202404202024042120240427H3CNE网络基础技术测试题（一）H3CNE网络基础技术测试题（二）H3CNE网络基础技术测试题（三）20240413https://www.h3c.com/cn/支持–软件下载–其他产品–模拟器官方下载人才研学中心—技术认证—电子资料按范围划分：局域网城域网广域网按拓扑结构划分：总线型环型星
基于Python的豆瓣电影爬虫数据分析可视化设计与实现计算机软件程序设计 Python爬虫 Python程序设计数据分析 python 爬虫
【1】系统介绍1.研究背景随着互联网的快速发展，电影产业已经成为全球文化产业的重要组成部分。观众对电影的需求和兴趣日益增长，而在线电影平台如豆瓣电影（DoubanMovie）成为了用户获取电影信息、发表评论和评分的主要渠道之一。豆瓣电影不仅提供了丰富的电影资料，还拥有庞大的用户群体，这些用户生成的内容（UGC）为电影市场分析提供了宝贵的数据资源。然而，尽管豆瓣电影平台提供了大量的公开数据，但这些数
自然语言处理（NLP）-总览图学习汤姆和佩琦 NLP 自然语言处理学习人工智能
文章目录自然语言处理（NLP）-总览图学习1.一张总览图的学习1.语音学（Phonology）2.形态学（Morphology）3.句法学（Syntax）4.语义学（Semantics）5.推理（Reasoning）小结自然语言处理（NLP）-总览图学习转自《Python自然语言处理第二版》1.一张总览图的学习这张图片展示了一个自然语言处理的流程模型，涵盖了从语音分析到应用推理和执行的多个阶段，每
系统架构设计基础：概念与原则 Evaporator Core 系统架构设计师 Python开发经验数据库系统设计师系统架构
系统架构设计基础：概念与原则引言系统架构设计是软件开发过程中至关重要的一环，它决定了系统的整体结构、组件之间的关系以及系统的可扩展性、可维护性和性能。系统架构设计师不仅需要具备扎实的技术功底，还需要对业务需求有深刻的理解，能够在复杂的需求中找到平衡点，设计出既满足当前需求又具备良好扩展性的系统架构。本文将深入探讨系统架构设计的基础概念与原则，帮助读者建立起系统架构设计的理论基础。第一章：系统架构设
周报管理系统大霸王龙行业+领域+业务场景=定制 python microsoft ascii 文本处理
代码仓库产品名称：智汇周报管理系统主要功能：自动化报告生成：智汇周报管理系统能够自动收集项目进展、任务完成情况、团队成员工作日志等关键数据，基于预设模板或用户自定义模板，一键生成周报。支持多格式导出（如Word、PDF、Excel），满足不同场景下的报告需求。智能数据分析与可视化：系统内置强大的数据分析引擎，能够自动对收集到的数据进行统计分析，如任务完成率、进度延误情况、成员工作负荷等，并通过图表
怎么利用商品详情 API 接口实现数据获取与应用？前端后端运维数据挖掘api
在电商蓬勃发展的时代，数据成为了驱动业务增长的关键要素。对于电商从业者、开发者以及数据分析爱好者而言，获取商品详情数据并加以有效应用，是实现精准营销、优化用户体验、提升运营效率的重要途径。商品详情API接口就像是一把钥匙，为我们打开了获取海量商品数据的大门。本文将深入探讨如何利用商品详情API接口实现数据的获取与应用，并通过丰富的代码示例，帮助大家更好地理解和实践。一、理解商品详情API接口API
【2024校招总结帖】数据分析、面试经验、心得体会分享 huaxinjiayou java
首航新能源，一进来就开始大批裁员工作节奏比较快，公司对员工的加班要求也比较严格，而且没有加班费，缺乏福利待遇。另外，公司裁员频繁，而阿里国际一面面经吹爆阿里国际面试官，比某些自以为是的面试官好太多了，面试还不开摄像头。写题的时候，我问他要开摄像头吗鼠人传（第五十二集，2024/4/30）刷题：补昨天的C、MinimizingtheSum，定义dp[i][j]为长度i，使用最多j次可2024西山居S
【Python】红旗超市线下缴电费用户数据分析及可视化（pandas+pyecharts）风度78 百度人工智能 python 机器学习数据分析
场景分析：一部分用户习惯在红旗超市线下进行缴电费，电力公司希望了解哪些用户喜欢到线下缴费，具体分布在哪里，才能有针对性地宣传掌上电力app引导用户体验更高效的线上缴费方式，提升用户满意度。需求分析：首先要拿到红旗超市线下缴费清单数据，对所有数据进行隐私化处理，数据预览如图所示：可以看出台区名称为本项目的核心字段，通过台区匹配到经纬度信息，然后利用经纬度信息进行线下缴费热力图展示。同时可以提供分析报
ECharts：数据可视化的魔法师，偶尔也会“皮”一下 Python私教 Web 使用Vue3进行前端开发 Vue 信息可视化 echarts 前端
在数据爆炸的时代，如何从海量数据中提取有价值的信息，并将其清晰易懂地呈现出来，成为了各行各业面临的共同挑战。数据可视化作为一种有效的信息传递手段，应运而生，并逐渐成为数据分析领域不可或缺的一部分。而在众多数据可视化工具中，ECharts凭借其强大的功能、灵活的配置和丰富的图表类型，脱颖而出，成为了众多开发者的首选利器。一、ECharts：数据可视化的利器ECharts是一个由百度开源的可视化图表库
【趣学SQL】第三章：数据处理与管理 3.2 分区表与分区索引——给数据库做“分舱救灾“的硬核指南精通代码大仙数据库 sql
第三章：数据处理与管理3.2分区表与分区索引——给数据库做"分舱救灾"的硬核指南欢迎来到「数据库装修大队」！今天我们将化身"数据空间规划师"，用一家年订单量破亿的外卖平台崩溃案例，教你如何像整理衣柜一样优雅管理海量数据。3.2.1分区表的概念——当数据库变成"春运火车站"血泪案例：某外卖平台未做分区，导致：查询3个月前的订单需要扫描20亿行数据促销活动时数据库IOPS飙到10万+（相当于春运期间所
【趣学SQL】第八章：SQL 实战案例 8.2 SQL 性能监控与调优——给数据库装上“心电图仪“的硬核指南精通代码大仙数据库数据库 sql
第八章：SQL最佳实践8.2SQL性能监控与调优——给数据库装上"心电图仪"的硬核指南欢迎来到「数据库急诊监护室」！今天我们将化身"SQL性能侦探"，用一家日活百万的虚拟吃瓜论坛"瓜田社"的崩库案例，教你如何用监控工具抓住"性能杀手"，让数据库从"垂死挣扎"变"生龙活虎"。8.2.1常见的监控工具——数据库的"健康手环"全家桶工具1：Prometheus+Grafana（豪华体检套餐）#prome
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那