weixin_39561004

pandas dataframe创建_Pandas教程：初学者入门必备，很全面，很详解！

学习Panda一些最重要的特性，用于对数据进行探索、清洗、转换、可视化以及从数据中学习。

Pandas库是当今使用Python进行工作的数据科学家和分析师所使用的最重要的工具。强大的机器学习和迷人的可视化工具可能会吸引大家关注，但是，Pandas是大多数数据项目的基础。

[pandas]源自术语“panel data”，这是计量经济学中用于描述数据集的术语，这些数据集是对一些个体在多个时间段内的观察结果。—维基百科

如果你正考虑将数据科学视为一种职业，那么当务之急就是要做的第一件事就是学习Pandas。在本文中，我们将介绍有关Pandas的基本信息，包括如何安装，如何使用以及如何与其他常见的Python数据分析包(例如matplotlib和scikit-learn)一起使用。

Pandas是用来干什么的？

Pandas有很多用途，把它不能做的事情列出来，而不是它能做的事情，也许是有意义的。此工具实际上是你数据的家。通过Pandas，您可以通过清理，转换和分析数据来了解数据。例如，假设您要浏览计算机上以CSV格式存储的数据集。Pandas将从CSV中提取数据到一个DataFrame(基本上是一个表)中，然后让您执行以下操作：

计算统计数据并回答有关数据的问题，例如

每列的平均值，中位数，最大值或最小值是多少？
A列与B列相关吗？
C列中的数据分布是什么样的？

通过执行一些操作来清除数据，例如删除缺失值并按某些条件过滤行或列在Matplotlib的帮助下可视化数据。
绘制条形图，线条，直方图，气泡等。
将清理后的转换数据存储回CSV，其他文件或数据库

在进入建模或复杂的可视化之前，您需要对数据集的性质有充分的了解，而Pandas是实现此目的的最佳途径。

Pandas如何算得上数据科学工具包？

Pandas不仅是数据科学工具包的重要组成部分，而且与该包中的其它库一起使用。

Pandas基于Numpy库构建，这意味着NumPy的许多结构都在Pandas中被使用或复制。Pandas中的数据通常用于SciPy中的统计分析，Matplotlib中的绘图功能以及Scikit-learn中的机器学习算法。

Jupyter Notebook提供了一个使用Pandas进行数据探索和建模的良好环境，但是Pandas也可以轻松地用于文本编辑器中。Jupyter Notebooks使我们能够在特定的单元格中执行代码，而不是运行整个文件。使用大型数据集和复杂转换时，这可以节省大量时间。Notebook还提供了一种简便的方法来可视化Pandas的数据框和图表。

你应该什么时候使用Pandas？

如果您没有使用Python进行编码的经验，那么您应该避免学习Pandas，直到您开始学习为止。您不必一定是软件工程师，但是您应该擅长Python编程的基础知识，例如列表，元组，字典，函数和迭代。另外，由于上述相似之处，我还建议您熟悉NumPy。

此外，对于那些希望进行数据科学训练营或其他一些加速数据科学教育计划的人，强烈建议您在开始该程序之前先自己学习Pandas。

即使集中训练可以教您Pandas，但事先具备更好的技能意味着您将能够最大限度地利用时间来学习和掌握更复杂的材料。

Pandas第一步

安装并导入

Pandas是易于安装的软件包。打开您的终端程序(对于Mac用户)或命令行(对于PC用户)，然后使用以下任一命令进行安装：

conda install pandas

或者

pip install pandas

或者，如果您当前正在Jupyter笔记本中查看本文，则可以运行以下单元格：

!pip install pandas

在开处“！”，表示在终端一样运行单元格。要导入Pandas，我们通常使用较短的名称来导入Pandas，因为它使用了很多：

import pandas as pd

现在介绍Pandas的基本构成。

pandas库的核心部分: Series和DataFrames

Pandas的主要两个组成部分是Series和DataFrame。Series本质上是一列，而DataFrame是由Series集合组成的多维表。

DataFrame和Series非常相似，因为您可以对一个进行许多操作，而对另一个进行其他操作，例如填充空值和计算均值。当我们开始使用以下数据进行工作时，您将看到这两个核心组件的用法。

从头开始创建DataFrames

在Python中创建DataFrames是一个很好的知识，并且在测试您在pandas文档中发现的新方法和函数时非常有用。

有很多方法可以从头开始创建DataFrame，但是一个不错的选择是只使用一个简单的dict。

假设我们有一个卖苹果和橙子的水果摊。我们希望每个水果都有一列，每个客户购买都有一行。要将其组织为pandas字典，我们可以执行以下操作：

data = {
          'apples': [3, 2, 0, 1],     'oranges': [0, 3, 7, 2]}

然后将其传递给pandas DataFrame构造函数：

purchases = pd.DataFrame(data)purchases

这是怎么回事呢？

数据中的每个(键，值)对都对应于结果DataFrame中的一列。

该数据框的索引是在创建时以数字0-3的形式提供给我们的，但是在初始化数据框时也可以创建自己的索引。让我们以客户名称作为索引：

purchases = pd.DataFrame(data, index=['June', 'Robert', 'Lily', 'David'])purchases

因此，现在我们可以使用客户名称来查找客户的订单：

>>> purchases.loc['June']apples     3oranges    0Name: June, dtype: int64

稍后将有更多关于从DataFrame定位和提取数据的信息，但是现在您应该能够使用任何随机数据创建一个DataFrame进行学习。

让我们继续学习一些从其他各种来源快速创建DataFrame的方法。

如何读取数据

将各种文件格式的数据加载到DataFrame中非常简单。在以下示例中，我们将继续使用苹果和橘子数据，但这一次它来自各种文件。

从CSV读取数据

使用CSV文件，您只需要一行即可加载数据：

df = pd.read_csv('purchases.csv')df

CSV没有像DataFrames这样的索引，因此我们需要做的只是在读取时指定index_col：

df = pd.read_csv('purchases.csv', index_col=0)df

在这里，我们将索引设置为零列。

您会发现大多数CSV都不会包含索引列，因此通常您不必担心此步骤。

从JSON读取数据

如果您有一个JSON文件-本质上是一个存储的Python字典-Pandas可以轻松读取它：

df = pd.read_json('purchases.json')df

请注意，这一次我们的索引正确地伴随了我们，因为使用JSON允许索引通过嵌套工作。随时在记事本中打开data_file.json，以了解其工作原理。

Pandas会尝试通过分析JSON的结构来弄清楚如何创建DataFrame，有时它做得不好。通常，您需要根据结构来设置orient关键字参数，因此请查看有关该参数的read_json文档，以查看所使用的方向。

从SQL数据库读取数据

如果您要使用SQL数据库中的数据，则需要先使用适当的Python库建立连接，然后将查询传递给Pandas。在这里，我们将使用SQLite进行演示。首先，我们需要安装pysqlite3，因此请在您的终端中运行以下命令：pip安装pysqlite3或者，如果您在笔记本电脑中，请运行此单元格：

!pip install pysqlite3

sqlite3用于创建与数据库的连接，然后我们可以将其用于通过SELECT查询生成DataFrame。因此，首先我们将连接到SQLite数据库文件：

import sqlite3con = sqlite3.connect("database.db")

SQL提示

如果您在PostgreSQL，MySQL或某些其他SQL Server中具有数据，则需要获取正确的Python库来建立连接。例如，psycopg2(链接)是建立与PostgreSQL连接的常用库。此外，您将连接到数据库URI，而不是像我们在SQLite上所做的那样连接到文件。

在此SQLite数据库中，我们有一个名为purchase的表，并且索引位于名为“ index”的列中。通过传递SELECT查询和我们的骗局，我们可以从购买表中读取：

df = pd.read_sql_query("SELECT * FROM purchases", con)df

就像CSV一样，我们可以传递index_col ='index'，但是我们也可以事后设置索引：

df = df.set_index('index')df

实际上，我们可以随时在任何使用任何列的DataFrame上使用set_index()函数。为Series和DataFrames建立索引是一项非常常见的任务，同时，创建的不同方法是值得记住的。

转换回CSV，JSON或SQL

因此，在完成清理数据的大量工作之后，您现在就可以将其保存为您选择的文件了。与我们读取数据的方式类似，pandas提供了直观的命令来保存数据：

df.to_csv('new_purchases.csv')df.to_json('new_purchases.json')df.to_sql('new_purchases', con)

当我们保存JSON和CSV文件时，我们需要输入到这些函数中的是带有所需文件扩展名的所需文件名。使用SQL，我们不会创建新文件，而是使用之前的con变量将新表插入数据库。让我们继续导入一些真实世界的数据，并详细介绍一些您将经常使用的操作。

最重要的DataFrame操作

DataFrame具有数百种对任何分析都至关重要的方法和其他操作。作为初学者，您应该知道执行数据简单转换的操作以及提供基本统计分析的操作。让我们加载IMDB电影数据集以开始：

movies_df = pd.read_csv("IMDB-Movie-Data.csv", index_col="Title")

我们正在从CSV加载此数据集，并指定电影标题作为索引。

查看数据

打开新数据集时，要做的第一件事是打印出几行以作为可视参考。我们使用.head()完成此操作：

movies_df.head()

.head()默认情况下输出DataFrame的前五行，但是我们也可以传递一个数字：例如movie_df.head(10)将输出前十行。

要查看最后五行，请使用.tail()。tail()也接受一个数字，在这种情况下，我们打印底部的两行：

movies_df.tail(2)

通常，当我们加载数据集时，我们希望查看前五行左右，以了解其背后的内容。在这里，我们可以看到每一列的名称，索引以及每一行中值的示例。您会注意到，DataFrame中的索引是“标题”列，您可以通过“标题”一词比其他列略低些来判断。

获取有关您的数据的信息

.info()应该是加载数据后运行的第一个命令之一：

>>> movies_df.info()Index: 1000 entries, Guardians of the Galaxy to Nine LivesData columns (total 11 columns):Rank                  1000 non-null int64Genre                 1000 non-null objectDescription           1000 non-null objectDirector              1000 non-null objectActors                1000 non-null objectYear                  1000 non-null int64Runtime (Minutes)     1000 non-null int64Rating                1000 non-null float64Votes                 1000 non-null int64Revenue (Millions)    872 non-null float64Metascore             936 non-null float64dtypes: float64(3), int64(4), object(4)memory usage: 93.8+ KB

.info()提供有关数据集的基本详细信息，例如行和列的数量，非空值的数量，每列中的数据类型以及DataFrame使用的内存量。

请注意，在电影数据集中，“收入”和“ Metascore”列中有一些明显的缺失值。我们将稍等一下。快速查看数据类型实际上非常有用。假设您刚刚导入了一些JSON，并且整数被记录为字符串。您需要进行一些算术运算，并找到“不受支持的操作数”异常，因为您无法使用字符串进行数学运算。调用.info()会很快指出您认为所有整数的列实际上都是字符串对象。

另一个快速而有用的属性是.shape，它仅输出(行, 列)的元组：

>>> movies_df.shape(1000, 11)

请注意，.shape没有括号，并且是格式(行, 列) 的简单元组。因此，我们的影片DataFrame中有1000行和11列。清理和转换数据时，您将需要进行很多调整。例如，您可能根据某些条件过滤了一些行，然后想要快速知道删除了多少行。

处理重复项

该数据集没有重复的行，但是确保您没有汇总重复的行始终很重要。为了演示，让我们简单地通过将影片DataFrame附加到自身上来使其加倍：

>>> temp_df = movies_df.append(movies_df)>>> temp_df.shapev(2000, 11)

使用append()将返回一个副本，而不会影响原始DataFrame。我们正在临时捕获此副本，因此我们不使用实际数据。通知呼叫.shape很快证明我们的DataFrame行已加倍。现在我们可以尝试删除重复项：

>>> temp_df = temp_df.drop_duplicates()>>> temp_df.shape(1000, 11)

就像append()一样，drop_duplicates()方法也将返回DataFrame的副本，但是这次删除了重复项。调用.shape确认我们回到了原始数据集的1000行。像本例中那样，继续将DataFrames分配给相同的变量有点冗长。因此，pandas的许多方法都具有inplace关键字参数。使用inplace = True将在适当位置修改DataFrame对象：

temp_df.drop_duplicates(inplace=True)

现在，我们的temp_df将自动具有转换后的数据。

drop_duplicates()的另一个重要参数是keep，它具有三个可能的选项：

first ：(默认)删除除第一个匹配项外的重复项。
last：除去最后一次出现的重复项。
False：删除所有重复项。

由于我们在上一个示例中没有定义保留方式，因此默认情况下将其设置为first。这意味着如果两行相同，则Pandas会掉落第二行并保留第一行。使用last具有相反的效果：删除第一行。另一方面，keep会删除所有重复项。如果两行相同，则都将被丢弃。观察temp_df发生了什么：

>>> temp_df = movies_df.append(movies_df)  # make a new copy>>> temp_df.drop_duplicates(inplace=True, keep=False)>>> temp_df.shape(0, 11)

由于所有行都是重复的，因此keep = False丢弃了所有行，导致剩下零行。如果您想知道为什么要这样做，原因之一是它允许您查找数据集中的所有重复项。当下面显示条件选择时，您将看到如何执行此操作。

列清理

很多时候，数据集会有冗长的列名，包括符号，大写和小写单词，空格和错别字。为了使按列名选择数据更加容易，我们可以花一些时间清理它们的名称。以下是打印数据集的列名称的方法：

>>> movies_df.columnsIndex(['Rank', 'Genre', 'Description', 'Director', 'Actors', 'Year',       'Runtime (Minutes)', 'Rating', 'Votes', 'Revenue (Millions)',       'Metascore'],      dtype='object')

如果希望通过简单的复制和粘贴来重命名列，.columns不仅会派上用场，而且当您需要了解为什么按列选择数据时为什么会收到“Key Error”时，.columns也很有用。

我们可以使用.rename()方法通过dict重命名某些或所有列。我们不需要括号，所以让我们重命名它们：

>>> movies_df.rename(columns={
              'Runtime (Minutes)': 'Runtime',         'Revenue (Millions)': 'Revenue_millions'    }, inplace=True)>>> movies_df.columnsIndex(['Rank', 'Genre', 'Description', 'Director', 'Actors', 'Year', 'Runtime',       'Rating', 'Votes', 'Revenue_millions', 'Metascore'],      dtype='object')

这很好。但是，如果我们要小写所有名称怎么办？除了使用.rename()之外，我们还可以像这样为列设置名称列表：

>>> movies_df.columns = ['rank', 'genre', 'description', 'director', 'actors', 'year', 'runtime',                      'rating', 'votes', 'revenue_millions', 'metascore']>>> movies_df.columnsIndex(['rank', 'genre', 'description', 'director', 'actors', 'year', 'runtime',       'rating', 'votes', 'revenue_millions', 'metascore'],      dtype='object')

但这是太多的工作。不仅可以手动重命名每列，我们还可以进行列表理解：

>>> movies_df.columns = [col.lower() for col in movies_df]>>> movies_df.columnsIndex(['rank', 'genre', 'description', 'director', 'actors', 'year', 'runtime',       'rating', 'votes', 'revenue_millions', 'metascore'],      dtype='object')

列表(和字典)理解通常在使用Pandas处理数据时会派上用场。如果您将使用数据集一段时间，则最好进行小写转换，删除特殊字符并用下划线替换空格。

如何处理缺失值

浏览数据时，您很可能会遇到缺失或空值，它们实际上是不存在的值的占位符。最常见的是，您会看到Python的None或NumPy的np.nan，在某些情况下，每种处理方式都不同。

处理空值有两种选择：

移除到包含空值的行或列
用非空值替换空值，这种技术被称为插补

让我们计算数据集每一列中的空值总数。第一步是检查DataFrame中的哪些单元格为空：

movies_df.isnull()

请注意，isnull()返回一个DataFrame，其中每个单元格为True或False，具体取决于该单元格的null状态。要计算每列中的空值数量，我们使用聚合函数求和：

>>> movies_df.isnull().sum()rank                  0genre                 0description           0director              0actors                0year                  0runtime               0rating                0votes                 0revenue_millions    128metascore            64dtype: int64

.isnull()本身并不是很有用，通常与其他方法( 例如sum())结合使用。

现在我们可以看到，我们的数据的Revenue_millions缺少128个值，而metascore缺少64个值。

删除空值

数据科学家和分析师经常会遇到丢弃或插补空值的难题，这是一项需要对您的数据及其上下文有深入了解的决定。总体而言，仅在缺少少量数据的情况下才建议删除空数据。

删除空值非常简单：

movies_df.dropna()

此操作将删除至少具有单个null值的任何行，但它将返回一个新的DataFrame而不会更改原始的DataFrame。您也可以在此方法中指定inplace = True。

因此，对于我们的数据集，此操作将删除128个行(其中Revenue_millions为null)和64个行(其中metascore为null)。这显然是一种浪费，因为在那些删除的行的其他列中都有非常好的数据。这就是为什么我们接下来要考虑归因的原因。

除了删除行之外，还可以通过设置axis = 1来删除具有空值的列：

movies_df.dropna(axis=1)

在我们的数据集中，此操作将删除Revenue_millions和metascore列。

判断

axis= 1参数是什么？

现在还不清楚轴的来源以及为什么需要将其设为1才能影响列。要查看原因，只需查看.shape

>>> movies_df.shape(1000，11)

如上所述，这是一个表示DataFrame形状的元组，即1000行11列。请注意，行位于该元组的索引零，列位于该元组的索引一。这就是为什么axis = 1影响列的原因。这来自NumPy，是为什么学习NumPy值得您花时间的一个很好的例子。

插补

插补是一种传统的特征工程技术，用于保留具有空值的有价值的数据。在某些情况下，删除具有空值的每一行会从数据集中删除太大的块，因此我们可以使用另一个值(通常是该列的均值或中位数)来估算该空值。让我们看一下在Revenue_millions列中估算缺少的值。首先，我们将该列提取到其自己的变量中：

revenue = movies_df['revenue_millions']

使用方括号是我们在DataFrame中选择列的一般方式。如果您还记得我们从头开始创建DataFrame的时候，那么dict的键最终将作为列名。现在，当我们选择DataFrame的列时，就像在访问Python字典一样，我们使用方括号。revenue现在包含一个Series：

>>> revenue.head()TitleGuardians of the Galaxy    333.13Prometheus                 126.46Split                      138.12Sing                       270.32Suicide Squad              325.02Name: revenue_millions, dtype: float64

格式与DataFrame略有不同，但是我们仍然拥有Title索引。我们将使用均值估算收入的缺失值。这是平均值：

>>> revenue_mean = revenue.mean()>>> revenue_mean82.95637614678897

用均值，让我们使用fillna()填充空值：

revenue.fillna(revenue_mean, inplace=True)

现在，我们将收入的所有空值替换为该列的平均值。注意，通过使用inplace = True，我们实际上已经影响了原始的movie_df：

>>> movies_df.isnull().sum()rank                 0genre                0description          0director             0actors               0year                 0runtime              0rating               0votes                0revenue_millions     0metascore           64dtype: int64

像这样用相同的值插入整列是一个基本示例。尝试由Genre或Director进行更细化的插补是一个更好的主意。

例如，您将找到每个genre产生的收益的平均值，并使用该genre的平均值推算每个genre中的空值。现在让我们看一下检查和理解数据集的更多方法。

了解您的变量

在整个DataFrame上使用describe()，我们可以得出连续变量分布的摘要：

movies_df.describe()

在考虑用于可视化表示数据的绘图类型时，了解哪些数字是连续的也是很方便的。

.describe()也可以用于分类变量，以获取行数，类别的唯一计数，顶层类别和顶层类别的频率：

>>> movies_df['genre'].describe()count                        1000unique                        207top       Action,Adventure,Sci-Fifreq                           50Name: genre, dtype: object

这告诉我们，genre列有207个唯一值，最高值是Action/Adventure/Sci-Fi, 显示了50次(频率)。.value_counts()可以告诉我们列中所有值的频率：

>>> movies_df['genre'].value_counts().head(10)Action,Adventure,Sci-Fi       50Drama                         48Comedy,Drama,Romance          35Comedy                        32Drama,Romance                 31Action,Adventure,Fantasy      27Comedy,Drama                  27Animation,Adventure,Comedy    27Comedy,Romance                26Crime,Drama,Thriller          24Name: genre, dtype: int64

连续变量之间的关系

通过使用相关方法.corr()，我们可以生成每个连续变量之间的关系：

movies_df.corr()

相关表是数据集中双变量关系的数字表示。正数表示正相关-一个上升，另一个上升-负数表示反相关-一个上升，另一个下降。1.0表示完美的相关性。

因此，在第一行第一列中，我们看到rank与自身之间具有完美的相关性，这是显而易见的。另一方面，votes与Revenue_Millions之间的相关性是0.6。更有趣一点。当您考虑到结果或因变量并且想要查看与结果的增加或减少最相关的功能时，检查双变量关系会很方便。您可以用散点图直观地表示双变量关系(见下图部分)。现在让我们更多地了解如何操作DataFrames。

数据切片，选择，提取

到目前为止，我们只专注于数据的一些基本摘要。我们已经学习了使用单括号进行简单列提取的方法，并使用fillna()在列中估算了空值。以下是切片，选择和提取的其他方法，您需要不断使用它们。

重要的是要注意，尽管许多方法是相同的，但DataFrame和Series具有不同的属性，因此您必须确保知道使用的是哪种类型，否则将收到属性错误。

让我们先来看一下使用列。按列，您已经了解了如何使用方括号提取列，如下所示：

>>> genre_col = movies_df['genre']>>> type(genre_col)pandas.core.series.Series

这将返回一个Series。要将列提取为DataFrame，您需要传递一个列名的列表。在我们的例子中，这只是一列：

>>> genre_col = movies_df[['genre']]>>> type(genre_col)pandas.core.frame.DataFrame

由于它只是一个列表，因此添加另一个列名很容易：

subset = movies_df[['genre', 'rating']]subset.head()

现在我们来看按行获取数据。

按行

对于行，我们有两个选择：

.loc-按名称查找
.iloc-通过数字索引定位

请记住，我们仍按电影标题来索引，因此要使用.loc，我们给它指定电影的标题：

>>> prom = movies_df.loc["Prometheus"]>>> promrank                                                                2genre                                        Adventure,Mystery,Sci-Fidescription         Following clues to the origin of mankind, a te...director                                                 Ridley Scottactors              Noomi Rapace, Logan Marshall-Green, Michael Fa...year                                                             2012runtime                                                           124rating                                                              7votes                                                          485820revenue_millions                                               126.46metascore                                                          65Name: Prometheus, dtype: object

另一方面，使用iloc，我们为它提供Prometheus的数值索引：

prom = movies_df.iloc[1]

loc和iloc可以认为类似于Python列表切片。为了进一步说明这一点，让我们选择多行。您将如何处理清单？在Python中，只需用方括号进行切片，例如example_list [1：4]。在熊猫中，其工作方式相同：

movie_subset = movies_df.loc['Prometheus':'Sing']movie_subset = movies_df.iloc[1:4]movie_subset

使用.loc和.iloc选择多行之间的一个重要区别是.loc将电影Sing包含在结果中，但是当使用.iloc时，我们得到的行是1：4，但索引4(自杀小队)的电影却没有包括在内。.iloc的切片遵循与列表切片相同的规则，不包括末尾索引处的对象。

条件选择

我们已经讨论了如何选择列和行，但是如果要进行条件选择怎么办？

例如，如果我们要筛选电影数据帧以仅显示由Ridley Scott执导的电影或评级大于或等于8.0的电影怎么办？

为此，我们从DataFrame中获取一列，然后对其应用布尔条件。这是布尔条件的示例：

>>> condition = (movies_df['director'] == "Ridley Scott")>>> condition.head()TitleGuardians of the Galaxy    FalsePrometheus                  TrueSplit                      FalseSing                       FalseSuicide Squad              FalseName: director, dtype: bool

与isnull()相似，这将返回一系列“真”和“假”值：对于由雷德利·斯科特执导的电影而言为“真”，对于不由他执导的电影而言为“假”。

我们想要过滤掉所有非雷德利·斯科特(Ridley Scott)执导的电影，换句话说，我们不想要假电影。要返回条件为True的行，我们必须将此操作传递到DataFrame中：

movies_df[movies_df['director'] == "Ridley Scott"]

您可以通过阅读以下内容来熟悉这些条件：选择movies_df导演等于里德利·斯科特的movies_df。让我们通过按等级过滤DataFrame来查看使用数值的条件选择：

movies_df[movies_df['rating'] >= 8.6].head(3)

我们可以通过使用逻辑运算符来制作一些更丰富的条件。| 为"或",＆为“与”。让我们过滤数据框以仅显示Christopher Nolan或Ridley Scott的电影：

movies_df[(movies_df['director'] == 'Christopher Nolan') | (movies_df['director'] == 'Ridley Scott')].head()

我们需要确保用括号将评估分组，以便Python知道如何评估条件。使用isin()方法，我们可以使它更简洁：

movies_df[movies_df['director'].isin(['Christopher Nolan', 'Ridley Scott'])].head()

假设我们希望在2005年至2010年之间发行的所有电影的评级都高于8.0，但收入却低于25％。这就是我们可以做的所有事情：

movies_df[    ((movies_df['year'] >= 2005) & (movies_df['year'] <= 2010))    & (movies_df['rating'] > 8.0)    & (movies_df['revenue_millions'] < movies_df['revenue_millions'].quantile(0.25))]

如果您回想起使用.describe()时收入的第25个百分位数大约是17.4，则可以通过使用float值为0.25的Quantile()方法直接访问此值。所以在这里，我们只有四部符合该标准的电影。

使用函数

可以像使用列表那样遍历DataFrame或Series，但是这样做(特别是在大型数据集上)非常慢。一种有效的替代方法是将函数套用到数据集。例如，我们可以使用一个函数将8.0或更高版本的电影转换为字符串值“好”，其余转换为“坏”，然后使用此转换后的值创建一个新列。首先，我们将创建一个函数，该函数在给予评级时确定其好坏：

def rating_function(x):    if x >= 8.0:        return "good"    else:        return "bad"

现在，我们要通过此函数发送整个评分列，这是apply()的作用：

movies_df["rating_category"] = movies_df["rating"].apply(rating_function)movies_df.head(2)

.apply()方法将rating列中的每个值都通过rating_function传递，然后返回一个新的Series。然后将此系列分配给一个新的列，称为“ rating_category”。您还可以使用匿名函数。此lambda函数可达到与rating_function相同的结果：

movies_df["rating_category"] = movies_df["rating"].apply(lambda x: 'good' if x >= 8.0 else 'bad')movies_df.head(2)

总的来说，使用apply()比手动在行上迭代要快得多，因为Pandas正在利用矢量化。

向量化：一种计算机编程样式，其中将运算应用于整个数组而不是单个元素

— Wikipedia

在自然语言处理(NLP)工作期间，大量使用了apply()是一个很好的例子。您需要将各种文本清除功能应用于字符串以为机器学习做准备。

简单作图

Pandas的另一个优点是它与Matplotlib集成在一起，因此您可以直接从DataFrames和Series中进行绘制。首先，我们需要导入Matplotlib(pip install matplotlib)：

import matplotlib.pyplot as pltplt.rcParams.update({'font.size': 20, 'figure.figsize': (10, 8)}) # set font and plot size to be larger

现在我们可以开始了。绘图不会涉及很多内容，但足以轻松浏览您的数据。

绘图提示

对于分类变量，请使用“条形图” *和“箱线图”。
对于连续变量，请使用直方图，散点图，折线图和箱线图。

让我们绘制评级和收入之间的关系。我们需要做的就是在movies_df上调用.plot()，其中包含有关如何构建情节的一些信息：

movies_df.plot(kind='scatter', x='rating', y='revenue_millions', );

分号是什么？这不是语法错误，只是在Jupyter笔记本中进行绘图时隐藏

输出的一种方法。

如果要基于单个列绘制简单的直方图，则可以在列上调用plot：

movies_df['rating'].plot(kind='hist', );

您还记得本教程开始时的.describe()示例吗？好吧，四分位间距的图形表示称为Boxplot。让我们回想一下describe()在评级列上为我们提供的内容：

>>> movies_df['rating'].describe()count    1000.000000mean        6.723200std         0.945429min         1.90000025%         6.20000050%         6.80000075%         7.400000max         9.000000Name: rating, dtype: float64

使用箱线图，我们可以可视化此数据：

movies_df['rating'].plot(kind="box");

通过组合分类数据和连续数据，我们可以创建收入的箱线图，并按上面创建的评级类别进行分组：

movies_df.boxplot(column='revenue_millions', by='rating_category');

那是与Pandas一起绘图的一般想法。有太多图要提及，因此绝对可以在这里查看plot()文档，以获取有关其功能的更多信息。

总结

在Python中使用Pandas探索，清理，转换和可视化数据是数据科学的一项基本技能。作为数据科学家，仅清理争吵的数据是您工作的80％。经过一些项目和一些实践之后，您应该对大多数基础知识都比较了解了。

往期回顾

Pandas 10大应用领域，哪些行业在使用Pandas？
15个Pandas最佳特性，是什么让Pandas如何特别？
你知道pandas库吗？7分钟内快速了解
当Python遇上Echarts，快速图表开发，即学即用

你可能感兴趣的:(pandas,dataframe创建,pandas,提取数字,pandas,读取csv)

什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的渠道选择策略研究说私域人工智能小程序
摘要：在数字化商业环境下，品牌与产品的渠道选择对其市场推广和运营成功至关重要。本文聚焦于如何依据自身品牌和产品特性，结合开源AI智能名片链动2+1模式与S2B2C商城小程序，运用科学的渠道选择方法，慎重挑选1-2个适宜平台，集中资源发力并取得成绩后再拓展其他渠道。通过理论分析与案例研究，探讨该策略的有效性和可行性，为企业渠道布局提供参考。关键词：渠道选择；开源AI智能名片；链动2+1模式；S2B2
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
Redis Sentinel（哨兵）和 Redis Cluster（集群） G丶AEOM 八股普通学习区 Redis redis 数据库缓存
哨兵机制和集群有什么区别Redis集群主要有两种，一种是RedisSentinel哨兵集群，一种是RedisCluster。主从集群，包括一个Master和多个Slave节点，Master负责数据的读写，Slave负责数据的读取，Master上收到的数据变更会同步到Slave节点上实现数据同步，但不提供容错和恢复，在Master宕机时不会选出新的Master，导致后续客户端所有写请求直接失败。所以
Linux/Centos7离线安装并配置MySQL 5.7 有事开摆无事百杜同学 LInux/CentOS7 linux mysql 运维
Linux/Centos7离线安装并配置MySQL5.7超详细教程一、环境准备1.下载MySQL5.7离线包2.使用rpm工具卸载MariaDB（避免冲突）3.创建系统级别的MySQL专用用户二、安装与配置1.解压并重命名MySQL目录2.创建数据目录和配置文件3.设置目录权限4.初始化MySQL5.配置启动脚本6.配置环境变量三、启动与验证1.启动MySQL服务2.获取初始密码3.登录并修改密码
本地包解决npm error code E404 雅痞yuppie npm 前端 node.js
这个错误提示表明npm找不到名为create-vue-admin-cli的包。这是因为你开发的CLI工具还没有发布到npm官方注册表。要解决这个问题，有两种方法：方法一：使用本地开发模式测试1.确保你的CLI已正确链接到全局在你的vue-admin-cli项目根目录下执行：npmlink这会在全局环境中创建一个符号链接，指向你本地的CLI项目。2.使用本地链接的CLI创建项目直接使用命令：vue-
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Kafka系列之：Dead Letter Queue死信队列DLQ 快乐骑行^_^ Kafka Kafka系列 Dead Letter Queue 死信队列 DLQ
Kafka系列之：DeadLetterQueue死信队列DLQ一、死信队列二、参数errors.tolerance三、创建死信队列主题四、在启用安全性的情况下使用死信队列更多内容请阅读博主这篇博客：Kafka系列之：KafkaConnect深入探讨-错误处理和死信队列一、死信队列死信队列（DLQ）仅适用于接收器连接器。当一条记录以JSON格式到达接收器连接器时，但接收器连接器配置期望另一种格式，如
Maya自定义右键菜单样例教程 holy-pills
本文还有配套的精品资源，点击获取简介：本文详细指导如何在Maya中通过脚本节点自定义右键菜单，增强工作效率和个性化工作环境。自定义右键菜单允许用户根据个人习惯调整菜单项，使之更加便捷。文章介绍了创建脚本节点、编写菜单脚本、关联菜单到视图以及保存和加载自定义菜单的具体步骤。同时提供了实际操作样例，帮助用户更好地理解和应用这一技巧。1.Maya自定义右键菜单的重要性Maya，作为三维动画制作的行业标准
玩转Docker | 使用Docker部署gopeed下载工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署gopeed下载工具前言一、gopeed介绍Gopeed简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署gopeed服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问gopeed应用五、测试与下载六、总结前言在当今信息爆炸的时代，高效地获取和管理网络资源变得尤为重要。无论是下载大型文件还是进行日常的数据传输，一个稳
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
零信任落地难题：安全性与用户体验如何两全？粤海科技君安全零信任终端安全网络安全 iOA
在零信任架构的实施过程中，平衡安全性与用户体验是企业数字化转型的核心命题。这一挑战的本质在于：既要通过「永不信任，持续验证」的安全机制抵御新型攻击，又要避免过度验证导致的效率损耗。一、矛盾根源：安全与体验的天然张力零信任的“永不信任”原则，本质上要求对每一次访问都进行动态评估，但这与用户对“便捷、流畅”的诉求存在天然冲突。例如：频繁的身份验证（如每次登录都需短信验证码）会打断工作节奏，某制造企业统
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
AIGC工具与软件开发流程的深度集成方案 Irene-HQ 软件开发测试 AIGC 测试工具 github AIGC 程序人生面试
一、代码开发环节集成路径‌环境配置标准化‌安装AIGC工具包并配置环境变量（如设置AIGC_TOOL_PATH），确保团队开发环境一致‌。在IDE插件市场安装Copilot等工具，实现编码时实时建议调用‌。‌人机协作新模式‌‌需求解析‌：上传PRD文档，AI自动提取业务规则生成类结构（如支付模块的PaymentService雏形）‌。‌代码补全‌：输入注释//JWT验证中间件，生成OAuth2.0
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
OkHttp3源码解析--设计模式，android开发实习面试题
this.cache=builder.cache;}//构造者publicstaticfinalclassBuilder{Cachecache;…//构造cache属性值publicBuildercache(@NullableCachecache){this.cache=cache;returnthis;}//在build方法中真正创建OkHttpClient对象，并传入前面构造的属性值publi
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
Topview Avatar 2深度实测：AI数字人带货的新高度，还是又一个营销噱头？神码小Z AI工具人工智能
在AI数字人赛道越来越卷的今天，各家产品都在宣传自己的"独门秘技"。最近，TopviewAI推出的Avatar2引起了我的注意——号称突破了产品尺寸限制，实现了"万物皆可带"。作为一个经常需要制作营销视频的内容创作者，我决定亲自上手测试一番，看看这款工具是否真的像宣传的那样强大。TopviewAvatar2是什么？革命性升级还是渐进式改良？TopviewAvatar2是TopviewAI推出的第二
OkHttp3源码解析--设计模式 2401_84413396 程序员设计模式
}//在创建OkHttpClient的时候OkHttpClientclient=newOkHttpClient.Builder().cache(/创建cache对象/).build();工厂模式====直接看代码：publicinterfaceCallextendsCloneable{Requestrequest();Responseexecute()throwsIOException;voide
C#中的设计模式：构建更加优雅的代码 Envyᥫᩣᩚ c#开发语言
C#在面向对象编程（OOP）方面的强大支持，我们可以探讨“C#中的设计模式”。这不仅有助于理解如何更好地组织代码，还能提高代码的可维护性和可扩展性。引言设计模式是软件工程中经过实践验证的解决方案模板，它们提供了一种标准化的方法来解决常见的开发问题。对于使用C#进行开发的程序员来说，理解和应用这些模式可以帮助创建结构良好、易于维护和扩展的应用程序。本文将介绍几种常用的设计模式，并展示如何用C#实现它
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
初始化列表与类型转换（C++） 2401_89195731 c++开发语言
初始化列表和构造函数体在C++中都是用于给类的成员变量赋初值区别：初始化列表是给每个成员变量定义初始化的地方，即使有成员变量没有给它显式在初始化列表初始化，它也会走初始化列表初始化时机初始化列表：在对象创建时，成员变量通过初始化列表被直接初始化，这发生在构造函数体执行之前。构造函数体内赋值：成员变量首先被默认初始化，然后在构造函数体内通过赋值语句进行赋值。性能差异初始化列表：通常更高效，因为它避免
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found