Avasla

深度学习笔记（kaggle课程《Intro to Deep Learning》）

一、什么是深度学习？

深度学习是一种机器学习方法，通过构建和训练深层神经网络来处理和理解数据。它模仿人脑神经系统的工作方式，通过多层次的神经网络结构来学习和提取数据的特征。深度学习在图像识别、语音识别、自然语言处理等领域取得了重大突破，并被广泛应用于人工智能技术中。

深度学习原理概括

深度学习的原理可以简单地概括为以下几点：

神经网络结构：深度学习使用一种称为神经网络的结构。神经网络由许多称为神经元的节点组成，这些节点按层次排列。每个神经元接收来自前一层神经元的输入，并通过权重进行加权处理后传递给下一层神经元。通过多层次的连接和处理，神经网络可以学习和提取数据的复杂特征。
前向传播：在深度学习中，输入数据通过神经网络的各个层次，逐层进行处理和转换。这个过程称为前向传播。每一层的神经元根据输入数据和权重计算输出，并将输出传递给下一层。这样，数据的表示逐渐变得更加抽象和高级。
反向传播：在训练神经网络时，使用一种称为反向传播的方法来调整网络的参数。首先，通过将输入数据传递到网络中，得到预测结果。然后，将预测结果与真实标签进行比较，计算预测误差。接下来，误差以相反的方向从网络的输出层传播回输入层，更新每个神经元的权重，使得误差逐渐减小。这个过程不断重复，直到网络的预测结果足够准确。
梯度下降：反向传播的核心是使用梯度下降算法来调整网络的参数。梯度是指误差对于每个参数的变化率，表示了误差下降最快的方向。通过计算梯度，可以确定如何更新每个参数，使得误差逐渐减小。梯度下降算法不断迭代地调整参数，直到达到最优的参数配置，使得网络的预测结果最好。
大量数据和计算能力：深度学习的成功离不开大量的标记数据和强大的计算能力。通过使用大量的数据来训练神经网络，网络可以学习到更广泛、更准确的模式和特征。同时，利用并行计算和高性能硬件（如GPU）的能力，可以加速深度学习模型的训练过程。

总的来说，深度学习利用神经网络的层次结构和反向传播算法，通过大量数据和梯度下降的优化过程，学习和提取数据的复杂特征，并用于预测、分类和生成等任务。

二、如何理解神经网络？

神经网络是深度学习的核心组件，它是一种数学模型，用于模拟和处理数据的方式类似于人脑中的神经元网络。

我们可以将神经网络想象成一系列节点的集合，这些节点被称为神经元。神经元之间通过连接进行信息传递。每个神经元接收一些输入数据，对这些输入进行加权处理，并生成一个输出结果。

神经网络由多个层组成，通常包括输入层、隐藏层和输出层。输入层接收原始数据作为输入，隐藏层和输出层根据输入进行一系列计算，生成最终的输出结果。

在每个神经元中，输入数据通过权重进行加权相加，并经过一个非线性函数（例如ReLU、Sigmoid）进行激活，得到神经元的输出。这个输出将成为下一层神经元的输入，以此类推，直到最终输出层生成最终的预测结果。

训练神经网络的过程涉及调整神经元之间的权重和偏置，使得网络能够产生准确的输出。这个调整过程是通过反向传播算法来实现的，它根据预测结果与真实结果之间的差异，逐层地更新网络参数，以减小误差。

通过调整神经网络的权重和偏置，它可以逐渐学习到数据中的模式和规律，从而进行准确的预测和分类。

总的来说，神经网络是一种模拟人脑神经系统的数学模型，通过节点之间的连接和权重调整来处理和理解数据。它是深度学习的基础，用于实现数据的特征提取、模式识别和预测等任务。

单个神经元

以图示来表示，具有一个输入的神经元（或单元）如下：

其中，

输入为x，权重为w，b是偏置，输出结果为y；
用公式表示为 $y = w x + b$ 。

也可以有多个输入，例如这个神经元的公式 $y=w_{0}x_{0}+w_{1}x_{1}+w_{2}x_{2}+b$ ：

层

神经网络通常将其神经元组织成层级。当我们将具有共同输入的线性单元集合在一起时，我们得到一个稠密层。

稠密层（Dense Layer），也称为全连接层（Fully Connected Layer）或线性层，是深度神经网络中最常见的一种层。在稠密层中，每个神经元都与前一层的所有神经元相连接，从而实现了全连接。

你可以将神经网络中的每一层视为执行某种相对简单的变换。通过深层堆叠的层，神经网络可以以越来越复杂的方式对其输入进行变换。在训练良好的神经网络中，每一层都是一个使我们离解决方案更接近一点的变换。

多种类型的层级
在Keras中，一个“层级”是一种非常通用的东西。实际上，一个层级可以是任何种类的数据转换。许多层级，比如卷积层和循环层，通过神经元对数据进行转换，它们的主要区别在于它们形成的连接模式。而其他一些层级则用于特征工程或者仅仅进行简单的计算。
其他拓展层级资料

激活函数

激活函数是神经网络中的一种函数，它在神经元的输出上施加一个非线性变换。在神经网络中，神经元的输出通常是加权和的结果，而激活函数会对这个加权和进行处理，以产生神经元的最终输出。

激活函数的作用是引入非线性性质，使得神经网络能够学习复杂的关系和模式。如果没有激活函数，多个线性层级的叠加将会等效于单个线性层级，无法捕捉到非线性模式。

修正线性单元（ReLU）

最常见的激活函数是修正线性单元，max(0, x)。这种函数的特点是在输入为负时输出为零，而在输入为正时输出与输入相等。

修正线性单元的图形是一条带有负部分被“修正”为零的直线。将该函数应用于神经元的输出将在数据中产生一个弯曲，使我们远离简单的直线。

当我们将修正线性单元连接到线性单元时，我们得到一个修正线性单元（Rectified Linear Unit，简称ReLU）。因此，通常将修正线性单元函数称为“ReLU函数”。将ReLU激活应用于线性单元意味着输出变为max(0, w * x + b)，我们可以在图表中绘制出来：

在神经网络中，其他常用的激活函数包括：

Sigmoid函数：将输入映射到0到1之间的范围，适用于二分类问题。
Tanh函数：将输入映射到-1到1之间的范围，类似于Sigmoid函数，但更广的范围可以提供更强的表达能力。
Leaky ReLU函数：与ReLU类似，但负数部分不是完全截断为0，而是保留一个小的斜率。
Softmax函数：通常用于多分类问题，将一组输入映射为概率分布，使得所有输出的和为1。

选择合适的激活函数取决于问题的性质和网络的结构，不同的激活函数可以在不同的情况下发挥最佳效果。

堆叠稠密层

一堆叠稠密层构成了一个“全连接”网络。

输出层之前的这些层有时被称为隐藏层，因为我们无法直接看到它们的输出。

注意到，最后（输出）层是一个线性单元（即没有激活函数）。这使得这个网络适用于回归任务，其中我们尝试预测某个任意的数值。其他任务（比如分类）可能需要在输出上使用激活函数。

【代码实现一】构建Sequential模型

Sequential模型由一系列线性层（layers）组成，每个线性层都按顺序连接在一起，前一层的输出作为后一层的输入。这种线性的层叠方式使得数据在网络中单向流动，没有跳跃或反馈连接，因此称为“序列”模型。在Keras中，一个Sequential模型可以通过添加层来构建。

from tensorflow import keras
from tensorflow.keras import layers

# 创建一个Sequential模型
model = keras.Sequential([
	#第一个隐藏层，包含128个神经元和relu激活函数
    layers.Dense(units=128, activation='relu', input_shape=[8]),
    #第二个隐藏层，包含64个神经元和relu激活函数
    layers.Dense(units=64, activation='relu'),
    #用于回归任务的线性激活函数
    layers.Dense(units=1, activation='linear')  # Linear activation for regression
])

参数解释 :input_shape
input_shape：是指输入数据的维度或形状。

如果输入的表格数据，（类似Pandas 中的 dataframe），那么数据集中的每个特征，都算是一个输入，input_shape=[num_columns]。比如，数据集中有8个特征，即8列数据，那么input_shape=[8]

Keras在这里使用列表的原因是为了允许使用更复杂的数据集。例如，图像数据可能需要三个维度：[高度，宽度，通道]。假设你要训练一个神经网络对手写数字进行分类，输入数据是28x28像素的灰度图像。那么输入形状可以表示为(28, 28, 1)，其中前两个维度表示图像的高度和宽度，最后一个维度表示图像的通道数（在本例中为灰度图像，因此通道数为1）。

三、随机梯度下降（Stochastic Gradient Descent）

损失函数（Loss Function）

损失函数衡量了目标的真实值与模型预测值之间的差异。在训练期间，模型将使用损失函数作为指导，找到其权重的正确值（较低的损失更好）。换句话说，损失函数告诉网络它的目标是什么。

回归问题常用的损失函数是平均绝对误差或MAE。此外，还有均方误差（MSE）或Huber损失。

随机梯度下降介绍

随机梯度下降（SGD）是优化算法中模型参数的常见方法。与传统的梯度下降方法相比，随机梯度下降的计算开销较小，因为它只考虑了一个样本（或小批量样本）而不是整个训练集。尽管随机梯度下降的更新可能在迭代过程中不够稳定，但它通常能够在更短的时间内达到良好的解决方案，特别是对于大规模数据集和复杂的模型。

具体步骤如下：

从训练数据中抽取一些样本，并将其输入到网络中进行预测。
计算预测值与真实值之间的损失。
最后，调整权重，使损失减小的方向。
然后一直重复这个过程，直到损失达到您期望的小值（或者无法进一步减小为止）。

每次迭代的训练数据样本称为小批量（通常简称为“批次”），而完整的一轮训练数据称为周期。训练的周期数表示网络将看到每个训练样例的次数。

动画展示了一个线性模型如何使用SGD进行训练。淡红色的点表示整个训练集，而实心红色的点则表示小批量。每次SGD看到一个新的小批量时，它将把权重（w是斜率，b是y截距）向其在该批次上的正确值方向调整。一批一批地，直线最终会收敛到最佳拟合。可以看到随着权重接近其真实值，损失会变得更小。

学习率和批量大小（Learning Rate and Batch Size）

请注意，曲线在每个批次的方向上只发生了轻微的移动（而不是一直移动到底）。这些移动的大小由学习率决定。较小的学习率意味着网络需要看到更多的小批量数据，才能使其权重收敛到最佳值。

学习率和小批量的大小是影响随机梯度下降（SGD）训练过程最大的两个参数。

幸运的是，对于大多数工作来说，通常不需要进行大量的超参数搜索以获得令人满意的结果。

【代码实现二】添加损失函数和优化器

在定义模型之后，可以通过模型的compile方法添加损失函数和优化器：

model.compile(
    optimizer="adam", #优化算法使用adam
    loss="mae", #损失函数使用mae
)

可以只使用字符串来指定损失函数和优化器。如果想要调整参数，也可以直接通过Keras API访问它们。

参数解释：Adam
Adam（Adaptive Moment Estimation）是一种具有自适应学习率的SGD算法，适用于大多数问题，无需进行任何参数调整（从某种意义上说，它是“自调节”的）。Adam是一个很好的通用优化器。

四、过拟合和欠拟合（Overfitting and Underfitting）

过拟合和欠拟合

对于深度学习模型来说，同样存在过拟合和欠拟合的问题。
简单来说，过拟合是指模型在训练数据上表现很好，但在未见过的新数据上表现较差，过多地记住了训练数据的噪声和细节。欠拟合是指模型无法很好地适应训练数据，无法捕捉数据中的模式和关系。

接下来，我们将讨论如何避免或者降低这两个问题对模型带来的影响。

容量（Capacity）

模型的容量是指它能够学习的模式的大小和复杂性。对于神经网络，在很大程度上由它拥有多少个神经元以及它们如何相互连接来决定。如果你觉得你的网络对数据的拟合不足，你可以尝试增加它的容量。

可以通过使网络变得更宽（向现有层添加更多单元）或通过使网络变得更深（添加更多层）来增加网络的容量。更宽的网络更容易学习更多的线性关系，而更深的网络更倾向于学习更多的非线性关系。哪种方式更好取决于数据集的情况。

例如：

#原始模型
model = keras.Sequential([
    layers.Dense(16, activation='relu'),
    layers.Dense(1),
])

#加宽模型
wider = keras.Sequential([
    layers.Dense(32, activation='relu'),
    layers.Dense(1),
])

#加深模型
deeper = keras.Sequential([
    layers.Dense(16, activation='relu'),
    layers.Dense(16, activation='relu'),
    layers.Dense(1),
])

提前终止（Early Stopping）

我们提到，当模型过于学习噪声时，验证损失可能在训练过程中开始增加。为了防止这种情况，我们可以在似乎验证损失不再减小时立即停止训练。这种中断训练的方式称为提前终止。

我们保留验证损失最小的模型。

一旦我们发现验证损失再次开始上升，我们可以将权重重置为最小值出现的位置。这确保模型不会继续学习噪声并过拟合数据。

这也意味着我们不太可能在网络完成学习信号之前过早地停止训练。因此，除了防止过长的训练导致过拟合外，提前终止还可以防止因为训练时间不足而出现欠拟合。

【代码实现三】添加提前终止功能

在Keras中，我们通过回调（callback）将提前停止功能添加到训练中。回调只是在网络训练过程中定期运行的函数。提前停止回调将在每个周期后运行。（Keras预定义了各种有用的回调，但也可以定义自己的回调。）

from tensorflow.keras.callbacks import EarlyStopping

early_stopping = EarlyStopping(
    min_delta=0.001, # 被视为改进的最小变化量
    patience=20, # 在停止之前等待的周期数
    restore_best_weights=True, # 是否恢复到最佳权重
)

这些参数表示：“如果在之前的20个周期内，验证损失没有改善至少0.001，那么停止训练并保留你找到的最佳模型。”有时很难判断验证损失的上升是由于过拟合还是由于随机批次变化。这些参数允许我们在何时停止训练时设置一些允许范围。

正如我们在下面红酒示例中将看到的，我们将把这个回调与损失和优化器一起传递给fit方法。

【代码实现四】红酒数据集示例

示例数据集包含了大约1600瓶红葡萄酒的测量数据。还包括了每瓶酒的品质评分。需要从测量数据中预测出一瓶酒的品质分数。(也可以替换成类似的预测数据集。）
数据示例如下：

import pandas as pd
from IPython.display import display

# 读取红酒数据集
red_wine = pd.read_csv('../input/dl-course-data/red-wine.csv')

# 创建训练和验证集拆分
df_train = red_wine.sample(frac=0.7, random_state=0)
df_valid = red_wine.drop(df_train.index)
display(df_train.head(4))

# 缩放到 [0, 1] 范围
max_ = df_train.max(axis=0)
min_ = df_train.min(axis=0)
df_train = (df_train - min_) / (max_ - min_)
df_valid = (df_valid - min_) / (max_ - min_)

# 拆分特征和目标
X_train = df_train.drop('quality', axis=1)
X_valid = df_valid.drop('quality', axis=1)
y_train = df_train['quality']
y_valid = df_valid['quality']

from tensorflow import keras
from tensorflow.keras import layers, callbacks

# 提前停止回调
early_stopping = callbacks.EarlyStopping(
    min_delta=0.001, # 被视为改进的最小变化值
    patience=20, # 在停止之前等待的周期数
    restore_best_weights=True,
)

# 创建模型
model = keras.Sequential([
    layers.Dense(512, activation='relu', input_shape=[11]),
    layers.Dense(512, activation='relu'),
    layers.Dense(512, activation='relu'),
    layers.Dense(1),
])

# 添加损失函数和优化器
model.compile(
    optimizer='adam',
    loss='mae',
)
# 训练模型
history = model.fit(
    X_train, y_train,
    validation_data=(X_valid, y_valid),
    batch_size=256,
    epochs=500,
    callbacks=[early_stopping], # 将回调函数放在列表中
    verbose=0,  # 关闭训练日志
)

history_df = pd.DataFrame(history.history)
history_df.loc[:, ['loss', 'val_loss']].plot();
print("最小验证损失：{}".format(history_df['val_loss'].min()))

五、Dropout & Batch Normalization

Dropout

Dropout提供了正则化一大类模型的方法，它可以帮助纠正过拟合问题。

原理是在训练过程中，随机地丢弃（即设置为零）一部分神经元的输出，使得网络无法过于依赖某些特定神经元的信息，从而迫使网络学习更加鲁棒的特征。通过这种方式，每个神经元都有一定的概率被丢弃，使得网络在不同的训练迭代中都会看到不同的神经元组合，从而减少过拟合风险。在实际预测时，不进行神经元丢弃，而是使用所有神经元的输出，以获得更稳定的预测结果。

在下面动图中，两个隐藏层之间添加了50%的Dropout。

参考资料：
花书《7.12 Dropout》中文版 p159
英文版：《Chapter 7Regularization for Deep Learning》

批标准化（Batch Normalization）

批标准化（Batch Normalization，或称为“批归一化”），它可以帮助纠正训练过程变慢或不稳定的情况。

在神经网络中，可以使用像scikit-learn的StandardScaler或MinMaxScaler之类的方法对数据进行标准化处理，使输入分布保持在一个合适的范围内，从而提高模型的稳定性。

如果在数据进入网络之前进行标准化是有益的，那么在网络内部进行标准化也许会更好！实际上，我们有一种特殊的层可以实现这一点，那就是批标准化层。批标准化层会在每个批次输入时进行操作，首先使用批次的均值和标准差对批次进行标准化，然后使用两个可训练的重新缩放参数将数据放在一个新的尺度上。批标准化实际上对其输入执行了一种协调的重新缩放。

批标准化通常是为了优化过程而添加的辅助功能（尽管有时它也可以改善预测性能）。使用批标准化的模型通常需要更少的周期来完成训练。此外，批标准化还可以解决可能导致训练“卡住”的各种问题。可以考虑在模型中添加批标准化，尤其是在训练过程中遇到问题时。

参考资料：
花书《8.7优化策略和元算法》p194
英文版：《Chapter 8Optimization for Training DeepModels》

【代码实现五】添加Dropout层和批标准化层

# Dropout
keras.Sequential([
    # ...
    layers.Dropout(rate=0.3), # 随机丢弃30%下一层的输入
    layers.Dense(16),
    # ...
])

# 如果将批标准化层添加为网络的第一层，它可以作为一种自适应的预处理器，类似于Sci-Kit Learn的StandardScaler的作用。

# 在一层后面添加Batch Normalization
layers.Dense(16, activation='relu'),
layers.BatchNormalization(),

# 在一层与其激活函数之间使用 Batch Normalization
layers.Dense(16),
layers.BatchNormalization(),
layers.Activation('relu'),

六、二分类问题

二分类问题

将数据分为两个类别是常见的机器学习问题。比如预测客户是否有可能购买商品，信用卡交易是否存在欺诈，深空信号是否显示了新的行星证据，或者医学测试是否显示了某种疾病证据。这些都是二分类问题。

在原始数据中，类别可以用字符串表示，比如"Yes"和"No"，或者"Dog"和"Cat"。在使用这些数据之前，我们会给它们分配一个类别标签：一个类别将被标记为0，另一个类别将被标记为1。分配数值标签将数据转化为神经网络可以使用的形式。

准确率和交叉熵

准确率是用于衡量分类问题成功度的众多度量之一。准确率是正确预测的数量与总预测数量的比率：准确率 = 正确预测数 / 总数。如果一个模型总是预测正确，它的准确率得分将为1.0。其他条件相同的情况下，准确率是一个合理的度量标准，适用于数据集中的类别出现频率大致相同的情况。

准确率（以及大多数其他分类度量）的问题在于它不能作为损失函数来使用。随机梯度下降（SGD）需要一个能够平滑变化的损失函数，而准确率作为计数比率在变化时会产生"跳跃"。因此，我们需要选择一个代替品作为损失函数，这个代替品就是交叉熵函数。

回顾一下，损失函数在训练过程中定义了网络的目标。

对于回归问题，我们的目标是最小化期望结果与预测结果之间的距离。我们选择了平均绝对误差（MAE）来衡量这个距离。
对于分类问题，我们希望的是概率之间的距离，这就是交叉熵是——一种从一个概率分布到另一个概率分布的距离度量。

交叉熵对错误的概率预测进行惩罚。

我们的想法是，我们希望网络以概率1.0预测正确的类别。预测概率与1.0的差距越大，交叉熵损失就越大。

我们使用交叉熵的技术原因可能有点微妙，但从本节中主要可以得出一个结论：对于分类损失，使用交叉熵；其他您可能关心的指标（如准确率）通常会随着交叉熵的改善而提高。

交叉熵作为损失函数的一个重要特点是，它在梯度计算时能够有效地促使神经网络的权重进行调整，从而改进预测结果。相对于准确率等离散指标，交叉熵是一个连续、平滑的函数，适用于梯度下降等优化算法，这使得网络的训练更加稳定。

总之，当您面临二分类问题时，可以将交叉熵作为损失函数，它能够有效地衡量预测概率分布之间的差距，同时在训练中促使神经网络调整权重以获得更好的预测性能。

使用Sigmoid函数生成概率

交叉熵和准确率函数都需要概率作为输入，也就是从0到1的数值。为了将密集层生成的实值输出转化为概率，我们会使用一种新的激活函数，即Sigmoid激活函数。

Sigmoid函数将实数映射到区间[0,1]。

为了得到最终的类别预测，我们定义了一个阈值概率。通常这个阈值为0.5，这样四舍五入就会给我们正确的类别：小于0.5意味着属于标签0的类别，0.5或以上意味着属于标签1的类别。0.5的阈值是Keras在默认情况下使用的准确率指标。

【代码示例六】

Ionosphere 数据集包含从聚焦于地球大气层电离层的雷达信号中获取的特征。任务是确定信号是否显示出某个物体的存在，或者只是空气。

import pandas as pd
from IPython.display import display

ion = pd.read_csv('../input/dl-course-data/ion.csv', index_col=0)
display(ion.head())

df = ion.copy()
df['Class'] = df['Class'].map({'good': 0, 'bad': 1})

df_train = df.sample(frac=0.7, random_state=0)
df_valid = df.drop(df_train.index)

max_ = df_train.max(axis=0)
min_ = df_train.min(axis=0)

df_train = (df_train - min_) / (max_ - min_)
df_valid = (df_valid - min_) / (max_ - min_)
df_train.dropna(axis=1, inplace=True) # drop the empty feature in column 2
df_valid.dropna(axis=1, inplace=True)

X_train = df_train.drop('Class', axis=1)
X_valid = df_valid.drop('Class', axis=1)
y_train = df_train['Class']
y_valid = df_valid['Class']

我们将像对回归任务那样定义模型，除了在最后一层添加一个 'sigmoid' 激活函数，以便模型能够产生类别概率。

from tensorflow import keras
from tensorflow.keras import layers

model = keras.Sequential([
    layers.Dense(4, activation='relu', input_shape=[33]),
    layers.Dense(4, activation='relu'),    
    layers.Dense(1, activation='sigmoid'),
])

使用 compile 方法为模型添加交叉熵损失和准确率指标。对于二分类问题，确保使用 'binary' 版本的损失函数。（多类别问题会稍有不同。）Adam 优化器在分类问题中也表现出色，因此我们将继续使用它。

model.compile(
    optimizer='adam',
    loss='binary_crossentropy',
    metrics=['binary_accuracy'],
)

在这个特定问题中，模型可能需要相当多的 epochs 才能完成训练，因此我们将添加早停（early stopping）回调以方便管理。

early_stopping = keras.callbacks.EarlyStopping(
    patience=10,
    min_delta=0.001,
    restore_best_weights=True,
)

history = model.fit(
    X_train, y_train,
    validation_data=(X_valid, y_valid),
    batch_size=512,
    epochs=1000,
    callbacks=[early_stopping],
    verbose=0, # hide the output because we have so many epochs
)

最后，查看学习曲线，并检查我们在验证集上获得的损失和准确率的最佳值。

history_df = pd.DataFrame(history.history)
# 从第 5 个 epoch 开始绘制图形
history_df.loc[5:, ['loss', 'val_loss']].plot()
history_df.loc[5:, ['binary_accuracy', 'val_binary_accuracy']].plot()


print(("Best Validation Loss: {:0.4f}" +\
      "\nBest Validation Accuracy: {:0.4f}")\
      .format(history_df['val_loss'].min(), 
              history_df['val_binary_accuracy'].max()))

这将帮助我们了解模型的训练进展以及在验证集上的表现。最终的最佳验证损失和准确率值将在输出中显示。

参考链接：https://www.kaggle.com/learn/intro-to-deep-learning

你可能感兴趣的:(深度学习,深度学习,笔记,人工智能)

《神经网络与深度学习》(邱锡鹏) 内容概要【不含数学推导】 code_stream #机器学习神经网络
第1章绪论基本概念：介绍了人工智能的发展历程及不同阶段的特点，如符号主义、连接主义、行为主义等。还阐述了深度学习在人工智能领域的重要地位和发展现状，以及其在图像、语音、自然语言处理等多个领域的成功应用。术语解释人工智能：旨在让机器模拟人类智能的技术和科学。深度学习：一种基于对数据进行表征学习的方法，通过构建具有很多层的神经网络模型，自动从大量数据中学习复杂的模式和特征。第2章机器学习概述基本概念：
图像识别与应用狂踹瘸子那条好脚 python
图像识别作为人工智能领域的重要分支，近年来取得了显著进展，其中卷积神经网络（CNN）功不可没。CNN凭借其强大的特征提取能力，在图像分类、目标检测、人脸识别等任务中表现出色，成为图像识别领域的核心技术。一、卷积神经网络：图像识别的利器CNN是一种专门处理网格状数据的深度学习模型，其结构设计灵感来源于生物视觉系统。与全连接神经网络不同，CNN通过卷积层、池化层等结构，能够有效提取图像的局部特征，并逐
大模型如何改变教育？典型应用场景的探究与展望！ AGI大模型学习大模型应用人工智能 AI产品经理 llama 大模型 AI 大模型教程
目前，大模型在教育领域的应用主要体现在个性化学习助手、智能问答系统、内容生成与创作辅助、智能写作评估、跨语言学习支持、数学解题辅助等几个方面。大模型技术在教育领域凭借卓越的数据处理能力和深度学习技术，极大推动了教育质量的提升与教育公平的实现。分级分类的教育数据助力大模型发展在构建与优化大模型的过程中，教育数据能够帮助我们更精准地理解教育现象，更有质量地辅助教学。教育数据涵盖广泛，包括但不限于学生的
使用 Docker 基本命令创建并发布带有新功能的镜像到阿里云 2021级计算机网络技术2班梁嘉敏 docker 阿里云容器
1.关于Docker镜像1.基础假定您在开发一个网上商城，您使用的是一台笔记本电脑而且您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。此外，您的企业还拥有标准化的测试和生产环境，且具有自身的配置和一系列支持文件。您希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销。请问？您要如何确保应用能够在这些环境中运行和
DeepSeek原理介绍以及对网络安全行业的影响 AI拉呱 Deepseek 人工智能
大家好，我是AI拉呱，一个专注于人工智领域与网络安全方面的博主，现任资深算法研究员一职，兼职硕士研究生导师；热爱机器学习和深度学习算法应用，深耕大语言模型微调、量化、私域部署。曾获多次获得AI竞赛大奖，拥有多项发明专利和学术论文。对于AI算法有自己独特见解和经验。曾辅导十几位非计算机学生转行到算法岗位就业。关注评审分享一起学习更多知识。1.DeepSeek公司介绍1.1DeepSeek是什么：wh
【学习笔记】Elasticsearch之环境搭建聪明马的博客 elasticsearch 学习笔记 elasticsearch
Elasticsearch官网本文是自己在学习Elasticsearch的过程中，记下的觉得非常有用的笔记，希望对大家认识Elasticsearch有一点点帮助。1.什么是Elasticsearch官网上是这么介绍的：Elasticsearchisadistributeddocumentstore.Insteadofstoringinformationasrowsofcolumnardata,El
知识图谱构建概念、工具、实例调研熟悉的黑曼巴知识图谱人工智能
一、知识图谱的概念知识图谱（Knowledgegraph）知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。知识图谱由节点和边组成。节点可以是实体，如一个人、一本书等，或是抽象的概念，如人工智能、知识图谱等。边可以是实体的属性，如姓名、书名或是实体之间的关系，如朋友、配偶。知识图谱的早期理念来自SemanticWeb（语义网络），其最初理想是把基于文本链接的万维网落转化为基于
auto-gptq安装以及不适配软硬件环境可能出现的问题及解决方式 IT修炼家大模型部署大模型 auto-gptq cuda
目录1、auto-gptq是什么？2、auto-gptq安装3、auto-gptq不正确安装可能会出现的问题（1）爆出：`CUDAextensionnotinstalled.`（2）没有报错但是推理速度超级慢1、auto-gptq是什么？Auto-GPTQ是一种专注于量化深度学习模型的工具库。它的主要目标是通过量化技术（Quantization）将大型语言模型（LLM）等深度学习模型的大小和计算复
【deepseek与chatGPT辩论】辩论题： “人工智能是否应当具备自主决策能力？” 海宁不掉头发软件工程人工智能人工智能 chatgpt deepseek
探讨辩论题这个提案涉及创建一个精确的辩论题目，旨在测试deepseek的应答能力。创建辩论题目提议设计一个辩论题目以测试deepseek的应答能力。希望这个题目具有挑战性并能够测量其回应质量。好的，来一道适合深度学习的辩论题：辩论题：“人工智能是否应当具备自主决策能力？”这个话题涉及到人工智能的发展、伦理以及未来应用，可以从以下几个方面展开辩论：支持方：认为人工智能的自主决策能力能够加速科技进步，
React学习笔记（组件通信）_千峰教育 react m0_54846402 程序员 react.js 学习笔记
reduxprinciple-+//定义一个dispatch的方法，接收到动作之后，自动调用constdispatch=(action)=>{changeState(action)renderCount(countState)}```创建createStore方法Reduxprinciple02reduxprinciple-+//定义一个方法，用于集中管理state和dispatchconstcr
拯救者机型背光键盘无法开启 famous_pengfei 计算机外设笔记本电脑
如果你是联想拯救者系列笔记本电脑的用户，想必对背光键盘这一酷炫功能十分喜爱。然而，当背光键盘突然无法开启时，这无疑会让人感到困惑和沮丧。别担心，联想官方知识库已经为你准备好了详细的解决方案。文章中提到，Windows10系统下，用户可以通过开始菜单进入LenovoSettings来开启背光键盘。这个方法简单易懂，即使是电脑小白也能轻松上手。此外，文章还提供了详细的图文说明，帮助用户更直观地理解操作
GenAI 平台，3 分钟即可构建基于 Claude、DeepSeek 的 AI Agent DO_Community 人工智能
DigitalOcean云服务在前不久发布了GenAI平台——一个让任何团队都能在几分钟内构建和部署AI代理的平台。DigitalOcean的GenAI平台持续扩展，让人工智能驱动的开发变得更加易用、灵活且强大。近日，Digitalocean宣布将Anthropic的Claude模型和DeepSeekR1引入Digitalocean的生态系统，为你提供更多构建和部署AI应用的选择。通过Anthro
智享AI直播三代系统，马斯克旗下AI人工智能直播工具,媲美DeepSeek！ V__17671155793 人工智能
智享AI直播三代系统，马斯克旗下AI人工智能直播工具,媲美DeepSeek！在科技飞速发展的当下，人工智能正以前所未有的态势重塑着各个行业的格局。直播领域，作为信息传播与商业交互的前沿阵地，也在AI技术的赋能下迎来了颠覆性的变革。其中，马斯克旗下的智享AI直播三代系统宛如一颗璀璨的新星，横空出世，以其卓越的性能和创新的理念，迅速在竞争激烈的直播市场中崭露头角，甚至被业界誉为可媲美DeepSeek的
蓝队基础：企业网络安全架构与防御策略重生之物联网转网安网络安全安全
声明学习视频来自B站up主**泷羽sec**有兴趣的师傅可以关注一下，如涉及侵权马上删除文章，笔记只是方便各位师傅的学习和探讨，此文章为对视频内容稍加整理发布，文章所提到的网站以及内容，只做学习交流，其他均与本人以及泷羽sec团队无关，切勿触碰法律底线，否则后果自负！！！！有兴趣的小伙伴可以点击下面连接进入b站主页[B站泷羽sec](https://space.bilibili.com/35032
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用 xiao5kou4chang6kai4 深度学习遥感勘测 python 深度学习分类
专题一：深度学习发展与机器学习深度学习的历史发展过程机器学习，深度学习等任务的基本处理流程梯度下降算法讲解不同初始化，学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络、卷积运算的基本原理池化操作，全连接层，以及分类器的作用BP反向传播算法的理解一个简单CNN模型代码理解特征图，卷积核可视化分析专题三TensorFlow与keras介绍与入门TensorFlow
DeepSeek与ChatGPT：会取代搜索引擎和人工客服的人工智能革命云边有个稻草人热门文章 chatgpt 搜索引擎人工智能 DeepSeek
云边有个稻草人-CSDN博客在众多创新技术中，DeepSeek和ChatGPT无疑是最为引人注目的。它们通过强大的搜索和对话生成能力，能够改变我们与计算机交互的方式，帮助我们高效地获取信息，增强智能服务。本文将深入探讨这两项技术如何结合使用，为用户提供更精准、更流畅的对话和搜索体验。目录一、介绍1.1什么是DeepSeek？1.2什么是ChatGPT？1.3DeepSeek与ChatGPT的结合：
Python入门笔记「已注销」计算机
文章目录第0周课程导学第1周Python基本语法元素保留字数据类型语句与函数输入函数第2周Python基本图形绘制turtle库绝对坐标海龟坐标turtle角度坐标体系RGB色彩体系画笔控制函数运动控制函数方向控制函数循环语句第3周基本数据类型整型浮点数科学计数法复数类型数值运算操作符二元操作符有对应的增强赋值操作符数值运算函数字符串类型的表示字符串切片字符串类型及操作字符串类型格式化time库时
LLM与知识图谱融合:智能运维知识库构建 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着信息技术的飞速发展，IT运维管理面临着越来越大的挑战。海量的设备、复杂的网络环境、日益增长的数据量，使得传统的运维方式难以满足需求。为了提高运维效率和质量，智能运维应运而生。智能运维的核心是将人工智能技术应用于运维领域，通过机器学习、深度学习等算法，实现自动化、智能化的运维管理。其中，大语言模型（LLM）和知识图谱是两个重要的技术方向。LLM能够理解和生成自然语言，可以用于构建智能
RT-Thread I2C 驱动框架学习笔记 DgHai RT-Thread mcu 单片机
RT-ThreadI2C驱动框架（5.1.0）II2C驱动包括两大部分，I2C驱动总线驱动和I2C设备驱动。I2C总线驱动负责控制I2C总线的硬件，包括发送和接收数据的时序控制，以及处理总线冲突等。它与嵌入式系统的硬件层交互，实现对I2C总线的底层操作，使得应用程序可以通过I2C总线与外部设备进行通信。I2C设备驱动负责管理和控制连接在I2C总线上的具体外部设备。它与I2C总线驱动和嵌入式系统的驱
CCNP350-401学习笔记（351-400题）殊彦_sy CCNP题库学习
351、WhichnewenhancementwasimplementedinWi-Fi6?A.4096QuadratureAmplitudeModulationModeB.ChannelbondingC.Wi-FiProtectedAccess3D.UplinkandDownlinkOrthogonalFrequencyDivisionMultipleAccess352、HowdoesIGMPf
16、电科院FTU检测标准学习笔记-基本性能2 six2me 配电自动化(FTU)测试笔记学习笔记 FTU 配电检测
作者简介：本人从事电力系统多年，岗位包含研发，测试，工程等，具有丰富的经验在配电自动化验收测试以及电科院测试中，本人全程参与，积累了不少现场的经验————————————————————————————————————目录交流工频电量影响量试验频率带来的影响谐波变化带来的影响不平衡电流对功率的影响三相功率测量元件之间相互作用引起的改变故障电流采集电流过载检测（大电流）状态量输出（遥控）输入SOE分
C语言流程控制学习笔记前端熊猫 C语言 c语言学习笔记
1.顺序结构顺序结构是程序中最基本的控制结构，代码按从上到下的顺序依次执行。大多数C语言程序都是由顺序结构组成的。2.选择结构选择结构根据条件的真假来决定执行哪一段代码。在C语言中，选择结构主要有以下几种：2.1if语句if语句用于根据条件的真假来执行相应的代码块。if(condition){//当条件为真时执行的代码}2.2if-else语句if-else语句用于在条件为真时执行一段代码，为假时
Python中LLM的知识图谱构建：动态更新与推理二进制独立开发 GenAI与Python 非纯粹GenAI python 知识图谱开发语言自然语言处理人工智能分布式机器学习
文章目录引言1.知识图谱的基本概念1.1知识图谱的定义1.2知识图谱的构建流程2.利用LLM进行知识抽取2.1实体识别2.2关系抽取2.3属性抽取3.知识融合3.1实体对齐3.2冲突消解4.知识存储5.知识推理5.1规则推理5.2基于LLM的推理6.动态更新6.1增量更新6.2实时更新7.结论引言随着人工智能技术的飞速发展，知识图谱（KnowledgeGraph,KG）作为一种结构化的知识表示方法
无需配置！深脑云一键启用DeepSeek全系AI模型小深ai硬件分享人工智能深度学习服务器
解锁无限算力潜能，开启DeepSeek镜像云算力新征程！在人工智能风起云涌的时代，算力就是驱动创新的引擎，而优质的模型镜像则是引领变革的密钥。我们向您介绍一下我们的深脑云算力平台，这里汇聚了DeepSeek的各大版本镜像，为您的科研、开发与创新之路注入强大动力！强大的DeepSeek模型家族DeepSeek，作为AI领域的璀璨明星，以其卓越的性能和先进的技术架构闻名遐迩。我们的平台精心整合了Dee
AI服务器散热黑科技：让芯片“冷静”提速小深ai硬件分享人工智能深度学习服务器
AI服务器为何需要散热黑科技在人工智能飞速发展的当下，AI服务器作为核心支撑，作用重大。从互联网智能推荐，到医疗疾病诊断辅助，从金融风险预测，到教育个性化学习，AI服务器广泛应用，为各类复杂人工智能应用提供强大算力。然而，AI服务器在运行时面临着严峻的散热挑战。随着人工智能技术的不断发展，对AI服务器的计算能力要求越来越高，这使得服务器的功率密度急剧增加。以GPT-4的训练为例，它需要大量的GPU
深度应用场景：DeepSeek —— 探索AI赋能的智慧未来人工智能专属驿站人工智能
深度应用场景：DeepSeek——探索AI赋能的智慧未来随着人工智能的迅猛发展，数据的价值已不再局限于简单的存储与处理，它们正变得更加智能与高效。DeepSeek，这一创新的AI技术平台，正以其独特的深度学习能力，开启了各行各业的智能化变革。让我们走进一个由DeepSeek打造的深度应用场景，探索它如何推动未来的发展。1.智能医疗：精准诊断，拯救生命想象一下，医生们不再是唯一的诊断专家，而是与AI
卷积神经网络之AlexNet经典神经网络，实现手写数字0~9识别知识鱼丸深度学习神经网络 cnn 人工智能深度学习 AlexNet 经典神经网络
深度学习中较为常见的神经网络模型AlexNet，AlexNet是一个采用GPU训练的深层CNN，本质是种LeNet变体。由特征提取层的5个卷积层两个下采样层和分类器中的三个全连接层构成。先看原理：AlexNet网络特点采用ReLU激活函数，使训练速度提升6倍采用dropout层，防止模型过拟合通过平移和翻转的方式对数据进行增强采用LRN局部响应归一化，限制数据大小，防止梯度消失和爆炸。但后续证明批
小白入门笔记：CMake编译过程详解 3Ｄ视觉工坊 3D视觉从入门到精通笔记 c++开发语言
作者丨SkyShaw@知乎点击进入—>3D视觉工坊学习交流群1、你好，CMake1.1CMake是什么？我觉得针对这个问题最简单（但不是最正确的）的回答应该是：“CMake是服务于将源代111码转换成可执行的文件的工具”。将源码转换为可工作应用会比较神奇。不仅是效果本身(即设计并赋予生命的工作机制)，而且是将理念付诸于过程的行为本身。CMake本身是一个工具集，由五个可执行的程序组成：cmake、
在 DeepSeek 驱动的编程变革中抓住机遇并脱颖而出智想天开 AI技术人工智能 deep learning
公众号地址:在DeepSeek驱动的编程变革中抓住机遇并脱颖而出更多内容请关注公众号：智想天开前言在DeepSeek引领的新一轮AI技术革新中，程序员们正面临着前所未有的挑战。随着DeepSeek等人工智能工具的迅猛发展，编程领域正在发生深刻变革。这些先进的工具不仅能够自动化完成繁重的代码生成和调试任务，还能够根据大量数据提供优化建议，改变了传统编程的工作流程。虽然这些技术为提高工作效率和解放开发
项目管理新趋势！2024年，Jira与Codes你更倾向谁？ Codes_AndyLiu jira teambition redmine 项目管理软件项目管理工具项目管理 jira 国产平替
一、项目管理软件新趋势概述2024年，项目管理软件呈现出诸多新趋势，这些趋势对于项目管理的重要性日益凸显。在数字化转型方面，项目管理软件成为企业实现数字化转型的关键工具。让老板感知数据，让中层管理者感受先进，让基层员工感到舒心.人工智能与自动化在项目管理软件中的应用也越来越广泛。项目管理软件正朝着智能化、自动化的方向迈进，利用AI技术提供个性化和场景化解决方案。例如，工作周报AI化，自动化测试，代
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。