KunLDB

基于keras的猫狗图像分类

# coding: utf-8

# ## EDA & pre-processing

# In[1]:


import os , shutil
original_dataset_dir = '/home/lkl/.kaggle/competitions/dogs-vs-cats/train'
base_dir = '/home/lkl/.kaggle/competitions/dogs-vs-cats-small'
os.mkdir(base_dir)


# In[2]:


train_dir = os.path.join(base_dir, 'train')
validation_dir = os.path.join(base_dir, 'validation')
test_dir = os.path.join(base_dir, 'test')
os.mkdir(train_dir)
os.mkdir(validation_dir)
os.mkdir(test_dir)


# In[3]:


train_cats_dir = os.path.join(train_dir, 'cats')
train_dogs_dir = os.path.join(train_dir, 'dogs')
validation_cats_dir = os.path.join(validation_dir, 'cats')
validation_dogs_dir = os.path.join(validation_dir, 'dogs')
test_cats_dir = os.path.join(test_dir, 'cats')
test_dogs_dir = os.path.join(test_dir, 'dogs')
os.mkdir(train_cats_dir)
os.mkdir(train_dogs_dir)
os.mkdir(validation_cats_dir)
os.mkdir(validation_dogs_dir)
os.mkdir(test_cats_dir)
os.mkdir(test_dogs_dir)


# In[17]:


fnames = ['cat.{}.jpg'.format(i) for i in range(1000)]

for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_cats_dir, fname)
    shutil.copyfile(src, dst)

fnames = ['cat.{}.jpg'.format(i) for i in range(1000, 1500)]

for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_cats_dir, fname)
    shutil.copyfile(src, dst)

fnames = ['cat.{}.jpg'.format(i) for i in range(1500, 2000)]

for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_cats_dir, fname)
    shutil.copyfile(src, dst)


# In[29]:


fnames = ['dog.{}.jpg'.format(i) for i in range(1000)]

for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_dogs_dir, fname)
    shutil.copyfile(src, dst)

fnames = ['dog.{}.jpg'.format(i) for i in range(1000, 1500)]

for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_dogs_dir, fname)
    shutil.copyfile(src, dst)

fnames = ['dog.{}.jpg'.format(i) for i in range(1500, 2000)]

for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_dogs_dir, fname)
    shutil.copyfile(src, dst)


# In[30]:


len(os.listdir(train_cats_dir))


# ## Build the model

# small split has 2000 pictures with 1000 trains , 500 tests, 500 validations

# In[31]:


from keras import layers
from keras import models 


# In[35]:


model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape = (150, 150, 3)))  
## 150 150 从何而来
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3) ,activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))


# In[36]:


model.summary()


# In[38]:


from keras import optimizers
model.compile(loss = 'binary_crossentropy',
              optimizer = optimizers.RMSprop(lr = 1e-4),
              metrics = ['acc'])
             


# In[11]:


from keras.preprocessing.image import ImageDataGenerator
train_datagen = ImageDataGenerator(rescale = 1./255)
test_datagen = ImageDataGenerator(rescale = 1./255)  ##1.代表浮点数
train_generator = train_datagen.flow_from_directory(   ##产生数据流
        train_dir,
        target_size = (150, 150),
        batch_size = 20,
        class_mode = 'binary')
validation_generator = test_datagen.flow_from_directory(
        validation_dir,
        target_size = (150, 150),
        batch_size = 20,
        class_mode = 'binary')


# In[43]:


for data_batch, labels_batch in train_generator:
    print('data batch shape :', data_batch.shape)## 遍历每个图片,所以要break
    print('labels batch shape :', labels_batch.shape)
    break


# ## Model Processing

# In[45]:


###开始训练
history = model.fit_generator(
    train_generator,  ##使用训练集数据
    steps_per_epoch = 100,   ##一个epoch分成100个batch,每个20样本即batch_szie
    epochs = 30,  ##30轮
    validation_data = validation_generator,  #使用交叉验证数据
    validation_steps = 50  ##交叉验证50次
        )


# 可以观察到在22次训练时几乎没有提升了,而训练集上的准确度达到0.99,这就是标准的过拟合

# ## Save  & Load model

# In[3]:


model.save('cats_and_dogs_small_1.h5')


# In[6]:


from keras.models import load_model
model = load_model('cats_and_dogs_small_1.h5')


# In[5]:


pwd


# ## DIsplay learning curve of loss and accuracy 

# In[51]:


import matplotlib.pyplot as plt
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs = range(1, len(acc) + 1)  ##epoch :1-30
plt.plot(epochs, acc, 'bo', label = 'Training acc')
plt.plot(epochs, val_acc, 'b', label = 'Validation acc')
plt.title('Training and validation accuracy')
plt.legend()
plt.figure()
plt.plot(epochs, loss, 'bo', label = 'Training loss')
plt.plot(epochs, val_loss, 'b', label = 'Validation loss')
plt.title('Training and validation loss')
plt.legend()
plt.show()


# 过拟合的原因主要是参数太多样本太少,可采用drop_out, L2正则化,数据扩增等等方法

# ## Using data augmentation 

# In[13]:


datagen = ImageDataGenerator(
        rotation_range = 40,  ##旋转
        width_shift_range = 0.2, ##缩放
        height_shift_range = 0.2,
        shear_range = 0.2, 
        zoom_range = 0.2, ##模糊
        horizontal_flip = True,  
        fill_mode = 'nearest')


# ## Display augmented training images

# In[29]:


import matplotlib.pyplot as plt
from keras.preprocessing import image
fnames = [os.path.join(train_cats_dir, fname) for 
    fname in os.listdir(train_cats_dir)]    ##对每个图片取对应名字构成矩阵,fname为变量
img_path = fnames[0]
img = image.load_img(img_path, target_size = (150, 150))
x = image.img_to_array(img)  ##变成 [3,150,150]
x = x.reshape((1,) + x.shape)  ##变成[1,3,150,150]  为何变为4维,第一个维度为batch_size
i = 0
for batch in datagen.flow(x, batch_size=1):
    plt.figure(i)
    imgplot = plt.imshow(image.array_to_img(batch[0]))
    i += 1
    if i % 4 == 0:   ##输出4个图像
        break
plt.show()


# ## new convnet with dropout

# In[4]:


from keras import models
from keras import layers
from keras import optimizers
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), input_shape = (150, 150, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation= 'relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dropout(0.5))
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))
model.compile(loss = 'binary_crossentropy',
              optimizer = optimizers.RMSprop(lr = 1e-4),
              metrics = ['acc'])


# ## Training with data-augmentation

# In[5]:


from keras.preprocessing.image import ImageDataGenerator
train_datagen = ImageDataGenerator(  ##扩充数据,
    rescale = 1./255,
    rotation_range = 40,
    width_shift_range = 0.2,
    height_shift_range = 0.2,
    shear_range = 0.2,
    zoom_range = 0.2,
    horizontal_flip = True,)
test_datagen = ImageDataGenerator(rescale = 1./255)   ##validation 不需要进行数据扩增
train_generator = train_datagen.flow_from_directory(  ##原本数据
    train_dir,
    target_size = (150, 150),
    batch_size = 32,
    class_mode = 'binary')
validation_generator = test_datagen.flow_from_directory(  ##原本val数据
    validation_dir,
    target_size = (150, 150),
    batch_size = 32,
    class_mode ='binary')
history = model.fit_generator(
    train_generator,
    steps_per_epoch = 100,
    epochs = 100,
    validation_data = validation_generator,
    validation_steps = 50)


# ## save model 2 

# In[6]:


model.save('cats_and_dogs_small_2.h5')


# In[1]:


from keras.models import load_model
model = load_model('cats_and_dogs_small_2.h5')


# In[17]:


import matplotlib.pyplot as plt
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs = range(1, len(acc) + 1)
plt.plot(epochs, acc, 'bo', label = 'Training acc')
plt.plot(epochs, val_acc, 'b', label = 'Validation acc')
plt.title('Training and validation accuracy')
plt.legend()
plt.figure()
plt.plot(epochs, loss, 'bo', label = 'Training loss')
plt.plot(epochs, val_loss, 'b', label = 'Validation loss')
plt.title('Training and validation loss')
plt.legend()
plt.show()


# 

# In[1]:


from keras.applications import VGG16
conv_base = VGG16(weights = 'imagenet',
                  include_top = False,
                  input_shape = (150, 150, 3))    ##頂部輸入爲自己的圖片shape,故有2,3參數


# In[2]:


conv_base.summary()


# In[12]:


import os
import numpy as np 
from keras.preprocessing.image import ImageDataGenerator
base_dir = '/home/lkl/.kaggle/competitions/dogs-vs-cats-small/'
train_dir = os.path.join(base_dir, 'train')
validation_dir = os.path.join(base_dir, 'validation')
test_dir = os.path.join(base_dir, 'test')
datagen = ImageDataGenerator(rescale = 1./255)
batch_size = 20
def extract_features(directory, sample_count):    ##特徵抽取
    features = np.zeros(shape = (sample_count, 4, 4, 512))  ##最後一層池化將輸出維度變爲4*4*512,故此處抽出的特徵維度構成的張量也是一樣的
    labels = np.zeros(shape = (sample_count))  ##labels於此處不是用於分類,而是表示每個輸入抽象而成的sample
    
    generator = datagen.flow_from_directory(
    directory,  ##根目錄
    target_size = (150, 150),
    batch_size = batch_size,   ##每個batch的樣本數
    class_mode = 'binary')
    
    
    i = 0
    for input_batch, labels_batch in generator:   ##生成的爲迭代器,返回兩個batch,分別代表target_size下的輸入和對應的標籤(文件夾名稱
        features_batch = conv_base.predict(input_batch)  ##使用VGG16對其進行抽取
        features[i * batch_size : (i + 1) * batch_size] = features_batch
        labels[i * batch_size : (i + 1) * batch_size] = labels_batch
        i += 1
        if i * batch_size >= sample_count:
            break
    return features, labels   ## [] 也可看做np矩陣
    


# In[3]:


train_features, train_labels = extract_features(train_dir, 2000)


# In[4]:


validation_features, validation_labels = extract_features(validation_dir, 1000)


# In[5]:


test_features, test_labels = extract_features(test_dir, 1000)


# 現在得到了利用VGG16對圖片進行特徵抽取的結果,下一部需要將其用於分類,故需要接上一個全連接層,則需要對抽取得到的512 4 4 的特徵向量進行平鋪Flatting,然後接上全連接層並訓練分類

# In[6]:


train_features = np.reshape(train_features, (2000, 512*4*4 ))
validation_features = np.reshape(validation_features, (1000, 512*4*4))
test_features = np.reshape(test_features, (1000, 512*4*4))


# In[13]:


##這部分是用VGG16進行預先抽取然後再分類(只有少量的全連接層加上分類器),其速度特別快
from keras import models
from keras import layers
from keras import optimizers
model = models.Sequential()
model.add(layers.Dense(256, activation = 'relu', input_dim = (4*4*512)))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(1, activation = 'sigmoid'))  ## 將其輸出化爲0-1
model.compile( optimizer = optimizers.rmsprop(lr = 2e-5),
                                              loss = 'binary_crossentropy',
                                              metrics = ['acc'])
history = model.fit(train_features, train_labels,
                    epochs = 30,    ##進行30輪,每輪每次讀20個數據
                    batch_size = 20,
                    validation_data = (validation_features,validation_labels))


# ## 繪制學習曲線

# In[16]:


import matplotlib.pyplot as plt 
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs = range(1, len(acc) + 1)
plt.plot(epochs, acc, 'bo', label = 'Training_acc')
plt.plot(epochs, val_acc, 'b', label = 'Validation_acc')
plt.title('Training and validation accuracy')
plt.legend()
plt.figure()
plt.plot(epochs, loss, 'bo' , label = 'Training loss')
plt.plot(epochs, val_loss, 'b', label = 'Validation loss')
plt.title('Training and validation loss')
plt.legend()
plt.show()


# 上圖可以發現,無論是測試還是訓練集,其準確度都較高達到了0.9,但是觀察loss曲線發現其仍舊存在過擬合現象,故仍可以繼續優化,而過擬合的原因初步是因爲訓練集樣本較少,所以可以考慮使用數據變換進行擴充

# ## 將VGG16不做特徵抽取而直接作爲訓練時神經網絡的一部分

# In[14]:


from keras import models 
from keras import layers 
model = models.Sequential()
model.add(conv_base)
model.add(layers.Flatten())
model.add(layers.Dense(256, activation = 'relu'))
model.add(layers.Dense(1, activation='sigmoid'))
model.summary()


# 可以觀察到,其參數比之前的網絡高出5倍,訓練時間是天文數字,從而考慮固定vgg16的權值

# In[24]:


model.trainable_weights  


# In[22]:


conv_base.trainable = False  
len(model.trainable_weights)  ##固定後需要訓練的部分只包括dense層的函數和偏置


# In[23]:


model.summary()


# ## 使用固定的VGG16,採用數據擴充訓練

# In[16]:


from keras.preprocessing.image import ImageDataGenerator
from keras import optimizers
train_datagen  = ImageDataGenerator(
        rescale = 1./255, ##像素值歸一化
        rotation_range = 40,  ##旋轉40度
        width_shift_range  = 0.2, ## 寬度20
        height_shift_range = 0.2,
        shear_range = 0.2,##錯切變換,即斜向拉長或放縮
        zoom_range = 0.2,  ##整體放錯0.2
        horizontal_flip = True,  ## 隨機水平翻轉
        fill_mode = 'nearest'  ## 變換時所產生的邊緣區域填充方式
            )
test_datagen = ImageDataGenerator(
        rescale = 1./255)
train_generator = train_datagen.flow_from_directory(
    train_dir,
    batch_size = 20,
    target_size = (150, 150),
    class_mode = 'binary'
)
validation_generator = test_datagen.flow_from_directory(
    validation_dir,
    target_size = (150, 150),
    class_mode = 'binary',
    batch_size = 20
)


# In[ ]:


model.compile(
    loss = 'binary_crossentropy',
    optimizer = optimizers.rmsprop(lr = 2e-5),
    metrics = ['acc'])
history = model.fit_generator(  ##由generator產生的數據,fit也用generator方法
    train_generator,
    steps_per_epoch=100,
    epochs = 30,
    validation_data = validation_generator,
    validation_steps = 50 )   ##????


# In[32]:


import matplotlib.pyplot as plt 
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs = range(1, len(acc) + 1)
plt.plot(epochs, acc, 'bo', label = 'Training_acc')
plt.plot(epochs, val_acc, 'b', label = 'Validation_acc')
plt.title('Training and validation accuracy')
plt.legend()
plt.figure()
plt.plot(epochs, loss, 'bo' , label = 'Training loss')
plt.plot(epochs, val_loss, 'b', label = 'Validation loss')
plt.title('Training and validation loss')
plt.legend()
plt.show()


# 此時acc和loss收斂到了較好的水平,過擬合問題基本去除了,如果想進一步去除過擬合問題則考慮從數據集入手,且代價較大

# ## Fine-tuning the model
# 作爲Freeze的補充方法,fine-tuning關注於修改部分的VGG16的結構,通常以頂層爲主,使得其適合自己的數據集

# ![image.png](attachment:image.png)

# In[2]:


conv_base.summary()


# In[9]:


conv_base.trainable = True
set_trainable = False
for layer in conv_base.layers:
    if layer.name == 'block5_conv1':
        set_trainable = True
    if set_trainable:
        layer.trainable = True
    else :
        layer.trainable = False
conv_base.summary()


# 此處訓練了block5_conv1時,其餘conv2,conv3也被訓練,這是因爲一個block的一層在訓練時會影響到其下所有block_conv

# ## Training fine-tuning model

# In[18]:


model.compile(loss = 'binary_crossentropy',
              optimizer = optimizers.rmsprop(lr = 1e-5),
              metrics = ['acc']
              )
history = model.fit_generator(
        train_generator,
        steps_per_epoch = 100,
        epochs = 30,
        validation_data = validation_generator,
        validation_steps = 50
)


# In[19]:


import matplotlib.pyplot as plt 
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs = range(1, len(acc) + 1)
plt.plot(epochs, acc, 'bo', label = 'Training_acc')
plt.plot(epochs, val_acc, 'b', label = 'Validation_acc')
plt.title('Training and validation accuracy')
plt.legend()
plt.figure()
plt.plot(epochs, loss, 'bo' , label = 'Training loss')
plt.plot(epochs, val_loss, 'b', label = 'Validation loss')
plt.title('Training and validation loss')
plt.legend()
plt.show()


# 將該不規則的曲線平滑化 ,前一個元素0.8,後一個元素0.2

# In[22]:


def smooth_curve(points, factor = 0.8):
    smoothed_points = []
    for point in points:
        if smoothed_points:
            previous = smoothed_points[-1]
            smoothed_points.append(previous * factor + point * (1 - factor))
        else:
            smoothed_points.append(point)
    return smoothed_points
plt.plot(epochs, smooth_curve(acc), 'bo', label = 'Smoothed training acc') 
plt.plot(epochs, smooth_curve(val_acc), 'b', label = 'Smoothed validation acc')
plt.title('Training and validation accuracy')
plt.legend()
plt.figure()
plt.plot(epochs, smooth_curve(loss), 'bo', label = 'Smoothed training loss') 
plt.plot(epochs, smooth_curve(val_loss), 'b', label = 'Smoothed validation loss')
plt.title('Training and validation loss')
plt.legend()
plt.show()


# 觀察到loss在變高的同時,acc卻提高了,這是因爲loss是基於點的平均值,而acc是對應loss下的一個分布而不是均值,所以會出loss在val上均值提高的情況下,acc也提高的情況

# ## 在測試集上進行訓練

# In[23]:


test_generator = test_datagen.flow_from_directory(
    test_dir,
    batch_size = 20,
    target_size = (150, 150),
    class_mode = 'binary'    ##二分類
    )
test_loss, test_acc = model.evaluate_generator(test_generator, steps=50)
print('test acc:', test_acc)


# 注意上述的條件只用了2000張圖片(10%的訓練集)就達到了92.5%正確率

# ## 訓練可視化

# In[1]:


from keras.models import load_model
model = load_model('cats_and_dogs_small_2.h5')
model.summary()


# In[30]:


##載入單張圖片數據
import numpy as np
img_path = '/home/lkl/.kaggle/competitions/dogs-vs-cats-small/test/cats/cat.1700.jpg'
from keras.preprocessing import image
img = image.load_img(img_path, target_size = (150, 150))
img_tensor = image.img_to_array(img)
img_tensor = np.expand_dims(img_tensor, axis = 0)   ##增加一個維度代表其爲第幾張圖片,在多張圖片展示時有用
img_tensor /= 255.
img_tensor.shape


# In[34]:


import matplotlib.pyplot as plt
plt.imshow(img_tensor[0])
plt.show() ##150*150的顯示


# In[36]:


from keras import models
layer_output = [layer.output for layer in model.layers[:8]]  ##top 8 層輸出
activation_model = models.Model(inputs = model.input, output = layer_output)  ## 8層輸出,一個輸入


# In[37]:


activations = activation_model.predict(img_tensor)
first_layer_activation = activations[0] ##使用第一層conv2d_1作輸出


# In[38]:


print(first_layer_activation.shape)  ##注意channel爲32.比原來3channel擴增8倍


# 從而輸出維度爲conv2d_1的output shape

# In[62]:


import matplotlib.pyplot as plt
for i in range(0,31):
    plt.matshow(first_layer_activation[0, :, :, i], cmap = 'viridis')  ##使用第四個channel
plt.show()


# ## 可視化特征向量

# In[103]:


layer_names = []
images_per_row = 16  ##(自定義每層conv輸出16個圖
for layer in model.layers[:6]:  ##不含dense層,否則會導致數據超出np數組
    layer_names.append(layer.name)

for layer_name, layer_activation in zip(layer_names, activations):  ##zip是由兩個list對應的元素構成二元組形成的列表
    n_features = layer_activation.shape[-1] ##一個深度爲一個feature,故取-1,即倒數一個
    size = layer_activation.shape[1]
    n_cols = n_features // images_per_row ##//爲相除後向下取整,故此爲列數??
    
    display_grid = np.zeros((size * n_cols, images_per_row * size )) ##對每層神經網絡輸出初始化np矩陣網格,其列爲size*深度數,列坐標爲size*每層的輸出特徵數
    for col in range(n_cols):
        for row in range(images_per_row):
            channel_image = layer_activation[0, :, :, col * images_per_row + row]  ##對應的圖對應的坐標
            channel_image -= channel_image.mean() 
            channel_image /= channel_image.std() ##標準化操作
            channel_image *= 64
            channel_image += 128  ##數據還原,這兩步使得還原的數據不超過255太多
            channel_image  = np.clip(channel_image, 0, 255).astype('uint8')##超過上下限時的數據約減,astype爲8位短整形數字,節約空間
            display_grid[col * size: (col+1) * size, row * size: (row + 1)*size] = channel_image
    scale = 1./ size 
    plt.figure(figsize=(scale * display_grid.shape[1],
                        scale * display_grid.shape[0])) ##figsize描述了繪圖對象個數,這裏是輸出圖片個數
    plt.title(layer_name)
    plt.grid(False)
    plt.imshow(display_grid, aspect='auto', cmap='viridis')
            


# In[104]:


plt.show()


# 從上可知越高層的卷积,其学到的特征向量就越加抽象

# ## 过滤器可视化

# In[35]:


from keras.applications import VGG16
from keras import backend as K
model = VGG16(weights = 'imagenet',
              include_top = False)
layer_name = 'block3_conv1'
filter_index = 0
layer_output = model.get_layer(layer_name).output
loss = K.mean(layer_output[:, :, :, filter_index])  ##自定义损失函数loss,tf里面的layer输出自带Y-Y*,故对于MSE只需求均值


# In[36]:


grads = K.gradients(loss , model.input)[0]   ##第二个参数相当于MSE中的自变量x


# In[37]:


## 正则化梯度trick,先将其平方,再求均值再开方,以使得平滑其快速收敛且避免陷入除以0 error
grads /= (K.sqrt(K.mean(K.square(grads))) + 1e-5)


# In[38]:


iterate = K.function([model.input], [loss, grads])  ## 这里定义了一个iterate函数用来表示数学函数表达式,其中自变量是input,输出是loss和grads.
                                                    ## 前者需要再调用该对象并赋予真正的输入


# In[39]:


def deprocess_image(x):
    x -= x.mean()        ##去均值化(0均值)
    x /= (x.std() + 1e-5)   ##标准差归一化,加上系数防止除0
    x *= 0.1   ##总体标准差归为0.1
    
    x += 0.5   ##使得其均值位置位于0,1的中点,此时将大量数据包含在0,1之间
    x = np.clip(x, 0, 1)  ##去除0,1外的离群点
    x *= 255   
    x = np.clip(x, 0, 255).astype('uint8')  ##将像素值化为uint8整型,因tensorflow在输出RGB时,若为浮点数需在0-1,大于1时为整型且需要位于0-255
    return x
##求当loss最大化时对应的grads
input_img_data = np.random.random((1, 150, 150, 3))*20 + 128  ## (0-1)*20 + 128 的区间范围
step = 1
for i in range(40):
    loss_value, grads_value = iterate([input_img_data])
    input_img_data += grads_value + input_img_data



y = deprocess_image(input_img_data)


# ## 注意
# Numpy数组与C数组一样,变量都类似于指针,对同一块内存区域的引用

# In[40]:


def generate_pattern(layer_name, filter_index, size = 150):
    layer_output = model.get_layer(layer_name).output
    loss = K.mean(layer_output[:, :, :, filter_index])
    grads = K.gradients(loss, model.input)[0]
    grads /= (K.sqrt(K.mean(K.square(grads))) + 1e-5) 
    iterate = K.function([model.input], [loss, grads])
    input_img_data = np.random.random((1, size, size, 3))*20 + 128
    
    step = 1
    for i in range(40):
        loss_values, grad_values = iterate([input_img_data])
        input_img_data += grad_values*step
    img = input_img_data[0]
    return deprocess_image(img)


# In[43]:


import matplotlib.pyplot as plt
import numpy as np
plt.imshow(generate_pattern('block3_conv1', 0))


# In[44]:


plt.show()


# In[87]:


input_img_data = np.random.random((1, 150, 150, 3))*20 + 128

input_img_data +=  grads_value
img = deprocess_image(input_img_data)


# In[88]:


img


# In[17]:


plt.show()


# filter同大小的随机噪音

# 由于本身是由对loss做梯度下降得到的结果,所以可对loss做梯度上升,就可以反映filter在原图中对于哪些部分学习的倾向,越亮的区域代表梯度变化的越多,即主要学习的区域,通过使用随机噪声做背景以此可以视作filter的学习倾向.

# In[103]:


##创建block1_conv1整层的可视化
def create_vision(layer_name):
    size = 64
    margin = 5
    
    results = np.zeros((8 * size + 7 * margin , 8 * size + 7*margin ,3))
    for i in range(8):
        for j in range(8):
            filter_img = generate_pattern(layer_name, i + (j * 8), size = size)
            horizontal_start = i * size + i * margin
            horizontal_end = horizontal_start + size
            vertical_start = j*size + j * margin
            vertical_end = vertical_start + size
            results[horizontal_start:horizontal_end, vertical_start:vertical_end, :] = filter_img
    plt.figure(figsize=(20, 20))
    plt.imshow(results.astype('uint8'))   ##不知为何deprocess_image无效,使得results矩阵并不是uint8格式,故需要转换否则不显示


# In[92]:


plt.show()


# In[106]:


create_vision('block1_conv2')
plt.show()


# 通过观察filter得知,同一个Block之间的连续卷积(未经过池化),其每个filter的学习目标并没有较大的差异

# In[112]:


create_vision('block2_conv1')
plt.show()


# In[111]:


create_vision('block3_conv1')
plt.show()


# In[108]:


create_vision('block4_conv1')
plt.show()


# In[113]:


create_vision('block5_conv1')
plt.show()


# In[107]:


create_vision('block5_conv3')
plt.show()


# ## heatmap to visual

# In[1]:


from keras.applications import VGG16
model = VGG16(weights='imagenet')


# In[2]:


model.summary()


# 由上可知,需要将输入转换成224*224的格式

# In[4]:


from keras.preprocessing import image
from keras.applications.vgg16 import preprocess_input, decode_predictions

import numpy as np
img_path = '/home/lkl/Pictures/Selection_002.png'
img = image.load_img(img_path, target_size=(224, 224))
x = image.img_to_array(img)

x = np.expand_dims(x, axis= 0 )  ## 增加batch维度,表明是第几张

x = preprocess_input(x)  ##预处理,将图片张量进行0均值化,这里采用固定值相减,故效果不一定好


# In[1]:


preds = model.predict(x)  ##即prediction层的输出
print('Predicted:', decode_predictions(preds, top = 3)[0])  ##返回preds中最大3个值对应的label


# In[18]:


preds


# In[19]:


np.argmax(preds)  


# 可知最大的是第386类,对应的类名为African_elephant

# 
# 于是可以考虑将其第386的分类对应的模型输出保留,再将其覆盖到原图生成热力图上观察其学习倾向,即导向反向传播
# 
# ICCV论文:Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization
# 对几种传播的分析:
# ![415974-1e2add2963798ca0.png](attachment:415974-1e2add2963798ca0.png)

# In[20]:


african_elephant_output = model.output[:, 386]


# In[51]:


import keras.backend as K
last_conv_layer = model.get_layer('block5_conv3')
grads = K.gradients(african_elephant_output, last_conv_layer.output)[0]  ##计算最后一层卷积的输出(带有最多的语义以及分类信息且作为分类器输入)对结果为386的输出的偏导数,从而得到其对386的影响
                                                                         ##梯度是张量,第0个为需要的
pooled_grads = K.mean(grads, axis=(0,1,2)) ##用平均化对每一个channel的feature map池化,而不需对channel进行池化

iterate = K.function([model.input] , [pooled_grads, last_conv_layer.output[0]]) ##定义输出为上一步的池化梯度和最后一层卷积的输出,[0]表示去掉batch维度,为第0张图
pooled_grads, conv_layer_output_value = iterate([x])
for i in range(512):
     conv_layer_output_value[:, :, i] *= pooled_grads[i]    ##梯度反映权重,即经由训练好的模型,求得变量之间的梯度关系,可反映该变量对输出的影响结果,通过梯度乘以该输出值,可得到一次变化的大小
heatmap = np.mean(conv_layer_output_value, axis = -1)  ##从最后一维求均值,得到各个channel的总体均值为热力图


# In[56]:


import matplotlib.pyplot as plt
heatmap = np.maximum(heatmap, 0)  ##逐位选择heatmap和0之间较大的元素而占位,即去掉heatmap中的负值为0
heatmap /= np.max(heatmap)
plt.matshow(heatmap)
plt.show()


# ## 使用opencv将其覆盖在原图上

# In[58]:


import cv2
img = cv2.imread(img_path)
heatmap = cv2.resize(heatmap, (img.shape[1], img.shape[0]))  ##将heatmap适应原图

heatmap = np.uint8(255 * heatmap)

heatmap = cv2.applyColorMap(heatmap, cv2.COLORMAP_JET)  ##生成heatmap彩色映射

superimposed_img = heatmap * 0.4 + img  ## 0.4为彩色强度,为了避免彩色覆盖过强而使用0.4参数并映射到原图

cv2.imwrite('/home/lkl/Desktop/elephant_Grad_CAM.jpg', superimposed_img)


# ![elephant_Grad_CAM.jpg](attachment:elephant_Grad_CAM.jpg)
# 观察到彩色区域在覆盖大的大象时,刚好避开了耳朵的部位,说明了第384类其对应的最高层卷积时,对于耳朵也成为了评判的标准,且小象对应的特征更强烈,这是否与说明卷积核大小有关?因为就正常而言,应该两个大象的身体都有所检测才对
# 
# 1.卷积核大小,深度等参数对可视化的影响
# 
# 2.更多的可视化方法
# 
# 3.可视化是否能够重构学习can
# 

# In[ ]:

Python-机器学习（二）-K近邻算法的原理与鸢尾花数据集实现详解 2401_84009679 程序员机器学习 python 近邻算法
fromsklearn.neighborsimportKNeighborsClassifierk=5#对模型训练clf=KNeighborsClassifier(n_neighbors=k)clf.fit(x,y)#对样本进行预测x_sample=[[0,2]]neighbors=clf.kneighbors(x_sample)neighbors[1]plt.figure(figsize=(16,
流式学习(简易版) 想成为配环境大佬论文学习信息可视化 python
最近读论文看到了这个概念，感觉还挺有意思的流形(Manifold)广泛应用于多个领域，如几何学、物理学、机器学习等。流形本质上是一个局部类似于欧几里得空间的空间，即它在某些尺度下看起来像我们熟悉的平面或曲面，但整体结构可能是复杂的。简单来说，你可以把流形想象成一个“弯曲的”空间，在局部上看起来像我们熟悉的平面，但全局上可能是弯曲或折叠的。流形学习（ManifoldLearning）是一种用于降维（
2025最全计算机毕业设计选题推荐【前后端全栈方向】大熊计算机毕设计算机项目推荐论文笔记
✅博主介绍：CSDN毕设辅导博主、CSDN认证Java领域优质创作者✅技术范围：主要包括Java、Vue、Python、爬虫、小程序、安卓app、大数据、机器学习等设计与开发。✅主要内容：免费功能设计、开题报告、任务书、功能实现、代码编写、论文编写和辅导、论文降重、答辩答疑辅导。文末有博主名片哦正文本文整理了30个涵盖前端Vue、后端Java或Python的全栈开发选题，适用于各种应用场景，帮助你
现代编程的影响 2501_90255623 生活
一、编程对技术创新的推动作用1.1引领前沿科技发展编程是人工智能、大数据、物联网、区块链等前沿科技的核心驱动力。通过编程，研发人员能够快速验证并迭代创新想法，推动这些领域的技术突破。例如，在人工智能领域，编程使得机器学习算法得以实现，从而创造出能够自主学习和适应环境的智能系统。1.2促进开源文化繁荣编程促进了开源文化的发展，使得全球范围内的开发者能够共享代码、知识和经验。开源项目不仅加速了技术创新
MATLAB机器学习、深度学习 Yolo566Q 机器学习 matlab matlab 机器学习深度学习
目录第一章MATLAB图像处理基础第二章BP神经网络及其在图像处理中的应用第三章卷积神经网络及其在图像处理中的应第四章迁移学习算法及其在图像处理中的应用第五章生成式对抗网络（GAN）及其在图像处理中的应用第六章目标检测YOLO模型及其在图像处理中的应用第七章讨论与答疑近年来，随着无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是在计算机
机器学习在金融领域的应用 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
机器学习在金融领域的应用1.背景介绍1.1金融行业面临的挑战1.1.1海量数据处理1.1.2实时风险监控1.1.3个性化服务需求1.2机器学习的兴起1.2.1大数据时代的到来1.2.2计算能力的提升1.2.3算法的不断创新2.核心概念与联系2.1机器学习的定义与分类2.1.1有监督学习2.1.2无监督学习2.1.3强化学习2.2机器学习与人工智能、深度学习的关系2.2.1人工智能的发展历程2.2.
机器学习在环境科学中的应用苹果酱0567 面试题汇总与解析课程设计 spring boot vue.js java mysql
机器学习在环境科学中的应用第一节机器学习的基本概念什么是机器学习机器学习是一种通过对大量数据的学习和分析，让计算机系统能够逐渐改善其性能和行为的技术。它通过建立数学模型来识别数据中的模式和规律，进而进行预测和决策。机器学习在环境科学中的意义在环境科学领域，机器学习可以帮助我们更好地理解和预测自然系统的变化。通过对大气、水文、生态等环境数据的分析，机器学习可以帮助科学家们更准确地了解环境变化的规律，
人工智能基础知识速成 - 机器学习、深度学习算法原理及其实际应用案例苹果酱0567 面试题汇总与解析课程设计 spring boot vue.js java mysql
一、机器学习概念与原理什么是机器学习？机器学习是人工智能的一个分支，通过从数据中学习和改进算法，使计算机系统在没有明确编程的情况下也能够自动地学习和改进。机器学习是一种实现人工智能的技术手段，能够让计算机“自我学习”，从而实现更准确的预测和决策。机器学习的基本原理机器学习的基本原理是通过构建数学模型，使用大量的数据进行训练，使得模型能够智能地预测和决策。在机器学习中，常用的模型包括线性回归、逻辑回
【LangChain编程：从入门到实践】代码实践 AI天才研究院计算大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】代码实践1.背景介绍1.1人工智能的发展历程人工智能(ArtificialIntelligence,AI)是当代科技领域最具革命性和颠覆性的技术之一。自20世纪50年代诞生以来,AI经历了起伏跌宕的发展历程。在早期,AI主要集中于基于规则的系统和专家系统,试图模拟人类的推理过程。然而,随着大数据时代的到来和计算能力的飞速提升,机器学习和深度学习技术开始占据主
因果推断与机器学习—因果表征学习与泛化能力樱花的浪漫因果推断机器学习学习人工智能深度学习自然语言处理计算机视觉
近十年来，深度学习在多个领域取得了巨大成功，包括机器视觉、自然语言处理、语音识别和生物信息等。这些成功为机器学习技术的进一步发展和应用奠定了基础。表征学习是深度学习的核心技术之一。在机器学习问题中，其主要目的是从观测到的低级变量中提取信息，进而学习到能够准确预测目标变量的高级变量。这种从低层次到高层次变量的学习过程，有助于模型更好地理解数据和进行预测。以德国马克斯-普朗克研究所的BernhardS
深度探索：机器学习中的粒子群优化算法（PBMT）原理及应用生瓜蛋子机器学习机器学习算法人工智能
目录一、引言与背景二、定理三、算法原理四、算法实现五、优缺点分析优点：缺点：六、案例应用七、对比与其他算法八、结论与展望一、引言与背景随着机器学习技术的迅速发展，优化算法在模型训练、特征选择、参数调优等多个环节扮演着至关重要的角色。粒子群优化（ParticleSwarmOptimization,PBMT）作为一类灵感源自鸟群觅食行为的群体智能优化算法，自1995年提出以来，因其简单、高效的特点，在
机器学习，深度学习，神经网络，深度神经网络武昌库里写JAVA 面试题汇总与解析 java 学习开发语言课程设计 spring boot
人工智能包含机器学习，机器学习包含深度学习（是其中比较重要的分支）。深度学习源自于人工神经网络的研究，但是并不完全等于传统神经网络。神经网络与深度神经网络的区别在于隐藏层级，通常两层或两层以上隐藏层的网络叫做深度神经网络。一般隐藏层越多，精确度越高。深度学习的算法又分很多种，比较典型的四种：卷积神经网络—CNN,循环神经网络—RNN,生成对抗网络—GANs,深度强化学习—RL。机器学习和深度学习的
Python中的决策树算法探索基本原理 myCOTB Python 算法 python 决策树
Python中的决策树算法探索决策树是一种简单而直观的机器学习算法，广泛应用于分类和回归任务中。它通过对数据进行分割，构建一个树形结构，从而做出决策。本文将探讨决策树的基本原理，并演示如何使用Python中的scikit-learn库实现决策树算法。决策树的基本原理决策树的基本思想是通过对数据进行分割，逐步缩小数据的范围，从而使得每个叶节点（终节点）中的样本属于同一类别或具有相似的特征。决策树的构
机器学习之决策树！决策树算法实战：葡萄酒品质预测风清扬雨人工智能机器学习算法决策树 python
决策树算法实战：葡萄酒品质预测Hey小伙伴们，今天我们将通过一个有趣的案例来探索决策树算法在葡萄酒品质预测中的应用。想象一下，只需几个关键指标，就能预测一瓶葡萄酒的品质，是不是很神奇呢？让我们一起用Python和决策树算法，揭开葡萄酒的秘密吧！数据集介绍我们将使用著名的UCIMachineLearningRepository中的“葡萄酒品质”数据集。这个数据集包含了葡萄酒的各种化学成分和物理特性，
Python_机器学习_简单绘图 Richard&仰望星空 python 机器学习
importpandasimportmatplotlib.pyplotaspltfrompylabimport*mpl.rcParams['font.sans-serif']=['SimHei']###python画图默认不能中文，如需必要则要加入上述两条语句#折线图绘制data=pandas.read_excel("123.xlsx")#print(data)类似于matlabplot画图操作p
青少年编程与数学 02-008 Pyhon语言编程基础 19课题、外部模块明月看潮生编程与数学第02阶段青少年编程 python 编程与数学编程语言
青少年编程与数学02-008Pyhon语言编程基础19课题、外部模块一、外部模块特点：常见外部模块：安装外部模块：使用外部模块：二、库二、框架三、常用框架Web开发框架：数据分析和科学计算框架：机器学习和人工智能框架：异步编程框架：GUI开发框架：课题摘要:本文介绍了Python中的外部模块、库和框架。外部模块是Python标准库之外的第三方模块，提供额外功能，如NumPy、Pandas等，通过p
机器学习day8 ኈ ቼ ዽ 机器学习 numpy python
自定义数据集，使用朴素贝叶斯对其进行分类代码importnumpyasnpimportmatplotlib.pyplotaspltclass1_points=np.array([[2.1,2.2],[2.4,2.5],[2.2,2.0],[2.0,2.1],[2.3,2.3],[2.6,2.4],[2.5,2.1]])class2_points=np.array([[4.0,3.5],[4.2,3
机器学习day5 ኈ ቼ ዽ 机器学习人工智能
自定义数据集使用tensorflow框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测代码importtensorflowastfimportnumpyasnp#1.自定义数据集data=[[-0.5,7.7],[1.8,98.5],[0.9,57.8],[0.4,39.2],[-1.4,-15.7],[-1.4,-37.3],[-1.8,-49.1],[1.5,75.6],[0.4,3
Tensorflow 2.x(keras)源码详解之第十章：keras中的模型保存与加载(详解Checkpoint&md5&模型序列化) 爱编程的喵喵 tensorflow keras 模型保存
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Tensorflow2.x(kera
对json数据进行去重的Python实战代码爱编程的喵喵 Python基础课程 python json 数据去重实战代码
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了对json数据进行去重的Python
【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】3.1 NumPy图像大小调整实战精通代码大仙 numpy python numpy python 开发语言
3.1NumPy图像大小调整实战目录NumPy图像大小调整实战图像大小调整的基本概念为什么需要调整图像大小使用NumPy调整图像大小的技术代码实现：详细原理和源码注释实际应用案例：图像缩放在机器学习中的应用目录图像大小调整的基本概念为什么需要调整图像大小使用NumPy调整图像大小的技术3.1线性插值3.2最近邻插值3.3双线性插值3.4双三次插值代码实现：详细原理和源码注释4.1线性插值代码实现4
【高中生讲机器学习】30. 理解条件随机场最清晰的思路！（上篇） Geeker · LStar 机器学习人工智能算法机器学习人工智能条件随机场算法监督学习标注问题
创建时间：2024-12-22首发时间：2025-01-24最后编辑时间：2024-01-24作者：Geeker_LStar你好呀~这里是Geeker_LStar的人工智能学习专栏，很高兴遇见你~我是Geeker_LStar，一名高一学生，热爱计算机和数学，我们一起加油~！⭐(●’◡’●)⭐上一篇我们讲完了马尔可夫随机场MRF，那篇的最后我简单介绍了条件随机场CRF但没有展开讲。这不，这篇就来填坑
【高中生讲机器学习】17. 讲人话的主成分分析，它来了！（上篇） Geeker · LStar 人工智能机器学习算法机器学习人工智能主成分分析算法无监督学习
创建时间：2024-08-13首发时间：2024-09-05最后编辑时间：2024-09-05作者：Geeker_LStar你好呀~这里是Geeker_LStar的人工智能学习专栏，很高兴遇见你~我是Geeker_LStar，一名准高一学生，热爱计算机和数学，我们一起加油~！⭐(●’◡’●)⭐那就让我们开始吧！诶嘿！这一篇想写很久啦，现在终于来了！（什么玩意都拖到开学了还没写完如果想比较好的理解这
【初中生讲机器学习】14. 手撕公式，一篇带你理解逻辑回归！ Geeker · LStar 人工智能机器学习算法机器学习逻辑回归人工智能算法分类算法监督学习
创建时间：2024-03-03最后编辑时间：2024-03-10作者：Geeker_LStar你好呀~这里是Geeker_LStar的人工智能学习专栏，很高兴遇见你~我是Geeker_LStar，一名初三学生，热爱计算机和数学，我们一起加油~！⭐(●’◡’●)⭐那就让我们开始吧！嘿嘿，好几篇前，好像是在线性回归那篇吧，我就说要讲逻辑回归，but当时被数学卡了一下（好吧不只一下）and正好遇上开学，
一个经典机器学习案例——良/恶性乳腺癌肿瘤预测曹文杰1519030112 python机器学习及实践人工智能机器学习
良/恶性乳腺癌肿瘤预测良/恶性乳腺癌肿瘤预测问题是一个十分经典的机器学习问题，简单来说我们需要利用肿块厚度和细胞尺寸这两个特征来判断肿瘤的类型（良性或者是恶性）。数据的下载网站如下：http://note.youdao.com/groupshare/?token=C6B145FA919F41F8ACAAC39EE775441C&gid=93772390我们首先来看一下部分数据ClumpThickn
python必读书单 Vin0sen python 开发语言
文章目录{编程入门}{编程进阶}{算法基础}{Web开发}{网络编程}{爬虫}{安全}{数据分析}{数据科学}{数据挖掘}{机器学习}{深度学习}{其他方向}{编程入门}父与子的编程之旅：与小卡特一起学Python[HOT]Python2.7和孩子一起玩编程Python2.7零压力学PythonPython3.0，但也指出了如何修改示例，以支持Python2.0Python编程：从入门到实践[HO
如何自学Python：适合小白的Python学习大纲—附教程_python小白学理论(1) 2401_84301389 程序员 python 学习开发语言
数据可视化基础、MLlib（RDD-BaseAPI）机器学习、MatPlotlib绘图进阶、高级绘图工具第二阶段-商业数据可视化Excel业务分析Excel基础技能、Excel公式函数、图表可视化、人力&财务分析案例、商业数据分析方法、商业数据分析报告Mysql数据库Mysql基础操作（一）、Mysql基础操作（二）、Mysql中级操作、Mysql高级操作、电商数据处理案例PowerBI初级商业智
TensorFlow 示例项目实战与源码解析.zip ELSON麦香包
本文还有配套的精品资源，点击获取简介：TensorFlow是谷歌大脑团队开发的开源机器学习库，广泛应用于深度学习、人工智能等领域。该压缩包提供了一个TensorFlow示例项目的源代码，涵盖了从基础操作到复杂模型的各种主题。文章将详细介绍TensorFlow的核心概念，如张量、图计算、会话、变量、梯度下降与优化器、损失函数、数据集、模型评估、模型保存与恢复以及KerasAPI。读者可通过实践这些示
大模型带你学pytorch课程立杰说 Python deep-learning Pytorch pytorch 人工智能 python
时间有限，大家有想看的部分，可以私信或者评论区联系，我及时补充。或者大家有想帮忙补充的也可以联系。注：大部分内容均为大模型生成，若有疏漏，欢迎指出。看起来你想要开始学习PyTorch，这是一个非常棒的选择！PyTorch是一个强大的开源机器学习框架，由Facebook的人工智能研究实验室开发，被广泛用于深度学习模型的构建和训练。让我们开始你的PyTorch旅程吧！1.预备课程大纲1.1引入Pyth
计算范式的变革：从图灵机到神经网络 AI架构设计之禅 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
图灵机，神经网络，计算范式，深度学习，机器学习，人工智能，算法，模型1.背景介绍自20世纪中叶以来，计算机科学经历了飞速发展，计算范式也经历了深刻的变革。从最初的图灵机模型到如今的深度学习，我们不断探索更强大、更灵活的计算方式。图灵机作为计算机科学的基石，奠定了通用计算的理论基础。它以有限的符号和规则，模拟了人类的逻辑思维过程，为现代计算机的诞生提供了理论支撑。然而，图灵机的计算能力受限于其固定的
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

基于keras的猫狗图像分类

你可能感兴趣的:(机器学习)