HelloNettt

【李宏毅《机器学习》2022】作业1：COVID 19 Cases Prediction (Regression)

文章目录

【李宏毅《机器学习》2022】作业1：COVID 19 Cases Prediction (Regression)
- 作业内容
- - 1.目标
  - 2.任务描述
  - 3.数据
  - 4.评价指标
- 代码
- - 1.下载数据
  - 2.导入软件包
  - 3.定义公用函数（这一部分不需要修改）
  - 4.数据集
  - 5.神经网络模型
  - 6.特征选择
  - 7.训练器
  - 8.超参数设置
  - 9.加载数据
  - 10.开始训练
  - 11.可视化训练过程
  - 12.保存测试集结果
  - 13.改进方案
  - - 13.1.选择更有效的特征
    - 13.2.修改模型
    - 13.3.修改优化器
  - 14. 测试结果

【李宏毅《机器学习》2022】作业1：COVID 19 Cases Prediction (Regression)

【作业1】来源

作业内容

1.目标

Solve a regression problem with deep neural networks (DNN).
Understand basic DNN training tips.
Familiarize yourself with PyTorch.

2.任务描述

Given survey results in the past 5 days in a specific state in U.S., then predict the percentage of new tested positive cases in the 5 th day.

3.数据

4.评价指标

MSE

代码

1.下载数据

!gdown --id '1kLSW_-cW2Huj7bh84YTdimGBOJaODiOS' --output covid.train.csv
!gdown --id '1iiI5qROrAhZn-o4FPqsE97bMzDEFvIdg' --output covid.test.csv

如果没有安装gdown（比如作者），可以采用按如下方法安装：

git clone https://github.com/wkentaro/gdown.git
cd gdown
pip install gdown

2.导入软件包

# Numerical Operations
import math
import numpy as np

# Reading/Writing Data
import pandas as pd#我一般喜欢用这个读入数据
import os
import csv

# For Progress Bar
from tqdm import tqdm

# Pytorch
import torch 
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader, random_split

# For plotting learning curve
from torch.utils.tensorboard import SummaryWriter

3.定义公用函数（这一部分不需要修改）

def same_seed(seed): 
    '''Fixes random number generator seeds for reproducibility.'''
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False
    np.random.seed(seed)
    torch.manual_seed(seed)
    if torch.cuda.is_available():
        torch.cuda.manual_seed_all(seed)

#sklearn有一个包也可以实现train_valid_split和predict功能。
def train_valid_split(data_set, valid_ratio, seed):
    '''Split provided training data into training set and validation set'''
    valid_set_size = int(valid_ratio * len(data_set)) 
    train_set_size = len(data_set) - valid_set_size
    train_set, valid_set = random_split(data_set, [train_set_size, valid_set_size], generator=torch.Generator().manual_seed(seed))
    return np.array(train_set), np.array(valid_set)

def predict(test_loader, model, device):
    model.eval() # Set your model to evaluation mode.
    preds = []
    for x in tqdm(test_loader):
        x = x.to(device)                        
        with torch.no_grad():                   
            pred = model(x)                     
            preds.append(pred.detach().cpu())   
    preds = torch.cat(preds, dim=0).numpy()  
    return preds

scikit-learn是一个强大的机器学习软件包，其使用方法可以参考sklearn中文文档。

4.数据集

class COVID19Dataset(Dataset):
    '''
    x: Features.
    y: Targets, if none, do prediction.
    '''
    def __init__(self, x, y=None):
        if y is None:
            self.y = y
        else:
            self.y = torch.FloatTensor(y)
        self.x = torch.FloatTensor(x)

    def __getitem__(self, idx):
        if self.y is None:
            return self.x[idx]
        else:
            return self.x[idx], self.y[idx]

    def __len__(self):
        return len(self.x)

5.神经网络模型

通过修改下面的类来尝试不同的模型。

class My_Model(nn.Module):
    def __init__(self, input_dim):
        super(My_Model, self).__init__()
        # TODO: modify model's structure, be aware of dimensions. 
        #一个简单的三层全链接层的神经网络模型
        self.layers = nn.Sequential(
            nn.Linear(input_dim, 16),#全连接层
            nn.ReLU(),#激活函数
            nn.Linear(16, 8),
            nn.ReLU(),
            nn.Linear(8, 1)
        )

    def forward(self, x):
        x = self.layers(x)
        x = x.squeeze(1) # (B, 1) -> (B)
        return x

可以参考torch.nn
PyTorch的torch.nn.Linear()是用于设置网络中的全连接层的，需要注意在二维图像处理的任务中，全连接层的输入与输出一般都设置为二维张量，形状通常为[batch_size, size]，不同于卷积层要求输入输出是四维张量。

6.特征选择

通过修改下面的函数，选择更有用的特征。

def select_feat(train_data, valid_data, test_data, select_all=True):
    '''Selects useful features to perform regression'''
    y_train, y_valid = train_data[:,-1], valid_data[:,-1]
    raw_x_train, raw_x_valid, raw_x_test = train_data[:,:-1], valid_data[:,:-1], test_data

    if select_all:
        feat_idx = list(range(raw_x_train.shape[1]))
    else:
        feat_idx = [0,1,2,3,4] # TODO: Select suitable feature columns.
        
    return raw_x_train[:,feat_idx], raw_x_valid[:,feat_idx], raw_x_test[:,feat_idx], y_train, y_valid

7.训练器

训练阶段创建模型的实例并进行迭代时训练。注意每次迭代都需要保存模型。训练结束后，对模型Loss随迭代次数的变化进行可视化，用于选取更合适的迭代次数。

def trainer(train_loader, valid_loader, model, config, device):

    criterion = nn.MSELoss(reduction='mean') # Define your loss function, do not modify this.

    # Define your optimization algorithm. 
    # TODO: Please check https://pytorch.org/docs/stable/optim.html to get more available algorithms.
    # TODO: L2 regularization (optimizer(weight decay...) or implement by your self).
    optimizer = torch.optim.SGD(model.parameters(), lr=config['learning_rate'], momentum=0.9) 
	
	#训练过程可视化器
    writer = SummaryWriter() # Writer of tensoboard.
	
	#创建保存model的路径，每次迭代都需要保存model
    if not os.path.isdir('./models'):
        os.mkdir('./models') # Create directory of saving models.

    n_epochs, best_loss, step, early_stop_count = config['n_epochs'], math.inf, 0, 0

    for epoch in range(n_epochs):
        model.train() # Set your model to train mode.
        loss_record = []

        # tqdm is a package to visualize your training progress.
        train_pbar = tqdm(train_loader, position=0, leave=True)

        for x, y in train_pbar:
            optimizer.zero_grad()               # Set gradient to zero.
            x, y = x.to(device), y.to(device)   # Move your data to device. 
            pred = model(x)             
            loss = criterion(pred, y)
            loss.backward()                     # Compute gradient(backpropagation).
            optimizer.step()                    # Update parameters.
            step += 1
            loss_record.append(loss.detach().item())
            
            # Display current epoch number and loss on tqdm progress bar.
            train_pbar.set_description(f'Epoch [{epoch+1}/{n_epochs}]')
            train_pbar.set_postfix({'loss': loss.detach().item()})

        mean_train_loss = sum(loss_record)/len(loss_record)
        writer.add_scalar('Loss/train', mean_train_loss, step)
		
		# 在验证集上进行模型准确率的分析验证。
        model.eval() # Set your model to evaluation mode.
        loss_record = []
        for x, y in valid_loader:
            x, y = x.to(device), y.to(device)
            with torch.no_grad():
                pred = model(x)
                loss = criterion(pred, y)

            loss_record.append(loss.item())
            
        mean_valid_loss = sum(loss_record)/len(loss_record)
        print(f'Epoch [{epoch+1}/{n_epochs}]: Train loss: {mean_train_loss:.4f}, Valid loss: {mean_valid_loss:.4f}')
        writer.add_scalar('Loss/valid', mean_valid_loss, step)

        if mean_valid_loss < best_loss:#如果当前loss低于过去最低的loss，则记录loss，并保存当前最好的模型。
            best_loss = mean_valid_loss
            torch.save(model.state_dict(), config['save_path']) # Save your best model
            print('Saving model with loss {:.3f}...'.format(best_loss))
            early_stop_count = 0
        else: 
            early_stop_count += 1

        if early_stop_count >= config['early_stop']:
            print('\nModel is not improving, so we halt the training session.')
            return

8.超参数设置

device = 'cuda' if torch.cuda.is_available() else 'cpu'
config = {
    'seed': 5201314,      # 制定模型的随即种子以保证模型的可恢复性。Your seed number, you can pick your lucky number. :)
    'select_all': True,   # Whether to use all features.
    'valid_ratio': 0.2,   # validation_size = train_size * valid_ratio
    'n_epochs': 3000,     # Number of epochs.            
    'batch_size': 256, 
    'learning_rate': 1e-5,              
    'early_stop': 400,    # If model has not improved for this many consecutive epochs, stop training. 任一时刻连续400次没有模型训练降低loss，就会提前停止。    
    'save_path': './models/model.ckpt'  # Your model will be saved here.
}

9.加载数据

# Set seed for reproducibility
same_seed(config['seed'])


# train_data size: 2699 x 118 (id + 37 states + 16 features x 5 days) 
# test_data size: 1078 x 117 (without last day's positive rate)
train_data, test_data = pd.read_csv('./covid.train.csv').values, pd.read_csv('./covid.test.csv').values
train_data, valid_data = train_valid_split(train_data, config['valid_ratio'], config['seed'])# 按照k折交叉验证法分成训练集和验证集

# Print out the data size.
print(f"""train_data size: {train_data.shape} 
valid_data size: {valid_data.shape} 
test_data size: {test_data.shape}""")

# Select features
x_train, x_valid, x_test, y_train, y_valid = select_feat(train_data, valid_data, test_data, config['select_all'])

# Print out the number of features.
print(f'number of features: {x_train.shape[1]}')

train_dataset, valid_dataset, test_dataset = COVID19Dataset(x_train, y_train), \
                                            COVID19Dataset(x_valid, y_valid), \
                                            COVID19Dataset(x_test)

# 用统一的Pytorch加载器包装待处理数据 Pytorch data loader loads pytorch dataset into batches.
train_loader = DataLoader(train_dataset, batch_size=config['batch_size'], shuffle=True, pin_memory=True)
valid_loader = DataLoader(valid_dataset, batch_size=config['batch_size'], shuffle=True, pin_memory=True)
test_loader = DataLoader(test_dataset, batch_size=config['batch_size'], shuffle=False, pin_memory=True)

10.开始训练

model = My_Model(input_dim=x_train.shape[1]).to(device) # put your model and data on the same computation device.
trainer(train_loader, valid_loader, model, config, device)

11.可视化训练过程

tensorboard 是一个可视化训练过程的工具。

%reload_ext tensorboard
%tensorboard --logdir=./runs/

12.保存测试集结果

输出保存测试集的结果，并在Kaggle上查看模型得分。

def save_pred(preds, file):
    ''' Save predictions to specified file '''
    with open(file, 'w') as fp:
        writer = csv.writer(fp)
        writer.writerow(['id', 'tested_positive'])
        for i, p in enumerate(preds):
            writer.writerow([i, p])

model = My_Model(input_dim=x_train.shape[1]).to(device)
model.load_state_dict(torch.load(config['save_path']))#加载你保存好的best model
preds = predict(test_loader, model, device) 
save_pred(preds, 'pred.csv')

可以看考state_dict和load_state_dict

13.改进方案

运行上述程序，即可通过simple_baseline。

但还不能通过medium_baseline，而我们的目标是boss_baseline，因此需要修改方案。

13.1.选择更有效的特征

首先，我们观察一下数据内部。

df = pd.read_csv('./covid.train.csv')
#df.head()
df.describe()

共有2699个data，117个feature，1个label。
我们利用Pearson相关系数分析不同feature与label的相关性强弱。

df.corr()['tested_positive'].sort_values(ascending=False)

根据Pearson系数降序排列的结果，我们重新选择特征。

def select_feat(train_data, valid_data, test_data, select_all=True):
    '''Selects useful features to perform regression'''
    y_train, y_valid = train_data[:,-1], valid_data[:,-1]
    raw_x_train, raw_x_valid, raw_x_test = train_data[:,:-1], valid_data[:,:-1], test_data

    if select_all:
        feat_idx = list(range(raw_x_train.shape[1]))
    else:
        feat_idx = list(range(38))+[53, 69, 85, 101] # TODO: Select suitable feature columns.
        
    return raw_x_train[:,feat_idx], raw_x_valid[:,feat_idx], raw_x_test[:,feat_idx], y_train, y_valid

这时，我们要把参数设置中的select_all设置为False。此外，我们还要减小batch_size，这样可以避免训练中梯度在极小值点附近被捕捉。同时，小batch_size好处还有减少一次训练的数据量，降低网络负载，也加快网络的收敛速度。

device = 'cuda' if torch.cuda.is_available() else 'cpu'
config = {
    'seed': 5201314,      # Your seed number, you can pick your lucky number. :)
    'select_all': False,   # Whether to use all features.
    'valid_ratio': 0.2,   # validation_size = train_size * valid_ratio
    'n_epochs': 3000,     # Number of epochs.            
    'batch_size': 100, 
    'learning_rate': 1e-5,              
    'early_stop': 400,    # If model has not improved for this many consecutive epochs, stop training.     
    'save_path': './models/model.ckpt'  # Your model will be saved here.
}

13.2.修改模型

首先，我们很容易想到的方法是：加深神经网络的层数。但是这个问题本身足够简单，数据量也不大，所以不能带来明显提升。
为了防止过拟合，引入L2正则化项可以通过给loss增加模型惩罚项使模型的结构化风险最小。

class NN_Model(nn.Module):
    def __init__(self, input_dim):
        super(NN_Model, self).__init__()
        # TODO: modify model's structure, be aware of dimensions. 
        self.layers = nn.Sequential(
            nn.Linear(input_dim, 16),
            nn.BatchNorm1d(16),
            nn.LeakyReLU(),
            nn.Dropout(0.1),
            nn.Linear(16, 1)
            nn.BatchNorm1d(8),
            nn.LeakyReLU(),
            nn.Dropout(0.1),
            nn.Linear(8,1)
        )
        self.criterion = nn.MSELoss(reduction='mean')
        #self.criterion = nn.CrossEntropyLoss()

    def forward(self, x):
        x = self.layers(x)
        x = x.squeeze(1) # (B, 1) -> (B)
        return x
    #添加L2正则项
    def regularization(self, coef):
      item = 0
      for param in self.net.parameters():
        item += torch.norm(param,2)
      res = coef*item
      return res

    def cal_loss(self,pred,target):
      #RMSE+L2 regularization
      loss = torch.sqrt(self.criterion(pred, target)) + self.regularization(0) 
      return loss
      return loss

其中，torch.nn.Dropout(num)是一种为了防止训练模型过拟合的方法。通过丢弃num比例的隐藏层神经元，不参与训练，可以有效的防止过拟合。
torch.nn.BatchNorm1d()是为了保持深度神经网络训练过程中每一层神经网络的输入同分布的方法。训练深度网络的时候经常发生训练困难的问题：因为，每一次参数迭代更新后，上一层网络的输出数据经过这一层网络计算后，数据的分布会发生变化，为下一层网络的学习带来困难，这被称为Internal Covariate Shift。为了解决Internal Covariate Shift，我们使用Batch Normalization。

torch.nn.BatchNorm1d(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)

num_features – 特征维度
eps – 为数值稳定性而加到分母上的值。
momentum – 移动平均的动量值。
affine – 一个布尔值，当设置为真时，此模块具有可学习的仿射参数。

13.3.修改优化器

经过测试，使用AdamW优化器效果最佳，其数学原理：
$\text { grad = decay-{rate} } * \text { grad }+(1-\text { decay-{rate} }) * d x^{2}$
优化器的参数设置。

optimizer = torch.optim.AdamW(model.parameters(), lr=config['learning_rate'], weight_decay=0.08)

14. 测试结果

通过了strong baseline。还有待优化，有时间了再来…

C#开发人员学习书籍推荐 Lu01 .net 学习 python
作为一名C#开发人员，持续学习和提升自己的技术水平是至关重要的。如今，技术不断更新换代，新的开发框架、语言和工具层出不穷。对于刚入行的开发者或希望深入某一领域的工程师来说，选对书籍是学习的捷径之一。本篇文章将推荐一些经典的书籍，涵盖了C#、数据库、前端开发等多个领域，帮助你在开发的道路上不断进步。1.学习SQL基础推荐书籍：《SQL必知必会（第5版）》作者：[美]本·福达（BenForta）译者：
mysql开放远程连接大叔是90后大叔 Mysql 服务器 mysql 数据库
mysql开放远程连接mysql开放远程连接方法一：方法二（推荐）：mysql开放远程连接新安装的mysql只可以本机连接，但是远程连接就会报notallowedtoconnecttothisMySQLserver例如：按如下步骤进行操作方法一：更改mysql数据库user表的host列，把localhost改为%[root@localhost~]#mysql-uroot-p123***mysql
1Panel服务器运维管理面板安星辰综合 web 运维服务器
1Panel是一个现代化、开源的Linux服务器运维管理面板，类似于宝塔1产品优势¶快速建站：深度集成Wordpress和Halo，域名绑定、SSL证书配置等一键搞定；高效管理：通过Web端轻松管理Linux服务器，包括应用管理、主机监控、文件管理、数据库管理、容器管理等；安全可靠：最小漏洞暴露面，提供防火墙和安全审计等功能；一键备份：支持一键备份和恢复，备份数据云端存储，永不丢失。在线安装：1环
AI Agent（智能体）技术白皮书（Google，2024）花生糖@ AIGC学习资料库人工智能 AI Agent 智能体 AI实战
1引言1.1人类的先验知识与工具的使用人类很很好地处理复杂和微妙的模式识别任务。能做到这一点是因为，我们会通过书籍、搜索或计算器之类的工具来补充我们头脑中的先验知识，然后才会给出一个结论（例如，“图片中描述的是XX”）。1.2人类的模仿者与以上类似，我们可以对生成式AI模型进行训练，让它们能使用工具来在现实世界中获取实时信息或给出行动建议。例如，利用数据库查询工具获取客户的购物历史，然后给出购物建
JavaWeb——MySQL-多表设计（3/5）：（一对一关系，多对多关系，小结） qiyi.sky JavaWeb mysql 数据库笔记学习 java
目录一对一关系剖析一对一关系场景与特点数据库实现方式图形化工具演示与验证多对多关系解析多对多关系实例与困境中间表解决方案工具演示与理解深化多表关系核心要点回顾一对一关系剖析一对一关系场景与特点以用户与身份证为例，呈现一对一典型场景。在业务系统中，为优化数据操作效率，常拆分含多种信息的大表。如用户表含基本与身份信息，若基本信息查询频繁、身份信息查询低频，可拆为用户基本信息表（含用户ID、姓名、性别等
centos安装1Panel管理面板 l1677516854 系统搭建 centos linux 运维
简介1Panel是一个现代化、开源的Linux服务器运维管理面板。高效管理：用户可以通过Web图形界面轻松管理Linux服务器，实现主机监控、文件管理、数据库管理、容器管理等功能；快速建站：深度集成开源建站软件WordPress和Halo，域名绑定、SSL证书配置等操作一键搞定；应用商店：精选上架各类高质量的开源工具和应用软件，协助用户轻松安装并升级；安全可靠：基于容器管理并部署应用，实现最小的漏
K8S中数据存储之配置存储元气满满的热码式 kubernetes 容器云原生
配置存储在Kubernetes中，ConfigMap和Secret是两种核心资源，用于存储和管理应用程序的配置数据和敏感信息。理解它们的功能和最佳实践对于提高Kubernetes应用程序的安全性和配置管理的效率至关重要。ConfigMapConfigMap是一种API对象，允许你存储非敏感配置数据，如环境变量、数据库URL等。它以键值对的形式存储数据，便于应用程序访问必要的配置。ConfigMap
软考高级系统架构设计师系列之：分布式存储技术快乐骑行^_^ 软考高级系统架构设计师考试软考高级系统架构设计师系列分布式存储技术
软考高级系统架构设计师系列之：分布式存储技术一、分布式存储技术及其实现机制二、分布式存储系统设计中的冗余技术三、常见的缓存工作模式和适应场景四、NOSQL一、分布式存储技术及其实现机制简要说明在分布式存储系统架构设计中所使用的分布式存储技术及其实现机制，详细叙述你在具体项目中选用了哪种分布式存储技术，说明其原因和实施效果。分布式存储技术集群存储技术。集群存储系统是指架构在一个可扩充服务器集群中的文
Redis的优缺点 zhanghaiyang0011 redis redis
优点：速度快，完全基于内存，使用C语言实现丰富的数据类型，Redis有8种数据类型，当然常用的主要是String、Hash、List、Set、SortSet这5种类型支持事务，Redis的所有操作都是原子性的支持主从复制可以进行读写分离缺点：由于Redis是内存数据库，短时间内大量增加数据，可能导致内存不够用数据库容量受到物理内存的限制，不能用作海量数据的高性能读写Redis较难支持在线扩容red
Redis的单线程架构ら．二十一 Redis
Redis使用了单线程架构和I/O多路复用模型来实现高性能的内存数据库服务。这里通过多个客户端命令调用的例子说明Redis单线程命令处理机制，接着分析Redis单线程模型为什么性能如此之高，最终给出为什么理解单线程模型是使用和运维Redis的关键。开启三个redis-cli客户端同时执行命令客户端1设置一个字符串键值对：127.0.0.1:6379>sethelloworld客户端2对counte
（2025 年最新）MacOS Redis Desktop Manager中文版下载，附详细图文 itbysj macos redis 数据库 Redis Desktop
MacOSRedisDesktopManager中文版下载大家好，今天给大家带来一款非常实用的Redis可视化工具——RedisDesktopManager（简称RDM）。相信很多开发者都用过Redis数据库，但如果你想要更高效、更方便地管理Redis数据，RDM无疑是个不错的选择！特别是Mac版本，不仅界面简洁，功能也非常强大，支持多种高效连接方式，简直是Redis用户的必备神器！什么是Redi
2023菜鸟物流一面.社招.Java后端开发心向阳光的天域 java面试 java
2023菜鸟物流一面.社招.Java后端开发1.手写一个StringBuilder2.介绍分布式锁3.介绍高并发经验4.介绍项目的吞吐量5.Mysql的行级锁(1)行级锁(2)表级锁6.单一职责和接口隔离区别1.手写一个StringBuilderpublicclassMyStringBuilder{/***可变长度的字符串——字符数组*/charvalue[];/***定义数据长度*/intcou
使用 EFCore 去连接 mysql 数据库的时候提示下面的报错信息黄同学real C#后端开发 .net 数据库 mysql .netcore c#.net
使用EFCore去连接mysql数据库的时候，提示下面的报错信息：“Anexceptionhasbeenraisedthatislikelyduetoatransientfailure.Considerenablingtransienterrorresiliencybyadding‘EnableRetryOnFailure（）’tothe‘UseMySql’call.”的解决方案。解决方案：这一般
【含文档+PPT+源码】智慧养老服务的小程序小咕聊编程小程序
本课程演示的是一款智慧养老服务的小程序，主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。1.包含：项目源码、项目文档、数据库脚本、软件工具等所有资料2.带你从零开始部署运行本套系统3.该项目附带的源码资料可作为毕设使用智慧养老服务系统的重要核心功能包括用户注册、用户登录、浏览商品、商品购买、浏览护工服务、护工服务预约等，以下为项目功能模块图：技术栈说明技术栈：后端：Sp
Ambari 2.7.5+HDP3.1.5离线安装详细教程（附安装包） Toroidals 大数据组件安装部署教程 Ambari-2.7.5 HDP3.1.5 安装包 ambari hdp
一.准备工作系统：centos7.6（推荐使用：redhat7、redhat-ppc7、ubuntu14、ubuntu16、ubuntu18）Ambari版本：2.7.5HDP版本：3.1.5主机：系统ip主机名称主机名内存Ambariservermysqlhttpd服务centos7.6192.168.112.143cluster01.toroidal.comcluster018G√√cento
缓存穿透和缓存雪崩 AAA猪饲料批发李师傅 .NET .netcore 缓存
缓存穿透问题stringcacheKey="Book"+id;//缓存键Book?b=memoryCache.Get(cacheKey);if(b==null)//如果缓存中没有数据{//查询数据库，然后写入缓存b=awaitctx.Set().FindAsync(id);memoryCache.Set(cacheKey,b);}使用IMemoryCache接口中的Get和Set设置缓存时，首先从
com/microsoft/sqlserver/jdbc/SQLServerDriver has been compiled by a more recent version of the Java 张3蜂 java 操作系统设计模式 java linux
目录1.故事是这样开始的2.发生事故的瞬间3.事故疑云4.事件追踪1.故事是这样开始的我想做一个可执行的jar包，把jar以服务的方式允许。在jar的代码中我采用JDBCSQLServer驱动来连接Sqlserver数据库；在我的本机已经连接数据库成功，但是向linux服务器部署可执行jar的过程中，遇到了难题。2.发生事故的瞬间做好了可执行的jar，向linux服务器部署可执行jar的过程中，报
菜鸟开发之多表联合增删改苏白辛数据库 mysql java
多表联合处理数据在开发过程中必不可少，占比不低于逻辑处理，菜菜鸟先以此记录简单的联查处理，后则不断补充，尤其数据表查询......目录一、多表联查新增1、一张表数据插入到另一张表1）新表存在2）新表不存在3）目标表字段多于源表4）IN子句可用于向另一个数据库Backup.mdb中拷贝表2、多表数据插入到另一张表1）直接新增查询结果数据2）查询结果不直接新增二、多表联查删除1、EXISTS2、IN3
MySQL个人复习总结 slh别学了数据库 mysql adb android 数据库
最近想把MySQL的知识点再过一遍，带着自己的理解使用简短的话把一些问题总结一下，尤其是开发中和面试中的高频问题，基础知识点可以参考之前写的如下几篇博客，这篇不再赘述，阅读顺序由浅入深依次递进。一、MySQL概述数据库&表操作数据增删改；二、MySQL单表查询多表设计；三、MySQL多表查询事务索引；四、Mybatis入门；五、Mybatis—基础操作；六、Mybatis—XML配置文件、动态SQ
MySql（十）：InnoDB存储引擎内存和磁盘架构 EShaooo MySql系列 innodb mysql 数据库 sql mysql优化
MySql存储引擎数据库底层软件组件，数据库管理系统使用数据引擎进行创建、查询、更新和删除数据操作//查看系统支持的存储引擎showengines;+--------------------+---------+----------------------------------------------------------------+--------------+------+-------
学习笔记： MySQL进阶篇一之架构和日志文件蜗牛_snail 学习笔记 mysql
MySQL架构图Connectors连接器：负责跟客户端建立连接ManagementServeices&Utilities系统管理和控制工具ConnectionPool连接池：管理用户连接，监听并接收连接的请求，转发所有连接的请求到线程管理模块SQLInterfaceSQL接口：接受用户的SQL命令，并且返回SQL执行结果Parser解析器：SQL传递到解析器的时候会被解析器验证和解析Optimi
QueryWrapper 格式化日期字段查询 qq_36608622 spring boot mybatis
在使用MyBatis-Plus的QueryWrapper时，如果你需要对日期字段进行格式化或基于日期的条件查询（如忽略时间部分），你可以结合SQL函数和QueryWrapper提供的方法来实现。MyBatis-Plus并没有直接提供日期格式化的注解或方法，但可以通过以下几种方式达成目标。方法一：使用SQL函数对于MySQL、SQLServer等数据库，可以利用数据库提供的函数（如DATE()、CA
【MySQL】十四，MySQL 8.0的隐藏索引 zhcf MySQL mysql 数据库
在MySQL8.0之前的版本中，索引只能直接删除。如果删除后发现引起了系统故障，又必须进行创建。当表的数据量比较大的时候，这样做的代价就会非常高。在MySQL8.0中，提供了隐藏索引。如果想删除某个索引，那么在实际删除之前，可以将其设置为隐藏，此时查询优化器就不会再使用此索引。确认对系统不会产生影响后，再实际删除。演示创建表时创建隐藏索引CREATETABLE`ts2`(`id`intnotNUL
【MySQL】六，sql_model的合理设置 zhcf MySQL mysql sql 数据库
宽松模式和严格模式宽松模式如果设置的是宽松模式，那么我们在插入数据的时候，即使是给了一个错误的数据，那么可能也不会报错。举例：某张表的name字段为char(10)，插入数据的时候，如果name字段的数据长度超过了10，如‘1234567890abc’，那么不会报错，mysql会自行处理，截取前10个字符存储，这就是宽松模式。应用场景：通过设置sql_mode为宽松模式，来保证大多数的SQL符合标
MySQL 基础学习(1)：数据类型与操作数据库和数据表 Purified_Soda MySQL数据库 oracle 数据库 mysql database
MySQL基础学习：数据类型与操作数据库和数据表在这篇博客中，我们将深入学习MySQL的基础操作，重点关注数据库和数据表的操作，以及MySQL中常见的数据类型。希望本文能帮助你更好地理解和掌握MySQL的基本用法。一、操作数据库在MySQL中，数据库是数据存储的逻辑集合，以下是常见的数据库操作：1.创建数据库createdatabase数据库名charsetutf8;通过以上命令，我们可以创建一个
写一个存储“网站”的网站前的分析是小邪邪呀 java 开发语言数据结构 javascript postgresql aws https
要创建一个能够存储自己网站内容的“网站”，通常意味着你希望有一个可以存储网站数据、文件、内容等信息的系统。为了实现这一目标，可以考虑构建一个内容管理系统（CMS），这个系统能够帮助你存储和管理网站上的内容。图片仅供参考以下是如何实现一个可以存储自己网站内容的网站的步骤，包括后端数据库和前端界面：步骤一：规划网站内容存储结构1.确定需要存储的内容：页面内容：例如文本、图片、视频等。数据：例如用户评论
r语言调用python_R语言与Python协同工作 weixin_39868034 r语言调用python
R（又称R语言）是一款开源的跨平台的数值统计和数值图形化展现工具。通俗点说，R是用来做统计和画图的。R拥有自己的脚本语言和大量的统计、图形库（得益于开源社区），这让她看起来既美又实用。与其他同类软件（如SPSS）相比，R的特点是纯命令行的，这倒也好，我们更应该把注意力放在数据本身，而非统计工具的UI。R虽说有一套自己的语言，还挺完备，但她最专业的还是做统计和画图，而像连接数据库、文本处理、文件操作
nodejs常用组件 weixin_34348174 javascript 数据库 ViewUI
mssql用途：连接SqlServer数据库node-excel-export用途：导出excel表格nodegrass用途：模拟用户进行get/post请求，下载文件等uuid用途：生成全球唯一标识的.官网：https://npm.taobao.org/package/uuid示例：12345importuuidfrom'uuid';console.log("36位uuid:",uuid.v4(
高效准确的PDF解析工具，赋能企业非结构化数据治理人工智能科技pdf
在数据为王的时代浪潮中，企业数据治理已成为组织优化运营、提高竞争力的关键。随着数字化进程的加速，企业所积累的数据量呈爆炸式增长，数据类型也愈发多样化，这些数据构成了现代企业数据资产的重要组成部分。然而，传统的数据治理方式主要聚焦于结构化数据，如数据库中的表格信息，而对于非结构化数据的治理则显得力不从心。传统的数据管理模式难以适应新的需求，企业需要建立更加灵活高效的数据治理体系，以确保数据的有效利用
数据编织大揭秘！MySQL在数据编织架构中的角色：连接与整合异构数据源10步指南墨瑾轩一起学学数据库【一】mysql 架构数据库
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣想象一下，当你需要从多个不同的数据源中提取信息并进行综合分析时，如何高效地管理和整合这些数据？这就是数据编织的魅力所在。今天，我们就来详细解析如何利用MySQL在数据编织架构中扮演关键角色，连接和整合异构数据源。准备好了吗？我们开始吧！第一步：理解数据编织的基
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts

【李宏毅《机器学习》2022】作业1：COVID 19 Cases Prediction (Regression)

文章目录

【李宏毅《机器学习》2022】作业1：COVID 19 Cases Prediction (Regression)

作业内容

1.目标

2.任务描述

3.数据

4.评价指标

代码

1.下载数据

2.导入软件包

3.定义公用函数（这一部分不需要修改）

4.数据集

5.神经网络模型

6.特征选择

7.训练器

8.超参数设置

9.加载数据

10.开始训练

11.可视化训练过程

12.保存测试集结果

13.改进方案

13.1.选择更有效的特征

13.2.修改模型

13.3.修改优化器

14. 测试结果

你可能感兴趣的:(mysql,sql,数据库)