如梦似幻11

第一次作业：深度学习基础

1. 视频学习心得及问题总结

1.1绪论

“人工智能”的概念诞生于1956年的达特茅斯会议。

2018年Yoshua Bengio、Geoffrey Hinton、Yann LeCun因在人工智能深度学习方面的贡献获得图灵奖。

人工智能的发展阶段：萌芽期、启动期、消沉期、突破期、发展期、高速发展期。

人工智能、机器学习以及深度学习三者之间的关系：

人工智能是一个领域，就是一个目标，我们希望机器人像人一样的去感知、去思考，机器学习的是来实现这样一个目标的，而深度学习是其中很小的一个点。

模型分类：

从数据标记角度分类为监督学习、无监督学习、半监督学习、强化学习；

从数据分布角度分类为参数模型、非参数模型；

从建模对象角度分类为判别模型、生成模型；

传统机器学习与深度学习：

前深度学习时代，首先花几天时间收集并标注图像，然后花几个月观察图像，设计一些特征，最后使用某种分类器进行分类；

深度学习时代，首先花几个星期收集并标注图像，然后挑几个深度模型，选几组模型超参数，最后让机器优化模型；

发展历程：

（1）感知器出现，认为感知器无所不能，但是实际上无法解决异或门问题；

（2）BP算法：Rumelhart和Hinton合作在Nature杂志上发表论文，第一次简洁地阐述了

BP算法，在神经网络里增加一个所谓的隐层，解决了XOR难题；

（3）CNN网络：Yann Lecun在1989年发表了论文，之后又进一步运用了一种叫做卷积神经网络的技术，最开始是运用于银行对数字的识别；

（4）Vladmir Vapnik提出了SVM，把神经网络推向寒冬；

（5）Hinton拿到资金后，将神经网络更名为深度学习；

（6）吴恩达2009年发表了论文，解决了速度问题，使用GPU运行速度和用传统双核CPU相比，最快时要快近70倍；

（7）李菲菲建立第一个超大型图像数据库供计算机视觉研究者使用；

（8）Hinton和两个研究生利用CNN+Dropout+Relu激励函数将ILSVRC的错误率降到了15.3%，是人工智能技术突破的一个转折点；

（9）Yoshua Bengio在2011年发表论文，提出了一种修正的relu激励函数，解决了传统激励函数在反向传播计算中的梯度消失问题；

（10）Schmidhuber和他的学生提出来长短期记忆的计算模型。

1.2深度学习概述

深度学习有六大不能：

（1）稳定性低；（2）可调试性差；（3）参数不透明；（4）机器偏见；（5）增量性差；（6）推理能力差；

激活函数：激活函数是用来加入非线性因素的，提高神经网络对模型的表达能力，解决线性模型所不能解决的问题。假设一个示例神经网络中仅包含线性卷积和全连接运算，那么该网络仅能够表达线性映射，即便增加网络的深度也依旧还是线性映射，难以有效建模实际环境中非线性分布的数据。

梯度：是一个向量，方向是最大方向导数的方向，模为方向导数的最大值。

深层神经网络的问题：梯度消失

对于激活函数，之前一直使用Sigmoid函数，其函数图像成一个S型，它会将正无穷到负无穷的数映射到0~1之间。当我们对Sigmoid函数求导时,会呈现一个驼峰状（很像高斯函数），从求导结果可以看出，Sigmoid导数的取值范围在0~0.25之间，而我们初始化的网络权值通常都小于1，因此，当层数增多时，小于0的值不断相乘，最后就导致梯度消失的情况出现。

受限玻尔兹曼机和自编码器：

自编码器：

2. 代码练习

2.1图像处理基本练习

!wget https://raw.githubusercontent.com/summitgao/ImageGallery/master/yeast_colony_array.jpg
import matplotlib
import numpy as np
import matplotlib.pyplot as plt

import skimage
from skimage import data
from skimage import io

colony = io.imread('yeast_colony_array.jpg')
print(type(colony))
print(colony.shape)

# Plot all channels of a real image
plt.subplot(121)
plt.imshow(colony[:,:,:])
plt.title('3-channel image')
plt.axis('off')

# Plot one channel only
plt.subplot(122)
plt.imshow(colony[:,:,0])
plt.title('1-channel image')
plt.axis('off');

# Get the pixel value at row 10, column 10 on the 10th row and 20th column
camera = data.camera()
print(camera[10, 20])

# Set a region to black
camera[30:100, 10:100] = 0
plt.imshow(camera, 'gray')

# Set the first ten lines to black
camera = data.camera()
camera[:10] = 0
plt.imshow(camera, 'gray')

# Set to "white" (255) pixels where mask is True
camera = data.camera()
mask = camera < 80
camera[mask] = 255
plt.imshow(camera, 'gray')

# Change the color for real images
cat = data.chelsea()
plt.imshow(cat)

# Set brighter pixels to red
red_cat = cat.copy()
reddish = cat[:, :, 0] > 160
red_cat[reddish] = [255, 0, 0]
plt.imshow(red_cat)

# Change RGB color to BGR for openCV
BGR_cat = cat[:, :, ::-1]
plt.imshow(BGR_cat)

from skimage import img_as_float, img_as_ubyte
float_cat = img_as_float(cat)
uint_cat = img_as_ubyte(float_cat)

img = data.camera()
plt.hist(img.ravel(), bins=256, histtype='step', color='black');

# Use colony image for segmentation
colony = io.imread('yeast_colony_array.jpg')

# Plot histogram
img = skimage.color.rgb2gray(colony)
plt.hist(img.ravel(), bins=256, histtype='step', color='black');

# Use thresholding
plt.imshow(img>0.5)

from skimage.feature import canny
from scipy import ndimage as ndi
img_edges = canny(img)
img_filled = ndi.binary_fill_holes(img_edges)

# Plot
plt.figure(figsize=(18, 12))
plt.subplot(121)
plt.imshow(img_edges, 'gray')
plt.subplot(122)
plt.imshow(img_filled, 'gray')

# Load an example image
img = data.camera()
plt.imshow(img, 'gray')

from skimage import exposure
# Contrast stretching
p2, p98 = np.percentile(img, (2, 98))
img_rescale = exposure.rescale_intensity(img, in_range=(p2, p98))
plt.imshow(img_rescale, 'gray')

# Equalization
img_eq = exposure.equalize_hist(img)
plt.imshow(img_eq, 'gray')

# Adaptive Equalization
img_adapteq = exposure.equalize_adapthist(img, clip_limit=0.03)
plt.imshow(img_adapteq, 'gray')

# Display results
def plot_img_and_hist(img, axes, bins=256):
    """Plot an image along with its histogram and cumulative histogram.

    """
    img = img_as_float(img)
    ax_img, ax_hist = axes
    ax_cdf = ax_hist.twinx()

    # Display image
    ax_img.imshow(img, cmap=plt.cm.gray)
    ax_img.set_axis_off()
    ax_img.set_adjustable('box')

    # Display histogram
    ax_hist.hist(img.ravel(), bins=bins, histtype='step', color='black')
    ax_hist.ticklabel_format(axis='y', style='scientific', scilimits=(0, 0))
    ax_hist.set_xlabel('Pixel intensity')
    ax_hist.set_xlim(0, 1)
    ax_hist.set_yticks([])

    # Display cumulative distribution
    img_cdf, bins = exposure.cumulative_distribution(img, bins)
    ax_cdf.plot(bins, img_cdf, 'r')
    ax_cdf.set_yticks([])

    return ax_img, ax_hist, ax_cdf
fig = plt.figure(figsize=(16, 8))
axes = np.zeros((2, 4), dtype=np.object)
axes[0, 0] = fig.add_subplot(2, 4, 1)
for i in range(1, 4):
    axes[0, i] = fig.add_subplot(2, 4, 1+i, sharex=axes[0,0], sharey=axes[0,0])
for i in range(0, 4):
    axes[1, i] = fig.add_subplot(2, 4, 5+i)

ax_img, ax_hist, ax_cdf = plot_img_and_hist(img, axes[:, 0])
ax_img.set_title('Low contrast image')

y_min, y_max = ax_hist.get_ylim()
ax_hist.set_ylabel('Number of pixels')
ax_hist.set_yticks(np.linspace(0, y_max, 5))

ax_img, ax_hist, ax_cdf = plot_img_and_hist(img_rescale, axes[:, 1])
ax_img.set_title('Contrast stretching')

ax_img, ax_hist, ax_cdf = plot_img_and_hist(img_eq, axes[:, 2])
ax_img.set_title('Histogram equalization')

ax_img, ax_hist, ax_cdf = plot_img_and_hist(img_adapteq, axes[:, 3])
ax_img.set_title('Adaptive equalization')

ax_cdf.set_ylabel('Fraction of total intensity')
ax_cdf.set_yticks(np.linspace(0, 1, 5))

fig.tight_layout()
plt.show()

2.2 pytorch基础练习

#一个数
import torch
x = torch.tensor(125)
print(x)

#一维数组
x = torch.tensor([1,2,3])
print(x)

#二维数组
x = torch.ones(2,3)
print(x)

#任意维数组
x = torch.ones(3,3,3)
print(x)

#创建空张量
x = torch.empty(3,3)
print(x)

#创建一个随机初始化的张量
x = torch.rand(3,3)
print(x)

#创建一个全为0的张量，并将数据类型设为long
x = torch.zeros(3,3,dtype=torch.long)
print(x)

#基于现有的tensor，创建一个新的tensor，使新的tensor可以继承原有tensor的属性
y = x.new_ones(3,3)
print(y)

#继承原来tensor的大小，重新定义了数据类型
z = torch.randn_like(x,dtype = torch.float)
print(z)

tensor([1, 2, 3])
tensor([[1., 1., 1.],
        [1., 1., 1.]])
tensor([[[1., 1., 1.],
         [1., 1., 1.],
         [1., 1., 1.]],

        [[1., 1., 1.],
         [1., 1., 1.],
         [1., 1., 1.]],

        [[1., 1., 1.],
         [1., 1., 1.],
         [1., 1., 1.]]])
tensor([[1.6773e-35, 0.0000e+00, 3.3631e-44],
        [0.0000e+00,        nan, 0.0000e+00],
        [1.1578e+27, 1.1362e+30, 7.1547e+22]])
tensor([[0.2663, 0.1039, 0.7578],
        [0.3250, 0.3323, 0.2042],
        [0.7675, 0.9358, 0.9857]])
tensor([[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]])
tensor([[1, 1, 1],
        [1, 1, 1],
        [1, 1, 1]])
tensor([[ 1.2492,  1.5812,  1.3829],
        [-0.9308, -0.6413,  0.7611],
        [-0.8240, -0.1809, -1.6046]])

#创建一个2x4的tensor，用Tensor创建出来的是浮点数，用tensor创建出来的是长整型
m = torch.tensor([[2,5,3,7],[4,2,1,9]])
print(m.size(0),m.size(1),m.size(),sep = '-')

#返回m中元素的数量
print(m.numel())

#返回m中的元素，利用下标标记元素
print(m[0][2])
print(m[:,1])
print(m[0,:])

#点乘
v = torch.arange(1, 5)
m @ v
m[[0], :] @ v

#加法
m + torch.rand(2, 4)

#转置
print(m.t())
print(m.transpose(0,1))

#返回3到8之间等距的20个数
torch.linspace(3,8,20)

#转换数据类型并显示
from matplotlib import pyplot as plt
plt.hist(torch.randn(1000).numpy(),100);

2-4-torch.Size([2, 4])
8
tensor(3)
tensor([5, 2])
tensor([2, 5, 3, 7])
tensor([[2, 4],
        [5, 2],
        [3, 1],
        [7, 9]])
tensor([[2, 4],
        [5, 2],
        [3, 1],
        [7, 9]])

#数组拼接
a = torch.Tensor([[1,2,3,4]])
b = torch.Tensor([[5,6,7,8]])
print(torch.cat((a,b),0))#在0方向即在Y方向上拼接
print(torch.cat((a,b),1))#在1方向即在X方向上拼接

tensor([[1., 2., 3., 4.],
        [5., 6., 7., 8.]])
tensor([[1., 2., 3., 4., 5., 6., 7., 8.]])

2.3 螺旋数据分类

!wget https://raw.githubusercontent.com/Atcold/pytorch-Deep-Learning/master/res/plot_lib.py
#数据初始化
import random
import torch
from torch import nn, optim
import math
from IPython import display
from plot_lib import plot_data, plot_model, set_default


# 因为colab是支持GPU的，torch 将在 GPU 上运行
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

# 初始化随机数种子。神经网络的参数都是随机初始化的，
# 不同的初始化参数往往会导致不同的结果，当得到比较好的结果时我们通常希望这个结果是可以复现的，
# 因此，在pytorch中，通过设置随机数种子也可以达到这个目的
seed = 12345
random.seed(seed)
torch.manual_seed(seed)

N = 1000  # 每类样本的数量
D = 2  # 每个样本的特征维度
C = 3  # 样本的类别
H = 100  # 神经网络里隐层单元的数量
X = torch.zeros(N * C, D).to(device)
Y = torch.zeros(N * C, dtype=torch.long).to(device)
for c in range(C):
    index = 0
    t = torch.linspace(0, 1, N) # 在[0，1]间均匀的取10000个数，赋给t
    # 下面的代码不用理解太多，总之是根据公式计算出三类样本（可以构成螺旋形）
    # torch.randn(N) 是得到 N 个均值为0，方差为 1 的一组随机数，注意要和 rand 区分开
    inner_var = torch.linspace( (2*math.pi/C)*c, (2*math.pi/C)*(2+c), N) + torch.randn(N) * 0.2
    
    # 每个样本的(x,y)坐标都保存在 X 里
    # Y 里存储的是样本的类别，分别为 [0, 1, 2]
    for ix in range(N * c, N * (c + 1)):
        X[ix] = t[index] * torch.FloatTensor((math.sin(inner_var[index]), math.cos(inner_var[index])))
        Y[ix] = c
        index += 1
plot_data(X, Y)

#创建线性模型
learning_rate = 1e-3
lambda_l2 = 1e-5

# nn 包用来创建线性模型
# 每一个线性模型都包含 weight 和 bias
model = nn.Sequential(
    nn.Linear(D, H),
    nn.Linear(H, C)
)
model.to(device) # 把模型放到GPU上

# nn 包含多种不同的损失函数，这里使用的是交叉熵（cross entropy loss）损失函数
criterion = torch.nn.CrossEntropyLoss()

# 这里使用 optim 包进行随机梯度下降(stochastic gradient descent)优化
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate, weight_decay=lambda_l2)

# 开始训练
for t in range(1000):
    # 把数据输入模型，得到预测结果
    y_pred = model(X)
    # 计算损失和准确率
    loss = criterion(y_pred, Y)
    score, predicted = torch.max(y_pred, 1)
    acc = (Y == predicted).sum().float() / len(Y)
    print('[EPOCH]: %i, [LOSS]: %.6f, [ACCURACY]: %.3f' % (t, loss.item(), acc))
    display.clear_output(wait=True)

    # 反向传播前把梯度置 0 
    optimizer.zero_grad()
    # 反向传播优化 
    loss.backward()
    # 更新全部参数
    optimizer.step()
#效果图如下    
# Plot trained model
print(model)
plot_model(X, Y, model)


####当尝试使用线性的决策边界来分隔螺旋的数据 - 只使用nn.linear()模组，而不在之间加上非线性 - 我们只能达到 50% 的正确度。

#加入ReLU激活函数
learning_rate = 1e-3
lambda_l2 = 1e-5

# 这里可以看到，和上面模型不同的是，在两层之间加入了一个 ReLU 激活函数
model = nn.Sequential(
    nn.Linear(D, H),
    nn.ReLU(),
    nn.Linear(H, C)
)
model.to(device)

# 下面的代码和之前是完全一样的，这里不过多叙述
criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate, weight_decay=lambda_l2) # built-in L2

# 训练模型，和之前的代码是完全一样的
for t in range(1000):
    y_pred = model(X)
    loss = criterion(y_pred, Y)
    score, predicted = torch.max(y_pred, 1)
    acc = ((Y == predicted).sum().float() / len(Y))
    print("[EPOCH]: %i, [LOSS]: %.6f, [ACCURACY]: %.3f" % (t, loss.item(), acc))
    display.clear_output(wait=True)
    
    # zero the gradients before running the backward pass.
    optimizer.zero_grad()
    # Backward pass to compute the gradient
    loss.backward()
    # Update params
    optimizer.step()
#效果图如下
# Plot trained model
print(model)
plot_model(X, Y, model)

####当我们从线性模型换成在两个 nn.linear() 模组再经过一个 nn.ReLU() 的模型，正确度增加到了 95%。这是因为边界变成非线性的并且更好的顺应资料的螺旋，如下图所呈现的。

2.4 回归分析

以上表现了一个无法用线性回归完成，但可以用这个相同的网络解决的问题。左面使用了Relu函数，有图使用了tanh函数，前者是一个分段的线性函数，后者则是连续、平滑的回归。

Redis架构之主从复制云雨殇 Redis redis 架构 java
Redis主从架构主从集群，实现读写分离主从数据同步主从同步流程slave节点向master节点发送replicaof命令建立连接，随后发送psync{repID}{offset}指令，repID表示主节点唯一标识，offset为复制偏移量。如果是第一次同步，那么repID是?，offset是-1。即psync?-1master节点收到了psync命令后，会响应slave节点并发送fullresy
ES6模块化(对比commonjs模块化) zvapour javascript
ES6模块化common.js对比CommonJS运行时加载–>只有运行时才能得到这个对象(module.exports的对象)在第一次加载之后会被缓存，引入的是缓存中的值//若需要动态更新，使用gettercount=1;module.exports={getcount(){returncount;},plusCoun
《深入浅出AI》前言知识：深度学习基础总结 GoAI 深入浅出AI 人工智能深度学习机器学习 cnn rnn 生成对抗网络神经网络
个人主页:GoAI|公众号:GoAI的学习小屋|交流群:704932595|个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等，专注大数据与人工智能知识分享。AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成
3. Python的变量 bai666ai Python语言入门 python 开发语言后端人工智能
《Python编程的术与道：Python语言入门》视频课程《Python编程的术与道：Python语言入门》视频课程链接：https://edu.csdn.net/course/detail/27845变量（Variable）变量用于存储数据值。与其它编程语言不同，Python没有用于声明变量的命令。变量是在第一次为其赋值时创建的。变量赋值变量赋值有三部分构成。#变量名赋值符号变量值message
C++中memset函数的用法 MatthewMao C++使用积累 C语言使用积累 C++memset函数初始化字符串或
//复习数组的时候，第一次见到了memset，学之。memset：char型初始化函数头文件：或函数原型：void*memset(void*s,intch,size_tn)memset(结构体/数组名,用于替换的ASCII码对应字符,前n个字符);memset(结构体/数组名,"用于替换的字符“,前n个字符);函数解释：将s中的前n个字节用ch替换并且返回s函数作用：在一段内存块中填充某一个给定的
python dag调度系统开发_DAG（有向无环图）动态作业调度程序 weixin_39913628 python dag调度系统开发
IneedtomanagealargeworkflowofETLtasks,whichexecutiondependsontime,dataavailabilityoranexternalevent.Somejobsmayfailduringexecutionoftheworkflowandthesystemshouldhavetheabilitytorestartafailedworkflowb
python csv文件写入（推荐） lxin_ooo python csv python
python将数据写入到.csv文件里importjsonimportosimportcsvclassSaveCSV(object):defsave(self,keyword_list,path,item):try:#第一次打开文件时，第一行写入表头ifnotos.path.exists(path):withopen(path,"w",newline='',encoding='utf-8')asc
基于自动化发布流程，运用多个工具实现高效运维实战罗伯特之技术屋运维自动化
【摘要】生产部署曾经是一件令运维极为头痛的事，充满着大量沟通和手动操作，自动化发布完全解决了过去发布的痛点。而在经济大环境的影响下，很多企业都需要降本增效，Serverless正在被越来越多的引入到生产环境上来。目前在对于云上的发布的流程基本上是，Terraform部署基础架构->Jenkins类的CICD工具发布应用->无服务化部署定时和事件触发的作业。本文将从如何建设自动化发布流程的原理入手，
r720换固态硬盘后如何重装系统_联想拯救者 R720 换装三星 960PRO 512G固态硬盘、重做系统与测试... weixin_39583222
联想拯救者R720换装三星960PRO512G固态硬盘、重做系统与测试2017-07-2410:00:0031点赞156收藏86评论R屏、SSD、机械键盘乃近10年以来用过了就再也用不回去的三项败家科技.....用的第一块固态硬盘是英睿达M550120G，当时是换到笔记本里面的，第一次用的时候，爽呆了！感觉整个世界都起飞了！后来给台式机装了850Pro256G，又装了一块英睿达MX200250G，
c++中std::thread构造函数的注意事项阳洞洞 c++开发语言
目录一、问题引出二、示例代码及输出结果三、详细解释1.关键点解析1.1第一次拷贝构造：临时对象（mData=101）1.2第二次拷贝构造：线程内部存储对象（mData=102）1.3第三次拷贝构造：线程函数参数p4（mData=103）2.析构顺序验证3.结论4.验证构造和析构发生在哪个线程5.看给Foo添加移动构造函数后的效果一、问题引出函数原型详见https://en.cppreference
hive-site.xml 配置总结 hxsln11 hive xml hadoop
在Hive安装后，hive主要的配置文件为conf中hive-site.xml那该文件中那么多的配置选项都是什么含义呢。下面这篇文章带你解密这些配置请跟随以下这些问题来看以下配置：1.hive输出格式的配置项是哪个？2.hive被各种语言调用如何配置？3.hive提交作业是在hive中还是hadoop中？4.一个查询的最后一个map/reduce任务输出是否被压缩的标志，通过哪个配置项？5.当用户
Boss直聘-AI行业岗位与薪资水平调研姚瑞南 AI行业资讯 AI行业产品调研人工智能自然语言处理 AIGC 经验分享笔记
2022年6月更渠道公司职位名称职位类型薪资水平是否要求PMP证书JDboss直聘字节跳动智能服务运营专家运营25-50K*15薪无智能IM机器人转人工、解决率指标提升boss直聘唯品会AI产品经理PM35-65K*14薪无智能产品规划与设计、数据分析、行业调研、推动项目、协同作业boss直聘京东智能机器人产品运营运营20-40K*15薪无智能客服机器人运营boss直聘字节跳动AI训练技术项目经理
javascript 常见设计模式 smiley121 javascript 设计模式
什么是设计模式?在软件开发中，设计模式是解决特定问题的经验总结和可复用的解决方案。设计模式可以提高代码的复用性、可维护性和可读性，是提高开发效率的重要手段。单例模式1.概念单例模式（SingletonPattern），保证一个类只有一个实例，并提供一个访问它的全局访问点。也就是说，第二次使用同一个类创建新对象的时候，应该得到与第一次创建的对象完全相同的对象。2.代码实现classSingleton
PMP知识点综合测试：150道易错习题和知识点汇总快乐骑行^_^ PMP项目管理软考高级信息系统项目管理师考试 PMP知识点综合测试百道易错习题和知识点汇总
PMP知识点综合测试：150道易错习题和知识点汇总1.项目建设过程中需要进行多次采购。现在，项目团队已经完成第一次采购。团队成员希望总结第一次采购中的经验和问题，以便改进以后的采购工作。项目经理应该如何指导团队成员的行动？A:要求团队在完成至少3次采购后再来一起总结B:要求团队立即开展审计C:要求团队把所发现的问题记录在问题日志中D:要求团队立即更新组织过程资产答案解析：采购审计是甲方或乙方对自己
AI大模型学习之白话笔记（一）-- GPT和LLM Langchain 人工智能学习笔记 langchain python 机器人大模型
前言2022年底第一次听说chatGPT,从最初的对话，到如今的文生视频Sora，带来的效果，越来越超出我们的想象。在2023年，我尝试去了解GPT可以干什么，有什么作用，该怎么用，不过变化太快，最终也没有找到一个好的方式干进去。为什么变化这么快，说到底，是AI大模型带来的巨变。现在很多大厂都在降薪裁员，也有不少公司在AllinAI，我们都有一个预感，要变天了。你想想，如果有一天，一款游戏的所有美
深度揭秘：我们是如何设计一个每天同步万亿数据的神器 - SeaTunnel架构解密数据库
"设计一个能支撑万亿级数据同步的系统挑战有多大？来告诉你一个从0到1的故事..."一个深夜的求助2021年的一个深夜，正准备关电脑休息，一个运维电话打了进来："救命！整个数据同步系统都崩溃了，3000多张表的同步全部积压，业务系统已经开始报警了..."电话那头是业务线技术负责人，声音中带着焦虑。这不是数据平台第一次接到类似求助，但这次的规模确实让人吃惊：数据规模：每天新增100TB+同步需求：30
加密通信实验遮天华月网络
加密通信实验作业罢了。实验内容学习理解网络通信学习数据加密和解密开发网络通信的客户端程序、服务器端程序，实现客户端将传输的网络数据进行加密、服务器端将收到的加密数据进行解密，在客户端和服务器端间传输加密数据。需要对比发送的数据、接受的数据是否一致，验证网络传输的正确性；需要对比两端的明文数据、密文数据是否一致，验证加密、解密的正确性。本文使用套接字+多线程的方式完成服务器通信，编程语言为Pytho
web第三次作业 naodianbozzz 前端 css javascript
实现网页登入窗口的显示隐藏登录窗口滑动效果*{margin:0;padding:0;box-sizing:border-box;}html,body{width:100%;height:100%;}.container{width:100%;height:100%;background-color:#f2f1f2;}header{width:1200px;height:50px;backgroun
大厂打工8年：我为什么选择离开？前端后端程序员
"你真的要离开腾讯吗？"在提完离职的那一刻，总监脸上难掩惊讶。我知道，对于很多人来说，这个决定可能显得不够理性——毕竟，腾讯仍是众多程序员心中的梦想企业，而我在这里已经连续五年获得五星好评，而且还有很多股票，似乎一切都在正轨上。但此时的我，内心异常平静。记得第一次走进腾讯大厦，仰望着那座象征着互联网巅峰的建筑，内心既激动又忐忑。彼时的我，怎么也想不到，八年后，我会主动选择告别。人们常说，选择大于努
c#quartz触发_C# 定时调度之Quartz 林John c#quartz触发
工作中我们经常碰到定时或者固定时间点去做一些事情，然后每天到时间点就会去做这样的事情，如果理解这样的场景，我们就要引入今天我们的主角Quartz，其实这个跟数据库的作业类似，但是不仅仅局限于数据库。一：quartZ引入&三大核心对象简介1：在项目中打开Nuget管理，然后搜索QuartZ，现在最新的版本是3.0.7，需要在Framework4.5.2上面使用。2：quartZ的三大核心对象A：IS
大学生小组作业工具合集：从任务分配到进度追踪，一键搞定
标题：2025大学生小组作业「救星」指南！5大高效协作工具+避坑攻略，卷王组队必备副标题：从“拖延内耗”到“人均效率狂魔”，这些工具让小组作业变成加分项【小组作业的“爱恨情仇”】2025年开学季，微博话题#小组作业比独自打工难100倍#再次冲上热搜。评论区“血泪史”扎堆：有人为协调会议时间抓狂，有人因文件版本混乱通宵返工，甚至有人因“划水队友”被迫“1拖N”……教育部最新数据显示，超70%的高校课
装配式建筑 4.0，中建海龙如何成为行业标杆科技世界网科技人工智能大数据
随着科技的飞速发展和城市化进程的加速，建筑行业正经历着前所未有的变革。在这场变革中，装配式建筑4.0以其高效、环保、智能的特点，引领着建筑业迈向新的发展阶段。同时，中建海龙科技有限公司（简称“中建海龙”）正以其卓越的技术实力和市场洞察力，为绿色建筑未来领航。装配式建筑4.0，作为建筑工业化发展的最新成果，代表了建筑行业向智能化、绿色化、数字化转型升级的重要方向。它将传统建造方式中的大量现场作业转移
TCP三次握手四次挥手和TCP/UDP区别不写bug的程序媛 java tcp/ip udp 网络
TCP/UDP区别TCP是面向连接的可靠传输，UDP是面向无连接的不可靠传输TCP是面向字节流的，UDP是基于数据报的TCP保证数据正确性，UDP可能丢包TCP保证数据顺序，UDP不保证TCP三次握手：第一次握手：客户端通过向服务端发送一个含有同步序列号的标志位的数据段给服务端，向服务端请求建立连接，通过这个数据段，客户端告诉服务端两件事：我想要和你通信；你可以用哪个序列号作为起始数据段来回应我。
【DeepSeek】一文详解GRPO算法——为什么能减少大模型训练资源？ FF-Studio DeepSeek R1 算法
GRPO，一种新的强化学习方法，是DeepSeekR1使用到的训练方法。今天的这篇博客文章，笔者会从零开始，层层递进地为各位介绍一种在强化学习中极具实用价值的技术——GRPO（GroupRelativePolicyOptimization）。如果你是第一次听说这个概念，也不必慌张，笔者会带领你从最基础的强化学习背景知识讲起，一步步剖析其来龙去脉，然后再结合实例讲解GRPO在实际应用中的思路和操作示
TCP/UDP 简介，三次握手与四次挥手 Ashy- 前端面试题前端笔记计算机网络 tcp/ip udp 网络
一、TCP三次握手目的：为了解决在不可靠的信道上建立可靠的网络连接三次握手是连接请求的过程：A发送连接请求的数据给B（发送SYN包）B同意连接，返回数据给A（返回SYN+ACK包）A收到后回复数据给B（返回ACK包），连接建立以上过程不区分客户端和服务端，tcp的连接是全双工的。两端均采用上述机制。Q：为什么不是两次握手？因为在不可靠的网络上可能会存在传输问题，比如A的第一次连接请求没有到B（网络
python编写mapreduce job教程 weixin_49526058 python mapreduce hadoop
在Python中实现MapReduce作业，通常可以使用mrjob库，这是一个用于编写和执行MapReduce作业的Python库。它可以运行在本地模式或Hadoop集群上。以下是一个简单的MapReduce示例，它计算文本文件中每个单词的出现次数。安装mrjob首先，你需要安装mrjob库。可以通过pip安装：pipinstallmrjobMapReduce示例：计算单词频率1.创建一个MapR
有什么数学题库软件吗?4款学生必备APP，题库超全超好用! xzwhyzhy 软件分享
有什么数学题库软件吗?平常喜欢尝试各种类型的数学题，除了可以提高自己的数学成绩，还能让自己多学点知识，那么有什么app可以做数学题呢?下面我就为大家介绍几个数学题库的软件，这些软件都有很多实用的功能，包含的数学题目也很广，每个题目都有很完整的解析供你学习，如果有兴趣的话可以下载一个试试!菁优网它收录的每道题目均附有细致入微的解析，并提供试卷、在线作业以及社交娱乐等各种服务，深受全国学生欢迎。猿题库
linux数学软件下载,小学六年级数学题盐选科普 linux数学软件下载
小学六年级数学题中涵盖了丰富的练习题，可供孩子随时随地的进行练习，遇到不会的题目还可以请教专业的老师，老师十分贴心，会为孩子进行全面的讲解，题目解析的十分透彻，并且在小学六年级数学题app中，孩子还会享受到趣味性十足的教学模式，激发孩子的学习兴趣。小学六年级数学题app特色小学六年级数学题app教孩子轻松应对数学考试。数学作业不用慌，小学六年级数学帮你搞定难点，考点涵盖数学的经典例题和习题。名校老
由GPT支付等衍生的国际支付问题程序员
前言大约2023年1月，是笔者第一次接触openai的时间，用起来的感受就是爽，以至于那段时间都在高强度使用gpt辅助工作，同年2月，openai推出旗下产品的付费plus服务，增值业务包括：高峰时段免排队、快速响应以及优先获得新功能和改进，最初版本的plus笔者也购入使用过（图1）相信绝大部分用户一开始都卡在了这个页面，笔者当初也是，第一次找人整的代充，花了200？不太记得了，总之刚出的时候那代
【深度学习基础】什么是注意力机制我的青春不太冷深度学习人工智能注意力机制
文章目录一、注意力机制的核心地位：从补充到主导二、技术突破：从Transformer到多模态融合三、跨领域应用：从NLP到通用人工智能四、未来挑战与趋势结语参考链接注意力机制：深度学习的核心革命与未来基石在深度学习的发展历程中，注意力机制（AttentionMechanism）的引入堪称一场革命。它不仅解决了传统模型的根本性缺陷，更通过动态聚焦关键信息的能力，重塑了人工智能处理复杂任务的范式。本文
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio