愤怒的可乐

从零实现深度学习框架——深入浅出Word2vec(上)

引言

本着“凡我不能创造的，我就不能理解”的思想，本系列文章会基于纯Python以及NumPy从零创建自己的深度学习框架，该框架类似PyTorch能实现自动求导。

要深入理解深度学习，从零开始创建的经验非常重要，从自己可以理解的角度出发，尽量不使用外部完备的框架前提下，实现我们想要的模型。本系列文章的宗旨就是通过这样的过程，让大家切实掌握深度学习底层实现，而不是仅做一个调包侠。

本文我们来探讨word2vec。本文介绍word2vec词嵌入，它一种稠密向量模型，向量的元素值是实数，甚至可以是负数。

值得注意的是，word2vec是一种静态嵌入(static embeddings)模型，即为词典中的单词生成的是固定嵌入，而不是像BERT那样根据上下文生成动态嵌入。

看完本文，你应该可以一次性掌握word2vec的原理以及实现。

word2vec

word2vec是一种高效的训练词向量的模型。它的想法直接，如果两个单词的上下文相似，那么这两个单词(词向量)也应该是相似的。比如，“A dog is running in the room"和"A cat is running in the room”。这两个句子，只是"cat"和"dog"不同，word2vec认为它们是相似的，而n-gram模型做不到这一点。

这里的词向量是什么？为了便于计算机处理，我们需要把文档、单词向量化。而且除了向量化之后，还希望单词的表达能计算相似词信息。

word2vec有两种计算嵌入的方法：skip-gram和CBOW。

我们先来看看CBOW。

CBOW

CBOW(Continuous Bag-of-Words，连续词袋)模型的基本思想是根据上下文对中心词(目标词,target word)进行预测。例如，对于文本 $wt−2 \cdots \, w_{t-2} \, w_{t-1} \, \underline{w_t} \, w_{t+1} \, w_{t+2} \, \cdots$ ，CBOW模型的任务是根据一定窗口大小内的上下文 $C_t$ (这里窗口大小为 $2$ ，则 $C_t =\{w_{t-2},w_{t-1},w_{t+1},w_{t+2}\}$ ）对 $t$ 时刻的单词 $w_t$ 进行预测。

但是要注意的是，CBOW模型不考虑单词的顺序，实际上是一个词袋模型，这就是它名字的由来。

CBOW模型可以表示成下图所示的前馈神经网络结构。但不同于一般的前馈神经网络，CBOW模型的隐藏层只是执行对词向量取平均的操作，而没有线性变换和非线性激活过程。这也是CBOW模型训练效率高的原因。

CBOW示意图，来自参考1

这里给定词典大小为 $V$ ，每个输入向量 $x$ 和输出向量 $y$ 都是维度为 $V$ 的独热编码。隐藏层的大小为 $N$ ，表示得到的词嵌入维度。

实际上我们的输入可以直接是索引，这一点在代码实现可以看到。

输入层(input)：以大小为 $2$ 的窗口为例，在目标词 $w_t$ 左右各取 $2$ 个单词作为模型的输入。那么输入就由 $4$ 个维度为词典大小 $V$ 的独热编码向量构成。

隐藏层(Hidden)：隐藏层所做的事情就是对上下文 $C_t$ 中的所有词向量取平均，得到一个上下文表示。具体来说，首先输入层中每个单词的独热编码向量经过矩阵 $\in \Bbb R^{V \times N}$ 映射到词向量空间：
$v_{w_i} = W^T x_i \tag 1$
这里 $x_i$ 表示第 $i$ 个单词的独热编码向量，维度是 $\times 1$ ；而 $W$ 为 $\times N$ 的权重矩阵；

上式的结果是得到一个 $\times 1$ 的向量，其实就是取矩阵 $W$ 的第 $i$ 行，也就是单词 $w_i$ 的词向量。

其实这里用不着独热编码，直接取 $W$ 的第 $i$ 行这种索引操作就行了，Pytorch提供了nn.Embedding来实现这一点。

而 $C_t =\{w_{t-2},w_{t-1},w_{t+1},w_{t+2}\}$ 表示所有 $w_t$ 的上下文单词的集合，这里对 $C_t$ 中所有单词的词向量取均值，作为 $w_t$ 的上下文表示：
$v_{C_t} = \frac{1}{|C_t|} \sum_{w \in C_t} v_w \tag{2}$
这里 $C_t|$ 表示该集合中单词的总数，这样 $v_{C_t}$ 的维度还是 $\times 1$ 。

输出层(Output)：输出层做的就是一个多分类问题，与前馈神经网络类似，但是也丢弃了线性变换和偏置。输出层有一个不同的权重矩阵 $W^\prime$ ，它的维度是 $\times V$ 的。如果说 $W$ 是表示中心词的权重矩阵，那么 $W^\prime$ 就是表示上下文词的权重矩阵。它的每一列代表一个上下文单词的词向量。

令 $v^\prime_{w_i}$ 为 $w_i$ 在 $W^\prime$ 中对应的列向量，维度为 $\times 1$ 。那么现在做的就是用 $v_{C_t}$ 与每一个列向量做点积，得到一个分数，这个分数可以理解为衡量中心词 $w_t$ 与输出词的相似度。

我们可以一次计算所有单词的得分：
$W^{\prime T} \cdot v_{C_t} \tag 3$
得到一个 $\times 1$ 的列向量，其中每个元素代表对应单词与中心词的相似得分。最终经过Softmax得到一个概率分布，再和实际的中心词独热编码做一个交叉熵计算损失，我们希望损失越小越好。

若是展开来看，并加上Softmax，那么输出中心词 $w_t$ 的概率可计算为：
$P(w_t|v_{C_t}) = \frac{\exp(v_{C_t} \cdot v^\prime_{w_t})}{\sum_{w^\prime \in \Bbb V} \exp(v_{C_t} \cdot v^\prime_{w^\prime})} \tag {4}$
损失函数

从公式 $(4)$ 可以看出，这其实是一个多分类问题。除了可以用交叉熵来作为损失函数，也可以用负对数似然损失：
$L(\theta) = \sum_{t=1}^T \log P(w_t|C_t) \tag 5$
其中 $C_t =\{w_{t-k},\cdots ,w_{t-1},w_{t+1},\cdots ,w_{t+k}\}$ 表示窗口大小为 $k$ 的上下文单词的集合。

有了正向传播过程和损失函数，我们就可以利用metagrad进行代码实现了，而不用关心反向传播过程。

如果想了解反向传播的推导，可以参考从零实现Word2Vec[^2]。

在CBOW模型的参数中，矩阵 $W$ 和 $W^\prime$ 都可以作为词向量矩阵，它们分别描述了词典中的词在作为目标词或上下文词的不同性质。在实际中通常只用 $W$ 就可以满足应用需求。

在介绍Skip-gram模型之前，我们先来实现已经学习的CBOW模型。

代码实现

在实现上面的权重矩阵 $W$ 时，可以基于没有偏置的线性层Linear来实现，这样输入就如上面所说的one-hot向量。但是还有一种更常用的实现，那么就是通过嵌入层Embedding。

如果通过one-hot向量加线性层实现，就是用one-hot向量与 $W$ 进行矩阵运算，实际上就是取的 $W$ 中的第 $k$ 行，假设one-hot向量中第 $k$ 个元素为 $1$ 。那么与其进行这么复杂的运算，不如直接传入索引 $k$ ，拿到 $W$ 的第 $k$ 行。嵌入层就是实现这个功能的。

嵌入层的实现

class Embedding(Module):
    def __init__(self, num_embeddings: int, embedding_dim: int, _weight: Optional[Tensor] = None,
                 dtype=None, device=None) -> None:
        '''
        一个存储固定大小词汇表嵌入的查找表，可以通过索引(列表)直接访问，而不是one-hot向量。
        :param num_embeddings: 词汇表大小
        :param embedding_dim:  嵌入维度
        '''

        super(Embedding, self).__init__()
        self.num_embeddings = num_embeddings
        self.embedding_dim = embedding_dim

        # 也可以传预训练好的权重进来
        if _weight is None:
            self.weight = Parameter(Tensor.empty((num_embeddings, embedding_dim), dtype=dtype, device=device))
            self.reset_parameters()
        else:
            assert list(_weight.shape) == [num_embeddings, embedding_dim], \
                'Shape of weight does not match num_embeddings and embedding_dim'
            self.weight = Parameter(_weight, device=device)

    def reset_parameters(self) -> None:
        init.uniform_(self.weight)

    def forward(self, input: Tensor) -> Tensor:
        return F.embedding(self.weight, input)

    @classmethod
    def from_pretrained(cls, embeddings: Tensor, freeze=True):
        assert embeddings.ndim == 2, \
            'Embeddings parameter is expected to be 2-dimensional'
        rows, cols = embeddings.shape
        embedding = cls(num_embeddings=rows, embedding_dim=cols, _weight=embeddings)
        embedding.weight.requires_grad = not freeze
        return embedding

代码也不复杂，这里还提供了从已经训练好的权重中加载的功能。在forward中直接调用embedding函数。显然核心逻辑在该函数里面，我们来实现看。

class Embedding(Function):
    def forward(ctx, weight: NdArray, indices: NdArray) -> NdArray:
        ctx.save_for_backward(weight.shape, indices)
        return weight[indices]

    def backward(ctx, grad: NdArray) -> Tuple[NdArray, None]:
        w_shape, indices = ctx.saved_tensors

        xp = get_array_module(grad)

        bigger_grad = xp.zeros(w_shape, dtype=grad.dtype)

        if xp is np:
            np.add.at(bigger_grad, indices, grad)
        else:
            bigger_grad.scatter_add(indices, grad)

        # 因为它有两个输入，防止错误地拆开bigger_grad
        # indices 不需要梯度
        return bigger_grad, None

def embedding(weight: Tensor, indices: Tensor) -> Tensor:
    return Embedding.apply(Embedding, weight, indices)

实现起来类似我们之前的slice函数，毕竟操作上本质是一样的嘛。

当然还有必不可少的单元测试，相关代码请参考完整代码。

那么接下来我们就可以实现CBOW模型了。

模型实现

首先我们要构建词典：

BOS_TOKEN = ""  # 句子开始标记
EOS_TOKEN = ""  # 句子结束标记
PAD_TOKEN = ""  # 填充标记
UNK_TOKEN = ""  # 未知词标记


class Vocabulary:
    def __init__(self, tokens=None):
        self._idx_to_token = list()
        self._token_to_idx = dict()

        # 如果传入了去重单词列表
        if tokens is not None:
            if UNK_TOKEN not in tokens:
                tokens = tokens + [UNK_TOKEN]
            # 构建id2word和word2id
            for token in tokens:
                self._idx_to_token.append(token)
                self._token_to_idx[token] = len(self._idx_to_token) - 1

            self.unk = self._token_to_idx[UNK_TOKEN]

    @classmethod
    def build(cls, text, min_freq=2, reserved_tokens=None):
        '''
        构建词表
        :param text: 处理好的(分词、去掉特殊符号等)text
        :param min_freq: 最小单词频率
        :param reserved_tokens: 预先保留的标记
        :return:
        '''
        token_freqs = defaultdict(int)
        for sentence in text:
            for token in sentence:
                token_freqs[token] += 1

        unique_tokens = [UNK_TOKEN] + (reserved_tokens if reserved_tokens else [])
        unique_tokens += [token for token, freq in token_freqs.items() \
                          if freq >= min_freq and token != UNK_TOKEN]
        return cls(unique_tokens)

    def __len__(self):
        return len(self._idx_to_token)

    def __getitem__(self, token):
        '''得到token对应的id'''
        return self._token_to_idx.get(token, self.unk)

    def token(self, idx):
        assert 0 <= idx < len(self._idx_to_token)
        '''根据索引获取token'''
        return self._idx_to_token[idx]

    def to_ids(self, tokens):
        return [self[token] for token in tokens]

    def to_tokens(self, indices):
        return [self._idx_to_token[index] for index in indices]

然后我们需要自定义数据集：

class CBOWDataset(Dataset):
    def __init__(self, corpus, vocab, window_size=2):
        self.data = []
        self.bos = vocab[BOS_TOKEN]
        self.eos = vocab[EOS_TOKEN]

        for sentence in tqdm(corpus, desc='Dataset Construction'):
            sentence = [self.bos] + sentence + [self.eos]
            # 如果句子长度不足以构建(上下文,目标词)训练样本，则跳过
            if len(sentence) < window_size * 2 + 1:
                continue
            for i in range(window_size, len(sentence) - window_size):
                # 分别取i左右window_size个单词
                context = sentence[i - window_size:i] + sentence[i + 1:i + window_size + 1]
                # 目标词：当前词
                target = sentence[i]
                self.data.append((context, target))

        self.data = np.asarray(self.data)

    def __len__(self):
        return len(self.data)

    def __getitem__(self, i):
        return self.data[i]

    @staticmethod
    def collate_fn(examples):
        '''
        自定义整理函数
        :param examples:
        :return:
        '''
        inputs = Tensor([ex[0] for ex in examples])
        targets = Tensor([ex[1] for ex in examples])
        return inputs, targets

构建(上下文,目标词)训练样本，并且实现自定义的整理函数。

下面我们就可以构建模型了，

class CBOWModel(nn.Module):
    def __init__(self, vocab_size, embedding_dim):
        # 词向量层，即权重矩阵W
        self.embeddings = nn.Embedding(vocab_size, embedding_dim)
        # 输出层，包含权重矩阵W'
        self.output = nn.Linear(embedding_dim, vocab_size, bias=False)

    def forward(self, inputs: Tensor) -> Tensor:
        # 得到所有上下文嵌入向量
        embeds = self.embeddings(inputs)
        # 计算均值，得到隐藏层向量，作为目标词的上下文表示
        hidden = embeds.mean(axis=1)
        output = self.output(hidden)
        return output

参考上面的描述图，其实就是两个权重矩阵。我们一个用嵌入层实现，另一个用不带偏置项的线性层实现。

在训练之前，我们需要构建词典对象，和处理好的语料。

def load_corpus(corpus_path):
    '''
    从corpus_path中读取预料
    :param corpus_path: 处理好的文本路径
    :return:
    '''
    with open(corpus_path, 'r', encoding='utf8') as f:
        lines = f.readlines()
    # 去掉空行，将文本转换为单词列表
    text = [[word for word in sentence.split(' ')] for sentence in lines if len(sentence) != 0]
    # 构建词典
    vocab = Vocabulary.build(text, reserved_tokens=[PAD_TOKEN, BOS_TOKEN, EOS_TOKEN])
    print(f'vocab size:{len(vocab)}')
    # 构建语料:将单词转换为ID
    corpus = [vocab.to_ids(sentence) for sentence in text]

    return corpus, vocab

最后就可以开始训练了：

 	embedding_dim = 64
    window_size = 3
    batch_size = 2048
    num_epoch = 2000
    min_freq = 3  # 保留单词最少出现的次数

    corpus, vocab = load_corpus('../../data/xiyouji.txt', min_freq)
    # 构建数据集
    dataset = CBOWDataset(corpus, vocab, window_size=window_size)
    data_loader = DataLoader(
        dataset,
        batch_size=batch_size,
        collate_fn=dataset.collate_fn,
        shuffle=True
    )

    device = cuda.get_device("cuda:0" if cuda.is_available() else "cpu")

    print(f'current device:{device}')

    loss_func = CrossEntropyLoss()
    # 构建模型
    model = CBOWModel(len(vocab), embedding_dim)
    model.to(device)

    optimizer = SGD(model.parameters(), 1)
    for epoch in range(num_epoch):
        total_loss = 0
        for batch in tqdm(data_loader, desc=f'Training Epoch {epoch}'):
            inputs, targets = [x.to(device) for x in batch]
            optimizer.zero_grad()
            output = model(inputs)
            loss = loss_func(output, targets)
            loss.backward()
            optimizer.step()
            total_loss += loss

        print(f'Loss: {total_loss.item():.2f}')

    save_pretrained(vocab, model.embeddings.weight, 'cbow.vec')

数据集采用的是《西游记》，经过分词、去掉标点符号预处理。
能看到这里的都是粉丝，这里直接放出处理好的数据集。
数据集下载 → 提取码：nap4

为了加速，我们使用GPU进行训练。所配的参数如下：

 	embedding_dim = 64
    window_size = 3
    batch_size = 2048
    num_epoch = 2000
    min_freq = 3

最终的Loss为：800+

实验效果：

> search('观音', embeddings, vocab)
故此: 0.5987884141294884
观音菩萨: 0.5976461631931431
菩萨: 0.5212316212655066
> search('孙悟空', embeddings, vocab)
齐天大圣: 0.5778116509661732
名字: 0.5639390829512272
那方: 0.5528188565550192
> search('呆子', embeddings, vocab)
八戒: 0.6547101716347253
行者: 0.6176272985497067
沙僧: 0.5527797715535391
> search('如来', embeddings, vocab)
佛祖: 0.7029674765576888
佛: 0.5874278308846846
菩萨: 0.5716678406707916
> search('唐僧', embeddings, vocab)
长老: 0.7743582601251642
圣僧: 0.7191300108695816
那怪: 0.6567922349528186

训练好的模型下载 → 提取码: p7ye

测试方法，运行examples/embeddings/load_and_test.py即可。

Skip-gram模型

CBOW模型使用上下文窗口词中的集合作为输入来预测目标词，即 $P(w_t|C_t)$ 。而Skip-gram模型是根据当前词 $w_t$ 来预测上下文词 $C_t$ 。

Skig-gram示意图，来自参考1

这里给定词典大小为 $V$ ，输入向量 $x$ 和输出向量 $y$ 都是维度为 $V$ 的独热编码。隐藏层的大小为 $N$ ，表示得到的词嵌入维度。

输入层 这里也以窗口大小 $k = 2$ 为例，输入 $w_i \in R^{V \times 1}$ 是 $V$ 维的独热编码，也记为 $w_t$ 。

隐藏层 $w_t$ 通过矩阵 $\in R^{N \times V}$ 投影到隐藏层，这里隐藏层向量即为 $w_t$ 的词向量 $v_{w_t} \in R^{N \times 1}$ ：

$v_{w_t} = W^Tx \tag 6$

输出层 输出层利用线性变换矩阵 $W^\prime$ 对上下文窗口内的单词进行预测：

具体做法是，假设 $v_c^\prime$ 某个上下文单词在 $W^\prime \in R^{N \times V}$ 中对应的列向量，维度为 $\times 1$ 。那么也是用当前词的词向量 $v_{w_t}$ 与上下文单词的词向量 $v^\prime_c$ 做一个点积，得到一个数值作为得分，也可以看成相似度。

那么我们也可以一次计算词典中所有单词的得分(其实就是公式 $(8)$ 中的：
$W^{\prime T} \cdot v_{w_t} \tag 7$
得到的 $\in R^{V \times 1}$ ，每个元素代表对应单词与当前词的相似得分，最终经过Softmax得到一个概率分布。若展开来看，那么由中心词计算上下文词 $c$ 的概率为：
$P(c|w_t) = \frac{\exp(v_{w_t} \cdot v_c^\prime)}{\sum_{w^\prime} \exp(v_{w_t} \cdot v^\prime_{w^\prime})} \tag 8$
其中 $\in \{w_{t-2},w_{t-1},w_{t+1},w_{t+2}\}$ 。

损失函数

Skip-gram模型的负对数似然损失函数为：
$L(\theta) = - \sum_{t=1}^T \sum_{-k \leq j \leq k, j\neq 0} \log P(w_{t+j}|w_t) \tag 9$
即希望基于 $w_t$ 预测得到的上下文单词 $w_{t+j}$ 出现的概率越高越好。

代码实现

有了上面的基础，我们直接进行模型实现。

Skip-gram模型的输入输出与CBOW模型接近，主要区别在于Skip-gram的输入输出都是单个单词，即在一定上下文窗口大小内共现的词对，而CBOW模型的输入是多个上下文单词与一个中心词组成的词对。

我们首先构建这种数据集：

class SkipGramDataset(Dataset):
    def __init__(self, corpus, vocab, window_size=2):
        self.data = []
        self.bos = vocab[BOS_TOKEN]
        self.eos = vocab[EOS_TOKEN]

        for sentence in tqdm(corpus, desc='Dataset Construction'):
            sentence = [self.bos] + sentence + [self.eos]

            for i in range(1, len(sentence) - 1):
                # 模型输入：当前词
                w = sentence[i]
                # 模型输出： 窗口大小内的上下文
                # max 和 min 防止越界取到非预期的单词
                left_context_index = max(0, i - window_size)
                right_context_index = min(len(sentence), i + window_size)
                context = sentence[left_context_index:i] + sentence[i + 1:right_context_index + 1]
                self.data.extend([(w, c) for c in context])

        self.data = np.asarray(self.data)

    def __len__(self):
        return len(self.data)

    def __getitem__(self, i):
        return self.data[i]

    @staticmethod
    def collate_fn(examples):
        '''
        自定义整理函数
        :param examples:
        :return:
        '''
        inputs = Tensor([ex[0] for ex in examples])
        targets = Tensor([ex[1] for ex in examples])
        return inputs, targets

从代码可以看出，假设窗口大小为 $k$ ，那么我们一次就得到了 $2 k$ 个训练样本(中心词，上下文词)。所以还是单类别多分类问题。

模型实现就更简单了，不需要求均值：

class SkipGramModel(nn.Module):
    def __init__(self, vocab_size, embedding_dim):
        self.embeddings = nn.Embedding(vocab_size, embedding_dim)
        self.output = nn.Linear(embedding_dim, vocab_size)

    def forward(self, inputs: Tensor) -> Tensor:
        # 得到输入词向量
        embeds = self.embeddings(inputs)
        # 根据输入词向量，对上下文进行预测，得到每个单词的得分，但是我们只关注样本中与中心词对应的上下文词的得分,期望越高越好。
        output = self.output(embeds)
        return output

最后的训练代码为：

embedding_dim = 64
    window_size = 3
    batch_size = 1024
    num_epoch = 10
    min_freq = 3  # 保留单词最少出现的次数

    # 读取文本数据，构建Skip-gram模型训练数据集
    corpus, vocab = load_corpus('data/xiyouji.txt', min_freq)
    dataset = SkipGramDataset(corpus, vocab, window_size=window_size)
    data_loader = DataLoader(
        dataset,
        batch_size=batch_size,
        collate_fn=dataset.collate_fn,
        shuffle=True
    )

    loss_func = CrossEntropyLoss()
    # 构建Skip-gram模型，并加载至device
    device = cuda.get_device("cuda:0" if cuda.is_available() else "cpu")
    model = SkipGramModel(len(vocab), embedding_dim)
    model.to(device)
    optimizer = SGD(model.parameters(), lr=1)

    for epoch in range(num_epoch):
        total_loss = 0
        for batch in tqdm(data_loader, desc=f"Training Epoch {epoch}"):
            inputs, targets = [x.to(device) for x in batch]
            optimizer.zero_grad()
            output = model(inputs)
            loss = loss_func(output, targets)
            loss.backward()
            optimizer.step()
            total_loss += loss
        print(f"Loss: {total_loss.item():.2f}")

完整代码

https://github.com/nlp-greyfoss/metagrad

References

Learning Word Embedding
从零实现Word2Vec
自然语言处理：基于预训练模型的方法
Speech and Language Processing

6.《DevOps》系列K8S部署CICD流水线之K8S通过Yaml部署动态Jenkins-slave,以及Jenkins平台基于Gitlab实现SSO授权认证洋葱_学习过程 devops kubernetes jenkins
架构服务器IP服务名称硬件配置192.168.1.100k8s-master8核、16G、120G192.168.1.101k8s-node18核、16G、120G192.168.1.102k8s-node28核、16G、120G192.168.1.103nfs2核、4G、500G操作系统：Rocky9.3jenkins版本：2.477原理JenkinsMaster接到构建任务后会动态在集群中的一
（基础）Python实现定时任务的八种方案详解程序员-不秃头的阿焕 python 开发语言后端
在日常工作中，我们常常会用到需要周期性执行的任务，我们可以用Python直接实现这一功能。今天我们来学习一下这些基本的操作，有需要了解更多关于python相关知识的，免费领取资源的，请点击这个链接。目录利用whileTrue:+sleep()实现定时任务使用Timeloop库运行定时任务利用threading.Timer实现定时任务利用内置模块sched实现定时任务利用调度模块schedule实现
MyMvvmMaster：Android应用开发的MVVM架构解决方案不胖的羊
本文还有配套的精品资源，点击获取简介：MyMvvmMaster.zip是一个集成MVVM架构、RxJava2、Retrofit和ARouter的Android应用框架压缩包，旨在简化开发流程，增强代码的可读性和可维护性。本框架通过DataBinding库实现数据和UI的双向绑定，利用RxJava2优化异步编程，Retrofit简化网络请求处理，ARouter管理模块间路由，从而提供一个高效、模块化
anaconda 安装后找不到prompt 刘凑华 prompt python 开发语言
解决方法，用cmd进入anaconda的安装目录，然后输入如下命令python .\Lib\_nsis.py mkmenus
php ip获取邮政编码,地理位置-如何从IP地址确定邮政编码和城市？哈士奇爱深海鱼 php ip获取邮政编码
以下是我发现的使用[http://ipinfodb.com/ip_locator.php]来获取其信息的代码段的修改版本。请记住，您也可以向他们申请API密钥，并直接使用API来获取您认为合适的信息。如您所见[http://ipinfodb.com/ip_location_api.php，]他们提供了从PHP到JavaScript到ASP.Net的所有示例。如前所述，下面不需要密钥，因为它可以拉动
Qutebrowser：Python程序员的浏览器利器东方佑量子变法 python
引言在日常工作中，我们常常会遇到一些重复性的操作，比如每天打开固定的几个网页，或者需要频繁地对网页进行截图。如果你是一位Python开发者，并且希望有一种更高效的方式来处理这些任务，那么今天介绍的Qutebrowser绝对会让你眼前一亮。Qutebrowser是一个基于Python和PyQt开发的键盘驱动浏览器，它不仅支持Vim风格的快捷键操作，还允许用户通过编写Python脚本来扩展其功能。接下
搭建服务器VPN,Linux客户端连接WireGuard,Windows客户端连接WireGuard skyQAQLinux linux 服务器运维
Linux客户端连接WireGuard实验要求准备两台Linux系统，实现VPN服务端功能，安装wireguard-tools等软件包并配置，服务端使用proxy主机，客户端使用client主机环境准备主机名IP地址角色client（已存在）eth0：192.168.88.10/24（充当公网地址）10.10.10.2（充当私网VPN通信地址）客户端proxy（已存在）eth0：192.168.8
Java实现文件内容加解密 qq_34759280 Java java 安全加解密
背景近期在做一个对数据安全要求比较高的软件，用户要求做到对接口、文件、以及数据库部分敏感字段进行加密。由于系统中文件内容比较敏感，用户要求除了客户其他人不能查看文件具体内容，包括运维人员和开发人员。探讨其实文件加密并不算太复杂。无非就是在用户上传文件的时候将文件内容读出加密写入后再存到服务器，然后用户下载的时候将内容读出然后解密再写入输出流即可。简单实现计算机数据内容是二进制，针对二进制最简单高效
Java移位运算符以及位运算专属_Smile java进阶
移位运算符：移位运算符是位操作运算符的一种。移位运算符可以在二进制的基础上对数字进行平移。按照平移的方向和填充数字的规则分为三种：>(带符号右移)和>>>(无符号右移)。左移运算符（>）按二进制形式把所有的数字向右移动对应位移位数，低位移出(舍弃)，高位的空位补符号位，即正数补零，负数补1。例如11>>3，则是将数字11右移3位。11的二进制值为00000000000000000000000000
使用RocketMQ 的业务系统怎么处理消息的重试？点滴~ rocketmq
目录1.消息重试的场景1.1生产者发送消息失败1.2消费者消费消息失败2.RocketMQ的重试机制2.1生产者重试2.2消费者重试3.处理消息重试的最佳实践3.1生产者重试处理3.2消费者重试处理3.3死信队列处理4.具体实现示例4.1生产者重试4.2消费者重试4.3死信队列处理5.注意事项5.1重试次数与间隔5.2幂等性设计5.3监控与告警6.总结在RocketMQ中，消息的重试是保证消息可靠
FPGA实现光纤通信(3)——光纤8b/10b编码数据回环得之坦然，失之淡然。 FPGA学习笔记 fpga开发开源
前言光纤通信属于高速串行通信，具有较高的数据传输速率，通常用于服务器以及通信设备之间用于高速数据交换，对于xilinx7系列的FPGA，内部具有集成的高速接口用于实现光纤通信。本次就来实现8b/10b编码数据回环。测试环境：vivado版本：2020.02FPGA芯片：XC7K70T测试说明：进行光纤8B/10B编码数据回环测试8B/10B编码简介8b/10b编码是由IBM公司的Widmer和Fr
一线大厂的 MQ 组件实现思路和架构设计思路 java领域 java 开发语言程序人生单元测试 python
首先来看看一线大厂的架构图一线大厂的架构图如上图所示，中间是我们的MQ集群架构，在上层利用keepalived和HA-Proxy，最下面是两个大的MQ集群做一个高可用。当然了，在实际大厂里面可能就不止两个集群了，可以是很多个集群，然后集群之间利用federration插件进行数据同步。上面的生产端组件：这里面可能就有很多的架构设计，比如生产端怎么对一个容器进行缓存，举个例子，我们生产端发送消息，都
Python GUI编程(Tkinter框架) chunyublog python 开发语言
1.Tkinter是什么？Tkinter是Python的标准GUI（图形用户界面）库，它是Python的Tcl/TkGUI工具包的包装器。Tkinter允许Python程序员快速创建GUI应用程序，而无需深入了解底层的图形绘制细节。2.安装TkinterTkinter通常已经预装在Python中，所以不需要额外安装。你可以在Python环境中直接导入它：Importtkinterastk不过，在某
《零基础学Nginx：轻松搭建高性能Web服务器-kylin系统》入眼皆含月 nginx 服务器运维
一、概述Nginx（发音为“engineX”）是一款高性能的开源HTTP服务器和反向代理服务器，同时也支持IMAP/POP3代理服务器。它由俄罗斯程序员伊戈尔·西索夫（IgorSysoev）开发，并于2004年首次发布。Nginx以其高并发处理能力、低资源消耗和高性能而闻名，广泛应用于互联网行业，是许多大型网站和高性能需求场景的首选解决方案。二、Nginx的特点（1）高性能：Nginx采用事件驱动
python、JAVA等多种语言演示免费获取股票数据（实时数据、历史数据、CDMA、KDJ等指标数据）配有股票数据API接口说明文档说明 Eumenides_max python java 数据库股票API接口股票数据接口
近一两年来，股票量化分析逐渐受到广泛关注。而作为这一领域的初学者，首先需要面对的挑战就是如何获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的核心任务是从这些数据中挖掘出有价值的信息，为我们的投资策略提供有力的支持。在寻找数据的过程中，我尝试了多种途径，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花
API接口助力独立站实现物流追踪自动化 FBAPI3713612741 人工智能 python 爬虫 oneapi
随着信息技术的飞速发展和电子商务的蓬勃兴起，物流追踪已成为电商平台和独立站运营中不可或缺的一环。API（应用程序编程接口）接口作为连接不同软件系统的桥梁，其在物流追踪自动化方面发挥着至关重要的作用。本文将深入探讨API接口如何助力独立站实现物流追踪自动化，并分析其带来的诸多优势。一、API接口的基本概念与功能API接口是一组预定义的函数或协议，允许不同的软件系统之间进行有效的通信和数据交换。这些接
从数据到决策：API接口助力电商独立站精准营销 FBAPI3713612741 python 爬虫
在数字化时代，电商行业正以前所未有的速度发展，而独立站作为电商领域的重要一环，面临着日益激烈的竞争环境。为了在市场中脱颖而出，独立站需要依靠精准营销来提升用户体验、增加用户黏性，并最终实现销售增长。在这个过程中，数据的作用不可忽视，而API接口则成为连接数据与决策的重要桥梁。本文将深入探讨如何从数据收集、处理、分析到最终决策，利用API接口助力电商独立站实现精准营销。一、数据收集：API接口打通信
电商数据高效处理，离不开API接口技术的支持 FBAPI3713612741 大数据 python 爬虫 oneapi 人工智能
在当今数字化、信息化高速发展的时代，电子商务（电商）行业以其便捷性、高效性和全球化特点，成为了推动经济发展的重要力量。电商平台的成功运作，离不开大量数据的处理与分析，而高效的数据处理则是电商平台得以持续优化用户体验、提升运营效率、实现精准营销的关键。在这一过程中，API（ApplicationProgrammingInterface，应用程序编程接口）接口技术发挥了至关重要的作用。本文将从API接
电商独立站如何利用API接口实现数据驱动决策 FBAPI3713612741 python 爬虫 oneapi 网络
在电商行业的快速发展中，独立站作为品牌直面消费者的主要渠道，其运营效率和决策准确性至关重要。API接口（ApplicationProgrammingInterface，应用程序编程接口）作为数据交互的标准方式，在电商独立站中扮演着至关重要的角色。它不仅打破了信息孤岛，实现了数据的集中和统一管理，还为电商业务的高效运行和持续创新提供了坚实的支撑。本文将深入探讨API接口技术如何助力电商独立站实现数据
数字时代信息安全的关键之道—零信任架构 AZone架构院架构
随着数字化转型的迅猛推进，信息安全面临的挑战也日益复杂和严峻。传统的网络边界已经逐渐模糊，企业数据流动的复杂性和敏感性也随之增加。在此背景下，零信任架构（ZeroTrustArchitecture，ZTA）应运而生，成为保护企业数字资产的首选策略。TheOpenGroup发布了《零信任的核心原则》，详细阐述了零信任架构的核心原则、应用场景以及技术实现，为企业提供了全面的参考指南。01零信任架构的核
无线移动通信的关键技术：SOA,WebX.0,Widget/Mashup,P2P/P4P,SaaS/云计算等架构和MIP,SIP,RTSP (实时流协议)等，定义和特点晓北斗NorSnow 多媒体考试架构
以下是对无线移动通信中一些关键技术的定义和特点的整理，以表格形式呈现：技术/架构定义特点SOA（面向服务的架构）一种将应用程序划分为自治的、可重用的、可组合的服务，并通过服务之间的松耦合和标准化的接口进行通信的架构模式1.服务导向，将应用程序看作一组互相独立的服务。2.可重用性高，服务可以被不同的应用程序和业务场景复用。3.松耦合，服务之间通过标准化的接口进行通信，不依赖具体的实现细节。4.灵活性
找不到Anaconda prompt终端 AI小白（入门版） prompt python 开发语言
想打开anacondaprompt时发现文件夹和开始菜单里都找不到问题原因因为anaconda还没有初始化，在安装anaconda的过程中，有一行是否要添加anaconda到菜单目录中，由于没有勾选，导致没有菜单部分的初始化，故找不到。问题解决打开cmd，进入anaconda的安装路径，输入命令。python.\Lib\_nsis.pymkmenus然后会发现菜单目录就有了anaconda终端。
独立站API接口安全：零信任架构的实践与挑战 FBAPI3713612741 python oneapi 爬虫网络大数据
随着数字化时代的深入发展，电商平台已成为全球经济的重要支柱。在这些平台中，API（应用程序编程接口）接口扮演着越来越重要的角色，不仅连接了电商平台的前端和后端系统，还促进了与第三方服务和应用的无缝集成。然而，随着API接口在电商平台中的广泛应用，其安全性问题也日益凸显。为了应对这一挑战，零信任架构作为一种先进的安全理念，被越来越多的电商平台采用来保障API接口的安全。本文将深入探讨独立站API接口
selenium+pytest自动化脚本生成报告乱码问题 xiaobawang001 selenium pytest 自动化
在运行pytest生成报告的时候，中文会显示为？如下图尝试多种修改conftest的编码格式后，未能成功，最终直接修改python路径\Lib\site-packages\pytest_html内的html_report.py将这句head=html.head(html.meta(charset="utf-8"),html.title(self.title),html_css)修改为：head=h
MacOS系统搭建Appium自动化测试环境 xiangzhihong8 前端 macos appium
一、Appium简介1.1什么是APPiumAPPium是一个开源测试自动化框架，适用于原生、混合或移动Web应用程序的自动化测试工具。APPium使用WebDriver协议驱动iOS、Android等应用程序。APPium具有如下特点：支持多平台（Android、iOS等）。支持多语言（python、java、ruby、js、c#等)。APPium是跨平台的，可以用在OSX，Windows以及L
vscode+Python便携版简易制作可以直接复制到u盘再看我把你喝掉笔记 python vscode visual studio code 编辑器
引言对于vscode和Python的爱好者，一直被复杂的开发环境所困扰，于是迫切需要一个可以将vscode和Python放置在u盘中可以不受运行环境的影响运行在不同电脑的便携方案。通过百度初步检索发现：吾爱破解论坛提供了一种需要修改pipe.exe源文件的制作方法，csdn网提供个一种通过设置bat批处理来实现便携化的方案。上述两种方案，操作相对复杂，需要一定的计算机知识，很不方便。对此提出一种更
领域模型、MDD\DDD\TDD概念 lemon_lmlmlmlm java
此篇是个人笔记整理，知识来源：领域模型-CSDN博客、什么是MDD，DDD，TDD?-CSDN博客一、领域模型定义：领域模型是对领域内的概念类或现实世界中对象的可视化表示。又称概念模型、领域对象模型、分析对象模型。它专注于分析问题领域本身，发掘重要的业务领域概念，并建立业务领域概念之间的关系。领域模型（DomainModel），是完成从需求分析到面向对象设计的一座桥梁，领域模型是指对需求所涉及的领
用bash脚本激活python虚拟环境这个人很懒，还没有设置昵称... bash bash
bash脚本内容：#!/bin/bashcondaactivatenamefasta=$1echo$fasta$1就是接受的用户在命令行输入的变量，echo就是打印该变量激活办法：bash-irun.sh参考链接：https://zhuanlan.zhihu.com/p/422365954if语句判断路径是否存在：result=$1if[-f"$result"];thenmkdir$resultf
R 调用 python weixin_33971205 python json java
上一篇说了python使用rpy2调用R，这里介绍R如何调用python。R的强项在于统计方面，尤其是专业的统计分析，统计检验以及作图功能十分强大，但是在通用性方面，就远不如Python了，比如python可以做web，可以开发GUI，可以爬虫，甚至可以开发游戏，这些R其实也不是完全不行，但是在易用性方面实在是难以与Python相匹敌。所以如果要是能将R与Python相结合，充分发挥二者的优势，那
chatgpt赋能python：Python怎么安装到U盘 vacvefito ChatGpt chatgpt 人工智能计算机
Python怎么安装到U盘在日常的编程工作中，Python是一门十分常用的编程语言。而有时候并非每个人都愿意在电脑上安装Python，或者在外出时需要借助一台非自己的电脑来进行Python编程。因此，将Python安装到U盘成为一个方便实用的选择。为什么要将Python安装到U盘将Python安装到U盘可以让我们在不同设备上进行Python编程，而不用担心设备内是否已经安装了Python。这样可以
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

从零实现深度学习框架——深入浅出Word2vec(上)

引言

word2vec

CBOW

代码实现

嵌入层的实现

模型实现

Skip-gram模型

代码实现

完整代码

References

你可能感兴趣的:(#,从零实现深度学习框架,深度学习,word2vec,python)