北落师门XY

Bert（Bidirectional Encoder Representations from Transformers）

一、简介

Bert即基于Transformer的双向编码器表示，2018年由google提出。基于多个Transformer的编码器堆叠而成，输入输出不改变形状。

Bert的双向不是常规的RNN式的正向反向后连接，指的能根据上下文表示，推测[mask]处的内容。区别可参考这篇博客：解释BERT为什么是双向表示_B站：阿里武的博客-CSDN博客_bert的双向

二、2种无监督预训练任务

1、MLM（Masked Language Model 遮罩式语言模型）

mask策略：随机mask15%，其中，10%替换成其他，10%原地不动，80%替换成mask。取输出的特征进行交叉熵损失计算，并设置ignore_index参数只计算这15%位置的损失，注意不是只根据替换的位置计算损失。“10%替换成其他”使模型的输入词汇不一定正确，更多地学习上下文信息

BERT中是怎么做到只计算[MASK]token的CrossEntropyLoss的？及torch.nn.CrossEntropyLoss()参数__illusion_的博客-CSDN博客_mask token

2、NSP（Next Sentence Prediction 下一句预测）

判断第二个句子是不是第一个句子的下一句，标签为IsNext和NotNext，取第一个cls的特征表示进行交叉熵二分类损失计算。由于包含主体预测及连贯性预测两个信息，如果是同一主题的文本，易被误判为IsNext，这个任务太简单不是很完美，对模型的训练作用比MLM小。

三、token embedding 词嵌入

input = token embedding（词嵌入） + segment embedding(划分两个句子)+position embedding（0、1、2...初始化，后让模型进行学习，而非transformer的正余弦函数）

Bert的tokenizer是先根据符号及空格分割，后根据词表分词。在英文场景中，一般会转为小写处理，do_lower_case。

BertTokenizer = BasicTokenizer + WordPieceTokenizer

BasicTokenizer 基于符号及空格分割，可指定某些词不分割

WordPieceTokenizer将词根据词根、时态等分割为子词（subword）

下例将一个句子转index为[2,3,4,5]后pad了4个0，组成一个长度为8的token，每个token都用一个7维的信息表示

import torch
import torch.nn as nn
max_len = 8
t= torch.tensor([[2,3,4,5,0,0,0,0]])

embed = nn.Embedding(6, 7)   # 随机初始化embedding，词表大小为6，每个词用一个7维向量表示
print(embed(t))   # 8*7维度

四、特殊标志位

这些特殊标志位会出现在词表中

[CLS] 标志放在第一个句子的首位，经过 BERT 得到的的表征向量 C 可以用于后续的分类任务。

[SEP] 标志用于分开两个输入句子，例如输入句子 A 和 B，要在句子 A，B 后面增加 [SEP] 标志。

[UNK]标志指的是未知字符

[MASK] 标志用于遮盖句子中的一些单词，将单词 [MASK] 之后，再利用 BERT 输出的 [MASK] 向量预测单词是什么。

[PAD]句子经过tokenizer后转为索引ids，由于transformer要求输入是固定大小的，以此索引列表又会后面补0并pad到固定长度，补0是因为特殊标志位[PAD]索引一般设置为0。PAD解决了输入的不定长问题

五、PAD MASK

为避免pad的地方对注意力机制产生影响，需要获取这些pad的位置，在实际运用中用MASK遮住补0的地方。获取这些pad位置的方法称为get_attn_pad_mask。这个mask会作用于q与k做点积后的矩阵上，因此要保持维度的一致。此外，get_attn_pad_mask是针对key的，当不是自注意力机制时，q与k不同，mask中1的位置（即pad位置）以k为准。注意这个函数的输入是embedding之前，mask是作用在embedding之后

为什么需要让pad_attn_mask的形状为(batch_size, len_q, len_k)呢？众所周知，做注意力的时候是query去与key做点积运算，做embedding之后q和k的形状为(batch_size, q_len, embed_size)和(batch_size, k_len, embed_size)，于是两者做点积后的shape变为(batch_size, q_len, k_len)，MASK需要与attn_mask形状一致。

import torch
import torch.nn as nn


def get_attn_pad_mask(seq_q, seq_k):
    # 在自注意力中，seq_q == seq_k
    batch_size, len_q = seq_q.size()
    batch_size, len_k = seq_k.size()
    # 等于0的即为
    # .data意思是不在计算图中储存它的梯度
    # eq意思是equal，是否相等
    pad_attn_mask = seq_k.data.eq(0).unsqueeze(1)  # 等于0的地方赋1，其余地方赋0
    print('pad_attn_mask=', pad_attn_mask)  # pad_attn_mask= tensor([[[0, 0, 0, 1, 1, 1]]], dtype=torch.uint8)
    print('pad_attn_mask.size()=', pad_attn_mask.size())  # [batch_size, 1, seq_k_length]= torch.Size([1, 1, 6])
    # tensor 中的expand可以理解为重复n次
    return pad_attn_mask.expand(batch_size, len_q, len_k)  # [batch_size, seq_q_length, seq_k_length]


q = torch.tensor([[2, 3, 4, 1, 0, 0]])
k = torch.tensor([[3, 4, 1, 0, 0, 0]])
mask = get_attn_pad_mask(q, k)
print(mask)
print(mask.size())  # torch.Size([1, 6, 6])
"""
tensor([[[0, 0, 0, 1, 1, 1],
         [0, 0, 0, 1, 1, 1],
         [0, 0, 0, 1, 1, 1],
         [0, 0, 0, 1, 1, 1],
         [0, 0, 0, 1, 1, 1],
         [0, 0, 0, 1, 1, 1]]], dtype=torch.uint8)
"""

六、attn_pad_mask的两种用法

attn_pad_mask指向的是key中pad的位置，点积前获取，作用在点积后的矩阵上，将这些位置变为-inf,之后再进行softmax，这些位置就是0。

有填充和相加两种方法，都是将pad处变为非常小的数。

先介绍pytorch的2个函数：bmm、masked_fill。

a = torch.tensor([[[1,2,3]],[[1,2,3]]])   # (b,h,w)
b = torch.tensor([[[1],[2],[3]],[[1],[2],[3]]])   # (b,w,h)
print(a.size(),b.size())   # torch.Size([2, 1, 3]) torch.Size([2, 3, 1])


# bmm做矩阵乘法，对输入的2个矩阵尺寸有要求
c = torch.bmm(a,b)
print(c)   # tensor([[[14]],[[14]]])
print(c.size())   # (b,h,h)=torch.Size([2, 1, 1])


#masked_fill将tensor的指定位置填充指定值
# 方法一：直接赋负无穷
# attn为q和k的embedding点积之后的矩阵
attn = attn.masked_fill(get_attn_pad_mask, float("-inf"))

# 方法二：加上负无穷
mask = mask.float().masked_fill(mask == 1, float("-inf")).masked_fill(mask == 0, float(0.0))
attn += mask

七、Position Mask

Bert中有2种mask，一个是pad mask，使注意力不关心k中pad的位置；另一个是解码时的Position Mask，预测下一个词时只看到前面的和本身，看不到后面的。

Decoder中的attention与encoder中的attention有所不同。Decoder中的attention中当前单词只受当前单词之前内容的影响，而encoder中的每个单词会受到前后内容的影响。因为编码是并行输入的，解码会用到当前的输出。

实现方法为先用triu做一个上三角矩阵，转置，分别赋予-inf和0

def generate_square_subsequent_mask(sz: int):
    print(torch.ones(sz, sz))
    print((torch.triu(torch.ones(sz, sz)) == 1))
    mask = (torch.triu(torch.ones(sz, sz)) == 1).transpose(0, 1)
    print(mask)
    mask = mask.float().masked_fill(mask == 0, float('-inf')).masked_fill(mask == 1, float(0.0))
    return mask


q= torch.tensor([[2, 3, 0, 0]])
position_mask = generate_square_subsequent_mask(q.size()[-1])
print(position_mask)
# tensor([[1., 1., 1., 1.],
#         [1., 1., 1., 1.],
#         [1., 1., 1., 1.],
#         [1., 1., 1., 1.]])
# tensor([[1, 1, 1, 1],
#         [0, 1, 1, 1],
#         [0, 0, 1, 1],
#         [0, 0, 0, 1]], dtype=torch.uint8)
# tensor([[1, 0, 0, 0],
#         [1, 1, 0, 0],
#         [1, 1, 1, 0],
#         [1, 1, 1, 1]], dtype=torch.uint8)
# tensor([[0., -inf, -inf, -inf],
#         [0., 0., -inf, -inf],
#         [0., 0., 0., -inf],
#         [0., 0., 0., 0.]])

八、整合PAD MASK和位置遮挡

解码时这2种mask要叠加，即将两种mask相加，再和点乘后的矩阵相加

attn_mask = mask + position_mask
attn += attn_mask
attn = softmax(attn)

九、位置编码

相对位置编码有学习和正余弦函数两种方式

正余弦函数法：在正余弦表示中，位置编码对token在句子中的位置POS及词向量的位置(单词含义)2i/2i+1都是敏感的。形状同word embedding，是一个二维矩阵，行为token长度，列为词向量长度。

PE(pos,2i)=sin(pos/100002i/dmodel)

PE(pos,2i+1)=cos(pos/100002i/dmodel)

import torch
import torch.nn as nn

Tensor = torch.Tensor


def positional_encoding(X, num_features, dropout_p=0.1, max_len=512) -> Tensor:
    r'''
        给输入加入位置编码
    参数：
        - num_features: 输入进来的维度，word embedding时表示词向量的维度
        - dropout_p: dropout的概率，当其为非零时执行dropout
        - max_len: 句子的最大长度，默认512

    形状：
        输出=输入+pisitional encoding,因此输入输出维度保持一致
        - 输入： [batch_size, seq_length, num_features]
        - 输出： [batch_size, seq_length, num_features]

    '''

    dropout = nn.Dropout(dropout_p)
    P = torch.zeros((1, max_len, num_features))  # P为位置编码矩阵
    X_ = torch.arange(max_len, dtype=torch.float32).reshape(-1, 1) / torch.pow(
        10000,
        torch.arange(0, num_features, 2, dtype=torch.float32) / num_features)
    P[:, :, 0::2] = torch.sin(X_)  # 偶数位置
    P[:, :, 1::2] = torch.cos(X_)  # 奇数位置
    X = X + P[:, :X.shape[1], :].to(
        X.device)  # X为输入，P为位置编码矩阵，相加后作为多头attention的输入。由于这个例子中X为(2,4,10)，而不是(2,512,10)，所以还用X.shape[1]做了一下截断
    return dropout(X)


X = torch.randn((2, 4, 10))  # (batch, seq_len, num_features) = (2,4,10),这个例子里还没做pad
X = positional_encoding(X, 10)
print(X.shape)   # torch.Size([2, 4, 10])

十、下游任务

1、句子对分类/文本匹配：取出cls信息做n分类下游任务，如nsp

2、单个句子分类

3、QA问答：取出一个句子中间的start及end作为答案

4、序列标注：序列标注，对每个词进行bio分类从而进行ner

十一、优化的Bert

这部分主要讲解原生bert存在的问题，以及后人在此基础上的改进。

BERT、ALBERT、RoBerta、ERNIE模型对比和改进点总结 - 知乎

ALBERT（A Lite BERT 一个精简的 BERT）

通过因式分解及跨层参数共享减小参数量，提出Sentence-order prediction (SOP序列顺序预测)来取代NSP

RoBERTa（A Robustly Optimized BERT 一个强力优化的Bert）

主要是训练技巧（动态mask技巧、更大batch_size、训练任务、更大的词汇表（更大的Byte-Pair Encoding））、更大数据集大小等细节的优化
ERNIE百度

MLM直接对单个token进行随机mask，丢失了短语和实体信息，这一点对中文尤其明显。利用短语和实体级别的mask方式，更多的中文语料

参考链接：

BERT 的 PyTorch 实现（超详细）_数学家是我理想的博客-CSDN博客_bert pytorch

一篇看懂所有关于Transformer在翻译任务中的细节_sherlock31415931的博客-CSDN博客_transformer翻译任务

图解Bert系列之Transformer实战 (附代码)

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史 - 知乎

bert 源码解读（基于gluonnlp finetune-classifier）_sinat_34022298的博客-CSDN博客_bert源码

BERT源码分析PART I - 知乎

你可能感兴趣的:(bert,自然语言处理,小程序)

外卖优惠券推广赚钱？外卖优惠券推广赚钱吗？高省APP珊珊
外卖优惠券推广赚钱是一种可行的商业模式，通过推广外卖优惠券来获得佣金收益。具体来说，推广者可以在社交媒体、公众号、小程序等渠道上发布外卖优惠券信息，吸引用户领取并使用，一旦用户使用优惠券下单，推广者即可获得一定的佣金收益。【高省APP】（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
HW prefetcher之CDP(Content-Directed Data Prefetching) Chip Design xPU Chip Design CPU GEM5
CDP是Content-DirectedDataPrefetching的缩写，它基于RobertCooksey和StephanJourdan提出的"Stateless,Content-DirectedDataPrefetchingMechanism"论文实现。是一种内容导向的数据预取机制，CDP通过分析内存中的数据内容来识别可能的指针，当识别到指针时，它会预取指针指向的内存地址。CDP使用VPN表
# 百万级OpenID自动化获取：高并发架构设计与微信生态实战 Loving_enjoy 计算机学科论文创新点人工智能深度学习经验分享 facebook
>当你的小程序日活突破10万+，如何安全高效地管理海量用户身份？OpenID作为微信生态的"用户身份证"，其获取效率直接影响业务增长！在微信生态开发中，OpenID是用户身份识别的核心密钥。然而传统获取方式存在三大痛点：1.**效率瓶颈**：单线程获取10万OpenID需27小时+2.**稳定性风险**：网络波动导致数据丢失3.**开发成本高**：需重复实现授权逻辑本文将揭秘百万级OpenID自动
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的渠道选择策略研究说私域人工智能小程序
摘要：在数字化商业环境下，品牌与产品的渠道选择对其市场推广和运营成功至关重要。本文聚焦于如何依据自身品牌和产品特性，结合开源AI智能名片链动2+1模式与S2B2C商城小程序，运用科学的渠道选择方法，慎重挑选1-2个适宜平台，集中资源发力并取得成绩后再拓展其他渠道。通过理论分析与案例研究，探讨该策略的有效性和可行性，为企业渠道布局提供参考。关键词：渠道选择；开源AI智能名片；链动2+1模式；S2B2
小林渗透入门：burpsuite+proxifier抓取小程序流量 ξ流ぁ星ぷ132 小程序 web安全安全性测试网络安全安全
目录前提：代理：proxifier：步骤：bp证书安装bp设置代理端口：proxifier设置规则：proxifier应用规则：结果：前提：在介绍这两个工具具体实现方法之前，有个很重要的技术必须要大概了解才行---代理。代理：个人觉得代理，简而言之，就是在你和服务器中间的一个中间人，来转达信息。那为什么要代理呢，因为这里的burpsuite要抓包，burpsuite只有做为中间代理人才可以进行拦截
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
个人日记本小程序开发方案（使用IntelliJ IDEA） HH予嵌入式驱动工程项目开发 intellij-idea java ide
个人日记本小程序开发方案（使用IntelliJIDEA）一、项目创建与环境配置1.新建项目打开IDEA→NewProject→JavaFX选择JDK11+版本添加必要依赖：<groupId
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
Python爬虫实战：使用最新技术爬取新华网新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言在当今信息爆炸的时代，网络爬虫技术已经成为获取互联网数据的重要手段。作为国内权威新闻媒体，新华网每天发布大量高质量的新闻内容，这些数据对于舆情分析、市场研究、自然语言处理等领域具有重要价值。本文将详细介绍如何使用Python最新技术构建一个高效、稳定的新华网新闻爬虫系统。二、爬虫技术选型2.1技术栈选择在构建新华网爬虫时，我们选择了以下技术栈：请求库：httpx（支持HTTP/2，异步请求
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
微信小程序开发：从漫画阅读到商业变现永远的12
本文还有配套的精品资源，点击获取简介：微信小程序作为一种轻量级应用平台，在无需下载安装的情况下提供便捷服务，尤其在漫画阅读领域得到广泛应用。本文介绍了微信小程序的基础开发框架，包括WXML、WXSS和JavaScript的使用，以及漫画小程序的核心功能设计，如漫画分类、搜索、详情展示、阅读模式等。同时，探讨了在小程序中加入广告ID以实现商业变现，包括广告组件的集成和广告政策的遵守。最后，强调了漫画
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
蓝领招聘爆发前夜：招工小程序如何抢占万亿级市场？
中国蓝领人群超4亿，但招聘线上化率不足30%！垂直领域招聘小程序正迎来三大机遇：1.市场规模与增长潜力数据：2023年蓝领招聘市场规模达8000亿元，年复合增长率超25%；痛点：传统中介收费高、信息不透明，企业“招工难”与求职者“就业难”并存；趋势：Z世代蓝领更倾向通过小程序“一键求职”，避免线下奔波。2.细分场景机会制造业：对接工厂“日结工”“临时工”需求，提供“当日面试、次日上岗”服务；服务业
同城搭子交友小程序：千亿级社交市场的下一个风口？
传统婚恋网站式微，Z世代“轻社交”需求爆发！搭子经济正成为新蓝海：1.市场规模与增长潜力数据：2023年中国陌生人社交市场规模达1500亿元，年复合增长率超20%；趋势：搭子类小程序用户规模突破8000万，预计2025年将占社交市场30%份额。2.竞争格局与差异化机会头部平台：Soul、探探聚焦泛社交，搭子类小程序仍属蓝海；细分场景：运动、美食、游戏等垂直领域搭子需求未被充分满足；下沉市场：三四线
短剧小程序开发全攻略：从0到1打造爆款内容平台 weixin_lynhgworld 小程序短剧
核心内容：行业趋势分析：短剧市场年增长率超300%，用户规模突破5亿，抖音、快手等平台加速布局。小程序成为短剧分发核心渠道：轻量化、低成本、社交裂变优势显著。开发核心功能模块：内容管理：支持多格式上传、分集管理、标签分类。播放体验优化：弹幕互动、倍速播放、清晰度切换、离线缓存。付费系统：单集付费、会员订阅、广告解锁等多元化盈利模式。社交裂变：分享奖励、邀请排行榜、拼团观影功能。技术实现难点：视频流
uniapp小程序无感刷新token 一只一只妖 uni-app 小程序前端
request.js//request.jsimport{getApptoken,getStoredApptoken}from'./tokenRequest'//从合并模块导入//全局配置constMAX_RETRIES=1//最大重试次数constbaseURL='https://your-api.com'//请求队列和刷新状态letrequestsQueue=[]letisRefreshing
小程序主体变更全攻略：流程、资料与异常处理方案今日热点小程序微信开放平台企业微信微信经验分享微信公众平台
一、什么是小程序主体变更？小程序主体变更是微信公众平台提供的账号迁移功能，允许开发者将小程序的运营权限、主体信息、业务数据从原账号转移至其他开发者账号。适用于企业重组、业务转让、账号交接等场景，变更后原账号主体将失去小程序控制权。二、主体变更必备资料清单材料类型具体要求主体资质文件原/目标主体营业执照照片（加盖公章，清晰露出四角及年检章）法人身份证明双方法人身份证正反面照片（有效期内，人像清晰无遮
微信小程序控制空调之EMQX服务器安装与配置今天长脑子了吗服务器运维 ESP32 小程序
目录前言一、EMQX服务器安装与配置1.Windows系统安装（推荐Docker方式）二、MQTTX客户端安装与使用1.下载安装2.连接EMQX服务器三、客户端与服务器通信测试1：MQTTX自收发测试四、安全加固建议（生产环境必做）修改默认密码启用TLS加密IP访问限制常见问题排查总结前言以下是EMQX服务器安装配置、MQTTX客户端使用及通信测试的完整教程，主要Windows平台实现，并附客户端
原生微信小程序研发，如何对图片进行统一管理？清颖~ 前端小程序微信小程序小程序
目标：统一在配置文件中管理图片，用变量存储，换图标时只需修改链接即可，无需更改业务代码，且方便查找。tips:不建议在asset中存储大量图片，原因是官方要求小程序内存要限制在2M以内，图片放多了占资源，会扩大包体积。若仅放几个代表性小图标则影响不大。1.创建config/img文件，放置图片链接，方便统一管理管理图片的cdn链接(或其他链接，只要能加载出图片即可)//config/image.j
微信小程序--事件绑定饭饭FF 微信小程序小程序
1.事件绑定方式方式一：bind:事件名例如方式二：bind事件名例如2.事件常用类型微信小程序中有许多的事件类型，常用的包括以下几种：1.bindtap:点击事件，当用户点击该元素时触发2.bindlongtap：长按事件，当用户长按该元素时触发3.bindinput：输入事件，当用户输入内容时触发4.bindscrolltolower：滚动到底部时间，当列表滚动到底部时触发5.bindchan
微信开放平台中 `UnionID` 和 `OpenID`使用区别对比慧一居士架构总结架构系统架构
在微信开放平台中，UnionID和OpenID是用于标识用户身份的关键字段，但二者使用场景和作用范围有本质区别。以下是详细对比：核心区别字段OpenIDUnionID作用范围单应用内唯一（如一个小程序或公众号）跨同一开放平台下所有应用唯一用途识别同一用户在同一应用内的身份识别同一用户在不同应用（同主体）中的身份获取条件用户访问应用即可获得需满足以下条件：1.应用绑定到同一开放平台2.用户已关注/使
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
Maven 构建性能优化深度剖析：原理、策略与实践越重天 Java Maven实战 maven 性能优化 java
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
【kafka】在Linux系统中部署配置Kafka的详细用法教程分享景天科技苑 linux基础与进阶 shell脚本编写实战 kafka linux 分布式 kafka安装配置 kafka优化
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面应用开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，云原生K8S，Prometheus监控，数据分析，Django
bert中 [CLS] 和 [SEP] 表示什么意思？
[CLS]和[SEP]是BERT中的两个特殊标记符号，在BERT的输入文本中起到特殊的作用。[CLS]是"classification"的缩写，在文本分类任务中，它通常表示句子或文档的开头。在BERT中，[CLS]对应着输入文本中第一个词的词向量，输出层中的第一个神经元通常会被用来预测文本的类别。[SEP]是"separator"的缩写，它通常表示句子或文档的结尾。在BERT中，[SEP]对应着输
uni-app跨平台开发：高效构建多端应用 2301_81335708 uni-app
引言：开发者之痛-多端开发的十字路口你是否曾为这些难题彻夜难眠？同一业务需维护iOS、Android、Web三套代码小程序平台各异（微信/支付宝/字节跳动），API差异令人抓狂团队技能栈分散，ReactNative、Flutter、原生开发各自为战产品迭代缓慢，50%时间消耗在跨平台适配uni-app：破局者登场由DCloud推出的uni-app基于Vue.js生态，用一套代码同步生成：iOS/A
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他