桃汽宝

hugging-face Transformer tokenization_bert.py

tokenization bert.py

函数
- load_vocab
- whitespace_tokenize
类
- BasicTokenizer类(继承自Object)
- - _tokenize_chinese_chars函数
  - _is_chinese_char函数
  - _run_strip_accents函数
  - _is_punctuation函数
  - _run_split_on_punc函数
  - _is_control函数
  - _is_whitespace函数
  - _clean_text函数
  - tokenize函数
- WordpieceTokenizer类(继承自object)
- - tokenize函数
- BertTokenizer类(继承自PreTrainedTokenizer)
- - 初始化
  - vocab_size函数
  - get_vocab函数
  - _tokenize函数
  - _convert_token_to_id函数
  - _convert_id_to_token函数
  - convert_tokens_to_string函数
  - build_inputs_with_special_tokens函数
  - get_special_tokens_mask函数
  - create_token_type_ids_from_sequences函数
  - save_vocabulary函数

函数

load_vocab

把词汇表加载为一个有序字典

def load_vocab(vocab_file):
    """Loads a vocabulary file into a dictionary."""
    """把词汇表加载为一个有序字典"""
    vocab = collections.OrderedDict()   # 有序字典
    with open(vocab_file, "r", encoding="utf-8") as reader:	# vocab_file是一个txt文件一个单词一行
        tokens = reader.readlines()     # 依次读取每行
    for index, token in enumerate(tokens):      # index：行号，从0开始
        token = token.rstrip("\n")      # rstrip：删除字符串末尾的指定字符
        vocab[token] = index        # token：键；index：值。 
       						 # eg. OrderedDict([('d1={}', 0), ("d1['a']='A'", 1), ("d1['c']='C'", 2)])
    return vocab		# vocab：有序字典

whitespace_tokenize

在一段文本上，删除空格并拆分

def whitespace_tokenize(text):
    """Runs basic whitespace cleaning and splitting on a piece of text."""
    """在一段文本上，删除空格并拆分"""
    text = text.strip()     # strip：删除字符串首尾的指定字符
    if not text:		# text没有内容就返回空列表
        return []
    tokens = text.split()       # split()函数按照空格进行分割，并返回分割后的字符串列表。
    return tokens       # tokens：列表

类

BasicTokenizer类(继承自Object)

基本的分词（标点符号拆分、小写）
参数：
do_lower_case :bool, optional, 默认为True 当分词时是否对输入小写。
never_split ：Iterable, 字符串的列表, optional. 分词期间不被切分的tokens的集合，只有当do_basic_tokenize=True的时候才有效。
tokenize_chinese_chars ：bool, optional, 默认为True. 是否对中文字符进行分词。
strip_accents：bool, optional. 用于去除变音符号。

附加符号或称变音符号（accents），是指添加在字母上面的符号，以更改字母的发音或者以区分拼写相似词语。例如汉语拼音字母“ü”上面的两个小点，或“á”、“à”字母上面的标调符。

_tokenize_chinese_chars函数

在任何中日韩字符前后添加空格

    def _tokenize_chinese_chars(self, text):
        """Adds whitespace around any CJK character."""
        # 在任何中日韩字符前后添加空格
        output = []
        for char in text:
            cp = ord(char)      # ord()以一个字符（长度为1的字符串）作为参数，返回对应的 ASCII 数值，或者 Unicode 数值
            if self._is_chinese_char(cp):
                output.append(" ")
                output.append(char)
                output.append(" ")
            else:
                output.append(char)
        return "".join(output)      # join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。

ord()以一个字符（长度为1的字符串）作为参数，返回对应的 ASCII 数值，或者 Unicode 数值

join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。

_is_chinese_char函数

用于判断是否是中日韩字符

Unicode 是一个符号集，它只规定了符号的二进制代码，却没有规定这个二进制代码应该如何存储。
https://home.unicode.org
中日韩汉字编码表：http://www.chi2ko.com/tool/CJK.html

UTF-8 就是在互联网上使用最广的一种 Unicode 的实现方式。
UTF-8 的编码规则很简单，只有二条：
1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的 Unicode 码。因此对于英语字母，UTF-8 编码和 ASCII码是相同的。
2）对于n字节的符号（n > 1），第一个字节的前n位都设为1，第n +1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的 Unicode 码。

转载自：http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

_run_strip_accents函数

在一段文本中去除变音符号

       def _run_strip_accents(self, text):
        """Strips accents from a piece of text."""
        # 在一段文本中去除变音符号
        # 先将文本标准化；进入循环，判断文本中字符的类型（如果是变音符号则跳过当前循环，否则将字符加入到空列表中）；返回拼接后的字符串
        text = unicodedata.normalize("NFD", text)       # unicodedata.normalize：对Unicode文本进行标准化。
        output = []
        for char in text:
            cat = unicodedata.category(char)        # unicodedata.category：返回一个字符在UNICODE里分类的类型
                                # Category一共分为 Letter, Mark, Number, Punctuation, Symbol, Seperator, Other 七大类
            if cat == "Mn":     # Mark Nonspacing 应该是变音符号
                continue
            output.append(char)
        return "".join(output)

unicodedata.normalize(form, unistr)
把一串UNICODE字符串转换为普通格式的字符串，具体格式支持NFC、NFKC、NFD和NFKD格式。
Normalization Form D (NFD)，Normalization Form KD (NFKD)，Normalization Form C (NFC)，和Normalization Form KC (NFKC)。
大约来说，NFD和NFKD将可能的字符进行分解，而NFC和NFKC将可能的字符进行组合。

unicodedata.category(chr)
返回一个字符在UNICODE里分类的类型。
查看unicode的相关属性 https://www.compart.com/en/unicode/category

_is_punctuation函数

def _is_punctuation(char):
    """Checks whether `char` is a punctuation character."""
    # 检查字符'char'是不是一个标点符号
    cp = ord(char)
    # We treat all non-letter/number ASCII as punctuation.
    # 将所有非字母/数字的ASCII视为标点
    # Characters such as "^", "$", and "`" are not in the Unicode
    # Punctuation class but we treat them as punctuation anyways, for
    # consistency.
    # "^", "$", 和 "`"不在标点的类别中，但是为了保持一致性将它们看作为标点
    # 判断ASCII
    if (cp >= 33 and cp <= 47) or (cp >= 58 and cp <= 64) or (cp >= 91 and cp <= 96) or (cp >= 123 and cp <= 126):
        return True
    # 判断unicode类别
    cat = unicodedata.category(char)
    if cat.startswith("P"):     # 如果以P开头
        return True
    return False

_run_split_on_punc函数

以标点符号来切分句子，返回列表。

    def _run_split_on_punc(self, text, never_split=None):
        """Splits punctuation on a piece of text."""
        # 以标点符号来切分句子，返回列表
        # 先判断此段文本能否分割；如果可以，则：（1）
        if never_split is not None and text in never_split:
            return [text]                   # text = "我是一个粉刷匠，粉刷本领强"
        chars = list(text)             # ['我', '是', '一', '个', '粉', '刷', '匠', '，', '粉', '刷', '本', '领', '强']
        i = 0
        start_new_word = True
        output = []
        while i < len(chars):
            char = chars[i]
            if _is_punctuation(char):
                output.append([char])       # 列表嵌套列表
                                            # [['我'], ['是'], ['一'], ['个'], ['粉'], ['刷'], ['匠']]
                                            # "".join的时候[子列表，子列表，……]
                start_new_word = True
            else:
                if start_new_word:
                    output.append([])       # 传入空列表
                start_new_word = False
                output[-1].append(char)     # 令output = [['我']]
                                  # [['我', '我', '是', '一', '个', '粉', '刷', '匠'],['粉', '刷', '本', '领', '强']]
                                            #  "".join的时候[子列表，子列表，……]，子列表中的字符直接拼接
            i += 1

        return ["".join(x) for x in output]     # if为True的输出：['我', '是', '一', '个', '粉', '刷', '匠']
                                                # False的输出：['我我是一个粉刷匠', '粉刷本领强']

jupyter尝试：

_is_control函数

判断’char’是否是一个控制字符

def _is_control(char):
    """Checks whether `char` is a control character."""
    # 判断'char'是否是一个控制字符
    # These are technically control characters but we count them as whitespace
    # characters.从技术上讲，它们是控制字符，但我们将其视为空格字符。
    # \t水平制表(HT) （跳到下一个TAB位置）
    # \r回车(CR) ，将当前位置移到本行开头
    # \n换行(LF) ，将当前位置移到下一行开头        https://baike.baidu.com/item/转义字符#2
    if char == "\t" or char == "\n" or char == "\r":
        return False
    cat = unicodedata.category(char)
    if cat.startswith("C"):
        return True
    return False

_is_whitespace函数

判断char是否是一个空格

def _is_whitespace(char):
    """Checks whether `char` is a whitespace character."""
    # 判断`char`是否是一个空格
    # \t, \n, and \r are technically contorl characters but we treat them
    # as whitespace since they are generally considered as such.
    # 从技术上讲，\t, \n,  \r是控制字符，但我们将其视为空格字符。
    if char == " " or char == "\t" or char == "\n" or char == "\r":
        return True
    cat = unicodedata.category(char)
    if cat == "Zs": # Zs separator,space
        return True
    return False

_clean_text函数

删除无效字符，清除空格

    def _clean_text(self, text):
        """Performs invalid character removal and whitespace cleanup on text."""
        # 删除无效字符，清除空格
        output = []
        for char in text:
            cp = ord(char)
            if cp == 0 or cp == 0xFFFD or _is_control(char):
                continue
            if _is_whitespace(char):
                output.append(" ")
            else:
                output.append(char)
        return "".join(output)

tokenize函数

私有变量：小写和一个前导下划线

_private_value

python中不存在私有变量一说，若是遇到需要保护的变量，使用小写和一个前导下划线。
但这只是程序员之间的一个约定，用于警告说明这是一个私有变量，外部类不要去访问它。
但实际上，外部类还是可以访问到这个变量。

    def tokenize(self, text, never_split=None):
        """Basic Tokenization of a piece of text.
            Split on "white spaces" only, for sub-word tokenization, see WordPieceTokenizer.
        对一段文本的基本分词。仅在空格的地方进行分词，对于子词的话参阅WordPieceTokenizer

        Args:
            **never_split**: (`optional`) list of str
                Kept for backward compatibility purposes.保持向后兼容目的
                Now implemented directly at the base class level (see :func:`PreTrainedTokenizer.tokenize`)
                List of token not to split.     不进行split的token列表
        """
        # union() returns a new set by concatenating the two sets.
        # union() 方法返回两个集合的并集，即包含了所有集合的元素，重复的元素只会出现一次。
        never_split = self.never_split.union(set(never_split)) if never_split else self.never_split

        # This was added on November 1st, 2018 for the multilingual and Chinese
        # models. This is also applied to the English models now, but it doesn't
        # matter since the English models were not trained on any Chinese data
        # and generally don't have any Chinese data in them (there are Chinese
        # characters in the vocabulary because Wikipedia does have some Chinese
        # words in the English Wikipedia.).
        if self.tokenize_chinese_chars:
            text = self._tokenize_chinese_chars(text)
        orig_tokens = whitespace_tokenize(text)
        split_tokens = []
        for token in orig_tokens:
            if token not in never_split:
                if self.do_lower_case:
                    token = token.lower()
                    if self.strip_accents is not False:
                        token = self._run_strip_accents(token)
                elif self.strip_accents:
                    token = self._run_strip_accents(token)
            split_tokens.extend(self._run_split_on_punc(token, never_split))
            # extend() 函数用于在列表末尾一次性追加另一个序列中的多个值（用新列表扩展原来的列表）。

        output_tokens = whitespace_tokenize(" ".join(split_tokens))
        return output_tokens

extend() 函数用于在列表末尾一次性追加另一个序列中的多个值（用新列表扩展原来的列表）。

union() 方法返回两个集合的并集，即包含了所有集合的元素，重复的元素只会出现一次。

控制字符是出现于特定的信息文本中，表示某一控制功能的字符。

WordpieceTokenizer类(继承自object)

WordpieceTokenizer是将BasicTokenizer的结果进一步做更细粒度的切分。做这一步的目的主要是为了去除未登录词对模型效果的影响。这一过程对中文没有影响，因为在前面BasicTokenizer里面已经切分成以字为单位的了。

class WordpieceTokenizer(object):
    """Runs WordPiece tokenization."""
    # 把word拆成piece一片一片。
    # WordPiece的一种主要的实现方式叫做BPE（Byte-Pair Encoding）双字节编码
    # WordpieceTokenizer是将BasicTokenizer的结果进一步做更细粒度的切分。
    # 做这一步的目的主要是为了去除未登录词对模型效果的影响。
    # 这一过程对中文没有影响，因为在前面BasicTokenizer里面已经切分成以字为单位的了。

    def __init__(self, vocab, unk_token, max_input_chars_per_word=100):
        self.vocab = vocab
        self.unk_token = unk_token
        self.max_input_chars_per_word = max_input_chars_per_word    # 每个单词最多的输入字符

tokenize函数

    def tokenize(self, text):
        """Tokenizes a piece of text into its word pieces.
        # 将一段文本标记为词片段形式

        This uses a greedy longest-match-first algorithm to perform tokenization
        using the given vocabulary. 贪心的最大正向匹配算法

        For example:
          input = "unaffable"
          output = ["un", "##aff", "##able"]

        Args:
          text: A single token or whitespace separated tokens. This should have
            already been passed through `BasicTokenizer`.
          text：BasicTokenizer的输出，即单个的token或空格分隔的标记

        Returns:
          A list of wordpiece tokens.
          返回词片段tokens
        """

        output_tokens = []
        for token in whitespace_tokenize(text):
            chars = list(token)     # token = 'xdcfvgbhjkn';
                                    # chars = ['x', 'd', 'c', 'f', 'v', 'g', 'b', 'h', 'j', 'k', 'n']
            if len(chars) > self.max_input_chars_per_word:  # 如果单词的字符长度大于阈值，这个单词本身就不要了，替换为unk_token
                output_tokens.append(self.unk_token)        # output_tokens列表中加入unk_token
                continue

            is_bad = False      # 是否是坏词
            start = 0
            sub_tokens = []     # 切分后的词片段
            while start < len(chars):     # 不满足循环的条件就跳到下一段代码
                end = len(chars)
                cur_substr = None
                while start < end:
                    substr = "".join(chars[start:end])
                    if start > 0:
                        substr = "##" + substr      # 表示这个词是接着前面的，这样使得WordPiece切分是可逆的（可以恢复出“真正”的词）
                    if substr in self.vocab:        
                        cur_substr = substr
                        break
                    end -= 1
                if cur_substr is None:
                    # 上面循环直到结束都没有找到在给定词表中的词片段，则认为是坏词
                    is_bad = True
                    break
                sub_tokens.append(cur_substr)
                start = end

            if is_bad:
                output_tokens.append(self.unk_token)
            else:
                output_tokens.extend(sub_tokens)
        return output_tokens

BertTokenizer类(继承自PreTrainedTokenizer)

基于WordPiece

参数：
vocab_files: str. 包括词汇表的文件。
do_lower_case : bool,optional：默认为True. 在分词的时候输入是否小写。
do_basic_tokenize ：bool, optional，默认为True. 是否在wordpiece之前做基本的分词。
never_split ：Iterable, 字符串的列表, optional. 分词期间不被切分的tokens的集合，只有当do_basic_tokenize=True的时候才有效。
unk_token ：str, optional, 默认为"[UNK]". 词汇表当中没有的未知的token，不能被转化为一个ID，会被设置为unk_token的ID。
sep_token：str, optional, 默认为"[SEP]". 分隔器token，在由多个序列去构建一个序列的时候会使用它；也会被用作一个特殊标记构建的序列的最后一个token。
pad_token ：str, optional, 默认为"[PAD]". 用于padding，当进行序列长度不一致的批处理的时候会用到。
cls_token ：str, optional, 默认为"[CLS]". 序列分类的时候被使用作为分类器token。当序列由特殊tokens构建而成的时候，会作为第一个token。
mask_token ：str, optional, 默认为"[MASK]". 用于对值进行掩盖，在训练MLM的时候会被使用。模型会尝试去预测这个token。
tokenize_chinese_chars ：bool, optional, 默认为True. 是否对中文字符进行分词。
strip_accents：bool, optional. 用于去除变音符号。

初始化

self.ids_to_tokens = collections.OrderedDict([(ids, tok) for tok, ids in self.vocab.items()])
                                                # 由词汇表构造一个有序字典，id-tokens

vocab_size函数

    def vocab_size(self):       # 返回词汇表的大小
        return len(self.vocab)

get_vocab函数

    def get_vocab(self):
        # dict() 函数用于创建一个字典
        return dict(self.vocab, **self.added_tokens_encoder)        
        # self.added_tokens_encoder是一个字典 Dict[str, int]

_tokenize函数

    def _tokenize(self, text):
        split_tokens = []
        # 判断是否做基础分词。
        # T：基础分词+wordpiece；F：wordpiece
        if self.do_basic_tokenize:
            for token in self.basic_tokenizer.tokenize(text, never_split=self.all_special_tokens):  # 所有特殊的token不被分割

                # If the token is part of the never_split set
                # 判断是否在never_split列表中。
                if token in self.basic_tokenizer.never_split:
                    split_tokens.append(token)
                else:
                    split_tokens += self.wordpiece_tokenizer.tokenize(token)
        else:
            split_tokens = self.wordpiece_tokenizer.tokenize(text)
        return split_tokens     # 返回（基础分词）+ wordpiece分词后的列表

_convert_token_to_id函数

    def _convert_token_to_id(self, token):
        """ Converts a token (str) in an id using the vocab. """
        # 通过词汇表将一个token（字符串）转换为一个ID
        return self.vocab.get(token, self.vocab.get(self.unk_token))

python dict.get(key, default=None)
key – 字典中要查找的键。
default – 如果指定的键不存在时，返回该默认值。
返回指定键的值，如果键不在字典中返回默认值 None 或者指定的默认值。

_convert_id_to_token函数

    def _convert_id_to_token(self, index):
        """Converts an index (integer) in a token (str) using the vocab."""
        # 通过词汇表将一个整数的索引值转化为一个token（字符串）
        return self.ids_to_tokens.get(index, self.unk_token)

convert_tokens_to_string函数

    def convert_tokens_to_string(self, tokens):
        """ Converts a sequence of tokens (string) in a single string. """
        # 将多个字符串合成一个单一的字符串
        # wordpiece后的结果：un,##aff,##able   ->  un ##aff ##able    ->  unaffable
        out_string = " ".join(tokens).replace(" ##", "").strip()        # strip()去除头尾的空格
        return out_string

build_inputs_with_special_tokens函数

    def build_inputs_with_special_tokens(
        self, token_ids_0: List[int], token_ids_1: Optional[List[int]] = None
    ) -> List[int]:
        """
        为模型构建输入，从一个序列或一对序列，对于序列分类任务，通过concat和add特殊字符
        Build model inputs from a sequence or a pair of sequence for sequence classification tasks
        by concatenating and adding special tokens.
        A BERT sequence has the following format:

        - single sequence: ``[CLS] X [SEP]``
        - pair of sequences: ``[CLS] A [SEP] B [SEP]``

        Args:
            token_ids_0 (:obj:`List[int]`):
                List of IDs to which the special tokens will be added.
                特殊token将被加入到的ID列表
            token_ids_1 (:obj:`List[int]`, `optional`):
                Optional second list of IDs for sequence pairs.

        Returns:
            :obj:`List[int]`: List of `input IDs <../glossary.html#input-ids>`__ with the appropriate special tokens.
        """
        if token_ids_1 is None:
            return [self.cls_token_id] + token_ids_0 + [self.sep_token_id]      # [CLS] X [SEP]
        cls = [self.cls_token_id]
        sep = [self.sep_token_id]
        return cls + token_ids_0 + sep + token_ids_1 + sep      # [CLS] A [SEP] B [SEP]

get_special_tokens_mask函数

    def get_special_tokens_mask(
        self, token_ids_0: List[int], token_ids_1: Optional[List[int]] = None, already_has_special_tokens: bool = False
    ) -> List[int]:
        """
        Retrieve sequence ids from a token list that has no special tokens added. This method is called when adding
        special tokens using the tokenizer ``prepare_for_model`` method.
        从一个没有特殊token添加的列表 恢复出来 序列的ID

        Args:
            token_ids_0 (:obj:`List[int]`):
                List of IDs.IDs的列表
            token_ids_1 (:obj:`List[int]`, `optional`):
                Optional second list of IDs for sequence pairs.
                序列对IDs的列表
            already_has_special_tokens (:obj:`bool`, `optional`, defaults to :obj:`False`):
                Whether or not the token list is already formatted with special tokens for the model.
                token列表是否已经用特殊token格式化

        Returns:
            :obj:`List[int]`: A list of integers in the range [0, 1]: 1 for a special token, 0 for a sequence token.
            返回一个整数构成的列表，1代表特殊token，0代表序列token
        """

        if already_has_special_tokens:  # 有特殊的token
            if token_ids_1 is not None: # 有第二个列表
                raise ValueError(
                    "You should not supply a second sequence if the provided sequence of "
                    "ids is already formated with special tokens for the model."
                )
            # 当是sep和cls的时候为1，其他为0
            # lamda冒号左边的x是token_ids_0中的每个元素，冒号右边是当前x的返回值
            return list(map(lambda x: 1 if x in [self.sep_token_id, self.cls_token_id] else 0, token_ids_0))

        if token_ids_1 is not None: # 没有特殊的token，有第二个列表
            # cls + 第一个列表的长度 + sep + 第二个列表的长度 + sep
            return [1] + ([0] * len(token_ids_0)) + [1] + ([0] * len(token_ids_1)) + [1]
        # cls + 第一个列表的长度 + sep
        return [1] + ([0] * len(token_ids_0)) + [1]         # 没有特殊的token，没有第二个列表

create_token_type_ids_from_sequences函数

    def create_token_type_ids_from_sequences(
        self, token_ids_0: List[int], token_ids_1: Optional[List[int]] = None
    ) -> List[int]:
        """
        Create a mask from the two sequences passed to be used in a sequence-pair classification task.
        # 从传递给序列对分类任务的两个序列中创建一个mask。
        A BERT sequence pair mask has the following format:

        ::

            0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1
            | first sequence    | second sequence |

        If :obj:`token_ids_1` is :obj:`None`, this method only returns the first portion of the mask (0s).
        如果只有一个序列，则只返回0的那部分。

        Args:
            token_ids_0 (:obj:`List[int]`):
                List of IDs.
            token_ids_1 (:obj:`List[int]`, `optional`):
                Optional second list of IDs for sequence pairs.

        Returns:
            :obj:`List[int]`: List of `token type IDs <../glossary.html#token-type-ids>`_ according to the given
            sequence(s).
        """
        sep = [self.sep_token_id]
        cls = [self.cls_token_id]
        if token_ids_1 is None:
            return len(cls + token_ids_0 + sep) * [0]
        # 返回只有0和1的列表。0表示第一个序列；1表示第二个序列。
        return len(cls + token_ids_0 + sep) * [0] + len(token_ids_1 + sep) * [1]

save_vocabulary函数

    def save_vocabulary(self, vocab_path):
        """
        Save the vocabulary (copy original file) and special tokens file to a directory目录.
        保存词汇表和特殊token文件到一个目录。

        Args:
            vocab_path (:obj:`str`):
                The directory in which to save the vocabulary.
                保存词汇表的目录

        Returns:
            :obj:`Tuple(str)`: Paths to the files saved.文件被存储的路径
        """
        index = 0
        if os.path.isdir(vocab_path):       # os.path.isdir：判断是不是路径
            vocab_file = os.path.join(vocab_path, VOCAB_FILES_NAMES["vocab_file"])
        else:
            vocab_file = vocab_path
        with open(vocab_file, "w", encoding="utf-8") as writer:
            # self.vocab：OrderedDict([('d1={}', 0), ("d1['a']='A'", 1)]）
            # sorted函数中，key主要是用来进行比较的元素
            # 当列表较为复杂时，以列表中的 每个元素的 第二个数据进行排序，即以token_index来排序。
            for token, token_index in sorted(self.vocab.items(), key=lambda kv: kv[1]):
                if index != token_index:
                    # logger.warning：某些没有预料到的事件的提示，或者在将来可能会出现的问题提示。例如：磁盘空间不足。但是软件还是会照常运行。
                    logger.warning(
                        "Saving vocabulary to {}: vocabulary indices are not consecutive."
                        " Please check that the vocabulary is not corrupted破坏!".format(vocab_file)
                    )
                    index = token_index
                writer.write(token + "\n")
                index += 1
        return (vocab_file,)

你可能感兴趣的:(MRC)

CPU架构 -- ARMv7与ARMv8协处理器比较 sz66cm 架构 cpu arm
ARMv7和ARMv8的协处理器比较相同点功能扩展：两个架构中的协处理器都用于扩展处理器的功能，包括但不限于浮点运算、SIMD（SingleInstructionMultipleData）运算、系统控制寄存器访问等。协处理器接口指令：ARMv7和ARMv8（AArch32状态下）都使用MCR（MovetoCoprocessorfromARMRegister）和MRC（MovetoARMRegist
iOS blocks - 三個會造成retain cycle的anti patterns backapace block retain cycle iOS iOS block retain cycle
在iOS4.0推出了Blocks這個語言特性後到現在iOS都已經出到5.0了所以我想Blocks應該可以被廣泛應用了但現在iOS環境是從MRC(ManualReferenceCounting)走到ARC(AutomaticReferenceCounting)在ReferenceCounting的環境中Runtime是無法自動解除Retaincycle的而Blocks有很多隱性的retain的動作很
38字以上的标题：OTFS仿真 MIMO-OTFS MP检测算法：详细注释、ZF均衡、低复杂度LU分解和误差纠正MMSE均衡检测：OMP及基本信道估计、MRC检测，结合索引调制IM、空间调制SM、正交 PGCUZcQeR 网络 matlab 人工智能
OTFS仿真MIMO-OTFSMP检测算法（详细注释），ZF均衡，低复杂度lu分解和误差纠正mmse均衡检测omp及基本信道估计，MRC检测，结合索引调制IM，空间调制SM，正交空间调制，SM-OFDM，多天线MIMO，AF，DF中继，理想脉冲/矩形脉冲，TDTF域DD域信道以及最新OTSM调制OFDM和OTFS性能对比。代码均可出，均可正常运行。适合本科B设及研究生学习。ID:971873550
c语言atomic能用数组的,属性关键字非著名程序~~~ c语言atomic能用数组的
一.属性关键字的分类？读写权限：readonly、readwrite(默认)原子相关：atomic(默认)、nonatomic(常用)aomic：可以保证赋值和获取是线程安全的。指的是成员属性直接的获取和赋值，不包括操作和访问。eg：用atomic修饰数组，获取和赋值保证线程安全，添加、移除对象，是不保证线程安全的。引用计数retain(mrc)、strong(arc)：修饰对象assign(修饰
【Xcode】Xcode基本使用指引 ADi_hhh iOS xcode macos ide
文章目录Xcode安装及iphone模拟器的安装Xcode中Debug和Release的切换Xcode中控件的使用Xcode工程的基本组成XcodeUI基本设计及使用iOS开发项目中的日志系统静态库支持多种架构制作xcframeworklibuv库Xcode路径.pbxproj文件苹果平台的宏Leaks检测内存泄漏OC中的ARC和MRC小结Xcode安装及iphone模拟器的安装参考文章：Xcod
【openwrt-21.02】T750+MT7916 WiFi驱动iwpriv指令结构体及dat文件读取函数 wellnw WiFi Driver WiFi
MT7916MT7916是一款先进的Wi-Fi6/6E无线网卡（NIC）解决方案，具备双频双发功能，网络速率可达3Gbps。MT7916同时支持3x3与2个空间串流（用于5/6GHz频段，带宽可达160MHz），以及2x2与2个空间串流（用于2.4GHz频段，带宽可达40MHz）。MT7916额外的第三根天线可用于零等待动态频率选择（DFS）和/或最大比合并（MRC），最高支持1024-QAM调制
基础的OC lfp901020
基础篇Objective-C的类可以多重继承么?可以采用多个协议么?不可以多重继承,可以采用多个协议.objc使用什么机制管理对象内存？MRC手动引用计数ARC自动引用计数,现在通常使用自动引用计数import跟#include又什么区别，@class呢,＃import用来包含系统的头文件，#import””用来包含用户头文件。描述一下iOSSDK中如何实现MVC的开发模式MVC是模型、试图、控制
Swift--内存管理优雅的步伐
Swift内存管理概述强引用循环打破强引用循环闭包中的强引用循环Swift内存管理概述Swift中的ARC内存管理是对引用类型的管理，即对类所创建的对象采用ARC管理。而对于值类型，如整型、浮点型、布尔型、字符串、元组、集合、枚举和结构体等，是由处理器自动管理的，程序员不需要管理它们的内存。ARC内存管理和值类型内存管理有一定的区别。虽然两者都不需要程序员管理，但本质上是有区别的，ARC和MRC一
AutoreleasePool探究飞奔的小鲨鱼
虽然现在已经是arc的时代了，不用我们自己管理对象的释放问题，但在面试的过程中难免会被问到这方面的问题，另一方了解AutoreleasePool的实现原理也会使我们对内存管理这方面有更加清晰的认识。再看这篇文章之前，先回到我们的题目中来，假如你现在正在面试，面试官问你，说说你对AutoreleasePool的了解。。。AutoreleasePool就是我们常说的自动释放池，在mrc的时候采用引用计
iOS ARC项目支持非ARC文件 00after
在xcode中，设置ARC与MRC的地方：选中Target，在ObjectiveClanguage地方，将ARC设为YES或NO。这是一个总开关。如有特别的文件，可以单独加上开关。851988-99a8963a9509ab52.png如何在未使用arc的工程中引入一个使用了arc特性的文件:选中工程->TARGETS->相应的target然后选中右侧的“BuildPhases”，向下就找到“Com
612，MRC的引用计数(面试点：一,1、创建一个对象，则对象的引用计数为1 2、一次retain操作，引用计数+1 3、一次release操作，引用计数-1 二，默认情况下，Xcode是不会管... 枫叶1234
前言iOS5.0开始，Apple有了ARC（AutoReferenceCounting），ARC不同于MRC（ManualReferenceCounting），它使得大部分类和自定义类不需要手动进行内存管理，它会在适当的时候回收内存，就像栈内存一样。但是作为一个ios开发者，我们需要通过MRC下的内存管理学习，加强对底层的理解。今天这篇文章讲的是ios内存管理的知识--引用计数。堆和栈我们知道内存
iOS开发——MRC（手动内存管理） Yeppppppppp objective-c ios
iOS开发——MRC（手动内存管理）内存分配区域栈区堆区总结常量区总结代码区总结全局区关于如何查看一个对象在堆区/栈区需要知道的知识手动引用计数MRC四个法则非自己生成的对象，且该对象存在，但自己不持有deallocretainCount不要使用retainCount我们要想了解内存管理的知识前，必须先搞明白计算机的内存分配以及计算机是如何处理内存的。内存分配区域内存指的就是RAM（randoma
iOS——MRC和ARC实现原理浪极 ios objective-c xcode
Objective-C提供了两种内存管理机制MRC（MannulReferenceCounting）和ARC（AutomaticReferenceCounting），为Objective-C提供了内存的手动和自动管理。下面我们来探讨一下MRC和ARC的实现。OC的内存管理方式1.自己生成的对象，自己持有在iOS内存管理中，有四个这样的关键字：new、alloc、copy、mutableCopy，如
599，dealloc是如何执行的（面试点：一，weak属性为什么自动置为nil，二，对象的实例变量是如何释放的，三，对象的关联对象释放的时机是什么？明确结论：1、dealloc的调用是在最后一... 枫叶1234
前言：本文将主要解答以下三个问题：weak属性的为什么能自动置为nil、对象的实例变量是如何释放的、对象的关联对象释放的时机是什么？（这些答案的探究来源于其他同学的研究输出，本人只不过是站在前人的基础上，结合自身经验做一些加工输出）ARC下的变化：ARC下我们不需要再dealloc中主动调用[superdealloc],而且对象的实例变量会被释放掉。对于经历过MRC开发的同学，会明显的产生以下疑惑
让工程支持Carthage 流年易逝_李
1.创建工程2.添加代码3.配置工程1）公开文件2）mrc设置3）share配置4.初始化仓库，提交代码，tag1)gitinit2)gitadd.gitcommit-m'init'3)gittag'0.1.0'
iOS开发-单例（粒）模式的介绍和实战使用 iOS_ZZ
今天给同学们讲解一下单例模式在iOS开发中的使用以及单例模式的相关优缺点，那么废话不多说，直接上代码～单例模式介绍和使用场景为什么选择单例模式？实现单例模式思路分析（核心&掌握）通过@synchronized/dispatch_once实现单例（掌握）单例为什么不能通过继承来实现（掌握）通过宏定义来写一个MRC/ARC环境下的单例（掌握）单例模式的优缺点（掌握）单例模式误区（了解）单例模式单例模式
iOS 组件中设置文件支持MRC RollingPin MRC 组件支持组件化 cocoaPods -fno-objc-arc
1.设置该文件的CompilerFlags为-fno-objc-arc使用cocopods加载此组件时，在Pods下的BuildPhases中的CompileSources目录中找到想要设置的文件，把CompilerFlags填写为-fno-objc-arc2.通过podspec文件来设置通过1的方式可让项目在本地正常跑起来，但无法简单的把改动提交git仓库，可使用此方法，通过podspec来完成
胶质瘤化疗临床实验简介汇总不会生信哟
杀杀汇总胶质瘤化疗药相关的II-III期临床实验以及大致简介Temozolomide（TMZArandomizedphaseIIIIntergroupstudybyEORTC/NCIC-CTG/TROG/MRC-CTU(EORTC22033-26033)PMID：27686946III期临床试验，对比单独放疗/单独TMZ的高风险II级胶质瘤患者的生存情况（对IDH进行分类RadiationTher
这个周末玉思盈蝶
这个周末，哈哈，不说你们也知道，当然必须是宅过去了，一眨眼周末就没了，我表示很不舍。昨天我干嘛了？上午看了别人的博客，哈哈，周五小组新接了一个项目，看看别人的代码，不看还好，一看真的是。。。。。。14年的代码，你懂得，里面甚至MRC还在感觉其实不复杂，不难，重点是代码有点乱啊，一个文件一千行代码的那种，没办法啊，就算看不懂，我还是必须看，好歹马上需求就来了，你得完成不是。整个项目代码文件和代码都过
ATMEGA328P使用内部8MRC振荡器（PWM控制） (2015-08-09 23:05:49) 沧海一声笑的DIY宇宙
MWC飞控的油门等接收脚使用的是490Hz的PWM信号，用占空比来控制数值变化-个人感觉比较原始哈。arduio的analogWrite函数正好也是490Hz，所以MWC是用ardunio开发的么。我设计的蓝牙接收器使用了内置8MRC作为振荡器，所以analogWrite就不能直接使用了。为了减轻掉晶振的重量，导致一个本来不应该超过20行代码的程序，折腾了近1个月，我也是很拼的哈。从手册中找PWM
将事件抽取看作机器阅读理解（EMNLP2020） Ly大可爱 NLP事件抽取人工智能自然语言处理
1、写作动机：以前的事件抽取方法通常被建模为分类任务，这些任务需要大量数据，并且存在数据稀缺问题。2、用MRC解决事件抽取的优势：1）通过将EE作为MRC，我们可以利用MRC的最新进展(例如，BERT)来增强EE任务，这可能会极大地加强模型中的推理过程。2）我们可以直接利用丰富的MRC数据集来提高EE的性能，这可能会缓解数据稀缺问题(这被称为跨域数据增强)。第二个优势也为零样本EE打开了一扇门:对
iOS八股文——属性修饰（assign, retain, weak, strong, copy） trimaximus
ARC(AutomaticReferenceCounting)是苹果在iOS5开始引入的内存管理机制，到今年（2021年）系统已经发布到iOS15了，面试仍然会频繁地提问关于MRC(ManualReferenceCounting)的问题，即便新入行的同学们已经开始广泛地使用Swift，甚至于他们完全没接触过Objective-C，这玩意儿就是过不去了。assign&weak相同它们都可以用于修饰需
Crowd Counting近期研究(附代码资源) 追忆苔上雪 paper 深度学习机器学习人工智能人群计数 Crowd Counting 深度学习目标检测
1.Semi-SupervisedCrowdCountingwithContextualModeling:FacilitatingHolisticUnderstandingofCrowdScenespaper:https://arxiv.org/abs/2310.10352code:https://github.com/cha15yq/MRC-Crowd摘要：为了减轻训练可靠的人群计数模型所需的繁
【机器阅读理解】System Report for CCL23-Eval Task 9: HUST1037 Explore Proper Prompt Strategy for LLM in MRC 辰阳星宇科研论文 prompt 策略模式
Abstract本文对中国高考阅读理解的对抗鲁棒性评价进行了研究。虽然语文阅读理解任务近年来得到了广泛的关注，但以往的方法对这一具有挑战性的数据集并不有效。我们专注于探索快速工程如何影响模型的阅读理解能力。通过使用ChatGLM、GPT3.5和GPT4进行实验，我们发现提示语和LLM阅读理解能力之间存在相关性，提示语工程提高了每种模型的阅读理解能力。我们团队提交了系统评估结果，在三项指标和总分中均
iOS arc原理和使用注意点沃妮马
本文主要将ARC原理和使用注意点，所以其他文章中的内容可能有删减，我只放我觉得应该放入的内容，其他内容请看原文。首先将引用文章的地址贴出来:彻底理解内存管理(MRC、ARC)ARC的判断原则ARC判断一个对象是否需要释放不是通过引用计数来进行判断的，而是通过强指针来进行判断的。那么什么是强指针?强指针默认所有对象的指针变量都是强指针被__strong修饰的指针Person*p1=[[Persona
__block和__weak修饰符的区别笨鸟后飞了
1、__block不管是ARC还是MRC模式下都可以使用，可以修饰对象，还可以修饰基本数据类型。2、__weak只能在ARC模式下使用，也只能修饰对象（NSString），不能修饰基本数据类型（int）。3、__block对象可以在block中被重新赋值，__weak不可以。
Block 原理面试（1） FY_Chao
玖：Block原理面试（1）block的原理是怎样的？本质是什么？答：Block的本质是一个封装了函数及其调用环境的Objective-C对象。原理详细见「Block使用及结构」block的属性修饰词为什么是copy？使用block有哪些使用注意？答：MRC下block如果没有copy到堆上,值捕获不会对外部变量引用。虽然ARC环境strong也可以修饰Block，那是因为编译器会对strong修
分析一套数据中每个square中的照片良率王海豚3022
由于使用EPU收集的数据都是分布在各个square中（默认状态中）但是我们在imput是，照片在同一个文件夹中会比较方便。所以我一般会用>mv../*/*.mrc/x/将所有的照片放到/x/中不过用软链接的方式也许更好>ln-s../*/*.mrc/x/这次的数据质量不太行，有很多照片都没有颗粒。前期只使用relion和cryoSPARC内部的参数性筛选照片后做处理，没有得到很好的重构结果，所以我
进阶-pod实战 coderPoo
转发请添加原作者地址谢谢转发请添加原作者地址谢谢转发请添加原作者地址谢谢组建场景公司项目使用微信IM的Mars（C++写的）静态库。数据传输使用了Google的protobuf库公司提供协议文件是MRC文件。所以这个私有库创建涉及到添加静态库、添加C++配置、设置MRC文件。step一、833DC211-B573-4482-9C3C-F6FD78ED8C44.pngstep二、使用git仓库地址c
JVM垃圾回收机制详解 xmh-sxh-1314 jvm
在我们写Java代码时，大部分情况下是不用关心你New的对象是否被释放掉，或者什么时候被释放掉。因为JVM中有垃圾自动回收机制。在之前的博客中我们聊过Objective-C中的MRC(手动引用计数)以及ARC(自动引用计数)的内存管理方式，下方会对其进行回顾。而目前的JVM的内存回收机制则不是使用的引用计数，而是主要使用的“复制式回收”和“自适应回收”。当然除了上面是这两种算法外，还有其他是算法，
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，