yscoder

天池NL2SQL Top15方案

目录

代码地址

Part0: 参赛成绩

Part1: 代码环境

环境配置步骤如下:

Part2: 预处理

一. 数值类型转化

二. 训练集数据清洗与分类

Part3:模型介绍

目录

代码地址

Part0: 参赛成绩

Part1: 代码环境

环境配置步骤如下:

Part2: 预处理

一. 数值类型转化

二. 训练集数据清洗与分类

Part3:模型介绍

Part4: 后处理

Part5: 模型效果评估

Part6: TODO

数字通用前后缀挖掘

同义词解决方案

BUGFIX: (FIXED)

部分冗余逻辑重写

附录:代码树

回复 "nl2sql" 获取数据集, 有问题请留言

Part4: 后处理

Part5: 模型效果评估

Part6: TODO

数字通用前后缀挖掘

同义词解决方案

BUGFIX: (FIXED)

部分冗余逻辑重写

附录:代码树

代码地址

https://github.com/yscoder-github/nl2sql-tianchi

Part0: 参赛成绩

平台昵称: yscoder
参赛形式: 个人
复赛排名: 15

Part1: 代码环境

环境配置步骤如下:

1. 深度学习相关环境

配置详情

显卡: 1080ti
OS: Ubuntu
Driver Version: 418.56
CUDA Version: 10.1
cudnn version

2. Python相关环境

conda create --name nl2sql-yscoder1 python=3.6
source activate
conda activate nl2sql-yscoder1
pip install --upgrade pip  
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple  -r requirements

root@481c7f8087a2

执行训练任务(训练入口):

cd code 
sh start_train.sh

执行推理任务(推理入口):

cd code 
sh start_test.sh

3. 模型与训练文件信息

Bert中文预训练模型(哈工大版) ,该模型存储位置: ./submit/chinese-bert_chinese_wwm_L-12_H-768_A-12 下载地址
Bert-finetune模型,该模型为经过finetune之后的，适配于当前nl2sql任务的训练模型, 该模型存储路径 ./data/weights/nl2sql_finetune.weights 训练好的模型链接: https://pan.baidu.com/s/11tQVSZl9e6VBLPp85c9JRQ 提取码: 4ceg
数据集位置

Part2: 预处理

一. 数值类型转化

　官方提供的数据集中考虑到用户输入的多样性，所以question包含了各种展现形式的数值类型．模型处理时首先对question进行了格式统一,具体如下:

百分数转换，例如百分之10转化为10%,百分之十转换为10%, 百分之一点五转化为1.5%
大写数字转阿拉伯数字，例如十二转换为12; 二十万转化为200000; 一点二转化为1.2
年份转换，如将12年转换为2012年

数值类型转换过程当中用到了大量正则匹配，主要匹配出数字可能出现的位置,以利于后续对训练集做标记.
具体代码位置: question_prepro.py
功能汇总函数: trans_question_acc

二. 训练集数据清洗与分类

具体代码文件: new_mark_acc_ensure.py check_input_feature.py

Part3:模型介绍

Todo (这两天把图做好　)

部分训练日志

注意，如果执行此代码报错，需要修改一下Keras的backend/tensorflow_backend.py，将sparse_categorical_crossentropy函数中原本是

   logits = tf.reshape(output, [-1, int(output_shape[-1])])

的那一行改为

logits = tf.reshape(output, [-1, tf.shape(output)[-1]])

模型解决的特殊问题:

AB型问题例如:初一欢乐寒假这本书多少钱。这个句子当中的初一与欢乐寒假是相邻的两个不同列的候选值
一个候选值对应多列, 例如　eps2011与eps2012均大于10的股票有哪些? 这里的10对应了表中的两个列

Part4: 后处理

后处理主要包括如下几块:

数字中的部分数位缺失,例如200000 模型之预测到200,根据数字的性质，可以对缺失的数位做补齐处理
question中数值单位和表中单位进行统一. 例如question当中票房的单位是"亿",而在相关表中该列的单位为"百万". 本数据集中数值相关的单位存储在表的列名称或者表的title中.

代码文件: post_treat.py

Part5: 模型效果评估

模型效果评估部分，主要采用官方baseline中的方法，并进行了一定封装．主要用于对预测各个部件的准确性进行评估，并存储预测的错误结果以用于后续分析.
功能所在文件为calc_acc.py
主要函数为check_part_acc

Part6: TODO

数字通用前后缀挖掘

由于时间关系，原有方案在将文本中的"中文数字"转换为阿拉伯数字时, 用了一种1字前缀+1字后缀的方式来匹配"中文数字" ，例如:

'概天','到月', '于元', '在年', '于平', '足平', '过股', '过套', '招位', '前', '前中', '前名', '前个', '于的'

上面的这几种词对也是通过对数据集进行处理而得出的。表面上看，虽然上面的几种词对可以将一些数字匹配出来，但是这种1字前缀+1字后缀的方式会将一些专有名词中的中文数字进行误换. 所以后期需要做数字通用前后缀挖掘,即挖掘出更好的n字前缀+n字后缀

有兴趣的可以看看是否可以将所有的数值相关的训练材料从阿拉伯数字转换为中文数字，最后评估下模型效果

同义词解决方案

例如如何将问题中的鹅场和腾讯关联起来

BUGFIX: (FIXED)

  File "nl2sql_main.py", line 816, in 
    callbacks=[evaluator]
  File "/home/yinshuai/anaconda3/envs/nl2sql-yscoder/lib/python3.6/site-packages/keras/legacy/interfaces.py", line 91, in wrapper
    return func(*args, **kwargs)
  File "/home/yinshuai/anaconda3/envs/nl2sql-yscoder/lib/python3.6/site-packages/keras/engine/training.py", line 1418, in fit_generator
    initial_epoch=initial_epoch)
  File "/home/yinshuai/anaconda3/envs/nl2sql-yscoder/lib/python3.6/site-packages/keras/engine/training_generator.py", line 251, in fit_generator
    callbacks.on_epoch_end(epoch, epoch_logs)
  File "/home/yinshuai/anaconda3/envs/nl2sql-yscoder/lib/python3.6/site-packages/keras/callbacks.py", line 79, in on_epoch_end
    callback.on_epoch_end(epoch, logs)
  File "nl2sql_main.py", line 798, in on_epoch_end
    acc = self.evaluate()
  File "nl2sql_main.py", line 806, in evaluate
    return evaluate(valid_data, valid_tables)
  File "nl2sql_main.py", line 721, in evaluate
    R = nl2sql(question, table)  # 
  File "nl2sql_main.py", line 555, in nl2sql
    if entity_start_pos_list[0] != v_start:
IndexError: list index out of range
2209it [00:25, 86.28it/s]

部分冗余逻辑重写

附录:代码树

├── code
│   ├── calc_acc.py
│   ├── check_input_feature.py
│   ├── config.py
│   ├── dbengine.py
│   ├── hand_set.py
│   ├── new_mark_acc_ensure.py
│   ├── nl2sql_main.py
│   ├── post_treat.py
│   ├── question_prepro.py
│   ├── start_test.sh
│   ├── start_train.sh
│   └── utils.py
├── data
│   ├── chinese-bert_chinese_wwm_L-12_H-768_A-12
│   │   ├── bert_config.json
│   │   ├── bert_model.ckpt.data-00000-of-00001
│   │   ├── bert_model.ckpt.index
│   │   ├── bert_model.ckpt.meta
│   │   └── vocab.txt
│   ├── logs
│   │   ├── evaluate_pred.json
│   │   ├── where_cnt_error.log
│   │   ├── where_col_error.log
│   │   ├── where_oper_error.log
│   │   └── where_val_error.log
│   ├── prepare_data
│   │   ├── col_in_text
│   │   ├── new_q_correct
│   │   ├── new_q_exactly_match
│   │   ├── new_q_exactly_more_strict_match
│   │   ├── new_q_need_col_sim
│   │   ├── new_q_no_num_similar
│   │   ├── new_q_one_vs_more_col
│   │   └── new_q_text_contain_similar
│   ├── train
│   │   ├── train.db
│   │   ├── train.json
│   │   └── train.tables.json
│   ├── val.db
│   ├── valid
│   │   ├── val.db
│   │   ├── val.json
│   │   └── val.tables.json
│   └── weights
│       └── nl2sql_finetune.weights
├── Dockerfile
├── requirements
├── img
│   └── nl2sql_model_old.png
├── README.md
└── run.sh

回复 "nl2sql" 获取数据集, 有问题请留言

你可能感兴趣的:(NLP)

语义向量模型全解：从基础到现在的deepseek中的语义向量主流模型来自于狂人人工智能语言模型
一、语义向量模型：自然语言处理的基石语义向量模型（SemanticVectorModel）是自然语言处理（NLP）的核心技术，它将词汇、句子或文档映射为高维向量，在数学空间中量化语义信息。通过向量距离（如余弦相似度）衡量语义的相似性，支撑了搜索引擎、情感分析、机器翻译等实际应用。1.1发展简史1980s~2000s：基于统计的浅层模型，如TF-IDF（直接表征词的重要性）、LSA（通过矩阵分解降维
什么是预训练语言模型下游任务？衣衣困语言模型人工智能自然语言处理
问题：Word2Vec模型是预训练模型吗？由于训练的特性，word2Vec模型一定是与训练模型。给定一个词先使用独热编码然后使用预训练好的Q矩阵得到这个词的词向量。这里指的是词向量本身就是预训练的语言模型。什么是下游任务？在自然语言处理（NLP）和机器学习领域，下游任务（downstreamtasks）指的是使用已经训练好的模型或表示（如词向量、预训练的模型等）来解决的具体任务。这些任务通常依赖于
大语言模型原理与工程实践：大语言模型推理工程推理加速：算子优化 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍近年来，大语言模型（LargeLanguageModel，LLM）在自然语言处理（NLP）领域取得了显著的进展。其中，推理（Inference）过程是大语言模型的核心环节之一。然而，随着模型规模的不断扩大，推理过程中的计算复杂度和延时也逐渐成为制约模型应用的重要因素。因此，如何实现大语言模型推理工程的推理加速，成为研究者和工程师迫切需要解决的问题。2.核心概念与联系在本文中，我们将深入
微调（Fine-tuning）路野yue 人工智能深度学习
微调（Fine-tuning）是自然语言处理（NLP）和深度学习中的一种常见技术，用于将预训练模型（Pre-trainedModel）适配到特定任务上。它的核心思想是：在预训练模型的基础上，通过少量任务相关的数据进一步训练模型，使其更好地适应目标任务。1.微调的核心思想预训练模型：像BERT、GPT这样的模型，已经在大量通用文本数据上进行了预训练，学习到了丰富的语言知识（如语法、语义、上下文关系等
Deepseek 使用指南与提问优化策略西瓜拍两瓣 ai 语言模型 python gpt
序言随着人工智能技术的迅猛发展，语义搜索已成为提升信息检索效率和用户体验的核心工具。DeepSeek作为一款先进的语义搜索引擎，通过自然语言处理（NLP）和机器学习技术，能够深入理解用户查询的语义意图，提供高度精准的搜索结果。本文将详细介绍DeepSeek的核心功能、集成方法，并深入探讨如何通过优化提问策略，最大化利用DeepSeek的语义搜索能力，从而提升信息检索的效率和准确性。访问DeepSe
神经网络之CNN文本识别邪恶的贝利亚神经网络 cnn 人工智能
1.参考我的第一篇文章了解CNN概念神经网络之CNN图像识别(torchapi调用)-CSDN博客2.框架目前对NLP的研究分析应用最多的就是RNN系列的框架，比如RNN,GRU,LSTM等等，再加上Attention，基本可以认为是NLP的标配套餐了。但是在文本分类问题上，相比于RNN，CNN的构建和训练更为简单和快速，并且效果也不差，所以仍然会有一些研究。那么，CNN到底是怎么应用到NLP上的
LLaMA（Meta开源的AI模型）与Ollama（本地运行和管理大模型的工具）简介（注意这俩虽然名字相似但没有直接联系） Dontla 人工智能大模型LLM llama 开源人工智能
文章目录LLaMA**Llama系列模型发展**1.**Llama1(2023年2月)**2.**Llama2(2023年7月)**3.**Llama3(2024年4月)****关键特性**-**开放性**:非商业许可下发布模型权重，促进研究社区发展[⁴](https://zh.wikipedia.org/zh-hans/LLaMA)。-**性能优势**:在NLP基准测试中表现优异，例如代码生成任
【深度学习】Hopfield网络：模拟联想记忆 T-I-M 深度学习人工智能
Transformer优化，什么是稀疏注意力？Transformer模型自2017年被提出以来，已经成为自然语言处理（NLP）领域的核心架构，并在计算机视觉、语音处理等其他领域也取得了显著的成功。然而，随着模型规模的不断增大和任务复杂性的提升，Transformer的计算成本和内存需求也随之激增。为了解决这一问题，研究者们提出了多种优化方法，其中稀疏注意力（SparseAttention）是一种备
完整指南：从基础到高级使用 Semantic Kernel 江沉晚呤时 Net core AI c#.netcore
SemanticKernel是微软推出的一款强大的开发框架，旨在帮助开发者通过语义理解和自然语言处理（NLP）构建智能应用。它为开发者提供了与OpenAI、AzureCognitiveServices等人工智能服务集成的简便接口，使得构建自然语言处理（NLP）应用变得更加直观和高效。在本文中，我们将从基础到高级全面讲解如何使用SemanticKernel，并提供详细的代码示例，帮助你快速掌握这个框
【NLP面试】大模型（NLP）岗位最新高频面题和面试经验总结，一定不要错过！！！（★思维导图版★）青松ᵃⁱ NLP 百面百过自然语言处理面试人工智能
【NLP面试】大模型（NLP）岗位最新高频面题和面试经验总结，一定不要错过！！！（★思维导图版★）嗨，你好，我是青松！自小刺头深草里，而今渐觉出蓬蒿。NLPGithub项目推荐：【AI藏经阁】：https://gitee.com/fasterai/ai-e-book介绍：该仓库主要分享了数百本AI领域电子书【AI算法面经】：fasterai/nlp-interview-handbook#面经介绍：
NLP自然语言处理——文本处理的基本方法小村学长毕业设计自然语言处理人工智能
NLP（自然语言处理）是人工智能领域的一个重要分支，它专注于使计算机能够理解和生成人类语言。文本处理是NLP中的基础且核心的部分，涉及多个步骤和技术，以确保原始文本数据能够被有效地转换、分析和利用。以下是对文本处理基本方法的详细探讨，包括文本预处理、文本表示、以及常见的NLP任务等。一、文本预处理文本预处理是NLP中的第一步，也是至关重要的一步。它主要包括以下几个子步骤：文本清洗：去除特殊字符：移
NLP自然语言处理：文本表示总结 - 上篇word embedding（基于降维、基于聚类、CBOW 、Skip-gram、 NNLM 、TF-ID、GloVe ）陈宸-研究僧 NLP自然语言处理
文本表示分类（基于表示方法）离散表示one-hot表示词袋模型与TF-ID分布式表示基于矩阵的表示方法降维的方法聚类的方法基于神经网络的表示方法NNLMCBOWSkip-gramGloVeELMoGPTBERT目录一、文本离散表示1.1文本离散表示：one-hot1.2文本离散表示：词袋模型与TF-IDF1.2.1词袋模型（bagofwords）1.2.2对词袋模型的改进：TF-IDF二、文本分布
自然语言处理：文本表示梦丶晓羽 python Glove Word2Vec TF-IDF 自然语言处理人工智能
介绍大家好，博主又来给大家分享知识了。今天给大家分享的内容是自然语言处理中的文本表示。在当今数字化信息爆炸的时代，自然语言处理作为人工智能领域的重要分支，发挥着越来越关键的作用。而文本表示，则是自然语言处理的基石之一，它就像是一把神奇的钥匙，能够将人类丰富多样、充满语义的自然语言，转化为计算机可以理解和处理的形式。话不多说，我们直接进入正题。文本表示概念阐述在自然语言处理(NLP)中，文本表示是将
XLNet：超越BERT的新星 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
-XLNet：超越BERT的新星1.背景介绍1.1自然语言处理的重要性自然语言处理(NaturalLanguageProcessing,NLP)是人工智能领域的一个重要分支,旨在使计算机能够理解和生成人类语言。随着大数据时代的到来,海量的自然语言数据不断涌现,对NLP技术的需求与日俱增。NLP技术已广泛应用于机器翻译、智能问答、信息检索、情感分析等诸多领域,为人类生产和生活带来了巨大便利。1.2预
【AI大模型】Transformers大模型库（九）：大模型微调之计算微调参数占比 LDG_AGI 人工智能
目录一、引言二、计算微调参数占比2.1概述2.2模型参数结构一览2.3微调参数占比计算三、总结一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。Transformers提供了数以千计的预训练模型，支持100多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成。它的宗旨是让最先进的NLP技术人人
Transformer模型详解 Yuki-^_^ Transformer模型详解人工智能 transformer 深度学习人工智能
导读Transformer在许多的人工智能领域，如自然语言处理(NaturalLanguageProcessing,NLP)、计算机视觉(ComputerVision,CV)和语音处理(SpeechProcessing,SP)取得了巨大的成功。因此，自然而然的也吸引了许多工业界和学术界的研究人员的兴趣。到目前为止，已经提出了大量基于Transformer的相关工作和综述。本文基于邱锡鹏[1]老师近
AIGC从入门到实战：探秘：ChatGPT 到底是什么 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1人工智能的浪潮近年来，人工智能(AI)发展迅猛，其应用已深入到各个领域，从自动驾驶汽车到智能家居，再到医疗诊断，AI正在改变我们的生活方式。其中，自然语言处理(NLP)作为AI的重要分支，近年来取得了显著进展，而AIGC(AI-GeneratedContent)正是NLP领域的一颗璀璨明珠。1.2AIGC的兴起AIGC指的是利用AI技术自动生成内容，包括文本、图像、音频、视频等。
2W8000字 LLM架构文章阅读指北人工智能
大模型架构专栏已经更新了30多篇文章。完整的专栏内容欢迎订阅：LLM架构专栏1、LLM大模型架构专栏||从NLP基础谈起2、LLM大模型架构专栏||自然语言处理（NLP）之建模3、LLM大模型架构之词嵌入（Part1）3、LLM大模型架构之词嵌入（Part2）3、LLM大模型架构之词嵌入（Part3）4、LLM架构从基础到精通之Word2Vec训练全解析5、LLM架构从基础到精通之循环神经网络（R
自然语言处理之语法解析：BERT：自然语言处理基础理论 zhubeibei168 自然语言处理 1024程序员节自然语言处理 bert 语音识别人工智能
自然语言处理之语法解析：BERT：自然语言处理基础理论自然语言处理基础自然语言处理的定义与应用自然语言处理（NaturalLanguageProcessing，NLP）是计算机科学领域与人工智能领域中的一个重要方向。它研究如何处理和运用自然语言；自然语言认知则是指让计算机“懂”人类的语言。NLP建立于20世纪50年代，随着计算机技术的飞速发展，NLP技术在信息检索、文本挖掘、语音识别、机器翻译、情
DeepSeek应用场景及其解决的问题杏花春雨江南自然语言处理
DeepSeek是一种基于深度学习的智能技术，能够处理复杂的非结构化数据（如文本、图像、语音等），并在企业级应用开发中发挥重要作用。以下是DeepSeek在企业级应用开发中的典型应用场景及其解决的问题：1.企业知识管理与智能搜索场景：企业拥有大量的文档、报告、邮件、会议记录等非结构化数据，员工需要快速找到相关信息。DeepSeek的作用：通过语义搜索和自然语言处理（NLP），DeepSeek可以理
在nodejs中使用ElasticSearch（三）通过ES语义检索,实现RAG konglong127 nodejs elasticsearch 搜索引擎 node.js 全文检索后端
RAG（Retrieval-AugmentedGeneration）是一种结合了信息检索和生成模型的技术，旨在提高生成模型的知识获取和生成能力。它通过在生成的过程中引入外部知识库或文档（如数据库、搜索引擎或文档存储），帮助生成更为准确和丰富的答案。RAG在自然语言处理（NLP）领域，特别是在对话生成、问答系统和文本摘要等任务中，具有非常重要的应用。它的核心思想是，生成模型不仅依赖于模型内部的知识，
穿越AI边界：深度集成DeepSeek API与云平台的实践之路云边有个稻草人热门文章人工智能 DeepSeek 大数据集成DeepSeek API DeepSeek算法阿里云百炼平台集成
云边有个稻草人-CSDN博客随着人工智能技术的日益发展，深度学习和自然语言处理（NLP）已经在很多领域得到了广泛的应用。DeepSeek作为一款领先的大型语言生成模型，凭借其强大的推理和生成能力，已经被越来越多的开发者和行业专家所青睐。通过DeepSeek提供的API接口，开发者可以在多个领域中实现先进的自然语言理解和生成任务。本文将深入探讨如何使用Python调用DeepSeek的API接口，并
自然语言处理NLP入门 -- 第八节OpenAI GPT 在 NLP 任务中的应用山海青风人工智能 gpt 自然语言处理 python
在前面的学习中，我们已经了解了如何使用一些经典的方法和模型来处理自然语言任务，如文本分类、命名实体识别等。但当我们需要更强的语言生成能力时，往往会求助于更先进的预训练语言模型。OpenAI旗下的GPT系列模型（如GPT-3、GPT-3.5、GPT-4等）在生成文本方面拥有强大的表现。它们不仅能进行语言生成，也可用于诸多NLP任务，包括文本摘要和情感分析。本章将重点介绍：GPT的文本生成原理和应用场
DeepSeek怎么用，DeepSeek使用指南最全合集（保姆级教程） xiecoding.cn deepseek deepseek使用指南 deepseek怎么用 deepseek免费教学 deepseek资料合集
DeepSeek是一款由国内顶尖团队开发的人工智能大模型，旨在为用户提供高效、智能的问答和知识服务。作为国产AI模型的代表，DeepSeek不仅在自然语言处理（NLP）领域表现出色，还在多个应用场景中展现了强大的能力。与ChatGPT等国际知名模型相比，DeepSeek在中文语境下的表现尤为突出，能够更好地理解中文的复杂语义和文化背景。DeepSeek使用资源下载为了方便大家更好地学习和使用Dee
J-LangChain，用Java实现LangChain编排！轻松加载PDF、切分文档、向量化存储，再到智能问答花千树-010 JLangChain-TG langchain java pdf AIGC nlp AI编程
Java如何玩转大模型编排、RAG、Agent？？？在自然语言处理（NLP）的浪潮中，LangChain作为一种强大的模型编排框架，已经在Python社区中广受欢迎。然而，对于Java开发者来说，能否有一个同样高效、灵活的工具来实现类似功能？答案是肯定的！今天，我们将聚焦J-LangChain——一个专为Java打造的LangChain实现，带你探索如何用Java语言轻松构建从PDF处理到智能问答
LangChain教程 - RAG - PDF问答花千树-010 LangChain langchain pdf AIGC python nlp embedding 人工智能
系列文章索引LangChain教程-系列文章在现代自然语言处理（NLP）中，基于文档内容的问答系统变得愈发重要，尤其是当我们需要从大量文档中提取信息时。通过结合文档检索和生成模型（如RAG，Retrieval-AugmentedGeneration），我们可以构建强大的问答系统。本博客将详细介绍如何使用FastAPI和LangChain框架，创建一个基于PDF文档的RAG问答API。一、背景在许多
深度学习开源数据集大全：从入门到前沿念九_ysl AI 人工智能
在深度学习中，数据是模型训练的基石。本文整理了当前最常用且高质量的开源数据集，涵盖图像、视频、自然语言处理（NLP）、语音与音频等方向，帮助研究者和开发者快速定位所需资源。一、图像类数据集1.MNIST简介：手写数字识别领域的“HelloWorld”，包含6万张训练图像和1万张测试图像，尺寸为28×28的灰度图。特点：适合入门级图像分类任务，支持快速验证算法原型28。下载地址：MNIST官网2.I
揭开人工智能中 Tokens 的神秘面纱东锋1.3 人工智能 easyui 前端 javascript
揭开人工智能中Tokens的神秘面纱在人工智能，尤其是自然语言处理（NLP）领域，"tokens"是一个频繁出现且至关重要的概念。对于理解语言模型如何处理和理解人类语言，tokens起着基础性的作用。那么，究竟什么是tokens呢？它又在人工智能系统中扮演着怎样关键的角色？让我们一探究竟。什么是Tokens简单来说，tokens是将文本分割成的一个个基本单元。当我们输入一段文字时，人工智能模型不会
自然语言处理NLP入门 -- 第十节简单的聊天机器人山海青风 #自然语言处理自然语言处理 chatgpt
一、为什么要做聊天机器人？在互联网时代，我们日常接触到的“在线客服”“自动问答”等，大多是以聊天机器人的形式出现。它能帮我们快速回复常见问题，让用户获得及时的帮助，并在一定程度上减少人工客服的压力。同时，聊天机器人也是了解自然语言处理（NLP）最好的实战项目之一。因为它整合了文字理解（NLU）、对话管理、文本生成（NLG）等多方面知识，既能看到很直观的对话效果，也能结合深度学习模型让机器人变得更智
自然语言处理NLP入门 -- 第一节基础概念山海青风 #自然语言处理自然语言处理人工智能 python
本部分主要介绍NLP的基础概念，并通过实际案例演示NLP的核心任务，同时引导你搭建NLP开发环境，确保你能顺利开始后续学习。1.什么是自然语言处理（NLP）1.1NLP的定义自然语言处理（NaturalLanguageProcessing,NLP）是人工智能（AI）的一个子领域，专注于让计算机理解、解释和生成人类语言。NLP结合了计算机科学、语言学和机器学习，以便计算机能自动处理文本和语音数据。简
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他