洛神灬殇

【人工智能技术专题】「入门到精通系列教程」零基础带你进军人工智能领域的全流程技术体系和实战指南（NLP、GPT-Pre-Training和数据标注都是什么）

零基础带你进军人工智能领域的全流程技术体系和实战指南（NLP、GPT-Pre-Training和数据标注都是什么）

前言
专栏介绍
专栏说明
学习大纲
前提条件
面向读者
学习目标
核心内容
- NLP自然话言理解指的是什么
- - 定义概念
  - - 涉及到的领域
    - 技术与应用关系
  - 重要性
  - - 语言结构剖析
    - 分析语言+识别意图
    - 识别意图+互动交互
    - 内容优化以及提升
  - 工作原理
  - - NLP执行的三个过程
  - 技术方向
  - NLP、AI和机器学习的关系
  - 应用和案例
- GPT框架中的预训练(Pre-Training)指的是什么
- - 预训练概念
  - 预训练目的
  - 预训练重要性
  - - 预训练的简单案例
- 数据标注对于人工智能的重要性
- - 数据标注的概念定义
  - 数据标注的重要性
  - - 解决了数据的精准性和精度问题
    - 作为媒介输入机器学习
  - 数据标注的几种类型
  - - 图像标注
    - 文本标注
    - 音频标注
  - 数据标注的挑战
核心浓缩总结
下节预告

前言

人工智能是一个庞大的研究领域。虽然我们已经在人工智能的理论研究和算法开发方面取得了一定的进展，但是我们目前掌握的能力仍然非常有限。机器学习是人工智能的一个重要领域，它研究计算机如何模拟或实现人类的学习行为，以获取新的知识或技能，并通过重新组织已有的知识结构来不断提高自身的性能。深度学习是机器学习中的一个研究方向，通过多层处理，将初始的“低层”特征表示逐渐转化为“高层”特征表示，从而可以用“简单模型”完成复杂的分类等学习任务。深度学习在人工智能的各个领域都有广泛的应用。

专栏介绍

许多人对AI技术有兴趣，但由于其知识点繁多，难以系统学习，学习没有方向等等问题。我们的专栏旨在为零基础、初学者和从业人员提供福利，一起探索AI技术，从基础开始学习和介绍。让你从零基础出发也能学会和掌握人工智能技术。

专栏说明

本专题文章以及涉及到整体系列文章主要涵盖了多个流行的主题，包括人工智能的历史、应用、深度学习、机器学习、自然语言处理、强化学习、Q学习、智能代理和各种搜索算法。这个人工智能教程提供了对人工智能的介绍，有助于您理解其背后的概念。我们的教程旨在为初级和中级读者提供完整的人工智能知识，从基本概念到高级概念。

学习大纲

与人类所的智能形成对比，人工智能是指机器所显示的智能。本教程涵盖了以下整体学习路线内容：

前提条件

在学习人工智能之前，需要具备以下基本知识，以便轻松理解一些编程相关的功能。

熟悉至少一种计算机语言，如C，C++，Java或Python（推荐Python）。
对基本数学有一定的了解，如微积分、概率论、线性代数和数理统计等，不太懂也没事，我也会带着大家进行分析学习。

面向读者

本教程专为对人工智能有兴趣的毕业生、研究生以及将人工智能作为课程一部分的初中级学者设计，同时也包括一些专业人士需要了解的高级概念。

学习目标

本专栏主要提供了人工智能的介绍，可以帮助您理解人工智能背后的概念以及人工智能的应用，深度学习，机器学习，自然语言处理，强化学习，Q学习，智能代理，各种搜索算法等。

学习后将掌握：机器学习和深度学习的概念，常用的机器学习算法和神经网络算法。
人工神经网络，自然语言处理，机器学习，深度学习，遗传算法等各种人工智能领域的基本概念及其在Python中的如何实现。
认识和掌握相关人工智能和Python编程的基本知识。还会掌握了AI中使用的基本术语以及一些有用的python软件包，如:nltk，OpenCV，pandas，OpenAI Gym等。

核心内容

本章的核心内容路线包括以下三个方面：

NLP自然语言理解是指通过计算机技术来理解和处理人类语言的能力。它包括语音识别、自然语言理解、自然语言生成等多个方面。
GPT框架中的预训练（Pre-Training）是指在大规模的语料库上进行的模型训练，以便使模型能够更好地理解和生成自然语言。这种预训练可以提高模型的泛化能力和效果。
数据标注对于人工智能的重要性在于，它为机器学习算法提供了有意义的数据，使得机器能够更好地理解和处理人类语言。数据标注可以帮助机器学习算法识别和分类文本、图像、音频等数据，从而提高人工智能系统的准确性和效率

NLP自然话言理解指的是什么

人类和计算机的语言差异很大，编程语言作为它们之间的中介存在。我们说话和写作的方式非常微妙，往往存在歧义，而计算机则完全基于逻辑，遵循编程指令执行。这种差异导致传统上计算机难以理解人类语言，但自然语言处理旨在改善计算机理解人类文本和语音的能力。为了实现这一目标，自然语言处理技术可以涵盖语音识别、语义分析、文本生成等多个方面。

下面是针对于【自然语言处理】技术体系的核心学习内容：

定义概念

NLP（全称Natural Language Processing），即自然语言处理，是计算机科学领域的一个重要分支，其主要目标是创建能够理解和处理人类语言的计算机和软件。

NLP涉及到语音识别、自然语言理解、自然语言生成等多个方面，其应用范围广泛，包括机器翻译、智能客服、文本分类、情感分析等。

涉及到的领域

NLP的应用非常广泛，包括但不限于以下领域：

机器翻译：将一种语言翻译成另一种语言。
情感分析：分析文本或语音中的情感，如积极、消极、中性等。
信息提取：从大量文本中提取有用的信息，如新闻摘要、知识图谱等。
自然语言生成：根据给定的条件生成新的文本，如自动回复、机器翻译等。
语音识别：将语音转换为文本，以便进行后续处理。
问答系统：回答用户提出的问题，如智能客服、智能助手等。

技术与应用关系

NLP利用人工智能、机器学习和计算语言学等技术处理文本和语音数据，以获取其含义、意图和情感，并生成相应的回应，自然语言处理的应用非常广泛。承接上面的应用我们来看看如何将技术转换为应用实现领域：

重要性

自然语言处理的概念比您所认知的要早得多，早在20世纪50年代，专家们就一直在寻找为计算机编程以进行语言处理的方法。近年来，随着计算能力的提高和机器学习的发展，该领域取得了巨大的进步。

语言结构剖析

当我们思考自然语言处理的重要性时，需要考虑人类语言的结构。除了构成书面句子的词汇、句法和语法之外，还有口语的语音、音调、口音和措辞。

分析语言+识别意图

我们以许多不同的方式传达意义，同一个词或短语可以有完全不同的意义，这取决于说话者或作者的背景和意图，从本质上讲，语言有时甚至对人类来说都很难解释，因此让机器理解我们是一个相当大的成就。

识别意图+互动交互

随着自然语言处理的改进，我们可以更好地与周围的技术对接。它有助于为本质上非结构化的东西带来结构，这可以使软件更加智能，甚至使我们能够更好地与其他人沟通。自然语言处理可以帮助产生更好的人机互动，提供关于意图和情感的详细见解，让企业、普通消费者和技术人员从中受益。

内容优化以及提升

为了优化这段内容，我们可以简化句子结构，删除一些不必要的词语，使其更加流畅易读。同时，我们可以使用压缩技术来降低内容的字数，使其更加紧凑。

工作原理

现在我们对自然语言处理有了一些了解，让我们深入了解其基本工作原理。需要注意的是，NLP是人工智能的一个高级应用，因此我们将着眼于对该软件的顶层解释。

关于自然语言处理的第一件事是，该领域由几个功能或任务组成。根据所需的解决方案，其中一些或所有的功能可能同时互动，在基本水平上，NLP软件执行三个主要过程：

NLP执行的三个过程

为了优化这段内容，我们可以使用更加简洁的语言来表达这三个主要过程，并删除一些不必要的词语，使其更加紧凑。当然，在这些过程中，还有更多的步骤参与其中。需要大量的语言学知识，以及编程、算法和统计。

它将语言（语音或文本）分解成小块；
它试图理解这些信息片段之间的关系；
它试图从这些关系中创造意义。

技术方向

我们提供了一些关于自然语言处理在某些任务上如何工作的进一步细节：

语音识别：这是将语音数据转化为文本数据的过程。语音识别软件将语音分解为各个声音，并使用算法将意义拼凑起来。
词义歧义化：在许多语言中，相同的词可以根据上下文有不同的含义。词义辨析（WSD）是分析语言以区分不同含义的过程。
核心推理解决：这个过程有助于确定文本或语音中的词是否以及何时指代同一实体。一个很好的例子是解决哪些代词（他、她、他们）是指哪个人或物体。
情感分析：语言往往有很多微妙之处，自然语言处理可以用来从语言中提取情绪和态度，无论是积极的还是消极的。

NLP、AI和机器学习的关系

自然语言处理（NLP）是人工智能（AI）的一个分支，它使用机器学习和数据分析的元素。

虽然这些是不同的领域，但它们有重叠之处，每个领域都是由大量的数据驱动的，数据越多，结果越好。为高度非结构化的数据带来结构是另一个特点。同样，每个领域都可以用来提供洞察力，突出模式，并确定当前和未来的趋势。

自然语言处理和人工智能都建立在机器学习的基础上，使用算法来教机器如何自动完成任务并从经验中学习。
自然语言处理专注于理解人类语言，而人工智能专注于机器模拟人类智能。
这两个领域有许多相同的属性和原则。

应用和案例

自然语言处理（NLP）是一个成熟的机器学习领域，近年来取得了重大进展。

语言翻译，需要考虑许多因素，如输入语言和输出语言。较早的语言翻译形式依赖于基于规则的机器翻译，而最近的方法依赖于统计机器翻译。
语音助手、搜索引擎结果和预测性文本都是NLP的应用领域。
语义搜索是自然语言处理的一个领域，可以更好地理解人们搜索背后的意图，并返回更有意义的结果。预测性文本研究个人和群体如何使用语言，并对接下来会出现什么词或短语做出预测。

GPT框架中的预训练(Pre-Training)指的是什么

接下来我们会进行探讨预训练在人工智能中的重要性，以及用于实现预训练的各种技术，预训练已成为现代机器学习模型的支柱，随着人工智能不断重塑我们的世界，其发展变得越来越重要。此外，我们还将讨论该领域的研究人员所面临的一些挑战。

预训练概念

预训练是在机器学习领域中的一个重要概念，指在一个大数据集上训练模型，以便从数据中学习一般的特征和表征。在微调之前，模型会在一个较小的、特定任务的数据集上进行预训练，然后针对具体任务进行微调。

预训练目的

预训练的主要动机是利用大规模数据集中的知识来提高模型在小规模、更专注的数据集上的性能，这种方法可以帮助研究人员用更少的标记实例获得更好的结果，从而减少对大量特定任务和标记数据的需求。

预训练重要性

预训练成为现代人工智能的重要组成部分，原因如下：

预训练可以实现知识的转移学习，从一个领域或任务中学到的知识可以应用到另一个领域或任务中。
预训练可以提高计算效率，因为它不需要特定任务的标记数据，可以从大量的数据中学习。这可以减少训练所需的计算资源，使训练大规模模型更加可行。
预训练可以提高模型性能，因为经过预训练的模型在特定任务上的表现往往比从头开始训练的模型更好。预训练期间学到的一般特征和表征可以针对广泛的任务进行微调，从而提高性能并加快收敛。

看到这里，可能很多小伙伴们会觉得不理解，没关系，我们举一个简单的案例来分析一下就知道了。

预训练的简单案例

当你对Siri说“明天天气怎么样？”的时候。

Siri会使用其内部预先训练好的语言模型，自动将你的语音转化为可理解的文字信息。

Siri会使用自然语言处理技术来分析你的问题，理解你想要的是明天的天气情况。
通过连接第三方天气预报服务，返回你所在区域的天气信息。
Siri会将天气信息转化为语音播报出来，让你听到。

整个过程中，Siri的各项任务都需要先进行预训练才能达成自然流畅的语音交互，这其中就需要依靠深度学习的预训练模型。

数据标注对于人工智能的重要性

数据标注的概念定义

机器学习已经成为医疗保健、金融、运输等各行各业的重要组成部分，其能够根据大量数据进行分析和预测。数据标注是机器学习过程中的重要方面，是一个对原始数据进行标记和分类的过程，使得数据可以被用于训练机器学习模型。

数据标注的重要性

解决了数据的精准性和精度问题

数据是机器学习算法的燃料，但原始数据往往是非结构化的，并且存在噪音，缺乏算法所需的背景信息，这会影响算法的准确性和精度。数据标注就是为了解决这个问题，它可以将原始数据进行标记和分类，为算法提供准确可靠的数据，以便算法能够学习和做出准确的预测。

作为媒介输入机器学习

数据标注有助于将原始数据转化为ML算法可以理解和学习的结构化格式。通过为数据提供背景和意义，标注过的数据可以作为训练ML模型的基础，以识别模式，进行预测，并执行各种任务。

以图像识别为例，数据标注通常会在图像中绘制边界框，对物体进行分类（例如汽车、人、树等），以便机器学习模型能够学习每个物体的特征和特性，从而能够识别和归类新的、未见过的图像。

数据标注的几种类型

不同的数据类型和ML任务需要不同类型的数据标注。以下是一些常见的数据标注类型：

图像标注

图像标注是用相关信息标注图像的过程，如物体识别、分割和地标。图像标注的技术包括：

边界框(Bounding Boxes)：绘制矩形框来确定物体的位置和类别。
语义分割(Semantic Segmentation)：将图像中的每个像素标记为相应的物体类别，从而对图像进行详细分析。
实例分割(Instance Segmentation)：与语义分割类似，但对同一物体类别进行了实例区分。
关键点标注(Keypoint Annotation)：标记物体上的特定点或地标，如面部特征或关节，以分析物体的结构和运动。

文本标注

以下是一些文本标注技术：

实体识别(Entity Recognition)：识别并分类文本中的实体，如人名、组织机构、地点等。
情感分析(Sentiment Analysis)：为文本打上情感标签，如积极、消极或中立，以理解文本传达的情感和观点。
词性标注(Part-of-Speech Tagging)：将语法类别分配给句子中的单词，如名词、动词、形容词等，以分析文本的结构和含义。

音频标注

以下是音频标注的常用技术：

转录(Transcription)：将口语录音转换成书面文本，以便机器学习模型进行语音分析和处理。
说话人辨认(Speaker Identification)：为录音片段中的讲话者标记身份，使模型能够区分多个说话人。
声音分类(Sound Classification)：对录音中的声音进行分类，如音乐、语音或环境噪声。

数据标注的挑战

以下是数据标注的解决方案：

自动标注(Automated Annotation)：利用机器学习模型执行初始的数据标注，然后由人工审查以保证数据质量。
主动学习(Active Learning)：机器学习模型建议哪些数据样本需要标注，从而减少所需的人工工作量。
众包(Crowdsourcing)：通过众包平台如Amazon Mechanical Turk，利用标注队伍分配标注任务，减少所需时间。

数据标注是机器学习过程中的一项重要工作，使机器学习模型能够从结构化和标记良好的数据中学习。通过了解不同类型的数据标注和每种标注所使用的技术，我们可以更好地理解数据标注在训练准确和有效的机器学习模型中的重要性。

核心浓缩总结

NLP自然语言理解是通过计算机技术来理解和处理人类语言的能力。它包括语音识别、自然语言理解、自然语言生成等多个方面，是实现机器人化客户服务、语音交互、情感分析等应用的关键技术。
GPT框架中的预训练（Pre-Training）是指在大规模的语料库上进行的模型训练，以便使模型能够更好地理解和生成自然语言。这种预训练可以提高模型的泛化能力和效果，极大地提升了自然语言处理的技术水平。
数据标注在人工智能领域的重要性不言而喻，它为机器学习算法提供了有意义的数据，使得机器能够更好地理解和处理人类语言。通过标注，机器学习算法可以识别和分类文本、图像、音频等数据，进一步优化人工智能系统的准确性和效率，拓展了人工智能应用场景的边界。

下节预告

【人工智能技术专题】「入门到精通系列教程」零基础带你进军人工智能领域的全流程技术体系和实战指南（机器学习基础知识）

小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
【无标题】达瓦达瓦 JhonKI 考研
博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
上图为是否色发 JhonKI 考研
博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
143234234123432 JhonKI 考研
博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
TDengine 签约前晨汽车，解锁智能出行的无限潜力涛思数据（TDengine） tdengine 汽车大数据
在全球汽车产业转型升级的背景下，智能网联和新能源技术正迅速成为商用车行业的重要发展方向。随着市场对环保和智能化需求的日益增强，企业必须在技术创新和数据管理上不断突破，以满足客户对高效、安全和智能出行的期待。在这一背景下，前晨汽车凭借其在新能源智能商用车领域的前瞻性布局和技术实力，成为行业中的佼佼者。前晨汽车采用整车数据采集和全车数据打通策略，能够实时将数据推送至APP端客户。然而，这导致整体写入和
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
基于Python给出的PDF文档转Markdown文档的方法程序媛了了 python pdf 开发语言
注：网上有很多将Markdown文档转为PDF文档的方法，但是却很少有将PDF文档转为Markdown文档的方法。就算有，比如某些网站声称可以将PDF文档转为Markdown文档，尝试过，不太符合自己的要求，而且无法保证文档没有泄露风险。于是本人为了解决这个问题，借助GPT（能使用GPT镜像或者有条件直接使用GPT的，反正能调用GPT接口就行）生成Python代码来完成这个功能。笔记、代码难免存在
(179)时序收敛---＞(29)时序收敛二九 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛二九（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）
(180)时序收敛---＞(30)时序收敛三十 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛三十（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）
(158)时序收敛---＞(08)时序收敛八 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛八（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）F
(159)时序收敛---＞(09)时序收敛九 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛九（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）F
(160)时序收敛---＞(10)时序收敛十 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛十（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）F
(153)时序收敛---＞(03)时序收敛三 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛三（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）F
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class