人工智能有点

NLP之基本介绍

文章目录

人工智能-研究方向
自然语言处理
自然语言处理的目标
算法相关工作
- 业务型
- 研究型
算法工程师需要的技能
关于算法的学习
NLP面临的困难
NLP的发展历程
图灵测试
NLP发展现状
深度学习发展历程
- 第一代神经网络（1958~1969）
- 第二代神经网络（1986~1998）
- 统计学习方法的春天（1986~2006）
- 第三代神经网络-DL（2006-至今）
NLP常用工具
机器学习简介
- 有监督学习的要点：
- 有监督学习在人工智能种的应用
- 无监督学习
- - 聚类
  - 降维
- 一般流程
- 常用概念
- - 评价指标：
深度学习简介
- 随机初始化
- 损失函数：计算预测值与真实值之间的误差
- 导数与梯度
- 梯度下降
- 优化器
- Mini Batch & epoch

人工智能-研究方向

TTS语音合成（避免人喊）
ASR语音识别（手机助手：声音-》文字）录音笔
字符识别（CV领域）银行卡扫描、身份证扫描
机器翻译（目前水平较好）双语字幕和语音识别相结合
声纹识别（一些验证场景）
指纹识别
语义理解（只能客服）
图像识别

机器学习是实现一种人工智能的一种方式。

人工智能的三驾马车-算法、算力、数据。数据非常重要。

自然语言处理

是数学、语言学、计算机科学三者结合

自然语言处理的目标

人机交互
- 问答搜索
- 机器翻译
- 指令操作（在家让车自己去加油，目前不行）
- 闲聊
- 辅助生活工作
- 其价值随着机器能力边界的提升而不断增加
数据分析/挖掘
- 舆情分析（电商对客户态度的收集、国家的民意调查）
- 文本分类
- 知识抽取
- 命名实体识别
- 辅助决策和选择
- 其价值随着数据量增大和类别增多而不断提升

算法相关工作

业务型

动手能力强

主要负责业务场景的算法落地，动手能力强
需要熟悉业务场景常见问题，极端情况的处理
小坑不断，需求总改，数据常缺，效果老降

研究型

论文公开数据集

主要负责发表论文及算法比赛等，理论知识扎实
研究内容可以脱离实际业务，在公开数据集上工作
想好的思路已发表，比赛的分数被人超

算法工程师需要的技能

编程能力（实现自己想法）
算法知识储备
沟通和协作能力
学习能力
一定程度的英文能力
使用搜索引擎的能力

关于算法的学习

多动手
多思考
温故而知新
保持学习
保持好心态，以及多锻炼身体

NLP面临的困难

NLP对于机器来说很困难，本质上是因为对于人来说它也很困难。事情本身复杂度高。
换句话说，这个任务本身的复杂度就非常高，远远高于下围棋等看似复杂，但实际有着明确规则的任务。
语言本身具有创造力，在不同领域和时代不断发生着变化。

新生词：

九漏鱼：九年义务教育漏网之鱼

NLP的发展历程

20世纪50年代开始，于计算机的诞生几乎同时
始于机器翻译
两种路线
- 基于规则的理性主义
  主张建立符号处理系统，人工编写初始的语言知识表示体系，构造响应的推理程序。
- 基于统计的经验主义
  主张通过建模学习复杂、广泛的语言结构，利用统计、模式识别、机器学习等方法训练模型。
20世纪80-90 两种方式对立走向融合
21世纪以来，机器学习快速崛起。在图像、语言、文本领域都有大量的数据集被建立起来，这种资源大幅度推动了基于统计的机器学习相关算法的发展。随着AlphaGo的出现，人工智能领域获得前所未有的关注度。NLP也飞快的追赶着其他领域发展（得益于数据和算力）。

图灵测试

计算机冒充人，与人对话，如果超多30%的人误认为自己对话而非计算机，则可以认为这台机器拥有人类智能。图灵测试是图灵个人看法，在1950年提出，并非当前业界的最求。

绕过图灵测试的方法：
焦躁的年轻人（机器一直说自己事情，表现出焦虑的感觉，容易让听者误认）
心理医生式问答（机器反问你一些问题，表现出一定的主动性，容易让人误认）

计算机在很多方面比人强（比如计算），如果在图灵测试中我问人工智能一个有计算量的运算（如：6526*541），那么它可以立刻给我答案，但这不是一个正常人可以马上计算出的。

NLP发展现状

深度学习大幅改变了NLP研究，使离散的符号转化为连续的数值，因此大量的数学工具得以应用，极大的推进了NLP技术的发展。

NLP技术已经深入生活的各个角落，输入法、语音助手、搜索引擎、智能客服等大量依赖NLP技术的应用已经被推广和使用。

综合来看，目前计算机对语义的理解能力尚不如小学生，但在特定任务上可以达到人类以上的水平。

深度学习发展历程

第一代神经网络（1958~1969）

用计算机来模拟人的神经元反应的过程，该模型将神经元简化为了三个过程：输入信号线性加权，求和，非线性激活（阈值法）

1969年，美国数学家及人工智能先驱Minsky在其著作中证明了感知器本质上是一种线性模型，只能处理线性分类问题。

第二代神经网络（1986~1998）

Hinton在1986年发明了适用于多层感知器（MLP）的BP算法，并采用Sigmoid进行非线性映射，有效解决了非线性分类和学习的问题。

1991年，BP算法被指出存在梯度消失问题，即在误差梯度后向传递的过程中，后层梯度以乘性方式叠加到前层，由于Sigmoid函数的饱和特性，后层梯度本来就小，误差梯度传到前层时几乎为0，因此无法对前层进行有效的学习

1997年，LSTM模型被发明，尽管该模型在序列建模上的特性非常突出，但由于正处于NN的下坡期，也没有引起足够的重视。

统计学习方法的春天（1986~2006）

决策树，支持向量机，随机森林等算法先后被提出，并且在实际场景取得不错的效果

第三代神经网络-DL（2006-至今）

该阶段又分为两个时期：快速发展期（2006_{2012）与爆发期（2012}至今）

2012年，Hinton课题组为了证明深度学习的潜力，首次参加ImageNet图像识别比赛，其通过构建的CNN网络AlexNet一举夺得冠军，且碾压第二名（SVM方法）的分类性能。

之后基于深度学习的模型在各种算法任务上开始屠榜，也带来了人工智能整个产业的崛起

NLP常用工具

编程语言

引擎开发：C++和Java居多
算法实验：Python, R

C++，Java的特点：
执行效率高，开发累(代码量大)，不好上手，有助于深入理解编程，有成熟的框架和各种检查工具

Python的特点：
执行效率低，开发轻松，开源库多，简单易学，做线上业务需要开发者有较好的编程习惯

框架：

Tensorflow 大名鼎鼎，工程配套完善
Pytorch 学术界宠儿，调试方便，个人推荐
Keras 高级封装，简单好用，现已和Tensorflow合体
Gensim 训练词向量，bm25等算法支持
Sklearn 大量机器学习算法，如逻辑回归，决策树，支持向量机，随机森林，KMeans等等，同时具有数据集划分和各种评价指标的实现
Numpy 各种向量矩阵操作

数据处理常用库

Jieba 分词，词性标注等
Pandas 数据处理，可以读取excel，csv等格式文件，按列去重、排序，去除无效值等等，但是经常搞事情
Matplotlib 用于画图，可视化是了解数据集的有效手段，也是做汇报等工作中常用的
Nltk 英文的预处理工具中的佼佼者，词性还原，去停用词等功能完善，对中文也有一定支持
Re 正则表达式，也许这会是你最常用的库
Json 读取json格式数据，非常常见
Pickle 文件读写自己建立的任意变量或数据结构，比如说自己建的索引等

检索框架

Lucene 基于java的全文检索引擎，使用倒排索引的机制
ElasticSearch 基于Lucene开发，提供分布式服务和api接口

数据库

MySQL
Postgre
MongoDB
Redis
Hbase
Neo4j

机器学习简介

训练的模型是一种输入与输出之间的映射。找输入输出的一种对应关系。这属于有监督学习。有监督学习的核心目标：建立一个魔心给（函数），来描述输入（X）与输出（Y）之间的映射关系。有监督学习的价值：对于新的输入，通过模型给出预测的输出。

有监督学习的要点：

需要有一定数量的训练样本（一个样本）
输入和输出之间有关联关系（预测幻云男孩女孩）
输入和输出可以数值化表示
任务需要有预测价值

有监督学习在人工智能种的应用

文本分类任务
输入：文本
输出：类别
关系：文本内容决定了文本的类别
机器翻译任务
输入：A狱中文本
输出：B狱中文本
A与中国表达的意思，在B狱中共有对应的意思
图像识别任务
输入：图像
输出：类别
图中的像素排列，决定了图像的的内容
语音识别任务
输入：音频
输出：文本
声音信号在特定语言中对应特定的文本

无监督学习

给与机器的数据没有标注信息，通过算法对数据进行一定的自动分析处理，得到一些结论

常见任务：聚类、降维、找特征值等等。

聚类

降维

高维降到低维，利于观察。

一般流程

常用概念

训练集：用于模型训练的训练数据集合
验证集：对于每种任务一般都有多种算法可以选择，一般会使用验证集验证用于对比不同算法的效果差异
测试集：最终用于评判算法模型效果的数据集合。评判。一般不暴露给算法开发人员

训练集和验证集可以看见。

K折交叉验证
初始采样分割成K个子样本，一个单独的子样本被保留作为验证模型的数据，其他K-1个样本用来训练。交叉验证重复K次，每个子样本验证一次，平均K次的结果

过度的频繁的使用一个数据集去修改一个模型很可能会发生集内。导致在其它测试集上不准。

过拟合：模型失去繁华能力。如果模型在训练集和验证集上都有很好的表现，但在测试集上表现很差，一般认为是发生了过拟合
欠拟合：模型没能建立起合理的输入输出之间的映射。当输入训练集中的样本时，预测结果与标注结果依然相差很大
回归问题
预测值为数值型（连续值）。如预测房价。
分类问题
预测值为类别（离散值）或在类别上的概率的分布。
特征
模型输入需要数值化，对于较为抽象的输入，如声音，文字，情绪等信息，需要将其转化为数值，才能输入模型。转化后的输入，被称作特征。
特征工程
筛选哪些信息值得（以特征的形式）输入模型，以及应当以何种形式输入的工作过程。对于机器学习而言非常重要。模型的输入，决定了模型能力的上限。

算法假设：
一般而言，算法模型是对问题的一种简化。或者说，对于数据事先进行了某种假设，然后在这个基础上，寻找合适的参数，使模型可以拟合数据。
即使问题明显不符合假设，并不意味着这个算法就不能用。事实上，很多情况下，这样依然能有不错的结果。但是，“假设”表明了算法的局限性。

评价指标：

评价算法效果的好坏，不同任务有不同指标
为了评价算法效果的好坏，需要找到一种评价模型效果的计算指标。不同的任务会使用不同的评价指标。常用的评价指标有：
1）准确率
2）召回率
3）F1值
4）TopK
5）BLEU…

深度学习简介

想要快速获得正确的模型，有哪些可以优化的地方？

随机初始化
设想初始化后loss很小，是不是很快收敛
NLP中的预训练模型实际上就是对随机初始化的技术优化
优化损失函数
（损失函数的选取）
调整参数的策略
（优化器，学习率）
调整模型结构
不同模型能够拟合不同的数据集

优化过程：模型随机初始化，预测，计算误差，反复调整

人工神经网络（Artificial Neural Networks，简称ANNs），也简称为神经网络（NN）。它是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。

隐含层/中间层：

神经网络模型输入层和输出层之间的部分，隐含层可以有不同的结构：RNN、CNN、DNN、LSTM、Transformer等等

不同的模型结构本质上就是不同的公式

随机初始化

隐含层中会含有很多的权重矩阵，这些矩阵需要有初始值，才能进行运算
初始值的选取会影响最终的结果
一般情况下，模型会采取随机初始化，但参数会在一定范围内
在使用预训练模型一类的策略时，随机初始值被训练好的参数代替
好的开始是成功的一半！

损失函数：计算预测值与真实值之间的误差

损失函数（loss function或cost function）用来计算模型的预测值与真实值之间的误差。
模型训练的目标一般是依靠训练数据来调整模型参数，使得损失函数到达最小值。
损失函数有很多，选择合理的损失函数是模型训练的必要条件。

导数与梯度

导数表示函数曲线上的切线斜率。除了切线的斜率，导数还表示函数在该点的变化率。

梯度下降

梯度告诉我们函数向哪个方向增长最快，那么他的反方向，就是下降最快的方向
梯度下降的目的是找到函数的极小值
为什么要找到函数的极小值？
因为我们最终的目标是损失函数值最小

优化器

知道走的方向，还需要知道走多远
假如一步走太大，就可能错过最小值，如果一步走太小，又可能困在某个局部低点无法离开
学习率（learning rate），动量（Momentum）都是优化器相关的概念

一步走太大，可能错过全局最优点；一步走太小，课呢困在局部最优点。所以需要一定的策略进行调整。

Mini Batch & epoch

一次训练数据集的一小部分，而不是整个训练集，或单条数据
它可以使内存较小、不能同时训练整个数据集的电脑也可以训练模型。
它是一个可调节的参数，会对最终结果造成影响
不能太大，因为太大了会速度很慢。也不能太小，太小了以后可能算法永远不会收敛。
我们将遍历一次所有样本的行为叫做一个 epoch

一次训练使用一部分
一次全部使用，机器不足。不容易收敛。

迭代过程：

迭代训练要点：

模型结构选择
初始化方式选择
损失函数选择
优化器选择
样本质量数量

模型训练好后把参数保存，可用于对新样本的预测

总结：

机器学习的本质，是从已知的数据中寻找规律，用来预测未知的样本

深度学习是机器学习的一种方法

深度学习的基本思想，是先建立模型，并将模型权重随机初始化，之后将训练样本输入模型，可以得到模型预测值。使用模型预测值和真实标签可以计算loss。通过loss可以计算梯度，调整权重参数。简而言之，“先蒙后调”

Python使用aiohttp库进行异步处理 HTTP 请求和响应飞起来fly呀 Python http 网络协议 python
aiohttp是一个非常强大的Python库，专为异步HTTP客户端和服务器开发而设计，它利用了Python的asyncio核心库来实现高效的非阻塞网络编程。这使得开发者可以在处理I/O密集型任务，如网络请求时，更加有效地利用系统资源，从而提升程序的并发性能。安装aiohttp要开始使用aiohttp，首先需要安装这个库。可以通过pip，Python的包管理工具来安装：pipinstallaioh
设计模式13：职责链模式 MatthewMao 设计模式设计模式 qt 职责链模式
系列总链接：《大话设计模式》学习记录_net大话设计-CSDN博客1.概述职责链模式（ChainofResponsibilityPattern）是一种行为设计模式，它允许将请求沿着处理者链传递，直到有一个处理者能够处理该请求。这种模式通过避免发送者和接收者之间的直接耦合，使得多个对象都有机会处理请求，从而增强了系统的灵活性和可扩展性。每个处理者包含对其下一个处理者的引用，如果当前处理者无法处理请求
记录使用python smtplib邮件发送 Wiktok python 前端 javascript
基于多源异构数据存储管理系统开发时遇到的邮件发送问题，这里做一下记录。importsmtplib#导入smtplib模块，用于发送邮件fromemail.mime.textimportMIMEText#从email.mime.text导入MIMEText类，用于构建文本邮件fromemail.headerimportHeader#从email.header导入Header类，用于设置邮件头部ema
交换两个整数的值（C语言） kk\n c语言算法
本人为一名C语言的初学者。对于交换两个整数的值首先呢最容易想到的方法应该就是通过创建一个临时变量来实现两个整数的交换即#includeintmain(){inta=0;intb=0;scanf("%d%d",&a,&b);inttmp=a;a=b;b=tmp;printf("%d%d",a,b);return0;}其次就是加减法了#includeintmain(){inta=0;intb=0;sc
百度困境剖析：业务、技术与市场多维度洞察萧十一郎@ 深度研究百度搜索引擎人工智能
一、引言1.1研究背景与意义百度作为中国互联网行业的先驱和领军企业之一，在搜索引擎、人工智能、信息流等多个领域占据着重要地位。自2000年成立以来，百度凭借其强大的搜索引擎技术，迅速崛起并成为中国最大的搜索引擎服务提供商，改变了人们获取信息的方式，在互联网信息检索市场长期占据主导地位。随着技术的不断进步和市场环境的日益复杂，百度近年来面临着诸多严峻的挑战和困境。在搜索引擎市场，尽管百度目前仍占据较
算法——编辑距离 csdn950212 数据结构与算法
思路见：https://blog.csdn.net/zhonglixianyun/article/details/82150621if__name__=='__main__':str1='ALGORITHM'str2='ALTRUISTIC'm=len(str1)n=len(str2)d=[[0forjinrange(n+1)]foriinrange(m+1)]foriinrange(m+1):d
SpringBoot中实现WebMvcConfigurer，配置跨域无效 TNTnine Spring spring boot java 后端
跨域配置如下：@ConfigurationpublicclassCorsConfigimplementsWebMvcConfigurer{/***跨域配置*-Access-Control-Allow-Origin的介绍：*-https://blog.csdn.net/MicroAnswer/article/details/102913571*-SpringMVC路径匹配规则：*-1、https:/
吴恩达-机器学习-多元线性回归模型代码 StrawBerryTreea 机器学习机器学习线性回归 python 吴恩达
吴恩达《机器学习》2022版第一节第二周多元线性回归房价预测简单实现以下以下共两个实验，都是通过调用sklearn函数，分别实现了一元线性回归和多元线性回归的房价预测。一、一元线性回归importnumpyasnpnp.set_printoptions(precision=2)fromsklearn.linear_modelimportLinearRegression#输入数据X_train=np
太厉害了，清华大学出品的这个ai学习教程火出圈。 2501_90658343 人工智能 AIGC 学习 AI写作 AI编程
最近疯传的《DeepSeek:从入门到精通》教程ppt，我已经搞到了。它是由清华大学博士后团队撰写。总共104页，详细的介绍了DeepSeek是什么，有什么用，以及如何正确高效使用DeepSeek的核心干货。完整版ppt资料已经帮大家整理好了，免费领取。领取链接：https://pan.quark.cn/s/c589f1a1982b
AI赋能教育：深度解析大模型在教育场景中的应用与架构设计【无标题】和老莫一起学AI 人工智能语言模型产品经理 ai 自然语言处理大模型程序员
随着人工智能技术的飞速发展，尤其是大模型的崛起，教育行业迎来了全新的机遇和挑战。教学模式的变革、个性化学习的深化、教育管理的智能化，大模型正以不可忽视的力量推动着教育的数字化升级。在这篇文章中，我们将基于一张完整的应用设计架构图，从应用场景到AI核心能力、训练标注平台、智能处理引擎以及业务数据，全方位剖析大模型如何助力教育行业实现突破，真正实现“AI赋能教育，重塑未来”。一、应用场景：从传统教育到
Go入门之语言变量常量介绍可爱de艺艺 golang 开发语言后端
funcmain(){varaint8=10varbint=5varcint=6fmt.Println("a=",a,"b=",b,"c=",c)d:=10fmt.Printf("a=%vleixing=%T\n",d,d)}main函数是入口函数,fmt包有三个打印的函数Println，Print，Printf。第一个是在打印结束有换行，并且每个逗号之间有空格，第二个为普通打印，第三个为格式化打
一个最简单的方法解决Python的TypeError: xxx() takes 1 positional argument but 2 were given Wiktok python 开发语言
当我们在类内写了函数进行调用的时候，有时侯并没有传递参数，所编写的函数方法也不需要参数，但运行会报错：TypeError:xxx()takes1positionalargumentbut2weregiven，参数请求的错误，某并未深究其中原因，但单纯就解决这个问题而言，根据某实际经验，只需要在你的目标调用函数里定义空参数即可解决报错问题。演示如下：假设报错：classMainPro:def__in
低代码平台调研结果大唐荣华大前端 javascript 前端 react.js 低代码 lowcode
调研要求：项目活跃度技术栈：react低代码功能点和业务切合度低代码平台调研项目一、百度aims百度aims体验地址：https://aisuda.github.io/amis-editor-demo/#/edit/0优点：2019年开源最早，关注量最多的国内低代码开源，最近更新一周之内；使用时间较长，在百度内部经过实践考验；内置组件丰富；项目活跃度较高，github10.9kstar，gitee
C++混合字符串排序 Echo-Tian 算法竞赛 c++正则表达式 stl 字符串
题一：有一个txt文件，里面都是空格或者回车分隔的英文单词。请写一个程序，输入文件名，输出文件中出现次数最多的前20个单词。1，使用unordermap统计字符出现次数2，将unordermap统计后的次数转化成pair的vector,3,调用sort函数自定义排序规则进行排序。#include#include#include#include#include#include#include#inc
RAM与ROM的区别云墨丹青系统 ram rom
[参考链接】(https://blog.csdn.net/tectrol/article/details/80638457)随机存取存储器（RandomAccessMemory，RAM）又称作“随机存储器”，是与CPU直接交换数据的内部存储器，也叫主存(内存)。它可以随时读写，而且速度很快，通常作为操作系统或其他正在运行中的程序的临时数据存储媒介。当电源关闭时RAM不能保留数据。如果需要保存数据，
关于命名空间内变量和函数及全局变量的使用和作用域: 云墨丹青 C++C++学习编程
(来源：https://www.runoob.com/cplusplus/cpp-namespaces.html)#includeusingnamespacestd;namespaceA{inta=100;namespaceB//嵌套一个命名空间B{inta=20;}}inta=200;//定义一个全局变量intmain(intargc,char*argv[]){cout<<"A::a="<
Python网络编程懒大王爱吃狼 python python 网络开发语言 pycharm Python基础 pycharm安装
Python网络编程涉及使用Python语言来创建网络应用程序，这些应用程序可以在网络上与其他计算机进行通信。Python提供了多个库和框架来简化网络编程的过程，其中一些最常用的包括socket库、http.server模块、asyncio库以及第三方库如requests、Twisted和aiohttp等。以下是一些Python网络编程的基本概念和使用示例：1.套接字编程（SocketProgra
【C++文件读写操作】IO流读文件[程序和文件必须在同一文件夹] 超级码力666 c++
郑书p505习题3：使用IO流以文本方式建立一个文件test1.txt（我存在了D盘的demo2文件夹下），注意程序和文件必须在同一文件夹下代码解释1.ofstreamfile(“test1.txt”);①创建一个ofstream对象file,用于写入文件②没有文件会自动创建文件；已有文件会覆盖原内容2.fileusingnamespacestd;intmain(){//创建一个ofstream对
c++字符串逆序输出青取之于蓝但没他蓝
1008.字符串操作时间限制:1000MS内存限制:65535KB题目描述:输入一个字符串，把其中的字符按逆序输出。如LIGHT，输出THGIL，要求用string类输入:一个字符串输出:字符串的逆序示例:inputLIGHToutputTHGIL#include#includeusingnamespacestd;intmain(){stringstring1;cin>>string1;strin
从0开始使用Docker搭建Spark集群吃鱼的羊 SPARK Hadoop
https://www.jianshu.com/p/ee210190224f?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation最近在学习大数据技术，朋友叫我直接学习Spark，英雄不问出处，菜鸟不问对错，于是我就开始了Spark学习。为什么要在Docker上搭建Spark集群
【人工智能】人工智能学习基础知识汇总奋力向前123 人工智能 python 开发语言人工智能
第1章初识人工智能本章主要介绍人工智能的概念、诞生和发展历程。具体包括人工智能概念的提出和涉及的相关重要人物，以及人工智能发展过程中的几个阶段，包括诞生、两次浪潮与寒冬、稳健阶段和ABC新时代。本章的主要知识点如下：人工智能概念1.人工智能英文名为“ArtificialIntelligence”,简称Al。它是用人工的方法在机器(计算机)上实现的智能；或者说是人们使机器具有类似于人的智能。2.人工
Python+DeepSeek，奔跑吧大模型 Bj陈默 python 开发语言
在当今数字化浪潮中，人工智能与编程语言的融合正以前所未有的速度重塑着技术生态。Python作为最受欢迎的编程语言之一，以其简洁易读的语法、丰富的库和广泛的应用场景，成为了无数开发者的首选。而DeepSeek，作为人工智能领域的一颗新星，凭借其强大的大模型能力，为开发者们打开了一扇通往全新世界的大门。当Python遇上DeepSeek，一场技术的盛宴就此拉开帷幕。一、为什么选择Python与Deep
线性代数导引：张量与张量空间 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
线性代数，张量，张量空间，深度学习，机器学习，人工智能1.背景介绍在现代人工智能领域，深度学习和机器学习算法的蓬勃发展，使得对数据的高效处理和表示能力提出了更高的要求。线性代数作为数学基础，为理解和构建这些算法提供了坚实的基础。而张量，作为一种高维数组的表示形式，成为了深度学习和机器学习的核心数据结构。本篇文章将从线性代数的角度出发，深入探讨张量与张量空间的概念，并阐述其在深度学习和机器学习中的重
探秘 DeepSeek R1 模型：跨越多领域的科技奇迹，引领智能应用新浪潮羑悻的小杀马特. AI学习科技 deepseek AI大模型
DeepSeekR1模型功能强大，应用广泛。在自然语言处理、计算机视觉、推荐系统和医疗等领域都能发挥作用。本文介绍了其在各领域的应用场景和代码示例，助你深入了解它。目录编辑一、本篇背景：二、DeepSeekR1模型概述：2.1模型特点：2.2技术原理：三、自然语言处理领域的应用：3.1文本分类：3.1.1应用场景：3.1.2代码演示：3.2情感分析：3.2.1应用场景：3.2.2代码演示：3.3机
备战蓝桥杯 Day4 差分爱coding的橙子蓝桥杯蓝桥杯算法 c++
差分(修改区间后查询)1.要点a[0]=0;for(inti=1;iusingnamespacestd;typedeflonglongll;constintN=1e5+9;lla[N],b[N],bdiff[N];//b[N]为位置查询次数数组.bdiff[N]为位置查询次数差分数组intmain(){ios::sync_with_stdio(false),cin.tie(0),cout.tie(
RK3588 ubuntu20.04 换源 aarch64源苏三福 ubuntu
备份sudocp/etc/apt/sources.list/etc/apt/sources.list.backup编辑sudovim/etc/apt/sources.list拷贝一下：debhttps://mirrors.tuna.tsinghua.edu.cn/ubuntu-ports/focalmainrestricteduniversemultiversedeb-srchttps://mir
TCG/TPM,Secure Boot 顺漆自然 UEFI
打开UEFI的安全模式后（关闭CSM)，开机提示：verificationfailed:(0x1a)securityviolation当UEFI安全模式下提示"verificationfailed:(0x1a)securityviolation"错误时，这通常意味着启动过程中遇到了安全策略的违反。要解决这个问题，可以尝试以下步骤：关闭安全启动模式：您可以尝试临时关闭UEFI的安全启动模式。进入BI
stdlib.h头文件 Vacant Seat
stdlib头文件里包含了C、C++语言的最常用的系统函数该文件包含了的C语言标准库函数的定义stdlib.h里面定义了五种类型、一些宏和通用工具函数。类型例如size_t、wchar_t、div_t、ldiv_t和lldiv_t；宏例如EXIT_FAILURE、EXIT_SUCCESS、RAND_MAX和MB_CUR_MAX等等；常用的函数如malloc()、calloc()、realloc()
DeepSeek —— 金融市场中的AI颠覆者！！！云边有个稻草人热门文章人工智能金融大数据 DeepSeek
目录云边有个稻草人-CSDN博客引言第1章：DeepSeek的技术概述第2章：DeepSeek对金融行业的影响2.1自动化与决策支持2.2风险评估与管理2.3金融市场预测2.4高频交易与量化分析第3章：展示如何利用DeepSeek进行不同的金融数据分析3.1市场情绪分析3.2新闻事件对股票价格的影响3.3使用DeepSeek进行量化策略回测3.4使用DeepSeek进行投资组合优化第4章：金融界专
请解释回流（Reflow）和重绘（Repaint）的概念，什么场景下会触发？程序员黄同学 JavaScript Java面试题前端开发 javascript 前端 html
核心概念解析回流（Reflow）当页面布局发生几何属性变化时，浏览器需要重新计算元素的位置和尺寸，这个过程称为回流。回流会导致子节点和祖先节点连锁更新，是性能消耗的主要来源。//典型回流场景示例constelement=document.getElementById('box');element.style.width='300px';//触发回流element.style.height='200
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(