人工智能大讲堂

【深度学习】机器翻译的前世今生

我们都知道谷歌翻译，这个网站可以像变魔术一样在100 种不同的人类语言之间进行翻译。它甚至可以在我们的手机和智能手表上使用：

谷歌翻译背后的技术被称为机器翻译。它的出现改变了世界交流方式。

事实证明，在过去几年中，深度学习完全改写了传统的机器翻译方法。对语言翻译几乎一无所知的深度学习研究人员正在拼凑相对简单的机器学习解决方案，这些解决方案正在击败世界上最好的专家构建的语言翻译系统。

这一突破背后的技术被称为sequence to sequence模型。这是一种非常强大的技术，可用于解决多种问题。在我们了解它的工作原理之后，我们还将了解如何使用完全相同的算法来编写 AI 聊天机器人和图片描述系统。

让计算机翻译

那么我们如何对计算机编程来翻译人类语言呢？

最简单的方法是用目标语言的翻译词替换句子中的每个词。这是一个将西班牙语逐字翻译成英语的简单示例：

这很容易实现，因为只需要构造一个字典数据结构来查找每个单词的翻译。但是结果很糟糕，因为它忽略了语法和上下文。

因此，接下来您可能要做的就是开始添加特定于语言的规则以改进结果。例如，您可以将常见的双词短语翻译为一个组。你可能会交换名词和形容词的顺序，因为它们在西班牙语中的出现顺序通常与它们在英语中的出现顺序相反：

成功了！如果我们不断添加更多规则，直到我们能够处理语法的每一部分，我们的程序应该能够翻译任何句子，对吧？

这就是最早的机器翻译系统的工作方式。语言学家想出了复杂的规则，并将它们一一编入程序。

不幸的是，这只适用于像天气预报这种简单、结构清晰的语言。当面对真实世界的语言时它就变得不再可靠。

因为人类语言并不遵循一套固定的规则。人类语言充满了特殊情况、区域差异，并且完全违反规则。例如，西方国家说英语的方式更多地受到数百年前入侵者的影响，而不是坐下来定义语法规则的人。

应用统计方法让计算机翻译得更好

在基于规则的系统失败后，使用基于概率和统计的模型而不是语法规则开发了新的翻译方法。

构建基于统计的翻译系统需要大量训练数据，其中将完全相同的文本翻译成至少两种语言。这种双重翻译的文本称为平行语料库。就像 1800 年代科学家使用罗塞塔石碑从希腊语中找出埃及象形文字一样，计算机可以使用平行语料库来猜测如何将文本从一种语言转换为另一种语言。

幸运的是，在很多奇怪地方已经有很多双重翻译的文本。例如，欧洲议会将议事录翻译成 21 种语言。因此，研究人员经常使用这些数据来帮助构建翻译系统。

概率思维

这种方式不会只生成一种精确的翻译。相反，他们会生成数千种可能的翻译，然后根据每个翻译的正确可能性对这些翻译进行排名。并通过它与训练数据的相似程度来估计它有多“正确”。它是这样工作的：

第 1 步：将原始句子分成块

首先，我们将句子分解成简单的块，每个块都可以轻松翻译：

第 2 步：为每个块找到所有可能的翻译

接下来，我们将通过查找人类在我们的训练数据中翻译这些相同词块的所有方式来翻译这些词块中的每一个。

重要的是要注意，我们不仅仅是在简单的翻译词典中查找这些块。相反，我们正在看到真实的人如何在现实世界的句子中翻译这些相同的词块。这有助于我们了解它们在不同情况下的所有不同使用方式：

其中一些可能的翻译比其他翻译更频繁地使用。根据每个翻译在我们的训练数据中出现的频率，我们可以给它打分。

例如，某人说“Quiero”的意思是“我想要”比意思是“我尝试”要常见得多。因此，我们可以使用训练数据中“Quiero”被翻译成“I want”的频率来赋予该翻译比频率较低的翻译更高的权重。

第 3 步：生成所有可能的句子并找到最有可能的句子

接下来，我们将使用这些块的每一种可能组合来生成一堆可能的句子。

仅从我们在步骤 2 中列出的块翻译，我们已经可以通过以不同方式组合块来生成近 2,500 种不同的句子变体。这里有些例子：

但在现实世界的系统中，会有更多可能的组块组合，因为我们还将尝试不同的单词顺序和不同的句子组块方式：

现在需要扫描所有这些生成的句子，以找到听起来“最合理”的句子。

为此，我们将每个生成的句子与数以百万计的英文书籍和新闻故事中的真实句子进行比较。我们能得到的英文文本越多越好。

一种可能的翻译是：

I try | to leave | per | the most lovely | open space.

但是没有人用英语写过这样的句子，它与我们数据集中的任何句子都不会非常相似。因此会给这个可能的翻译一个低概率分数。

再看看这个可能的翻译：

I want | to go | to | the prettiest | beach.

这句话会和我们训练集中的某个句子相似，所以它会得到很高的概率分数。

在尝试了所有可能的句子之后，我们将选择具有最可能的块翻译的句子，同时也与真实的英语句子总体上最相似。

我们的最终翻译是“I want to go to the prettiest beach”。不错！

统计机器翻译是一个巨大的里程碑

如果您为统计机器翻译系统提供足够的训练数据，它们的性能要比基于规则的系统好得多。Franz Josef Och 改进了这些想法，并在 2000 年代初期使用它们构建了 Google 翻译。机器翻译终于面世了。

在早期，每个人都惊讶于基于概率的“愚蠢”翻译方法比语言学家设计的基于规则的系统效果更好。这导致了 80 年代研究人员之间的一个（有点刻薄的）说法：

每次我解雇一名语言学家，我的准确性都会提高。
统计机器翻译的局限性

统计机器翻译系统运行良好，但构建和维护起来很复杂。您要翻译的每一对新语言都需要专家调整和调整新的多步骤翻译管道。

由于构建这些不同的管道需要大量工作，因此必须做出权衡。如果你要求谷歌将格鲁吉亚语翻译成泰莱古语，它必须在内部将其翻译成英语作为中间步骤，因为没有足够多的格鲁吉亚语到泰莱古语的翻译来证明在该语言对上投入大量资金是合理的。与您要求更常见的法语到英语选择相比，它可能会使用不太先进的翻译管道进行翻译。

如果我们可以让计算机为我们完成所有烦人的开发工作，那不是很酷吗？

让计算机翻译得更好——没有那些昂贵的人

机器翻译的圣杯是一个黑匣子系统，它可以自己学习如何翻译——仅仅通过查看训练数据。使用统计机器翻译，仍然需要人工来构建和调整多步骤统计模型。

2014年，KyungHyun Cho的团队取得了突破。他们找到了一种应用深度学习来构建这个黑匣子系统的方法。他们的深度学习模型采用平行语料库，并使用它来学习如何在没有任何人工干预的情况下在这两种语言之间进行翻译。

两个伟大的想法使这成为可能——递归神经网络和编码。通过巧妙地结合这两种思想，我们可以构建一个自学习翻译系统。

循环神经网络

常规（非循环）神经网络是一种通用机器学习算法，它接受数字列表并计算结果（基于先前的训练）。神经网络可以用作解决许多问题的黑匣子。例如，我们可以使用神经网络根据房屋的属性计算房屋的近似值：

但与大多数机器学习算法一样，神经网络是无状态的。您传入一个数字列表，然后神经网络计算出一个结果。如果您再次传入相同的数字，它将始终计算出相同的结果。它没有过去计算的记忆。换句话说，2 + 2 总是等于 4。

循环神经网络（或简称 RNN）是神经网络的略微调整版本，其中神经网络的先前状态是下一次计算的输入之一。这意味着以前的计算改变了以后计算的结果！

我们到底为什么要这样做？无论我们上次计算什么，2 + 2 不应该总是等于 4 吗？

这个技巧允许神经网络学习一系列数据中的模式。例如，您可以使用它根据前几个词预测句子中下一个最有可能的词：

每当您想学习数据模式时，RNN 都非常有用。由于人类语言只是一种庞大而复杂的模式，因此 RNN 越来越多地用于自然语言处理的许多领域。

编码

我们需要审查的另一个想法是编码。我们之前讨论了作为人脸识别一部分的编码。为了解释编码，让我们稍微绕一下我们如何用计算机区分两个不同的人。

当你试图用计算机区分两张脸时，你会从每张脸上收集不同的测量值，并使用这些测量值来比较面孔。例如，我们可能会测量每只耳朵的大小或两只眼睛之间的间距，然后比较两张照片中的这些测量值，看看他们是否是同一个人。

将一张脸变成一个测量列表的想法是编码的一个例子。我们正在获取原始数据（一张人脸图片）并将其转换为表示它的测量值列表（编码）。

但是我们不必拿出一个特定的面部特征列表来衡量自己。相反，我们可以使用神经网络从面部生成测量值。在确定哪些测量最能区分两个相似的人方面，计算机可以比我们做得更好：

这是我们的编码。它让我们用简单的东西（128 个数字）来表示非常复杂的东西（一张脸的图片）。现在比较两张不同的脸要容易得多，因为我们只需要比较每张脸的这 128 个数字，而不是比较完整的图像。

你猜怎么了？我们可以用句子做同样的事情！我们可以想出一种编码，将每个可能的不同句子表示为一系列唯一的数字：

为了生成这种编码，我们会将句子输入 RNN，一次输入一个单词。处理完最后一个单词后的最终结果将是代表整个句子的值：

太好了，现在我们有办法将整个句子表示为一组唯一的数字！我们不知道编码中每个数字的含义，但这并不重要。只要每个句子都由它自己的一组数字唯一标识，我们就不需要确切地知道这些数字是如何生成的。

让我们翻译吧！

好的，所以我们知道如何使用 RNN 将一个句子编码成一组唯一的数字。这对我们有什么帮助？这就是事情变得非常酷的地方！

如果我们采用两个 RNN 并将它们端到端连接起来会怎样？第一个 RNN 可以生成表示句子的编码。然后第二个 RNN 可以采用该编码并反向执行相同的逻辑以再次解码原始句子：

当然，能够对原始句子进行编码然后再次解码并不是很有用。但是，如果（这是个好主意！）我们可以训练第二个 RNN 将句子解码为西班牙语而不是英语怎么办？我们可以使用我们的平行语料库训练数据来训练它来做到这一点：

就像那样，我们有一种通用的方法可以将一系列英语单词转换为等效的西班牙语单词序列！

这是一个强大的想法：

这种方法主要受限于你拥有的训练数据量和你可以投入的计算机能力。机器学习研究人员两年前才发明这个，但它的性能已经和耗时 20 年开发的统计机器翻译系统一样好。
这并不取决于了解有关人类语言的任何规则。该算法自己计算出这些规则。这意味着您不需要专家来调整翻译流程的每一步。计算机会为你做这些。
这种方法几乎适用于任何类型的序列到序列问题！事实证明，许多有趣的问题都是序列到序列的问题。继续阅读您可以做的其他很酷的事情！

请注意，我们忽略了使这项工作与实际数据一起工作所需的一些事情。例如，您需要做一些额外的工作来处理不同长度的输入和输出句子（请参阅分桶和填充）。正确翻译生僻词也存在问题。

构建您自己的序列到序列翻译系统

如果您想构建自己的语言翻译系统，TensorFlow 中包含一个可在英语和法语之间进行翻译的工作演示。但是，这不适合胆小者或预算有限的人。这项技术仍然很新，而且非常耗费资源。即使你有一台配备高端显卡的快速计算机，也可能需要大约一个月的连续处理时间来训练你自己的语言翻译系统。

此外，序列到序列的语言翻译技术进步如此之快，以至于很难跟上。最近的许多改进（如添加注意力机制或跟踪上下文）正在显着改善结果，但这些发展太新了，甚至还没有维基百科页面。如果你想对序列到序列学习做任何严肃的事情，你需要跟上新的发展。

序列到序列模型的荒谬力量

那么我们还能用序列到序列模型做些什么呢？

大约一年前，谷歌的研究人员表明您可以使用序列到序列模型来构建人工智能机器人。这个想法是如此简单，以至于令人惊讶的是它的工作原理。

首先，他们获取了谷歌员工和谷歌技术支持团队之间的聊天记录。然后他们训练了一个序列到序列模型，其中员工的问题是输入句子，技术支持团队的回答是该句子的“翻译”。

当用户与机器人交互时，他们将使用该系统“翻译”用户的每条消息以获得机器人的响应。

最终结果是一个可以（有时）回答真正的技术支持问题的半智能机器人。这是他们论文中用户和机器人之间的示例对话的一部分：

他们还尝试构建一个基于数百万电影字幕的聊天机器人。这个想法是利用电影角色之间的对话来训练机器人像人一样说话。输入的句子是一个字符说的一行对话，“翻译”是下一个字符的回应：

这产生了非常有趣的结果。机器人不仅像人一样交谈，而且还显示出一点点智慧：

这只是可能性的开始。我们不仅限于将一个句子转换为另一个句子。也可以制作一个可以将图像转换为文本的图像到序列模型！

Google 的另一个团队通过用卷积神经网络替换第一个 RNN 来做到这一点（就像我们在第 3 部分中了解到的那样）。这允许输入是图片而不是句子。其余的工作方式基本相同：

就这样，我们可以把图片变成文字（只要我们有很多很多的训练数据）！

Andrej Karpathy 扩展了这些想法，构建了一个能够通过分别处理图像的多个区域来非常详细地描述图像的系统：

这使得构建图像搜索引擎成为可能，这些引擎能够找到与奇怪的特定搜索查询匹配的图像：

甚至还有研究人员在研究相反的问题，即根据文本描述生成整张图片！

仅从这些示例中，您就可以开始想象各种可能性。到目前为止，从语音识别到计算机视觉的方方面面都有序列到序列的应用。我敢打赌明年会有更多。

独立开发者灵感日报：简化您生活的 IT 聊天机器人前端后花园前端热门开源项目生活机器人百度人工智能自动化 AI编程
独立开发者产品日刊，每日汇集ProductHunt热榜产品介绍，⚡️1句Slogan榨干产品灵魂，⚡️3秒get全球独立开发者的爆款灵感。关注小前，每日捕获全球产品灵感。这是日刊第28篇文章。FleetAICopilotSlogan：简化您生活的IT聊天机器人标签：人工智能·机器人·科技为什么值得推荐：FleetAICopilot是您新的AI驱动的IT助手，可简化设备管理并转换日常IT任务。它通过
AI DMP 数据基建：如何利用数据提升营销效率 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
AIDMP数据基建：如何利用数据提升营销效率关键词：AI、DMP、数据基建、营销效率、数据驱动、用户画像、精准投放、数据安全摘要：本文深入探讨了AI驱动的DMP（数据管理平台）在现代营销中的关键作用。文章详细阐述了AIDMP数据基建的核心概念、技术原理和实施步骤，包括数据收集、整合、分析和应用等方面。通过结合人工智能技术，DMP能够更精准地构建用户画像，优化营销策略，提高广告投放效率。文章还探讨了
航电系统智能诊断深度实战：从硬件集成到DO-178C认证全流程解析（附工业级代码） Coderabo DeepSeek R1模型企业级应用航电系统智能诊断
航电系统智能故障诊断全栈技术解析——基于深度学习的工业级实现指南一、航电系统故障诊断技术体系1.1典型故障模式与特征classAvionicFault:FAULT_TYPES={101:'总线通信故障',102:'传感器漂移',
直播美颜SDK的底层技术解析：图像处理与深度学习的结合美狐美颜sdk 美颜API 直播美颜SDK 美颜SDK 图像处理深度学习人工智能美颜API 视频美颜SDK 直播美颜SDK 滤镜sdk
直播美颜SDK通过高效的图像处理技术和深度学习算法，使得用户在直播过程中可以获得更为自然、精致的美颜效果。本文将深入解析直播美颜SDK的底层技术，探讨图像处理与深度学习如何在这一领域实现完美结合，提升用户体验并推动行业创新。一、直播美颜SDK的基本概述图像处理是直播美颜SDK的核心技术之一，它主要负责对图像进行预处理、特征提取以及美颜效果的实时合成。在直播美颜SDK中，图像处理技术包含多个关键步骤
Neat Vision：深度学习NLP注意力机制可视化工具教程纪亚钧
NeatVision：深度学习NLP注意力机制可视化工具教程neat-visionNeat(NeuralAttention)Vision,isavisualizationtoolfortheattentionmechanismsofdeep-learningmodelsforNaturalLanguageProcessing(NLP)tasks.(framework-agnostic)项目地址:h
介绍 TensorFlow 的基本概念和使用场景。 AC使者 github sqlite 开发语言自然语言处理
TensorFlow是一个由Google开发的开源机器学习框架，旨在让开发者能够构建和训练各种深度学习模型。以下是TensorFlow的基本概念和使用场景：张量（Tensor）：在TensorFlow中，数据以张量的形式表示，可以理解为多维数组。张量是TensorFlow的基本数据单位，常用于存储训练数据和模型的参数。计算图（ComputationalGraph）：TensorFlow使用计算图来
人工智能训练师如何做文本数据标注？小宝哥Code 人工智能训练师人工智能
在人工智能训练中，文本数据标注是非常重要的一个环节。文本数据标注是对数据进行结构化、分类、分词、情感分析、命名实体识别（NER）等操作，为机器学习模型提供准确的输入。以下是常见的文本数据标注任务和对应的Python代码示例。1.文本分类标注文本分类标注是对文本数据进行分类的任务。通常我们会将文本数据标注为不同的类别，比如“体育”、“娱乐”、“政治”等。示例：假设我们有一组新闻文本，我们需要为其分配
基于ChatGPT-4o信息检索、总结分析、论文写作与投稿、专利idea构思与交底书的撰写 AAIshangyanxiu chatgpt python 机器学习深度学习
第一章2024大语言模型最新进展与ChatGPT各模型讲解1、2024AIGC技术最新进展介绍（生成式人工智能的基本概念与原理、最新前沿技术和发展趋势简介）2、国内外大语言模型（ChatGPT4O、Gemini、Claude、Llama3、PerplexityAI、文心一言、星火、通义千问、Kimi、智谱清言、秘塔AI等）对比分析3、OpenAI12天12场直播新功能解读与演示（ChatGPTO1
撰写文献必用的评价指标之DCA决策曲线小辉同志深度学习深度学习论文阅读
系列文章目录第一章撰写文献必用的评价指标之普通表格第二章撰写文献必用的评价指标之DCA决策曲线目录系列文章目录前言一、DCA决策曲线表现形式横轴纵轴曲线曲线解读图例二、单因素多因素分析单因素分析多因素分析三、R语言程序代码代码解释总结前言在智慧医疗中，深度学习模型用于疾病预测等任务，DCA决策曲线能将模型的预测结果与不同阈值下的临床决策相结合，直观展示在不同疾病概率阈值下，采取某种诊断或治疗策略所
【有啥问啥】DeepSeek NSA（Native Sparse Attention）：开启高效推理与降本增效的新篇章有啥问啥大模型人工智能算法
DeepSeekNSA（NativeSparseAttention）：开启高效推理与降本增效的新篇章在人工智能领域，尤其是自然语言处理（NLP）和大语言模型（LLM）的浪潮中，性能与效率一直是研究者和开发者关注的焦点。随着模型规模的不断扩大，计算资源的需求呈指数级增长，这不仅带来了高昂的硬件成本，也对推理速度和实时性提出了严峻挑战。而DeepSeek团队提出的NSA（NativeSparseAtt
DeepSeek 学习路线图 CarlowZJ 学习 deepseek
以下是基于最新搜索结果整理的DeepSeek学习路线图，涵盖从基础到高级的系统学习路径，帮助你全面掌握DeepSeek的使用和应用开发。一、基础知识与预备技能1.数学基础线性代数：掌握矩阵运算和向量空间，这是深度学习的核心。概率统计：理解贝叶斯理论和概率分布，用于模型训练和推理。微积分：了解优化算法中的梯度下降等概念。2.编程基础Python：掌握Python编程，这是深度学习和AI开发的主要语言
DeepSeek：为医疗数智化注入新动能数澜悠客数字化转型人工智能 deepseek
DeepSeek掀起企业数智化浪潮在数字化与智能化深度融合的时代背景下，企业数智化转型已从一种趋势演变为关乎生存与发展的必然选择。随着云计算、大数据、人工智能等前沿技术的迅猛发展，数智化转型成为企业提升竞争力、创新业务模式、优化客户体验的关键路径。在这场波澜壮阔的转型浪潮中，DeepSeek以其卓越的技术实力和创新能力，成为众多企业实现数智化飞跃的强大助推器。DeepSeek作为人工智能领域的佼佼
计算机毕业设计吊炸天Python+Spark地铁客流数据分析与预测系统地铁大数据地铁流量预测 qq_80213251 java javaweb 大数据课程设计 python
开发技术SparkHadoopPython爬虫Vue.jsSpringBoot机器学习/深度学习人工智能创新点Spark大屏可视化爬虫预测算法功能1、登录注册界面，用户登录注册，修改信息2、管理员用户：（1）查看用户信息；（2）出行高峰期的10个时间段；（3）地铁限流的10个时间段；（4）地铁限流的前10个站点；（6）可视化大屏实时显示人流量信息。3、普通用户：（1）出行高峰期的10（5）可视化大
微构科技《VigorData一站式企业大数据平台产品白皮书》皙姑娘微构大数据微构科技微构大数据 VigorData 一站式企业大数据平台产品白皮书
本白皮书阐述了微构科技VigorData一站式企业大数据平台的定位与应用场景、系统架构、产品特性。VigorData满足企业从数据采集、存储、计算、分析挖掘到可视化展示的一站式数据处理需求，并融合前沿AI科技机器深度学习自我进化，直至与企业自身状况深度契合，帮助企业借力大数据优势深化自身业务价值体系。01产品概述1.1.产品目标一站式企业大数据平台VigorData提供了端到端一站式数据处理服务,
深入解析 Hydra 库：灵活强大的 Python 配置管理框架萧鼎 python基础到进阶教程 python 开发语言
深入解析Hydra库：灵活强大的Python配置管理框架在机器学习、深度学习和复杂软件开发项目中，管理和维护大量的配置参数是一项具有挑战性的任务。传统的argparse、json或yaml方式虽然能管理部分配置，但随着项目规模的增长，手动管理配置文件变得越来越复杂。Hydra作为一个现代化的Python配置管理框架，提供了动态配置、层级合并、运行时修改等强大功能，使得配置管理更加灵活和高效。本文将
一文了解AI大模型相关知识点（含资料分享）大模型研究院人工智能机器学习自然语言处理深度学习语言模型大模型
前言，随着人工智能技术飞速发展，AI大模型在各行各业的应用日益广泛，是助力各行业提升产业智能化水平、优化业务流程等必不可少的推力，什么是AI大模型？AI大模型行业应用落地的背景？具体分为几类有哪些特点？现阶段AI大模型在落地过程中面临哪些挑战和可能的方案是什么？今天我们围绕以上几个点简单做个分享！一、AI大模型的定义和背景AI大模型指具有庞大规模和复杂计算结构的机器学习模型，这些模型通常由深度神经
SD模型微调之LoRA 好评笔记补档深度学习计算机视觉人工智能面试 AIGC SD stable diffusion
大家好，这里是Goodnote（好评笔记），关注公主号Goodnote，专栏文章私信限时Free。本文是SD模型微调方法LoRA的详细介绍，包括数据集准备，模型微调过程，推理过程，优缺点等。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习论文概念核心原理优点训练过程预训练模型加载选择微调的层LoRA优化的层Cross-Attention（跨注意力）层Self
清影2.0（AI视频生成）技术浅析（四）：计算机视觉（CV）爱研究的小牛 AIGC—视频 AIGC——图像 AIGC—计算机视觉人工智能音视频 AIGC 深度学习机器学习
清影2.0是一个基于人工智能的视频生成平台，其核心计算机视觉（CV）技术包括图像处理与增强、动作捕捉与平滑等。这些技术通过深度学习、生成对抗网络（GAN）、光流估计等方法，实现了高质量的视频生成和编辑。1.清影2.0概述清影2.0的核心目标是通过计算机视觉技术生成高质量的视频内容，其主要功能包括：图像处理与增强：提升视频帧的质量和清晰度。动作捕捉与平滑：捕捉视频中的动作并生成平滑的过渡。2.图像处
0基础如何入门Python编程 weixin_33830216 爬虫 python 游戏
Python目前已经成为最受欢迎的编程语言之一，吸引了一大批粉丝，但是很多人在要跨入的时候犹豫了，原因竟然是觉得零基础学习Python太难了，真的是这样吗？零基础入门Python编程学习有什么好的技巧吗？文章最后有免费的Python资料获取Python因为其清晰易读的风格，广泛的适用性，Python已经成为最受欢迎的编程语言之一。在TIOBE排行榜中位居第四，是名副其实的人工智能第一语言。风靡的另
国科大《人工智能原理与算法》2021年期末试题+2024经验（2025指南） MatsumotoChrikk 算法人工智能
声明：本专题几乎每次作业都有两份答案作为参考，后附两次考试原题+备期末考指南。仅做参考交流使用。启发式路径算法（Pohl，1977）是一种最佳优先搜索，它的评估函数是：f(n)=(2−w)⋅g(n)+w⋅h(n)f(n)=(2−w)⋅g(n)+w⋅h(n)假设hh是可采纳的。ww取什么值能保证算法是最优的？当w=0w=0，w=1w=1，w=2w=2时，分别是什么搜索算法？本题以并字棋（圈与十字游戏
【Python】成功解决: OSError: [Errno 22] Invalid Argument 云天徽上 python运行报错解决记录 python 开发语言 pandas 机器学习 numpy
【Python】成功解决:OSError:[Errno22]InvalidArgument博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者
深度学习-123-综述之AI人工智能与DL深度学习简史1956到2024 皮皮冰燃深度学习人工智能深度学习
文章目录1AI与深度学习的简史1.1人工智能的诞生(1956)1.2早期人工神经网络(1940-1960年代)1.3多层感知器MLP(1960年代)1.4反向传播(1970-1980年代)1.5第二次黑暗时代(1990-2000年代)1.6深度学习的复兴(21世纪末至今)1.6.1CNN卷积神经网络(1980-2010)1.6.2RNN递归神经网络(1986-2017)1.6.3Transform
深度学习-124-LangGraph之基础知识(一)基本聊天机器人和工具增强的聊天机器人皮皮冰燃深度学习深度学习人工智能 LangGraph
文章目录1基本使用1.1聊天模型1.2创建图1.3与ICEL交互2构建一个基本的聊天机器人2.1定义状态2.2添加节点2.3添加边(入口点)2.4添加边(终点)2.5编译图2.6调用2.7整体代码3使用工具增强聊天机器人3.1百度搜索工具3.2绑定工具的聊天模型3.3定义图3.4添加工具节点3.5添加条件边3.6调用4参考附录1基本使用下图包含一个名为“Lucy”的节点，它执行聊天模型，然后返回结
橙狮AI图像识别绘本阅读方案（含完整源代码和开发文档）橙狮科技人工智能自动驾驶算法人工智能
概述本文描述一个基于人工智能2D图像识别算法实现的绘本阅读方案，应用于绘本阅读机器人和绘本阅读手机APP。主要内容包括：基础算法，方案架构及工程化，项目遇到的坑及解决方案。为了更容易理解，本文重点描述项目的工程化，对于算法也做一定程度的阐述、但不做深入，相关算法资料及论文在互联网可方便搜到。演示视频基础算法算法方案选型：本项目要解决的核心问题是：在低算力的硬件上通过普通摄像头（2D）采集图像快速（
大模型量化概述 AI领航者人工智能 ai 大模型
近年来，随着Transformer、MOE架构的提出，使得深度学习模型轻松突破上万亿规模参数，从而导致模型变得越来越大，因此，我们需要一些大模型压缩技术来降低模型部署的成本，并提升模型的推理性能。模型压缩主要分为如下几类：剪枝（Pruning）知识蒸馏（KnowledgeDistillation）量化Quantization）本系列将针对一些常见大模型量化方案（GPTQ、LLM.int8()、Sm
基于Java的智能家居设计：开发跨平台智能家居应用的技术要点 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于Java的智能家居设计：开发跨平台智能家居应用的技术要点作者：禅与计算机程序设计艺术1.背景介绍1.1智能家居的兴起与发展近年来，随着物联网、云计算、人工智能等技术的快速发展，智能家居的概念逐渐走进千家万户。智能家居是指利用先进的信息技术，实现家居设备的智能化控制和管理，为用户提供更加舒适、安全、便捷的生活体验。1.2Java在智能家居开发中的优势Java作为一门成熟、稳定、跨平台的编程语言，
利用DeepSeek提升编程效率:全面指南一小路一 DeepSeek使用服务器后端 AI编程 ai
利用DeepSeek提升编程效率:全面指南目录什么是DeepSeekDeepSeek的主要功能如何有效使用DeepSeekDeepSeekvs其他AI编程助手实际应用案例注意事项和最佳实践总结1.什么是DeepSeekDeepSeek是一个基于人工智能的编程助手,旨在帮助开发者提高编码效率和质量。它利用先进的自然语言处理和机器学习技术,为程序员提供智能代码补全、代码生成、错误检测等功能。2.Dee
深度学习笔记之自然语言处理(NLP) 电棍233 深度学习笔记自然语言处理
深度学习笔记之自然语言处理(NLP)在行将开学之时，我将开始我的深度学习笔记的自然语言处理部分，这部分内容是在前面基础上开展学习的，且目前我的学习更加倾向于通识。自然语言处理部分将包含《动手学深度学习》这本书的第十四章，自然语言处理预训练和第十五章，自然语言处理应用。并且参考原书提供的jupyternotebook资源。自然语言处理，预训练自然语言处理（NaturalLanguageProcess
react19设计AntVX6 人工智能建模 DAG 图 I like Code? AntV X6 javascript 前端开发语言
HomeTop.tsximportReact,{useState,useEffect,useRef}from'react'importuseStorefrom'../../../store/state'import{Graph,Path}from'@antv/x6'import{History}from'@antv/x6-plugin-history'importAlgoNodefrom'../.
从零开始玩转TensorFlow：小明的机器学习故事 1 山海青风 #机器学习机器学习 tensorflow 人工智能
1.引言故事简介小明是一个计算机专业的大三学生，近期在学校里接触到了机器学习。他在某次校园活动中发现，活动主办方总是难以准确预测学生的报名人数，导致准备的物料经常不够或浪费。于是，小明萌生了一个想法：能否通过一些历史数据，用机器学习的方式来预测每场活动的参与率？在老师的建议下，他选择了TensorFlow，一个流行且强大的深度学习框架，希望能将这个想法变成现实。2.开始TensorFlow的旅程场
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

【深度学习】机器翻译的前世今生

你可能感兴趣的:(深度学习,深度学习,机器翻译,人工智能)