-左同学-

Python深度学习---第1章什么是深度学习

<< Python深度学习>>

第1章什么是深度学习

1.1 人工智能、机器学习与深度学习

1.1.1 人工智能

人工智能的简洁定义如下：努力将通常由人类完成的智力任务自动化。因此，人工智能是一个综合性的领域，不仅包括机器学习与深度学习，还包括更多不涉及学习的方法。

1.1.2 机器学习

在经典的程序设计（即符号主义人工智能的范式）中，人们输入的是规则（即程序）和需要根据这些规则进行处理的数据，系统输出的是答案（见图 1-2）。利用机器学习，人们输入的是数据和从这些数据中预期得到的答案，系统输出的是规则。这些规则随后可应用于新的数据，并使计算机自主生成答案。

机器学习系统是训练出来的，而不是明确地用程序编写出来的。将与某个任务相关的许多示例输入机器学习系统，它会在这些示例中找到统计结构，从而最终找到规则将任务自动化。

1.1.3 从数据中学习表示

用三个要素来进行机器学习：
1.输入数据点
2.预期输出的示例
3.衡量算法效果好坏的方法，这一衡量方法是为了计算算法的当前输出与预期输出的差距。衡量结果是一种反馈信号，用于调节算法的工作方式。这个调节步骤就是我们所说的学习。

1.1.4 深度学习之“深度”

数据模型中包含多少层，这被称为模型的深度（depth）。这一领域的其他名称包括分层表示学习和层级表示学习。现代深度学习通常包含数十个甚至上百个连续的表示层，这些表示层全都是从训练数据中自动学习的。与此相反，其他机器学习方法的重点往往是仅仅学习一两层的数据表示，因此有时也被称为浅层学习。

1.1.5 理解深度学习的工作原理

深度神经网络通过一系列简单的数据变换（层）来实现这种输入到目标的映射，而这些数据变换都是通过观察示例学习到的。下面来具体看一下这种学习过程是如何发生的。

1.2 深度学习之前：机器学习简史

1.2.1 概率建模

概率建模（probabilistic modeling）是统计学原理在数据分析中的应用。它是最早的机器学习形式之一，至今仍在广泛使用。其中最有名的算法之一就是朴素贝叶斯算法。朴素贝叶斯是一类基于应用贝叶斯定理的机器学习分类器，它假设输入数据的特征都是独立的。

1.2.2 早期神经网络

贝尔实验室于 1989 年第一次成功实现了神经网络的实践应用，当时 Yann LeCun将卷积神经网络的早期思想与反向传播算法相结合，并将其应用于手写数字分类问题，由此得到名为LeNet 的网络，在 20 世纪 90年代被美国邮政署采用，用于自动读取信封上的邮政编码。

1.2.3 核方法

核方法是一组分类算法，其中最有名的就是支持向量机（SVM，support vector machine）。虽然 Vladimir Vapnik 和 Alexey Chervonenkis 早在 1963 年就发表了较早版本的线性公式 a，但 SVM 的现代公式由 Vladimir Vapnik 和 Corinna Cortes 于 20 世纪 90 年代初在贝尔实验室提出，并发表于 1995 年 b。SVM 的目标是通过在属于两个不同类别的两组数据点之间找到良好决策边界（decision boundary，见图 1-10）来解决分类问题。决策边界可以看作一条直线或一个平面，将训练数据划分为两块空间，分别对应于两个类别。对于新数据点的分类，你只需判断它位于决策边界的哪一侧。

SVM 通过两步来寻找决策边界：
(1) 将数据映射到一个新的高维表示，这时决策边界可以用一个超平面来表示（如果数据像图 1-10 那样是二维的，那么超平面就是一条直线）。
(2) 尽量让超平面与每个类别最近的数据点之间的距离最大化，从而计算出良好决策边界（分割超平面），这一步叫作间隔最大化（maximizing the margin）。这样决策边界可以很好地推广到训练数据集之外的新样本。

将数据映射到高维表示从而使分类问题简化，这一技巧可能听起来很不错，但在实践中通常是难以计算的。这时就需要用到核技巧（kernel trick，核方法正是因这一核心思想而得名）。其基本思想是：要想在新的表示空间中找到良好的决策超平面，你不需要在新空间中直接计算点的坐标，只需要在新空间中计算点对之间的距离，而利用核函数（kernel function）可以高效地完成这种计算。核函数是一个在计算上能够实现的操作，将原始空间中的任意两点映射为这两点在目标表示空间中的距离，完全避免了对新表示进行直接计算。核函数通常是人为选择的，而不是从数据中学到的——对于 SVM 来说，只有分割超平面是通过学习得到的。

1.2.4 决策树、随机森林与梯度提升机

决策树（decision tree）是类似于流程图的结构，可以对输入数据点进行分类或根据给定输入来预测输出值（见图 1-11）。决策树的可视化和解释都很简单。在 21 世纪前十年，从数据中学习得到的决策树开始引起研究人员的广泛关注。到了 2010 年，决策树经常比核方法更受欢迎。

随机森林（random forest）算法，它引入了一种健壮且实用的决策树学习方法，即首先构建许多决策树，然后将它们的输出集成在一起。随机森林适用于各种各样的问题——对于任何浅层的机器学习任务来说，它几乎总是第二好的算法。

与随机森林类似，梯度提升机也是将弱预测模型（通常是决策树）集成的机器学习技术。它使用了梯度提升方法，通过迭代地训练新模型来专门解决之前模型的弱点，从而改进任何机器学习模型的效果。将梯度提升技术应用于决策树时，得到的模型与随机森林具有相似的性质，但在绝大多数情况下效果都比随机森林要好。它可能是目前处理非感知数据最好的算法之一。

1.2.5 神经网络

2012 年以来，深度卷积神经网络（convnet）已成为所有计算机视觉任务的首选算法。更一般地说，它在所有感知任务上都有效。在 2015 年和 2016 年的主要计算机视觉会议上，几乎所有演讲都与 convnet 有关。与此同时，深度学习也在许多其他类型的问题上得到应用，比如自然语言处理。它已经在大量应用中完全取代了 SVM 与决策树。举个例子，欧洲核子研究中心（CERN）多年来一直使用基于决策树的方法来分析来自大型强子对撞机（LHC）ATLAS 探测器的粒子数据，但 CERN 最终转向基于 Keras 的深度神经网络，因为它的性能更好，而且在大型数据集上易于训练。

1.2.6 深度学习有何不同

先前的机器学习技术（浅层学习）仅包含将输入数据变换到一两个连续的表示空间，通常使用简单的变换，比如高维非线性投影（SVM）或决策树。但这些技术通常无法得到复杂问题所需要的精确表示。因此，人们必须竭尽全力让初始输入数据更适合用这些方法处理，也必须手动为数据设计好的表示层。这叫作特征工程。与此相反，深度学习完全将这个步骤自动化:利用深度学习，你可以一次性学习所有特征，而无须自己手动设计。这极大地简化了机器学习工作流程，通常将复杂的多阶段流程替换为一个简单的、端到端的深度学习模型。

1.2.7 机器学习现状

2016 年和 2017 年，Kaggle 上主要有两大方法：梯度提升机和深度学习。具体而言，梯度提升机用于处理结构化数据的问题，而深度学习则用于图像分类等感知问题。使用前一种方法的人几乎都使用优秀的 XGBoost 库，它同时支持数据科学最流行的两种语言：Python 和 R。使用深度学习的 Kaggle 参赛者则大多使用 Keras 库，因为它易于使用，非常灵活，并且支持Python。要想在如今的应用机器学习中取得成功，你应该熟悉这两种技术：梯度提升机，用于浅层学习问题；深度学习，用于感知问题。用术语来说，你需要熟悉 XGBoost 和 Keras，它们是目前主宰 Kaggle 竞赛的两个库。

1.3 为什么是深度学习，为什么是现在

深度学习用于计算机视觉的两个关键思想，即卷积神经网络和反向传播，在 1989 年就已经为人们所知。长短期记忆（LSTM，long short-term memory）算法是深度学习处理时间序列的基础，它在 1997 年就被开发出来了，而且此后几乎没有发生变化。那么为什么深度学习在2012 年之后才开始取得成功？这二十年间发生了什么变化？

三种技术力量在推动着机器学习的进步： 硬件、数据集和基准、算法上的改进

1.3.1 硬件

2007 年，NVIDIA 推出了 CUDA，作为其 GPU 系列的编程接口。少量 GPU 开始在各种高度并行化的应用中替代大量 CPU 集群，并且最早应用于物理建模。深度神经网络主要由许多小矩阵乘法组成，它也是高度并行化的。2011 年前后，一些研究人员开始编写神经网络的 CUDA 实现，而 Dan Ciresana 和 Alex Krizhevskyb 属于第一批人。
与此同时，大公司还在包含数百个 GPU 的集群上训练深度学习模型，这种类型的 GPU 是专门针对深度学习的需求开发的，比如 NVIDIA Tesla K80。如果没有现代 GPU，这种集群的超级计算能力是不可能实现的。此外，深度学习行业已经开始超越 GPU，开始投资于日益专业化的高效芯片来进行深度学习。2016 年，Google 在其年度 I/O 大会上展示了张量处理器（TPU）项目，它是一种新的芯片设计，其开发目的完全是为了运行深度神经网络。据报道，它的速度比最好的 GPU 还要快 10 倍，而且能效更高。

1.3.3 算法

除了硬件和数据之外，直到 20 世纪前十年的末期，我们仍没有可靠的方法来训练非常深的神经网络。因此，神经网络仍然很浅，仅使用一两个表示层，无法超越更为精确的浅层方法，比如 SVM 和随机森林。关键问题在于通过多层叠加的梯度传播。随着层数的增加，用于训练神经网络的反馈信号会逐渐消失。
这一情况在 2009—2010 年左右发生了变化，当时出现了几个很简单但很重要的算法改进，可以实现更好的梯度传播。
1.更好的神经层激活函数（activation function）。
2.更好的权重初始化方案（weight-initialization scheme），一开始使用逐层预训练的方法，不过这种方法很快就被放弃了。
3.更好的优化方案（optimization scheme），比如 RMSProp 和 Adam。
只有这些改进可以训练 10 层以上的模型时，深度学习才开始大放异彩。最后，在 2014 年、2015 年和 2016 年，人们发现了更先进的有助于梯度传播的方法，比如批标准化、残差连接和深度可分离卷积。今天，我们可以从头开始训练上千层的模型。

你可能感兴趣的:(人工智能)

人工智能训练师如何做图像数据标注，从情感分析和实体分析两个个场景分析小宝哥Code 人工智能训练师人工智能
在人工智能训练中，图像情感分析和图像实体分析是两个重要的应用场景。高质量的图像数据标注对于训练情感识别模型和目标检测/语义分割模型至关重要。本指南将详细介绍：情感分析标注（EmotionAnalysis）实体分析标注（EntityRecognition）自动化标注工具Python代码示例数据格式与存储标注数据质量评估1.情感分析（EmotionAnalysis）标注1.1情感分析简介图像情感分析（
DeepSeek开源周震撼来袭！手把手教你玩转AI神器（附20个万能提问公式+清华内部资料）后端
标题：DeepSeek开源周震撼来袭！手把手教你玩转AI神器（附20个万能提问公式+清华内部资料）正文：一、DeepSeek最新动态：开源周引爆AI圈2025年2月21日，DeepSeek在社交平台宣布启动「开源周」，计划于下周起逐步开源5个核心代码库，涵盖其在线服务的基础组件和实战测试模块。这一举措标志着中国AI团队首次以完全透明的方式向全球开发者社区共享AGI（通用人工智能）研究成果。值得关注
AIGC：开启内容创作的新纪元顾漂亮 AIGC
目录引言AIGC是什么基于GANs的AIGC示例AIGC的发展历程AIGC在各领域的应用1.新闻媒体2.艺术创作3.广告营销4.教育领域AIGC的技术实现自然语言生成（NLG）图像生成音频生成AIGC面临的挑战与机遇挑战机遇未来展望引言在当今数字化飞速发展的时代，人工智能已经逐渐渗透到我们生活的方方面面。而AIGC（AI-GeneratedContent，人工智能生成内容）作为人工智能领域的一颗璀
人工智能：从基础到前沿顾漂亮人工智能深度学习 windows
目录目录1.引言2.人工智能基础2.1什么是人工智能？2.2人工智能的历史2.3人工智能的分类3.机器学习3.1机器学习概述3.2监督学习3.3无监督学习3.4强化学习4.深度学习4.1深度学习概述4.2神经网络基础4.3卷积神经网络（CNN）4.4循环神经网络（RNN）5.自然语言处理（NLP）5.1NLP概述5.2文本预处理5.3词嵌入5.4语言模型6.计算机视觉6.1计算机视觉概述6.2图像
边缘计算与联邦学习驱动医疗金融预测及模型可解释性技术突破智能计算研究中心其他
内容概要当前人工智能技术正经历多维度融合与迭代升级，边缘计算与联邦学习的协同创新成为突破性方向。通过将计算资源下沉至终端设备，边缘计算有效缓解了传统中心化架构的延迟与带宽压力，而联邦学习则在保障数据隐私的前提下，实现了跨机构模型的分布式训练。这种技术组合在医疗诊断与金融预测领域展现出显著优势，例如通过部署轻量化模型实现实时病理分析，或构建跨银行风险预测系统，同时满足监管合规需求。在模型优化层面，自
DeepSeek助力科研工作 CodeJourney. 数据库算法架构
在科研领域，传统工作模式面临诸多挑战。科研人员往往需要耗费大量时间和精力在文献综述、技术报告生成和数据分析等基础工作上。据统计，科研人员约三分之一的工作时间都花在查阅和梳理文献上，这不仅效率低下，还容易遗漏重要信息，尤其在信息爆炸的今天，海量的文献资料让科研人员不堪重负。而数据分析的复杂性也使得研究进展缓慢，难以快速从数据中挖掘出有价值的信息。但随着人工智能技术的发展，这些问题迎来了转机，Deep
革新之力：数字科技——重塑未来的超越想象之旅不会写代码的女程序猿科技
在21世纪的科技浪潮中，数字科技如同一股不可阻挡的洪流，正以前所未有的速度和广度改变着我们的生活、工作乃至整个社会的结构。它不仅是技术的简单迭代，更是对人类社会认知边界的拓宽，对经济模式、社会治理、文化形态等多方面的深刻重塑。本文旨在探讨数字科技的重要性，揭示其超越我们日常想象的深远影响。一、数字科技：新时代的驱动力1.数字经济引领全球增长数字科技是数字经济的核心引擎。通过大数据、云计算、人工智能
人工智能学习框架静默.\\ 人工智能学习
人工智能学习框架概述随着人工智能技术的飞速发展，选择合适的机器学习或深度学习框架对于项目的成功至关重要。这些框架提供了强大的工具和库，使得开发者能够更高效地构建、训练和部署模型。目前市面上有许多流行的AI学习框架，每种框架都有其独特的特点和适用场景。首先，TensorFlow是由Google开发的一个开源机器学习框架，支持从简单的线性回归到复杂的神经网络等多种模型类型。它以其高度灵活性和可扩展性著
Grok-3：人工智能领域的新突破大模型之路大模型（LLM）人工智能 Grok-3 llm
近日，xAI公司推出的最新AI模型——Grok-3，在ChatbotArena中一举夺魁，以破纪录的1402分傲视群雄，不仅刷新了大型语言模型（LLMs）的评分上限，更标志着AI技术的一次重大飞跃。本文将深入探讨Grok-3的技术突破、命名背后的深意、对AI领域的深远影响以及xAI公司的未来展望。一、Grok-3：技术突破与命名寓意Grok-3的横空出世，无疑给AI界带来了一场地震。它不仅在Cha
将 Llama 3 与 Ollama 和 Python 结合使用使用 Ollama API 访问这一领先模型知识大胖 NVIDIA GPU和大语言模型开发教程 Python源码大全 llama python 开发语言
Meta最近发布的新法学硕士Llama3在人工智能领域引起了轰动。例如，请查看我对下面型号的70B版本的评论和测试。在我的测试中，Llama3令人印象深刻，但它们是使用聊天界面进行的。如果您想对此模型进行编程以执行有用的任务或使用Python创建您自己的模型聊天界面，该怎么办？本文将向您准确展示如何使用Ollama来做到这一点。如果您不知道Ollama是什么，这是一个允许您在本地下载Llama3等
NVIDIA A100 SXM4与NVIDIA A100 PCIe版本区别深度对比：架构、性能与场景解析 ASI人工智能人工智能架构机器人 AIGC gpt 文心一言 palm
NVIDIAA100SXM4与PCIe版本深度对比：架构、性能与场景解析作为NVIDIAAmpere架构的旗舰级数据中心GPU，A100系列凭借强大的计算能力和显存带宽，已成为人工智能训练、高性能计算（HPC）等领域的核心硬件。然而，A100家族中存在两种不同形态的版本——SXM4与PCIe，二者在物理设计、性能上限和适用场景上存在显著差异。本文将深入解析两者的技术特性，为硬件选型提供决策依据。文
数字人源头厂商-源码出售源码交付-OEM系统贴牌余~~18538162800 音视频线性代数网络人工智能
引言在数字化浪潮中，数字人正成为创新应用的焦点。从虚拟偶像活跃于舞台，到虚拟客服在各行业的普及，数字人展现出巨大的潜力。搭建数字人源码系统，是融合多领域前沿技术的复杂工程，涵盖图形学、人工智能、语音处理等。本文将深入剖析数字人源码搭建的技术开发细节，为开发者提供全面且深入的技术指南。技术体系架构感知层语音识别：技术选型：采用Kaldi语音识别框架，它是一个开源且灵活的工具包，支持多种语言和声学模型
微软发布Majorana 1芯片，开启量子计算新路径新加坡内哥谈技术人工智能深度学习语言模型自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/微软今日推出Majorana1，这是一款基于拓扑核心（TopologicalCore）架
英伟达（NVIDIA）芯片全解析：专业分类、应用场景与真实案例嵌入式Jerry AI 分类人工智能数据挖掘嵌入式硬件 linux 数据分析算法
引言你知道吗？你每天使用的智能手机、AI语音助手、自动驾驶汽车，甚至是电影特效背后，都有英伟达（NVIDIA）的芯片在默默工作。NVIDIA不仅仅是“游戏显卡”的代名词，它的GPU和AI计算平台已经广泛应用于人工智能（AI）、自动驾驶、医疗影像、工业自动化、智能家居等领域。那么，NVIDIA的芯片有哪些分类？它们分别用在哪里？普通人又能从哪些场景感受到它的存在？今天，我们就来用最通俗易懂的方式，带
什么是机器学习? CM莫问机器学习模型机器学习人工智能算法
一、概念（维基百科）机器学习是人工智能的一个分支。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。二、主要特点机器学习的主要特点包括：1、数据驱动：机器学习模型的性能主要依赖于输入的数据。数据的质量和数量直接影响模型的准确性和泛化能力，所谓“Garbagein,garbag
机器学习，我们主要学习什么？悠然的笔记本机器学习机器学习
机器学习的发展历程机器学习的发展历程，大致分为以下几个阶段：1.起源与早期探索（20世纪40年代-60年代）1949年：Hebb提出了基于神经心理学的学习机制，开启了机器学习的先河1950年代：机器学习的起源与人工智能的探索紧密相连。例如，1956年，达特茅斯会议标志着人工智能的诞生，机器学习作为其重要分支也开始受到关注1960年代：出现了早期的机器学习算法，如1967年诞生的K最近邻算法（KNN
傻傻分不清？云存储、云计算与分布式存储、分布式计算是一回事吗？ IPFS星际无限 IPFS星际无限分布式分布式计算
随着互联网的蓬勃兴起，大数据、人工智能、物联网、云计算与云存储等这些专业词汇在大众视野内出现的频率越来越高，再加上近几年分布式技术异军突起，更使得分布式存储、分布式计算等成为热词。然而，很多人对这些名词都一知半解，所以本文将主要和大家聊一聊，云存储、云计算与分布式存储、分布式计算的联系与区别。一、云存储与云计算1、云存储云存储（CloudStorage）是一种网上在线存储的模式，也就是把数据存放在
编程王炸来袭，DeepSeek+IDEA 会java的怪蜀黍 java intellij-idea java ide
*引言*2025年的春节可以说是人工智能在中国史上飘红的一段历史时刻，年后上班的第一天，便马不停蹄的尝试新技能。今天的科技在飞速发展，编程领域的人工智能工具犹如雨后春笋般涌现。其中，DeepSeek则以其卓越的性能和智能化的功能，迅速在众多开发者中赢得了青睐。对于Java开发者而言，将DeepSeek集成到IDEA中，就如同为自己的编程之路配备了一位智能助手，大幅提升开发效率，让编程变得更加轻松愉
中美人工智能发展对比与博弈：现状、挑战与未来走向 2501_90255623 人工智能
摘要人工智能（AI）作为当今科技领域的核心驱动力，深刻影响着全球经济、政治和社会格局。中美两国在AI领域处于领先地位，各自具备独特的优势与发展路径。本文深入剖析中美AI发展的现状，从技术创新、产业应用、政策环境等多维度进行对比，探讨两国在AI发展过程中面临的挑战以及未来的发展走向，旨在为把握全球AI发展趋势提供参考。一、引言人工智能技术自诞生以来，经历了多次起伏，如今已进入快速发展阶段。其在图像识
第一个问题：AI会威胁人类吗？释迦呼呼 AI一千问人工智能
第一个问题：AI会威胁人类吗？对于这个问题，我的回答是：AI本身并不会威胁人类，但其是否构成威胁取决于人类如何设计、使用和监管它。下面我将从几个角度详细分析。AI的本质：人类的工具AI（人工智能）是由人类创造的工具，它的行为和决策完全基于人类设计的算法和输入的数据。换句话说，AI没有自己的意识、意图或独立的目标，因此它本身并不具备威胁人类的动机或能力。它的作用是由开发者、使用者和管理者决定的。AI
在低功耗MCU上实现人工智能和机器学习电子科技圈 Silicon Labs 人工智能机器学习嵌入式硬件经验分享科技物联网 mcu
作者：SiliconLabs人工智能（AI）和机器学习（ML）技术不仅正在快速发展，还逐渐被创新性地应用于低功耗的微控制器（MCU）中，从而实现边缘AI/ML解决方案。这些MCU是许多嵌入式系统不可或缺的一部分，凭借其成本效益、高能效以及可靠的性能，现在能够支持AI/ML应用。这种集成化在可穿戴电子产品、智能家居设备和工业自动化等应用领域中，从AI/ML功能中获得的效益尤为显著。具备AI优化功能的
《AI与NLP：开启元宇宙社交互动新纪元》人工智能深度学习
在科技飞速发展的当下，元宇宙正从概念逐步走向现实，成为人们关注的焦点。而在元宇宙诸多令人瞩目的特性中，社交互动体验是其核心魅力之一。人工智能（AI）与自然语言处理（NLP）技术的迅猛发展，为元宇宙社交互动带来了前所未有的变革与提升，深刻地影响着用户在虚拟世界中的社交方式与体验。自然语言交互，打破沟通壁垒在早期的元宇宙雏形中，用户与虚拟环境、其他用户的交互多依赖于简单的指令输入或有限的动作操作，这种
函数调用和 Java 与 Spring AI 模型的集成算法资料吧！ java spring 人工智能
SpringAI是一个功能强大的SpringFramework项目，它为Java开发人员带来了人工智能（AI）功能。通过将AI模型集成到Java应用程序中，SpringAI简化了创建智能应用程序的过程，同时利用了Spring生态系统的稳健性。本文将指导您完成使用SpringAI将AI模型集成到Java应用程序中的步骤，特别关注允许AI模型与外部数据源和服务动态交互的函数调用机制。SpringAIS
DeepSeek 到底是什么类型的应用，其核心功能是什么？ AndrewHZ python 生活算法深度学习人工智能语言模型 deepseek
DeepSeek是一款多用途的人工智能工具，其核心功能基于大模型技术，覆盖内容生成、数据分析、个性化服务及复杂任务处理等多个领域。以下从应用类型和核心功能两方面展开分析：一、DeepSeek的应用类型通用型人工智能助手DeepSeek被设计为跨行业的通用型AI，适用于生活、学习、工作等场景。例如：生活场景：提供旅游推荐（如黔南的景点、美食）、诗歌创作、儿童故事生成等。专业场景：在金融、保险等领域，
使用LlamaIndex进行Token计数的实战指南 llzwxh888 自然语言处理人工智能 python
在人工智能领域，特别是在自然语言处理（NLP）任务中，理解和跟踪Token的使用情况是非常重要的。这篇文章将介绍如何使用LlamaIndex库来进行Token计数，并提供一些实用的代码示例，以便你在自己的项目中应用这些技术。环境设置首先，我们需要设置回调和服务上下文。通过全局设置，我们可以在不需要每次查询时都传递这些设置的情况下使用它们。importosos.environ["OPENAI_API
清华大学第5弹: 《DeepSeek与AI幻觉》 - 清华大学DeepSeek全套资料完整版 - 持续更新 - PDF免费下载 jiswordsman 人工智能 pdf
由清华大学新闻与传播学院与人工智能学院双聘教授沈阳教授团队倾力打造的《DeepSeek与AI幻觉》，全面呈现，共计38页。《DeepSeek与AI幻觉》报告探讨了AI幻觉的成因、评测方法及其影响，并以DeepSeek模型为例，分析数据偏差、知识固化等问题如何导致幻觉现象。报告还提出缓解策略，如联网搜索、提示词优化，并探讨AI幻觉在科学创新和艺术创作中的潜在价值。点击链接免费下载《DeepSeek与
人工智能基础：从零开始讲解AI的基本概念、发展历程及其核心技术一碗黄焖鸡三碗米饭人工智能前沿与实践人工智能架构机器学习深度学习
人工智能基础：从零开始讲解AI的基本概念、发展历程及其核心技术人工智能（AI）正以前所未有的速度发展，渗透到各行各业，改变着我们的生活方式和工作模式。从自动驾驶到语音助手，从推荐系统到智能制造，人工智能技术无处不在。然而，许多人对于人工智能的了解仍停留在表面，甚至对其中的一些核心概念感到陌生。本文将围绕人工智能的基础概念、发展历程及核心技术进行详细讲解。我们将通过代码示例和表格对比，帮助大家深入理
人工智能时代，程序员如何保持核心竞争力？大道归简人工智能 AIGC
一、AI辅助编程对程序员工作的影响AI辅助编程工具正在迅速改变程序员的日常工作实践。这些工具提供了强大的功能，如智能代码补全、自动代码生成和代码重构等，极大地提高了编程效率。例如，GitHubCopilot可以根据上下文自动生成代码片段，而Tabnine则能提供智能代码补全建议。这些工具不仅加快了编码速度，还能帮助程序员减少常见错误，提高代码质量。然而，过度依赖AI工具也可能带来一些潜在风险：编程
数字人源码源头搭建技术全攻略，支持OEM 余18538162800） python
引言在人工智能与多媒体技术迅猛发展的当下，数字人已从概念构想逐步走进现实应用，广泛渗透于娱乐、教育、医疗、金融等多个领域。搭建数字人源码系统是一项综合性的技术工程，融合了计算机图形学、人工智能、语音处理等多学科前沿技术。本文将深入剖析数字人源码搭建的技术细节，为开发者提供详尽的技术开发指南。技术选型与架构设计图形渲染技术实时渲染引擎：Unity：作为一款跨平台的实时渲染引擎，Unity在数字人开发
数据飞轮：激活数据中台的数据驱动引擎 Earth explosion kafka
在数字化转型的浪潮中，企业面临着如何有效利用海量数据驱动业务增长的挑战。数据中台，作为企业数据集成和分析的关键基础设施，往往未能充分发挥其潜力，成为数据的沉睡之地。数据飞轮作为一种新兴的数据驱动模型，提供了唤醒数据中台并实现数据流动的新思路。本文将探讨数据飞轮的概念、构建方法以及如何通过数据飞轮实现数据中台的活力焕发。随着人工智能和大数据技术的发展，企业拥有了收集和处理前所未有的数据量的能力。然而
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他