E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
样本熵
深度学习(1)-简单神经网络示例
我们将使用MNIST数据集,图2-1给出了MNIST数据集的一些
样本
。在机器学习中,分类问题中的某个类别叫作类(class),数据点叫作
样本
(sample),与某个
样本
对应的类叫作标签(label)。
yyc_audio
·
2025-02-16 21:41
深度学习
人工智能
给我通俗易懂地讲一下损失函数与正则化
核心作用**:每次投篮训练后,自动算出学生的「犯错分数」-**举个栗子**:-**均方误差(MSE)**:记录每次投篮偏离篮筐的距离(比如差30cm记0.3分,差50cm记0.5分),最后算平均分-**交叉
熵
损失
利万国潮科技 A9.36(asi智神版)
·
2025-02-16 13:46
经验分享
DeepSeek-R1-Zero 与 DeepSeek-R1 的异同与优劣分析
DeepSeek-R1-Zero与DeepSeek-R1的异同与优劣分析一、相同点核心训练方法:两者均基于强化学习(RL),采用GroupRelativePolicyOptimization(GRPO)算法,通过组内
样本
的奖励相对比较优化策略模型
AI生成曾小健
·
2025-02-16 04:34
Deepseek原理与使用
人工智能
单细胞分析(11)——scRNA-seq数据整合
不同
样本
来源(如多个实验室、不同测序平台、不同患者)可能会导致非生物学因素的影响,从而影响数据分析的准确性。
生信小鹏
·
2025-02-16 01:15
生信技能学习
scRNA
单细胞测序
经验分享
LangChain开发【NL2SQL】应用(few-shot优化)
这篇文章来讲一下优化什么是few-shot使用这些少量的、调整后的
样本
对预训练模型进行微调其实就是给LLM少量示例关于few-shot的研究:https://medium.com/ubiai-nlp/step
向羿燃
·
2025-02-15 22:48
LangChain开发及生态
langchain
ai
人工智能
数据分析
1.5 企业级AI大模型四阶技术全景解析:从Prompt到Pre-training的进化路径
从Prompt到Pre-training的进化路径一、技术演进金字塔:四阶技术如何构建AI新范式▲预训练│(万亿参数基建)├─大模型微调│(领域知识注入)├─AI智能体│(任务自动化)└─提示工程(零
样本
交互
少林码僧
·
2025-02-15 21:08
掌握先机!从
0
起步实战
AI
大模型微调
打造核心竞争力
人工智能
prompt
chatgpt
langchain
gpt
langchain学习笔记之小
样本
提示词Few-shot Prompt Template
langchain学习笔记之小
样本
提示词引言Few-shotPromptTemplates\text{Few-shotPromptTemplates}Few-shotPromptTemplates简单介绍示例集创建创建
静静的喝酒
·
2025-02-15 21:08
langchain
深度学习
人工智能
大模型开发
langchain
多模态小
样本
学习颠覆传统!
小
样本
学习与多模态结合是当前人工智能领域的热门研究方向,旨在通过结合多模态数据(如视觉、语言、音频等)来提高模型在数据稀缺情况下的学习效率和性能。
沃恩智慧
·
2025-02-15 03:15
人工智能
深度学习
人工智能
学习
深度学习
拉普拉斯平滑(Laplacian smoothing)
概念零概率问题:在计算事件的概率时,如果某个事件在观察
样本
库(训练集)中没有出现过,会导致该事件的概率结果是0。
潜心学习的渣渣
·
2025-02-14 22:07
机器学习
概率图模型家族(HMM、MaxEnt、MEMM和CRF)
目录概率图(ProbabilisticGraphical)有向概率图无向概率图隐马尔科夫模型(HMM)最大
熵
模型(MaxEnt)最大
熵
马尔科夫模型(MEMM)条件随机场(ConditionalRandomField
ErbaoLiu
·
2025-02-14 21:29
自然语言处理&大模型
机器学习&大模型
概率图
概率图模型
贝叶斯网络
隐马尔科夫模型
最大熵模型
条件随机场
【论文阅读】Revisiting the Assumption of Latent Separability for Backdoor Defenses
https://github.com/Unispac/Circumventing-Backdoor-Defenses摘要和介绍在各种后门毒化攻击中,来自目标类别的毒化
样本
和干净
样本
通常在潜在空间中形成两个分离的簇
开心星人
·
2025-02-14 19:10
论文阅读
论文阅读
《深度解析:批量、随机和小批量梯度下降的区别与应用》
例如,若训练集中有1000个
样本
,那么每次迭代
·
2025-02-14 09:40
人工智能深度学习
第二章:9.5 多个输出的分类
多标签分类问题多标签分类问题是一种特殊的分类问题,其中每个输入
样本
可以同时属于多个类别。这与单标签分类问题不同,在单标签分类问题中,每个输入
样本
只能属于一个类别。
望云山190
·
2025-02-14 05:33
分类
数据挖掘
人工智能
机器学习·逻辑回归
一、逻辑回归vs线性回归特性逻辑回归线性回归任务类型分类(二分类为主)回归(预测连续值)输出范围(0,1)(概率值)(-∞,+∞)核心函数Sigmoid函数线性函数损失函数对数损失函数(交叉
熵
)均方误差
AAA顶置摸鱼
·
2025-02-14 03:00
python
深度学习
机器学习
逻辑回归
人工智能
R中单细胞RNA-seq分析教程 (6)
原因很直接:目前的单细胞RNA测序技术每次只能捕捉到有限
样本
的分子状态。为了在多个实验和不同条件下对众多
样本
进行测量,通常需要对来自不同实验的单细胞RNA测序数据进行联合分析。
·
2025-02-13 20:18
后端
线性回归、逻辑回归及SVM
可以简单的理解为:在给定训练
样本
点和已知的公式后,对于一个或多个未知参数,机器会自动枚举参数的所有可能取值(对于多个参数要枚举它们的不同组合),直到找到那个最符合
样本
点分布的参数(或参数组合)。
@迷途小书童
·
2025-02-13 07:38
机器学习
瑞熙贝通|智能实验教学管理平台建设方案
在负一楼室外建设废液、废气和生物制品的处理平台,在虚拟仿真室建设局域网和数据采集中心,以“物联网”模式贯穿始终,运用射频识别、传感识别、图像识别、互联互通等技术,完成实验室运行管控、设备使用申请、设备耗材管控、样品
样本
检测
瑞熙贝通实验室综合管理平台
·
2025-02-13 02:27
实验室综合管理系统平台建设
人工智能
大数据
物联网
Laplace(拉普拉斯)平滑
零概率问题,就是在计算实例的概率时,如果某个量x,在观察
样本
库(训练集)中没有出现过,会导致整个实例的概率结果是0。
郑万通
·
2025-02-12 20:45
机器学习
平滑技术
拉普拉斯平滑
机器学习
Laplace
如何从零开始,训练AI大模型?零基础入门到精通,收藏这一篇就够了
但还有一个很直观的情况,随着预训练
样本
的质量不断提升,训练手段的优化。新的模型,往往效果能轻松反超参数量两倍于它的模型。例如,最新出的minicpm,微信内部评测效果也是非常棒的。
网络安全大白
·
2025-02-12 10:09
科技
程序员
大模型
人工智能
大模型
AUC完全总结:定义、手撕计算代码、优缺点
曲线二分类混淆矩阵如下:真实情况label=1真实情况label=0预测情况label=1TPFP预测情况label=0FNTN假阳率(FalsePositiveRate)FPR=FP/(FP+TN),即在所有真实的负
样本
中
zs1996_
·
2025-02-12 08:54
机器学习笔记
机器学习
深度学习
算法
初创公司AI大模型战略:李开复的选择与启示
本文将深入探讨初创公司在AI大模型发展中的策略选择,并以李开复的案例为分析
样本
。初创公司与大模型:挑战与机遇并
·
2025-02-12 01:33
前端
自动评估基准 | 设计你的自动评估任务
数据集需要注意的问题
样本
是由谁创建的?在我看来,按照
样本
的标注员素质高
·
2025-02-12 01:59
人工智能
基于计算图的Softmax层反向传播推导
书本十分通俗易懂,在Chapter5——反向传播部分,作者以计算图方式给出了Sigmoid函数,全连接层的反向传播过程,但是在给出Softxmax层的反向传播推导过程的时候,将Softmax函数与交叉
熵
计算函数直接相连
KaiMing Zhu
·
2025-02-11 21:25
深度学习
反向传播
【机器学习】
样本
不均衡问题解决策略(欠采样方法总结)
文章目录前言1.没有绝对最好,但可以根据场景选择最佳确定效果最好的方法的核心在于以下几个方面:2.方法特点对比及推荐场景3.如果不考虑复杂度和资源开销,哪些方法更值得试用?(1)推荐方法:综合性能最突出的(2)具体任务导向推荐4.总结:前言在选择欠采样方法时,没有一个方法可以在所有情况下都普遍适用并效果最好。不同的欠采样方法在实际应用中的效果取决于数据的具体特征、类分布情况、噪声水平以及实际任务要
又喝真露
·
2025-02-11 18:05
机器学习
机器学习
数据分析
人工智能
强化学习关键技术:重要性采样深度剖析
目录一、引言二、重要性采样基本原理(一)什么是重要性采样(二)重要性采样在强化学习中的作用三、判断采样好坏的方法(一)偏差(Bias)(二)方差(Variance)(三)有效
样本
数量(EffectiveSampleSize
进一步有进一步的欢喜
·
2025-02-11 08:21
强化学习
概率论
机器学习
人工智能
重要性采样
AGI方向研究
**数学与理论基础**-**数学基础**:线性代数(矩阵运算、特征值)、概率统计(贝叶斯理论、分布模型)、微积分(梯度优化)、信息论(
熵
、KL散度)。-**计
微醺欧耶
·
2025-02-11 07:44
agi
k折交叉验证(k-fold Cross-validation)
交叉验证,顾名思义,就是重复的使用数据,把得到的
样本
数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。
向大厂出发
·
2025-02-11 03:43
python
开发语言
单细胞数据整合-解决AnnData合并时ValueError: cannot reindex from a duplicate axis问题
项目场景:使用scanpy包进行单细胞数据分析时,往往需要整合多个
样本
的数据,也就是将多个AnnData对象合并为一个AnnData对象。
bamboo_shoot_kk
·
2025-02-11 00:20
单细胞数据分析
python
【AI论文】LIMO:推理中少即是多
仅凭817个精心挑选的训练
样本
,LIMO就在AIME数据集上取得了57.1%的准确率,在MAT
东临碣石82
·
2025-02-10 16:55
人工智能
(全新整理)700多所高校科技教育经费历史数据
包括科学研究和技术开发活动)的全部费用,本次分享的是728所高校的历年科技经费支出数据,希望对大家有所帮助一、数据介绍数据名称:700多所高校科技经费历史数据数据范围:728所高校数据年份:2008-2017年数据
样本
.Android安卓科研室.
·
2025-02-10 10:34
毕业设计
数据引用
科技
torch.nn.CrossEntropyLoss()的一些小细节(原理和数学,softmax与dim,ignore_index,报错:0D or 1D target tensor expecte)
目录关于torch.nn.CrossEntropyLoss()数学原理关于
熵
数学公式pytorch中的torch.nn.CrossEntropyLoss()torch.nn.CrossEntropyLoss
老肝犯
·
2025-02-09 22:49
人工智能
深度学习
python
机器学习
神经网络
使用MATLAB实现SMOTE算法
SMOTE算法通过合成新的少数类
样本
来平衡类别不平衡的数据集。它通过在少数类
样本
之间插入合成
样本
,以增加少数类
样本
的数量。这些合成
样本
是通过在少数类样
PixelLancer
·
2025-02-09 22:42
matlab
算法
人工智能
Matlab
Manus Metagloves Pro精准塑造动作捕捉XR领域未来
Manus推出的动作捕捉数据手套,以下将从其特点、应用场景两方面展开介绍:产品特点•高精度追踪:采用量子跟踪技术,配备毫米级精确的指尖跟踪传感器,可实现高保真手指跟踪,信号latency≤7.5ms,传感器
样本
率达
虚拟现实产品超市
·
2025-02-09 17:41
xr
交叉
熵
和它的朋友
交叉
熵
交叉
熵
衡量两个概率分布PPP和QQQ的差异,定义为:H(P,Q)=−∑iP(i)logQ(i)H(P,Q)=-\sum_{i}P(i)\logQ(i)H(P,Q)=−∑iP(i)logQ(i)其中
Jamence
·
2025-02-09 15:59
AI数学知识
人工智能
语言模型
chatgpt
软件
熵
:AI如何平衡系统的复杂性与可维护性
随着项目规模的扩大和功能的迭代,软件系统不可避免地会走向复杂,如同宇宙的
熵
增一般,这就是所谓的“软件
熵
”。软件
熵
的增加会导致代码难以理解、维护成本飙升,最终影响软件的质量和用户体验。
·
2025-02-08 18:22
前端
CosyVoice /F5-TTS /GPT-SoVITS /Fish-Speech 开源语音克隆与文本转语音(TTS)项目的对比整理
:项目CosyVoiceF5-TTSGPT-SoVITSFish-Speech核心技术双向流式语音合成,支持离线与流式一体化建模基于流匹配的ConvNeXt文本表示,SwaySampling采样策略零
样本
云樱梦海
·
2025-02-08 10:27
Github开源项目
开源
语音克隆
信息
熵
(entropy)定义公式的简单理解
首先公式长这样:H(X)=−∑i=1np(xi)logp(xi)H(X)=-\sum_{i=1}^{n}p\left(x_{i}\right)\logp\left(x_{i}\right)H(X)=−i=1∑np(xi)logp(xi)PxiP_{x_{i}}Pxi表示随机事件X为xix_{i}xi的概率。这里直接给出一些结论。对于某一事件,其发生的概率越小,那么其信息量越大;发生的概率越大,那
xiongxyowo
·
2025-02-07 10:18
杂文
划水
KNN算法:从思想到实现(附代码)
新
样本
寻找K个最近邻分类问题:多数表决回归问题:均值计算KNN核心思想如何做一个样
lihuayong
·
2025-02-07 03:29
人工智能
机器学习算法
KNN算法
分类问题
回归问题
机器学习与数据挖掘:决策树(知识点总结)
基本流程决策树算法递归返回的三个条件:当前结点包含的
样本
全属于同一类别,无需划分;当前属性集为空,或是所有
样本
在所有属性上取值相同,无法划分;*将当前节点标记为叶节点,将其类别设定为该节点所含
样本
最多的类别
KE.WINE
·
2025-02-07 02:49
机器学习
机器学习
数据挖掘
决策树
【大模型LLM面试合集】训练数据_数据格式
每个
样本
可以是一个字符串或者是一个tokenized的文本序列。标签数据:标签数据是与输入数据对应的标签或类别。标签可以是单个类别,也可以是多个类别的集合。对于多分类任务,通常使用one
X.AI666
·
2025-02-06 18:28
人工智能
big
data
在深度学习中,
样本
不均衡问题是一个常见的挑战,尤其是在你的老虎机任务中,某些的中奖倍数较高
在深度学习中,
样本
不均衡问题是一个常见的挑战,尤其是在你的老虎机任务中,某些的中奖倍数较高在深度学习中,
样本
不均衡问题是一个常见的挑战,尤其是在你的老虎机任务中,某些的中奖倍数较高而其他的中奖倍数较低。
zhangfeng1133
·
2025-02-06 17:53
深度学习
人工智能
deseq2进行差异分析时的分组问题
示例1:两组比较#创建一个示例数据集,包含4个
样本
dds=1.10中,所选的阈值是过滤器的最低分位数,其中拒绝数接近拟合曲线在过滤器分位数上的峰值。“接近”定义为在1个残差标准差内。
请你喝好果汁641
·
2025-02-06 06:07
RNA-seq
学习
Python-机器学习(二)-K近邻算法的原理与鸢尾花数据集实现详解
fromsklearn.neighborsimportKNeighborsClassifierk=5#对模型训练clf=KNeighborsClassifier(n_neighbors=k)clf.fit(x,y)#对
样本
进行预测
2401_84009679
·
2025-02-05 22:00
程序员
机器学习
python
近邻算法
Python中的决策树算法探索基本原理
决策树的基本原理决策树的基本思想是通过对数据进行分割,逐步缩小数据的范围,从而使得每个叶节点(终节点)中的
样本
属于同一类别或具有相似的特征。决策树的构
myCOTB
·
2025-02-05 12:21
Python
算法
python
决策树
数据库操作 -- 添加数据、查看表结构、多表查询、创建视图、创建存储过程、多表删除记录
任务点:•向每个表插入3条测试数据(
样本
数据包含下面题目中使用的数据);•查询出所有选修了“数据库原理”课程的学生学号、姓名和籍贯;•查询出“数据库原理”这门课的最高成绩;•查询有哪些课程没有被任何同学选修
小鞠..
·
2025-02-05 10:34
数据库
数据库
sql
数据库开发
医疗方向的可视化大屏,十分契合医疗行业数据量大的特点
从患者的个人基本信息、过往病史、各项检查检验报告,到医疗机构日常运营产生的物资管理数据、设备运行数据,再到大规模医疗研究中的海量
样本
数据,这些数据的规模和复杂性不断增加。
大象数据工场
·
2025-02-05 08:23
物联网
人工智能
智慧医疗
自定义数据集 使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测,对预测结果计算精确度和召回率及F1分数
训练模型:使用二元交叉
熵
损失函数BCELoss和随机梯度下降优化器SGD进行训练。保存模型:使用torch.save保存模型的参数。加载模型并预测:加载
知识鱼丸
·
2025-02-05 06:42
machine
learning
机器学习
自定义数据集 使用scikit-learn中svm的包实现svm分类
数据集生成:-使用make_classification函数生成包含1000个
样本
的数据集,设置20个特征,其中10个是有信息的特征,类别数为2,通过设置random_state=42保证每次运行生成的数据相同
知识鱼丸
·
2025-02-05 01:31
machine
learning
人工智能
《AI赋能行业实战:揭秘企业数字化转型最佳实践,落地案例深度解析!》 ---- 总目录
文章大纲金融行业落地实践浅析基于PySpark进行信用卡评分--实战案例迁移学习小
样本
金融风控生物信息识别大健康行业落地实践浅析传统行业深度融合升级如何深度参与创业?
shiter
·
2025-02-04 20:58
人工智能系统解决方案与技术架构
人工智能
大数据
AI
scikit-learn实现SVM
最大间隔超平面:SVM的目标是找到能够最大化训练
样本
间隔的超平面。间隔被定义为到最近训练
样本
点的距离,这些点被称为支持向量。这种策略的优势在于它提供了一种防止模型过拟合的方法,从而提高了泛化能力。
PeterClerk
·
2025-02-04 19:23
支持向量机
scikit-learn
算法
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他