swy_swy_swy

人智导（七）：回归分析

人智导（七）：回归分析

问题引入

给出一组示例，估算/还原出函数f：
基于示例的学习（归纳学习）：未知 $f$ ，已知的是一个示例集合（训练集），求得一个或多个函数 $f^{'}$ （模型、假设），使得 $f^{'}$ 近似于 $f$
举例：

30个无产者的数据：收入与受教育年限

问题模型

问题描述

给出一组观测变量 $X=(x_1,x_2, \dots ,x_p)$ 以及响应变量 $Y$ （连续值）
$X$ 与 $Y$ 之间存在关联，即
$Y=f(X)+\epsilon$
其中 $f$ 是未知的函数， $\epsilon$ 是随机错误（均值为零）
任务：已知一组观测数据（ $X$ ， $Y$ ）取值，估算出 $f$
目的：预测和推理（解释）

预测的目的

在许多现实应用中，输入变量 $X$ 是可预测的，但输出变量 $Y$ 的实际值不易直接观测到
试图预测真实的 $Y$ ，通过 $Y^{'} = f^{'} (X)$
$f^{'}$ 表示未知 $f$ 的预估， $Y^{'}$ 表示预测的结果
回归技术：估算 $f$ ，使得误差（残差）平方均值最小化 $E(Y-Y')^2~or~[f(X)-f'(X)]^2$

目标函数：均方误差最小

$RSS=e_1^2+e_2^2+\dots +e_n^2 = (y_1-y'_1)^2+(y_2-y'_2)^2+\dots +(y_n-y'_n)^2$
均方误差 $MSE=\frac{RSS}{n}$ 最小化
数学期望（均值）： $\mu = \frac{\Sigma^n_{i=1}y_i}{n}$
方差：度量随机变量与其数学期望（即均值）之间的偏离程度 $\sigma^2=\frac{\Sigma^n_{i=1}(y_i-\mu)^2}{n}$
标准差： $\sigma$

推理的目的

估算 $f$ ，是理解 $X$ 与 $Y$ 之间的关系
具体地，回答以下问题：

$(x_1,x_2,\dots ,x_p)$ 中哪些变量与 $Y$ 关联？
$Y$ 与 $(x_1,x_2,\dots ,x_p)$ 中的每一变量的关系是什么？是正/负相关性？
$Y$ 与 $(x_1,x_2,\dots ,x_p)$ 中每一变量的关系能否线性地概括？或需要更复杂的方程表示？

应用示例：为客户改善其产品销售提供咨询

数据集：某商业客户产品在数百家商场的销售量以及三种不同媒体（电视、电台广播、报纸）在每家广告费用支出的历史数据。
应用目的：
- 开发一个精确的预测模型，能基于这三种媒体费用的预算预测该产品销售量 $s a l e s = f (t v, r a d i o, n e w s p a p e r)$
- 解答问题，如：
  - 哪种媒体对销售有贡献？
  - 哪种媒体对销售量的提升贡献最大？
  - TV广告费用的增长将导致多少销售量的增长？

基于示例的学习

如何估算 $f$ ？
已有一组观察数据（训练数据）：
$\{(x_1,y_1),(x_2,y_2),\dots ,(x_n,y_n)\}$ ， $x_i$ 是 $p$ 个元素的矢量
通过已观察到的（训练）数据估算未知的 $f$ ，发现 $f^{'}$ ，使得 $Y\approx f'(X)$
两类通用的方法：参数化方法与非参数化方法

参数化方法：基于模型的方法

第一步：假设函数 $f$ 的形式/形状，如 $f$ 假设是线性的（模型）
$f(X)=\beta_0+\beta_1X_1+\beta_2X_2+\dots +\beta_pX_p$
第二步：使用训练数据，来训练这个模型。问题简化成估算参数的值 $\beta_0,\beta_1 ,\dots ,\beta_p$
$Y\approx \beta_0+\beta_1X_1+\beta_2X_2+\dots +\beta_pX_p$
特点：

泛化能力强(generalization)
解释性强，适于判断X与Y的关联（推理）
参数化方法弱处：
有可能与真实的 $f$ 形状非常不同，预测精度相差较大。

非参数方法

不假设 $f$ 的形式/形状，而是尽可能地拟合观察（训练）数据
特点：可以拟合更多形式/形状的 $f$ ，故预测精度高
缺点：需要大量的观察数据（训练数据），以便训练一个有精度的模型（针对 $f$ ），否则容易过拟合(overfitting)

预测精度与模型可解释性的权衡

参数化方法：不灵活、更受限（估算的 $f$ 形状局限于小范围内）
非参数方法：更灵活的（拟合性好）、估算的 $f$ 形状在大范围内变化
既然有更灵活的方法，为何选择应用比较受限的方法？
- 以推理/解释为目的。线性模型易于解释各观测变量X与响应变量Y之间的关系
- 而描述形状更灵活的方法如SVM、Bagging&Boosting、DNN等理解观测变量X与响应变量Y间的关联是很困难的
  如下图：

回归

线性回归

最简单形式的线性回归：单一观测变量 $\beta_0 +\beta_1 X$ 已知有一组观察数据（训练数据）： $\{(x_1,y_1),(x_2,y_2),\dots ,(x_n,y_n)\}$ ，其中第i个观测数据的误差（残差）： $e_i = y'_i - y_i$ ；目标是求得参量 $\beta_0$ 和 $\beta_1$ 以最小化误差（损失）函数 $Loss(\beta)=\Sigma^n_{i=1}(y'_i - y_i)^2$
最小二乘法： $\beta_1 = \frac{\Sigma^n_{i=1}(x_i-\bar{x})(y_i-\bar{y})}{\Sigma^n_{i=1}(x_i-\bar{x})^2}$ $\beta_0 = \bar{y} - \beta_1 \bar{x}$ $\bar{x} = \Sigma^n_{i=1}\frac{x_i}{n}~\bar{y} = \Sigma^n_{i=1}\frac{y_i}{n}$
举例：

$\beta_1 = 3.5~\beta_0 = 23.6~Y\approx 23.6+3.5X$
预测10年工龄员工的工资：58.6k

多元线性回归

多元回归模型： $Y=\beta_0+\beta_1X_1+\beta_2X_2+\dots +\beta_nX_n$ 示例： $\beta_0~+~\beta_1~ \times~ radio~+~\beta_2~\times~tv~+\beta_3~\times~newspaper$
极小化损失函数（目标函数）： $Loss(\beta)=\Sigma^n_{i=1}(f'_{\beta}(x_i)-y_i)^2$
最小二乘法求解参数 $Loss(\beta)=\Sigma^n_{i=1}e^2 =\Sigma^n_{i=1}(y'-y)^2\\=e'e=(Y-Y')'(Y-Y')=(Y-X\beta)'(Y-X\beta) \\=Y'Y-\beta'X'Y-YX\beta +\beta'X'X\beta \\=Y'Y-2\beta'X'Y +\beta'X'X\beta$ 上式求偏导极小化损失函数： $\frac{\partial Loss(\beta)}{\partial \beta}=\frac{\partial (Y'Y-2\beta'X'Y+\beta'X'X\beta)}{\partial\beta} = -2X'Y+2X'X\beta = 0$ 因此 $\beta = (X'X)^{-1}X'Y$

回归模型的线性假设

线性回归假设一
- 观测变量 $X=(X_1,X_2,\dots ,X_p)$ 与响应变量间的关系是累加性(additive)的（变量独立） $\beta_0 +\beta_1X_1 +\beta_2 X_2$
- 例如有两个观测变量时，扩展考虑变量间的相关性，示例： $Y=\beta_0+\beta_1X_1+\beta_2X_2+\beta_3X_1X_2 \\ Y=\beta_0 +(\beta_1+\beta_3X_2)X_1+\beta_2X_2 \\ Y = \beta_0 +\hat{\beta_1}X_1+\beta_2X_2$ $sales~=~\beta_0~+~(\beta_1~+~\beta_3\times radio)\times yv~+~\beta_2\times radio$
线性回归模型假设二
- 观测变量X与响应变量Y间的关系是线性的
- 多项式回归，扩展地表示非线性关系为多元线性回归 $Y=\beta_0 +\beta_1X+\beta_2X^2+\beta_3X^3+\dots +\beta_nX^n$
- 例如 $n$ 取值为3： $=\beta_0+\beta_1X_1+\beta_2X_2+\beta_3X_3 \\X_1=X~X_2=X^2~X_3=X^3$

Logistic回归

引入

有两种预测问题：

响应变量Y是连续型（数值型）：线性回归，用于数值型问题解决
响应变量Y是离散型（类目型）：逻辑(Logistic)回归，用于分类问题解决
二元分类问题（0，1）
- 并不直接模型化响应变量Y
- Logistic回归模型化Y属于一个特定类的概率，即模型化 $P r (Y = 0 ∣ X)$ 与 $X$ 的关系

Logistic回归

Logistic函数（Sigmoid函数） $f(z)=\frac{1}{1+e^{-z}}$ $z=\beta_0 +\beta_1X_1+\dots +\beta_nX_n$
[0,1]区间平滑曲线，且 $f (z) + f (- z) = 1$
二元分类： $P (y = 0 ∣ z) = f (z)$ $P (y = 1 ∣ z) = 1 - f (z)$

Logistic回归与贝叶斯方法

二分类（类C1：y=0；类C2：y=1）
$P(C1|X)=\frac{P(X,C1)}{P(X)}=\frac{P(X|C1)P(C1)}{P(X)}\\ =\frac{P(X|C1)P(C1)}{P(X|C1)P(C1)+P(X|C2)P(C2)}\\ =\frac{1}{1+e^{-\alpha}}$
其中
$\alpha =ln\frac{P(X|C1)P(C1)}{P(X|C2)P(C2)}$
逻辑回归（判别模型）
极大似然估计：决定最优参数 $\beta^{*}$ : $\beta^{*}\leftarrow arg_{\beta}max\Pi^m_{i=1}P(Y_i|X_i,\beta)$
目标函数：求全局最优解
$f(\beta) = \Sigma^m_{i=1}[Y_iln~P(Y_i=1|X_i,\beta)+(1-Y_i)ln~P(Y_i=0|X_i,\beta)]\\ =\Sigma^m_{i=1}[Y_iln\frac{P(Y_i=1|X_i,\beta)}{P(Y_i=0|X_i, \beta)} + ln~P(Y_i=0|X_i,\beta)]\\ =\Sigma^m_{i=1}[Y_i(\beta_0+\Sigma^n_{j=1}\beta_jX^{(j)}_i)-(1+exp(\beta_0+\Sigma^n_{j=1}\beta_jX^{(j)}_i))]$
朴素贝叶斯（生成模型）
二元分类 $Y\in \{0,1\}$ : $P(Y|X)=\frac{P(X,Y)}{P(X)}=\frac{P(X|Y)P(Y)}{P(X)}$
条件独立性假设 $X=(x_1,x_2,\dots ,x_n)$ : $P(X|Y)=\Pi^n_{i=1}P(x_i|Y)$
假设在Y类中变量 $x\in X$ 的概率分布服从高斯（正态）分布
概率密度函数 $P(x|Y)=\frac{1}{\sqrt{2\pi}\sigma_k}e^{-\frac{(x-\mu_k)^2}{2\sigma_k^2}}$

你可能感兴趣的:(数学与逻辑,机器学习,深度学习,人工智能,数据分析)

使用matlab的热门问题七十二五值得关注 matlab 开发语言青少年编程算法经验分享
MATLAB广泛应用于科学计算、数据分析、信号处理、图像处理、机器学习等多个领域，因此热门问题也涵盖了这些方面。以下是一些可能被认为当前最热门的MATLAB问题：深度学习与神经网络：如何使用MATLAB的深度学习工具箱（DeepLearningToolbox）来构建和训练神经网络？如何利用MATLAB进行图像识别、语音识别或自然语言处理等深度学习应用？数据分析与可视化：如何使用MATLAB进行大数
如何在Python中处理不平衡数据葡萄_ac1c
Index1、到底什么是不平衡数据2、处理不平衡数据的理论方法3、Python里有什么包可以处理不平衡样本4、Python中具体如何处理失衡样本印象中很久之前有位朋友说要我写一篇如何处理不平衡数据的文章，整理相关的理论与实践知识（可惜本人太懒了，现在才开始写），于是乎有了今天的文章。失衡样本在我们真实世界中是十分常见的，那么我们在机器学习（ML）中使用这些失衡样本数据会出现什么问题呢？如何处理这些
【机器学习】机器学习的基本概念、算法的工作原理、实际应用案例 @我们的天空人工智能技术机器学习算法人工智能自然语言处理金融 python sklearn
一、机器学习的基本概念定义：机器学习是人工智能的一个分支，它使计算机能够在没有明确编程的情况下从数据中学习并改进其性能。机器学习的目标是让计算机自动学习模式和规律，从而能够对未知数据做出预测或决策。主要类型：监督学习：在这种类型的学习中，算法通过已知输入输出数据对进行训练，学习映射函数，以便对新的输入数据进行预测。常见的监督学习任务包括分类和回归。无监督学习：无监督学习的任务是发现数据中的结构或模
从零开始设计一款全新GPU jack_201316888 GPU AI大模型渲染GPU GPGPU
（提纲：：）设计一款全新的GPU（图形处理单元）是一项复杂且多方面的工程工作，涉及到硬件架构、软件编程模型、性能优化、功耗管理等多个领域。以下是从零到一设计一款全新GPU的基本步骤和关键考虑因素。1.定义需求和目标1.1应用场景首先，需要明确GPU的应用场景。这可以是图形渲染（如游戏、电影制作）、通用计算（如科学计算、人工智能训练）、嵌入式系统（如移动设备、汽车电子）等。1.2性能目标根据应用场景
深度学习目标检测入门COCO数据集日暮途远z 深度学习目标检测人工智能
常见数据集类型：COCO数据集：Pytorch加载COCO数据集：COCO数据集的读取COCO_dataset=torchvision.datasets.CocoDetection(root="./dataset/val2017",annFile="./instances_val2017/instances_val2017.json")root(strorpathlib.Path)–Rootdir
【数据获取与读取】JSON & CSV yogurt=b 数据分析 json python
数据分析流程获取数据-读取数据-评估数据-清洗数据-整理数据-分析数据-可视化数据公开数据集飞桨（百度旗下深度学习平台）数据集：https:/aistudio.baidu.com/aistudio/datasetoverview天池（阿里云旗下开发者竞赛平台）:https:/tianchiaiyun.com/dataset/和鲸社区（数据科学开源社区）数据集：htps://www.heywhale
DL参考资源（二） antkillerfarm 深度学习
DL参考资源推荐系统https://zhuanlan.zhihu.com/p/26237106深度学习在推荐算法上的应用进展http://i.dataguru.cn/mportal.php?mod=view&aid=11463深度学习在推荐领域的应用https://mp.weixin.qq.com/s/hGvQvddD3i858XSK4z08Ug主要推荐系统算法总结及Youtube深度学习推荐算法
每个分布式营销团队都应该使用的5种分析工具 AI进修生分布式
没有数据分析的营销就像没有计划的训练——当然，你可能会取得一些进展，但是你很可能没有将工作时间和努力投资在最有效的方式上。它是没有方向的，容易变成毫无目的的磨炼，通常会产生不可预测或次优的结果。但你已经了解这些了，所以你用GoogleAnalytics来追踪你网站的性能指标。你还可能会定期查看你的邮件和社交媒体营销平台内置的分析工具，以监控你的内容和广告表现。但这足够吗？特别是当你希望你的营销团队
COI实验室技能：图像到图像的深度学习开发框架（pytorch版）山颠海涯深度学习 pytorch 人工智能
Basicdeeplearningframeworkforimage-to-image这个开发框架旨在帮助科研人员快速地实现图像到图像之间的模型开发。github连接：https://github.com/SituLab/Basic-deep-learning-framework-for-image-to-image目录1模型开发1-1克隆项目到本地1-2深度学习开发2环境配置2-1安装conda
【专题】2024年中国AI人工智能基础数据服务研究报告合集PDF分享（附原数据表）拓端研究室人工智能
原文链接：https://tecdat.cn/?p=37516随着人工智能技术的迅猛发展，AI基础数据服务行业迎来了前所未有的发展机遇。报告合集显示，2023年中国AI基础数据服务市场规模达到45亿元，且未来五年复合增长率有望达到30.4%。多模态大模型、长文本处理能力提升以及大模型小型化技术成为AI领域热点研究方向，从而推动了对高质量数据的大量需求。阅读原文，获取专题报告合集全文，解锁文末403
【自然语言处理】自然语言处理NLP概述及应用 @我们的天空人工智能技术 nlp 人工智能深度学习 python 机器学习自然语言处理 scikit-learn
自然语言处理（NaturalLanguageProcessing，简称NLP）是一门集计算机科学、人工智能以及语言学于一体的交叉学科，致力于让计算机能够理解、解析、生成和处理人类的自然语言。它是人工智能领域的一个关键分支，旨在缩小人与机器之间的交流障碍，使得机器能够更有效地识别并响应人类的自然语言指令或内容。自然语言处理NLP概述基本任务：文本分类：将文本划分为预定义的类别，如情感分析、主题分类等
大模型面试通关指南：常见问题与答案解析史上最全超详细收藏我这一篇就够了程序员辣条面试职场和发展大模型人工智能 AI大模型
大模型相关的面试问题通常涉及模型的原理、应用、优化以及面试者对于该领域的理解和经验。以下是一些常见的大模型面试问题以及建议的回答方式：请简述什么是大模型，以及它与传统模型的主要区别是什么？回答：大模型通常指的是参数数量巨大的深度学习模型，如GPT系列。它们与传统模型的主要区别在于规模：大模型拥有更多的参数和更复杂的结构，从而能够处理更复杂、更广泛的任务。此外，大模型通常需要更多的数据和计算资源进行
大模型落地指南：从下载到本地化部署全流程解析网安猫叔人工智能自然语言处理语言模型 AIGC 深度学习
一、引言随着人工智能技术的迅猛发展，大规模预训练模型（如GPT-4、BERT等）在自然语言处理、图像识别等领域展现出了卓越的性能。然而，如何将这些强大的模型从理论落地到实际应用中，仍然是许多技术从业者面临的挑战。本篇文章旨在为读者提供一份详尽的大模型落地指南，从模型的下载、文件结构的解析，到本地化部署的具体步骤，全面覆盖整个流程。无论你是初次接触大模型的新手，还是希望深入了解部署细节的资深开发者，
ChatGPT在环境科学领域的应用前沿分享树谷-胡老师科研会议 chatgpt
ChatGPT在环境科学领域的应用前沿在党的二十届三中全会上，明确要求健全因地制宜的发展新质生产力体制机制。新质生产力通过创新驱动，以高科技、高效能、高质量为特征，旨在摆脱传统经济增长方式和生产力发展路径，符合新发展理念。环境科学的新质生产力主要体现在基础数据、数据管理和数据分析三方面。通过增加数据覆盖率、提升数据管理自动化水平和利用人工智能（AI）进行数据分析，实现环境质量的实时监控和管理，为环
如何在5个步骤中编写更好的ChatGPT提示 AI脑极体 chatgpt 人工智能
ChatGPT是一个风靡全球的生成式人工智能(AI)工具。虽然它有可能编造一些东西，但是通过精心设计提示，可以确保获得最佳结果。在这篇文章中，我们将探讨如何做到这一点。在本文中，我将向你展示如何编写提示，激励驱动ChatGPT的大语言模型（LLM）提供最佳答案。另请参阅:自从ChatGPT问世以来，我测试了几十个AI聊天机器人。这里是我最新的首选编写有效提示，通常被称为提示工程，已经成为一个高薪职
自然语言处理系列六十六》对话机器人项目实战》对话机器人原理与介绍陈敬雷-充电了么-CEO兼CTO python 人工智能算法自然语言处理机器人人工智能 AIGC chatgpt gpt ai
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》（人工智能科学与技术丛书）【陈敬雷编著】【清华大学出版社】文章目录自然语言处理系列六十六对话机器人项目实战》对话机器人原理与介绍对话机器人项目代码实战总结自然语言处理系列六十六对话机器人项目实战》对话机器人原理与介绍对话机器人是一个用来模拟人类对话或聊天的计算机程序，本质上是通过机器学习和人工智能等技术让
OPENAI中RAG实现原理以及示例代码用PYTHON来实现 dzend aigc python 开发语言 ai
OPENAI中RAG实现原理以及示例代码用PYTHON来实现1.引言在当今人工智能领域，自然语言处理（NLP）是一个非常重要的研究方向。近年来，OPENAI发布了许多创新的NLP模型，其中之一就是RAG（Retrieval-AugmentedGeneration）模型。RAG模型结合了检索和生成两种方法，可以用于生成与给定问题相关的高质量文本。本文将介绍RAG模型的实现原理，并提供使用Python
《机器学习》—— XGBoost（xgb.XGBClassifier）分类器张小生180 机器学习人工智能
文章目录一、XGBoost分类器的介绍二、XGBoost（xgb.XGBClassifier）分类器与随机森林分类器（RandomForestClassifier）的区别三、XGBoost（xgb.XGBClassifier）分类器代码使用示例一、XGBoost分类器的介绍XGBoost分类器是一种基于梯度提升决策树（GradientBoostingDecisionTree，GBDT）的集成学习算
2021年05月1-11检视成长为价值投资者
5月目标：3日前完成应收账款更新---增加逾期并作为绩效的扣除项，不停与人沟通交流，好处增加催货款的主动性，财务控制作用，坏处就得罪人，增加日常工作量。考虑增加奖励项。工行贷款进行时，兴业贷款进行时。11日前完成月度数据分析--完成。15日前完成相关税务报表--完成。24日凭证整理装订投资及紫微斗数阅读，完善年度计划，目标不会高于梦想，所以自己的梦想不设限！一、事业（25分）目标：有老板的全局思维
自动编码器 - Autoencoder hellozhxy 深度学习人工智能机器学习
文章目录一、自编码器（Autoencoder）简单模型介绍二、神经网络自编码模型三、神经网络自编码器三大特点四、自编码器（Autoencoder）搭建五、几种常见编码器1.堆栈自动编码器2.欠完备自编码器3.正则自编码器4.噪自编码器（denoisingautoencoder,DAE）参考链接一、自编码器（Autoencoder）简单模型介绍暂且不谈神经网络、深度学习等，仅仅是自编码器的话，其原理
Autoencoder chuange6363 人工智能 python
自编码器Autoencoder稀疏自编码器SparseAutoencoder降噪自编码器DenoisingAutoencoder堆叠自编码器StackedAutoencoder本博客是从梁斌博士的博客上面复制过来的，本人利用Tensorflow重新实现了博客中的代码深度学习有一个重要的概念叫autoencoder，这是个什么东西呢，本文通过一个例子来普及这个术语。简单来说autoencoder是一
Python Pandas将 DataFrame 转换为列表详解 Rocky006 python pandas 开发语言数据分析
概要在数据分析和处理过程中，经常会使用到Pandas库来处理和操作数据。Pandas提供了灵活强大的数据结构DataFrame，它可以存储和处理各种类型的数据，并提供了丰富的方法和函数来进行数据操作。有时候，我们需要将DataFrame转换为列表形式，以便进一步处理或者与其他库进行集成。本文将详细介绍如何使用Pandas将DataFrame转换为列表，并提供丰富的示例代码来帮助读者更好地理解和应用
大语言模型的上下文窗口（Context Windows）：对人工智能应用的影响澳鹏Appen 生成式AI 人工智能与机器学习 RAG 人工智能语言模型自然语言处理
大语言模型（LLMs）极大地提升了人工智能在理解和生成类人文本方面的能力。其中一个影响其效用的基本方面是它们的“上下文窗口”——这个概念直接影响着这些模型接收和生成语言的有效性。我将深入探讨上下文窗口是什么、它们对人工智能应用的影响以及组织在利用大语言模型时的一些考量。澳鹏在提升大语言模型开发方面处于领先地位，提供一系列对超越当前性能基准至关重要的服务。我们专注于大语言模型创建的复杂细节，包括上下
全能型AI与专业型AI：多样性与精专性的博弈 wangzaojun 人工智能
随着人工智能技术的不断进步，AI的应用已经从单一领域扩展到几乎所有行业。近日，OpenAI宣布将在秋季推出代号为“草莓”的全新AI模型，这款全能型AI能够从复杂的数学计算到主观的营销策划，展现出令人惊叹的多样性。这一消息引发了广泛讨论：全能型AI是否会成为未来AI产品的发展方向？相比之下，专业型AI能否继续保持其不可替代的市场地位？本文将探讨全能型AI与专业型AI的优劣势，并分析其未来发展潜力。一
关于深度森林的一点理解 Y.G Bingo 机器学习方法机器学习神经网络
2017年年初，南京大学周志华老师上传了一篇名为：DeepForest：TowardsAnAlternativetoDeepNeuralNetworks的论文，一石激起千层浪，各大媒体纷纷讨论着，这似乎意味着机器学习的天色要变，实则不然，周志华老师通过微博解释道，此篇论文不过是为机器学习打开了另一扇窗，是另一种思维，而不是真的去替代深度神经网络（DNN）。下面我就简单概括一下我对这篇论文的理解，如
深度学习部署：Triton（Triton inference server）【旧称：TensorRT serving，专门针对TensorRT设计的服务器框架，后来变为Triton，支持其他推理后端】 u013250861 #LLM/部署深度学习人工智能
triton作为一个NVIDIA开源的商用级别的服务框架，个人认为很好用而且很稳定，API接口的变化也不大，我从2020年的20.06切换到2022年的22.06，两个大版本切换，一些涉及到代码的工程变动很少，稍微修改修改就可以直接复用，很方便。本系列讲解的版本也是基于22.06。本系列讲解重点是结合实际的应用场景以及源码分析，以及写一些triton周边的插件、集成等。非速成，适合同样喜欢深入的小
五款BI对比分析 qq_43696218 信息可视化
本文将用一两段话来概括市面上比较常用的五款BI软件，至于究竟哪一款BI软件更适合你，则需要根据自己的情况进行选择了。注意：以下排名不分先后1、FineBIFineBI是一款国产的BI工具，以其本土化做得好和学习教程完善而广受欢迎。它提供了与国产数据库的高适配度和适合中国人使用习惯的图表、指标，使得业务人员能够更轻松地理解和分析数据。FineBI的易用性和强大的数据分析功能使其成为业务人员的得力助手
多模态视野：探索Qwen-VL的70亿参数世界努力犯错人工智能计算机视觉深度学习 gpt-3 语言模型
引言在人工智能的迅猛发展中，多模态大模型成为了新的研究热点。阿里云推出的Qwen-VL模型，就是在这一领域的重要突破。作为一款基于70亿参数的通义千问模型Qwen-7B开发的多模态视觉语言模型，Qwen-VL不仅在技术上实现了创新，更在多模态任务评测中展现出卓越的性能。官网demo技术特点Qwen-VL模型的核心在于其多模态理解能力。它能够同时处理图像和文本信息，实现更加全面和深入的数据解析。这一
倒计时5天！“SMP-智谱AI大模型交叉学科基金”第二期持续申报中！数百万元现金或等额赞助支持... AITIME论道人工智能
点击蓝字关注我们AITIME欢迎每一位AI爱好者的加入！|本基金申报截止时间为2024年9月8日。随着人工智能和大模型技术的飞速发展，大模型技术在各个学科领域的应用已经展现出巨大的潜力和影响力。中国中文信息学会社会媒体处理专委会（http://www.cips-smp.org）联合北京智谱华章科技有限公司（以下简称“智谱AI”），共同推出“SMP-智谱AI大模型交叉学科基金”第二期。SMP-智谱A
微积分在神经架构搜索中的应用光剑书架上的书深度强化学习原理与实战元学习原理与实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
微积分在神经架构搜索中的应用1.背景介绍随着深度学习技术的飞速发展,神经网络模型的复杂度也在不断提高,从最初的简单全连接网络,到如今的卷积神经网络、循环神经网络、注意力机制等各种复杂的神经网络架构。这些先进的神经网络架构大大提高了深度学习模型的性能,但同时也给神经网络的设计和调优带来了巨大的挑战。手工设计神经网络架构通常需要大量的专业知识和经验积累,过程繁琐复杂,难以推广。为了解决这一问题,神经架
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他