E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
PySpark机器学习
pyspark
学习_RDD转为DataFrame
#方法1:反射机制推断RDD模式people.txtTom12Jack13Janny14from
pyspark
.sqlimportSparkSession,Rowspark=SparkSession.builder.getOrCreate
heiqizero
·
2024-01-26 02:09
spark
spark
python
pyspark
学习-RDD转换和动作
#RDD创建#1.parallelize方法:创建RDD,参数为list,返回RDDsc.parallelize(param:list)#demosc.parallelize(['tom','jack','black'])#2.textFile方法:读取文件,创建RDD,参数为hdfs文件地址或者本地文件地址,返回RDDsc.textFile(param:filepath)#demosc.text
heiqizero
·
2024-01-26 02:39
spark
spark
python
PySpark
—DataFrame笔记
本人博客园同篇文章:
PySpark
—DataFrame笔记 DataFrame基础+示例,为了自查方便汇总了关于
PySpark
-dataframe相关知识点,集合了很多篇博客和知乎内容,结合了自身实践
了无痕1314
·
2024-01-26 02:38
PySpark
spark
大数据
【Spark】
pyspark
基于DataFrame使用MLlib包
另外,根据Spark文档,现在主要的Spark
机器学习
API是spark.ml包中基于DataFrame的一套模型。1ML包的介绍从顶层上看,ML包主要包含三大抽象类:转换器、预测器和工作流。
beautiful_huang
·
2024-01-26 02:37
Spark
spark
PySpark
常见操作
DataFrame创建1、RDD转换DataFrame首先创建一个rdd对象from
pyspark
.sqlimportSparkSessioncolumns=["language","users_count
kang0709
·
2024-01-26 02:37
Spark
大数据
机器学习
pyspark
学习_dataframe常用操作_01
1.创建DataFrame本文使用DataFrame通过读取json文件获取数据,代码如下:from
pyspark
.sqlimportSparkSessionspark=SparkSeesion.builder.getOrCreate
heiqizero
·
2024-01-26 02:37
spark
spark
python
我的2023年的总结
年初,我意识到AI和
机器学习
已经成为不可逆转的趋势,尤其是在自然语言处理和图像识别领域。因此,我决定深入学习这些技术,并将其应用到我的日常工作中。我开始系统地学习深度学习框架
编程千纸鹤
·
2024-01-26 00:48
文档资料
年终总结
活动参与
02 深度学习介绍【动手学深度学习v2】
自然语言处理:语言->符号计算机视觉:在一个图片里可以帮你做一些处理->图片很难用符号解释->使用概率模型深度学习:是
机器学习
的一种、可以做自然语言处理、计算机视
不安全的安保
·
2024-01-26 00:15
动手学深度学习
机器学习
深度学习
人工智能
神经网络
chatgpt
PyTorch的衍生资源
以下是PyTorch发展过程中的几个关键里程碑事件:2016年:PyTorch于2016年首次发布,作为一个基于动态计算图的开源
机器学习
库,它提供了自动微分功能,并强调代码可读性和灵活性。
科学禅道
·
2024-01-26 00:23
PyTorch
pytorch
人工智能
python
深度学习
开源
计算机视觉
音视频
【基础配置】Python2/Python3并存安装配置教程
它可以应用于多种领域,如Web开发、数据科学、人工智能、
机器学习
、科学计算、自动化测试等。Python由GuidovanRossum于1989年底发明,目前已成为世界上最流行的编程语言之一。
晚风不及你ღ
·
2024-01-25 23:26
【工作笔记】
系统架构
python
开发语言
Day 1322:架构师训练营学习总结(w13)
本周主要讲了Spark流计算、数据分析和
机器学习
。Spark的主要特点是DAG切分多阶段计算、内存存储中间结果、RDD的编程模型。RDD是Spark的核心概念。
kafkaliu
·
2024-01-25 22:18
机器学习
系列15:通过t-SNE可视化高维数据
t-SNE的全称是t-distributedstochasticneighborembedding(t-分布随机领域嵌入),这是一种非线性降维技术。而PCA和LDA是线性的降维技术。t-SNE通常用来在二维或者三维空间中可视化复杂数据集。简单来说,t-SNE试图发现数据集中的样本在原始高维空间中距离的概率分布,然后再去低维空间中重建这种概率分布。我们通过t-SNE将高维空间中的数据点嵌入到了低维空
加百力
·
2024-01-25 22:38
深度学习
机器学习
信息可视化
人工智能
2016年不可错过的21个深度学习视频、教程和课程
几年之前,深度学习还是
机器学习
里面一个不太受人关注的领域。随着神经网络和大数据的出现,很多复杂任务的实现已经成为可能。2009年时,深度学习还是一个新兴领域,只有少数人认为这是一个值得研究的领域。
wd_cloud
·
2024-01-25 22:31
神经网络
强化学习 - Policy Gradient Methods(策略梯度方法)
什么是
机器学习
策略梯度方法(PolicyGradientMethods)是一类用于解决强化学习问题的算法,其目标是直接学习策略函数,而不是值函数。
草明
·
2024-01-25 21:53
数据结构与算法
机器学习
人工智能
算法
深度学习
无监督学习 - 聚类的潜在语义分析(Latent Semantic Analysis,LSA)
什么是
机器学习
潜在语义分析(LatentSemanticAnalysis,LSA)是一种无监督学习方法,用于在文本数据中发现潜在的语义结构。LSA的主要应用之一是进行文本文档的主题建模和信息检索。
草明
·
2024-01-25 21:23
数据结构与算法
学习
聚类
数据挖掘
机器学习
人工智能
强化学习 - Deep Q Network (DQN)
什么是
机器学习
DeepQNetwork(DQN)是一种结合深度学习和强化学习的方法,用于解决离散动作空间的强化学习问题。
草明
·
2024-01-25 21:23
数据结构与算法
机器学习
人工智能
深度学习
算法
强化学习 - Q-learning(Q学习)
什么是
机器学习
强化学习中的Q-learning(Q学习)是一种用于学习在未知环境中做出决策的方法。它是基于值函数的方法,通过学习一个值函数Q,该函数表示在给定状态和动作下,期望的累积奖励。
草明
·
2024-01-25 21:52
数据结构与算法
学习
机器学习
人工智能
深度学习
20种最常用编程语言的特点及应用
-应用场景:数据分析、
机器学习
、人工智能、Web开发、自动化脚本。2.Java-特点:跨平台、面向对象、强大的企业级框架。-应用场景:企业级应用开发、Android移动应用开发、服务器端Web开发。
极客代码
·
2024-01-25 21:39
java
c++
c语言
2024年,AIGC赛道专利文献和软著大全
发明人:周红伟;李凯;任伟;李庆;郭奇杰;周杨;刘川郁二、
机器学习
算法发表文献Simulationmodelanddropletejectionperformanceofathermal-bubblemicroejector
AI周红伟
·
2024-01-25 20:30
AIGC
人工智能
机器学习
chatgpt
Linux 安装
pySpark
1、安装Java和Scale。1.1、Java参考Java安装运行1.2、Scale安装1)下载并解压官网地址:https://www.scala-lang.org/download/wgethttps://downloads.lightbend.com/scala/2.13.1/scala-2.13.1.tgztar-zxvfscala-2.13.1.tgzmvscala-2.13.1scala
兰叶书
·
2024-01-25 20:00
Linux
《速通
机器学习
》-逻辑回归
(由于知乎平台稿件格式问题,公式格式不能正确写上;如若读写困难可后台私信我要完整电子版)线性回归是指特征x通过模型运算得到预测值y^'。在理论上,y^'的取值范围是(-∞,+∞),即y^'可以是任何值,例如销量、价格、负债等。在回归任务中,有一类特殊场景值得注意,就是预测概率。概率可用于解决分类问题。在这类场景中,模型的输出是输入样本属于某个类别的概率。例如,输入的是用户消费习惯和商品特征等信息,
北大博士后AI卢菁
·
2024-01-25 19:16
速通机器学习
机器学习
逻辑回归
人工智能
《速通
机器学习
》-因子分解模型
但是,随着互联网的发展,以及应用场景的日益复杂,人们对
机器学习
的期待日渐提高,在一些复杂的场景中,逻辑回归显得有些力不从心。例如,在电商推荐场景中预测用户是
北大博士后AI卢菁
·
2024-01-25 19:16
速通机器学习
机器学习
人工智能
《速通
机器学习
》- 经典分类模型
(由于平台稿件格式问题,公式格式不能正确写上;如若读写困难可后台私信我要完整电子版)5.1支持向量机5.1.1支持向量机的基本原理通过前面的学习我们知道,逻辑回归其实就是在平面上通过画直线进行二分类,其学习过程就是通过梯度下降法在训练数据中寻找分类线。当训练数据线性可分时,能够正确进行分类的分类线有无数条,不同的分类线对应于不同的w和w_0及不同的Loss,如图5-1所示。图5-1在图5-1中,直
北大博士后AI卢菁
·
2024-01-25 19:16
速通机器学习
机器学习
分类
人工智能
《速通
机器学习
》- 线性回归
在
机器学习
中,这类业务有一个专门的名字——回归(Regression)。回归是指通过大量已知数据发现输入x和输出y的内在关系,并对新的输入进行预测。发现内在
北大博士后AI卢菁
·
2024-01-25 19:15
速通机器学习
机器学习
线性回归
人工智能
《速通
机器学习
》- 数据的量化和特征提取
前言:读者朋友们大家好,从这篇开始更新我本人撰写的《速通
机器学习
》一书;本书已出版并发售于JD,想要实体书的可以自行购买。
北大博士后AI卢菁
·
2024-01-25 19:15
速通机器学习
机器学习
人工智能
Redis面试题32
它与传统
机器学习
有何不同?答:深度学习是
机器学习
的一个分支,在人工神经网络的基础上构建了多层的神经网络模型,以实现对复杂数据的学习和分析。
CrazyMax_zh
·
2024-01-25 19:21
redis
大创项目推荐 题目:垃圾邮件(短信)分类 算法实现
机器学习
深度学习 开题
文章目录1前言2垃圾短信/邮件分类算法原理2.1常用的分类器-贝叶斯分类器3数据集介绍4数据预处理5特征提取6训练分类器7综合测试结果8其他模型方法9最后1前言优质竞赛项目系列,今天要分享的是基于
机器学习
的垃圾邮件分类该项目较为新颖
laafeer
·
2024-01-25 18:35
分类
python
OpenCV C++(一)----入门
一、初识OpenCVOpenCV(OpenSourceComputerVisionLibrary)是开源的计算机视觉和
机器学习
库,提供了C++、C、Python、Java接口,并支持Windows、Linux
肉松饼饼
·
2024-01-25 18:28
基于雾凇算法优化多头注意力机制卷积结合长短记忆神经网络RIME-CNN-LSTM-Multihead-Attention多变量时间序列预测附MATLAB实现
更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机内容介绍随着人工智能和
机器学习
技术的飞速发展,时间序列预测在各种领域中变得越来越重要
matlab科研助手
·
2024-01-25 17:18
神经网络预测
神经网络
算法
cnn
IME-CNN-LSTM-Multihead-Attention|基于雾凇算法优化多头注意力机制卷积结合长短记忆神经网络R多变量时间序列预测附MATLAB仿真
更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机内容介绍随着人工智能和
机器学习
技术的飞速发展,时间序列预测在各种领域中变得越来越重要
Matlab科研辅导帮
·
2024-01-25 17:47
神经网络
cnn
lstm
6.PR-AUC
机器学习
模型性能的常用的评估指标
PR-AUCPR-AUC,即精确率-召回率曲线下的面积,是一种用于评估分类模型性能的指标。与ROC-AUC(接收者操作特征曲线下的面积)不同,PR-AUC关注的是精确率和召回率之间的关系,特别适用于不平衡数据集。精确率(Precision)和召回率(Recall)是分类模型中常用的两个重要指标:精确率衡量模型在预测为正类别的样本中有多少是真正的正类别。召回率衡量模型成功预测出所有正类别样本的能力。
Algorithm_Engineer_
·
2024-01-25 17:09
机器学习
机器学习
人工智能
from sklearn.preprocessing import LabelEncoder的详细用法
这在许多
机器学习
算法中是必要的,因为它们通常不能处理类别数据。1.用法说明#初始化:le=LabelEncoder()#转换标签:encoded_labels=le.fit_tra
小桥流水---人工智能
·
2024-01-25 17:52
机器学习算法
Python程序代码
sklearn
人工智能
python
pyspark
排雷
问题执行计算时,抛出异常:...java.lang.IllegalArgumentException:Unsupportedclassfilemajorversion57...经过查询,发现时
pyspark
jar
_Rango_
·
2024-01-25 16:05
借助一个例子简要了解
机器学习
练习:训练一个模型,基于适合狗的护具的大小来预测适合狗的靴子尺寸环境:azureml_pyimportpandas!wgethttps://raw.githubusercontent.com/MicrosoftDocs/mslearn-introduction-to-machine-learning/main/graphing.py!wgethttps://raw.githubuserconten
泥烟
·
2024-01-25 15:41
机器学习
机器学习
人工智能
深度学习
深度学习电脑配置有什么要求?
随着人工智能和
机器学习
的快速发展,深度学习已经成为了许多领域的重要工具。然而,深度学习的应用需要强大的计算能力,因此对于想要进行深度学习的用户来说,选择一台合适的电脑是必不可少的。
机器视觉—ing
·
2024-01-25 15:04
硬件选型
深度学习
人工智能
机器学习
/深度学习中的类别不均衡问题及处理方法
类别不均衡问题数据的类别不平衡(classimbalance),也叫数据偏斜(classskew)。以常见的二分类问题(是和否两类)为例,我们希望预测病人是否得了某种罕见疾病。但在历史数据中,阳性的比例可能很低(如0.1%)。在这种情况下,学习出好的分类器是很难的,而且在这种情况下得到结论往往也是很具迷惑性的。例如,若分类器总是预测一个人未患病,即预测为反例,那么我们依然有高达99.9%的预测准确
几时见得清梦
·
2024-01-25 14:20
向量库与嵌入模型
简介非结构化数据世界上大约超过百分之八十的数据都是非结构化数据,例如:图像、音视频、自然语言等,这些模型不遵循预定义的模式或组织方式,可以使用各种人工智能(AI)和
机器学习
(ML)模型转换为向量。
liuzhenghua66
·
2024-01-25 14:56
#
AI
人工智能
【
机器学习
】强化学习(七)-策略梯度算法-REINFORCE 训练月球着陆器代理(智能体)...
概述月球着陆器代理是一个模拟飞行器在月球表面着陆的环境,它有八个连续的状态变量,分别是水平坐标、垂直坐标、水平速度、垂直速度、角度、角速度、腿1触地、腿2触地。它有四个离散的动作,分别是什么都不做、发动左方向引擎、发动主引擎、发动右方向引擎。训练月球着陆器代理的目标是使飞行器能够安全地降落在两个黄色旗帜之间的停机坪上,最小化燃料消耗和着陆时间。为了实现这个目标,我们可以用策略梯度算法来训练一个神经
十年一梦实验室
·
2024-01-25 14:25
机器学习
算法
人工智能
智慧城市的发展过程中,最需要的15个工作岗位
1.
机器学习
科学家随着城市越来越多地利用物联网,并能够从现有资源中收集更多关于天气、交通等的数据,随后通过第三方应用程序对数据进行挖掘,数据科学家不仅需要从数据中分析和创造更多价值,还需要连接数据孤岛。
人工智能爱好者
·
2024-01-25 14:24
物联网
智慧城市
数据可视化的未来:2024 年及以后_光点科技
人工智能、
机器学习
和增强现实等新兴技术正在为新一代实时数据可视化工具铺平道路,这些工具将增强我们理解复杂数据的能力并彻底改变我们与之交互的方式。
光点数据治理
·
2024-01-25 14:43
信息可视化
科技
大数据
深度学习模型选择
作为
机器学习
科学家,我们的目标是发现模式(pattern)。但是,我们如何才能确定模型是真正发现了一种泛化的模式,而不是简单地记住了数据呢?
良子c
·
2024-01-25 12:24
动手学深度学习
深度学习
人工智能
python
机器学习
算法之神经网络算法初识
神经网络算法初识感知机算法1.概述感知机由两层神经元组成,输入层接收外界输入信号后传递给输出层,输出层是M-P神经元,亦称“阈值逻辑单元”(thresholdlogicunit)。其学习能力非常有限,若二分类数据集线性可分,即存在一个线性超平面能将它们分开,则感知机的学习过程一定会收敛而求得适当的权向量;否则感知机学习过程会发生振荡,难以稳定下来。要解决非线性可分问题,需考虑使用多层功能神经元,即
魔术师帽子里的兔子
·
2024-01-25 12:06
Scikit-Learn 高级教程——自定义评估器
PythonScikit-Learn高级教程:自定义评估器Scikit-Learn提供了许多内置的评估器(Estimator)来进行
机器学习
任务,但在某些情况下,我们可能需要自定义评估器以满足特定需求。
Echo_Wish
·
2024-01-25 11:04
Python
笔记
Python算法
scikit-learn
python
机器学习
[Python] scikit-learn - accuracy_score(准确率分数)函数介绍和使用场景(案例)
Scikit-learn是一个用于
机器学习
和数据挖掘的Python库,提供了大量的
机器学习
算法和工具,使得
机器学习
任务更加便捷和高效。
老狼IT工作室
·
2024-01-25 11:31
python
python
scikit-learn
特征抽取-----
机器学习
pycharm软件
导入包fromsklearn.datasetsimportload_iris#方法datasets_demo()数据集使用fromsklearn.feature_extractionimportDictVectorizer#方法dict_demo()字典特征抽取用fromsklearn.feature_extraction.textimportCountVectorizer#方法count_dem
辣椒酱.
·
2024-01-25 11:41
python
机器学习
pycharm
python
copilot和chatGPT的区别分析
它可以利用
机器学习
技术和大量训练数据生成高质量的代码,提高开发者的编码效率。Copilot的工作原理是基于自然语言处理、
机器学习
和深度神经网络技术,以及大规模实际编码数据的训练。
love6a6
·
2024-01-25 11:39
python
copilot
【本科生
机器学习
】【北京航空航天大学】课题报告:支持向量机(Support Vector Machine, SVM)初步研究【上、原理部分】
一、课程总结1、
机器学习
(MachineLearning,ML)的定义
机器学习
是人工智能的一个分支。
不是AI
·
2024-01-25 10:06
机器学习
python
机器学习
支持向量机
人工智能
一篇文章教你快速学会Kafka参数调优实战
附Java/C/C++/
机器学习
/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全:书单导航页(点击右侧极客侠栈即可打开个人博客):极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全
数据结构大师
·
2024-01-25 10:03
深入浅出特征工程 – 基于 OpenMLDB 的实践指南(上)
1.什么是
机器学习
的特征工程一个真实场景的
机器学习
应用一般会包含两个主体流程,即特征工程和
机器学习
模型(以下简称模型)。
第四范式开发者社区
·
2024-01-25 10:01
OpenMLDB
人工智能
机器学习
深度学习
数据挖掘
sql
深入浅出推荐系统(四):召回:向量化的潮流
只要对
机器学习
稍有涉猎,就会发现如今
机器学习
,无论是推荐、图像、语言等领域,随处可见embedding,可以说,在深度学习主宰
机器学习
领域的今天,万物皆可embedding。
慕阮
·
2024-01-25 10:00
推荐与广告
机器学习
人工智能
推荐系统
深度学习
上一页
40
41
42
43
44
45
46
47
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他