E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
DataWhale
第八章 文本数据
来源:https://
datawhale
china.github.io/joyful-pandas/build/html/%E7%9B%AE%E5%BD%95/ch8.html一、str对象定义在Index
叶小刀_b59f
·
2023-12-19 13:24
Datawhale
12月组队学习 leetcode基础 day3 递归
这是一个新的专栏,主要是一些算法的基础,对想要刷leedcode的同学会有一定的帮助,如果在算法学习中遇到了问题,也可以直接评论或者私信博主,一定倾囊相助进入正题,今天咱们要说的是递归,递归是是很多初学者比较头疼的问题啊,在这篇博客里,我会先阐述一下递归的定义,然后再举几个例子来证明一下,最后咱们练个小题强化一下。递归算法递归算法简介递归算法解题思路例题例题1练习递归算法简介首先说一下递归的含义,
struggle2003
·
2023-12-17 07:07
学习
leetcode
算法
【
Datawhale
大模型基础】第五章 大模型法律 【AI创作的图片是否受到版权法保护?是否被称为作品?】
第五章大模型法律WhentrainingLLMs,wemustaddressissuesofcopyrightandfairuse.Obtainingpermissionsfromeveryindividualduetotheindiscriminatenatureofwebscrapingwouldbeextremelychallenging.Thegenerativenatureofthemo
皓哥好运来
·
2023-12-16 23:03
LLM
人工智能
机器学习
【
Datawhale
大模型基础】第六章 大模型的模型架构(中文版)
这篇博客基于
Datawhale
学习文件和一个写的很好的综述。6.1典型架构Transformer架构已成为创建各种LLMs的主导框架,使得语言模型的参数规模能够扩展到数百亿甚
皓哥好运来
·
2023-12-16 23:51
LLM
人工智能
语言模型
【
Datawhale
组队学习】2023年11月动手学大模型应用开发 —— 第一章 大模型简介
一、大模型基本概念大语言模型(英文:LargeLanguageModel,缩写LLM),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。通常,大语言模型(LLM)指包含数百亿(或更多)参数的语言模型,这些模型在大量的文本数据上进行训练。国外的大模型有:GPT-3GPT-4PaLMGalacticaLLaMA国内的大模型有:ChatGLM文心一言通义千问讯飞星火尽管大型语言模型(例如拥
zadarmo_
·
2023-12-16 19:19
深度学习
学习
【DW12月-推荐系统】Task01 熟悉推荐系统基本流程
参考链接:https://github.com/
datawhale
china/fun-rec一、掌握数据分析方法数据分析的价值主要在于熟悉了解整个数据集的基本情况包括每个文件里有哪些数据,具体的文件中的每个字段表示什么实际含义
沫2021
·
2023-12-16 03:03
【
Datawhale
大模型基础】第四章 大模型的数据
第四章大模型的数据TherelationshipbetweenLLMsandpre-trainingdatasetsislikethatofamusicianandtheirsheetmusic.Thepre-trainingdatasetisakintovariouspiecesofsheetmusic,whiletheLLMislikeaskilledmusicianwho,bystudyin
皓哥好运来
·
2023-12-15 10:39
LLM
人工智能
语言模型
笔记
【
Datawhale
大模型基础】第二章 大模型的能力
第二章大模型的能力WithLLMshavingsignificantlymoreparametersthanPLMs,anaturalquestionarises:whatnewcapabilitiesdoesthelargerparametersizebringtoLLMs?Inthepaper“Emergentabilitiesoflargelanguagemodels”,anewconcep
皓哥好运来
·
2023-12-15 10:08
LLM
人工智能
语言模型
【
Datawhale
大模型基础】第三章 大型语言模型的有害性(危害)
第三章大型语言模型的有害性(危害)Asillustratedaforementioned,LLMshaveuniqueabilitiesthatpresentonlywhenthemodelhavehugeparameters.However,therearealsosomeharmsinLLMs.Whenconsideringanytechnology,wemustcarefullyweighi
皓哥好运来
·
2023-12-15 10:58
LLM
语言模型
人工智能
自然语言处理
算法岗面试复盘:阿里,百度,作业帮,华为
↑↑↑关注后"星标"
Datawhale
每日干货&每月组队学习,不错过
Datawhale
干货作者:苏young,整理:NewBeeNLP写在前面先介绍下个人情况,本科金融,辅修数学,研究生转应用统计,主要申算法岗
Datawhale
·
2023-12-15 09:41
算法
人工智能
编程语言
机器学习
java
【DW12月-推荐系统】Task03 离线物料系统的构建
参考链接:https://github.com/
datawhale
china/fun-rec/blob/master/docs/image.png一、物料侧画像的构建1.1新物料来源物料是通过每天在新闻网站上爬取获取的
沫2021
·
2023-12-14 16:45
Datawhale
12月组队学习 leetcode基础 day1 枚举
这是一个新的专栏,主要是一些算法的基础,对想要刷leedcode的同学会有一定的帮助,如果在算法学习中遇到了问题,也可以直接评论或者私信博主,一定倾囊相助进入正题,今天咱们要说的枚举算法,这是个很简单的算法哈,先说一下原理然后就看几道题练一下,算是很好学的算法了枚举算法枚举算法简介枚举算法解题思路例题例题1例题2练习枚举算法简介这里简单的和大家分享一下什么是枚举,简单来说,就是一一列举可能出现的情
struggle2003
·
2023-12-14 14:43
leetcode基础
学习
leetcode
算法
datawhale
开源项目:动手学大模型应用开发第二三次打卡调用大模型API大模型开发流程及架构
一、基本概念1.PromptPrompt最初是NLP(自然语言处理)研究者为下游任务设计出来的一种任务专属的输入模板,类似于一种任务(例如:分类,聚类等)会对应一种Prompt。在ChatGPT推出并获得大量应用之后,Prompt开始被推广为给大模型的所有输入。即,我们每一次访问大模型的输入为一个Prompt,而大模型给我们的返回结果则被称为Completion。例如,在下面示例中,我们给Chat
soulermax
·
2023-12-02 18:33
架构
ai
语言模型
人工智能
AI编程
AIGC
python
策略算法与Actor-Critic网络
策略算法教程链接
DataWhale
强化学习课程JoyRLhttps://johnjim0816.com/joyrl-book/#/ch7/main策略梯度与前面的基于价值的算法不同,这类算法直接对策略本身进行近似优化
数分虐我千百遍
·
2023-12-01 01:38
算法
手把手教你Autodl平台Qwen-7B-Chat FastApi 部署调用
手把手带你在AutoDL上部署Qwen-7B-ChatFastApi调用项目地址:https://github.com/
datawhale
china/self-llm.git如果大家有其他模型想要部署教程
Unicornlyy
·
2023-11-29 23:44
大模型
fastapi
Qwen
人工智能
语言模型
手把手教你在AutoDL上Qwen-7B-Chat WebDemo Qwen-7B-Chat 网络演示
手把手带你在AutoDL上Qwen-7B-ChatWebDemoQwen-7B-Chat网络演示项目地址:https://github.com/
datawhale
china/self-llm.git如果大家有其他模型想要部署教程
Unicornlyy
·
2023-11-29 23:44
大模型
人工智能
webdemo
Qwen
大模型
手把手教你在AutoDL上部署Qwen-7B-hat Transformers 部署调用
手把手带你在AutoDL上部署Qwen-7B-hatTransformers调用项目地址:https://github.com/
datawhale
china/self-llm.git如果大家有其他模型想要部署教程
Unicornlyy
·
2023-11-29 23:10
大模型
人工智能
LLM
transformer
LLM大语言模型学习资料整理2308
2333331、吴恩达与OpenAI合作系列课程(中文版)《面向开发者的LLM入门课程》在线阅读地址:https://
datawhale
china.github.io/prompt-engineering-for-developers
Mango_Holi
·
2023-11-29 19:05
语言模型
人工智能
自然语言处理
AI 夏令营第三期 - 基于论文摘要的文本分类与关键词抽取挑战赛学习笔记3
背景
Datawhale
联合科大讯飞、阿里云天池平台开设了机器学习、深度学习、AIforScience三个方向的夏令营学习。
话不多说干起来
·
2023-11-29 01:02
人工智能
学习
笔记
python
2023.10
DataWhale
扩散模型学习笔记——Week2
项目地址:DocsNotebook地址(推荐使用googlecolab打开):https://github.com/huggingface/diffusion-models-class/tree/main/unit2推荐阅读材料:《扩散模型-从原理到实战》第五章本文为大家介绍扩散模型的三种进阶操作方式:1.微调2.引导3.Conditioning微调(Fine-tuning)基于一个预训练好的模型
godlikesun97
·
2023-11-29 01:31
学习
笔记
2020-04-01
#
Datawhale
零基础入门数据挖掘-Task4建模调参##四、建模与调参Tip:此部分为零基础入门数据挖掘的Task4建模调参部分,带你来了解各种模型以及模型的评价和调参策略,欢迎大家后续多多交流。
黑乎乎AI
·
2023-11-27 17:24
datawhale
pandas 打卡08 文本数据
内容简介这次文章的内容是pandas的文本数据文章目录内容简介string类型介绍以及与object的区别正则表达式三、文本处理的五类操作1.拆分2.合并匹配替换提取string类型介绍以及与object的区别从pandas的1.0.0版本开始,引入了string类型,其引入的动机在于:原来所有的字符串类型都会以object类型的Series进行存储,但object类型只应当存储混合类型,例如同时
Linzijiandevx
·
2023-11-27 17:42
datawhale相关
pandas
python
开发语言
Datawhale
Pandas 打卡-第四章 分组
今天学习的是第四章--分组,我觉得是非常重要和有用的pandas知识。这章主要围绕着groubpy函数,介绍了在其之上的agg、transform、apply等函数的应用。教材中总结了分组的三大操作:聚合、变换和过滤。1.聚合:groupby对象已定义了一些聚合函数,如max等。但仍有不方便之处,所以引入了agg函数。agg函数的优势在于:(1)agg函数可同时使用多个函数。agg同时使用多个函数
君恒_801f
·
2023-11-26 17:52
Linux实践
datawhale
组队学习打卡笔记Task3
本次Linux实践是
Datawhale
组织的组队学习学习资料以及Linux运行环境由开源学习组织
Datawhale
提供本次学习针对的对象:Linux不会操作,不知道文件目录创建、命令行等细节Linux不知道如何运行代码
miskirito
·
2023-11-26 14:12
1
linux
运维
服务器
六月份组队学习【深入浅出PyTorch】Task05打卡笔记
本次吃瓜教程是
Datawhale
组织的组队学习。学习资料由开源学习组织
Datawhale
提供。
miskirito
·
2023-11-26 14:12
1
学习
pytorch
人工智能
Linux实践
datawhale
组队学习打卡笔记Task2
本次Linux实践是
Datawhale
组织的组队学习学习资料以及Linux运行环境由开源学习组织
Datawhale
提供本次学习针对的对象:Linux不会操作,不知道文件目录创建、命令行等细节Linux不知道如何运行代码
miskirito
·
2023-11-26 14:42
1
linux
python
运维
DQN算法
DQN算法教程链接
DataWhale
强化学习课程JoyRLhttps://johnjim0816.com/joyrl-book/#/ch7/mainDQN算法DQN(DeepQ-Network)主要创新点在于将
数分虐我千百遍
·
2023-11-25 02:18
算法
零基础入门语音识别-食物声音识别Task1
零基础入门语音识别-食物声音识别本次新人赛是
Datawhale
与天池联合发起的零基础入门系列赛事第八场——零零基础入门语音识别-食物声音识别挑战赛。
miskirito
·
2023-11-24 12:29
1
语音识别
竞赛提升:必知必会的21篇论文!
Datawhale
干货作者:阿水,
Datawhale
成员如何更好的参与竞赛实践呢?当然是阅读论文了,本文整理了竞赛常见库和模型的论文,涵盖树模型和深度学习模型。
Datawhale
·
2023-11-22 19:20
知识库文档处理
在我们的项目中,我们以
Datawhale
的一些经典开源课程作为示例,设计了多种文件类型,介绍每一种文件类型的处理方式,从而支持用户无难度地构建自
Alexa2077
·
2023-11-22 08:19
大模型
人工智能
pytorch
python
数据分析 第二章 3.数据可视化
导入包和数据并且打印importnumpyasnpimportpandasaspdimportmatplotlib.pyplotasplttext=pd.read_csv("E:/Python/python操作/
Datawhale
玛卡巴卡的手推车
·
2023-11-22 06:39
小路
python
Tianchi发布完整开源数据集!
包含了计算机视觉,自然语言处理,金融,电商,医疗,工业,农业等数据集,非常适合学习和实践,
Datawhale
整理如下:#数据集开源地址https://tianchi.aliyun.com/dataset
小客2323
·
2023-11-22 04:05
深度学习基础
深度强化学习教程链接
DataWhale
强化学习课程JoyRLhttps://johnjim0816.com/joyrl-book/#/ch7/main深度学习基础强化学习的问题可以拆分成两类问题,即预测与控制
数分虐我千百遍
·
2023-11-22 01:04
深度学习
人工智能
手把手带你在AutoDL上部署ChatGLM3 Web Demo
手把手带你在AutoDL上部署ChatGLM3WebDemo作者:
Datawhale
不要葱姜蒜项目地址:https://github.com/KMnO4-zx/self_llm.git如果大家有其他模型想要部署教程
不要葱姜蒜_kmon4
·
2023-11-21 21:41
python
chatgpt
语言模型
Datawhale
八月学习-NLP专题-BERT和GPT
一、BERT1.什么是BERT1)BERT简介: BERT与现有语言模型不同的是,BERT旨在通过调节所有层中的上下文来进行深度双向的预训练。因此,预训练的BERT表示可以通过另外的输出层进行调整,以创建用于广泛任务的状态模型,例如问题转换和语言参考,而无需实质的任务特定体系结构修改。 BERT全称是“BidirectionalEncoderRepresentationfromTransfor
wumo_rfr
·
2023-11-21 01:32
NLP学习
机器学习
Datawhale
组队学习NLP_Bert文本分类学习笔记
1.1TransformerDatasets1.1.1datasets.Metric2数据预处理2.1定义一个tokenizer2.2Datasets2.2.1检查数据格式(可选)2.2.2Datasets预处理3Trainer微调预训练模型4超参数搜索本文为学习
Datawhale
2021.8
宝友你好
·
2023-11-21 01:02
Datawhale组队学习
自然语言处理
深度学习
机器学习
Datawhale
第六天打卡
第一题:字符串相乘给定两个以字符串形式表示的非负整数num1和num2,返回num1和num2的乘积,它们的乘积也表示为字符串形式。示例1:输入:num1="2",num2="3"输出:"6"示例2:输入:num1="123",num2="456"输出:"56088"示例3:输入:num1="498828660196",num2="840477629533"输出:"4192543298646564
hyh1996
·
2023-11-20 12:36
Datawhale
9月组队学习打卡Day9
Datawhale
9月组队学习打卡Day9写在前面10.1混合专家模型子任务和专家混合专家系统10.1.1基础知识10.1.1.1示例10.1.1.2训练10.1.1.3节约计算10.1.1.4平衡专家
royi_0825
·
2023-11-19 21:00
笔记
学习
智能驾驶汽车虚拟仿真视频数据理解(一)
赛题官网
datawhale
赛题介绍跑通demopaddle跑通demotorch提交的障碍物取最主要的那个?不考虑多物体提交。障碍物,尽可能选择状态发生变化的物体。
RessCris
·
2023-11-19 13:34
计算机视觉
汽车
贷款违约预测-Task3 特征工程
赛题:零基础入门数据挖掘-零基础入门金融风控之贷款违约项目地址:https://github.com/
datawhale
china/team-learning-data-mining/tree/master
致Great
·
2023-11-19 05:40
2.2 调用星火大模型的API
调用星火大模型的API1申请API调用权限:2调用原生星火API3统一API调用方式项目仓库地址:https://github.com/
datawhale
china/llm-universe讯飞星火认知大模型
Alexa2077
·
2023-11-19 03:53
大模型
人工智能
深度学习
pytorch
大模型
【
Datawhale
Ai 夏令营】用户新增预测挑战赛baseline
文章目录前言一、用户新增预测挑战赛教程1.赛题背景2.赛题任务3.赛题数据集4.评价指标5.比赛链接二、baseline1.解题思路2.baseline前言AI夏令营由
Datawhale
主办、联合科大讯飞
Turing_well
·
2023-11-17 03:14
Datawhale
Ai
训练营
人工智能
【
Datawhale
Ai 夏令营】用户新增预测挑战赛:分类器比较和特征工程
系列文章目录【
Datawhale
Ai夏令营】用户新增预测挑战赛baseline文章目录系列文章目录[【
Datawhale
Ai夏令营】用户新增预测挑战赛baseline](https://blog.csdn.net
Turing_well
·
2023-11-17 03:14
Datawhale
Ai
训练营
人工智能
Datawhale
AI夏令营 - NLP实践:基于论文摘要的文本分类与关键词抽取挑战赛——基础篇
DAY1入门讲解直播ingQ:如何选择机器学习算法或深度学习算法?A:在许多机器学习问题中,特征工程的重要性不容忽视。如果特征工程能够充分捕捉数据的关键特征,那么机器学习算法也能够表现良好。深度学习在某种程度上可以自动学习特征,但对于特定问题,手动设计特征可能会更有效。总而言之,当样本量足够大且数据集具有一定的特点时,使用机器学习。其中,常用的机器学习包括树模型、SVM模型;深度学习包括神经网络,
学软件的小铃铛
·
2023-11-17 03:44
人工智能
自然语言处理
python
AI Earth人工智能创新挑战赛-使用Docker提交baseline
AIEarth人工智能创新挑战赛-使用Docker提交baseline本地PC准备数据及代码在阿里云中创建镜像仓库构建镜像并推送AIEarth人工智能创新挑战赛-使用Docker提交baseline记录
DataWhale
What We Talk about
·
2023-11-17 03:42
AI
Earth挑战赛
Datawhale
-AI夏令营:脑PET图像分析和疾病预测挑战赛
importos,sys,glob,argparseimportpandasaspdimportnumpyasnpfromtqdmimporttqdmimportcv2fromPILimportImagefromsklearn.model_selectionimporttrain_test_split,StratifiedKFold,KFoldimporttorchtorch.manual_see
CV不存在了M
·
2023-11-17 03:42
人工智能
深度学习
pytorch
Datawhale
AI夏令营第三期 - 脑PET图像分析和疾病预测挑战赛——最后的挣扎及总结
最后改了模型又做了数据增强,不过好像还是没什么进步,后面了看别人的笔记,又学了一些上分技巧,在这里分享给大家,由于时间问题目前还没来得及尝试,有空了再试试,看有什么提升。大佬们的一些上分思路分享1.从数据出发对于我们这些搞机器学习的人而言,看到图像第一反应可能就是把图像加载到内存中,作为一个矩阵去跑各种机器学习算法,但我们忽略了一点,那就是图像本身的元数据。以传统图像为例,其记录的并不仅仅是图片的
cs6182890
·
2023-11-17 03:12
人工智能
深度学习
神经网络
python
天池多模态赛事,2023全球智能汽车AI挑战赛来啦!
Datawhale
大赛主办方:吉利汽车、阿里云、英伟达2023全球智能汽车AI挑战赛,由吉利汽车、阿里云、NVIDIA英伟达共同发起,阿里云天池作为官方竞赛平台。
Datawhale
·
2023-11-17 03:41
汽车
人工智能
Datawhale
AI夏令营第三期 - 脑PET图像分析和疾病预测挑战赛——Baseline修改及优化
(一)
Datawhale
AI夏令营第三期-脑PET图像分析和疾病预测挑战赛——环境搭建及PyTorchBaseline跑通上期完成Baseline跑通后,这期主要是对Baseline的优化,整队图像分类问题
cs6182890
·
2023-11-17 03:41
人工智能
深度学习
神经网络
python
Datawhale
智能汽车AI挑战赛
1.赛题解析赛题地址:https://tianchi.aliyun.com/competition/entrance/532155任务:输入:元宇宙仿真平台生成的前视摄像头虚拟视频数据(8-10秒左右);输出:对视频中的信息进行综合理解,以指定的json文件格式,按照数据说明中的关键词(key)填充描述型的文本信息(value,中文/英文均可以)评分标准:系统会针对参赛者提交的json文件,通过描
Unicornlyy
·
2023-11-17 03:10
机器学习
python学习
汽车
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他