dataWhale

阅读笔记(2) 单层网络:回归

阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。

a2507283885·2025-06-28 09:41

【机器学习实战】Datawhale夏令营2：深度学习回顾

#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率

城主_全栈开发·2025-06-28 00:17

二、大模型的能力（DataWhale大模型理论基础）

大模型的能力一、概述本节主要是通过对GPT-3论文中的基准测试深入研究，从而获得关于GPT-3更深程度的认识我们应该知道，GPT-3的结果参差不齐：在某些任务上，比如语言建模，GPT-3大幅度超越了现有技术的最高水平；在其他任务上，GPT-3与训练有素，拥有大量标签数据的系统竞争时，却明显落后。造成上述现象的原因：GPT-3并未明确针对这些任务进行训练，它只是作为一个语言模型，被训练来预测下一个词

Y_fulture·2025-06-26 02:32

大模型学习（Datawhale_Happy-LLM）笔记4: 预训练语言模型

大模型学习（Datawhale_Happy-LLM）笔记4:预训练语言模型一、概述本章按Encoder-Only、Encoder-Decoder、Decoder-Only的顺序来依次介绍Transformer

lxltom·2025-06-25 11:09

【Datawhale组队学习202506】YOLO-Master task02 YOLO系列发展线

系列文章目录`文章目录系列文章目录前言V1-2015-JosephRedmonV2-2016-JosephRedmonV3-2018-JosephRedmonYOLO之父的退出V4-202004-Chien-YaoWangV5-20200609-Ultralytics公司V6-20220623-美团V7-2022-Chien-YaoWangV8-20230110-Ultralytics公司V9-2

来两个炸鸡腿·2025-06-23 22:21

Datawhale YOLO Master 第1次笔记

课程链接https://github.com/datawhalechina/yolo-masterYOLO系列模型堪称算法界的《五年高考三年模拟》：代码比字典的释义还易懂：PyTorch版源码自带"防脱发

weixin_44811994·2025-06-22 07:36

DataWhale-零基础网络爬虫技术（一）

课程链接先给各位↓↓↓（点击即可食用.QAQDatawhale-学用AI,从此开始一、引言还是在笔记的开始，唠唠一些自己的故事十年前第一次接触网络，也可以说是第一次接触计算机的时候，那时候还是在中学阶段

我怎么又饿了呀·2025-06-21 10:20

DataWhale-零基础络网爬虫技术（二er数据的解析与提取）

课程链接先给各位↓↓↓（点击即可食用.QAQDatawhale-学用AI,从此开始一、数据的解析与提取数据提取的几种方式：re解析bs4解析xpath解析1.1正则表达式（ReuglarExperssion

我怎么又饿了呀·2025-06-21 10:19

【Datawhale组队学习202506】YOLO-Master task01 导学课程

二、YOLO好在哪2.1卓越性能2.2极易学习2.3模块化设计2.4开源社区活跃三、YOLOMaster教程内容介绍总结前言Datawhale是一个专注于AI与数据科学的开源组织，汇集了众多领域院校和知名企业的优秀学习者

来两个炸鸡腿·2025-06-19 21:36

Datawhale组队学习 - 202505 - PyPOTS - Task01时序数据与PyPOTS

系列文章目录Task01-时序数据与PyPOTS文章目录系列文章目录前言1时间序列数据1.1时间序列数据的类型1.2时间序列数据示例1.3时间序列的研究与应用方向1.3.1预测Forecasting1.3.2分类Classification1.3.3聚类Clustering1.3.4异常监测AnomalyDetection1.3.5时间序列生成Generation1.3.6插补Imputation

来两个炸鸡腿·2025-06-19 21:06

【Datawhale组队学习202506】零基础学爬虫 01 初始爬虫

核心字段重要规则说明非标准扩展指令协议生效条件局限性验证工具2.3一个爬虫demo3Web请求与HTTP协议3.1一个web请求的全过程3.2判断页面源代码位置3.3HTTP协议HTTP请求HTTP响应3.4requests模块入门总结前言Datawhale

来两个炸鸡腿·2025-06-19 20:02

Datawhale 2025年2月组队学习- 推荐系统教程FunRec #Task3

第二章基于向量的召回1.item2vec未完待续……2.youtubeDnn3.经典双塔模型

dxnb22·2025-06-18 22:28

Datawhale | 最新AI Agent万字综述分享！

本文来源公众号“Datawhale”，仅用于学术分享，侵权删，干货满满。原文链接：最新AIAgent万字综述分享！

双木的木·2025-06-16 23:32

全方位入门大模型应用开发，只需一招搞定：吴恩达系列课程中文教程实战指南！

而由Datawhale团队打造的《面向开发者的大模型手册-LLMCookbook》项目，正好为有志于投身大模型开发的中文学习者提供了一套体系化、本地化的入门与实战宝典。

AI小白熊·2025-06-15 02:10

Git 3天2K星标：Datawhale 的 Happy-LLM 项目介绍（附教程）

为了帮助广大AI爱好者深入掌握大语言模型的精髓，国内最大的AI开源学习社区Datawhale推出了Happy-LLM项目。这个开源教程以

大语言模型·2025-06-09 09:08

LLM基础1_语言模型如何处理文本

基于GitHub项目：https://github.com/datawhalechina/llms-from-scratch-cn工具介绍tiktoken：OpenAI开发的专业"分词器"torch：Facebook

激进小猪1002·2025-06-08 05:54

LLM基础2_语言模型如何文本编码

基于GitHub项目：https://github.com/datawhalechina/llms-from-scratch-cn字节对编码(BPE)上一篇博文说到为什么GPT模型不需要[PAD]和[UNK

激进小猪1002·2025-06-08 05:53

机器学习西瓜书笔记——机器学习基本术语，模型性能指标【一】

西瓜书第一，二章笔记datawhale吃瓜教程task1学习笔记第一章第一张主要介绍了一些机器学习研究内容和基本术语，以及发展现状。基本术语由于有些术语过于基础，在此不做赘述大家可以去读西瓜书。

Code思铮·2025-05-31 19:45

给MCP加上RAG，工具准确率提升200%，起飞～

Datawhale分享作者：TiantianGan、QiyaoSun编辑：PaperAgent大型语言模型（LLMs）在有效利用越来越多的外部工具（如模型上下文协议（MCP）所定义的工具）方面存在困难，

Datawhale·2025-05-18 00:39

Datawhale PyPOTS时间序列5月第1次笔记

课程原地址：https://github.com/WenjieDu/PyPOTS（Package地址）https://github.com/WenjieDu/BrewPOTS/tree/datawhale

weixin_44811994·2025-05-15 01:42

Datawhale-llm-universe 第一章 LLM介绍打卡

第一章课程大纲：（本笔记大部分内容来自DataWhale的六月llm打卡课程，并融入了一些个人的理解以及思考）大型语言模型LLM理论简介LLM的定义和概念发展历程主要模型（如GPT-3、GPT-4、PaLM

星野yee·2025-05-15 01:11

Datawhale llm-universe Task1

课程链接:课程笔记本本节内容主要是讲述大语言模型是什么、大语言模型的发展过程、现在常用的大语言模型第一节课比较偏概念,我的笔记以我自己的个人理解为主。大语言模型的奠基之作:2017年google发表AttentionisAllyouneed.这篇文章提出了transformer结构,从此llm的发展就像雨后春笋.一个重要的现象:随着模型参数量的增大,模型会出现一种类似于"自我思考自我联想"的“涌现

programer_cao·2025-05-15 01:10

【datawhale组队学习】coze-ai-assistant TASK01

文章目录AI工作流CozeAgentAI工作流工作流具备了：大量的重复性任务（如内容创作、编辑、发布）和固定的业务流程（如策划、创作、审核、发布）。通过AI来标准化这些步骤，并利用工具自动执行这些流程，就可以大大提高效率。Coze智能体：基于对话的AI项目，它通过对话方式接收用户的输入，由大模型自动调用插件或工作流等方式执行用户指定的业务流程，并生成最终的回复。应用：应用是指利用大模型技术开发的应

speop·2025-05-14 09:28

DataWhale AI春训营-AI+生命科学学习笔记

赛题的核心是IDRs预测问题，需要参赛者基于给定的蛋白质序列信息，准确预测蛋白质的内在无序区域。数据标注方式：序列标注：参赛者需要对每个氨基酸位置进行标注，判断该位置是否属于无序区域。标注方式：使用二进制标签（0或1）表示每个氨基酸是否属于无序区域。例如：{'id':'disordered_protein_0','sequence':'MKQFGLAAFDELKDGKYNDVNKTILEKQSVE

Mmiraclez·2025-05-07 23:15

Datawhale AI春训营 | AI+蛋白质固有无序区域预测（蛋白质预测）

DatawhaleAI春训营|AI+蛋白质固有无序区域预测（蛋白质预测）赛题背景在生物体系中，蛋白质并非总是维持着固定的刚性结构，相当一部分蛋白质或其部分区域处于无序状态，即所谓的内在无序蛋白（IDPs

神奇鱼同学·2025-05-07 23:13

Datawhale AI春训营--蛋白质预测（AI+生命科学）

基础解题方案方法1：词向量+机器学习步骤1：训练词向量使用gensim库的Word2Vec模型对氨基酸序列进行词向量训练。将每个蛋白质序列转换为由空格分隔的字符串（’'.join(x[“sequence”])），形成句子列表。vector_size=100：词向量的维度为100。min_count=1：至少出现一次的单词才会被考虑。训练完成后，model_w2v包含了每个氨基酸的词向量表示。dat

2 0 1 2·2025-05-07 23:43

DatawhaleAI春训营-蛋白质预测（AI+生命科学）初次体验和学习笔记

Datawhale官方链接：https://www.datawhale.cn/home首先先感谢Datawhale提供的AI春训营让我能在枯燥的本科大学生活中也能接触先进的AI知识，感谢你们的开源精神（

fresh416·2025-05-07 23:13

李宏毅《深度学习》课程笔记第一章：机器学习核心概念解析

本文为参与DataWhale组队学习期间，对李宏毅教授《深度学习》课程第一章"机器学习介绍"的学习总结。内容基于个人理解整理，主要面向机器学习初学者，重点梳理核心概念与技术框架。

*花ㄜ漾_._·2025-05-05 17:38

动手学大模型应用全栈开发（Datawhale X 魔搭 AI夏令营）

DatawhaleX魔搭第四期AI夏令营文章目录前言一、学习内容提要二、什么是大模型三、小白零基础10分钟速通指南1.开通阿里云PAI-DSW试用2.在魔塔社区授权3.在魔塔社区创建PAI实例4.10分钟体验一站式

Kristina_code·2025-04-29 20:01

《解锁LLMs from scratch：开启大语言模型的探索之旅》

《解锁LLMsfromscratch：开启大语言模型的探索之旅》GitHub-datawhalechina/llms-from-scratch-cn:仅需Python基础，从0构建大语言模型；从0逐步构建

空云风语·2025-04-28 03:47

大模型之模型架构（Datawhale一起学）

大模型之模型架构/新的模型架构篇（Datawhale一起学）注意：文章内容参考了斯坦福CS324-LargeLanguageModels课程，以及Datawhale的一起学相关课程中的内容。

拨开自己的理想三旬·2025-04-25 05:34

【Datawhale AI春训营】RNA结构预测（AI+创新药）Task 学习笔记

赛题介绍：RNA(核糖核酸)在细胞生命活动中扮演着至关重要的角色，从基因表达调控到催化生化反应，都离不开RNA的参与。RNA的功能很大程度上取决于其三维(3D)结构。理解RNA的结构与功能之间的关系，是生物学和生物技术领域的核心挑战之一。RNA折叠是指RNA序列自发形成特定三维结构的过程。而RNA逆折叠则是一个更具挑战性的问题，即基于给定的RNA三维骨架结构设计出能够折叠成这种结构的RNA序列。本

m0_57932792·2025-04-24 06:00

【2025】Datawhale AI春训营-蛋白质预测（AI+生命科学）-Task2笔记

【2025】DatawhaleAI春训营-蛋白质预测（AI+生命科学）-Task2笔记本文对Task2使用的代码进行理解。

Mocode·2025-04-24 06:29

Datawhale Al春训营 --RNA结构预测（AI+创新药）代码记录

#模型训练与验证classRNADataset(torch.utils.data.Dataset):def__init__(self,coords_dir,seqs_dir):self.samples=[]#读取所有数据并转换为图forfnameinos.listdir(coords_dir):#加载坐标数据coord=np.load(os.path.join(coords_dir,fname))

2 0 1 2·2025-04-24 06:29

Sheila Teo分享GPT-4提示工程竞赛胜利经验，DynamiCrafter工具实现图转超逼真动态视频

一支烟花官网：https://agifun.love智源社区我是如何赢得GPT-4提示工程大赛冠军的Datawhale干货作者：SheilaTeo，来源：机器之心去年11月8日，新加坡政府科技局（GovTech

一支烟一朵花·2025-04-21 11:08

第二届世界科学智能大赛社会科学赛道：市场博弈和价格预测 # Datawhale AI 夏令营 # task1

这是Datawhale2024暑期夏令营的第三期，该期夏令营同样依托于AI竞赛，DW选择了由上海科学智能研究院、复旦大学联合阿里云在上智院·天池平台发布的“第二届世界科学智能大赛”。

Lu•R²·2025-04-21 05:04

第二届世界科学智能大赛逻辑推理赛道：复杂推理能力评估 #大模型技术之逻辑推理方向 #Datawhale #夏令营

赛事链接：http://competition.sais.com.cn/competitionDetail/532231/format往期入门文档Docs本期入门文档Datawhale在跑完baseline

SimpleLifeT_T·2025-04-21 05:34

讯飞星辰MaaS大模型

ch=maas-dw-mxb第二步：下载数据集https://github.com/datawhalechina/self-llm/blob/master/dataset/huanhuan.json第三步

韶博雅·2025-04-20 21:39

Datawhale AI春训营：高级气象预测技术

学习笔记：高级气象预测技术（基于树模型与深度学习）引言本教程在基线方案的基础上，进一步探讨了用于气象预测竞赛的更高级技术，特别侧重于基于树的模型（如LightGBM）和深度学习模型。回顾：通用竞赛流程即使采用高级方法，基本步骤仍然至关重要：数据探索分析(EDA):理解数据模式、变量关系和潜在问题。(参考数据分析常用方法汇总)数据清洗:处理缺失值、异常值，确保数据质量。(参考数据清洗常用方法汇总)特

vyniu·2025-04-20 11:39

DataWhale组队学习 ollama教程 task4

1.环境设置Conda环境：用于创建和管理Python虚拟环境，确保依赖包的隔离和版本控制。命令：condacreate-nhandlmpython=3.10创建环境，condaactivatehandlm激活环境。依赖安装：安装必要的Python包，如langchain-ollama、langchain、langchain-community等。命令：pipinstalllangchain-ol

菜鸟码农01·2025-04-20 11:38

DataWhale组队学期 Ollama教程 task5 使用 LangChain 构建本地 RAG 应用解析代码与收获

1.RAG（检索增强生成）的核心逻辑概念：通过「文档检索→上下文提取→生成」的流程增强模型回答的准确性，尤其适用于需要专业知识库的场景。关键技巧：使用WebBaseLoader加载网页内容，RecursiveCharacterTextSplitter分割文档（chunk_size需平衡信息完整性与检索效率）。用Chroma向量数据库存储嵌入（本地嵌入模型nomic-embed-text的选择影响语

菜鸟码农01·2025-04-20 11:38

Datawhale | 聊聊强化学习发展这十年

本文来源公众号“Datawhale”，仅用于学术分享，侵权删，干货满满。

双木的木·2025-04-19 18:40

基于天池Better Synth多模态大模型数据合成挑战赛的多模态大模型数据合成(2) [Datawhale AI 夏令营]

目录官方Baseline学习小题外话数据合成训练小题外话（_关于服务器中的python文件在导入自定义模块中识别不出mgm文件位置情况_）关于Data-juicer参考资料官方Baseline学习再来回顾一下，该问题背景基于天池BetterSynth多模态大模型数据合成挑战赛，详细可以参考该链接。简而言之，本背景基于图片数据方面，在合成与清洗图文数据中提高多模态大模型的图片理解能力。基于Mini-

Heorine·2025-04-11 06:00

ai prompt工程师认证

进入datawhale官网Datawhale-学用AI，从此开始、进入该网址学习一下AIPrompt工程师认证&学习指南-飞书云文档准备考试easy通过

sduwcgg·2025-04-03 15:44

10篇R1相关的研究全面汇总，万字思考！

原创长琴DatawhaleDatawhale干货作者：长琴，Datawhale成员本文通过10篇R1相关的研究，介绍R1后LLM的新范式。其核心就是如何进一步增强LLM的能力。

·2025-03-30 08:19

阿里巴巴蔡崇信：未来AI发展应专注两点

Datawhale分享访谈：蔡崇信，阿里巴巴，编译：数字开物2月13日，阿里巴巴集团联合创始人兼董事会主席蔡崇信亮相迪拜举行的世界政府峰会。

Datawhale·2025-03-26 10:59

DeepSeek R1后，AI应用、职业与行业！

长琴DatawhaleDatawhale经验作者：长琴，Datawhale成员突然就想写点应用、开发相关的东西，一方面是不断有企业和朋友问我他们可以用DeepSeek做什么，怎么用；另一方面是这个方向的职业

·2025-03-26 08:52

10篇R1相关的研究全面汇总，万字思考！

原创长琴DatawhaleDatawhale干货作者：长琴，Datawhale成员本文通过10篇R1相关的研究，介绍R1后LLM的新范式。其核心就是如何进一步增强LLM的能力。

·2025-03-21 07:28

吴恩达的翻译Agent项目，复现教程来了！

原创郭才高DatawhaleDatawhale教程作者：郭才高，Datawhale创作者1.TranslationAgent复现效果展示#执行任务#调用编译后的工作流，传入初始状态字典result=app.invoke

·2025-03-15 10:49

周报 | 25.3.3-25.3.9文章汇总

周报|25.2.24-25.3.2文章汇总-CSDN博客Datawhale|最新「大模型简史」整理！从Transformer（2017）到DeepSeek-R1（2025）--建议收藏！

双木的木·2025-03-10 21:04

推荐频道

dataWhale

阅读笔记(2) 单层网络:回归

【机器学习实战】Datawhale夏令营2：深度学习回顾

二、大模型的能力（DataWhale大模型理论基础）

大模型学习 （Datawhale_Happy-LLM）笔记4: 预训练语言模型

【Datawhale组队学习202506】YOLO-Master task02 YOLO系列发展线

Datawhale YOLO Master 第1次笔记

DataWhale-零基础网络爬虫技术（一）

DataWhale-零基础络网爬虫技术（二er数据的解析与提取）

【Datawhale组队学习202506】YOLO-Master task01 导学课程

Datawhale组队学习 - 202505 - PyPOTS - Task01时序数据与PyPOTS

【Datawhale组队学习202506】零基础学爬虫 01 初始爬虫

Datawhale 2025年2月组队学习- 推荐系统教程FunRec #Task3

Datawhale | 最新AI Agent万字综述分享！

全方位入门大模型应用开发，只需一招搞定：吴恩达系列课程中文教程实战指南！

Git 3天2K星标：Datawhale 的 Happy-LLM 项目介绍（附教程）

LLM基础1_语言模型如何处理文本

LLM基础2_语言模型如何文本编码

机器学习西瓜书笔记——机器学习基本术语，模型性能指标【一】

给MCP加上RAG，工具准确率提升200%，起飞～

Datawhale PyPOTS时间序列5月第1次笔记

Datawhale-llm-universe 第一章 LLM介绍打卡

Datawhale llm-universe Task1

【datawhale组队学习】coze-ai-assistant TASK01

DataWhale AI春训营-AI+生命科学学习笔记

Datawhale AI春训营 | AI+蛋白质固有无序区域预测（蛋白质预测）

Datawhale AI春训营--蛋白质预测（AI+生命科学）

DatawhaleAI春训营-蛋白质预测（AI+生命科学）初次体验和学习笔记

李宏毅《深度学习》课程笔记第一章：机器学习核心概念解析

动手学大模型应用全栈开发（Datawhale X 魔搭 AI夏令营）

《解锁LLMs from scratch：开启大语言模型的探索之旅》

大模型之模型架构（Datawhale一起学）

【Datawhale AI春训营】RNA结构预测（AI+创新药）Task 学习笔记

【2025】Datawhale AI春训营-蛋白质预测（AI+生命科学）-Task2笔记

Datawhale Al春训营 --RNA结构预测（AI+创新药）代码记录

Sheila Teo分享GPT-4提示工程竞赛胜利经验，DynamiCrafter工具实现图转超逼真动态视频

第二届世界科学智能大赛社会科学赛道：市场博弈和价格预测 # Datawhale AI 夏令营 # task1

第二届世界科学智能大赛逻辑推理赛道：复杂推理能力评估 #大模型技术之逻辑推理方向 #Datawhale #夏令营

讯飞星辰MaaS大模型

Datawhale AI春训营：高级气象预测技术

DataWhale组队学习 ollama教程 task4

DataWhale组队学期 Ollama教程 task5 使用 LangChain 构建本地 RAG 应用 解析代码与收获

Datawhale | 聊聊强化学习发展这十年

基于天池Better Synth多模态大模型数据合成挑战赛的多模态大模型数据合成(2) [Datawhale AI 夏令营]

ai prompt工程师认证

10篇R1相关的研究全面汇总，万字思考！

阿里巴巴蔡崇信：未来AI发展应专注两点

DeepSeek R1后，AI应用、职业与行业！

10篇R1相关的研究全面汇总，万字思考！

吴恩达的翻译Agent项目，复现教程来了！

周报 | 25.3.3-25.3.9文章汇总

大模型学习（Datawhale_Happy-LLM）笔记4: 预训练语言模型

DataWhale组队学期 Ollama教程 task5 使用 LangChain 构建本地 RAG 应用解析代码与收获