编程大乐趣

python爬虫菜鸟教程-Python数据分析，学习路径拆解及资源推荐

原标题：Python数据分析，学习路径拆解及资源推荐

关于Python数据分析，其实网上能够找到的学习资源很多，主要分为两类：

一类是提供各种资源的推荐，比如书单、教程、以及学习的先后顺序；

另一类是提供具体的学习内容，知识点或实际案例。

但很多繁琐而又杂乱的内容，除了给初学者增加理解和认识的噪音外，真正能够起到明确的方向指引导的，确实不多。

以至于很多人一开始没有明确的方向就一头扎进去，学了很久却不知道自己到底在学什么，或者自己学了很久不知道能够做什么。

学习一门技术之前，你应该知道，你想要达成的目标是什么样的。

也就是说，你想通过这门技术来解决哪些问题。你就可以知道要达成这样的目标，它的知识体系是怎么样的。

更重要一点的是，每个部分是用来解决哪些问题，只有明确的目标导向，学习最有用的那部分知识，才能避免无效信息降低学习效率。

对于数据分析这件事情，有很多的应用场景：

比如你需要进行调研，来了解市场的宏观情况，窥探竞争对手，做可行性分析……

比如你所在的工作部门产生了大量的数据，你需要考虑用这些数据来优化产品、营销、技术方案……

比如你需要对产品、业务、用户进行分析，挖掘出重要结论，给上级提出合理的决策建议……

通过这些常见的数据分析场景，你就可以获得数据分析项目的基本流程。

一般大致可以按"数据获取-数据存储与提取-数据预处理-数据建模与分析-数据报告”这样的步骤来实施一个数据分析项目。

按照这个流程，每个部分需要掌握的细分知识点如下：

高效的学习路径是什么？就是按这样的顺序循序渐进，你会知道每个部分需要完成的目标是什么，需要学习哪些知识点，哪些知识是暂时不必要的。

然后每学习一个部分，你就能够有一些实际的成果输出，有正向的反馈和成就感，你才会愿意花更多的时间投入进去。以解决问题为目标，效率自然不会低。

接下来我们分别从每一个部分展开，讲讲具体应该学什么、怎么学，以及各个部分主要的知识点进行结构化地展示，并有针对性地推荐学习资源。

如何获取数据

我们分析的数据一般有内部数据和外部数据两种。

内部数据是在我们的业务运转中产生，比如常见的用户数据、产品数据、销售数据、内容数据等等。

内部的数据相对来说更加完善、规整，我们经常要做的工作汇报、产品优化等分析数据一般来源于此。

可以找公司的技术人员索要，或者自己去数据库提取。

当然，很多时候，我们需要利用外部的数据。

比如进行市场调研，竞品分析，或者输出报告的时候，外部数据的分析是必不可少的，这也可以帮助我们得出更多的结论。

1. 公开数据源

UCI：加州大学欧文分校开放的经典数据集，真的很经典，被很多机器学习实验室采用。

http://archive.ics.uci.edu/ml/datasets.html

国家数据：数据来源于中国国家统计局，包含了我国经济民生等多个方面的数据。

http://data.stats.gov.cn/index.htm

CEIC：超过128个国家的经济数据，能够精确查找GDP、CPI、进出口以及国际利率等深度数据。

https://www.ceicdata.com/zh-hans

中国统计信息网：国家统计局的官方网站，汇集了海量的全国各级政府各年度的国民经济和社会发展统计信息。

http://www.tjcn.org/

政务数据网站：现在各个省都在很大程度上地开放政务数据，比如北京、上海、广东、贵州等等，都有专门的数据开放网站，搜索比如"北京政务数据开放”。

2. 网络爬虫

基于互联网爬取的数据，你可以对某个行业、某种人群进行分析。比如：

职位数据：拉勾、猎聘、51job、智联

金融数据：IT桔子、雪球网

房产数据：链家、安居客、58同城

零售数据：淘宝、京东、亚马逊

社交数据、微博、知乎、Twitter

影视数据：豆瓣、时光网、猫眼

……

在爬虫之前你需要先了解一些 Python 的基础知识：元素（列表、字典、元组等）、变量、循环、函数（菜鸟教程就很好）……

以及如何用成熟的Python 库（urllib、BeautifulSoup、requests、scrapy）实现网页爬虫。

掌握基础的爬虫之后，你还需要一些高级技巧。

比如正则表达式、模拟用户登录、使用代理、设置爬取频率、使用cookie等等，来应对不同网站的反爬虫限制。

爬虫可以说是最为灵活、有效的数据获取方式，但学习成本相对来说也要高一些。

开始建议先利用公开数据进行分析，后续有更多的数据需求，再上手爬虫。

那个时候你已经掌握了Python基础，爬虫上手也会更轻松。

3. 其他数据获取方式

如果你暂时不会爬虫，但又有采集数据的需求，可以尝试各种采集软件，不需要编程知识也可以轻松爬取信息，比如火车头、八爪鱼等。

很多数据竞赛网站也会公开不错的数据集，比如国外的Kaggle，国内的DataCastle、天池。

这些数据都是真实的业务数据，且规模通常不小，可以经常去搜集和整理。

推荐数据汇总资源：

数据获取方式汇总https://dwz.cn/Q44MsDkH

△ 常用的数据获取方式

数据存储与提取

数据库这个技能放在这里，是因为这是数据分析师的必备技能。

大多数的企业，都会要求你有操作、管理数据库的基本技能，进行数据的提取和基本分析。

SQL作为最经典的关系型数据库语言，为海量数据的存储与管理提供可能。

MongoDB则是新崛起的非关系型数据库，掌握一种即可。

初学建议SQL。你需要掌握以下技能：

1.查询/提取特定情况下的数据：企业数据库里的数据一定是巨量而繁复的，你需要提取你想要的那一部分。

比如你可以根据你的需要提取2017年所有的销售数据、提取今年销量最大的50件商品的数据、提取上海、广东地区用户的消费数据……

2.数据库的增、删、改：这些是数据库最基本的操作，但只要用简单的命令就能够实现。

3.数据的分组聚合、建立多个表之间的联系：这个部分是数据库的进阶操作，多个表之间的关联。

在你处理多维度、多个数据集的时候非常有用，这也让你可以去处理更复杂的数据。

数据库听起来很可怕，但其实满足数据分析的那部分技能不要太简单。

当然，还是建议你找一个数据集来实际操作一下，哪怕是最基础的查询、提取等操作。

推荐数据库教程：

SQL-菜鸟教程https://dwz.cn/a042MLdz

MongoDB-菜鸟教程https://dwz.cn/sJFhRzj1

△ mySQL知识框架

△ MongoDB知识框架

数据清洗及预分析

很多时候我们拿到的数据是不干净的，数据的重复、缺失、异常值等等。

这时候就需要进行数据的清洗，把这些影响分析的数据处理好，才能获得更加精确地分析结果。

比如空气质量的数据，其中有很多天的数据由于设备的原因是没有监测到的，有一些数据是记录重复的，还有一些数据是设备故障时监测无效的。

比如用户行为数据，有很多无效的操作对分析没有意义，就需要进行删除。

·选择：数据访问（标签、特定值、布尔索引等）

·缺失值处理：对缺失数据行进行删除或填充

·重复值处理：重复值的判断与删除

·空格和异常值处理：清楚不必要的空格和极端、异常数据

·相关操作：描述性统计、Apply、图形绘制等

从数据处理开始，就需要介入编程知识了，但不必把Python的教程完全啃一遍，只需要掌握数据分析必备的那部分即可。

·基本的数据类型：比如字符串、列表、字典、元组，不同的数据类型如何创建、进行增、删、改等操作，以及其中常用的函数及方法；

·Python函数：学习如何去创建自己的函数，实现更丰富的定制化程序，知道在使用中如何调用；

·控制语句：主要是条件语句和循环语句，利用不同的语句对流程进行控制，这是实现程序的自动化的基础。

Python教程推荐：

Python3-菜鸟教程https://dwz.cn/2nJnWkrp

Python练手项目合集https://dwz.cn/cpM0jua5

△ Python基础知识框架

另外，Python中两个非常重要的库Numpy和Pandas也是需要掌握的，我们的很多数据处理及分析方法就源于其中。

如果把Python比作是我们的房子，为我们提供基础的框架，那么Numpy和Pandas就是房子里的家具和电器，为我们入住提供各种功能。

当然，即便只是这两个库，官方文档的内容也是非常多的，建议先掌握最常用的一些方法，这样你可以解决大部分的实际问题，若后续遇到问题可以有针对性地去查询文档。

Numpy

·数组创建：从已有的数组创建、从数值范围创建

·数组切片：通过切片进行选择

·数组操作：元素增删、数组维度修改、数组的分割及连接

·Numpy函数：字符串函数、数学函数、统计函数

推荐Numpy文档：

Nump快速入门http://h5ip.cn/ypHr

Numpy中文文档https://www.numpy.org.cn/

△ Numpy知识框架

Pandas

·数据准备：数据读取、创建数据表

·数据查看：查看数据基本信息、查找空值和唯一值

·数据清洗：缺失值处理、重复值处理、字符处理

·数据提取：按标签值进行提取、按位置进行提取

·数据统计：采样、汇总、基本的统计量计算

推荐Pandas文档：

十分钟入门Pandashttp://t.cn/EVTGis7

Pandas中文文档https://www.pypandas.cn/

△ Pandas知识框架

数据分析及建模

如果你有一些了解的话，就知道目前市面上其实有很多 Python 数据分析的书籍，但每一本都很厚，学习阻力非常大。

如果没有整体的认识，往往不知道为什么要学习这些操作，这在数据分析中到底起什么样的作用。

为了得出普遍意义上的结论（或者从一般的数据分析项目来看），我们通常要进行三种类型的数据分析：描述性分析、探索性分析以及预测性分析。

描述性分析主要是有目的去描述数据，这就要借助统计学的知识，比如基本的统计量、总体样本、各种分布等等。

通过这些信息，我们可以获得对数据的初步感知，也能够得到很多简单观察得不到的结论。

所以其实描述性的分析主要需要两个部分的知识，其一是统计学的基础，其二是实现描述性的工具，用上述 Numpy 和 Pandas 的知识即可实现。

探索性分析通常需要借助可视化的手段，利用图形化的方式，更进一步地去观看数据的分布规律，发现数据里的知识，得到更深入的结论。

所谓"探索”，事实上有很多结论我们是无法提前预知的，图形则弥补了观察数据和简单统计的不足。

Python中的Seaborn和Matplotlib库都提供了强大的可视化功能。

相对于Matplotlib，Seaborn更加简单易于理解，画基本的图形也就是几行代码的事情，更推荐初学使用。

如后续需要定制化图形，可进一步了解Matplotlib。

预测性的数据分析主要用于预测未来的数据，比如根据历史销售数据预测未来某段时间的销售情况，比如通过用户数据预测未来用户的行为……

预测性分析稍难，越深入会涉及更多数据挖掘、机器学习的知识，所以可以只做做基本了解（或者等有需求的时候再学习）。

比如基本的回归、分类算法，以及如何用Python的scikit-learn库去实现，至于机器学习相关的算法选择、模型调优则不必深入（除非你游刃有余）。

推荐数据分析资料：

书籍《深入浅出统计学》《商务与经济统计学》

Matplotlib中文文档https://www.matplotlib.org.cn

十分钟掌握Seaborn https://dwz.cn/4ePGzwAg

Scikit-learn中文文档http://sklearn.apachecn.org

△ 数据分析建模知识框架

撰写数据报告

数据报告是整个数据分析项目的最终呈现，也是所有分析过程的总结，输出结论和策略的部分。

所以无论你的心路历程多么精彩，数据报告才是最终决定你分析价值的产物。

要写好一个分析报告，首先要明确数据分析任务的目标，是要探索数据里的知识，还有要对产品进行优化，或者预测未来的数据。

针对这些目标，那么需要对问题进行拆分，要达到目标，必须要输出哪些有价值的信息。

对于最终的决策，哪些数据、信息是有用的，是否要进一步探索，哪些是无效的，是否直接丢弃。

确定好输出的大致内容、在数据分析过程中得到有用的结论之后，接下来应该思考，如何把这些分散的信息整合起来，为了达到最终的说服力，应该以怎样的逻辑进行整合。

这是一个建立框架的过程，同时也反映这这个问题的拆解思路。

在搭建好框架之后，就是把已有的结论填充进去，选择合适的表达形式。

选择更合适的数据，哪些需要更加直观的图表，哪些结论需要进行详细的解释，并进行最终的美化设计，这样一份完整的数据分析报告也就完成了。

在写分析报告时，有一些一定要注意的地方：

1.一定要有框架，最简单的就是以问题拆分的逻辑来进行搭建，在每个分支进行内容填充，分点说明；

2.数据的选择不要过于片面，要多元化，进行对比分析，否则结论可能有失偏颇。

数据的价值决定了分析项目的上限，尽可能多收集有用的数据，进行多维度的分析；

3.结论一定要有客观的数据论证，或者严密的逻辑推导，否则没有说服力，特别容易陷入自嗨；

4.图表比文字更加直观，而且可读性更高，应该多利用图形化的表达方式；

5.分析报告不只是要说明问题，更重要的是基于问题提出建议、解决方案、预测趋势；

6.多看行业报告，多练习，Business Sense 在后期比技巧更重要。

艾瑞网-数据报告http://report.iresearch.cn/

友盟+-数据报告http://t.cn/EVT6Z6z

世界经济论坛报告http://t.cn/RVncVVv

普华永道行业报告http://t.cn/RseRaoE

△ 撰写数据报告的框架

以上就是Python数据分析完整的学习路径，这个框架看其实是有一些庞大的，牛逼的事情看起来不都这样嘛（滑稽脸）。

但完全不用担心，其实我们每个人都天生数据敏感，自带分析事物的天赋，只不过在没有分析方法加持之前，我们凭的是经验和直觉。

你不必完全回炉重造，像开发程序一样去学代码、像考试一样去背函数和方法，只需要一些业务的常识，像均值、极值、排序、相关性、中位数……

这些东西我们信手捏来的东西往往占据数据分析的绝大多数内容，你所学的只不过是实现这些的工具而已。

就像一个100行的数据，给任何一个智力正常的人，不用任何工具和编程技术，他也能获得一份基本的结论，而工具则是让我们在效率、可扩展性和实现维度方面得到更好的提升，仅此而已。

责任编辑：

使用分布式锁解决淘客返利系统中的并发问题微赚淘客系统开发者@聚娃科技分布式
使用分布式锁解决淘客返利系统中的并发问题大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！1.引言在淘客返利系统中，常常需要处理高并发的订单和返利计算。由于并发请求可能会导致数据不一致的问题，因此需要一种有效的解决方案来管理并发访问。分布式锁是一种常见的并发控制机制，可以确保在同一时刻只有一个请求对共享资源进行修改。本文将详细介绍如何在Java中使用分布式锁解决淘客返利
自动化测试的学习路线 Ws＿学习
自动化测试是提高软件开发效率和质量的关键手段。学习自动化测试通常涉及多个方面的技能，从基础的编程语言知识到测试工具的使用，再到实际的测试脚本编写和执行。以下是一个学习自动化测试的路线图，帮助你有条不紊地掌握相关技能：1.基础知识在开始自动化测试之前，首先要具备一定的编程和软件测试基础：编程语言：Python、Java、JavaScript或者Ruby（根据你选择的自动化测试工具决定）软件测试基础：
Python自动化测试 Ws＿ python python
Python自动化测试是软件开发中的重要组成部分，可以帮助提高测试效率和准确性。以下是学习Python自动化测试的基本路线，以及相关资料的链接：学习路线1.基础知识Python基础：掌握Python语言的基本语法、数据类型、控制流、函数、面向对象编程等。你可以先确保对Python的基本语法有清晰的理解。参考资料：Python官方文档书籍推荐：《Python编程：从入门到实践》2.了解自动化测试的基
JavaEE进阶知识学习-----定时任务调度Quartz-4 四川码匠 Quartz JAVA进阶学习 Quartz 任务调度
Quartz和SpringMVC，Spring整合1.Quartz依赖的包如下：org.springframeworkspring-context-support${spring.version}org.springframeworkspring-tx${spring.version}org.quartz-schedulerquartz2.2.3使用Quartz配置作业的方式第一种：MethodI
23. AI-概述真上帝的左手 23.AI ai 人工智能
文章目录前言一、AI1.简介2.发展3.应用场景前言AI‌ 随着技术的发展，AI正变得越来越强大和普及，其在解决复杂问题和提高人类生活质量方面的潜力日益显现。一、AIAI（ArtificialIntelligence，人工智能）1.简介 AI（ArtificialIntelligence，人工智能）是计算机科学的一个分支，旨在开发智能系统，使其能够执行通常需要人类智能的任务，例如学习、推理、问
【深度解析】最短路径算法：Dijkstra与Floyd-Warshall 吴师兄大模型算法数据结构 python 最短路径算法 Dijkstra算法 Floyd-Warshall 开发语言
系列文章目录01-从零开始掌握Python数据结构：提升代码效率的必备技能！02-算法复杂度全解析：时间与空间复杂度优化秘籍03-线性数据结构解密：数组的定义、操作与实际应用04-深入浅出链表：Python实现与应用全面解析05-栈数据结构详解：Python实现与经典应用场景06-深入理解队列数据结构：从定义到Python实现与应用场景07-双端队列（Deque）详解：Python实现与滑动窗口应
代理IP服务如何优化AI大模型训练的分布式计算效率 http
AI大模型训练就像一场接力赛，每个计算节点都是接力选手，而代理IP则是保证选手们“跑得更稳、交接更顺”的隐形教练。在分布式计算中，效率瓶颈往往不是算力本身，而是数据调度与通信协作的隐性损耗。接下来，我们从三个实操场景拆解代理IP的增效逻辑。场景一：数据采集与分发的“高速公路”分布式训练的第一步是将海量数据切分到不同计算节点。假设某团队要训练法律文书解析模型，需从20个省级法院网站抓取判例。如果所有
制造业上了MES后，生产过程透明化，实时掌握生产动态
一、MES系统的作用与功能MES系统是车间制造执行系统，它打通了企业计划层和执行层的信息通道，建立了透明、高效、有序的生产模式。生产调度：MES系统能够实时调度生产任务，优化资源配置，确保生产过程中的每个环节都能高效运作。这种调度能力使得生产过程中的每一步都能被清晰记录和监控。数据采集：MES系统能够自动采集生产数据，包括设备运行状态、工人操作记录等。这些数据为后续分析提供了可靠依据，使得生产过程
【核心算法篇十三】《DeepSeek自监督学习：图像补全预训练方案》再见孙悟空_ 「2025 DeepSeek技术全景实战」算法学习计算机视觉 deepSeek 深度学习 transformer 人工智能
引言：为什么自监督学习成为AI新宠？在传统监督学习需要海量标注数据的困境下，自监督学习（Self-SupervisedLearning）凭借无需人工标注的特性异军突起。想象一下，如果AI能像人类一样通过观察世界自我学习——这正是DeepSeek图像补全方案的技术哲学。根据，自监督学习通过设计巧妙的"预训练任务"（PretextTask），让模型在无标签数据中自动学习图像语义特征。而图像补全正是这类
HarmonyOS Next AI开发环境搭建与工具使用 harmonyos
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中AI开发环境搭建与工具使用相关技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、HarmonyOSNextAI开发环境概述（一）硬件与软件环境需求介绍硬件环境处理器：对于HarmonyOSNext
HarmonyOS Next智能安防系统中的人脸比对与异构计算实战 harmonyos
本文旨在深入探讨基于华为鸿蒙HarmonyOSNext系统（截止目前API12）构建智能安防系统中人脸比对与异构计算技术的实战应用，基于实际开发经验进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、智能安防系统需求与架构设计（一）功能需求分析实时人脸检测与识别需求在智能安防系统中，实时人脸检测与识别
HarmonyOS Next智能语音助手的语音合成与模型优化实战 harmonyos
本文旨在深入探讨基于华为鸿蒙HarmonyOSNext系统（截止目前API12）构建智能语音助手过程中语音合成与模型优化技术的实战应用，基于实际开发经验进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、语音助手功能需求与架构规划（一）功能需求梳理语音指令识别需求智能语音助手需要准确识别用户的语音指令
设计导购类电商平台的高可维护性架构微赚淘客系统开发者@聚娃科技架构 java 开发语言
设计导购类电商平台的高可维护性架构大家好，我是阿可，微赚淘客系统及省赚客APP创始人，是个冬天不穿秋裤，天冷也要风度的程序猿！在当今竞争激烈的电商市场中，一个高可维护性的架构对于导购类电商平台至关重要。本文将探讨如何设计一个高可维护性的架构，以支持快速迭代和稳定运行。高可维护性架构的重要性高可维护性的架构可以降低系统的维护成本，提高开发效率，确保系统的可扩展性和稳定性。这对于快速适应市场变化和用户
全网最全！DeepSeek 新手入门教程合集人工智能deepseek
如果你是初次接触DeepSeek的普通用户或开发者，面对海量教程却无从下手？别担心！本文为你整理全网最易懂、最实用的DeepSeek学习资源，涵盖快速上手、编程实战、系统手册等，附直达链接，收藏这一篇就够了！一、快速入门指南《DeepSeek入门教程》-博客园亮点：手把手教你注册账号、获取APIKey，并提供Python调用多轮对话的代码示例，适合初级开发者。直达链接：点击查看核心内容：API调用
如何制定高效的项目执行计划表？掌握这些关键步骤！项目管理
项目执行计划表是项目管理中不可或缺的重要工具，它为项目团队提供了清晰的路线图和执行指南。一个高效的项目执行计划表不仅能够明确项目目标、任务分工和时间节点，还能够有效协调资源，提高团队协作效率，确保项目按时、高质量地完成。本文将深入探讨如何制定一份高效的项目执行计划表，帮助您掌握关键步骤，提升项目管理水平。明确项目目标和范围制定项目执行计划表的第一步是明确项目目标和范围。这个阶段需要与相关stake
如何高效进行项目计划生产？项目管理
在当今竞争激烈的商业环境中，项目计划生产已成为企业成功的关键因素。高效的项目计划生产不仅能够提高工作效率，还能降低风险、优化资源配置，为企业带来显著的经济效益。本文将深入探讨如何高效进行项目计划生产，为企业管理者和项目负责人提供实用的指导和建议。明确项目目标和范围高效的项目计划生产始于明确的目标和范围界定。这一阶段需要与相关stakeholders进行充分沟通，确保项目目标与公司战略相一致。同时，
集中式架构vs分布式架构谦亨有终架构架构分布式
一、集中式架构如何准确理解集中式架构1.集中式架构的定义集中式架构是一种将系统的所有计算、存储、数据处理和控制逻辑集中在一个或少数几个节点上运行的架构模式。这些中央节点（服务器或主机）作为系统的核心，负责处理所有用户请求和业务逻辑，客户端只负责请求和展示。2.核心特性单一控制中心：所有服务和资源都由中央节点统一管理。资源集中管理：数据和计算资源位于同一位置，便于维护和扩展。高一致性：由于资源集中管
《计算机组成及汇编语言原理》阅读笔记：p1-p8 编程
《计算机组成及汇编语言原理》学习第1天，p1-p8总结，总计8页。一、技术总结1.Intel8088microprocessor(微处理器)，1979-1988。2.MS-DOSMicrosoftDiskOperatingSystem的缩写，是一个操作系统(operatingsystem)。3.Moore'sLaw&Moore'ssecondlaw(1)Moore'slawThenumberoft
Linux操作系统：个人云存储服务搭建开发暮雨哀尘 Linux的那点事 linux 运维服务器大数据集群技术 nginx mysql
个人云存储服务搭建开发文档一、项目目标搭建一个类似Dropbox的个人云存储服务，实现文件的同步和备份功能，确保数据的安全性和便捷性。二、技术栈操作系统：Linux（推荐使用UbuntuServer或CentOS）云存储软件：Nextcloud或SeafileWeb服务器：Apache或Nginx数据库：MySQL或MariaDBSSL证书：自签名证书或Let'sEncrypt免费证书三、搭建步骤
国外7个最佳大语言模型 (LLM) API推荐程序员后端
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
QT界面自适应天生爱打工 qt qt 开发语言
一自适应工具类介绍:1.1功能控件能跟随界面大小的变化实现字体、大小同比例的变化1.2优点控件大小,字体可跟随界面大小同比例任意变化。同一套程序能兼容不同分辨率及不同DPI的显示器对于控件数目固定不变的UI区域:只需要将控件拖拽到指定位置即可，不需要使用弹簧及布局等qt属性对于控件数目有可能会根据需求变化的UI区域:可以使用qt原有的布局,但解放了qt原有布局中不能改变字体的属性。二自适应工具类使
深圳SMT贴片加工厂家核心技术及服务优势解析安德胜SMT贴片其他
内容概要在电子制造领域，高效、精准的生产能力已成为企业保持竞争力的关键要素。如何通过技术创新与服务优化实现快速交付与品质保障，是当前行业关注的核心议题。深圳作为国内电子制造产业的重要聚集地，其SMT贴片加工厂家通过持续的技术迭代与服务升级，形成了独特的市场竞争力。本文将系统解析该类企业在核心技术与服务模式上的突破路径，涵盖设备精度提升、工艺创新、品控体系完善等关键维度。首先，高精度贴片设备与智能化
SMT贴片加工报价构成要素与成本优化策略解析安德胜SMT贴片其他
内容概要在现代电子制造领域，SMT贴片加工报价的精准核算直接影响企业供应链成本控制效能。本文通过结构化分析框架，系统解构报价体系的五大核心要素，并建立可操作的优化模型。研究路径覆盖从基材选型到生产规划的完整价值链，重点揭示各环节成本动因的相互作用机制。为直观呈现报价要素的关联性，特构建以下参数对照表：要素类别成本占比范围关键波动因素优化切入点PCB基材成本15-25%层数/板材类型/表面处理工艺标
C语言结构体学习笔记 BUG 劝退师 c语言 c语言学习笔记
C语言结构体学习笔记目录结构体基本概念结构体变量定义结构体初始化结构体数组结构体指针共用体枚举类型typedef自定义类型总结结构体基本概念1.什么是结构体？结构体：一种用户自定义的数据类型，用于将多个不同类型的变量组合成一个整体。用途：表示复杂数据（如学生信息：学号、姓名、成绩等）。2.结构体定义struct结构体名{数据类型成员1;数据类型成员2;//可以嵌套结构体struct子结构体名子成员
Python Union 联合类型注解详解人才程序员杂谈 python 服务器 java linux 后端软件工程开发语言
文章目录PythonUnion联合类型注解详解1.什么是Union联合类型？**语法（Python3.9及之前版本）**：**语法（Python3.10及之后版本）**：2.Union联合类型注解示例**(1)使用Union来表示多个类型的参数****(2)使用`|`来表示联合类型（Python3.10及之后版本）**3.使用Union进行复杂类型注解**(1)使用Union与列表结合****(2
Ubuntu22.4.03服务器版安装及搭建深度学习环境的问题总结蜡笔小祎在线学习问题集合深度学习人工智能
Ubuntu22.4.03服务器版安装流程整个流程已经有很多分享帖了，这里概述一下：下载iso制作启动U盘，按f2进入安装，选择语言，键盘布局english，ubuntuserver安装，DHCP自动配置网络（问题1），代理服务器我们没填，配置阿里云镜源http://mirrors.aliyun.com/ubuntu/，磁盘分区（问题2），设置服务器密码，安装ssh远程工具，重启reboot。可参
macOS Catalina 10.15 - 新增功能及其他信息记录伊织code Apple 开发+10.15 macOS Catalina Sidecar
文章目录推荐阅读参考一、基本信息WWDC2019壁纸二、beta版本安装macOS10.15Xcode11三、新功能添加屏幕使用时间iPadOS应用可在Mac上运行APFS宗卷被拆分为只读的系统宗卷(System)和用户数据宗卷(Data)增加Findmy查找添加由Siri控制的「捷径」和「屏幕时间」AppleWatch可解锁MacSidecar：将iPad作为副显示屏四、其他变更终端shell建
释放 DeepSeek 的力量：像专家一样本地安装与探索！ guzhoumingyue AI python
要在本地运行DeepSeek，您需要遵循以下步骤。请确保您的计算机上已安装Python和Git，并且满足DeepSeek的依赖项。步骤1:安装依赖项安装Python和pip确保您已安装Python（建议使用Python3.6及以上版本）。您可以通过在终端/命令提示符中输入以下命令来检查Python是否已安装：bash复制代码python--version或者bash复制代码python3--ver
FPGA设计怎么学？薪资前景好吗？博览鸿蒙 FPGA fpga开发
FPGA前端设计和各岗位之间有着很多联系，是一个薪资待遇高，前景发展好的岗位。但这个岗位的门槛也比较高，很多人不知道怎么学习，下面就和宸极教育一起来了解一下吧。数字前端设计必备技能1、熟悉数字电路设计2、熟悉Verilog或VHDL3、熟悉异步电路设计4、熟悉FIFO的设计5、熟悉UNIX系统及其工具的使用6、熟悉脚本语言Perl、Shell、Tcl等7、熟悉C/C++语言、SystemVeril
Linux：从入门到精通的全面指南 dbsnc1111 linux 运维服务器
一、引言Linux作为一种开源操作系统，犹如一座技术宝库，在当今的科技领域中占据着至关重要的地位。它以其卓越的稳定性、高度的安全性和无与伦比的灵活性，在服务器、嵌入式系统、个人计算机、超级计算机等众多领域广泛应用。无论是渴望提升技术水平的个人，还是寻求拓展职业道路的专业人士，学习Linux都无疑是开启新机遇之门的钥匙。以下是关于Linux的详细知识以及学习Linux的经验总结，希望能为正在学习或准
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

python爬虫菜鸟教程-Python数据分析，学习路径拆解及资源推荐

你可能感兴趣的:(python爬虫菜鸟教程-Python数据分析，学习路径拆解及资源推荐)