baby_hua

数据分析入门——深入浅出数据分析

该系列文章系个人读书笔记及总结性内容，任何组织和个人不得转载进行商业活动！

前言

其实我也不知道怎么就买了这么一般书，可能是学点python就觉得想要做点什么，好吧，买了毕竟是要读的，那就开始吧；

数据分析的书

数据中充满了“智慧”——信了你的邪！
创建直观的图形、试验假设条件、进行回归分析或整理混乱的数据；——很吸引人！

在，正式阅读之前，请“大量喝水”！

1 分解数据——数据分析引言

处理大量数据，分解和构建复杂的问题和数据集，得到推进现实工作的策略；

示例：分析某公司产品的销售情况：

	9月	10月	11月	12月	1月	2月
总销量	11000	14000	12000	12000	13000	14000
目标销量	10000	13500	15000	17000	19000	21000

广告费	5000	4000	3000	2000	1000	1000
社交网络费	0	1000	2000	3000	4000	5000

单价	2	2	2	1.9	1.9	1.9

目标：提高销量

数据中哪些东西能够实现这个目标；

数据分析就是仔细推敲证据

固定的基本流程+丰富的经验：

确定：确定问题；
分解：分解问题和数据，使之成为最小的组合；
评估：根据前两步了解的情况作出结论；
决策：结论重组，得出建议/决策；

好的数据分析师往往能作出更好的决策；

如何确定问题

客户能帮助确定问题：

客户是数据服务的对象；
客户将根据你的分析作出决策；所以需要从客户处尽可能多的了解信息；
客户多种多样，甚至不了解自己的数据、自己的业务；对客户了解越深，分析就越能排上用处；

探索性数据分析：找到一些值得进行进行测试的假设条件；

优秀的数据分析师能够帮助客户思考自己的问题；而不是等待客户告诉他们该做什么；

聘用数据分析师的人认为。具备分析技能的人能够改善他们的业务；有人把这些问题视为机会，而向客户支出如何发现机会的数据分析师则能让客户赢得竞争优势；

确认问题的典型提问

您希望销量提高多少？——如：重回目标值；
消费受众是哪些？——如：20-30岁的女性消费者；
销量提高的目标值合理吗？
您的竞争对手销量如何？
营销手段有哪些？——如：广告和社交；
各个营销手段投入的预算是多少？——如：收入的30%；

将大问题分解为小问题

找到感兴趣的比较对象，分解汇总数据：

进行有效的比较是数据分析的核心；

已确定观点：

消费受众固定且唯一，但消费潜力很大；
修改各个营销手段的预算分配；
竞争对手很强大；

数据体现出来的：

最新一月的销量，与第一个月相比，成绩不明显；
销量与目标相去甚远，尤其从11月开始；
降价未能有效的提升销量；
消减费用会影响公司的销量达标能力；

对自己：

要在数据中发现什么；
避免做出过头的结论；
对工作成败负责；

对客户：

尊重数据分析师的判断；
理解数据分析师的判断是有局限性的；

作为数据分析师，工作就是让自己和客户仔细研究你对数据的评估，从而做出更好的决策；
提交的报告要以得到客户理解、鼓励客户以数据作为基础做出明智的决策为重点；

分析报告：

背景
数据解说
建议

客户已经确认的观点和可能会让你误入歧途——客户心理想的往往是一种心智模型；

你对外界的假设和你确信的观点就是你的心智模型；
统计模型取决于心智模型；

假设：

最受欢迎的产品？
需要新产品才能提高销量？
没有匹敌的对手？
“网络”营销最有效？
受众愿意花更多的钱在产品上？
…

明确不确定因素、盲点，获取未知信息；了解自己的知识缺陷，及时补充：

无法明确的回到关于产品销量的问题；
十分明确的观点的反面很有可能是一个大的盲点；
大量不确定因素的确定，有助于发现盲点；

准确了解数据背后所代表的信息：

比如，你的数据里有一家经销商公司，你可能要了解，这个经销商公司的受众是哪些（再下一级受众）？
无论数据多么纷杂，一定要始终明确自己的目标；

现在数据分析已经纳入了更多的信息：各个经销商的分销产品的数量、占比等；

男士也是受众！！

总结

完善的心智模型需要大量的知识、经验相结合。

2 实验——检验你的理论

实验

解决问题、揭示事物的真正运行规律；
摆脱对观察数据的无限依赖，帮助理清因果关系；得到可靠的实证数据；

示例：咖啡销量下滑

会见CEO，弄清楚公司商务运营方式；
进行一次客户调查（弄清楚客户想法，当然自己可以先喝一杯）——随机抽样；
目标销量如何定义的；

比较越多，分析结果越正确；

观察研究法：被研究的人自行决定自己属于哪个群体的一种研究方法；

观察分析法充满了混杂因素（混杂因素就是研究对象的个人差异）；
比如某一个富人区对咖啡的需求会影响整个咖啡销量分析的结果；
所以需要——校正混杂因素；

控制组：一组体现现状的处理对象，未经过任何新的处理（也称对照组）；

好的实验总是有一个控制组（对照组），使分析师能够将检验情况与现状进行比较；
没有控制组就意味着没有比较，就意味着没法对所发生的情况进行判断；

历史控制法通常用于检测对象的成功方面；当前和历史的大多数方面不具有可比性；

实验组和控制组的选择：避免混杂因素；
你可以：

轮流按不同的价格给顾客结账；这样一半进实验组，一半进控制组，店址也不再是混杂因素；X
使用历史控制法，将这个月所有店作为控制组，下个月所有店作为实验组；X
将不同的店随机分配给控制组和实验组；X
将大的地理区域分成小的地理区域，随机将这些微区域分进控制组和实验组；√
- 分割范围要合适，分割区域也要彼此相似；
- 相似的组织间才有可比性；

从对象池中随机选择对象是避免混杂因素的极好方法；（随机使混杂因素的影响对控制组和实现组相同）

随机控制 是各种实验的黄金标准；最大限度地接近数据分析的核心——证明因果关系；

添加随机列，在第一个单元格输入 =RAND()，然后向下拖动使用，在对随机列进行排序；
根据需要划分控制组和多个实验组；

我们已经了解了观察研究法 实验研究法 控制组和实验组 混杂因素 随机性 ，使用它们设计合适的实验，找到想要的答案；

试图证明什么？why？
控制组和实验组是什么样子的？
- 将数据表划分为微区域；
- 将微区域随机分配给控制组和实验组；
如何避免混杂因素？
- 相同（相似）的组，再区别对待，才有了有效的比较；
分析结果会是什么样的？

结论

随机控制实验，得出了最有效的提高营业收入的方式。

3 最优化——寻找最大值

用数字表示利润、钱、效率、速度等，实现更高目标：调整决策变量、解决方案和优化点；

分析：

当前产品的盈利能力；
约束各个产品盈利能力的因素都有哪些；
- 各个产品的利润，原料公用能力，生产需要时间…
- 给出每个产品生产多少的意见；

`约束条件`：

可以明确在实现利润最大化的过程中无法做到的事；

`决策变量`：在不超过约束条件的情况下，选择一个组合实现利润最大化；

最优化问题：

通过改变一些量值，实现某一项的最大化；如通过改变各个产品的生产数量，达到利润的最大化；

解决最优化问题：

将决策变量、约束条件及希望最大化的目标合并成一个目标函数；
希望最大化或最小化的对象就是目标，目标函数可以帮助找到最优化的结果；

约束条件和决策变量在等式中共同作用，形成利润，多个最终汇成目标：总利润：

P	=	c1x1	+	c2x2
目标：期望最大化的对象		c表示约束条件		x表示一个决策变量

任何最优化问题都有一些约束条件和一个目标函数；

产品1的利润 * 产品1的生产数量 + 产品2的利润 * 产品2的生产数量 = 利润

如何在一张图里把各个产品组合的约束条件绘制出来？

以x轴表示产品1，y轴表示产品2，产品组合在由约束线围城的空间称为可行区域；每个约束条件都会引起可行区域的变化，可以通过可行区域找到最优点；

原料供应的约束条件：

500个产品1 或400个产品2；各取圆点画直线；

可行区域的点带入到目标函数：

$5 * 产品1的数量 + $4 * 产品2的数量 = 利润；

使用Excel的小函数找到最优点，解决最优化的问题

Excel中的函数插件：Solver（求解器）；
插入约束条件，写下目标函数，其他的交给Solver吧；

一切模型都是错误的，但其中有一些有用的；尽量创建最有用的模型；

Solver可以解决许多定量问题，但Solver主要是一个解决线性编程问题的工具，优化问题还有许多其他类型，可以用各种算法求解；

提防负相关变量：

产品1的市场受欢迎程度可能和产品2负相关；
创建模型时，往往要假设并明确各个变量的相互关系；

加入一个新的约束条件：估计某个月各个产品的最高销量；并假设后续几个月会保持前几个月的销售趋势；

模型使用的数据都是观察数据，现在其作用，未来可能会失灵，要做好准备，反复不断地进行构建正式分析师的工作；

总结

理解了具体的定量最优解的求解方式，但是这个Solver没用上，在WPS上没找到。

4 数据图形化——图形让你更精明

高明的数据图形：

做出高明的比较；
展示了个更多的变量；

散点图是探索性数据分析的奇特工具：

使用散点图发现因果关系，x轴表示自变量（原因），y轴表示应变量（表示结果）；

最优秀的图形都是多元图形：

图形中，数据与假设的吻合程度，数据是否证实了假设；

5 假设检验——假设并非如此

证伪法：一种切实有效的非直觉方法；

请勿试图选出最合理的假设，只需剔除无法证实的假设——这就是假设检验的基础：伪证；

在进行假设检验时，重点是要识别和找出诊断证据，非诊断证据不会给你带来任何进展；
要关注新进的证据，随时重新分析评估之前的各个假设；

6 贝叶斯统计——穿越第一关

必须确保每一个分析过程都充分利用所搜集到的与问题有关的数据；

贝叶斯规则：利用基础概率和波动数据进行分析；

条件概率：以一件事的发生为前提的另一件事的发生概率；

避免基础概率谬误的唯一办法就是对基础概率提高警惕，而且务必要将基础概率整合到分析中；

7 主观概率——信念数字化

主观概率:

主观概率是根据规律进行分析的巧妙方法，尤其是在预测孤立事件却缺乏从前在相同条件下发生过的事件的可靠数据的情况下；

通过散点图的分布确定已经达成共识的部分；

标准偏差：

标准偏差量度：分析点与平均值的偏差；
数据集中的大部分点都会落在平均值的一个标准偏差范围内；

EXCEL中计算标准偏差：

公式 =STDEV(数据范围)

示例中场景：

主观概率偏离平均值的标准差越大，分歧越大；

贝叶斯规则用来修正主观概率：

已知证据，求假设条件的概率 = （假设的概率 * 在假设成立的条件下，证据出现的概率） / （假设的概率 * 在假设成立的条件下，证据出现的概率）+（假设不成立的概率 * 在假设不成立的条件下，证据出现的概率）

P(H|E) = P(H)P(E|H) /( P(H)P(E|H) + P(_H)P(E|H) )

通过比较修正后的主观概率重新确定需要达成的共识；

8 启发法——凭人类的天性作分析

启发法是从直觉走向最优化的桥梁：

选择一两个变量，然后根据这些变量对整个系统做出结论；
用一种更便于理解的属性代替一种难解的、令人困惑的属性；
可能会得出正确的答案，但不保证得出最优解；

使用快省树：

一种描述启发法的图形被称为快省树，快是耗时不多，省是不需要大量认知；

9 直方图——数字的形状

使用Wxcel的Data DataAnalysis：

选择Histogram（直方图）；
选择数据；
勾选Chart Output进行图标绘制；

直方图体现了每组数据的发生频数：

无论数据集多大，直方图都能显示出数据点在数值范围内的分布情况；

10 回归——预测

散点图：plot

使用平均值图形预测每个区间内的数值：

画一条线把平均值图中的点连起来——回归线；可以用于预测；
线性回归 or 非线性回归（更复杂，不讨论）；

回归线对于具有线性相关特点的数据很有用；

相关性即两个变量之间的线性关系，如果要呈现线性关系，散点图上的点就需要大致沿着直线分布；

11 误差——合理误差

外插法：回归方程预测数据范围以外的数值预测方法；

指定附加假设条件；

内插法：回归方程预测数据范围以内的数值预测方法；（x值的范围来自能观察到的数据范围）

观察模型时，一定要想一想他们的假设有何道理，以及是否忘记了某种假设；不合适的假设会使模型完全失效；

机会误差=实际结果与模型预测结果之间的偏差；

统计学中，机会误差又称为残差，对残差的分析是优秀的统计模型的核心；

定量地指定误差：

残差分布：需要一个统计值，体现观察结果相对于回归线的平均偏移量；

做为一种度量方式，相对于回归线的机会误差（或者称为均方根误差）的分布与相对于平均值的标准偏差具有相同的用途；

有了回归线的均方根误差值，就能明确实际结果与典型预测结果之间可能有多大差距；

用均方根误差定量表示残差分布：

均方根误差描述的是回归线周围的分布情况；

计算均方根使用相关的统计计算软件提供的函数很方便；我们需要知道的是：

误差是可以定量描述、定量使用的；

度量误差的方法还有很多，均方根只是描述偏差的一种；

分割的目的是管理误差：

将数据拆分为几个组称为分割，如果为几个组分别创建预测模型比单独使用一个模型更能减小误差，则应进行分割；

12 关系数据库——你能关联吗

数据库就是一系列相互有特定关系的数据；

根据从表格导入的数据进行图表绘制使数据更加直观；

13 整理数据——井然有序

作为数据分析师，花在数据整理上的时间多过数据分析上的时间；

如果给定的数据域有规则，比如以某个分隔符进行分隔，Excel可以通过”Text to columns“来进行文本转换列；

Excel提供了字符串处理的函数：

Find：在单元格中哪个位置查找搜索字符串；
Left：取单元格左边的字符；
Right：取单元格右边的字符；
Trim：删除单元格中的空格；
Len：求单元格的长度；
Concatenate：取两个值，然后合并在一起；
Value：求以文本格式存储的数字的数值；
Substitute：以指定的新文本代替单元格中不需要的文本；

FirstName域：=SUBSTITUTE(B2,"^","")

多个公式还可以嵌套使用：

CONCATENATE(LEFT(A1,1),RIGHT(A1,1))

使用正则表达式处理复杂的数据模式；

为数据排序：让重复数值集中出现：

数据越混乱，越应该大胆的排序；

Excel中支持删除重复数据：Remove Dumplications；

附录A

十大要诀：

统计知识大全

统计学领域拥有大量数据分析工具和技术，对数据分析极为重要；
取样：调查、置信区间、标准误差、样本均值；
显著性检验：原假设和备择假设、T检验、卡方检验、Z检验；
概率：乘法规则、独立性、二项式定理；
随机变量：平均律、概率直方图、正态逼近法、盒子模型；
本书主要提及了假设和建模；
Excel技巧：

掌握Excel并不是特别难；
图形原则：

分析设计原则；
提现比较对比差异
提现因果关系机制理由系统结构
提现多元数据（提现出1或2个变量）
将文字数字图片图形结合
充分描述证据
数据分析报告的成败在于报告内容的质量、相关性和整体性；
数据透视表

数据透视表是电子表格和数据分析软件中极为重要的数据分析工具；
非线性与多元回归
原假设-备择假设检验（《深入浅出统计学》）
随机性
Excel的扩展插件安装并启用及其他。

Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python数据分析与可视化 jun778895 python 数据分析开发语言
Python数据分析与可视化是一个涉及数据处理、分析和以图形化方式展示数据的过程，它对于数据科学家、分析师以及任何需要从数据中提取洞察力的专业人员来说至关重要。以下将详细探讨Python在数据分析与可视化方面的应用，包括常用的库、数据处理流程、可视化技巧以及实际应用案例。一、Python数据分析与可视化的重要性数据可视化是将数据以图形或图像的形式表示出来，以便人们能够更直观地理解数据背后的信息和规
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
python读写CSV文件 bcbobo21cn .Net python 开发语言机器学习 CSV
做数据分析，有时候要分析的数据在CSV文件里；先看一下python读写CSV文件；importpandasaspddf=pd.read_csv('test1.csv')print(df)print('')print(df.head(2))companyname=["A1","B2","E3","F4"]legperson=["lier","yanqi","wangwu","zhangsan"]le
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
python数据分析知识点大全编程零零七 python数据分析 python 开发语言 python数据分析数据分析知识点大全 python数据分析知识点 python教程 python基础
Python数据分析知识点大全可以归纳为以下几个主要方面：一、基础概念与目的数据分析定义：数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论，对数据加以详细研究和概括总结的过程。其目的在于从数据中挖掘规律、验证猜想、进行预测。Python在数据分析中的优势：Python因其易学性、快速开发、丰富的扩展库（如NumPy、Pandas等）和成熟的框架，成为数据分析领域的
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【数字化供应链】数字化供应链架构、全景管理、全流程贯通方案数字化建设方案数字化转型数据治理主数据数据仓库供应链数字仓储智慧物流智慧仓储物流园区架构微服务数据挖掘大数据人工智能
原文《数字化供应链架构、全景管理、全流程贯通方案》PPT格式。主要从供应链管理全景、智慧供应链建设总体目标、供应链总体业务流程、供应链总体功能架构、供应链总体技术架构、供应链全流程贯通、供应链全领域管理、供应链数据数据分析、供应链决策中台等进行建设。本文仅对主要内容进行介绍。来源网络公开渠道，旨在交流学习，如有侵权联系速删，更多参考公众号：优享智库基于先进IT技术、大数据能力、物联网应用、区块链平
OmicsTools除b站教学视频外已整理的零代码生信全流程分析文档邢博士谈科教医学科研生信分析 r语言数据可视化数据挖掘数据分析生信医学生信分析
OmicsTools软件介绍和下载安装配置软件简介我开发了一款本地电脑无限使用的零代码生信数据分析作软图神器电脑软件OmicsTools，欢迎大家使用OmicsTools进行生物医学科研数据分析和作图，该软件件能让大家在不需要任何编程和代码编写的基础上，分析次数没有限制，可以无限使用，让您在自己电脑上快速进行大量的生信分析和加速大家的科研。OmicsTools生信分析电脑软件可以做医学生物生信各个
【数据分析】利用Python+AI+工作流实现自动化数据分析-全流程讲解 z千鑫 AI领域 FLASK基础 Python基础人工智能数据分析 python AI编程 AI工作流 ai 自动化
文章目录一、为什么要用AI进行自动化分析？二、AI自动化分析场景三、编写Python脚本示例1、用flask实现让AI分析数据内容使用说明：示例2、用定时任务的方式，定时处理AI数据代码说明四、把AI分析的数据，放到AI工作流中做展示五、openAI的key结尾在信息爆炸的时代，如何快速获取有价值的洞察力成为了各行各业的迫切需求。传统的内容分析方法往往又耗时又费力，并且难以满足快速变化的市场需求。
Mall4j商城实战 - 部署 canal 数据库增量日志解析 yueerba126 Mall4j商城实战数据库 spring cloud 微服务架构
Canal简介Canal是基于MySQL数据库增量日志解析的工具，主要用于增量数据的订阅和消费。Canal主要用途基于MySQL数据库增量日志解析详细功能：实时解析MySQL的二进制日志（Binlog）。捕获数据库中的所有增量变更，如插入、更新和删除操作。使用场景：适用于实时监控数据库变化的应用，比如数据复制、数据备份或实时数据分析等。提供增量数据订阅和消费服务
大数据新视界 --大数据大厂之揭秘大数据时代 Excel 魔法：大厂数据分析师进阶秘籍青云交大数据新视界 Excel 数据分析函数公式数据透视表图表功能规划求解数据分析工具库大数据新视界数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
Rust: duckdb和polars读csv文件比较 songroom rust 开发语言后端
duckdb在数据分析上，有非常多不错的特质。1、快；2、客户体验好，特别是可以同时批量读csv（在一个目录下的csv等文件）。polars的性能比pandas有非常多的超越。但背后的一些基于arrow的技术栈有很多相同之类。今天想比较一下两者在csv数据读写的情况。一、文件准备csv样本内容，是N行9列的csv标准格式，有字符串，有浮点数，有整型。具体如下：本次准备了两个csv文件，一个大约是2
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
python基于django/flask的NBA球员大数据分析与可视化python+java+node.js QQ_511008285 python django flask java spring boot 数据分析
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以本文针对NBA球员的大数据进行
Java基于spring boot的国产电影数据分析与可视化python+java+node.js QQ_511008285 java spring boot 数据分析 python django vue.js flask
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以该系统使用进行大数据处理和
Python最全的股票数据API接口 w_traveler python 开发语言大数据
python最全的股票数据API接口使用python是一种有效的方式来获取高频股票数据，以便进行股票行情数据分析和量化交易。python是一种广泛应用于金融数据领域的编程语言，可用于与股票数据API接口进行交互。通过调用股票数据API接口，我们可以获取实时的股票数据，包括tick数据和k线历史数据。tick数据提供了每次交易的详细信息，而k线历史数据则提供了一段时间内港股、美股、A股、沪深行情数据
R 地图绘制-比例尺与指北针 jamesjin63
ggplot绘制mapR语言可以进行数据分析，也可以进行地图绘制，而且非常简洁，快速。虽然Arcgis基于桌面可视化操作，能够进行空间分析，但是唯一不足的就是操作步骤繁琐而且一不小心，就要从头再来，可重复性较低。这篇文章主要讲述如何利用R语言中的ggplot与sf绘制带有指北针、图列与标尺的地图屏幕快照2020-06-28下午9.27.59.png数据我们下载非洲地区54个国家的图层Afirca.
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
新质农业-再生农业的应用橙蜂智农人工智能制造创业创新
橙蜂智能公司致力于提供先进的人工智能和物联网解决方案，帮助企业优化运营并实现技术潜能。公司主要服务包括AI数字人、AI翻译、埃域知识库、大模型服务等。其核心价值观为创新、客户至上、质量、合作和可持续发展。橙蜂智农的智慧农业产品涵盖了多方面的功能，如智能化推荐、数据分析、远程监控和决策支持系统。用户可以通过应用获得个性化的作物种植建议、实时的生长状态监控以及精确的灌溉和施肥指导，提升农业生产效率。文
利用发电量和气象数据分析来判断光伏仿真系统的准确性鹧鸪云光伏与储能软件开发数据分析数据挖掘光伏发电大数据光伏新能源
随着光伏产业的迅速发展，光伏仿真系统通过集成气象数据分析、发电量分析、投融资分析及损耗估算等功能，为光伏项目的全生命周期管理提供了科学依据。光伏仿真系统集成了气象数据分析、发电量预测、投融资分析、损耗估算及光伏设计等功能。其中，气象数据分析是仿真系统的基石，通过整合权威的气象数据（如Meteonorm、Nasa等），模拟光伏电站所在区域的历史气象条件及未来气象预测。基于这些气象数据，发电量分析功能
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

数据分析入门——深入浅出数据分析