华夏_数据分析

阿里巴巴股票行情分析

友情提示：投资有风险，入股需谨慎

阿里巴巴股票数据集提取码: spyv

简单分析

上代码

import numpy as np
from dateutil.parser import parse
# 指定打开的文件名
# 不需要的行需要skip掉
# 默认没有分隔符，所以需要指定delimiter
# 不加载全部的情况下需要指定加载哪些列usecols
# 希望把每一列加载到单独的数组中需要设置unpack=True，并指定对应的变量名
stock_info = np.loadtxt('./BABA_stock.csv', skiprows=1, unpack=True, usecols=(1, 2, 3, 4, 5), delimiter=',')
stock_info = stock_info[:, ::-1]
print(stock_info.shape)
print(stock_info)


close_info = stock_info[0]
open_info = stock_info[2]

# 上涨天数
rise_count = close_info[(close_info-open_info) > 0].size
print('上涨的天数: {}'.format(rise_count))

# 下跌的天数
fail_count = len(close_info[(close_info-open_info) < 0])
print('下跌的天数: {}'.format(fail_count))

# 上涨的概率
rise_percent = (close_info[(close_info-open_info) > 0]).size / stock_info.shape[1]
print('上涨的概率是: {:.2%}'.format(rise_percent))

# 下跌的概率
fail_percent = len(close_info[(close_info-open_info) < 0]) / stock_info.shape[1]
print('下跌的概率是: {:.2%}'.format(fail_percent))

(5, 755)
[[7.897000e+01 7.901000e+01 7.946000e+01 ... 1.849800e+02 1.889100e+02
  1.830700e+02]
 [1.169603e+07 7.761672e+06 1.472746e+07 ... 8.848863e+06 1.256109e+07
  1.461019e+07]
 [7.945000e+01 7.852000e+01 7.920000e+01 ... 1.851500e+02 1.877100e+02
  1.880600e+02]
 [7.975000e+01 7.912000e+01 8.048000e+01 ... 1.860600e+02 1.897900e+02
  1.881700e+02]
 [7.846000e+01 7.771000e+01 7.847000e+01 ... 1.837500e+02 1.871400e+02
  1.825600e+02]]
上涨的天数: 358
下跌的天数: 395
上涨的概率是: 47.42%
下跌的概率是: 52.32%

从上面代码运行的结果可以看出

2016年4月15日到2019年4月15日这三年一共有755个交易日
上涨的天数是358天
下跌的天数是395天
上涨的概率是47.42%
下跌的概率是52.32%

把日线转换成周线

继续上代码

# 日线转换成周线
# 什么是周线
high_info = stock_info[3]
low_info = stock_info[4]

# loadtxt方法有一个参数converters参数，可以利用自定义的函数把string做转换
from dateutil.parser import parse
def convert_date(d):
    return parse(d).weekday()
stock_info = np.loadtxt('./BABA_stock.csv', delimiter=',', usecols=(0, 1, 3, 4, 5), skiprows=1, dtype='S', converters={0: convert_date})
# print(stock_info)
print(stock_info.shape)

# 倒序排列
stock_info = stock_info[::-1, :].astype('f8')
# 需要按照周分组
# 先找到星期一的数据的索引
week_split = np.where(stock_info[:, 0] == 0)[0]
# week_split
# 按照周一去分组，split返回给定索引的分组
# 可以指定任意间隔的索引，所以split以一个list的形式返回
week_infos_temp = np.split(stock_info, week_split)
# print(type(week_infos_temp))
# week_infos_temp

# 为了简单起见，我们这里只使用一周数据有五天的
week_info = [x for x in week_infos_temp if len(x) == 5]
# week_info
# 每个星期的数据都是一样的了， 我们把它转成ndarray 
w = np.array(week_info)
print(w.shape)
print(w[:3])
week_close = w[:, -1, 1]
week_open = w[:, 0, 2]
week_high = w[:, :, 3].max(axis=1)
week_low = w[:, :, 4].min(axis=1)

w_info = np.array([week_close, week_open, week_high, week_low])

# 一周的数据放一行，可以直接用转置矩阵
print(w_info.T[:5])

# 把数据保存到文件
np.savetxt('./week_info_baba.csv', w_info.T, header='close, open, high, low', delimiter=',', fmt='%.2f')

(755, 5)
(114, 5, 5)
[[[ 0.     79.01   78.52   79.12   77.71  ]
  [ 1.     79.46   79.2    80.48   78.47  ]
  [ 2.     81.21   79.     81.735  78.99  ]
  [ 3.     80.78   81.08   81.78   80.2   ]
  [ 4.     79.89   80.12   85.89   79.155 ]]

 [[ 0.     78.84   79.8    79.84   78.68  ]
  [ 1.     78.61   78.85   79.56   77.8001]
  [ 2.     77.65   78.3    78.62   76.57  ]
  [ 3.     76.4    77.65   77.9    76.09  ]
  [ 4.     76.94   76.81   77.28   75.66  ]]

 [[ 0.     76.61   76.89   77.     75.94  ]
  [ 1.     75.91   75.96   76.27   75.425 ]
  [ 2.     75.82   75.64   75.91   75.01  ]
  [ 3.     78.83   79.52   79.94   78.1   ]
  [ 4.     79.2    78.35   79.72   78.25  ]]]
[[79.89  78.52  85.89  77.71 ]
 [76.94  79.8   79.84  75.66 ]
 [79.2   76.89  79.94  75.01 ]
 [77.16  78.94  80.485 76.97 ]
 [78.79  77.86  80.2   77.59 ]]

股票买卖策略评估

策略：股价超出十日均线买入，跌破十日均线卖出

# 加载数据，把date这一列设置为索引，简单起见，只用收盘价进行分析
import numpy as np
import pandas as pd

df = pd.read_csv('./BABA_stock.csv', index_col='date', usecols=[0, 1])
# 先查看下数据
print(df.head())

# 将索引转换成datetime形式
df.index = pd.DatetimeIndex(df.index.str.strip("'"))
print(df.index)

# 数据中最近的日期排在前面，按照日期重新排序
df.sort_index(inplace=True)
print(df.head())
print(df.describe())

              close
date                
'2019/04/15'  183.07
'2019/04/12'  188.91
'2019/04/11'  184.98
'2019/04/10'  186.19
'2019/04/09'  187.19
DatetimeIndex(['2019-04-15', '2019-04-12', '2019-04-11', '2019-04-10',
               '2019-04-09', '2019-04-08', '2019-04-05', '2019-04-04',
               '2019-04-03', '2019-04-02',
               ...
               '2016-04-28', '2016-04-27', '2016-04-26', '2016-04-25',
               '2016-04-22', '2016-04-21', '2016-04-20', '2016-04-19',
               '2016-04-18', '2016-04-15'],
              dtype='datetime64[ns]', name='date', length=755, freq=None)
            close
date             
2016-04-15  78.97
2016-04-18  79.01
2016-04-19  79.46
2016-04-20  81.21
2016-04-21  80.78
            close
count  755.000000
mean   143.366954
std     40.345464
min     74.230000
25%    102.925000
50%    152.110000
75%    179.155000
max    210.860000

从上面代码运行的结果可以看出

2016年4月15日到2019年4月15日这三年一共有755个交易日
收盘价最高210.86
收盘价最低是74.23
平均收盘股价是143.366954

# 策略一：股价超出10日均线买入，跌破十日均线卖出
# 先计算十日均线数据
ma10 = df.rolling(10).mean().dropna()
# ma10

# 买点
ma10_model = df['close'] - ma10['close'] > 0
# print(ma10_model)

# 第一个值是False，第二个值是True，在True的时候买入，需要自定义一个移动窗口处理函数
# 因为卖的时候还需要定义类似的函数，所以把折两个函数放在一起
# 可以在自定义函数中print一些信息，例如w值，以方便调试---这也是调试的一种方式
def get_deal_date(w, is_buy=True):
    if is_buy == True:
        return True if w[0] == False and w[1] == True else False
    else:
        return True if w[0] == True and w[1] == False else False

# raw=False没有的话会有警告信息
# 如果删除na值，会有缺失，所以这里用0填充，转换为bool值方便后面取值
se_buy = ma10_model.rolling(2).apply(get_deal_date, raw=False).fillna(0).astype('bool')
# print(se_buy)

# apply的args接收数组或者字典给自定义参数传参
se_sale = ma10_model.rolling(2).apply(get_deal_date, raw=False, args=[False]).fillna(0).astype('bool')
# print(se_sale)

# 具体的买卖点
buy_info = df[se_buy.values]
sale_info = df[se_sale.values]
# print(buy_info)
# print(sale_info)

# 买和卖的索引值不一样，不过数据都有63条，所以删除时间索引信息
no_index_buy_info = buy_info.reset_index(drop=True)
no_index_sale_info = sale_info.reset_index(drop=True)

# print(no_index_buy_info.head())
# print(no_index_sale_info.head())

# 每次交易盈利情况
profit = no_index_sale_info - no_index_buy_info
# print(profit)
print(profit.sum())
print(profit.describe())

close    36.07
dtype: float64
           close
count  63.000000
mean    0.572540
std     6.419356
min    -9.190000
25%    -3.380000
50%    -1.120000
75%     3.435000
max    17.840000

分析步骤里的数据大家可以结合注释自行打印，结果太长了，我就不贴出来了。

总利润是36.07，注意这是买和卖一股的利润（买固定的股数），三年的时间交易了63次
最多投入210.86，平均投入是143.366954，按最高投入算利润率（36.07 / 210.86），年化差不多5%，按平均投入算0.2515，年化将近8%，当然还有手续费没算

最后我们假设有10000美元，算一下最终盈利

# 假设有一万美元，最终盈利是多少
all_money = 10000
remain = all_money
for i in range(len(no_index_buy_info)):
    buy_count = remain / no_index_buy_info.iloc[i]
    remain = buy_count * no_index_sale_info.iloc[i]
    profit_money = remain - all_money
    if i == len(no_index_buy_info) - 1:
        print(profit_money)
        print(remain)
        
# 如果加上每次交易金额的万分之三手续费
all_money = 10000
remain = all_money
fee = 0.0003
for i in range(len(no_index_buy_info)):
    buy_count = remain / no_index_buy_info.iloc[i]
    remain = buy_count * no_index_sale_info.iloc[i] * (1 - fee)
    profit_money = remain - all_money
    if i == len(no_index_buy_info) - 1:
        print(profit_money)
        print(remain)

close    3799.294014
dtype: float64
close    13799.294014
dtype: float64
close    3540.898129
dtype: float64
close    13540.898129
dtype: float64

最后剩下13799.294014，年化10%多点，还不错
如果加上每次交易金额的万分之三手续费，最终金额是13540.898129，少了一点，不过也还不错

你可能感兴趣的:(数据分析项目)

金融数据分析（十）人均国内生产总值的增长率于科技人文间徘徊金融数据分析 python 数据分析
案例（四）宏观金融数据分析项目一：利用世界银行公开数据平台提供的宏观经济数据比较最近40年间A国与B国的人均国内生产总值的增长率（图表输出）数据可通过此网页中的下载链接获取：https://data.worldbank.org.cn/?locations=CN-US#-*-coding:utf-8-*-"""CreatedonMonSept229:11:592020@author:mly"""im
python量化交易策略实例_Day 80 量化投资与Python——项目案例 weixin_39964660 python量化交易策略实例
数据分析项目案例股票分析小结：需求：使用tushare包获取某股票的历史行情数据。输出该股票所有收盘比开盘上涨3%以上的日期。输出该股票所有开盘比前日收盘跌幅超过2%的日期。#需求四：假如我从2010年1月1日开始，每月第一个交易日买入1手股票，每年最后一个交易日卖出所有股票，到今天为止，我的收益如何？需求一：使用tushare包获取某股票的历史行情数据。#获取行情df=ts.get_k_data
新冠疫情数据分析项目实战附完整项目代码实验报告计算机毕设论文 python之数据分析可视化数据分析数据挖掘 python
题目要求1.标明你的数据来源：包括网址和首页截图2.数据分析和展示应包括：a)15天中，全球新冠疫情的总体变化趋势；b)累计确诊数排名前20的国家名称及其数量；c)15天中，每日新增确诊数累计排名前10个国家的每日新增确诊数据的曲线图；d)累计确诊人数占国家总人口比例最高的10个国家；e)死亡率（累计死亡人数/累计确诊人数）最低的10个国家；f)用饼图展示各个国家的累计确诊人数的比例（你爬取的所有
毕设项目基于大数据的b站数据分析 nange12330a 毕业设计毕设大数据
文章目录0数据分析目标1B站整体视频数据分析1.1数据预处理1.2数据可视化1.3分析结果2单一视频分析2.1数据预处理2.2数据清洗2.3数据可视化3文本挖掘（NLP）3.1情感分析0数据分析目标今天向大家介绍如何使用大数据技术，对B站的视频数据进行分析，得到可视化结果。项目运行效果：毕业设计基于大数据的b站数据分析项目分享:见文末!1B站整体视频数据分析分析方向：首先从总体情况进行分析，之后分
简记一段数据清洗项目经历 Jo乔戈里 sql database mysql python
声明：该项目是从github上下载的，原项目地址在:https://github.com/TurboWay/bigdata_analyse这个数据分析项目选自其中的"Amoy_job",即"10万条厦门招聘数据分析",但是没有严格沿用里面的代码，绝大部分都是自己思考所做的数据清洗。注意，此处仅是数据清洗，尚未进入到真正的数据分析和可视化，得出结论这些阶段！代码镇楼:fromcollectionsi
毕设分享基于大数据的b站数据分析 knooor 毕业设计毕设大数据
文章目录0数据分析目标1B站整体视频数据分析1.1数据预处理1.2数据可视化1.3分析结果2单一视频分析2.1数据预处理2.2数据清洗2.3数据可视化3文本挖掘（NLP）3.1情感分析0数据分析目标今天向大家介绍如何使用大数据技术，对B站的视频数据进行分析，得到可视化结果。项目运行效果：毕业设计基于大数据的b站数据分析项目分享:见文末!1B站整体视频数据分析分析方向：首先从总体情况进行分析，之后分
大数据分析案例-基于逻辑回归算法构建抑郁非抑郁推文识别模型艾派森大数据分析案例合集机器学习人工智能 python 数据挖掘回归
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+喜欢大数据分析项目的小伙伴，希望可以多多支持该系列的其他文章大数据分析案例合集
数据分析项目——物流数据行业数据分析 ~在杰难逃~ 数据分析数据挖掘 python numpy pandas 大数据
提升自己，掌握数据分析的能力，最快的方式就是实践！这里又是一个经典的数据分析项目——物流数据行业数据分析，有需要项目配套数据集的可以关注私信我免费获取(●'◡'●)PS：本文中全部代码都在JupyterNotebook中编写完成，可以使用JupyterNotebook或者JupyterLab直接运行。数据来源：某企业销售的6种商品所对应的送货及用户反馈数据首先我们还是确定下我们需要做些什么一、解决
【摸鱼笔记】python 提取和采集 finereport 未绑定目录的报表模板 The_Singing_Towers 笔记 python 开发语言
背景在企业应用过程中，报表一般会按照数据分析的主题、项目将多个报表放在一处，一些图表类报表会有通过超链接等方式，跳转到对应的明细报表中。并且在正式的使用中，这些报表不会绑定到目录。在梳理数据分析项目使用情况时这些报表会难以辨认所属的项目，因为即使按照很标准的方式【将同一项目的报表放在同一目录】也会有数据分析项目相互包含的问题影响梳理的工作量。同时在finelogDB的访问记录中displayNam
php案例分析百度云_基于阿里云平台的大数据教学案例 —— B站弹幕数据分析 weixin_39892311 php案例分析百度云
简介：实验基于所学的大数据处理知识，结合阿里云大数据相关产品，分组完成一个大数据分析项目，数据集可以使用开源数据集或自行爬取，最终完成一个完整的实验报告：1、能够使用阿里云大数据相关产品完成数据分析、数据建模与模型优化2、能够基于分析结构构建可视化门户或可视化大屏，分析和呈现不少于5个3、分析案例有实用价值并能够形成有效结论4、能够将开源技术与阿里云产品结合，综合利用提升开发效率，降低成本5、能够
49Kaggle 数据分析项目入门实战--绝地求生游戏最终排名预测 Jachin111
绝地求生介绍相信很多都玩过绝地求生这款游戏，其游戏规则主要是将100名玩家空手被扔到一个岛上，这些玩家必须探索、寻找、消灭其他玩家，直到只剩下一个玩家活着。绝地求生很受欢迎。这款游戏销量目前超过5000万份，是有史以来销量排名前五的游戏，每月有数百万活跃玩家。而我们本次实验的任务就是根据玩家在游戏中的种种表现来预测出其在最终的排名。导入数据并预览首先安装实验需要的statsmodels包。!pip
python3 数据分析项目案例,python数据分析报告范文 2301_81895949 oracle
这篇文章主要介绍了python3数据分析项目案例，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获，下面让小编带着大家一起了解一下。1需求分析随着科学技术的不断发展，信息流通日益方便，信息数据不断膨胀，充斥在各行各业。由于数据非常庞大，所以即使在搜索引擎存在的情况下，搜索结果的准确率也不高，这使得在网上查找关键有效信息也变为一项极具挑战性的复杂任务python编程代码画哆啦
小白Pycharm使用（6）：如何使用 Python 开始建立你的数据分析项目程序员八阿哥
python开发新手工具网盘地址下载链接：http://pan.baidu.com/s/1eS8WMR4密码：7esopycharm中文版包网盘地址下载链接：http://pan.baidu.com/s/1dEVkPtn密码：mzetpycharm注册码http://idea.qinxi1992.cnhttp://intellij.mandroid.cn（或http://idea.imsxm.co
让你能进“大厂”的数据分析项目是长怎样？全套路线（建议收藏）悠玩编程编程语言大数据数据分析 java 人工智能
《算法+数据结构》全套路线（建议收藏）前言所谓活到老，学到老，虽然我感觉自己已经学了很多算法了，但是昨天熬夜整理完以后发现，自己还是个弟弟，实在忍不住了，打算把算法学习路线发出来，我把整个算法学习的阶段总结成了五个步骤，分别为：基础语法学习、语法配套练习、数据结构、算法入门、算法进阶。本文梳理了这五个大项的思维导图，在下文会有详细介绍。希望各位能够找到自己的定位，通过自己的努力在算法这条路
基于北京二手房价数据的探索性数据分析和房价评估——项目设计和数据的获取快乐的冲浪码农数据分析数据分析决策树
数据分析项目——北京二手房价数据分析第一步：项目设计和获取数据（获取实验的数据集！！）第二步：数据读取和数据预处理第三步：数据的可视化分析第四步：构建房价评估模型（决策树、随机森林等）整个项目的代码和数据集获取：https://github.com/Proberen/Data-analysis___Beijing__Houseprice该项目的设计思路：
50Kaggle 数据分析项目入门实战--分销商产品未来销售情况预测 Jachin111
分销商产品未来销售情况预测未来销售额预测介绍对于一个产品来说，其未来销售额的预测是一个重要的指标，也是一项重要的任务。例如，对于一部苹果手机来说。在上市之前，得先对销售额进行预测，才能确定出货量的大小。本次实验来源于Kaggle上的一个挑战，即：未来销售额预测，由俄罗斯的1C-Company软件分销公司发起，并提供数据。而本次实验的任务就是根据提供的数据，包含商品类别、商品名称、商店等信息和商品的
大数据分析案例-基于随机森林算法构建电影票房预测模型艾派森大数据分析案例合集 python 机器学习数据分析随机森林人工智能
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+喜欢大数据分析项目的小伙伴，希望可以多多支持该系列的其他文章大数据分析案例合集大数据分析案例-基于随机森林算法预测人类预期寿命大数据分析案例-基于随机森林算法的商品评价情感分析大数据分析案例-用RFM模型对客户价值分析(聚类)大数据分析案例-对电信客户流失
我的第一个数据分析项目——51job“数据分析”岗位分析（数据清洗篇二）大力SAMA
一、工作经验字段完善虽然概要描述中显示无工作经验，但实际职位描述中仍旧要求工作经验，因此要把职位描述中的内容取出来更新到工作经验这一列。网页数据显示excel数据显示代码如下：#-*-coding:utf-8-*-"""CreatedonWedSep1213:05:272018@author:shirley"""fromopenpyxlimportload_workbookimportrepath
看书笔记【R语言数据分析项目精解：理论、方法、实战 8】小胡涂记 R语言资料实现笔记 r语言数据分析
看书笔记——R语言Chapter8从数据中寻找优质用户8.1项目背景、目标和方案8.1.1项目背景8.1.2项目目标8.1.3项目方案8.2项目技术理论简介8.2.1逻辑回归的基本概念8.2.2建模流程1.模型开发2.模型验证阶段3.模型测试阶段4.模型实施阶段8.2.3模型开发阶段1.数据采样2.数据探索3.数据填缺4.离散型变量压缩5.连续型变量压缩6.变量筛选（用到的时候再细看一下，主要是权
看书标记【R语言数据分析项目精解：理论、方法、实战 7】小胡涂记 R语言资料实现 r语言数据分析开发语言
看书标记——R语言Chapter7构建用户画像7.1项目背景、目标和方案7.1.1项目背景7.1.2项目目标7.2项目技术理论简介7.2.1用户画像的基本概念7.2.2用户画像应用领域7.2.3用户画像分类7.2.4用户画像构建1.数据源2.用户画像构建粒度3.用户画像构建抽象方法4.用户画像标签创建流程5.用户画像标签构建难点7.2.5用户画像标签的数值处理方法1.数值归一化2.连续型数值的离散
看书标记【R语言数据分析项目精解：理论、方法、实战 6】小胡涂记 R语言资料实现 r语言数据分析开发语言
看书标记——R语言Chapter6变量筛选技术6.1项目背景、目标和方案6.1.1项目背景6.1.2项目目标6.1.3项目方案6.2项目技术简介6.2.1变量相关性1.定类变量和定类变量2.定序变量与定类变量3.定距（连续型）变量与定距变量4.定类变量与定序变量6.2.2变量筛选1．基于变量距离的层次聚类2.基于变量距离的模糊聚类6.2.3变量降维1.主成分分析（PCA）2.因子分析6.2.4R语
看书标记【R语言数据分析项目精解：理论、方法、实战 3】小胡涂记 R语言资料实现 r语言数据分析开发语言
看书标记——关于R语言chapter3互联网运营指标的建立3.1项目背景、目标及方案3.1.1项目背景3.1.2项目目标3.1.3项目方案3.2项目技术理论简介3.2.1骨灰级流量指标1.PV（pageviews访问页面数）2.UV（UniqueVistors唯一访问人数）3.Visit(会话)3.2.2登录和激活3.2.3访问深度和吸引力1.PV/Visit2.Vist/UV3.Duration
数据分析项目｜淘宝用户行为分析（Python+可视化）程序员小猴紫 python 编程数据分析 python 数据分析用户分析
一、认识数据了解数据的来源、字段等信息1.1数据来源及介绍本数据来源于阿里云天池，是其随机选择约100万用户在2017年11月25日至12月3日之间发生的行为记录，具有包括点击、购买、加购物车和收藏商品的行为。数据集的每一行表示一条用户行为，由用户ID、商品ID、商品类目ID、行为类型和时间戳组成，并以逗号分隔。1.2数据格式二、提出问题针对不同的数据提出问题，总结分析思路了解到所给数据集只有5个
看书标记【R语言数据分析项目精解：理论、方法、实战 9】小胡涂记 R语言资料实现 r语言数据分析开发语言
看书标记——R语言Chapter9文本挖掘——点评数据展示策略9.1项目背景、目标和方案9.1.1项目背景9.1.2项目目标9.1.3项目方案1.建立评论文本质量量化指标2.建立用户相似度模型3.对用户评论进行情感性分析9.2项目技术理论简介9.2.1评论文本质量量化指标模型1.主题覆盖量2.评论文本分词数量3.评论点赞数4.评论中的照片数5.评论分值偏移9.2.2用户相似度模型1.pearson
从数据角度分析年龄与NBA球员赛场表现的关系【数据分析项目分享】报告，今天也有好好学习数据分析数据分析 pandas 数据可视化数据分析案例数据分析项目
好久不见朋友们，今天给大家分享一个我自己很感兴趣的话题分析——NBA球员表现跟年龄关系到底大不大？数据来源于Kaggle，感兴趣的朋友可以点赞评论留言，我会将数据同代码一起发送给你。目录NBA球员表现的探索性数据分析导入Python库和加载数据数据简要概述数据可视化年龄与上场时间的比较年龄与出场次数相比较年龄与PER相比较结论NBA球员表现的探索性数据分析美国国家篮球协会(NBA)中有各个年龄段的
olist巴西电商数据分析项目 sql+tableau @程序媛有个猫 sql
一、分析背景巴西Olist是当地电商平台，本数据集包含2016年9月-2018年8月的数据，本文将通过对平台的整体情况、用户、商家、产品、销售五个方面分析平台的经营状况，目的是为了发现平台可能存在的问题，分析可能的原因并给出建议。数据链接：https://www.kaggle.com/jainaashish/orders-merged数据字段说明：1、product_id：商品ID2、seller
Python多线程爬虫——数据分析项目实现详解雪碧有白泡泡粉丝福利活动 python 爬虫开发语言
前言「作者主页」：雪碧有白泡泡「个人网站」：雪碧的个人网站ChatGPT体验地址文章目录前言爬虫获取cookie网站爬取与启动CSDN爬虫爬虫启动将爬取内容存到文件中多线程爬虫选择要爬取的用户线程池爬虫爬虫是指一种自动化程序，能够模拟人类用户在互联网上浏览网页、抓取网页内容、提取数据等操作。爬虫通常用于搜索引擎、数据挖掘、网络分析、竞争情报、用户行为分析等领域。我们以爬取某个用户的博文列表并存储到
Python Pandas 数据分析项目实例 weixin_42098295 python pandas 数据分析
假设我们有一个电子商务公司的销售数据，包含了客户购买记录、商品价格、购买日期等信息。我们的目标是分析这些数据，提取有价值的信息，例如总销售额、最畅销的产品、销售趋势等。1、安装引用Pandas如没有安装Pandas，可以通过pip安装它。参考下面的文档。然后在Python脚本或Jupyter笔记本中导入Pandas。参考文档：PythonPandas安装和设置2、加载数据使用Pandas加载数据。
基于 Python 的数据分析与可视化百事没事阿 python 数据分析开发语言自动化数据挖掘学习 windows
学好数据分析，可以干什么呢？第一，用于实现自动化办公，解放自我。比如：可以使用Python读取Excel、CSV等格式的数据文件，进行数据清洗、转换、计算等操作，进行自动化数据处理。可以使用Python读取Word、PDF等格式的文档文件，进行文本提取、格式修改、内容替换等操作，进行自动化文档处理。第二，用于企业研发，数据建模必备技能。针对日益复杂的项目需求，很多企业数据分析项目需要高阶数学建模，
统计案例 | 统计数据会说谎？写代码的阿呆统计案例统计学统计案例被平均均值估计统计数据会说谎
统计案例|统计数据会说谎？一、前言二、统计和数学的关系？三、统计数据会说谎？四、写在最后—大咖说统计！一、前言各位小伙伴好，小编在今年将会推出【统计案例】系列文章，目的是通过一系列的实际案例（经典统计案例+小编实际参与的数据分析项目）来洞悉这些案例背后所体现的“统计思维”，一方面可以培养自己基于实际案例的统计思维，另一方面对于后续希望从事统计相关工作的同学也会有所裨益（毕竟好的统计思维是通用的），
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他