走投无路只能来敲敲代码

数据分析入门

作者：Yupeng Jiang

伦敦大学学院数学系 (英国顶尖大学，2018 QS世界大学排名中位列世界第7名，英国第3名)
email:yupeng.jiang.13atcl.ac.uk
2016年6月5日
[课件来自] https://zhuanlan.zhihu.com/p/21332075

遇到的模块

NumPy：多维数组的有效操作。高效的数学函数。
Matplotlib：可视化：2D和（最近）3D图
SciPy：大型库实现各种数值算法，例如：
- 线性和非线性方程的解
- 优化
- 数值整合
Sympy：符号计算（解析的 Analytical）
Pandas：统计与数据分析（明天）

Numpy

Ndarray类型

　　NumPy提供了一种新的数据类型：ndarray（n维数组）。

与元组和列表不同，数组只能存储相同类型的对象
这使得数组上的操作比列表快得多; 此外，阵列占用的内存少于列表。
数组为列表索引机制提供强大的扩展。

　　

均匀间隔的数组

import numpy as np

# arange:range(start, stop, step)的所有三个参数
# 即起始值，结束值，步长都是可以用的 另外还有一个dtype参数，数据类型 
a=np.arange(5)
b=np.arange(10,100,20,dtype = float)
#linspace（start，stop，num）返回数字间隔均匀的样本，按区间[start，stop]计算：
c=np.linspace(0.,2.5,5)

多维数组矩阵

import numpy as np

a = np.array([[1, 2, 3] ,[4, 5, 6]])
print(a)
print(a.shape)#行，列数
print(a.ndim)#维度数
print(a.size)#元素个数

形状变化

import numpy as np

a = np .arange(0, 20, 1) #1维
b = a.reshape((4, 5))   #4行5列
c = a.reshape((20, 1))  #2维
d = a.reshape((-1, 4))  #-1：自动确定
e = a.shape =(4, 5) #改变a的形状

Size（N，），（N，1）和（1，N）不同之处

import numpy as np

a = np.array([1,2,3,4,5])
b = a.copy ()

c1 =  np.dot(np.transpose(a), b)#矩阵乘法dot
print(c1)
c = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(c)
tran = c.transpose()#转置矩阵transpose
print(tran)

ax  =  np.reshape(a, (5,1))
bx  =  np.reshape(b, (1,5))
c = np.dot(ax, bx)
print(c)

填充数组

import numpy as np

a = np.zeros(3)
b = np.zeros((2, 2), complex)#complex 复数
c = np.ones((2, 3))
d = np.random.rand(2, 4)#rand: 0和1之间均匀分布的随机数
e = np.random.randn(2, 4)#randn: 均值为0，标准差为1的标准（高斯）正态分布

副本和视图

采用标准的list切片建其副本
采用一个NumPy数组的切片可以在原始数组中创建一个视图。两个数组都指向相同的内存。因此，当修改视图时，原始数组也被修改：
为避免修改原始数组，可以制作一个切片的副本

import numpy as np

a = np.arange(5)
print(a)
b = a[2:];b[0] = 100
print(b)
print(a)
c = a[2:].copy();
c[0]=99
print(c)
print(a)

矩阵乘法

运算符 * 表示元素乘法，而不是矩阵乘法：
使用dot（）函数进行矩阵乘法：
dot（）方法也适用于矩阵向量(matrix-vector)乘法：

import numpy as np

A = np.array([[1, 2],[3, 4]])
print(A * A)
print(np.dot(A,A))

文件操作

savetxt()将表保存到文本文件。
其他可用的格式(参见API文档)
save()将表保存为Numpy“.npy”格式的二进制文件
oadtxt（）将以文本文件存储的表读入数组。
默认情况下，loadtxt()假定列是用空格分隔的。您可以通过修改可选的参数进行更改。以散列（＃）开头的行将被忽略。
示例文本文件data.txt： (Example text file data.txt:)

1990 -1.5 25.3

1991 -3.2 21.2

import numpy as np

a = np.linspace(0, 1, 12)
a.shape=(3,4)
np.savetxt('myfile.txt',a)
np.save('myfile',a)
table = np.loadtxt("data.txt")

Numpy包含更高效率的功能

Numpy包含许多常用的数学函数，例如：
- np.log
- np.maximum
- np.sin
- np.exp
- np.abs
在大多数情况下，Numpy函数比Math包中的类似函数更有效，特别是对于大规模数据。

Scipy

SciPy的结构

scipy.integrate - >积分和普通微分方程
scipy.linalg - >线性代数
scipy.ndimage - >图像处理
scipy.optimize - >优化和根查找(root finding)
scipy.special - >特殊功能
scipy.stats - >统计功能
...

要加载一个特定的模块，请这样使用, 例如 :

from scipy import linalg

线性代数

　　线性方程的解

　　linalg的其他有用的方法：eig()（特征值和特征向量），det()（行列式）。

import numpy as np
from scipy import linalg    

A = np.random.randn(5, 5)
b = np.random.randn(5)
x = linalg.solve(A, b)     # A x = b
#print(x)    
eigen = linalg.eig(A)     # eigens
#print(eigen)    
det = linalg.det(A)     # determinant    
print(det)

数值整合

　　integration.quad是一维积分的自适应数值积分的函数。

import numpy as np
from scipy import integrate

def fun(x):
    return np.log(x)

value, error = integrate.quad(fun,0,1)
print(value)
print(error)

用Scipy进行统计

　　scipy具有用于统计功能的子库,有一些有用的统计功能。例如，给出标准正态分布的累积密度函数。

　　　　　　　　　　　　　　

　　这个包，我们可以直接使用它，如下：

from scipy import stats

y = stats.norm.cdf(1.2) #标准正态分布的累积密度函数
print(y)

优化：数据拟合

import numpy as np
from scipy.optimize import curve_fit
import matplotlib.pyplot as plt

def func(x, a, b, c):    
    return a * np.exp(-b * x) + c

x = np.linspace(0, 4, 50)
y = func(x, 2.5, 1.3, 0.5)
ydata = y+0.2*np.random.normal(size=len(x))
popt, pcov = curve_fit(func, x, ydata)
plt.plot(x, ydata, 'b*')
plt.plot(x, func(x, popt[0],popt[1], popt[2]), 'r-')
plt.title('$f(x)=ae^{-bx}+c$ curve fitting')

　　　　　　　　　　

优化:根搜索

import numpy as np
from scipy import optimize

def fun(x):
    return np.exp(np.exp(x)) - x**2

# 通过初始化点0，找到兴趣0 (find zero of fun with initial point 0)
# 通过Newton-Raphson方法 (by Newton-Raphson)
value1 = optimize.newton(fun, 0)

# 通过二分法找到介于(-5,5)之间的 (find zero between (-5,5) by bisection)
value2 = optimize.bisect(fun, -5, 5)

Matplotlib

简单制图

import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 10, 201)
#y = x ** 0.5
#plt.plot(x, y) # default plot
plt.figure(figsize = (3, 3)) # new fig
plt.plot(x, x**0.3, 'r--') # red dashed
plt.plot(x, x-1, 'k-') # continue plot
plt.plot(x, np.zeros_like(x), 'k-')

多个制图图例标签和标题

import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 10, 201)
plt.figure(figsize = (4, 4))
for n in range(2, 5):
    y = x ** (1 / n)
    plt.plot(x, y, label='x^(1/'  + str(n) + ')')
plt.legend(loc = 'best')
plt.xlabel('X axis')
plt.ylabel('Y axis')
plt.xlim(-2, 10)
plt.title('Multi-plot e.g. ', fontsize = 18)

绘制子图

import numpy as np
import matplotlib.pyplot as plt

def pffcall(S, K):    
    return np.maximum(S - K, 0.0)
def pffput(S, K):
    return np.maximum(K - S, 0.0)  

S=np.linspace(50,151,100)
fig = plt.figure(figsize=(12, 6))  

sub1 = fig.add_subplot(121)
sub1.set_title('Call', fontsize = 18)
plt.plot(S, pffcall(S, 100), 'r-', lw = 4)#lw是宽度
plt.plot(S, np.zeros_like(S), 'black',lw = 1)
sub1.grid(True)#显示网格线
sub1.set_xlim([60, 120])
sub1.set_ylim([-10, 40])    

sub2 = fig.add_subplot(122)
sub2.set_title('Put', fontsize = 18)
plt.plot(S, pffput(S, 100), 'r-', lw = 4)
plt.plot(S, np.zeros_like(S), 'black',lw = 1)
sub2.grid(True)
sub2.set_xlim([60, 120])
sub2.set_ylim([-10, 40])

在绘制的图上添加文本和注释

import numpy as np
from scipy.stats import norm
import matplotlib.pyplot as plt

def call(S, K=100, T=0.5, vol=0.6, r=0.05):
    d1 = (np.log(S/K) + (r + 0.5 * vol**2) \
          *T) / np.sqrt(T) / vol
    d2 = (np.log(S/K) + (r - 0.5 * vol**2) \
          *T) / np.sqrt(T) / vol
    return S * norm.cdf(d1) - K * np.exp(-r * T) * norm.cdf(d2)

def delta(S, K=100, T=0.5, vol=0.6, r=0.05):
    d1 = (np.log(S/K) + (r + 0.5 * vol**2)*T) / np.sqrt(T) / vol
    return norm.cdf(d1)

S = np.linspace(40, 161, 100)
fig = plt.figure(figsize=(7, 6))
ax = fig.add_subplot(111)
#add_subplot(111)把画布分为1行1列，area为从左往右从上往下第1块区域
plt.plot(S,(call(S)-call(100)),'r',lw=1)
plt.plot(100, 0, 'ro', lw=1)
plt.plot(S,np.zeros_like(S), 'black', lw = 1)
plt.plot(S,call(S)-delta(100)*S-  \
         (call(100)-delta(100)*100), 'y', lw = 1)

ax.annotate('$\Delta$ hedge', xy=(100, 0), \
            xytext=(110, -10),arrowprops= \
            dict(headwidth =3,width = 0.5, \
            facecolor='black', shrink=0.05))#xy是点的位置 #xytext是文字位置，arrowprops 箭头
ax.annotate('Original call', xy= \
            (120,call(120)-call(100)),xytext\
            =(130,call(120)-call(100)),\
            arrowprops=dict(headwidth =10,\
            width = 3, facecolor='cyan', \
            shrink=0.05))
plt.grid(True)
plt.xlim(40, 160)
plt.xlabel('Stock price', fontsize = 18)
plt.ylabel('Profits', fontsize = 18)

3D制图

import numpy as np
import matplotlib.pyplot as plt
from matplotlib import cm
from mpl_toolkits.mplot3d import Axes3D

x, y = np.mgrid[-5:5:100j, -5:5:100j]
z = x**2 + y**2
fig = plt.figure(figsize=(8, 6))
ax = plt.axes(projection='3d')
surf = ax.plot_surface(x, y, z, rstride=1,\
                       cmap=cm.coolwarm, cstride=1, \
                       linewidth=0)
fig.colorbar(surf, shrink=0.5, aspect=5)
plt.title('3D plot of $z = x^2 + y^2$')

3D制图练习

import numpy as np
import matplotlib.pyplot as plt
from matplotlib import cm
from mpl_toolkits.mplot3d import Axes3D

x, y = np.mgrid[-10:10:100j, -10:10:100j]
z = x**2*0.05 + np.sin(x) + y**2*0.05 + np.sin(y)
fig = plt.figure(figsize=(8, 6))
ax = plt.axes(projection='3d')
surf = ax.plot_surface(x, y, z, rstride=1,\
                       cmap=cm.rainbow, cstride=1, \
                       linewidth=0)
fig.colorbar(surf, shrink=0.5, aspect=5)
plt.title('3D plot of $z = 0.05*x^2 + sin(x) + 0.05*y^2+sin(y)$')

♥形线

import numpy as np

import matplotlib.pyplot as plt

def y(S):
    
    return 13*np.cos(S)-5*np.cos(2*S)-2*np.cos(3*S)-np.cos(4*S) 
def x(S):
    return 16*np.sin(S)**3

S = np.linspace(0, 2*np.pi, 100)
fig = plt.figure(figsize=(4, 4))

plt.plot(x(S),y(S),'blue',lw=1)
plt.title("Heart")
plt.grid(True)

符号计算（Symbolic computat）

　　以上只是数值计算，接下来涉及符号计算，python通过模块sysmpy来进行符号计算，类似于方程求解，积分等的显式求解。

声明一个符号变量　

import sympy as sy

#声明x，y为变量
x = sy.Symbol('x')
y = sy.Symbol('y')
a, b = sy.symbols('a b')
#创建一个新符号（不是函数
f = x**2 + y**2 -2*x*y + 5
print(f)
#自动简化
g = x**2 + 2 - 2*x + x**2 -1
print(g)

符号的使用1：求解方程

import sympy as sy

x  = sy.Symbol ('x')
y  = sy.Symbol('y')
# 给定[-1,1]  (give [-1, 1])
print(sy.solve (x**2 - 1))
# 无解 (no guarantee for solution)
print(sy.solve(x**3  +  0.5*x**2 - 1))
# 用x的表达式表示y     (exepress x in terms of y)
print (sy.solve(x**3  +  y**2))
# 错误：找不到算法 (error:  no  algorithm  can  be  found)
print(sy.solve(x**x + 2*x - 1))

符号的使用2：集成

import sympy as sy

x = sy.Symbol('x')
y = sy.Symbol( 'y')
a,b = sy.symbols ( 'a b')
# 单变量 single  variable
f = sy.sin(x) + sy.exp(x)
print(sy.integrate(f, (x,  a,  b)))
print(sy.integrate(f, (x,  1,  2)))
print(sy.integrate(f, (x,  1.0,2.0)))
# 多变量 multi variables
g = sy.exp(x) + x * sy.sin(y)
print(sy.integrate(g, (y,a,b)))

符号的使用3：分化

import sympy as sy

x =  sy.Symbol( 'x')
y =  sy.Symbol( 'y')
# 单变量 (single variable)
f = sy.cos(x) + x**x
print(sy . diff (f ,  x))
#  多变量  (multi variables)
g = sy.cos(y) * x + sy.log(y)
print(sy.diff (g,  y))

代码整合

　　链接：https://pan.baidu.com/s/1X6eG5C03KmBJ8yN-WoRRSw
　　提取码：a6dy 　　
　　复制这段内容后打开百度网盘手机App，操作更方便哦

你可能感兴趣的:(数据分析入门)

数据分析入门初解 Mikhail_G 数据分析 python 大数据运维开发语言
大家好!在当今数字化时代，数据分析已成为一项备受瞩目的技能。它就像一把神奇的钥匙，能够打开隐藏在数据背后世界的大门，帮助我们更好地理解周围的一切并做出明智的决策。如果你是数据分析的初学者，这篇文章将为你开启一段简单易懂的探索之旅。一、什么是数据分析数据分析就是对收集到的数据进行整理、处理和分析，从中提取有价值的信息和知识。想象一下，你有一大堆杂乱无章的考试成绩，通过数据分析，你可以找出最高分、最低
如何进行Python数据分析？正确的“入门之路”三部曲！_python医学数据分析入门 2401_84301948 程序员网络安全学习面试
给大家的福利零基础入门对于从来没有接触过网络安全的同学，我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。同时每个成长路线对应的板块都有配套的视频提供：因篇幅有限，仅展示部分资料网络安全面试题绿盟护网行动还有大家最喜欢的黑客技术网络安全源码合集+工具包所有资料共282G，朋友们如果有需要全套《网络安全入门+黑客进阶学习资源包》，可以扫描下方二维码
数据分析入门指南：从历史到实践搞程序的心海数据分析数据分析人工智能大数据
在信息爆炸的时代，数据分析已经成为各行各业不可或缺的技能，无论是商业决策、医疗研究，还是社会科学，数据分析都在其中扮演着关键角色。本文将带你深入了解数据分析的历史、定义、流程、数据来源与处理、常用工具，并通过实际案例，让你对数据分析有更加全面的认识。目录一、数据分析的历史沿革二、什么是数据分析三、数据分析的流程1、明确问题2、收集数据3、数据处理4、数据分析5、结果解释6、报告撰写与展示四、数据来
数据分析基础：需要掌握的入门知识数字天下数据分析数据库人工智能
数据分析基础：你需要掌握的入门知识数据分析是一项令人着迷的技能，它不仅仅关乎处理数字，更是将复杂的数据转化为有意义的洞察，推动决策并创造价值。作为一名数据分析的从业者，我常常被问及如何入门这个领域，特别是对于那些刚开始接触数据分析的人来说，掌握哪些基础知识是关键。这篇文章将结合我的经验和个人见解，为你详细解析数据分析入门所需的核心知识。统计学基础：数据分析的灵魂在我刚开始数据分析职业生涯时，统计学
【数据分析入门】R语言读写文本文件及RDATA文件如果我是温帅帅数据分析 r语言
一、读入文件x<-read.table("input.txt")head(x)x<-read.table("input.csv")x<-read.table("input.csv",sep=",")x<-read.table("input.csv",sep=",",header=T)x<-read.table("input.test.txt",sep=",",header=T,skip=5)x<-
【Python使用】嘿马python数据分析教程第4篇：特征工程,特征衍生【附代码文档】 python后端
教程总体简介：Excel的使用全渠道业务概述1.Excel的使用(预计4小时)2.全渠道业务分析(预计4小时)第01章Pandas基础第02章DataFrame基本操作第03章数据分析入门第04章选取数据子集第05章布尔索引第06章分组聚合、过滤、转换第09章时间序列分析第10章用Matplotlib、Pandas、Seaborn进行可视化完整笔记资料代码：https://gitee.com/yi
python数据分析入门与实战王静_Keras快速上手：基于Python的深度学习实战 weixin_39724362
1准备深度学习的环境11.1硬件环境的搭建和配置选择.........................11.1.1通用图形处理单元..........................31.1.2你需要什么样的GPU加速卡....................61.1.3你的GPU需要多少内存.......................61.1.4是否应该用多个GPU..............
Python数据分析入门与Pandas master_chenchengg python python 办公效率 python开发 IT
Python数据分析入门与Pandas一、开启Python之旅：为什么选择Python进行数据分析缘起：从Excel到Python的转变为何Python是数据分析的首选语言Python的魅力：简洁与强大并存二、初识Pandas：解锁数据处理的超级能力Pandas是什么：从零开始了解Series与DataFrame：Pandas的核心数据结构如何创建第一个DataFrame：动手试试看三、数据清洗：
3.Python数据分析—数据分析入门知识图谱&索引(知识体系中篇) 以山河作礼。 Python数据分析项目数据分析知识图谱数据挖掘 python 开发语言
3.Python数据分析—数据分析入门知识图谱&索引-知识体系中篇一·个人简介二·数据获取和处理2.1数据来源：2.2数据清洗：2.2.1缺失值处理：2.2.2异常值处理：2.3数据转换：2.3.1数据类型转换：2.3.2数据编码：2.4数据合并与重塑：2.4.1数据合并：2.4.2数据拼接：2.4.3数据重塑：三·数据探索与分析3.1描述性统计分析3.2数据可视化原则和技巧3.3探索性数据分析（
第十三届脑电数据分析入门班（训练营：2023.11.15~11.28）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★脑电图具有高时间分辨率、成本低、无创以及便于操作等特点，在认知神经科学领域具有独特的应用优势。熟悉脑电的神经生理学基
第十三届脑电数据分析入门班（训练营：2023.11.15~11.28）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★脑电图具有高时间分辨率、成本低、无创以及便于操作等特点，在认知神经科学领域具有独特的应用优势。熟悉脑电的神经生理学基
QGIS数据分析入门——Qgis下载及界面介绍（一） shishi521 qgis 数据分析数据挖掘 qgis
QGIS是免费的地图数据展示和分析工具。课程任务本教程使用QGIS3.20建议您按照本教程中的详细制图步骤，通过QGIS使用示范数据一步一步实际动手操作，完成教程中的制图任务。将会学到的其他技巧如何查看和修改QGIS下载安装，设置中文。如何使用QGIS界面介绍。软件下载1.软件下载直接百度搜索“qgis下载”，从.org这样的结尾的官网上下载2.直接点击我分享的下载地址下载QGIShttps://
第十二届脑电数据分析入门班（训练营：2023.9.6~9.19）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★脑电图具有高时间分辨率、成本低、无创以及便于操作等特点，在认知神经科学领域具有独特的应用优势。熟悉脑电的神经生理学基
RNA-seq转录组数据分析医学小白学生信
B站：RNA-seq转录组数据分析入门实战1linux常用命令touchtext.txt#新建文件rm-rf/var/log/httpd/access#将会删除/var/log/httpd/access目录以及其下所有文件、文件夹rm-f*html#删除所有html格式文件rm-f*zip#删除所有zip格式文件tarzxvf#解压tar.gz文件tarjxvfsamtools-1.11.tar.
第十一届脑电数据分析入门班（训练营：2023.7.19~8.1）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★脑电图具有高时间分辨率、成本低、无创以及便于操作等特点，在认知神经科学领域具有独特的应用优势。熟悉脑电的神经生理学基
Python数据分析入门书籍推荐！ IT青年
在当下这个数据驱动的时代，毫不夸张的说各行各业的商业决策和运营管理都离不开数据分析，因此数据分析已经成为当前每个人的必备技能和加分项。对于许多初学者来讲，想要入门Python数据分析常常不知道从何下手。本文将为大家推荐一些适合零基础学习者阅读的Python数据分析入门书籍，感兴趣的话就接着看下去吧！为了帮助大家更轻松的学好Python开发，Python爬虫技术，Python数据分析等相关知识,给大
DAY7+ 学习笔记 by 康康 ReneeeeKKKK
《R与tidyverse——数据分析入门》学习笔记R与tidyverse——数据分析入门3.dataframe和tibbleR中的多变量数据的标准保存形式是dataframe；tibble是dataframe的进化版。一个正确的dataframe书中截图创建tibble3.1新建一个tibbletbble()【注意】tibble是按列写入的举例：my_tibble_1=4&Petal.Length
空间数据分析入门POI与莫兰指数基础知识笔记肖永威数据分析人工智能及Python 数据分析空间数据分析 POI 莫兰指数 python
1.空间分析与POI1.1.什么是POIPOI是“PolntofInformation”的缩写，中文可以翻译为“信息点”。POI是地图上任何非地理意义的有意义的点，如商店、酒吧、加油站、医院、车站等。这些点通常包括名称、类别、经纬度和地址等基本信息。此外，POI数据还可以进一步扩展，包括营业时间、联系电话、人均消费等信息，以满足不同应用场景的需求。POI数据的应用场景非常广泛，包括但不限于：城市规
数据分析入门指南：用 Python 开启数据之旅东离与糖宝合作推广数据分析 python 数据挖掘
文章目录前言发现宝藏为什么选择Python进行数据分析？准备工作数据分析基础1.数据加载2.数据探索3.数据清洗4.数据可视化探索更多可能性好书推荐总结前言为了巩固所学的知识，作者尝试着开始发布一些学习笔记类的博客，方便日后回顾。当然，如果能帮到一些萌新进行新技术的学习那也是极好的。作者菜菜一枚，文章中如果有记录错误，欢迎读者朋友们批评指正。（博客的参考源码可以在我主页的资源里找到，如果在学习的过
后天开课 | 第十一届脑电数据分析入门班（训练营：2023.7.19~8.1）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★脑电图具有高时间分辨率、成本低、无创以及便于操作等特点，在认知神经科学领域具有独特的应用优势。熟悉脑电的神经生理学基
第十二届脑电数据分析入门班（训练营：2023.9.6~9.19）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★脑电图具有高时间分辨率、成本低、无创以及便于操作等特点，在认知神经科学领域具有独特的应用优势。熟悉脑电的神经生理学基
第十三届脑电数据分析入门班（训练营：2023.11.15~11.28）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★脑电图具有高时间分辨率、成本低、无创以及便于操作等特点，在认知神经科学领域具有独特的应用优势。熟悉脑电的神经生理学基
浅谈数据分析思维戏说猫狗
笔名：戏说猫狗全文共2331字，阅读需要6分钟我之前有写过数据分析系列《数据分析从简入手，一招让你更专业》（点击可跳转入门篇），是以案例入手讲数据分析入门的。但这次我不讲如何进行数据分析，而是来浅谈一下数据分析的思维和现状。因为数据驱动产品一定少不了数据分析这个话题，我尽量以最简单通俗的语言来聊一聊。——BEGIN——数据分析是个什么东西？我们把这个名词分解来看：数据和分析。这里面最主要的不是数据
第十二届脑电数据分析入门班（训练营：2023.9.6~9.19）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★脑电图具有高时间分辨率、成本低、无创以及便于操作等特点，在认知神经科学领域具有独特的应用优势。熟悉脑电的神经生理学基
探索数据的奥秘：一份深入浅出的数据分析入门指南 uncle_ll 数据库数据分析数据挖掘入门
数据分析书籍推荐入门读物深入浅出数据分析啤酒与尿布数据之美数学之美数据分析ScipyandNumpyPythonforDataAnalysisBadDataHandbook集体智慧编程MachineLearninginAction机器学习实战BuildingMachineLearningSystemswithPython数据挖掘导论MachineLearningforHackers专业读物Intr
明天开课 | 第十一届脑电数据分析入门班（训练营：2023.7.19~8.1）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★脑电图具有高时间分辨率、成本低、无创以及便于操作等特点，在认知神经科学领域具有独特的应用优势。熟悉脑电的神经生理学基
Python数据分析入门到进阶：数据清洗（含详细代码） Python_魔力猿 python 数据分析开发语言
在上一篇文章中，介绍了如何使用python导入数据，导入数据后的第二步往往就是数据清洗，下面我们来看看如何使用pandas进行数据清洗工作导入相关库importpandasaspddataframe=pd.read_csv(r'C:/Users/DELL/data-science-learning/python数据分析笔记/探索性数据分析/train.csv')dataframe.head(5)P
数据分析入门准备小跳蛙leapfrog 数据分析数据挖掘人工智能
目标：数据挖掘，数据分析偏数据挖掘方向春招找到工作，11月找到实习入门参考资料：1.数据分析求职面试指南拿下Offer：数据分析师求职面试指南（掌阅）2.stone教你如何做数据分析项目Stone教你如何做数据分析项目（上）_哔哩哔哩_bilibili计划：三天看完并修改简历
第十二届脑电数据分析入门班（训练营：2023.9.6~9.19）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★脑电图具有高时间分辨率、成本低、无创以及便于操作等特点，在认知神经科学领域具有独特的应用优势。熟悉脑电的神经生理学基
从零开始了解大数据(七)：总结橘子-青衫从零开始了解大数据大数据大数据 hadoop hive big data hdfs 数据仓库
系列文章目录从零开始了解大数据(一)：数据分析入门篇-CSDN博客从零开始了解大数据(二)：Hadoop篇-CSDN博客从零开始了解大数据(三)：HDFS分布式文件系统篇-CSDN博客从零开始了解大数据(四)：MapReduce篇-CSDN博客从零开始了解大数据(五)：YARN篇-CSDN博客从零开始了解大数据(六)：数据仓库Hive篇-CSDN博客目录系列文章目录前言一、数据分析1.企业数据分析
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他