Fancy_Jin

极客时间《数据分析实战45讲 - 基础篇》学习笔记

图书资源

Numpy操作

Pandas操作

用户画像

数据采集

Python数据爬取

数据处理

可视化

其他

图书资源

思维：《思维简史：从丛林到宇宙》

商业相关：《洛克菲勒留给儿子的38封信》《商业冒险：华尔街的12个经典故事》《从0到1：开启商业与未来的秘密》《商业的本质》

数据处理：《数据挖掘：概念与技术》《Pentaho Kettle解决方案》《精益数据分析》《Small Data》《利用Python进行数据分析》《深入浅出数据分析》

问题：

1. C4.5、CART和其他决策树算法的区别？EM原理和实现？
矩阵和向量运作在数据挖掘中如何运用的？最优化方法的概念对迭代收敛的作用？
矩阵在PCA 方法、SVD 方法，以及 MF、NMF 方法中的应用？
隐式拷贝是什么？浅拷贝和深拷贝是什么意思？参考Python - 对象赋值、浅拷贝、深拷贝的区别 - 1024搜-程序员专属的搜索引擎但是没看懂
快速排序、合并排序、堆排序区别和实现？
pandasql.sqldf中什么时候用globals()什么时候用locals()?

数据挖掘的过程可以分成以下 6 个步骤。

商业理解：数据挖掘不是我们的目的，我们的目的是更好地帮助业务，所以第一步我们要从商业的角度理解项目需求，在这个基础上，再对数据挖掘的目标进行定义。
数据理解：尝试收集部分数据，然后对数据进行探索，包括数据描述、数据质量验证等。这有助于你对收集的数据有个初步的认知。
数据准备：开始收集数据，并对数据进行清洗、数据集成等操作，完成数据挖掘前的准备工作。
模型建立：选择和应用各种数据挖掘模型，并进行优化，以便得到更好的分类结果。
模型评估：对模型进行评价，并检查构建模型的每个步骤，确认模型是否实现了预定的商业目标。
上线发布：模型的作用是从数据中找到金矿，也就是我们所说的“知识”，获得的知识需要转化成用户可以使用的方式，呈现的形式可以是一份报告，也可以是实现一个比较复杂的、可重复的数据挖掘过程。数据挖掘结果如果是日常运营的一部分，那么后续的监控和维护就会变得重要。

Python数据类型基本操作：

列表	增：list.append(), list.insert(index, value) 删：list.pop()
元组	不能改
字典	增：dict['key'] = value 删：dict.pop('key') 查：‘key’ in dict, dict.get('key')
集合	增：set.add(value) 删：set.remove(value)

注释在 python 中使用 #，如果注释中有中文，一般会在代码前添加 # -- coding: utf-8 -。

import 引用可以是模块 module，或者包 package。针对 module，实际上是引用一个.py 文件。而针对 package，可以采用 from package_name import moudule_name的方式，这里实际上是从一个目录中引用模块，这时目录结构中必须带有一个 __init__.py 文件。

由于列表中的元素可以是任意的对象，所以列表中 list 保存的是对象的指针。虽然在 Python 编程中隐去了指针的概念，但是数组有指针，Python 的列表 list 其实就是数组。这样如果我要保存一个简单的数组[0,1,2]，就需要有 3 个指针和 3 个整数的对象，这样对于 Python 来说是非常不经济的，浪费了内存和计算时间。

为什么要用 NumPy 数组结构而不是 Python 本身的列表 list？这是因为列表 list 的元素在系统内存中是分散存储的，而 NumPy 数组存储在一个均匀连续的内存块中。这样数组计算遍历所有的元素，不像列表 list 还需要对内存地址进行查找，从而节省了计算资源。另外在内存访问模式中，缓存会直接把字节块从 RAM 加载到 CPU 寄存器中。因为数据连续的存储在内存中，NumPy 直接利用现代 CPU 的矢量化指令计算，加载寄存器中的多个连续浮点数。另外 NumPy 中的矩阵计算可以采用多线程的方式，充分利用多核 CPU 计算资源，大大提升了计算效率。

除了使用 NumPy 外，还需要一些技巧来提升内存和提高计算资源的利用率。一个重要的规则就是：避免采用隐式拷贝，而是采用就地操作的方式。举个例子，如果我想让一个数值 x 是原来的两倍，可以直接写成 x*=2，而不要写成 y=x*2。

Numpy操作

问题：numpy.c_和numpy.r_的用法？

NumPy 中数据结构围绕 ndarray 展开

如果数据中使用了中文，可以把类型设置为 U32

# 定义数组结构类型
persontype = np.dtype({
    'names':['name', 'age', 'chinese', 'math', 'english'],
    'formats':['S32','i', 'i', 'i', 'f']})
peoples = np.array([("ZhangFei",32,75,100, 90),("GuanYu",24,85,96,88.5),
       ("ZhaoYun",28,85,92,96.5),("HuangZhong",29,65,85,100)],
    dtype=persontype)
persontype2 = np.dtype({
    'names':['name', 'age', 'english'],
    'formats':['U32','i', 'f']})
peoples2 = np.array([("张飞",32,90),("关羽",24,88.5), ("赵云",28,96.5),("黄忠",29,100)], dtype=persontype2)

ages = peoples[:]['age']
chineses = peoples[:]['chinese']

# 创建连续数组：以下两种方式结果一样
x1 = np.arange(1,11,2)
x2 = np.linspace(1,9,5)

# Range of values (maximum - minimum) along an axis.
np.ptp(a, axis=None, out=None, keepdims=)

# 求均值
np.mean() # 求平均数
np.average() # 可以用过设置weights参数求加权平均值

# 求众数
## 法一：只能用在非负数据集
counts = np.bincount(nums)
np.argmax(counts)
## 法二：
from scipy import stats
stats.mode(nums)[0][0]
## 法三：
age_maxf = train_features['Age'].value_counts().index[0]

# 排序
np.sort(array, axis=-1, kind=‘quicksort’, order=None) 
# kind里指定quicksort快速排序、mergesort合并排序、heapsort堆排序。
# axis默认是-1，即沿着数组的最后一个轴进行排序，也可以取不同的axis轴，axis=None代表采用扁平化的方式作为一个向量进行排序。
# order字段，对于结构化的数组可以指定按照某个字段进行排序。

Pandas操作

Pandas 中数据结构围绕一维序列 Series 和二维表 DataFrame 展开

# Pandas中的统计函数
temp = pd.Series([i for i in range(1, 20, 2)])
temp.index = [f'row {i}' for i in range(1, 20, 2)]
temp.min() # 1
temp.argmin() # 0
temp.idxmin() # 'row 1'

 # 用SQL方式打开Pandas
from pandasql import sqldf
df1 = pd.DataFrame({'name':['ZhangFei', 'GuanYu', 'a', 'b', 'c'], 'data1':range(5)})
pysqldf = lambda sql: sqldf(sql, globals())
sql = "select * from df1 where name = 'ZhangFei'"

用户画像

标签维度：

用户标签：它包括了性别、年龄、地域、收入、学历、职业、通过何种渠道进行的注册等。这些包括了用户的基础属性。
消费标签：消费习惯、购买意向、是否对促销敏感。这些统计分析用户的消费习惯。
行为标签：时间段、频次、时长、访问路径。这些是通过分析用户行为，来得到他们使用 App 的习惯。
内容分析：对用户平时浏览的内容，尤其是停留时间长、浏览次数多的内容进行分析，分析出用户对哪些内容感兴趣，比如，金融、娱乐、教育、体育、时尚、科技等。

标签类型：

数据层指的是用户消费行为里的标签。我们可以打上“事实标签”，作为数据客观的记录。
算法层指的是透过这些行为算出的用户建模。我们可以打上“模型标签”，作为用户画像的分类标识。
业务层指的是获客、粘客、留客的手段。我们可以打上“预测标签”，作为业务关联的结果。

标签应用：

获客：如何进行拉新，通过更精准的营销获取客户。
活客：个性化推荐，搜索排序，场景运营等。
留客：流失率预测，分析关键节点降低流失率。

数据采集

开放数据源：单位维度，比如政府、企业、高校；行业维度，比如交通、金融、能源等领域。

爬虫抓取：常用工具有火车采集器、八爪鱼、搜集客

日志采集：统计用户的操作。我们可以在前端进行埋点，在后端进行脚本收集、统计，来分析网站的访问情况，以及使用瓶颈等。

Python数据爬取

爬虫的过程包括三个阶段：打开网页、提取数据和保存数据。在“打开网页”这一步骤中，可以使用 Requests 访问页面，得到服务器返回给我们的数据，这里包括 HTML 页面以及 JSON 数据。在“提取数据”这一步骤中，针对 HTML 页面，可以使用 XPath 进行元素定位，提取数据；针对 JSON 数据，可以使用 JSON 进行解析。在最后一步“保存数据”中，我们可以使用 Pandas 保存数据，最后导出 CSV 文件。

Requests访问页面：

Requests 是 Python HTTP 的客户端库，它有两种访问方式：Get 和 Post。Get 把参数包含在 url 中，而 Post 通过 request body 来传递参数。

访问豆瓣，用 Get 从服务器上获取数据：

'''
proxies = { "http": None, "https": None}
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) \
    AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36'
}
'''
r = requests.get('http://www.douban.com') # , proxies=proxies, headers = headers

使用 Post 进行表单传递，向服务器传递数据：（自己尝试尚未得到满意结果）

r = requests.post('http://xxx.com', data = {'key':'value'})

代理问题：requests 代理设置问题解决方案_简单随风的博客-CSDN博客

状态码有误：利用 r = requests.get('https://www.douban.com') 爬取豆瓣数据返回 r.status_code = 418，参考网络爬虫之Requests爬取豆瓣电影中“三.Requests请求服务器”。

比较：r.text is the content of the response in Unicode, and r.content is the content of the response in bytes. Presumably r.text would be preferred for textual responses, such as an HTML or XML document, and r.content would be preferred for "binary" filetypes, such as an image or PDF file.

XPath定位

使用 XPath 定位，可以用解析库 lxml。XPath 是 XML 的路径语言，通过元素和属性导航定位位置。常用路径表达方式如下：

例：

xpath(‘node’) 选取了 node 节点的所有子节点；
xpath(’/div’) 从根节点上选取 div 节点；
xpath(’//div’) 选取所有的 div 节点；
xpath(’./div’) 选取当前节点下的 div 节点；
xpath(’…’) 回到上一个节点；
xpath(’//@id’) 选取所有的 id 属性；
xpath(’//book[@id]’) 选取所有拥有属性 id 的 book 元素；
xpath(’//book[@id=“abc”]’) 选取所有 book 元素，且这些 book 元素拥有 id= "abc"的属性；
xpath(’//book/title | //book/price’) 选取 book 元素的所有 title 和 price 元素。

想要定位 HTML 中的所有列表项目，可以采用下面这段代码：

from lxml import etree
html = etree.HTML(html)
result = html.xpath('//li')

JSON对象

数据爬取（JSON下载和XPath下载两种）

问题：

Python + Selenium + 第三方浏览器可以让我们处理多种复杂场景，包括网页动态加载、JS 响应、Post 表单等。因为 Selenium 模拟的就是一个真实的用户的操作行为，就不用担心 cookie 追踪和隐藏字段的干扰了。

这部分内容中各个技术细节的具体含义？

动态网页与静态网页：静态页面与动态页面的区别_易优CMS

自己尝试的例子：

谷歌浏览器右键点击检查，选中Network板块；
豆瓣打开网页；
输入关键词“王祖贤”，搜索结果中“相关豆瓣内容”中选择“显示更多”，依次出现游园惊梦、阿婴、倩女幽魂等；
找到Type为xhr的数据，复制链接为 https://www.douban.com/j/search?q=%E7%8E%8B%E7%A5%96%E8%B4%A4&start=2&subtype=item
打开该链接可以看到格式大致为
```
{'items':
    [...影片信息，如title='倩女幽魂'..., 
    ...影片信息...],
'total': 100,
'limit': 20,
'more': True}
```
能看到王祖贤的相关豆瓣内容一共100条，其中一次只返回了 20 条，还有更多的数据可以请求。数据被放到了一个数组结构的 items 对象里，每个数组元素包含一些影片的相关信息。
观察网址本身 https://www.douban.com/j/search?q=王祖贤&start=2&subtype=item，发现有三个参数q、start和subtype。start是请求的起始 ID，此处对图片的顺序标识是从 0 开始计算的。start=2 是因为初始时便显示2条。如果想从第 21 个图片下载，可以设置 start = 20。

对 https://www.douban.com/j/search?q=王祖贤&start=2&subtype=item 中需要的内容利用XPath进行解析，再用根据该链接变动规律，利用 for 循环完成对列表中所有数据的爬取。代码如下

import requests
import json
import pandas as pd
from lxml import etree

query = '王祖贤'
proxies = { "http": None, "https": None} # 在挂有代理服务器的时候需要设置
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) \
      AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.67 Safari/537.36'
} # 根据实际情况会有不同，具体获取方法见“状态码有误”部分
df = pd.DataFrame()

'''解析信息'''
def parse_html(text):
    html = etree.HTML(text)
    return html.xpath('//a[@class="nbg"]/@title | //span[@class="rating_nums"]/text() | \
                      //a[@class="nbg"]/@onclick | //a[@class="nbg"]/@href')
            
''' for 循环 请求全部的 url '''
for i in range(0, 100, 20):
  url = 'https://www.douban.com/j/search?q='+query+'&start='+str(i)+'&subtype=item'
  r = requests.get(url, proxies=proxies, headers=headers)
  response = json.loads(r.text)['items']
  # print(list(map(parse_html, response)))
  df = pd.concat([df, pd.DataFrame(map(parse_html, response))])

df = df.reset_index(drop=True)
df.columns = ['href_link', 'onclick_info', 'title', 'rating']
df.to_excel('E:/your_path/极客时间/crawler_test.xlsx', index=False)

如果是需要用户登陆后才能爬取的数据，可以使用python+selenium的方式完成账户的自动登录，因为selenium是个自动化测试框架，使用selenium的webdriver可以模拟浏览器的行为。找到输入用户名密码的地方，输入相应的值，然后模拟点击即可完成登录（没有验证码的情况下）。另外也可以使用cookie来登录网站：登录网站时，先保存网站的cookie，下次访问时，加载之前保存的cookie，放到request headers中，则不需要再登录网站。

数据处理

问题：

为什么MinMaxScaler().fit_transform()对于一个多维数组会以列为维度进行规范化，而不是整个数组或者以行为维度？如果想实现后面两种应该怎么做？z-score规范化的scale()同理。
非线性z分原理？没太看懂

# 删除非 ASCII 字符
df['first_name'].replace({r'[^\x00-\x7F]+':''}, regex=True, inplace=True)
# 切分名字
df[['first_name','last_name']] = df['name'].str.split(expand=True)

\xnn 匹配ASCII代码中十六进制代码为nn的字符，[x00-x7f] 匹配ASCII值从0-127的字符
0-127表示单字节字符，即数字、英文字符、半角符号及某些控制字符。无法匹配中文。

规范化方法：

min-max规范化：将原始数据变换到[0,1]的空间中。公式为：新数值 =（原数值 - 极小值）/（极大值 - 极小值）。

Z-Score规范化：假设A与B的考试成绩都为80分，A的考卷满分是 100 分（及格60分），B的考卷满分是500分（及格300分）且 A 和 B 的考试成绩都是成正态分布。那么如何用相同的标准来比较A与B的成绩呢？Z-Score可以解决这一问题。定义：新数值 =（原数值 - 均值）/ 标准差。假设A所在班级平均分为80，标准差为 10；B所在班级平均分为400，标准差为100。那么A的新数值=(80-80)/10=0，B的新数值=(80-400)/100=-3.2。则在Z-Score标准下，A的成绩比B好。Z-Score的优点是算法简单，不受数据量级影响，结果易于比较。不足在于，它需要数据整体的平均值和方差，且结果没有实际意义，仅用于比较。

“Z-Score”的非线性计算方式：

先按公式计算出百分等级。百分等级（年级）=100-(100x 年级名次 -50)/ 有效参加考试人数。这里百分等级是每个学生在该批学生中的相对位置，其中百分等级是按照正态分布图的所占面积比例求得的；
按照百分等级数去标准正态分布表中查询得出 Z-Score 值，这样最终得出的 Z 分便是标准的正态分布，能够将偏态转化成标准正态。

因为在很多情况下，数值如果不是正态分布，而是偏态分布，直接使用 Z-Score 的线性计算方式无法将分数转化成正态分布。采用以上的方法可以解决这一个问题，大家可以了解下。

小数定标规范化：通过移动小数点位置进行规范化。小数点移动位数取决于属性取值中的最大绝对值。比如属性A的取值范围是-999到88，最大绝对值为 999，小数点就会移动 3 位，即新数值 = 原数值/1000。故A的取值范围被规范化为-0.999到0.088。

from sklearn import preprocessing 
import numpy as np

x = np.array([[ 0., -3., 1.], 
              [ 3., 1., 2.], 
              [ 0., 1., -1.]])

# min-max规范化
min_max_scaler = preprocessing.MinMaxScaler()
minmax_x = min_max_scaler.fit_transform(x)
# 结果：
# [[0.         0.         0.66666667]
#  [1.         1.         1.        ]
#  [0.         1.         0.        ]]

# z-score规范化
scaled_x = preprocessing.scale(x)
# 结果：
# [[-0.70710678 -1.41421356  0.26726124]
#  [ 1.41421356  0.70710678  1.06904497]
#  [-0.70710678  0.70710678 -1.33630621]]

# 小数定标规范化
j = np.ceil(np.log10(np.max(abs(x)))) # np.ceil()向上取整
scaled_x = x/(10**j)
# 结果： 
# [[ 0.  -0.3  0.1]
#  [ 0.3  0.1  0.2]
#  [ 0.   0.1 -0.1]]

需要规范化的算法：

在数据挖掘算法中，一般情况下是需要进行数据规范化的，尤其是针对距离相关的运算，比如 K-Means、KNN 以及聚类算法中，有对距离的定义，所以在用这些算法前，需要进行数据规范化。

另外一些算法用到了梯度下降作为优化器，这是为了提高迭代收敛的效率，也就是提升找到目标函数最优解的效率。我们也需要进行数据规范化，比如逻辑回归、SVM 和神经网络算法。在这些算法中都有目标函数，需要对目标函数进行求解。梯度下降的目标是寻找到目标函数的最优解，而梯度的方法则指明了最优解的方向。

但不是所有的算法都需要进行数据规范化。如构造决策树时，我们不关心特征值的大小维度，也没有使用到梯度下降来做优化，所以数据规范化对决策树构造结果和构造效率影响不大。除此之外，还是建议在做数据挖掘算法前进行数据规范化。

规范化方法选择：数据比较零散时可以使用Min-Max规范化；如果数据符合高斯分布，可以使用Z-Score规范化。有些分类方法对归一化比较敏感，比如GaussianNB，效果就不一定好。

可视化

问题：

商业智能分析（Tableau & PowerBI）和可视化大屏（DataV）和前端可视化组件的区别？
典型的 Web 渲染技术：Canvas、SVG 和 WebGL。简单来说，Canvas 和 SVG 是 HTML5 中主要的 2D 图形技术，WebGL 是 3D 框架。Canvas 适用于位图，也就是给了你一张白板，需要你自己来画点。Canvas 技术可以绘制比较复杂的动画。不过它是 HTML5 自带的，所以低版本浏览器不支持 Canvas。ECharts 这个可视化组件就是基于 Canvas 实现的。SVG 的中文是可缩放矢量图形，它是使用 XML 格式来定义图形的。相当于用点和线来描绘了图形，相比于位图来说文件比较小，而且任意缩放都不会失真。SVG 经常用于图标和图表上。它最大的特点就是支持大部分浏览器，动态交互性实现起来也很方便，比如在 SVG 中插入动画元素等。WebGL 是一种 3D 绘图协议，能在网页浏览器中呈现 3D 画面技术，并且可以和用户进行交互。你在网页上看到的很多酷炫的 3D 效果，基本上都是用 WebGL 来渲染的。下面介绍的 Three.js 就是基于 WebGL 框架的。在了解这些 Web 渲染协议之后，我再来带你看下这些常用的可视化组件： Echarts、D3、Three.js 和 AntV。ECharts 是基于 H5 canvas 的 Javascript 图表库，是百度的开源项目，一直都有更新，使用的人也比较多。它作为一个组件，可以和 DataV、Python 进行组合使用。你可以在 DataV 企业版中接入 ECharts 图表组件。也可以使用 Python 的 Web 框架（比如 Django、Flask）+ECharts 的解决方案。这样可以让你的项目更加灵活地使用到 ECharts 的图表库，不论你是用 Python 语言，还是用 DataV 的工具，都可以享受到 ECharts 丰富的图表库样式。D3 的全称是 Data-Driven Documents，简单来说，是一个 JavaScript 的函数库，因为文件的后缀名通常为“.js”，所以 D3 也常使用 D3.js 来称呼。它提供了各种简单易用的函数，大大简化了 JavaScript 操作数据的难度。你只需要输入几个简单的数据，就能够转换为各种绚丽的图形。由于它本质上是 JavaScript，所以用 JavaScript 也是可以实现所有功能的。Three.js，顾名思义，就是 Three+JS 的意思。“Three”表示 3D 的意思，“Three.js”就是使用 JavaScript 来实现 3D 效果。Three.js 是一款 WebGL 框架，封装了大量 WebGL 接口，因为直接用 WebGL API 写 3D 程序太麻烦了。AntV 是蚂蚁金服出品的一套数据可视化组件，包括了 G2、G6、F2 和 L7 一共 4 个组件。其中 G2 应该是最知名的，它的意思是 The grammar Of Graphics，也就是一套图形语法。它集成了大量的统计工具，而且可以让用户通过简单的语法搭建出多种图表。G6 是一套流程图和关系分析的图表库。F2 适用于移动端的可视化方案。L7 提供了地理空间的数据可视化框架。这一部分中提到的具体技术内容？
核函数和核密度估计？核密度图？
蜘蛛图中为什么# plt.xticks(angles[:-1], labels, color='grey', size=8, FontProperties=font)
# ax.set_thetagrids(angles[:-1] * 180/np.pi, labels, FontProperties=font)这两种都是可以实现？通过plt和ax作图的区别在哪里？

散点图：

Matplotlib 默认情况下呈现的是长方形。而 Seaborn 呈现的是正方形，而且不仅显示出了散点图，还给了这两个变量的分布情况。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

N = 1000
x = np.random.randn(N)
y = np.random.randn(N)
df = pd.DataFrame({'x':x, 'y':y})

plt.scatter(x, y, marker='x')
sns.jointplot(x='x', y='y', data=df, kind='scatter')

折线图：

在Matplotlib中，可以直接使用 plt.plot() 函数，但需要将x轴的按大小进行排序，否则画出来的折线图将无法按照 x 轴递增的顺序展示。

利用以下代码进行Matplotlib和Seaborn画图，结果一样，只是在Seaborn中标记了x和y轴含义。

x = [2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019]
y = [5, 3, 6, 20, 17, 16, 19, 30, 32, 35]
df = pd.DataFrame({'x_data':x, 'y_data':y})

plt.plot(x, y)
sns.lineplot(x='x_data', y='y_data', data=df)

直方图：

可以看到变量的数值分布。

a = np.random.randn(100)

plt.hist(a, bins=10)
sns.distplot(a, bins=10, kde=False)
sns.histplot(a, bins=10, kde=True)
sns.displot(a, bins=10, kde=True)

条形图：

帮助查看类别的特征。

x = ['Cat1', 'Cat2', 'Cat3', 'Cat4', 'Cat5']
y = [5, 4, 8, 12, 7]
df = pd.DataFrame({'x':x, 'y':y})

plt.bar(x, y)
sns.barplot(x='x', y='y', data=df)

箱线图：

分析数据的差异性、离散程度和异常值等。

data = np.random.normal(size=(10, 4))
labels = ['A','B','C','D']
df = pd.DataFrame(data, columns=labels)

plt.boxplot(data, labels=labels)
sns.boxplot(data=df)

饼图：

nums = [25, 37, 33, 37, 6]
labels = ['High-school','Bachelor','Master','Ph.d', 'Others']
plt.pie(nums, labels=labels)

热力图：

flights = sns.load_dataset("flights")
data=flights.pivot('year','month','passengers')
sns.heatmap(data)

蜘蛛图：

原理类似于在极坐标系中绘制折线图，并根据需要在其中填充颜色

# 原代码和该代码有区别
from matplotlib.font_manager import FontProperties

labels = np.array([u"推进","KDA",u"生存",u"团战",u"发育",u"输出"])
stats = [83, 61, 95, 67, 76, 88]
angles = np.linspace(0, 2*np.pi, len(labels), endpoint=False) 
# endpoint=True时为[0., 1.25663706, 2.51327412, 3.76991118, 5.02654825, 6.28318531]
stats =  np.concatenate((stats, [stats[0]]))
angles = np.concatenate((angles, [angles[0]])) # 让曲线闭合故加一位

ax = plt.subplot(111, polar=True)    
ax.plot(angles, stats, 'o-', linewidth=2)
ax.fill(angles, stats, alpha=0.25)
font= FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf", size=14)
ax.set_thetagrids(angles[:-1] * 180/np.pi, labels, FontProperties=font)

二元变量分布：散点图、核密度图、Hexbin图

Hexbin图代表直方图的二维模拟

sns.jointplot(x='total_bill', y='tip', data=tips, kind='scatter')
sns.jointplot(x='total_bill', y='tip', data=tips, kind='kde')
sns.jointplot(x='total_bill', y='tip', data=tips, kind='hex')

成对关系：

sns.pairplot() 会同时展示 DataFrame 中每对变量的关系；在对角线上，能看到每个变量自身作为单变量的分布情况。

iris = sns.load_dataset('iris')
sns.pairplot(iris)

其他

问题：

规范化后的数值都会在同一个数量的级别上，这样方便后续进行运算。另外还有一些算法用到了梯度下降作为优化器，这是为了提高迭代收敛的效率，也就是提升找到目标函数最优解的效率。规范化如何在这两点上起作用？
用 Chrome 浏览器的开发者工具，可以监测出来网页中是否有 json 数据的传输。怎么看？
有个答疑二和答疑三涉及加餐还没看

你可能感兴趣的:(Python,数据分析,学习)

「Python系列」Python uWSGI ·零落· Python入门到掌握 python 开发语言 uWSGI
文章目录一、PythonuWSGI简介二、PythonuWSGI安装配置三、PythonuWSGI应用案例前提条件步骤1：创建Django项目步骤2：配置Django项目步骤3：创建uWSGI配置文件步骤4：启动uWSGI步骤5：配置Web服务器四、PythonuWSGI常见问题常见问题1：uWSGI无法找到应用模块常见问题2：uWSGI和Nginx通信问题常见问题3：uWSGI进程管理常见问题4
Python系列（亲测有效）：uwsgi: command not found（python环境明明安装了）、uwsgi出现invalid request block size: 21573 (max 坦笑&&life #python python 网络开发语言
uwsgi:commandnotfound（python环境明明安装了）、uwsgi出现invalidrequestblocksize:21573(max一.uwsgi:commandnotfound问题描述：uwsgi:commandnotfound解决办法：找到uwsgi执行位置，建立软链接软连接做了，测试uwsgi是否正常运行创建test.py文件如下：运行方式运行方式一：运行方式二：访问均
《如何建立知识图谱？这些资源和工具助你一臂之力》
知识图谱：解锁高效学习与成长的密码[]()在信息爆炸的时代，我们每天都会接触到海量的知识。从书本、网络文章到各类课程，知识的获取变得前所未有的容易。但你是否有过这样的困扰：学了很多知识，却感觉它们杂乱无章，在需要的时候无法快速调用？这时候，构建个人知识图谱就显得尤为重要。它就像一个私人知识管家，帮你将零散的知识整理得井井有条，让知识真正为你所用，助力你在学习和成长的道路上一路开挂。接下来，就让我们
基于opencv消除图片马赛克小苗爸爸 opencv 人工智能计算机视觉
以下是一个基于Python的图片马赛克消除函数实现，结合了图像处理和深度学习方法。由于马赛克消除涉及复杂的图像重建任务，建议根据实际需求选择合适的方法：importcv2importnumpyasnpfromPILimportImagedefremove_mosaic(image_path,output_path,method='traditional',block_size=10,scale_f
创建ASCII数字打印机(OpenCV C++) 河边一只猫 opencv c++cv
学习OpenCV3（中文版）LearningOpenCV3ComputerVisioninC++withtheOpenCVLibrary第四章练习1建立一个500×500大小的单通道图像，每个像素值都为0。a.创建一个ASCII数字打印机，你可以在自己电脑上输入数字，并在一个20像素高、10像素宽的方块中显示数字。当你键入时，数字将从左到右显示，直到到达图像的末尾才停止。b.允许键入回车和退格。c
Elasticsearch 学习 Anthonywish java 后端 elasticsearch springdata 全文检索
内容摘要安装Elasticsearch使用Rest的API操作索引使用Rest的API查询数据使用Rest的API聚合数据SpringDataElasticsearch使用1.Elasticsearch介绍和安装用户访问我们的首页，一般都会直接搜索来寻找自己想要购买的商品。而商品的数量非常多，而且分类繁杂。如果能正确的显示出用户想要的商品，并进行合理的过滤，尽快促成交易，是搜索系统要研究的核心。面
部署Django+nginx+uwsgi到ubuntu服务器 Mr番茄蛋问题解决 python Linux
前提：Django程序可以正常运行，注意服务器python版本和本地版本可能不一致，有可能不能正常运行Django程序。安装过程更新ubuntu的python比如更新到3.6，先拉取新的仓库，再更新安装sudoadd-apt-repositoryppa:jonathonf/python-3.6sudoaptupdatesudoaptinstallpython3.6创建虚拟环境安装虚拟环境命令sud
YashanDB初始数据库数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E5%AE%89%E8%A3%85%...YashanDB产品安装创建的初始数据库信息如下：监听端口：如未在安装过程中进行调整，则默认为1688。用户：安装过程创建了sales样例用户，密码为sales，用于YashanDB的学习和验证；除此之外系统中无任何普通用户。
Python将json格式数据存储到Mysql数据库代码轨迹 Python python 数据库 json
Python操作Mysql数据库1.安装pipinstallmysql-connector-python2.数据库插入json格式数据importmysql.connectorimportjsonfromdatetimeimportdatetime#创建数据库连接db=mysql.connector.connect( host="localhost", #MySQL服务器地址 user="ro
【AI深度学习基础】Pandas完全指南入门篇：数据处理的瑞士军刀（含完整代码） arbboter 人工智能人工智能深度学习 pandas 数据处理数据分析数据清洗数据分析效率提升
Pandas系列文章导航入门篇进阶篇终极篇一、引言在大数据与AI驱动的时代，数据预处理和分析是深度学习与机器学习的基石。Pandas作为Python生态中最强大的数据处理库，以其灵活的数据结构（如DataFrame和Series）和丰富的功能（数据清洗、转换、聚合等），成为数据科学家和工程师的核心工具。Pandas以Series（一维标签数组）和DataFrame（二维表格）为核心数据结构，提供高
bash: uwsgi: 未找到命令大胖丫 bash 开发语言
针对你提出的“bash:uwsgi:commandnotfound”问题，以下是一些可能的解决方案，请按照步骤逐一排查：‌1、检查uwsgi命令是否正确‌：确保你输入的命令是uwsgi，而不是uWSGI或其他变体。‌2、确认uwsgi是否已安装‌：使用pipshowuwsgi命令来检查uwsgi是否已安装在你的Python环境中。如果未安装，可以使用pipinstalluwsgi或pip3inst
Github 2024-09-30 开源项目周报 Top15 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，本周(2024-09-30统计)共有15个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目7JupyterNotebook项目2Dart项目1Ruby项目1HTML项目1C#项目1TypeScript项目1Rust项目1非开发语言项目1AutoGPT:人工智能革命的先锋创建周期：486天开发语言：Python协议类型：MI
python json转化为字典_Python处理json字符串转化为字典 weixin_39636691 python json转化为字典
原博文2015-11-0923:02−有一个需求，需要用python把json字符串转化为字典inp_str="{'k1':123,'k2':'345',’k3’,’ares’}"importjsoninp_str="{'k1':123,'k2':'345',’k3’,...相关推荐2017-11-1711:57−在工作中遇到一个小问题，需要将一个python的字符串转为字典，比如字符串：user
python保存字典到xml文件_如何将Python字典序列化为XML？ weixin_39725193
使用dicttoxml包将Python字典转换为xml表示形式。首先，安装dicttoxml软件包pip3installdicttoxml创建一个字典对象>>>D1={"name":"Ravi","age":21,"marks":55}现在dicttoxml()从dicttoxml包中导入函数，并使用D1作为参数。该函数返回已编码的字符串作为字典的xml表示形式>>>fromdicttoxmlim
python保存字典到xml文件_Python将字典转换为XML的方法 weixin_39872123
问题你想使用一个Python字典存储数据，并将它转换成XML格式。解决方案尽管xml.etree.ElementTree库通常用来做解析工作，其实它也可以创建XML文档。例如，考虑如下这个函数：fromxml.etree.ElementTreeimportElementdefdict_to_xml(tag,d):'''Turnasimpledictofkey/valuepairsintoXML''
FastAPI 路径参数完全指南：从基础到高级校验实战 [特殊字符] qcidyu 文章归档 API安全 RESTful 正则表达式参数校验类型转换类型转换路径参数 FastAPI
title:FastAPI路径参数完全指南：从基础到高级校验实战date:2025/3/5updated:2025/3/5author:cmdragonexcerpt:探讨FastAPI路径参数的核心机制，涵盖从基础类型转换到高级校验的全方位知识。通过详细的代码示例、课后测验和常见错误解决方案，帮助初学者快速掌握FastAPI路径参数的使用技巧。您将学习到如何通过类型转换、正则表达式和自定义校验器
对“预训练”的理解衣衣困深度学习神经网络自然语言处理
预训练有什么用传统的机器学习是偏数学的，对数据的量不做过多要求，而深度学习的项目通常是有大量的数据可供使用。在平常的任务或者项目中，我们可能并没有大量数据，只有少量数据，在这时我们就可以通过“借用”有大数据支持的模型的参数，作为基准，这样就能提高效率和准确率。因为他们神经网络的浅层是相似的，也就是说，在任务相似的情况下，可以用已有的模型即“预训练”好的模型参数实现小数据量的模型训练。预训练可以节省
Python 3.8.10 for Windows：开启编程之旅的完美选择裴涓斐Kathy
Python3.8.10forWindows：开启编程之旅的完美选择python3.8.zip项目地址:https://gitcode.com/open-source-toolkit/dd07d项目介绍Python3.8.10forWindows是一款专为Windows用户设计的Python安装包，旨在为Windows7及更高版本的操作系统提供稳定、高效的Python环境。无论您是Python编程
Python 3.8.10 AMD64 安装包卢枫岱
Python3.8.10AMD64安装包项目地址:https://gitcode.com/open-source-toolkit/03899描述本仓库提供了一个Python3.8.10的AMD64安装包，旨在解决原下载地址网速过慢的问题，帮助用户节省下载时间。资源文件文件名:python-3.8.10-amd64.exe版本:Python3.8.10架构:AMD64使用方法点击仓库中的python
Java 大视界 -- Java 大数据机器学习模型的可解释性增强技术与应用（107）青云交大数据新视界 Java 大视界大数据 java 可解释性 AI SHAP LIME 因果推理可视化交互
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
深入理解STM32定时器PWM波：从原理到实战 2401_87067267 stm32 单片机
在嵌入式系统开发中，STM32系列微控制器凭借其强大的性能和丰富的资源，被广泛应用于各类项目。定时器产生PWM波是STM32的一项基础且重要的功能，在电机控制、LED调光、音频信号生成等诸多领域发挥着关键作用。今天，就让我们一同深入学习STM32定时器PWM波的相关知识。一、PWM波基础原理PWM，即脉冲宽度调制（PulseWidthModulation），是一种对模拟信号电平进行数字编码的方法。
一键生成Python项目依赖清单：pipreqs完全指南北岭敲键盘的荒漠猫 #python开发 python 开发语言
省流:pipinstallpipreqspipreqs./--encoding=utf8--force一键生成Python项目依赖清单：pipreqs完全指南作为Python开发者，你是否经历过这些痛苦场景？✅项目迁移到新环境时，发现漏装了几个依赖包，调试到崩溃…✅用pipfreeze导出依赖，结果混入一堆无关的全局包，臃肿不堪…✅手动维护requirements.txt，每次更新都要反复核对版本
基于Vue&Axios制作音乐播放器(bilibili黑马程序员Vue入门学习记录) xxxrsongseven 前端 javascript vue vue.js 前端 css
目录使用Vue制作一个音乐播放器前言VueVue导入Vue挂载Vue指令v-textv-htmlv-onv-showv-ifv-bindv-forv-modelaxiosaxios导入axios使用音乐网站代码HTMLCSSJS使用Vue制作一个音乐播放器前言第一次写，如有不足请指正！音乐播放器效果展示音乐播放器（密码：He371226）（域名出了点问题，临时使用）学习链接：黑马程序员vue前端基
鸿蒙HarmonyOS APP 开发入门2--事件_鸿蒙os 按钮事件 xcbyaya 程序员 harmonyos 华为
系列文章目录鸿蒙HarmonyOSAPP开发入门2–事件文章目录系列文章目录三、事件学习1.单击事件（常用）2.事件的四种写法3.双击事件4.长按事件5.滑动事件总结三、事件学习设计APP的时候最重要的知识就是事件，APP的组件之间的交互等，都需要通过事件来进行实现。事件就是可以被识别的操作。常见的事件有：单击、双击、长按、还有触摸事件。我们可以给文本、按钮等添加不同的事件。比如添加了单击事件之后
最新版阿里 231.13，x82y 滑块、水果滑块验证码，ali140~ali 231 都有，ai 轨迹通杀！呆头呆脑~ python 爬虫 javascript 网络爬虫算法 ai
声明本文章中所有内容仅供学习交流，抓包内容、敏感网址、数据接口均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关，若有侵权，请联系我立即删除！#欢迎交流wjxch1004
鸿蒙HarmonyOS NEXT实战（5.0）ArkUI开发＞动画曲线蜡笔小新、没有笔 OpenHarmony HarmonyOS 鸿蒙开发 harmonyos 华为鸿蒙鸿蒙系统开发语言 ui 前端
鸿蒙HarmonyOSNEXT开发实战往期文章必看（持续更新......）HarmonyOSNEXT应用开发性能实践总结HarmonyOSNEXT应用开发案例实践总结合集最新版！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！动画曲线概述动画曲线是属性关于时间的变化函数，决定属性变化时产生动画的运动轨迹
鸿蒙HarmonyOS NEXT实战（5.0）ArkUI开发＞模态转场方式蜡笔小新、没有笔 OpenHarmony HarmonyOS 鸿蒙开发 harmonyos 华为鸿蒙鸿蒙系统开发语言前端 ui
鸿蒙HarmonyOSNEXT开发实战往期文章必看（持续更新......）HarmonyOSNEXT应用开发性能实践总结HarmonyOSNEXT应用开发案例实践总结合集最新版！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！模态转场是新的界面覆盖在旧的界面上，旧的界面不消失的一种转场方式。表1模态转场
思考–如何学习陌生的知识后知后觉的先行者思考学习
思考–如何学习陌生的知识面对新知识的学习，可以遵循以下系统化的方法，既提高效率又减少迷茫感：一、明确学习目标：打破“学什么都要学全”的误区核心原则二八定律：80%的实用场景只需掌握20%的核心知识。场景驱动：明确“学这个知识要解决什么问题？”（例如：学Python是为了数据分析还是自动化办公？）。快速定位重点通过行业标杆案例、岗位JD或技术文档，提取高频关键词（如“神经网络”之于AI、“API调用
Html5学习教程，从入门到精通，HTML 5 图像语法知识点语法知识点及案例代码（9）知识分享小能手前端开发网页开发编程语言如门 html html5 学习前端 java 编辑器开发语言
HTML5图像语法知识点在HTML5中，图像是通过标签来嵌入的。以下是关于标签的详细知识点：基本语法：src：指定图像的URL或路径。alt：为图像提供替代文本，当图像无法显示时，浏览器会显示这个文本。可选属性：width和height：指定图像的宽度和高度（以像素为单位）。title：为图像提供额外的提示信息，当用户将鼠标悬停在图像上时会显示。loading：指定图像的加载方式，lazy表示延迟
Html5学习教程，从入门到精通，HTML 5 表格语法知识点 & 案例代码（10）知识分享小能手前端开发网页开发编程语言如门 html html5 学习 java 开发语言前端设计语言
HTML5表格语法知识点&案例代码一、HTML表格基础HTML表格用于展示数据，由行和列组成。1.1基本结构:定义表格。:定义表格行。:定义表格单元格。:定义表格表头单元格，默认加粗居中。1.2案例代码简单表格学生成绩表姓名语文数学英语张三908588李四789280代码解释::定义表格，并设置边框宽度为1像素。:定义表格行。:定义表头单元格，显示为“姓名”、“语文”、“数学”、“英语”。:定义普
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam