尤尔小屋的猫

Pandas+Seaborn+Plotly：联手探索苹果AppStore

公众号：尤而小屋
作者：Peter
编辑：Peter

大家好，我是Peter~

今天给大家分享一篇kaggle实战的新文章：基于Seaborn+Plotly的AppleStore可视化探索，这是一篇完全基于统计+可视化的数据分析案例。

原notebook只用了seaborn库，很多图形小编用plotly进行了实现，原文章地址：https://www.kaggle.com/adityapatil673/visual-analysis-of-apps-on-applestore/notebook

导入库

import pandas as pd
import numpy as np

# 可视化
from matplotlib import pyplot as plt
import seaborn as sns

import plotly_express as px
import plotly.graph_objects as go

数据基本信息

读取并且查看基本信息：

 # 1、整体大小
data.shape
(7197, 16)

# 2、缺失值
data.isnull().sum()

id                  0
track_name          0
size_bytes          0
currency            0
price               0
rating_count_tot    0
rating_count_ver    0
user_rating         0
user_rating_ver     0
ver                 0
cont_rating         0
prime_genre         0
sup_devices.num     0
ipadSc_urls.num     0
lang.num            0
vpp_lic             0
dtype: int64
  
# 3、字段类型
data.dtypes

id                    int64
track_name           object
size_bytes            int64
currency             object
price               float64
rating_count_tot      int64
rating_count_ver      int64
user_rating         float64
user_rating_ver     float64
ver                  object
cont_rating          object
prime_genre          object
sup_devices.num       int64
ipadSc_urls.num       int64
lang.num              int64
vpp_lic               int64
dtype: object

一般情况下，也会查看数据的描述统计信息（针对数值型的字段）：

APP信息统计

免费的APP数量

sum(data.price == 0)

4056

价格超过50的APP数量

价格大于50即表示为：超贵（原文：super expensive apps）

sum(data.price >= 50)

7

价格超过50的比例

sum((data.price > 50) / len(data.price) * 100)

0.09726274836737528

# 个人写法
sum(data.price >= 50) / len(data) * 100

0.09726274836737529

离群数据

价格超过50的APP信息

outlier = data[data.price > 50][['track_name','price','prime_genre','user_rating']]
outlier

免费APP

选择免费APP的数据信息

正常区间的APP

取数

paidapps = data[(data["price"] > 0) & (data.price < 50)]

# 正常价格区间的最大值和最小值
print("max_price:", max(paidapps.price))
print("min_price:", min(paidapps.price))

max_price: 49.99
min_price: 0.99

价格分布

plt.style.use("fivethirtyeight")
plt.figure(figsize=(12,10))

# 1、绘制直方图
# 2*1*1 两行一列的第1个图
plt.subplot(2,1,1)  # 位置
plt.hist(paidapps.price, log=True)  # 绘制直方图
# 标题和label值
plt.title("Price distribution of apps (Log scale)")
plt.ylabel("Frequency Log scale")
plt.xlabel("Price Distributions in ($) ")

# 2、绘制stripplot(分布散点图)
# 两行一列的第2个图
plt.subplot(2,1,2)
plt.title("Visual Price distribution")
sns.stripplot(data=paidapps,  # 整体数据
              y="price",  # 待绘图的字段
              jitter=True,  # 当数据点重合较多时，用该参数做调整
              orient="h",  # 水平方向显示 h-水平  v-垂直
              size=6
             )
plt.show()

结论1

随着价格的上涨，付费应用的数量呈现指数级的下降
很少应用的价格超过30刀；因此，尽量保持价格在30以下

category对价格分布的影响

data.columns  # 数据字段

Index(['id', 'track_name', 'size_bytes', 'currency', 'price',
       'rating_count_tot', 'rating_count_ver', 'user_rating',
       'user_rating_ver', 'ver', 'cont_rating', 'prime_genre',
       'sup_devices.num', 'ipadSc_urls.num', 'lang.num', 'vpp_lic'],
      dtype='object')

种类及数目

data["prime_genre"].value_counts()

Games                3862
Entertainment         535
Education             453
Photo & Video         349
Utilities             248
Health & Fitness      180
Productivity          178
Social Networking     167
Lifestyle             144
Music                 138
Shopping              122
Sports                114
Book                  112
Finance               104
Travel                 81
News                   75
Weather                72
Reference              64
Food & Drink           63
Business               57
Navigation             46
Medical                23
Catalogs               10
Name: prime_genre, dtype: int64

显示前5个种类

# y轴范围
yrange = [0,25]
fsize =15
plt.figure(figsize=(12,10))

# 分别绘制5个子图

# 图1 
plt.subplot(5,1,1)
plt.xlim(yrange)
# 挑出第一类的数据
games = paidapps[paidapps["prime_genre"] == "Games"]
sns.stripplot(data=games,
              y="price",
              jitter=True,
              orient="h",
              size=6,
              color="#eb5e66"
             )
plt.title("Games", fontsize=fsize)
plt.xlabel("")

# 图2
plt.subplot(5,1,2)  
plt.xlim(yrange)
# 挑出第一类的数据
ent = paidapps[paidapps["prime_genre"] == "Entertainment"]
sns.stripplot(data=ent,
              y="price",
              jitter=True,
              orient="h",
              size=6,
              color="#ff8300"
             )
plt.title("Entertainment", fontsize=fsize)
plt.xlabel("")


# 图3
plt.subplot(5,1,3)
plt.xlim(yrange)
edu = paidapps[paidapps.prime_genre=='Education']
sns.stripplot(data=edu,y='price',jitter= True ,orient ='h' ,size=6,color='#20B2AA')
plt.title('Education',fontsize=fsize)
plt.xlabel('') 

# 图4
plt.subplot(5,1,4)
plt.xlim(yrange)
pv = paidapps[paidapps.prime_genre=='Photo & Video']
sns.stripplot(data=pv,
              y='price',
              jitter= True,
              orient ='h',
              size=6,
              color='#b84efd')
plt.title('Photo & Video',fontsize=fsize)
plt.xlabel('') 

# 图5(个人添加)
plt.subplot(5,1,5)
plt.xlim(yrange)
ut = paidapps[paidapps.prime_genre=='Utilities']
sns.stripplot(data=ut,
              y='price',
              jitter= True,
              orient ='h',
              size=6,
              color='#084cfd')
plt.title('Utilities',fontsize=fsize)
plt.xlabel('')

结论2

Games游戏类的apps价格相对高且分布更广，直到25美元
Entertainment娱乐类的apps价格相对较低

Paid apps Vs Free apps

付费APP和免费APP之间的比较

app种类

# app的种类

categories = data["prime_genre"].value_counts()
categories

Games                3862
Entertainment         535
Education             453
Photo & Video         349
Utilities             248
Health & Fitness      180
Productivity          178
Social Networking     167
Lifestyle             144
Music                 138
Shopping              122
Sports                114
Book                  112
Finance               104
Travel                 81
News                   75
Weather                72
Reference              64
Food & Drink           63
Business               57
Navigation             46
Medical                23
Catalogs               10
Name: prime_genre, dtype: int64

len(categories)

23

选择前4个

选择前4个，其他的APP全部标记为Other

s = categories.index[:4]
s

Index(['Games', 'Entertainment', 'Education', 'Photo & Video'], dtype='object')

def categ(x):
    if x in s:
        return x
    else:
        return "Others"
    
data["broad_genre"] = data["prime_genre"].apply(categ)
data.head()

统计免费和付费APP下的种类数

# 免费
data[data.price==0].broad_genre.value_counts()

Games            2257
Others           1166
Entertainment     334
Photo & Video     167
Education         132
Name: broad_genre, dtype: int64

将两个数据合并起来：

统计量对比

高亮显示最大值（个人增加）

结论3

从上面的高亮结果中，我们发现：

Games相关的APP是最多的，不管是paid还是free
从付费占比来看，Education教育类型占比最大
从免费占比来看，Entertainment娱乐类型的占比最大

付费和免费的占比

生成数据

分组对比付费和免费的占比

list_free = dist.free_per.tolist()
list_free

[29.13907284768212,
 62.42990654205608,
 58.44122216468152,
 58.35835835835835,
 47.85100286532951]

# 列表转成元组
tuple_free = tuple(list_free)

# 付费类型相同操作
tuple_paidapps = tuple(dist.paid_per.tolist())

柱状图

plt.figure(figsize=(12,8))
N = 5
ind = np.arange(N)
width = 0.56  # 两个柱子间的宽度

p1 = plt.bar(ind, tuple_free, width, color="#45cea2")
p2 = plt.bar(ind,tuple_paidapps,width,bottom=tuple_free,color="#fdd400")

plt.xticks(ind,tuple(dist.index.tolist()))
plt.legend((p1[0],p2[0]),("free","paid"))
plt.show()

饼图

# 绘制饼图
pies = dist[['free_per','paid_per']]
pies.columns=['free %','paid %']
pies

plt.figure(figsize=(15,8))
pies.T.plot.pie(subplots=True,  # 显示子图
                 figsize=(20,4),  # 大小
                 colors=['#45cea2','#fad470']  # 颜色
                )
plt.show()

结论4

在教育类的APP中，付费paid的占比是很高的
相反的，在娱乐类的APP中，免费free的占比是很高的

付费APP真的足够好吗？

价格分类

# 对价格处理  0-free >0则用paid

data["category"] = data["price"].apply(lambda x: "Paid" if x > 0 else "Free")
data.head()

小提琴图

plt.figure(figsize=(15,8))
plt.style.use("fast")
plt.ylim([0,5])

plt.title("Distribution of User ratings")

sns.violinplot(data=data, # 数据+2个轴
               y="user_rating",
               x="broad_genre",
               hue="category",  # 分组
               vertical=True,  # 垂直显示
               kde=False,
               split=True,  # 同个类别的小提琴图一起显示
               linewidth=2,
               scale="count",
               palette=['#fdd470','#45cea2']
              )

plt.xlabel(" ")
plt.ylabel("Rating(0-5)")

plt.show()

结论5（个人增加）

在Education类的APP中，paid的占比是明显高于free；其次是Photo & Video
Entertainment娱乐的APP，free占比高于paid；且整体的占比分布更为宽

注意下面的代码中改变了split参数：

plt.figure(figsize=(15,8))
plt.style.use("fast")
plt.ylim([0,5])

plt.title("Distribution of User ratings")

sns.violinplot(data=data, 
               y="user_rating",
               x="broad_genre",
               hue="category",  
               vertical=True, 
               kde=False,
               split=False,  # 关注这个参数
               linewidth=2,
               scale="count",
               palette=['#fdd470','#45cea2']
              )

plt.xlabel(" ")
plt.ylabel("Rating(0-5)")

plt.show()

size和price 关系

探索：是不是价格越高，size越大了？

sns.color_palette("husl",8)
sns.set_style("whitegrid")

flatui = ["#9b59b6", "#3498db", "#95a5a6", "#e74c3c", "#34495e", "#2ecc71"]

# 改变字节数
data["MB"] = data.size_bytes.apply(lambda x: x/1048576)
# 挑选区间的数据
paidapps_regression =data[((data.price<30) & (data.price>0))]

sns.lmplot(data=paidapps_regression,
           x="MB",
           y="price",
           size=4,
           aspect=2,
           col_wrap=2,
           hue="broad_genre",
           col="broad_genre",
           fit_reg=False,
           palette=sns.color_palette("husl",5)
          )

plt.show()

使用Plotly实现（个人增加）

增加使用plotly实现方法

px.scatter(paidapps_regression,
           x="MB",
           y="price",
           color="broad_genre",
           facet_col="broad_genre",
           facet_col_wrap=2
          )

APP分类：是否可根据paid和free来划分

5种类型占比

# 1、设置颜色和大小
BlueOrangeWapang = ['#fc910d','#fcb13e','#239cd3','#1674b1','#ed6d50']
plt.figure(figsize=(10,10))

# 2、数据
label_names=data.broad_genre.value_counts().sort_index().index
size = data.broad_genre.value_counts().sort_index().tolist()

# 3、内嵌空白圆
my_circle=plt.Circle((0,0), 0.5, color='white')
# 4、圆
plt.pie(size, labels=label_names, colors=BlueOrangeWapang)
p=plt.gcf()
p.gca().add_artist(my_circle)
plt.show()

使用plotly如何实现：

# Plotly如何实现

fig = px.pie(values=size,
             names=label_names,
             labels=label_names,
             hole=0.5)

fig.update_traces(textposition='inside', textinfo='percent+label') 

fig.show()

5种类型+是否付费

f=pd.DataFrame(index=np.arange(0,10,2),
               data=dist.free.values,  # free
               columns=['num'])
p=pd.DataFrame(index=np.arange(1,11,2),
               data=dist.paid.values,  # paid
               columns=['num'])

final = pd.concat([f,p],names=['labels']).sort_index()
final

plt.figure(figsize=(20,20))

group_names=data.broad_genre.value_counts().sort_index().index
group_size=data.broad_genre.value_counts().sort_index().tolist()
h = ['Free', 'Paid']

subgroup_names= 5*h
sub= ['#45cea2','#fdd470']
subcolors= 5*sub
subgroup_size=final.num.tolist()

# 外层
fig, ax = plt.subplots()
ax.axis('equal')
mypie, _ = ax.pie(group_size, radius=2.5, labels=group_names, colors=BlueOrangeWapang)
plt.setp( mypie, width=1.2, edgecolor='white')

# 内层
mypie2, _ = ax.pie(subgroup_size, radius=1.6, labels=subgroup_names, labeldistance=0.7, colors=subcolors)
plt.setp( mypie2, width=0.8, edgecolor='white')
plt.margins(0,0)

plt.show()

基于plotly的实现：

# plotly如何实现
fig = px.sunburst(
  data,
  path=["broad_genre","category"],
  values="MB"
)

fig.show()

你可能感兴趣的:(机器学习,可视化工具,随机森林,分类,机器学习)

实战1. 利用Pytorch解决 CIFAR 数据集中的图像分类为 10 类的问题啥都鼓捣的小yao 深度学习 pytorch 分类人工智能深度学习
实战1.利用Pytorch解决CIFAR数据集中的图像分类为10类的问题加载数据建立模型模型训练测试评估你的任务是建立一个用于CIFAR图像分类的神经网络，并实现分类质量>0.5。注意：因为我们实战1里只讨论最简单的神经网络构建，所以准确率达到0.5以上就符合我们的目标，后面会不断学习新的模型进行优化CIFAR的数据集如下图所示：我们大概所需要的功能包如下：importnumpyasnpimpor
Training-free Neural Architecture Searchthrough Variance of Knowledge of Deep Network Weights（预览版本）境心镜免训练深度学习人工智能 NAS
代码位置摘要深度学习彻底改变了计算机视觉，但它使用深度网络架构取得了巨大的成功，而这些架构大多是手工制作的，因此可能不是最理想的。神经架构搜索(NAS)旨在通过遵循明确定义的优化范式来弥补这一差距，该范式系统地寻找最佳架构，给定客观标准，例如最大分类准确度。然而，NAS的主要限制是其天文数字般的计算成本，因为它通常需要从头开始训练每个候选网络架构。在本文中，我们旨在通过基于Fisher信息提出一种
DeepSeek 提示词样例量仔搞靓化 prompt
https://api-docs.deepseek.com/zh-cn/prompt-library文章目录一、代码改写提示词样例输出二、代码解释提示词样例输出三、代码生成提示词样例输出四、内容分类提示词样例输出五、结构化输出提示词样例输出六、角色扮演（自定义人设）提示词样例输出七、角色扮演（情景续写）提示词样例输出八、散文写作提示词样例输出九、诗歌创作提示词样例输出十、文案大纲生成提示词样例输出
支持向量机——SVM big_matster 周志华机器学习支持向量机算法
支持向量机支持向量机是一种经典的二分类模型，基本模型定义为特征空间中的最大间隔的线性分类器，其学习的优化目标便是间隔最大化，因此，支持向量机本身可以转换一个凸二次规划求解问题。函数间隔和几何间隔对于二分类学习，假设现在的数据是线性可分的，这时分类学习最基本的想法就是找到一个合理的超平面，该超平面能够将不同类别的样本分开，类似于二维平面使用ax+by+c=0ax+by+c=0ax+by+c=0来表示
如何成为LangChain项目的贡献者 eahba langchain easyui 前端 python
技术背景介绍LangChain是一个开源项目，致力于处理自然语言处理和生成任务。随着AI和机器学习领域的快速发展，LangChain项目的更新速度也很快。此项目欢迎社区的参与，无论是新功能、基础设施改进、文档提升还是Bug修复，都在积极寻求贡献。核心原则解析参与开源项目不仅能提升个人技能，还能为社区带来价值。对LangChain的贡献包括但不限于以下几个方面：文档改进：帮助改善项目文档，以便新人和
VSCode 常用的快捷键白总Server vscode ide 编辑器运维数据库 nginx 架构
VisualStudioCode(VSCode)提供了丰富的快捷键来提高开发效率。是常用的VSCode快捷键，按功能分类：1.基础编辑Ctrl+C/Ctrl+V/Ctrl+X：复制、粘贴、剪切当前选中的文本。Ctrl+Z/Ctrl+Y：撤销和重做操作。Ctrl+A：全选当前文件中的所有文本。Ctrl+D：选择当前单词，并跳到下一个匹配的单词（多选）。Ctrl+L：选择当前行。Alt+↑/Alt+↓
构建一个完整的视觉Transformer（ViT）图像分类模型 VIT （vision transformer）图像分类 Jackie_AI transformer 分类深度学习
构建一个完整的视觉Transformer（ViT）图像分类模型VIT（visiontransformer）图像分类根据提供的截图内容，我们可以看到一个名为VitNet的视觉Transformer（VisionTransformer，简称ViT）网络架构的部分代码。下面我将提供完整的VitNet类以及相关的辅助函数和训练流程示例代码。计算机视觉、图像处理、毕业辅导、作业帮助、代码获取，远程协助，代码
PyQt组件间的通信方式 cclsdxs python pyqt pyqt
PyQt组件间的通信方式PyQt组件间的通信方式1.组件介绍1.1组件的定义1.2组件的分类2.组件的通信方式2.1信号与槽（Signal&Slot）1.组件介绍在Qt框架中，‌组件‌（Component）是构建图形用户界面（GUI）的核心元素1.1组件的定义Qt组件（又称‌控件‌或‌部件‌）指用户界面中所有可视化的交互元素，例如按钮、文本框、标签、窗口等‌12。这些组件通过继承QWidget类实
用python 的 sentiment intensity analyzer的情感分析器，将用户评论进行分类 max500600 python 算法 python 分类人工智能
SentimentIntensityAnalyzer是nltk（NaturalLanguageToolkit）库中的一个工具，用于进行情感分析。它会为文本返回四个得分：负向情感得分（neg）、中性情感得分（neu）、正向情感得分（pos）和综合得分（compound）。综合得分范围在-1（极负面）到1（极正面）之间，通常可以根据这个得分对用户评论进行分类。以下是一个使用SentimentInten
beancount记账 HackerTom 环境 beancount 记账复式记账文本记账
之前在安卓用「那样记账」记账，换iPhone后发觉在AppStore没有，想找一款跨平台的记账软件，期望功能：记账（分类、分层的）统计图示同步找到beancount[1]，想起是之前BYVoid推荐过[4]。本篇做入门简介，更详细的介绍见beancount的文档[2]和BYVoid的系列网志[4]。Beancountbeancount属于纯文本记账[5]的工具之一，即所有收支记录都记在文本文件里，
Python开发农村青年婚恋appq (实操) Geeker-2025 python
开发一款农村青年婚恋APP是一个复杂且具有挑战性的项目。该应用需要整合用户管理、匹配算法、实时通信、数据分析等多个功能模块，并确保系统的安全性、稳定性和用户体验。使用Python开发可以充分利用其在数据处理、机器学习和Web开发方面的优势，构建一个高性能、可扩展且功能丰富的应用。以下是一个高层次的设计概述，涵盖主要的技术栈和功能模块，并提供使用Python开发的示例。##技术栈概述###前端-**
数字识别项目不要天天开心机器学习人工智能深度学习算法
集成算法·Bagging·随机森林构造树模型：由于二重随机性，使得每个树基本上都不会一样，最终的结果也会不一样。集成算法·Stacking·堆叠：很暴力，拿来一堆直接上（各种分类器都来了）·可以堆叠各种各样的分类器（KNN,SVM,RF等等）·分阶段：第一阶段得出各自结果，第二阶段再用前一阶段结果训练实现神经网络实例利用PyTorch内置函数mnist下载数据。·利用torchvision对数据进
性能测试详解（一）概述小高写BUG 性能测试与分析压力测试前端运维
文章目录性能测试详解（一）概述1.性能测试基础2.性能测试主要指标3.性能需求分析4.性能场景设计5.性能测试监控6.性能的分析与调优7.持续集成8.项目性能测试综合实战性能测试详解（一）概述1.性能测试基础结合实际应用对性能测试中所关联的所有性能理论知识进行详细讲解。性能测试的发展史性能测试的概念性能测试的分类性能测试的目的性能瓶颈的测试的测试方法性能测试的准入准出条件性能测试的流程为什么需要性
核函数及其常见类型 Shockang 机器学习数学通关指南机器学习人工智能数学线性代数概率统计
前言本文隶属于专栏《机器学习数学通关指南》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和参考文献请见《机器学习数学通关指南》正文核心概念核函数（KernelFunction）是机器学习中处理非线性可分数据的关键工具。它的核心思想是隐式映射：通过将数据从原始低维空间映射到高维空间，使得在高维空间中线性可分，从而无需显式计算高维映射，仅需在低维空间高效计算
【全网超详细】常用的 Windows CMD（命令提示符）指令合集 Wit's blog c++python pyqt scrapy scikit-learn dash scipy
以下整理了一份【全网超详细】常用的WindowsCMD（命令提示符）指令合集，并对其功能、常见用法及示例进行了分类与说明。希望能帮助你在日常或专业环境下快速定位和使用所需命令，提高工作与学习效率。为方便查阅，本篇会按照文件管理类、系统信息与网络类、进程与服务类、磁盘与系统维护类等主题进行梳理，每条命令配有简单示例及常见参数介绍。一、文件管理类指令1.dir功能：列出指定目录下的文件与子目录信息。常
PyTorch 学习路线 gorgor在码农 #python入门基础 python pytorch
学习PyTorch需要结合理论理解和实践编码，逐步掌握其核心功能和实际应用。以下是分阶段的学习路径和资源推荐，适合从入门到进阶：1.基础知识准备前提条件Python基础：熟悉Python语法（变量、函数、类、模块等）。数学基础：了解线性代数、微积分、概率论（深度学习的基础）。机器学习基础：理解神经网络、损失函数、优化器（如梯度下降）等概念。学习资源Python入门：Python官方教程机器学习基础
机器学习篇——决策树基础巷955 机器学习算法决策树
引言：决策树是一种常见的机器学习算法，广泛应用于分类和回归任务。它通过树状结构表示决策过程，每个内部节点代表一个特征测试，每个分支代表一个可能的测试结果，而每个叶节点则代表一个类别或回归值。本文将详细介绍决策树的原理、构建过程、优缺点以及实际应用。1.决策树的基本概念1.1什么是决策树？决策树是一种监督学习算法，主要用于分类和回归任务。它通过递归地将数据集划分为更小的子集，最终生成一棵树状结构。决
无监督AI训练:机遇与挑战并存 AI天才研究院计算 ChatGPT DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
无监督AI训练：机遇与挑战并存关键词：无监督学习、AI训练、机器学习、聚类算法、降维技术、深度学习摘要：本文深入探讨无监督AI训练这一新兴领域，首先介绍了其基本概念与原理，然后详细解析了无监督AI训练的核心技术，如聚类算法和降维技术，以及无监督深度学习。接着，本文通过实际项目案例分析，展示了无监督AI训练的应用实践。最后，本文分析了无监督AI训练面临的挑战，并展望了其未来发展趋势。通过本文的阅读，
【2024】LeetCode HOT 100——技巧「已注销」 leetcode 算法职场和发展
目录1.只出现一次的数字1.1C++实现1.2Python实现1.3时空分析2.多数元素2.1C++实现2.2Python实现2.3时空分析3.颜色分类3.1C++实现3.2Python实现3.3时空分析4.下一个排列4.1C++实现4.2Python实现4.3时空分析5.寻找重复数5.1C++实现5.2Python实现5.3时空分析1.只出现一次的数字原题链接：136.只出现一次的数字只需注意到
PyTorch：Python深度学习框架使用详解零度° python python 深度学习 pytorch
PyTorch是一个开源的机器学习库，广泛用于计算机视觉和自然语言处理领域。它由Facebook的AI研究团队开发，因其动态计算图、易用性以及与Python的紧密集成而受到开发者的青睐。PyTorch的主要特点动态计算图：PyTorch的计算图在运行时构建，使得模型的修改和调试更加灵活。自动微分：自动计算梯度，简化了机器学习模型的训练过程。丰富的API：提供了丰富的神经网络层、函数和损失函数。跨平
mysql面试知识点 mysql
leftjoin和innerjoin区别leftjoin在右表没有匹配项的时候，会将左表拼接上右表，右表的字段以null填充。innerjoin在右表没有匹配项的时候，该结果不显示innoDB默认的存储引擎支持事务、支持物理外键天生支持行锁、手动支持表锁使用聚簇索引（索引和数据在同一个文件）索引概念一种排好序，能够提升查询性能的数据结构分类聚簇索引（主键索引）索引和行数据都在一个叶子节点上非聚簇索
1.3 最优化的基本概念西瓜毛毛猫最优化算法
系统分类一般来说，最优化算法研究可以分为：构造最优化模型、确定最优化问题的类型与设计算法、实现算法或调用优化算法软件包进行求解。最优化模型的构造与实际问题息息相关。打个比方，给定二维欧几里得空间的若干个分离点，假定它们可以通过一条直线分成两部分，也可以通过一条曲线分成两部分。那么分别使用直线和曲线所得到的最优化模型是不同的。在前文的问题中，目标函数与约束函数都是由模型来决定的。在确定模型后，我们再
HTML5——新增属性野性的鬼 #html html5 html 前端
除了html的基础标签，在html5中增加了一些新的属性，下边总结分类一下这些新的属性。有绿色背景的为以后可能的常用属性。目录1、新增语义元素2、被删元素3、新增表单控件4、新增输入类型新增的输入类型：新增的输入属性：5、新增图像6、新增媒介元素7、总结：1、新增语义元素——定义页面独立的内容区域。——定义页面的侧边栏内容。——定义section或document（文档）的页脚。——定义文档的头部
python | flower，一个强大的 Python 库！双木的木 python拓展学习 python库 python 开发语言计算机视觉人工智能算法联邦学习深度学习
本文来源公众号“python”，仅用于学术分享，侵权删，干货满满。原文链接：flower，一个强大的Python库！大家好，今天为大家分享一个强大的Python库-flower。Github地址：https://github.com/mher/flower随着机器学习模型应用的增长，联邦学习（FederatedLearning，FL）逐渐成为一个重要方向。联邦学习允许多个客户端在不共享原始数据的情
【开源项目】2024最新PHP在线客服系统源码/带预知消息/带搭建教程于飞SEO 免费资源分享开源 php 开发语言
简介随着人工智能技术的飞速发展，AI驱动的在线客服系统已经成为企业提升客户服务质量和效率的重要工具。本文将探讨AI在线客服系统的理论基础，并展示如何使用PHP语言实现一个简单的AI客服系统。源码仓库地址：ym.fzapp.top在线客服系统的理论基础AI在线客服系统通过自然语言处理（NLP）、机器学习（ML）和深度学习（DL）技术，能够理解和响应客户的查询。这些系统通常包括以下几个关键组件：自然语
ChatGPT-4o引领医学革命：临床科研创新与效率的新纪元小艳加油教程语言类人工智能数据分析 ChatGPT-4o 临床医学
2024年5月12日，更强版本的ChatGPT-4o上线，文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。因此，帮助广大临床医学相关的医院管理人员、医生、学生、科研人员更加熟练地掌握ChatGPT-4o在临床医学日常生活、工作与学习、课题申报、论文选题、实验方案设计、实验数据统计分析与可视化等方面的强大功能，同时更加系统地学习人工智能（包括传统机器学习、深度学习等）的基础理
云贝餐饮外卖O2O1.5.6+商家端1.1.4+前端 weixin_40214893 源码小程序
版本号：1.5.6备注：本次更新不需要从头上传小程序【批改】直播插件【批改】微信会员卡图片问题【新增】券包功用云贝餐饮【新增】充值分账功用【新增】生日有礼(需配置独自定时使命,地址在添加生日活动页面获取)【优化】公众号分割红包按钮点了没反应【优化】公众号会员卡权益不显现【优化】会员卡公告显现问题【批改】美食分类查找问题【批改】账单订单类型查找下载地址：http://www.95vs.com/173
电机的声音数据进行AI分析鹿屿二向箔人工智能
对电机的声音数据进行分析，尤其是当数据来源于加速度传感器时，涉及到的不仅仅是声音分析，还包含了振动分析。这类问题通常可以归类于机械故障诊断或预测性维护领域。以下是一些适合处理这种类型数据的人工智能模型和方法：1.特征工程+传统机器学习模型在直接应用深度学习之前，通常首先会进行特征提取。对于振动信号（即使通过加速度传感器采集），常用的方法包括计算频域特征（如傅里叶变换后的频谱）、时域特征（如均方根值
可解释性机器学习——从金融科技视角（1） flex_university 可解释性机器学习与金融科技机器学习深度学习金融
可解释性机器学习——从金融科技视角（1）内容摘要：可解释性的重要性文章目录可解释性机器学习——从金融科技视角（1）1、过程为什么重要2、可解释性机器学习模型能做到什么3、什么时候不需要可解释性1、过程为什么重要尽管机器学习模型表现良好，但单一指标（如分类准确性）是对大多数实际任务的不完整表述。（Doshi-Velez&Kim2017）。某些任务不仅需要得到预测结果，更需要解释模型是如何得出预测的。
Python简介 Gao_xu_sheng python 开发语言
Python前言Python一直是一门优秀的编程语言，不仅简洁、易用，而且功能强大，它能做到的事情太多了，既可用于开发桌面应用，也可用于做网络编程，网络爬虫，还有很重要的领域就是AI大模型开发。近年来，随着人工智能（AI）和机器学习（ML）领域的迅猛发展，Python在这些前沿技术中扮演了至关重要的角色，特别是在构建和训练大规模机器学习方面。Python拥有丰富的库和框架，这些工具极大地促进了AI
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n
操作日期和时间的工具类 vipbooks 工具类
大家好啊，好久没有来这里发文章了，今天来逛逛，分享一篇刚写不久的操作日期和时间的工具类，希望对大家有所帮助。 /* * @(#)DataFormatUtils.java 2010-10-10 * * Copyright 2010 BianJing,All rights reserved. */ package test; impor

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他