简佐义的博客

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend...

【简说基因】ggstatsplot：画图并自动为图形加上丰富的统计信息。

在典型的探索性数据分析工作流中，数据可视化和统计建模是两个不同的阶段：可视化有助于建模，而建模反过来又可以建议不同的可视化方法，依此类推。ggstatsplot 的核心思想很简单：将这两个阶段合并为一个，以图形的形式呈现统计细节，使数据探索变得更简单、更快速。

ggstatsplot 是 ggplot2 的一个扩展包，它提供 9 个函数用于常见的统计作图，根据功能可以将它们分成 4 类：

分布

数据的分布（gghistostats()，直方图）
带标签的数据的分布（ggdotplotstats(), 点图）

比较

数值数据的组间比较（ggbetweenstats(), 小提琴图）
数值数据的组内比较（ggwithinstats(), 小提琴图）
分类数据的组间比较（ggbarstats(), 柱状图）
分类数据的组间比较（ggpiestats(), 饼图）

相关性

两个变量之间的相关性（ggscatterstats(), 散点图）
多个变量之间的相关性（ggcorrmat(), 相关性矩阵图）

回归

回归模型和 meta 分析（ggcoefstats(), 点须图）

我们先来看一下统计报告的格式。ggstatsplot 默认的模板遵循统计报告的黄金标准，既报告了传统的频率学派分析结果，也包含贝叶斯分析结果，详情看下图：

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend..._第1张图片

分布

1. 数据的分布（gghistostats()，直方图）

可视化单个变量的分布，并进行单样本检验，看样本均值与指定值是否有显著不同。

# install.packages("ggstatsplot")
library(ggstatsplot)
library(ggplot2)

set.seed(123)

gghistostats(
  data       = diamonds,
  x          = carat,
  title      = "Carat of diamonds",
  test.value = 0.75,
  binwidth   = 0.05
)

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend..._第2张图片

2. 带标签的数据的分布（ggdotplotstats(), 点图）

当数字变量带有标签时，用点图进行可视化，同时进行单样本检验。

set.seed(123)

ggdotplotstats(
  data       = dplyr::filter(gapminder::gapminder, continent == "Asia"),
  x          = lifeExp,
  y          = country,
  test.value = 55,
  type       = "robust",
  title      = "Distribution of life expectancy in Asian continent",
  xlab       = "Life expectancy"
)

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend..._第3张图片

比较

3. 数值数据的组间比较（ggbetweenstats(), 小提琴图）

组合箱线图、小提琴图和抖动散点图，并将统计信息展示在副标题和图注中。

set.seed(123)

ggbetweenstats(
  data  = iris,
  x     = Species,
  y     = Sepal.Length,
  title = "Distribution of sepal length across Iris species"
)

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend..._第4张图片

4. 数值数据的组内比较（ggwithinstats(), 小提琴图）

对于重复测量数据，可以使用 ggwithinstats()绘图并进行配对样本检验。

set.seed(123)
library(WRS2) ## for data
library(afex) ## to run ANOVA

ggwithinstats(
  data    = WineTasting,
  x       = Wine,
  y       = Taste,
  title   = "Wine tasting"
)

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend..._第5张图片

5. 分类数据的组间比较（ggbarstats(), 柱状图）

可以通过百分比柱状图展示分类变量，注意 x 参数将作为列联表的行，y 参数将作为列联表的列。

set.seed(123)
library(ggplot2)

ggbarstats(
  data             = mtcars,
  x                = am,
  y                = cyl,
  title            = "cyl by am",
  legend.title     = "Transmission",
  ggplot.component = list(ggplot2::scale_x_discrete(guide = ggplot2::guide_axis(n.dodge = 2))),
  palette          = "Set2"
)

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend..._第6张图片

6. 分类数据的组间比较（ggpiestats(), 饼图）

也可以通过饼图研究分类变量之间的相互作用：

set.seed(123)

ggpiestats(
  data         = mtcars,
  x            = am,
  y            = cyl,
  package      = "wesanderson",
  palette      = "Royal1",
  title        = "Dataset: Motor Trend Car Road Tests",
  legend.title = "Transmission"
)

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend..._第7张图片

相关性

7. 两个变量之间的相关性（ggscatterstats(), 散点图）

散点图探索两个变量之间的相关性，其边缘添加直方图用于显示数据的分布。

ggscatterstats(
  data  = mtcars,
  x     = disp,
  y     = mpg,
  title = "The relationship between disp and mpg"
)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend..._第8张图片

8. 多个变量之间的相关性（ggcorrmat(), 相关性矩阵图）

对于多个变量，可以用相关性矩阵图展示它们之间的关系。

set.seed(123)

## as a default this function outputs a correlation matrix plot
ggcorrmat(
  data     = ggplot2::msleep,
  colors   = c("#B2182B", "white", "#4D4D4D"),
  title    = "Correlalogram for mammals sleep dataset",
  subtitle = "sleep units: hours; weight units: kilograms"
)

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend..._第9张图片

回归

9. 回归模型和 meta 分析（ggcoefstats(), 点须图）

点须图：回归系数的点估计显示为点，置信区间显示为须，其他统计信息则显示为标签。

set.seed(123)

## model
mod <- stats::lm(formula = mpg ~ am * cyl, data = mtcars)

ggcoefstats(mod)

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend..._第10张图片

提取统计信息

ggstatsplot 图形中的统计信息可以通过一些方便的函数提取出来，比如：

set.seed(123)

p <- ggbetweenstats(mtcars, cyl, mpg)

extract_subtitle(p)
## list(italic("F")["Welch"](2, 18.03) == "31.62", italic(p) ==
##     "1.27e-06", widehat(omega["p"]^2) == "0.74", CI["95%"] ~
##     "[" * "0.53", "1.00" * "]", italic("n")["obs"] == "32")

extract_caption(p)
## list(log[e] * (BF["01"]) == "-14.92", widehat(italic(R^"2"))["Bayesian"]^"posterior" ==
##     "0.71", CI["95%"]^HDI ~ "[" * "0.57", "0.79" * "]", italic("r")["Cauchy"]^"JZS" ==
##     "0.71")

extract_stats(p)
## $subtitle_data
## # A tibble: 1 x 14
##   statistic    df df.error    p.value
##                  
## 1      31.6     2     18.0 0.00000127
##   method                                                   effectsize estimate
##                                                                
## 1 One-way analysis of means (not assuming equal variances) Omega2        0.744
##   conf.level conf.low conf.high conf.method conf.distribution n.obs expression
##                                       
## 1       0.95    0.531         1 ncp         F                    32 
##
## $caption_data
## # A tibble: 6 x 17
##   term     pd prior.distribution prior.location prior.scale     bf10
##                                       
## 1 mu    1     cauchy                          0       0.707 3008850.
## 2 cyl-4 1     cauchy                          0       0.707 3008850.
## 3 cyl-6 0.780 cauchy                          0       0.707 3008850.
## 4 cyl-8 1     cauchy                          0       0.707 3008850.
## 5 sig2  1     cauchy                          0       0.707 3008850.
## 6 g_cyl 1     cauchy                          0       0.707 3008850.
##   method                          log_e_bf10 effectsize         estimate std.dev
##                                                        
## 1 Bayes factors for linear models       14.9 Bayesian R-squared    0.714  0.0503
## 2 Bayes factors for linear models       14.9 Bayesian R-squared    0.714  0.0503
## 3 Bayes factors for linear models       14.9 Bayesian R-squared    0.714  0.0503
## 4 Bayes factors for linear models       14.9 Bayesian R-squared    0.714  0.0503
## 5 Bayes factors for linear models       14.9 Bayesian R-squared    0.714  0.0503
## 6 Bayes factors for linear models       14.9 Bayesian R-squared    0.714  0.0503
##   conf.level conf.low conf.high conf.method n.obs expression
##                          
## 1       0.95    0.574     0.788 HDI            32 
## 2       0.95    0.574     0.788 HDI            32 
## 3       0.95    0.574     0.788 HDI            32 
## 4       0.95    0.574     0.788 HDI            32 
## 5       0.95    0.574     0.788 HDI            32 
## 6       0.95    0.574     0.788 HDI            32 
##
## $pairwise_comparisons_data
## # A tibble: 3 x 9
##   group1 group2 statistic   p.value alternative distribution p.adjust.method
##                                
## 1 4      6          -6.67 0.00110   two.sided   q            Holm
## 2 4      8         -10.7  0.0000140 two.sided   q            Holm
## 3 6      8          -7.48 0.000257  two.sided   q            Holm
##   test         expression
##           
## 1 Games-Howell 
## 2 Games-Howell 
## 3 Games-Howell 
##
## $descriptive_data
## NULL
##
## $one_sample_data
## NULL
##
## $tidy_data
## NULL
##
## $glance_data
## NULL

将统计信息应用于个性化图形

提取出来的统计信息，可以绘制到其他作图系统创建的图形上，例如：

## loading the needed libraries
set.seed(123)
library(ggplot2)

## using `{ggstatsplot}` to get expression with statistical results
stats_results <- ggbetweenstats(iris, Species, Sepal.Length) %>% extract_subtitle()

## creating a custom plot of our choosing
ggplot(iris, aes(x = Species, y = Sepal.Length)) +
  geom_boxplot() +
  labs(
    title = "Sepal length of iris",
    subtitle = stats_results,
  )

使用ggstatsplot简化数据探索：一步完成数据可视化和统计建模 | 简说基因 Recommend..._第11张图片

总结

ggstatsplot 确实为探索性数据分析带来了极大的便利，其优点有：

统计作图一个包搞定，无需使用其他大量的软件包。
易于使用，所有函数都只需要少量代码（通常只需要指定 data, x 和 y 即可），这可以极大地减少错误。
各种统计方法可以任选。
独立的图形就可以让人看懂，无需上下文信息。

本文首发于公众号：简说基因，欢迎关注。

你可能感兴趣的:(信息可视化)

springBoot中不添加依赖 , 手动生成一个token ,并校验token (使用简单 , 但是安全会低一点) 无足鸟丶 spring boot 安全后端
在SpringBoot里，即便不添加额外依赖，也能手动生成和校验Token。下面以简单的基于时间戳和密钥的方式来生成和校验Token为例，介绍具体实现步骤。实现思路生成Token：把用户信息、时间戳等数据组合起来，再用密钥进行哈希处理，生成一个唯一的Token。校验Token：从Token里提取出用户信息和时间戳，重新进行哈希处理，然后与原Token进行对比，同时检查时间戳是否过期。代码实现1.创
Linux篇1-初识Linux 逃跑的机械工 Linux linux
1.Linux能干什么Linux能够进行各种语言的开发工作，基本主要以后端语言为主C++，JAVA,python;Linux能进行各种指令操作，从而完成各种的文件相关的管理工作2.Linux基本指令2.1ls指令在Linux中，以.开头的文件，叫做隐藏文件；ls-a显示隐藏文件隐藏文件：Linux配置文件，可以隐藏起来，防止误操作，起到保护作用；ls-l列出文件的详细信息-d将目录象文件一样显示，
Python获取tiktok视频数据信息 api 爬虫程序媛了了 python 开发语言
Tiktok通过ID爬取视频信息api采集页面如图：https://www.tiktok.com/@basketwithball2.0/video/7273119444522650912?q=irving&t=1706683319923请求APIhttp://api.xxxx.com/tt/video/info?video_id=7273119444522650912&token=test请求参数
人生建议往死里学网络安全！零基础也能跨行学习！！漏洞挖掘还能做副业黑客老哥 web安全学习安全网络系统安全
一、网络安全的重要性：从‘不学会被黑’到‘学会保护别人’网络安全的概念现在不再是技术圈的独立话题，它已经渗透到社会的各个领域。从个人的隐私保护、企业的数据安全，到国家的信息防护，网络安全几乎影响了每一个人的生活。无论是黑客攻击、勒索病毒、数据泄露，还是国家间的信息战，网络安全已经成为现代社会的基础设施之一。所以，首先要明白学习网络安全的重要性：你不仅是在学习技术，更多的是在为自己和他人的安全“筑城
新手必看——ctf六大题型介绍及六大题型解析&举例解题沛哥网络安全 web安全学习安全 udp 网络协议
CTF（CaptureTheFlag）介绍与六大题型解析一、什么是CTF？CTF（CaptureTheFlag），意为“夺旗赛”，是一种信息安全竞赛形式，广泛应用于网络安全领域。CTF竞赛通过模拟现实中的网络安全攻防战，让参赛者以攻防对抗的形式，利用各种信息安全技术进行解决一系列安全问题，最终获得“旗帜（Flag）”来获得积分。CTF赛事一般分为两种形式：Jeopardy（解题模式）：参赛者通过解
AI学习指南RAG篇(24)-RAGFlow的社区与开源贡献俞兆鹏 AI学习指南人工智能
一、引言RAGFlow是一款基于深度文档理解的开源RAG（Retrieval-AugmentedGeneration，检索增强生成）引擎，旨在解决现有RAG技术在数据处理和生成答案方面的挑战。RAGFlow通过结合大型语言模型（LLMs）的强大生成能力和高效的信息检索系统，为用户提供了一种全新的交互体验。本文将鼓励读者参与到RAGFlow的开源社区中，共同推动技术的发展和创新。二、RAGFlow的
如何在 Node.js 中使用 .env 文件管理环境变量？鸠摩智首席音效师 node.js
Node.js应用程序通常依赖于环境变量来管理敏感信息或配置设置。.env文件已经成为一种流行的本地管理这些变量的方法，而无需在代码存储库中公开它们。本文将探讨.env文件为什么重要，以及如何在Node.js应用程序中有效的使用它。为什么使用.env文件?Security在源代码中保留敏感信息(如API密钥、数据库凭据)可能会将它们暴露给意想不到的访问者。将此数据分离到特定于环境的文件中，您可以使
Java设计模式之代理模式飞翔中文网 Java java 设计模式
概念和作用代理模式是一种结构型设计模式，它允许为其他对象提供一种代理以控制对这个对象的访问。代理对象在客户端和目标对象之间起到中介作用，可以在目标对象执行某些操作前后添加额外的功能。使用场景1.访问控制：根据用户权限决定是否允许访问目标对象。2.日志记录：在访问目标对象前后记录日志信息。3.性能监控：测量目标对象方法的执行时间。4.延迟加载：按需加载资源，避免过早占用内存。举例静态代理静态代理在编
为什么有免费 SSL 证书大家还用付费的 ssl证书数字证书
一、信任基石：权威与否大不同免费SSL证书通常由一些非权威的证书颁发机构提供，在浏览器地址栏中显示时，可能会出现诸如“不安全”的提示标识，容易引发用户对网站可信度的质疑。付费SSL证书多来自全球知名、广受认可的权威机构，这些大机构经过长期的行业深耕，有着严苛的审核流程，其颁发的证书能让网站瞬间提升“可信度”，用户看到熟悉且信任的锁形图标，更愿意放心地在网站上输入敏感信息，如登录密码、银行卡号等，这
Ubuntu执行apt-get install xxx报错怎么办？
在Ubuntu系统中，使用apt-getinstall命令安装软件包时，可能会遇到各种报错。本文将详细介绍Ubuntu执行apt-getinstallxxx报错的解决方法，帮助您快速定位并解决问题。️常见报错及解决方法1.更新源和软件包问题：软件包信息过时，导致无法找到或安装最新的软件包。解决方法：首先确保系统源和软件包是最新的，执行以下命令更新：sudoaptupdatesudoaptupgra
2023年中职网络安全——SQL注入测试（PL）解析旺仔Sec 网络安全职业技能大赛任务解析服务器运维 web安全 sql 网路安全
SQL注入测试（PL）任务环境说明：服务器场景：Server2312服务器场景操作系统：未知（关闭链接）已知靶机存在网站系统，使用Nmap工具扫描靶机端口，并将网站服务的端口号作为Flag（形式：Flag字符串）值提交。访问网站/admin/pinglun.asp页面，此页面存在SQL注入漏洞，使用排序语句进行列数猜测，将语句作为Flag（形式：URL无空格）值提交。页面没有返回任何有用信息，尝试
全面解析条形码、二维码与RFID技术的区别及应用场景爱码字的小印条形码经验分享
在生活中，我们常见的条形码、二维码，甚至RFID技术，早已成了日常识别的小帮手。从超市结账到包裹追踪，再到门禁通行，它们无处不在。然而，看似都能识别信息，这三者的背后其实有着各自独特的工作原理和适用场景。到底条形码、二维码和RFID有什么不同？它们各自适用于哪些行业？今天，我们就来揭开这三种技术的奥秘，帮您找到最适合自己业务的识别方案！一、条形码技术：传统而稳定的识别方式条形码（Barcode）是
python、JavaScript 、JAVA等实例代码演示教你如何免费获取股票数据（实时数据、历史数据、CDMA、KDJ等指标数据）配有股票数据API接口说明文档详解参数说明蝶澈乐乐 python javascript java 股票数据接口 api 开发语言
近一两年来，股票量化分析逐渐受到广泛关注。而作为这一领域的初学者，首先需要面对的挑战就是如何获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的核心任务是从这些数据中挖掘出有价值的信息，为我们的投资策略提供有力的支持。在寻找数据的过程中，我尝试了多种途径，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花
Java通过QRCode生成二维码(1) 2401_84006757 程序员 java 开发语言
QRCode码，是由Denso公司于1994年9月研制的一种矩阵二维码符号，它具有一维条码及其它二维条码所具有的信息容量大、可靠性高、可表示汉字及图象多种文字信息、保密防伪性强等优点。先下载QRCode.jar包：https://pan.baidu.com/s/1Pb9XzWKhumgwaYrE90vyWg二、代码实例1、生成二维码//加密：文字信息->二维码publicstaticvoidenc
【Flutter】从安卓与iOS包体优化到一键自动打包脚本的一条龙服务 sugood Flutter android flutter ios
系统信息Systemversion:MacOS12Flutterversion:1.22.5Dartversion:2.10.4AndroidStudioversion:4.1.1介绍APK优化包体大小APK多渠道打包APK一键打包脚本IPA优化包体大小IPA无签名打包IPA一键打包脚本脚本地址github脚本地址安卓APK优化包体大小优化图片等资源大小，删除无用资源只选择保留必要的so库。第三方
Hessian 矩阵（海森矩阵） Chen_Chance 矩阵算法机器学习
Hessian矩阵（海森矩阵）是一个包含二阶偏导数信息的方阵，在数学和优化中起着重要作用。对于一个多元函数，其Hessian矩阵是由其各个变量的二阶偏导数组成的矩阵。假设有一个函数f(x1,x2,…,xn)f(x_1,x_2,\dots,x_n)f(x1,x2,…,xn)，其Hessian矩阵(H)的元素是：Hij=∂2f∂xi∂xjH_{ij}=\frac{\partial^2f}{\parti
打造城市二手房分析与可视化系统+聚类分析+58爬虫+线性回归 OverlordDuke 聚类算法数据可视化爬虫线性回归算法
打造城市二手房分析与可视化系统+聚类分析+58爬虫+线性回归利用数据实现全面分析数据分析与可视化功能创新的聚类分析功能结语在如今房地产市场日益复杂的背景下，对于投资者、购房者和市场分析师来说，了解市场动态并做出明智的决策至关重要。基于此，我们开发了一款基于Python的城市二手房分析与可视化系统，为用户提供了强大的工具，帮助他们深入了解当地房地产市场。利用数据实现全面分析我们的系统利用爬取的58同
纯血鸿蒙系统 HarmonyOS NEXT自动化测试实践夜阑卧听风吹雨，铁马冰河入梦来 python Appium自动化测试 harmonyos 华为
1、测试框架选择hdc：类似android系统的adb命令，提供设备信息查询，包管理，调试相关的命令@ohos.UiTest：鸿蒙sdk的一部分，类似androidsdk里的uiautomator，基于Accessibility服务，提供模拟UI操作的能力。但是需要用arkTS语言来写自动化case，并且用例需要打包到被测app里面hypium：鸿蒙官方的自动化框架，功能比较完善，可以基于pyth
ChatGPT、DeepSeek、GIS与Python机器学习强强联合！地质灾害风险评估、易发性分析、信息化建库及灾后重建 WangYan2022 DeepSeek ChatGPT 地下水地质灾害 DeepSeek ChatGPT GIS 灾后重建
在地质灾害频繁肆虐的当下，精准开展风险评价刻不容缓。如今，一门极具创新性的教程震撼登场，它将ChatGPT、DeepSeek等前沿技术与GIS、Python以及机器学习深度交融，为学员打造出前所未有的学习体验，助力大家在地质灾害风险评价领域强势突围，一路领先。前沿技术融合，铸就智能学习核心动力教程最闪耀的亮点之一，便是大胆引入了ChatGPT和DeepSeek技术。它们恰似无所不能的“数据魔法师”
python3实现爬取淘宝页面的商品的数据信息（selenium+pyquery+mongodb） flood_d mongodb python selenium pyquery 爬虫
1.环境须知做这个爬取的时候需要安装好python3.6和selenium、pyquery等等一些比较常用的爬取和解析库，还需要安装MongoDB这个分布式数据库。2.直接上代码spider.pyimportrefromconfigimport*importpymongofromseleniumimportwebdriverfromselenium.common.exceptionsimportT
使用Java爬虫根据关键词获取Shopee商品列表？小爬虫程序猿 java 爬虫开发语言
在跨境电商领域，Shopee作为东南亚及中国台湾地区领先的电商平台，拥有海量的商品信息。无论是进行市场调研、数据分析，还是寻找热门商品，根据关键词获取Shopee商品列表都是一项极具价值的任务。然而，手动浏览和整理这些信息显然是低效且容易出错的。幸运的是，通过编写Java爬虫程序，我们可以高效地完成这一任务。本文将详细介绍如何利用Java爬虫根据关键词获取Shopee商品列表，并提供完整的代码示例
Selenium实战-模拟登录淘宝并爬取商品信息_使用selenium模拟真实登录行为,并爬取商品评论数据。 2401_84009899 程序员 selenium python 测试工具
模拟淘宝登录deflogin_taobao():print(‘开始登录…’)try:login_url=‘https://login.taobao.com/member/login.jhtml’driver.get(login_url)input_login_id=wait.until(EC.presence_of_element_located((By.ID,‘fm-login-id’)))in
数据结构篇——线索二叉树张二娃同学数据结构
一、引入遍历二叉树是按一定规则将二叉树结点排成线性序列，得到先序、中序或后序序列，本质是对非线性结构线性化，使结点（除首尾）在线性序列中有唯一前驱和后继；但以二叉链表作存储结构时，只能获取结点左右孩子信息，无法直接得任一序列中的前驱和后继信息，该信息需在遍历动态过程中获取，所以我们将引入线索二叉树来保存遍历动态过程中得到的前驱和后继信息。二、线索二叉树的基本概念试做如下规定:若结点有左子树,则其l
LoRA中黑塞矩阵、Fisher信息矩阵是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力矩阵机器学习人工智能 transformer 深度学习算法线性代数
LoRA中黑塞矩阵、Fisher信息矩阵是什么1.三者的核心概念黑塞矩阵（Hessian）二阶导数矩阵，用于优化问题中判断函数的凸性（如牛顿法），或计算参数更新方向（如拟牛顿法）。Fisher信息矩阵（FisherInformationMatrix,FIM）统计学中衡量参数估计的不确定性，反映数据中包含的关于参数的信息量。在机器学习中常用于自然梯度下降（NaturalGradientDescent
21.11 《ChatGLM3-6B+Gradio工业级落地：多模态交互+60%性能优化，手把手实现生产部署》少林码僧 AI大模型应用实战专栏人工智能 gpt 语言模型性能优化交互
《ChatGLM3-6B+Gradio工业级落地：多模态交互+60%性能优化，手把手实现生产部署》关键词：ChatGLM3-6B应用开发，Gradio界面集成，模型交互优化，Web服务容器化，多模态输入支持使用Gradio赋能ChatGLM3-6B图形化界面通过Gradio实现大模型服务的可视化交互，是生产级AI应用落地的关键环节。本节将深入解析如何构建适配ChatGLM3-6B的工业级交互界面。
Cookies 详解：工作原理、使用方法及安全性才华是浅浅的耐心 python java javascript
1.什么是Cookie？Cookie是存储在用户浏览器中的小型文本数据，通常用于保存用户会话信息、个性化设置以及跨页面的数据共享。它是Web服务器与客户端浏览器之间的一种状态管理机制，常用于爬虫的会话凭证。查看方式：打开网站-登录-打开开发正工具-点击网络-刷新-点击一个包-查看表头（有的需要禁用缓存才能看见）2.Cookie的作用会话管理：如用户登录状态的保持。个性化设置：存储用户偏好，如主题、
小红书app复制链接转换为直接可访问链接，网页版链接，小红书短链转长链（最新版）才华是浅浅的耐心 python 爬虫开发语言
简介：小红书手机app分享的链接需要点击才能获取完成链接，本文教大家如何通过代码的方式将xhs的短连接转化为长链接。1.正常我们分享的链接是这样的：44小猪吃宵夜发布了一篇小红书笔记，快来看吧！KeA1GIGiSMXGWy7http://xhslink.com/a/sT7omKb6ijX6，复制本条信息，打开【小红书】App查看精彩内容！转换后是这样的：https://www.xiaohongsh
推特关键词爬虫Python实现最新版（2025.2.20）才华是浅浅的耐心爬虫 python 开发语言
引言随着各类自媒体平台的兴起，数据挖掘和分析变得尤为重要。推特作为全球最大的自媒体平台，越来越来越多的人需要通过爬取其内容进行分析。然后自从马斯克接手推特之后，推特api不可再用，推特的反爬力度也在逐渐增强。今天小编就分享一个推特爬虫的教程。描述这篇文章主要通过关键词爬取帖子内容信息以及帖子作者主页相关信息，用户也可根据自己需要的时间段进行筛选。推特可支持筛选多种语言，我这里先展示中文和英文的。字
Fastdfs-V5.11使用docker部署集群(X86) 礁之 Linux系列 dfs java docker
文章目录一、Fastdfs介绍二、部署信息三、步骤tracker/storage机器的compose内容storage机器的composetracker与storage启动目录层级与配置文件client.confstorage.conf查看集群信息测试测试集群扩容与缩减nginx配置一、Fastdfs介绍FastDFS是一款高性能的分布式文件系统，特别适合用于存储和管理大量的文件二、部署信息使用d
基于Python拉取tiktok直播视频流，并将视频流切割成一定时长的视频片段 sh_moranliunian 蜘蛛侠网络爬虫后端 python 爬虫
通过访问tiktok的直播间网页，从网页的script标签内部提取出关于该直播间的相关信息的JSON串，最终从JSON里提取出直播视频流的hls地址和直播间的其他信息。importsysimportrequestsimportjsonimporttimeimportsubprocessfromurllib.parseimporturlunparsefrombs4importBeautifulSou
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他