codingClaire

2019川大新生数据可视化（python wordcloud + echarts）

8月底和同学一起为川大新生制作了一个新生数据可视化的推送。这篇推送中插入的图片，主要使用了python的wordcloud制作词云，用echarts中的一些图表。这篇博客主要会记录一下我制作的部分。

- 一、wordcloud制作姓名词云
- - 1.Anaconda下安装wordcloud模块
  - 2.导入模块
  - 3. 处理数据
  - - 1）处理名字
    - 2）处理姓氏
  - 4.生成词云
- 二、用Python处理数据
- - - 1) 处理日期
    - 2）其他数据转换成json数组
- 三、echarts制作其他图表
- - 1.矩形树图(Treemap)制作专业人数分布图
  - 2.桑基图(Sankey)制作年龄流动图
  - 3.柱状图制作男女比例图
- 四、设计与配色
- 五、总结

一、wordcloud制作姓名词云

1.Anaconda下安装wordcloud模块

如果没有安装wordcloud，可以在官网下载whl文件。下载好文件后，使用Anconda命令行，切到whl所在的文件目录，输入命令行：pip install wordcloud-1.5.0-cp36-cp36m-win_amd64.whl，然后安装成功后就可导入该模块了。

2.导入模块

要制作词云，主要需导入wordcloud,matplotlib这两个模块。

#!/usr/bin/python
# -*- coding: UTF-8 -*-
#导入wordcloud模块和matplotlib模块
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS
import matplotlib.pyplot as plt
from scipy.misc import imread
import chardet

3. 处理数据

由于当时得到的excel表格中，学生包括新疆、西藏等民族，姓名不是普通的姓+名的结构，给姓名的处理带来了一定困难。因此没有统计他们的姓氏。当时不了解python也可以处理excel，于是是将姓名按行存入一个txt文件，再通过python进行处理。

1）处理名字

#读取原始的姓名txt文件
fileObj = open('name4.txt','r',encoding='UTF-8-sig')
ming=[]
#按行读取,姓名是三个字的同学的姓删除
line=fileObj.readline()
while line:
    line=line.strip('\n')
    if (len(line)<=4 and len(line)>0):
        line=line.replace(line[0],"")
    ming.append(line)
    line=fileObj.readline()
m="".join(ming)
print(ming)
fileObj2 = open('ming.txt', 'w', encoding='utf-8')
fileObj2.write(m)
fileObj2.close()

# 姓名全部以单字形式排列，并存入新的文档
name=open('ming.txt','r',encoding='UTF-8').read()

name=name.replace('·','')
name=name.replace('\n','')

result=[]
for i in name:
    result.append(i)
    result.append(" ")

s = "".join(result) #列表转字符串

save = open('name7.txt', 'w', encoding='utf-8')
save.write(s)
save.close()

得到处理的结果：

2）处理姓氏

# 姓

fileObj = open('name4.txt','r',encoding='UTF-8-sig')
surname=[]
line=fileObj.readline()
while line:
    line=line.strip('\n')
    if (len(line)<=4 and len(line)>0):
        surname.append(line[0])
        surname.append(" ")
    line=fileObj.readline()
sur="".join(surname)
print(surname)
fileObj2 = open('surname.txt', 'w', encoding='utf-8')
fileObj2.write(sur)
fileObj2.close()

得到处理的结果：

4.生成词云

处理完名和姓的结果后，就可以使用wordcloud函数来绘制词云。当时遇到了一个问题就是词云只能生成两个字及以上的词云，对于单个字会认为这不是一个词。解决办法是修改参数中的regexp（正则表达式）有regexp=r"\w[\w']*"，这样wordcloud就会将单字也认为是词，从而生成字云。
除此之外还使用到了以下几个参数：

mask：设置为pic是为了让生成的词云具有图片的形状。#FFFFFF是不会显示字的，因此如果画面背景不是纯白也会显示字。
prefer_horizontal：这个属性是让竖直的字的出现概率为1，因此词云的所有字都是竖直排列的，可读性会更强。
background_color=None和mode=‘RGBA’ ：这两个一起设置，能够让图片的背景是透明的。（这里主要是需要和美工交接，让她帮忙上一个底色）
stopwords：停止词，因为处理数据是先生成了姓，因此当时考虑将姓作为停止词（也就是不会出现在词云上），但鉴于有些姓同样会出现在名字中，会影响准确性，因此并没有这样做。

#读入处理过的姓名文件
text2= open('name7.txt','r',encoding='UTF-8').read()
#读入背景图片
pic = imread('panda16.png')
#生成词云
cloud = WordCloud(mask=pic,prefer_horizontal=1,#width=800,height=800,
                  font_path='C:\\Windows\\Fonts\\Nk728iWCZ.TTF',
                  background_color=None,scale=5,regexp=r"\w[\w']*",
                  max_font_size = 100,mode='RGBA') #,stopwords=stop)
cloud.generate(text2)
image_colors = ImageColorGenerator(pic)
cloud.recolor(color_func=image_colors)
#显示词云图片
plt.imshow(cloud)
plt.axis('off')
plt.show()
#保存图片
cloud.to_file('test26.png')

最后生成的词云如下：

二、用Python处理数据

除了用python处理词云之外，python还用于处理一些数据，比如将数据从excel格式调成json格式(便于echarts使用）。当然，当时我python处理excel文件还不太熟，因此整个处理数据（包括年龄、星座等制作后面的表格时使用到的数据）的步骤可以归纳为以下的几点：
1.在excel中用数据透视表进行统计，然后将得到的结果以txt文本保存。
2.在notepad进行简单的查找替换，将文件编码设置为utf-8。
3.转化为json数组时通过python读取txt文件，然后对其进行相应的处理，得到符合要求的json数组。
（当然后续知道可以直接在excel中转json，不过写数据处理的代码也算是让我更熟悉了python)

这里放部分的代码：

1) 处理日期

因为生日的日期有多种格式（斜杠、全数值、横杠），为了让他们格式相同，所以进行了处理。

while line:
    if(line.find('/')>=0):
        print(line)
        line=line.replace('/','-')
        fileObj2.write(line)   
    elif(line.find('-')<0):
        line_list=[]
        line_list=list(line)
        line_list.insert(4,'-')
        print(line_list)
        line_list.insert(7,'-')
        print(line_list)
        newline="".join(line_list)
        print(newline)
        fileObj2.write(newline) 
    else:
        fileObj2.write(line)
    line=fileObj.readline()
fileObj2.close()

2）其他数据转换成json数组

这是用来生成桑基图中的links中的数组。

while line:   
    index=line.find('\n')
    blank=line.find(' ')
    line_list = list(line)
    line_list.insert(index+1,"},")
    line_list.insert(0,"{ 'name':'")
    line_list.insert(blank+2,"',\n")
    line_list.insert(blank+3,"value:")
    
    print(line_list)
    #转回字符串
    newline=''.join(line_list)
    print(newline)
    fileObj2.write(newline) 
    line=fileObj.readline()
fileObj2.close()

三、echarts制作其他图表

1.矩形树图(Treemap)制作专业人数分布图

在这张图中，主要通过矩形的大小来映射专业的人数多少。图片的尺寸考虑到看推送的清晰度问题，因此设置得较长。

在做的时候，遇到的问题主要是字体不能够换行以及调整字体大小的问题。
解决办法是用：series->upperLable->normal加入formatter: '{b}',，然后通过data中的name进行换行处理（由于矩形树图的特殊性，为了让排版更好看，手动对每一个需要换行的name进行了换行）。

series->levels中的两个元素分别表示的是学院层和学院下的专业层的不同设置。

var myChart = echarts.init(document.getElementById('treemap'));
option = {
    series: [{
        type: 'treemap',
        data: [
            {
                name: '材料科学与工程学院',          
                value: xxx,
                children: [{
                    name: '材料类', 
                    value: xx,
                }, {
                    name: '生物医学工程',        
                    value: xx
                }]
                //每一个学院下的专业
            },
        ],
        upperLabel:{
            normal:{
                ellipsis:false,
                color: '#555',
                show:true,
                fontSize:10,
                fontWeight:'bold',
                formatter: '{b}',
                backgroundColor:'#e6eae3'
            }
        },
        levels:[
            {
                color:['#5bbdc8','#83ccd2','#7ebea5','#ffefa1'],
                itemStyle: {
                    normal: {
                        borderColor:'#e6eae3',
                        borderWidth: 6,
                        gapWidth: 5
                    }
                }
            },
            {
                itemStyle: {
                    normal: {
                        borderColor:'#e6eae3',
                        borderWidth: 4,
                        gapWidth: 1
                    }
                }
            },
        ],
        label:{
            position:'insideLeft',
            ellipsis:false,
            color: '#555',
            fontWeight:'bold',
            fontSize:13,
            formatter:'{b}',
        }
    }]
};
myChart.setOption(option);

2.桑基图(Sankey)制作年龄流动图

从桑基图中，能够看到不同年龄占男女生总人数的比例，以及占学院总人数的比例。
在制作桑基图时，主要遇到的问题是：年龄最小/大的人数过少，表现在echarts的图表中就会发现根本无法选中和显示出来，为了解决这个问题，将series->data->itemStyle->borderWidth中的数值改大（即增大边框宽度），这样就能够正常显示和交互了。

option = {
    series: {
        type: 'sankey',
        layout: 'none',
        layoutIterations: 0,
        nodeWidth: 30,
        nodeGap: 10,
        height: 300,
        focusNodeAdjacency: 'allEdges',
        orient: 'vertical',
        label: {
            show: true,
            position: 'bottom',
            //[-10,60],
            formatter: function(val) {
                //x轴的文字改为竖版显示
                var str = val.name.split("");
                return str.join("\n");
            },
        },
        data: [{
            name: '14岁',
            itemStyle: {
                color: '#e95295',
                borderWidth: 6,
                borderColor: '#e95295',
                opacity: 1,
            },
        },
        //其余每一个年龄除了color的设置之外，其他都是相同的
        {
            name: '材料科学与工程学院',
            itemStyle: {
                color: '#595857',
                borderWidth: 0,
            },
        },
        //其他所有学院的格式都如上所示
        {
            name: '男',
            itemStyle: {
                color: '#595857',
            },
        },
        {
            name: '女',
            itemStyle: {
                color: '#595857',
            },
        }],
        
        links: [{
            source: '男',
            target: '15岁',
            value: 7,
        },
        /*...
        男和女两种性别和到每一个年龄的所有link
        此处不公开数据*/
        {
            source: '15岁',
            target: '材料科学与工程学院',
            value: 1
        },
          /*...
          每一个年龄流动到每一个学院的所有link
        此处不公开数据*/
        ],
        lineStyle: {
            normal: {
                color: 'source',
                curveness: 0.75
            }
        }
    },
};
// 使用刚指定的配置项和数据显示图表。
myChart.setOption(option);

3.柱状图制作男女比例图

柱状图制作的比较顺利。右侧的数值可以通过设置两个y轴来解决。另外，圆角的柱状图可以在series->itemStyle->barBorderRadius中设置圆角的半径。

var myChart = echarts.init(document.getElementById('gendermap'));

option = {
    backgroundColor: '#fff',
    tooltip: {
        trigger: 'axis',
        axisPointer: {// 坐标轴指示器，坐标轴触发有效
            type: 'shadow'        
            // 默认为直线，可选为：'line'或'shadow'
        }
    },
    legend: {
        data: ['男生', '女生'],
    },
    grid: {
        left: '3%',
        right: '4%',
        bottom: '3%',
        containLabel: true
    },
    yAxis: [
        {
            type: 'category',
            data: ['外国语学院',
                '文学与新闻学院',
                ...],
                /*这里存储的是图中左侧显示的每一个学院
                为了减少篇幅就不写完了*/
            splitLine: {
                show: true,
                ineStyle:{type:'dashed'}
                },
            axisLine: {
                lineStyle: {
                    color: '#000',
                }
            },
            axisLabel: {
                color: '#000',
                fontSize:15
            }
        },
        {
            type: 'category',
            data: ['0.24:1',...],
            /*这里存储的是图中右边显示的所有的比例（用字符串存储）
            为了减少篇幅就不写完了*/
            text:'男女比',
            splitLine: {
                show: false
            },
            axisLine: {
                lineStyle: {
                    color: '#000',
                }
            },
            axisLabel: {
                color: '#000',
                fontSize:15
            }
        }

    ],
    xAxis: [
        {
            show: false,
            type: 'value',
        }
    ],
    series : [
        {
            name:'女生',
            type:'bar',
            stack: '总量',
            data:[],
            /*这里的data包括每一个学院的女生的数量
            此处就不公开该数据了*/
            itemStyle: {
                barBorderRadius: 20,
                //设置柱形的圆角，可以设置该半径
                color: new echarts.graphic.LinearGradient(0, 0, 0, 1, [{
                    offset: 0.4,
                    color: "#ffefa1"
                },

                ])
            },
        },
        {
            name:'男生',
            type:'bar',
            stack: '总量',
            data:[],
            /*这里的data包括每一个学院的男生的数量
            需要将数量取成负数
            这样能够让男女数量分布在坐标轴的两边（中轴对齐）*/
            itemStyle: {
                barBorderRadius: 20,
                color: new echarts.graphic.LinearGradient(0, 0, 0, 1, [{
                    offset: 0.4,
                    color: "#5bbdc8"
                },
                ])
            },
        }
    ]
};

if (option && typeof option === "object") {
    myChart.setOption(option, true);
}

四、设计与配色

使用了echarts和python，可视化看上去的确没有什么难度，但如果说要做出来能够放在推送上的视觉美观的作品，就不得不考虑设计和配色了。
首先是两个姓氏和名字的词云，大川的美工小姐姐基于原图，帮我们画了底色，让整个图案变得更鲜明。
其次，最初我们制作的图表的风格不统一，配色也非常混乱。在讨论后我们选择用了蓝色和黄色作为两种主色调。在这个基础上做好的图都要重新换一身衣服。当看到统一的配色的时候，风格自然地就融入在一起了。
关于配色当时我们参考了一些网站，包括配色方案，还有其他的一些网上常见的有RGB值的色卡，最后定下来颜色。

五、总结

这个可视化推送我们断断续续做了一周左右。因为我python其实不算熟，做词云、数据处理的时候是边学边做，绕了不少弯路，配色那里也是反复修改，每张图都是十几稿，词云生成了差不多三十张（笑哭）。不过总算也将一个相对成熟的可视化作品完成了，3万点击量和很多令人感动的留言真的是让人成就感满满呐。
还有一点我很惊讶，我司空见惯，甚至觉得有点难看的echarts，在不是计算机专业的美工看来非常稀奇，希望更多不是计算机的人也能使用这些可视化工具，如果这篇文章能有些帮助的话，那就太好了。

鸿蒙开发：自定义一个Toast egzosn
前言代码案例基于Api13。系统的toast已经可以满足大部分的场景了，而且使用起来也是十分的简单，可以修改很多的可配置属性，简单的使用代码如下：登录后复制promptAction.showToast({message:"toast提示"})1.但是偏偏有一点实现不了，那就是圆角度数的设置，还有就是和icon结合使用的场景也无法满足，为了更好的适配UI的设计图，那么自定义一个Toast是在所难免的
C++中map和set的详解程序员Hagei c++算法开发语言
C++中map和set的介绍与使用在C++编程中，map和set是标准模板库（STL）中两种非常重要的关联容器。它们基于平衡二叉搜索树（通常是红黑树）的数据结构来实现，提供了高效的数据存储和检索功能。本文将详细介绍map和set的特点、用法以及一些常见的操作示例。一、map的介绍与使用1.map的基本概念map是一个键值对容器，其中每个键都是唯一的，且按照升序排序。map的内部结构是红黑树，这使得
堆数据结构：从基础原理到高效算法实现的技术探讨 Everyrt 课程设计
摘要堆作为一种特殊的树形数据结构，在多种算法场景中发挥着核心作用。本文深入剖析堆的基础原理，详细阐述堆的构建、插入、删除等操作的实现细节，并探讨其在优先队列、堆排序等高效算法中的应用，助力读者全面掌握堆数据结构及其应用技术。一、引言堆数据结构以其独特的特性，能够高效地获取集合中的最大（或最小）元素。无论是操作系统中的进程调度，还是搜索算法中的最优解筛选，堆都扮演着不可或缺的角色。理解堆的原理与实现
C语言基础与进阶学习指南（附运行效果图及术语解析）算法练习生 C语言 c语言开发语言
C语言基础与进阶学习指南（附运行效果图及术语解析）目录C语言标准与编译流程CPU与内存基础C语言基础语法数据类型详解变量与内存管理运算符与表达式输入输出函数函数与内存管理指针与内存操作结构体与高级应用1.C语言标准与编译流程1.1C语言标准演进K&RC（1978）：最初由DennisRitchie和BrianKernighan开发，无标准，依赖文档。ANSIC/C89（1989）：首个国际标准，定
CAD开发经验总结我的sun&shine CAD二次开发 c++
作为一个拥有三年CAD二次开发经验的C++程序员，今天将积累的经验总结整理了一下，希望对二次开发人员有帮助，一个word文档，放到下载里面了，挣点积分，文档目录截个图
算法设计与分析4（变治法） songx_99 算法设计与分析算法
变治法将问题转化为一个或数个有一定关联当形式上不同的更加简单或更加好解决的子问题。变治法的应用：预排序思想用预排序可以简化许多问题，如检查元素唯一性，检查出现次数最多的元素等堆算法堆的定义首先它是一个完全二叉树，完全二叉树表明树的每一层都是满的，只有最后一层最右边的元素有可能缺位。且父结点的值大于它的两个子节点，则称是一个大根堆，若值小于两个子节点，称小根堆堆化有向下调整，向上调整两种，大致思路相
Shell 脚本：自动化运维的利器 Waitccy linux 服务器运维
Shell脚本：自动化运维的利器一、引言在计算机的世界里，效率就是一切。当我们需要频繁执行一系列命令时，手动输入不仅繁琐，还容易出错。Shell脚本就是为解决这类问题而生的强大工具。它允许用户将一系列的命令组合在一起，形成一个可执行的脚本文件，从而实现自动化任务，提高工作效率。无论是系统管理员进行服务器维护，还是开发者进行项目部署，Shell脚本都发挥着重要的作用。本文将详细介绍Shell脚本的基
JavaScript基础-DOM事件流難釋懷 javascript 开发语言
在Web开发过程中，理解和掌握DOM事件流是实现高效交互的关键。DOM事件流描述了当一个事件发生时，它在文档树中的传播路径。了解事件流的概念有助于我们更精确地控制事件处理逻辑，避免不必要的行为，并提升用户体验。本文将深入探讨DOM事件流的基本概念，包括事件捕获、目标阶段和事件冒泡，并通过示例展示如何应用这些知识。一、什么是DOM事件流？DOM事件流是指事件在整个页面结构中传播的过程。根据W3C标准
[解决方案]word文档无法存放过长过大的visio图片狮子再回头其他应用 visio word office UML
一：问题描述visio-UML画的流程图过长了，复制黏贴到word，一页无法显示全二：解决办法1.选择文档内容，工具栏“开始”——“段落”——“行距”——“单倍行距”，注意不能为固定值；2.选择“插入”---“对象”--“由文件创建”，如下图再选择浏览，打开自己的visio文件，确定。visio文件插入后，可能显示过大或不全，点击“图片工具”。调整下拉框中的高度/宽度，直到显示全visio图片.
基于PyCATIA的工程图视图锁定工具开发实战解析 Python×CATIA工业智造 CATIA二次开发 python 自动化
引言本文针对CATIA工程图设计中视图误操作问题，基于PySide6与PyCATIA库开发了一款轻量化视图锁定工具。通过Python二次开发实现全视图/选定视图快速锁定、非模态交互界面及状态实时反馈功能，有效提升大型装配体工程图操作效率。文章深度解析代码架构设计、关键技术实现及工程应用价值，提供完整的开发方法论。一、工具功能与工程应用场景1.1核心功能模块功能模块技术指标应用场景全视图锁定批量操作
松下空调全国售后服务指南及维修 2503_90926332 eclipse
松下空调全国官网售后服务点热线号码4OO-675-8161故障报修：4OO-675-8161服务为先，满意为念，服务无/极/限，真/诚/到永远。讲诚信、树新风、诚以待人、信以立世、认真负责、精益求精、积极热情，本公司为厂家全国维修服务!全/天候、全/天蔬诚为您服务。维修服务网点致力于为客户摄供及时、专/业、用心的佳服务,让千万家庭/感/受/到“家”的感觉!!维修服务承/诺:1、严格按照维修及操作规
python函数闭包和递归_python函数基础3--闭包 + 递归 + 函数回调 weixin_39532019 python函数闭包和递归
一、闭包1.函数嵌套defouter():print("外层函数")definner():print("内层函数")returninner()outer()函数嵌套流程图2.闭包闭包的表现形式：函数里面嵌套函数，外层函数返回内层函数的函数名，这种情况就称之为闭包defouter():print("外层函数")definner():print("内层函数")returninnerret=outer(
线性代数-MIT 18.06-汇总儒雅的钓翁数学基础线性代数矩阵
第一讲：方程组的几何解释第二讲：矩阵消元第三讲：乘法和逆矩阵第四讲：AAA的LULULU分解第五讲：转换、置换、向量空间R第六讲：列空间和零空间第七讲：求解Ax=0Ax=0Ax=0，主变量，特解第八讲：求解Ax=bAx=bAx=b：可解性和解的结构第九讲：线性相关性、基、维数第十讲四个基本子空间第十一讲：矩阵空间、秩1矩阵和小世界图第十二讲：图和网络第十三讲：复习一第十四讲：正交向量与子空间第十五
华为OD机试 - 宜居星球改造计划 - 图的多源BFS（Python/JS/C/C++ 2023 B卷 100分）哪吒华为od 宽度优先 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述2XXX年，人类通过对火星的大气进行宜居改造分析，使得火星已在理
华为OD机试 - 红黑图（Python/JS/C/C++ 2023 B卷100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述众所周知红黑树是一种平衡树，它最突出的特性就是不能有两个相邻的红
华为OD机试 - 寻找最富裕的小家庭（Python/JS/C/C++ 2024 D卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述在一棵树中，每个节点代表一个家庭成员，节点的数字表示其个人的财富
医疗旅游发展方案 cainiaojunshi 旅游软件思路预算方案
一、策划目标在深入剖析医疗旅游市场环境的基础上，设计出针对中低端市场的医疗旅游产品，通过有效的冷启动推广策略，实现项目的初步盈利与客户积累，逐步树立专业品牌形象，建立客户信任机制，形成可复制、可规模化的商业模式。二、医疗旅游发展环境分析（一）费用对比以根管治疗为例，国内外费用差异显著。以下通过表格对比能更直观呈现：项目国内费用（人民币）国外（以美国为例）费用（人民币）根管治疗费用500-2000元
3.19学习总结 2402_88131930 学习
学习了Java中的面向对象的知识点完成一道算法题，找树左下角的值，错误的以为左下角只能是最底层的左节点，但指的是最底层最左边的节点
【从零开始学习JAVA】异常体系介绍 Cools0613 从0开始学Java 学习
前言：本文我们将为大家介绍一下异常的整个体系，而我们学习异常，不是为了敲代码的时候不出异常，而是为了能够熟练的处理异常，如何解决代码中的异常。异常的两大分类：我们就以这张图作为线索来详细介绍一下Java中的异常：1.Exceptions（异常）在Java中，Exception（异常）是一种表示非致命错误或异常情况的类或接口。Exception通常是由应用程序引发的，可以被程序员捕获、处理或抛出。E
栈力扣hot100热门面试算法题面试基础核心思路背题滑动窗口最大值字符串解码每日温度柱状图中最大矩形有效的括号最小栈尘土哥算法 leetcode 面试
栈栈的核心思路：每个数都要进栈or队列，但是要及时维护栈or队列，当某元素没有存在的意义时就删掉，关键是思考栈尾什么时候有用与没用。滑动窗口最大值https://leetcode.cn/problems/sliding-window-maximum/题解链接https://leetcode.cn/problems/sliding-window-maximum/solutions/3067170/d
通过 Kibana 操作 Elasticsearch：从入门到实践格子先生Lab elasticsearch 大数据搜索引擎
引言Kibana是Elasticsearch的可视化工具，提供了一个用户友好的界面来管理和操作Elasticsearch中的数据。通过Kibana，你可以轻松地执行数据搜索、创建可视化图表、构建仪表盘等操作。本文将带你从零开始学习如何通过Kibana操作Elasticsearch，掌握其基本功能和进阶操作。1.Kibana简介1.1什么是Kibana？Kibana是一个开源的数据可视化工具，专为E
在 Linux 中，lsblk 命令输出内容解释冷冷清清中的风风火火 linux 运维服务器
在Linux中，lsblk命令用于以树状结构列出所有块设备（如磁盘、分区、LVM逻辑卷等）的信息。以下是lsblk输出的详细解释和示例：1.示例输出NAMEMAJ:MINRMSIZEROTYPEMOUNTPOINTSsda8:00238.5G0disk├─sda18:10512M0part/boot/efi├─sda28:201G0part/boot└─sda38:30237G0part└─vg-
Neo4j GDS-02-graph-data-science 插件库安装实战笔记老马啸西风 neo4j neo4j 笔记数据库图数据结构算法
neo4japoc系列Neo4jAPOC-01-图数据库apoc插件介绍Neo4jAPOC-01-图数据库apoc插件安装neo4jonwindows10Neo4jAPOC-03-图数据库apoc实战使用使用Neo4jAPOC-04-图数据库apoc实战使用使用apoc.path.spanningTree最小生成树Neo4jAPOC-05-图数据库apoc实战使用使用labelFilterNeo4
Neo4j GDS-02-graph-data-science 简单聊一聊图数据科学插件库老马啸西风 neo4j neo4j 数据库算法图数据库开源
neo4japoc系列Neo4jAPOC-01-图数据库apoc插件介绍Neo4jAPOC-01-图数据库apoc插件安装neo4jonwindows10Neo4jAPOC-03-图数据库apoc实战使用使用Neo4jAPOC-04-图数据库apoc实战使用使用apoc.path.spanningTree最小生成树Neo4jAPOC-05-图数据库apoc实战使用使用labelFilter详细介绍
TreeNode底层实现原理 zhglhy 开发语言 java
TreeNode是树结构的基本单元，通常用于表示树形数据结构中的节点。其底层实现原理涉及以下几个方面：1.TreeNode的基本结构在Java中，TreeNode通常是一个类，包含以下核心属性：数据域：存储节点的数据。子节点引用：指向子节点的引用（对于二叉树，通常是左子节点和右子节点）。父节点引用：指向父节点的引用（可选，取决于具体实现）。以下是一个典型的二叉树节点的实现：classTreeNod
LLM 大模型技术知识最佳学习路径图发布！ AGI-杠哥学习人工智能语言模型 agi 自然语言处理
近日，经常有小伙伴私信我，大模型知识太多了，有点懵啊，我该如何学习LLM大模型？今天我们就来剖析下LLM大模型技术知识的学习路径。如果你是一个LLM大模型的“技术小白”，我们建议的学习路径如下：技术交流群前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~我们建了大模型技术与面试交流群
【Python】 Stacking: 强大的集成学习方法音乐学家方大刚 Python python 集成学习开发语言
我们都找到天使了说好了心事不能偷藏着什么都一起做幸福得没话说把坏脾气变成了好沟通我们都找到天使了约好了负责对方的快乐阳光下的山坡你素描的以后怎么抄袭我脑袋想的薛凯琪《找到天使了》在机器学习中，单一模型的性能可能会受到其局限性和数据的影响。为了解决这个问题，我们可以使用集成学习（EnsembleLearning）方法。集成学习通过结合多个基模型的预测结果，来提高整体模型的准确性和稳健性。Stacki
使用Seaborn库中的`violinplot`函数绘制水平小提琴图（Violin Plot）是一种常见的数据可视化方法 code_welike 信息可视化数据分析数据挖掘 Python
使用Seaborn库中的violinplot函数绘制水平小提琴图（ViolinPlot）是一种常见的数据可视化方法。水平小提琴图可以展示数据的分布特征，并可以对比不同组别之间的差异。本文将介绍如何使用Python和Seaborn库绘制水平小提琴图，并提供相应的源代码示例。首先，我们需要确保已经安装了Seaborn库。可以使用以下命令在Python中安装Seaborn：pipinstallseabo
Stacking算法：集成学习的终极武器 civilpy 算法集成学习机器学习
Stacking算法：集成学习的终极武器在机器学习的竞技场中，集成学习方法以其卓越的性能而闻名。其中，Stacking（堆叠泛化）作为一种高级集成技术，更是被誉为“集成学习的终极武器”。本文将带你深入了解Stacking算法的原理和实现，并提供一些实战技巧和最佳实践。1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基模型，并将它们的预测结果作为新模型的输入特征，以此来
直方图梯度提升：大数据时代的极速决策引擎万事可爱^ 大数据机器学习深度学习直方图梯度提升 GBDT 算法
一、为什么需要直方图梯度提升？在Kaggle竞赛的冠军解决方案中，超过70%的获奖方案都使用了梯度提升算法。但当数据量突破百万级时，传统梯度提升树（GBDT）面临三大致命瓶颈：训练耗时剧增：每个特征的分割点计算都需要全量数据排序内存消耗爆炸：存储排序后的特征值需要额外空间处理效率低下：无法有效利用现代CPU的多核特性而梯度提升决策树（GBDT）作为集成学习的代表算法，通过迭代构建决策树实现预测能力
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后