u010022051

PySpark处理数据并图表分析

http://www.aboutyun.com/thread-18150-1-1.html

PySpark简介

官方对PySpark的释义为：“PySpark is the Python API for Spark”。也就是说pyspark为Spark提供的Python编程接口。
Spark使用py4j来实现python与java的互操作，从而实现使用python编写Spark程序。Spark也同样提供了pyspark，一个Spark的python shell，可以以交互式的方式使用Python编写Spark程序。如：

[Python] 纯文本查看复制代码

 
     ? 
    
 
      
        
        
          from 
          pyspark  
          import 
          SparkContext 
         
 
              
          sc 
          = 
          SparkContext( 
          "local" 
          , 
          "Job Name" 
          , pyFiles 
          = 
          [ 
          'MyFile.py' 
          , 
          'lib.zip' 
          , 
          'app.egg' 
          ]) 
         
 
              
          words 
          = 
          sc.textFile( 
          "/usr/share/dict/words" 
          ) 
         
 
              
          words. 
          filter 
          ( 
          lambda 
          w:w.startswith( 
          "spar" 
          )).take( 
          5 
          ) 
         
 
      
 
    

PySpark文档主页界面：

PySpark是构建在Java API之上的，如下图：

处理数据并图表分析

下面我通过PySpark对真实的数据集进行处理，并作图形来分析。首先我需要介绍下数据集以及数据处理的环境。

数据集

MovieLens数据集是由Minnesota大学的GroupLens Research Project对电影评分网站(movielens.umn.edu)收集的，数据集包含了1997年9月19日到1998年四月22日间共七个月的数据。这些数据已经被处理过了（清除了那些评分次数少于20次以及信息没有填写完整的数据）

MovieLens数据集：

MovieLens数据集，用户对自己看过的电影进行评分，分值为1～5。MovieLens包括两个不同大小的库，适用于不同规模的算法．小规模的库是943个独立用户对1682部电影作的10000次评分的数据（我是用这个小规模作数据处理和分析）；通过对数据集分析，为用户预测他对其他未观看的电影的打分，将预测分值高的电影推荐给用户，认为这些电影是用户下一步感兴趣的电影。

数据集结构：

1、943个用户对1682场电影评分，评判次数为100000次，评分标准：1~5分。

2、每位用户至少评判20场电影。

3、简单地统计了用户的一些信息 (age, gender, occupation, zip)

数据用途：

供科研单位和研发企业使用，可用于数据挖掘、推荐系统，人工智能等领域，复杂网络研究等领域。

数据处理的环境

Hadoop伪分布环境
Spark Standalone环境
Anaconda环境：（下载地址：https://www.continuum.io/downloads）
Anaconda Python 是 Python 科学技术包的合集，包含超过400个流行的科学计算、数学、工程以及数据分析用的包。这里我主要是用它的一些包，免得自己装一些Python包麻烦。

其他：

处理一（用户年龄统计分析）

处理一简介：

通过对用户数据处理，获得用户信息中的年龄。然后对年龄进行统计并使用Python中的图形框架Matplotlib生成柱状图，最后通过柱状图分析观看电影的观众年龄分布趋势。

处理一所有代码：

[Plain Text] 纯文本查看复制代码

 
      ? 
     
           #加载HDFS上面的用户数据 
          
           user_data = sc.textFile("hdfs:/input/ml-100k/u.user") 
          
           #打印加载的用户信息第一条 
          
           user_data.first() 
          
           #用"|"分割符分割每一行的数据，然后将数据返回到user_fields 
          
           user_fields = user_data.map(lambda line: line.split("|")) 
          
           #统计总的用户数 
          
           num_users = user_fields.map(lambda fields: fields[0]).count() 
          
           #统计性别的种类数，distinct()函数用来去重。 
          
           num_genders = user_fields.map(lambda fields:fields[2]).distinct().count() 
          
           #统计职位种类数 
          
           num_occupations = user_fields.map(lambda fields:fields[3]).distinct().count() 
          
           #统计邮政编码种类数 
          
           num_zipcodes = user_fields.map(lambda fields:fields[4]).distinct().count() 
          
           #打印统计的这些信息 
          
           print "Users: %d, genders: %d, occupations: %d, ZIP codes: %d" % (num_users, num_genders, num_occupations, num_zipcodes) 
          
           #统计用户年龄 
          
           ages = user_fields.map(lambda x: int(x[1])).collect() 
          
           #通过python中的matplotlib生成图表提供给分析师分析 
          
           import matplotlib.pyplot as plt 
          
           hist(ages, bins=20, color='lightblue', normed=True) 
          
           fig = plt.gcf() 
          
           fig.set_size_inches(16, 10) 
          
           plt.show()

进入Spark安装目录的，然后输入如下命令开启pyspark:

[Shell] 纯文本查看复制代码

 
      ? 
     
           . 
           /bin/pyspark

之后加载HDFS上面的用户数据（u.user)，然后通过user_data.first()打印第一条数据显示数据格式。

统计的HDFS上面的所有用户信息：总共943位用户、男女两种性别、21中职位、795个不同的邮政编码。

Matplotlib是一个Python的图形框架，下面为matplotlib工作过程的打印信息：

Matplotlib对统计后的数据图形化显示：

用户年龄分布图：

结论：

通过生成的柱状图我们可以看出这些电影观众年龄段趋于青年，并且大部分用户年龄都在15到35之间。

处理二（用户职位统计分析）

处理二简介：

首先对用户数据处理，获得用户信息中的职位种类以及每种职位用户个数。然后对职位进行统计并使用Python中的图形框架Matplotlib生成柱状图，最后通过柱状图分析观看电影的观众职位以及人数分布趋势。

处理二所有代码：

[Python] 纯文本查看复制代码

 
      ? 
     
 
       
         
         
           #处理职位那一列，通过类似于MapReduce经典例子WordCount处理过程处理职位 
          
 
           count_by_occupation 
           = 
           user_fields. 
           map 
           ( 
           lambda 
           fields: (fields[ 
           3 
           ], 
           1 
           )).reduceByKey( 
           lambda 
           x, y: x  
           + 
           y).collect() 
          
 
           #导入numpy模块 
          
 
           import 
           numpy as np 
          
 
           #获取用户职位，并作为柱状图的x轴数据显示 
          
 
           x_axis1 
           = 
           np.array([c[ 
           0 
           ] 
           for 
           c  
           in 
           count_by_occupation]) 
          
 
           #获取用户的各个职位数，并作为y轴数据显示 
          
 
           y_axis1 
           = 
           np.array([c[ 
           1 
           ] 
           for 
           c  
           in 
           count_by_occupation]) 
          
 
           #让x轴类别的显示按照y轴中每种职位的个数升序排序 
          
 
           x_axis 
           = 
           x_axis1[np.argsort(y_axis1)] 
          
 
           #y轴也是升序 
          
 
           y_axis 
           = 
           y_axis1[np.argsort(y_axis1)] 
          
 
           #设置柱状图中x轴范围以及width 
          
 
           pos 
           = 
           np.arange( 
           len 
           (x_axis)) 
          
 
           width 
           = 
           1.0 
          
 
           #将统计的职位信息使用matplotlib生成柱状图 
          
 
           from 
           matplotlib  
           import 
           pyplot as plt 
          
 
           ax 
           = 
           plt.axes() 
          
 
           ax.set_xticks(pos 
           + 
           (width  
           / 
           2 
           )) 
          
 
           ax.set_xticklabels(x_axis) 
          
 
           plt.bar(pos, y_axis, width, color 
           = 
           'lightblue' 
           ) 
          
 
           plt.xticks(rotation 
           = 
           30 
           ) 
          
 
           fig 
           = 
           plt.gcf() 
          
 
           fig.set_size_inches( 
           16 
           , 
           10 
           ) 
          
 
           plt.show() 
          
 
       
 
     

用户职位信息处理过程：

用户职位信息统计并生成柱状图：

用户职位分布图：

结论：

从最终生成的图表中，我们可以看出电影观众大部分都是student, educator, administrator, engineer和programmer。并且student的人数领先其他职位一大截。

处理三（电影发布信息统计分析）

处理三简介：

首先对用户数据处理，获得用户评价的电影发布时间信息。然后以1998年为最高年限减去电影发布的年限（数据集统计的时间为1998年）得到的值作为x轴，接着通过Python中的图形框架Matplotlib生成柱状图，最后通过柱状图分析当时电影发布时间趋势。
电影信息有一些脏数据，所以需要先作处理。

处理三所有代码：

[Python] 纯文本查看复制代码

 
      ? 
     
 
       
         
         
           #从HDFS中加载u.item数据 
          
 
           movie_data 
           = 
           sc.textFile( 
           "hdfs:/input/ml-100k/u.item" 
           ) 
          
 
           #打印第一条数据，查看数据格式 
          
 
           print 
           movie_data.first() 
          
 
           #统计电影总数 
          
 
           num_movies 
           = 
           movie_data.count() 
          
 
           print 
           "Movies: %d" 
            % 
            num_movies 
          
 
           #定义函数功能为对电影数据预处理，对于错误的年限，使用1900填补 
          
 
           def 
           convert_year(x): 
          
 
                
           try 
           : 
          
 
                    
           return 
           int 
           (x[ 
           - 
           4 
           :]) 
          
 
                
           except 
           : 
          
 
                    
           return 
           1900 
            # there is a 'bad' data point with a blank year,which we set to 900 and will filter out later 
          
 
           #使用"|"分隔符分割每行数据 
          
 
           movie_fields 
           = 
           movie_data. 
           map 
           ( 
           lambda 
           lines: lines.split( 
           "|" 
           )) 
          
 
           #提取分割后电影发布年限信息，并做脏数据预处理 
          
 
           years 
           = 
           movie_fields. 
           map 
           ( 
           lambda 
           fields: fields[ 
           2 
           ]). 
           map 
           ( 
           lambda 
           x:convert_year(x)) 
          
 
           #获取那些年限为1900的电影（部分为脏数据） 
          
 
           years_filtered 
           = 
           years. 
           filter 
           ( 
           lambda 
           x: x ! 
           = 
           1900 
           ) 
          
 
           #计算出电影发布时间与1998年的年限差 
          
 
           movie_ages 
           = 
           years_filtered. 
           map 
           ( 
           lambda 
           yr:  
           1998 
           - 
           yr).countByValue() 
          
 
           #将年限差作为x轴，电影数量作为y轴作柱状图 
          
 
           values 
           = 
           movie_ages.values() 
          
 
           bins 
           = 
           movie_ages.keys() 
          
 
           from 
           matplotlib  
           import 
           pyplot as plt1 
          
 
           plt1.hist(values, bins 
           = 
           bins, color 
           = 
           'lightblue' 
           , normed 
           = 
           True 
           ) 
          
 
           fig 
           = 
           plt1.gcf() 
          
 
           fig.set_size_inches( 
           16 
           , 
           10 
           ) 
          
 
           plt1.show() 
          
 
       
 
     

从HDFS上加载电影数据并打印第一条数据查看数据格式：

打印的电影数据格式：

打印的电影总数：

电影发布年限统计并生成柱状图：

电影发布年限分布图：（x轴为1998减去电影发布年限）

结论：

从最终生成的图表中，我们可以看出绝大多数电影发布时间都在1988-1998年之间。

处理四（用户评分统计分析）

处理四简介：

首先对用户数据处理，获得用户对电影的评分数，然后统计评分1-5的每个评分个数，然后绘制图表供分析。

处理四所有代码：

[Python] 纯文本查看复制代码

 
      ? 
     
 
       
         
         
           #从HDFS上面加载用户评分数据 
          
 
           rating_data 
           = 
           sc.textFile( 
           "hdfs:/input/ml-100k/u.data" 
           ) 
          
 
           print 
           rating_data.first() 
          
 
           #统计评分记录总数 
          
 
           num_ratings 
           = 
           rating_data.count() 
          
 
           print 
           "Ratings: %d" 
            % 
            num_ratings 
          
 
           #使用"\t"符分割每行数据 
          
 
           rating_data 
           = 
           rating_data. 
           map 
           ( 
           lambda 
           line: line.split( 
           "\t" 
           )) 
          
 
           #获取每条数据中的用户评分数集合 
          
 
           ratings 
           = 
           rating_data. 
           map 
           ( 
           lambda 
           fields:  
           int 
           (fields[ 
           2 
           ])) 
          
 
           #获取最大评分数 
          
 
           max_rating 
           = 
           ratings. 
           reduce 
           ( 
           lambda 
           x, y:  
           max 
           (x, y)) 
          
 
           #获取最小评分数 
          
 
           min_rating 
           = 
           ratings. 
           reduce 
           ( 
           lambda 
           x, y:  
           min 
           (x, y)) 
          
 
           #获取平均评分数 
          
 
           mean_rating 
           = 
           ratings. 
           reduce 
           ( 
           lambda 
           x, y: x  
           + 
           y)  
           / 
           num_ratings 
          
 
           #获取评分中位数 
          
 
           median_rating 
           = 
           np.median(ratings.collect()) 
          
 
           #每位用户平均评分 
          
 
           ratings_per_user 
           = 
           num_ratings  
           / 
           num_users 
          
 
           #每位用户评了几场电影 
          
 
           ratings_per_movie 
           = 
           num_ratings  
           / 
           num_movies 
          
 
           #打印上面这些信息 
          
 
           print 
           "Min rating: %d" 
            % 
            min_rating 
          
 
           print 
           "Max rating: %d" 
            % 
            max_rating 
          
 
           print 
           "Average rating: %2.2f" 
            % 
            mean_rating 
          
 
           print 
           "Median rating: %d" 
            % 
            median_rating 
          
 
           print 
           "Average # of ratings per user: %2.2f" 
            % 
            ratings_per_user 
          
 
           print 
           "Average # of ratings per movie: %2.2f" 
            % 
            ratings_per_movie 
          
 
           #获取评分数据 
          
 
           count_by_rating 
           = 
           ratings.countByValue() 
          
 
           import 
           numpy as np 
          
 
           #x轴的显示每个评分（1-5） 
          
 
           x_axis 
           = 
           np.array(count_by_rating.keys()) 
          
 
           #y轴显示每个评分所占概率，总概率和为1 
          
 
           y_axis 
           = 
           np.array([ 
           float 
           (c) 
           for 
           c  
           in 
           count_by_rating.values()]) 
          
 
           y_axis_normed 
           = 
           y_axis  
           / 
           y_axis. 
           sum 
           () 
          
 
           pos 
           = 
           np.arange( 
           len 
           (x_axis)) 
          
 
           width 
           = 
           1.0 
          
 
           #使用matplotlib生成柱状图 
          
 
           from 
           matplotlib  
           import 
           pyplot as plt2 
          
 
           ax 
           = 
           plt2.axes() 
          
 
           ax.set_xticks(pos 
           + 
           (width  
           / 
           2 
           )) 
          
 
           ax.set_xticklabels(x_axis) 
          
 
           plt2.bar(pos, y_axis_normed, width, color 
           = 
           'lightblue' 
           ) 
          
 
           plt2.xticks(rotation 
           = 
           30 
           ) 
          
 
           fig 
           = 
           plt2.gcf() 
          
 
           fig.set_size_inches( 
           16 
           , 
           10 
           ) 
          
 
           plt2.show() 
          
 
       
 
     

从HDFS加载数据

评分记录总数：

评分的一些统计信息;

统计评分信息并生成柱状图：

用户电影评价分布图：

结论：

从图中我们可以看出电影的评分大都在3-5分之间。

处理五（用户总评分统计分析）

处理五简介：

首先对用户数据处理，获得用户对电影的总评分数（每位至少评价20次，评分在1-5之间）然后绘制图表供分析。

处理四所有代码：

[Python] 纯文本查看复制代码

 
      ? 
     
 
       
         
         
           #获取用户评分次数和每次评分 
          
 
           user_ratings_grouped 
           = 
           rating_data. 
           map 
           ( 
           lambda 
           fields: ( 
           int 
           (fields[ 
           0 
           ]), 
           int 
           (fields[ 
           2 
           ]))).groupByKey() 
          
 
           #用户ID以及该用户评分总数 
          
 
           user_ratings_byuser 
           = 
           user_ratings_grouped. 
           map 
           ( 
           lambda 
           (k, v): (k, 
           len 
           (v))) 
          
 
           #打印5条结果 
          
 
           user_ratings_byuser.take( 
           5 
           ) 
          
 
           #生成柱状图 
          
 
           from 
           matplotlib  
           import 
           pyplot as plt3 
          
 
           user_ratings_byuser_local 
           = 
           user_ratings_byuser. 
           map 
           ( 
           lambda 
           (k, v):v).collect() 
          
 
           plt3.hist(user_ratings_byuser_local, bins 
           = 
           200 
           , color 
           = 
           'lightblue' 
           ,normed 
           = 
           True 
           ) 
          
 
           fig 
           = 
           plt3.gcf() 
          
 
           fig.set_size_inches( 
           16 
           , 
           10 
           ) 
          
 
           plt3.show() 
          
 
       
 
     

打印用户5条处理后的结果：

生成每位用户评分总数分布图：

结论：

从图中可以看出总评分在100以内的占了绝大多数。当然，100到300之间还是有一部分的。

注意事项

1、要显示Python图标，必须要操作系统有图形界面。

2、Python必要有matplotlib 模块。

3、必须要以root用户开启PySpark，不然会报以下错误，没有权限连接x Server。

你可能感兴趣的:(PySpark处理数据并图表分析)

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
《庄子.达生9》钱江潮369
【原文】孔子观于吕梁，县水三十仞，流沫四十里，鼋鼍鱼鳖之所不能游也。见一丈夫游之，以为有苦而欲死也，使弟子并流而拯之。数百步而出，被发行歌而游于塘下。孔子从而问焉，曰：“吾以子为鬼，察子则人也。请问，‘蹈水有道乎’”曰：“亡，吾无道。吾始乎故，长乎性，成乎命。与齐俱入，与汩偕出，从水之道而不为私焉。此吾所以蹈之也。”孔子曰：“何谓始乎故，长乎性，成乎命？”曰：“吾生于陵而安于陵，故也；长于水而安于
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的