代码实体

windows下pyspark访问hive所需的环境搭建

文章目录

简介
环境搭建与效果演示
更细节的搭建方法

搭建HDFS、Spark或hive的前提
已经有了远程可访问的测试集群
搭建hadoop2.7.2

修改hadoop配置
格式化hdfs
测试

搭建spark-2.4.5

解压hive-2.1.0
创建hive元数据库的schema
测试spark-sql
spark-sql访问已经被hive创建的表出现的问题
测试hive

jupyter中使用pyspark

使用pyspark访问本地hive
测试pyspark

简介

学习大数据最痛苦和费时间的就是入门时的环境搭建，对于大数据工程师而言，这个过程必不可少，但对于一些简单的测试，每次都要打开自己搭建好的虚拟机，未免有些麻烦。

对于数据分析师而言，一般只需要使用hive和spark就好，搭建集群实在是一件费力没有效果的事。如果有一种方法让数据分析师能够在不搭建linux集群的情况下就能把spark，hive在本地跑起来直接使用，那或许会非常方便。

我为了让需要使用大数据组件的朋友很方便的在本地使用hive和spark，已经多次测试了从零到1在windows平台下搭建hadoop、hive和spark，并且直接跑起来。为了减少广大读者环境带来的坑，我删除了原有的老版本，专门下载新版本的spark和对应的hadoop版本进行测试。

按照本文的方法搭建好之后，你就可以直接在windows上启动hdfs、hive和spark各组件，并直接跑起来，然后我会演示如何使用python调用spark，并让pyspark访问现有的hive集群的数据。

每个人机器的环境也都不一样，我之所以写这篇文章这么久就是反复考虑大多数人可能出现的环境问题，但仍然不可能面面俱到。我已经在自己机器上测试通过，若有读者测试中遇到问题无法解决，欢迎反馈。

前面windows下pyspark访问hive所需的环境部分，是演示windows基础环境的搭建，如果你已经有了现成的可以直接远程连接的测试集群，则不需要在本地搭建额外的测试集群可以直接跳过不读本文，但本文提到的一个图形化操作HDFS的工具或许对你有用，它支持windows远程连接HDFS集群，也支持连接使用了kerberos认证的HDFS的集群。

为了大家的方便，我已经将本文涉及的配置好的包和工具上传到网盘，下载地址：

链接：https://pan.baidu.com/s/1XIHFg6sO02HKwtGhBQl5qQ
提取码：5cmd

部分新手可能阅读本文后依然花了很长时间才把本地环境搭建好，初次搭建对于你来说可能很复杂很费时，但想想每次测试都不用再都打开虚拟机了，其实相对来说就省了很多时间，除非你以后不打算再玩大数据。另外，在本地linux虚拟机上跑程序比直接在宿主机上跑程序慢很多，相对每次基础测试都带来的时间节省，我觉得还是很值得的。

最后将演示如何使用python调用spark，并用pyspark访问现有的hive集群。你也可以把你现有集群的hive配置按照文章最后一部分的方法放入指定目录中，使pyspark直接访问你已经配置的hive集群。

环境搭建与效果演示

已经给大家录制了相应的操作视频，整个搭建过程不算上讲解仅需三分钟，快来看看吧：

windows平台搭建和使用hdfs、spark和hive以及pyspark的使用

视频链接：https://www.bilibili.com/video/BV1Ff4y1U7GU/

更细节的搭建方法

下面的方法是全部自己下载包的情况下如何搭建，所以过程有些繁琐，上面的方法已经能够让你成功快速的搭建整个过程，不想了解细节的下面的内容都几乎可以不用再看啦。

搭建HDFS、Spark或hive的前提

电脑中已经安装过java1.8版本，并将JAVA_HOME配置到环境变量中，PATH环境变量也添加了

%JAVA_HOME%\bin和%JAVA_HOME%\jre\bin

为了远程管理并共享hive元数据库，我们使用mysql关系型数据库作管理。使用其他关系型数据库也可以，但本文只演示使用mysql作为hive元数据库。

已经有了远程可访问的测试集群

那本章你就基本不用看了，除非你也想在windows本地搭建一个。

仅需要python调用pyspark，那你只需要电脑本身已经安装了python3.6以上版本即可，没有jupyter就运行以下命令安装

pip install jupyter

然后按照文章最后一部分的方法将hive配置文件添加到pip所安装的库对应的目录中。

搭建hadoop2.7.2

下载hadoop2.7.2版本的包：http://archive.apache.org/dist/hadoop/core/hadoop-2.7.2/hadoop-2.7.2.tar.gz，将其解压到你喜欢的位置。

例如我解压到D:/jdk中，然后将D:\jdk\hadoop-2.7.2重命名为D:\jdk\hadoop

配置环境变量HADOOP_HOME=D:\jdk\hadoop

Path环境变量本质上是一个;分割的路径字符串，再向Path中添加

%HADOOP_HOME%\bin和%HADOOP_HOME%\sbin这两个路径

例如Path原本的值为

C:\Windows\system32;C:\Windows

添加后就是

C:\Windows\system32;C:\Windows;%HADOOP_HOME%\bin;%HADOOP_HOME%\sbin

下载已经编译好的window平台的hadoop，版本为2.7.2

http://w3.153.d3s1puv.cn:82/uploadfile/2018/binwin7hadoop.rar

将其解压到%HADOOP_HOME%路径里面，覆盖bin目录中的文件

然后将%HADOOP_HOME%\bin\hadoop.dll复制到C:\Windows\System32

修改hadoop配置

core-site.xml配置：



<configuration>
	
	<property>
        <name>fs.defaultFSname>
        <value>hdfs://localhost:9000value>
    property>
	
    <property>
        <name>hadoop.tmp.dirname>
        <value>/tmp/hadoop/datavalue>    
	property>
	
	
	
	<property>
			<name>hadoop.proxyuser.Administrator.hostsname>
			<value>*value>
	property>
	<property>
			<name>hadoop.proxyuser.Administrator.groupsname>
			<value>*value>
	property>
configuration>

hdfs-site.xml配置：




<configuration>
  	
    <property>
        <name>dfs.replicationname>
        <value>1value>
    property>
    
	<property>
        <name>dfs.permissionsname>
        <value>falsevalue>
    property>
configuration>

格式化hdfs

命令行中输入命令hdfs namenode -format：

D:\>hdfs namenode -format

注意：我在hadoop.tmp.dir的配置中为/tmp/hadoop/data没有加盘符，此时命令行执行位置所在路径决定了hdfs的数据文件的存放位置。由于我在D盘执行的命令，所以最终hdfs的数据文件会放在D:\tmp\hadoop\data中。当然也可以配置为/D:/tmp/hadoop/data（最前面的/不能省略，也不允许在/前面加file:，必须以/开头+盘符才能指定盘符），这样即使在C盘执行命令也会放在D盘。

出现has been successfully formatted.表示格式化成功。

测试

启动hdfs：

start-dfs.cmd

会启动namenode和datanode两个进程。

游览器访问http://localhost:50070/可查询UI界面：

用HDFS游览器访问刚才搭建好的HDFS：

地址和端口填写上面连接HDFS的webUI的ip和端口，上面的连接地址是http://localhost:50070/，所以地址填localhost，端口填50070。

然后测试上传文件：

也没有问题，想要这个小工具可以关注公众号data_xxm后台留言获取噢。

再测试一下shell命令行里访问：

也完全正常。

搭建spark-2.4.5

下载spark-2.4.5：http://archive.apache.org/dist/spark/spark-2.4.5/spark-2.4.5-bin-hadoop2.7.tgz

解压到你喜欢的任意位置，例如我解压到D:\jdk，就将D:\jdk\spark-2.4.5-bin-hadoop2.7\bin添加到Path环境变量中，然后在D:\jdk\spark-2.4.5-bin-hadoop2.7\jars中放入mysql的驱动jar包，例如mysql-connector-java-5.1.38-bin.jar

解压hive-2.1.0

下载：http://archive.apache.org/dist/hive/hive-2.1.0/apache-hive-2.1.0-bin.tar.gz

解压到你喜欢的任意位置，例如，我解压到D:\jdk

配置环境变量HIVE_HOME=D:\jdk\apache-hive-2.1.0-bin

并向Path环境变量中加入%HIVE_HOME%\bin

conf中新建hive-site.xml文件，内容如下：

<configuration>
    <property>
        <name>javax.jdo.option.ConnectionURLname>
        <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=truevalue>
    property>

    <property>
        <name>javax.jdo.option.ConnectionUserNamename>
        <value>rootvalue>
    property>

    <property>
        <name>javax.jdo.option.ConnectionPasswordname>
        <value>123456value>
    property>

    <property>
        <name>javax.jdo.option.ConnectionDriverNamename>
        <value>com.mysql.jdbc.Drivervalue>
    property>

    <property>
        <name>hive.metastore.warehouse.dirname>  
          
        <value>/tmp/hive/warehousevalue>
    property>
    <property>
        <name>hive.cli.print.headername>
        <value>truevalue>
    property>

    <property>
        <name>hive.cli.print.current.dbname>
        <value>truevalue>
    property>
configuration>

前三项分别是你的mysql连接url，用户名和密码，按照实际情况修改即可。连接url中hive也可以修改为其他名字，表示hive存储元数据的数据库的名称。

hive.metastore.warehouse.dir表示默认情况hive管理表的数据存储位置。

注意：上面hive-site.xml配置了hive.metastore.warehouse.dir=/tmp/hive/warehouse，这个路径在spark中会识别为以程序启动所在盘符下的本地路径，可以指定具体盘符，例如D:/tmp/hive/warehouse则路径不受程序启动位置的限制。

而在这个配置的hive下创建数据库或表，/tmp/hive/warehouse会识别为以fs.defaultFS为前缀的hdfs路径，在本文的配置中就是hdfs://localhost:9000/tmp/hive/warehouse，如果hive.metastore.warehouse.dir被配置为D:/tmp/hive/warehouse则hive会认为是hdfs://localhost:9000/D:/tmp/hadoop/data导致hive无法创建不指定手动指定路径主控表。

要想让hive创建的表也被识别为本地路径，必须配置为file:/D:/tmp/hive/warehouse指定file协议。

创建hive元数据库的schema

hive启动在需要mysql中存在scheme 表格结构，在hive1.x版本原本是可以自动创建的，但2.x版本中必须手工通过下面这个命令：

schematool --dbType mysql --initSchema

但是这个命令在windows平台不好使，会报如下错误，当前路径都会自动给你切换：

D:\jdk\apache-hive-2.1.0-bin\bin\ext>schematool.cmd --dbType mysql --initSchema
C:\Windows\system32
找不到文件
系统找不到指定的路径。

C:\Windows\System32>

其实我之前在windows平台上搭建hive，使用schematool命令，但这次为了演示却不成功了。

如果有读者知道在windows平台如何正确使用schematool命令，欢迎讨论。

既然这个方法不好使，所以我就直接从原理层面直接操作了。这个命令本质是使用了预先定义保存在模板文件的一些sql语句，根据不同的条件选择模板问题，并填充里面的变量。

但是我经过观察发现，这些模板文件需要变量填充的部分执行与否都无所谓，根本不用自己再开发一个填充变量的程序，直接执行这些模板文件的合法sql脚本内容即可。

这样就能实现创建scheme的效果，具体scheme模板文件的路径是%HIVE_HOME%/scripts/metastore/upgrade/mysql/ 目录下的 hive-schema-2.1.0.mysql.sql （其他关系型数据库同理）。

于是只要无视错误的导入D:\jdk\apache-hive-2.1.0-bin\scripts\metastore\upgrade\mysql\hive-schema-2.1.0.mysql.sql脚本到hive数据库就可以创建元数据库scheme了。

下面具体操作一下，先创建hive数据库（字符集必须指定为latin1，排序规则默认值即可）：

再导入sql脚本（下图使用sqlyog操作）：

共导入46张表（使用Navicat查看）：

测试spark-sql

首先将%HIVE_HOME%\hive-site.xml文件添加到D:\jdk\spark-2.4.5-bin-hadoop2.7\conf目录下：

运行D:\jdk\spark-2.4.5-bin-hadoop2.7\bin\spark-sql2.cmd并创建几张表（已经将D:\jdk\spark-2.4.5-bin-hadoop2.7\bin添加到Path环境变量中）：

导入数据：

由于我配置的数据存储路径都是本地文件系统，未使用hdfs文件系统，则直接将数据文件扔到存储表对应的目录即可，本文中的配置就是D:\tmp\hive\warehouse下面的子目录。

上述表涉及的数据可见：

http://mp.weixin.qq.com/mp/homepage?__biz=MzA4NzcxOTQ1NA==&hid=2&sn=24824d7bbf36edb89470e03efa2d1545&scene=18#wechat_redirect

测试查询：

spark-sql访问已经被hive创建的表出现的问题

如果你是按照上面的方法，通过spark创建的hive表，是不会遇到这个坑的，但是如果上面的表你是通过hive先创建的，再次打开spark-sql就有可能会报如下错误：

Caused by: java.lang.RuntimeException: The root scratch dir: /tmp/hive on HDFS s
hould be writable. Current permissions are: rwx------
        at org.apache.hadoop.hive.ql.session.SessionState.createRootHDFSDir(Sess
ionState.java:612)
        at org.apache.hadoop.hive.ql.session.SessionState.createSessionDirs(Sess
ionState.java:554)
        at org.apache.hadoop.hive.ql.session.SessionState.start(SessionState.jav
a:508)
        ... 14 more

就是因为当前用户不具备对\tmp\hive的操作权限：

D:\>winutils ls \tmp\hive
drwx------ 1 BUILTIN\Administrators XIAOXIAOMING\None 0 May  4 2020 \tmp\hive

解决办法是把\tmp\hive目录的权限改为777：

D:\>winutils chmod 777 \tmp\hive

D:\>winutils ls \tmp\hive
drwxrwxrwx 1 BUILTIN\Administrators XIAOXIAOMING\None 0 May  4 2020 \tmp\hive

然后再次尝试即可顺利访问。

winutils更多的操作方法可直接敲winutils命令查看：

D:\>winutils
Usage: winutils [command] ...
Provide basic command line utilities for Hadoop on Windows.

The available commands and their usages are:

chmod          Change file mode bits.

chown          Change file owner.

groups         List user groups.

hardlink       Hard link operations.

ls             List file information.

readlink  Print the target of a symbolic link.

systeminfo     System information.

task           Task operations.
Usage: task create [OPTOINS] [TASKNAME] [COMMAND_LINE]
       task createAsUser [TASKNAME] [USERNAME] [PIDFILE] [COMMAND_LINE]
         Creates a new task jobobject with taskname as the user provided
       task isAlive [TASKNAME]
         Checks if task job object is alive
       task kill [TASKNAME]
         Kills task job object
       task processList [TASKNAME]

service        Service operations.

测试hive

spark-sql可以在不启动hdfs的情况下使用，但hive即使所有表都指定本地文件系统，使用前也必须先启动hdfs，否则出现如下错误：

正确启动后：

查看一下hive表：

windows版的hive最大的缺点就是日志过多，另外是一些分区修护的命令不好使，但是常规的查询还是可以在hive上测试的。

本人已经多次测试修改hive的多个log4f配置文件，仍然没有生效，INFO日志依然打印的不停，如果有哪位大佬知道改那个配置可以取消这些烦人的日志，欢迎讨论。

准备执行：

运行结果：

jupyter中使用pyspark

使用pyspark访问本地hive

首先安装与本地hadoop兼容的pyspark版本，跟前面的spark版本一致即可：

pip install pyspark==2.4.5

然后将hive-site.xml配置文件放入D:\Anaconda3\Lib\site-packages\pyspark\conf中

D:\Anaconda3\Lib\site-packages更换为命令pip show pyspark查看到的地址（Location）

(base) C:\Users\Administrator>pip show pyspark
Name: pyspark
Version: 2.4.5
Summary: Apache Spark Python API
Home-page: https://github.com/apache/spark/tree/master/python
Author: Spark Developers
Author-email: [email protected]
License: http://www.apache.org/licenses/LICENSE-2.0
Location: d:\anaconda3\lib\site-packages
Requires: py4j
Required-by:

再将mysql连接驱动例如mysql-connector-java-5.1.38-bin.jar放入D:\Anaconda3\Lib\site-packages\pyspark\jars中。

为了加速pip的下载，可以在~/pip中添加pip.ini文件，内容如下：

[global]
trusted-host=mirrors.aliyun.com
index-url=http://mirrors.aliyun.com/pypi/simple/

测试pyspark

先获取SparkSession和SparkContext对象：

from pyspark.sql import SparkSession
from pyspark.sql import Row

spark = SparkSession \
    .builder \
    .appName("Python Spark SQL Hive integration example") \
    .enableHiveSupport() \
    .getOrCreate()
sc = spark.sparkContext
spark

测试一下文本读取，先获取自己所在目录下所有文件的行数：

textFile = spark.read.text(".")
textFile.count()

获取第一条数据：

textFile.first()

Row(value='Sun May 03 06:58:24 CST 2020 Thread[Thread-4,5,main] Cleanup action starting')

测试一下sql，先获取存在的表：

spark.sql("show tables").show()

+--------+---------+-----------+
|database|tableName|isTemporary|
+--------+---------+-----------+
| default|   xxm_t1|      false|
| default|   xxm_t2|      false|
| default|   xxm_t3|      false|
| default|   xxm_t4|      false|
| default|   xxm_t5|      false|
+--------+---------+-----------+

顺利访问到前面创建的表。

测试窗口函数：

sql="""
SELECT cookieid,
createtime,
pv,
SUM(pv) OVER(PARTITION BY cookieid ORDER BY createtime) AS pv1, -- 默认为从起点到当前行
SUM(pv) OVER(PARTITION BY cookieid ORDER BY createtime ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS pv2, --从起点到当前行，结果同pv1
SUM(pv) OVER(PARTITION BY cookieid) AS pv3,                --分组内所有行
SUM(pv) OVER(PARTITION BY cookieid ORDER BY createtime ROWS BETWEEN 3 PRECEDING AND CURRENT ROW) AS pv4,   --当前行+往前3行
SUM(pv) OVER(PARTITION BY cookieid ORDER BY createtime ROWS BETWEEN 3 PRECEDING AND 1 FOLLOWING) AS pv5,    --当前行+往前3行+往后1行
SUM(pv) OVER(PARTITION BY cookieid ORDER BY createtime ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING) AS pv6   ---当前行+往后所有行  
FROM xxm_t1
"""
spark.sql(sql).show()

+--------+----------+---+---+---+---+---+---+---+
|cookieid|createtime| pv|pv1|pv2|pv3|pv4|pv5|pv6|
+--------+----------+---+---+---+---+---+---+---+
| cookie1|2015-04-10|  1|  1|  1| 26|  1|  6| 26|
| cookie1|2015-04-11|  5|  6|  6| 26|  6| 13| 25|
| cookie1|2015-04-12|  7| 13| 13| 26| 13| 16| 20|
| cookie1|2015-04-13|  3| 16| 16| 26| 16| 18| 13|
| cookie1|2015-04-14|  2| 18| 18| 26| 17| 21| 10|
| cookie1|2015-04-15|  4| 22| 22| 26| 16| 20|  8|
| cookie1|2015-04-16|  4| 26| 26| 26| 13| 13|  4|
+--------+----------+---+---+---+---+---+---+---+

顺利执行。

关于sparksql的函数可参考：http://spark.apache.org/docs/latest/api/sql/index.html

当然sparksql对hive的函数几乎全部都支持，只看hive的函数也可以。

测试一下机器学习：

from pyspark.mllib.linalg import Matrices, Vectors
from pyspark.mllib.regression import LabeledPoint
from pyspark.mllib.stat import Statistics

vec = Vectors.dense(0.1, 0.15, 0.2, 0.3, 0.25)  # a vector composed of the frequencies of events

# compute the goodness of fit. If a second vector to test against
# is not supplied as a parameter, the test runs against a uniform distribution.
goodnessOfFitTestResult = Statistics.chiSqTest(vec)

# summary of the test including the p-value, degrees of freedom,
# test statistic, the method used, and the null hypothesis.
print("%s\n" % goodnessOfFitTestResult)

mat = Matrices.dense(3, 2, [1.0, 3.0, 5.0, 2.0, 4.0, 6.0])  # a contingency matrix

# conduct Pearson's independence test on the input contingency matrix
independenceTestResult = Statistics.chiSqTest(mat)

# summary of the test including the p-value, degrees of freedom,
# test statistic, the method used, and the null hypothesis.
print("%s\n" % independenceTestResult)

obs = sc.parallelize(
    [LabeledPoint(1.0, [1.0, 0.0, 3.0]),
     LabeledPoint(1.0, [1.0, 2.0, 0.0]),
     LabeledPoint(1.0, [-1.0, 0.0, -0.5])]
)  # LabeledPoint(label, feature)

# The contingency table is constructed from an RDD of LabeledPoint and used to conduct
# the independence test. Returns an array containing the ChiSquaredTestResult for every feature
# against the label.
featureTestResults = Statistics.chiSqTest(obs)

for i, result in enumerate(featureTestResults):
    print("Column %d:\n%s" % (i + 1, result))

Chi squared test summary:
method: pearson
degrees of freedom = 4 
statistic = 0.12499999999999999 
pValue = 0.998126379239318 
No presumption against null hypothesis: observed follows the same distribution as expected..

Chi squared test summary:
method: pearson
degrees of freedom = 2 
statistic = 0.14141414141414144 
pValue = 0.931734784568187 
No presumption against null hypothesis: the occurrence of the outcomes is statistically independent..

Column 1:
Chi squared test summary:
method: pearson
degrees of freedom = 0 
statistic = 0.0 
pValue = 1.0 
No presumption against null hypothesis: the occurrence of the outcomes is statistically independent..
Column 2:
Chi squared test summary:
method: pearson
degrees of freedom = 0 
statistic = 0.0 
pValue = 1.0 
No presumption against null hypothesis: the occurrence of the outcomes is statistically independent..
Column 3:
Chi squared test summary:
method: pearson
degrees of freedom = 0 
statistic = 0.0 
pValue = 1.0 
No presumption against null hypothesis: the occurrence of the outcomes is statistically independent..

执行后UI界面的变化：

你可能感兴趣的:(python数据分析)

Python 数据分析与可视化：从基础到进阶的技术实现与优化策略女码农的重启 python 数据分析开发语言
数据分析与可视化是数据科学领域的核心技能，Python凭借其丰富的库生态和灵活的编程范式，成为该领域的首选工具。本文将系统讲解Python数据分析与可视化的技术栈实现，从基础操作到性能优化，结合实战场景提供可复用的解决方案。数据分析核心库技术解析Pandas数据处理引擎原理Pandas作为数据分析的基石，其核心优势在于基于NumPy的矢量运算和高效的内存管理。与Excel的单元格级操作不同，Pan
Python数据分析：从入门到精通
引言在当今数据驱动的时代，数据分析已成为企业和组织做出明智决策的关键。Python作为一种强大的编程语言，因其简洁性和丰富的数据分析库而成为数据科学领域的首选工具。无论你是初学者还是有一定经验的数据分析师，本指南都将带你从入门到精通Python数据分析，掌握必备技能和最佳实践。数据分析的重要性与Python的角色数据分析涉及收集、处理和解释数据，以揭示模式、趋势和见解。它有助于解决复杂问题，优化业
Python数据分析案例｜从模拟数据到可视化：零售门店客流量差异分析全流程
1.依赖库导入importmatplotlib.pyplotaspltimportnumpyasnpimportpandasaspdfrommatplotlibimportfont_managerfromdatetimeimportdatetimematplotlib.pyplot：用于绘制图表。numpy：numpy：pandas：虽然代码中未font_manager：设置datetime：生成
Python数据分析学习笔记：字符串统计 NIKEeri python pandas 字符串匹配 python 数据分析学习
一、题目来源KagglePandas-Exercise:SummaryFunctionsandMaps章节二、题目要求描述一瓶葡萄酒时，可用的词汇有限。哪种词出现频率更高：“tropical”还是“fruity”？统计description列中这两个词的出现次数。忽略大小写。三、我的思路（使用str.contains统计总次数）tropical_count=reviews['description
python数据分析scipy库安装与使用范哥来了 python 数据分析 scipy
安装scipy库scipy是一个用于科学计算的Python库，它依赖于numpy。如果你还没有安装scipy，可以使用以下命令来安装：pipinstallscipy或者，如果你使用的是Anaconda环境，可以通过conda来安装：condainstallscipy使用scipy库scipy提供了许多用于科学计算的功能，包括统计、优化、积分、线性代数等。下面是一些常见的用法示例。1.导入scipy
Python,C++开发上市辅导方法与实操APP Geeker-2025 python c++
#上市辅导方法与实操APP-Python与C++综合解决方案下面是一个完整的上市辅导方法与实操APP的实现方案，结合Python和C++的优势，涵盖金融建模、合规分析、流程管理等多个方面：```mermaidgraphTDA[上市辅导系统]-->B[核心引擎]A-->C[应用平台]B-->D[C++金融计算引擎]B-->E[Python数据分析]B-->F[合规检查系统]C-->G[Web管理平台
《python 数据分析从入门到精通》读书笔记｜了解数据分析｜数据分析基础知识
《python数据分析从入门到精通》读书笔记第一章：了解数据分析1.1什么是数据分析数据分析是利用数学、统计学理论与实践相结合的科学统计分析方法，对Excel数据、数据库中的数据、收集的大量数据、网页抓取的数据进行分析，从中提取有价值的信息并形成结论进行展示的过程。数据分析实际上是通过数据的规律来解决业务问题，以帮助实际工作中的管理者做出判断和决策。数据分析包括以下几个主要内容：（1）现状分析：分
【python数据分析】数据建模之Kmeans聚类斑点鱼 SpotFish python 数据建模聚类 python 数据分析
K-means聚类：最常用的机器学习聚类算法，且为典型的基于距离的聚类算法。K均值：基于原型的、划分的距离技术，它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度Kmeans聚类案例分析：make_blobs聚类数据生成器#导入模块from sklearn.cluster import KMeansfromsklearn.datasetsimportmake_blobs#创建数据x,y_tr
Python 数据分析与机器学习入门 (一)：环境搭建与核心库概览程序员阿超的博客 Python python 数据分析机器学习入门教程环境搭建 Anaconda JupyterNotebook
Python数据分析与机器学习入门(一)：环境搭建与核心库概览本文摘要本文是Python数据分析与机器学习入门系列的第一篇，专为初学者设计。文章首先阐明了Python在数据科学领域的优势，然后手把手指导读者如何使用Anaconda搭建一个无痛、专业的开发环境，并介绍了强大的交互式工具JupyterNotebook的基本操作。最后，简要概览了NumPy、Pandas、Scikit-learn等核心库
物流数据行业分析（包含完整代码和流程）------python数据分析师项目Anaconda 欲梦yhd 数据分析项目大数据 conda python
一、引言数据分析流程为明确目的、获取数据、数据探索和预处理、分析数据、得出结论、验证结论、结果展现。物流业务中对数据进行深入挖掘和分析的过程，旨在提高运输效率、降低运输成本、提高客户满意度，以及提高公司的竞争力。本案例物流数据分析目的：a、配送服务是否存在问题b、是否存在尚有潜力的销售区域c、商品是否存在质量问题二、详细流程1、数据预处理（数据清洗）（1）数据导入使用panda库读取数据，编码方式
Python 数据分析实践经验与学习心得 lzzy_sj_0999 python 数据分析开发语言
在当今数据驱动的时代，Python以其丰富的库和便捷的语法，成为数据分析领域的首选语言。本文将结合实际案例，分享Python数据分析的学习心得与实践经验，涵盖数据读取、清洗、分析及可视化等关键环节，希望能为大家的学习和工作提供帮助。一、数据分析必备库介绍在Python数据分析中，有几个核心库是必须掌握的，它们就像我们手中的“神兵利器”，能够高效完成各种数据分析任务。Pandas：用于数据处理和分析
《Python数据分析与挖掘实战》Chapter8中医证型关联规则挖掘笔记茫茫大地真干净机器学习 Python 数据挖掘
最近在学习《Python数据分析与挖掘实战》中的案例，写写自己的心得。代码分为两大部分：1.读取数据并进行聚类分析2.应用Apriori关联规则挖掘规律1.聚类部分函数分析：defprogrammer_1():datafile="C:/Users/longming/Desktop/chapter8/data/data.xls"processedfile="C:/Users/longming/Des
python数据分析张俊红_Python数据分析实战基础 | 初识Pandas weixin_39678531 python数据分析张俊红
这是Python数据分析实战基础的第一篇内容，主要是和Pandas来个简单的邂逅。已经熟练掌握Pandas的同学，可以加快手速滑动浏览或者直接略过本文。01重要的前言这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像
python数据分析第9天雪球滚滚滚数据分析 python 数据挖掘
python数据分析第9天电商网站用户/订单/活动数据分析项目商业模式B2B：商家对商家（企业卖家对企业买家），交易双方都是企业，最典型的案例就是阿里巴巴，汇聚了各行业的供应商，特点是订单量一般较大。B2C：商家对个人（企业卖家对个人买家），例如：唯品会，聚美优品。B2B2C：商家对商家对个人，例如：天猫、京东。C2C：个人（卖家）对个人（买家），例如：淘宝、人人车。O2O：线上（售卖）到线下（提
Python数据处理三剑客：NumPy、Pandas和xarray全面详解 AI开发学习分享 python 数据分析 python numpy pandas
在Python数据分析领域，NumPy、Pandas和xarray是最核心的三个库。本文将详细介绍它们的功能、用法和区别，并提供大量实用代码示例。一、NumPy：科学计算基础库NumPy是Python科学计算的基础包，提供了高性能的多维数组对象和各种计算工具。1.1基本数组操作importnumpyasnp#创建数组arr1=np.array([1,2,3,4])#一维数组arr2=np.arra
100个Pandas练习题：从入门到精通的实战指南陆骊咪Durwin
100个Pandas练习题：从入门到精通的实战指南100-pandas-puzzles100datapuzzlesforpandas,rangingfromshortandsimpletosupertricky(60%complete)项目地址:https://gitcode.com/gh_mirrors/10/100-pandas-puzzles前言Pandas作为Python数据分析的核心库，
Python 数据分析与可视化实践与python数据分析绘图表的实现，和实际的完整案例 Q_ytsup5681 python 数据分析开发语言 plotly matplotlib
本文链接：Python数据分析与可视化实践与python数据分析绘图表的实现，和实际的完整案例-CSDN博客学习Python数据可视化对于数据分析和数据科学领域是至关重要的，它有着许多作用，包括但不限于以下几个方面：1.数据理解与探索：可视化使得数据更加直观，通过图表和图形，可以更容易地观察数据的分布、趋势和模式。这有助于深入理解数据，识别异常值和发现潜在的关联性。2.决策支持：数据可视化为决策提
python数据分析期末测验,python数据分析基础题库 Leospanb87 python 开发语言人工智能
大家好，小编来为大家解答以下问题，python数据分析与应用选择题答案，python数据分析与应用课后题，现在让我们一起来看看吧！文章目录一、选择题二、填空题三、判断题四、代码分析题五、程序题一、选择题1.sum(range(0,101)的结果是（）A.5050B.5151C.0D.101A2.下面哪个不是python合法的标识符（）A.int32B.70XLC.selfD.__name__B3.
python数据分析与可视化蓝宗林 python 数据分析信息可视化
一、Python数据分析概述Python是一种解释型、交互式的编程语言，其设计理念强调代码的可读性和简洁性。Python的语法结构简单，支持面向对象、过程式和函数式三种编程范式，使得Python成为一种强大而灵活的编程语言。Python数据分析主要包括数据清洗、数据探索和数据可视化三个部分。数据清洗是数据分析的重要环节，主要是对数据进行预处理，包括缺失值处理、异常值处理、数据类型转换等。数据探索则
Python数据分析与可视化理论知识
Python数据分析概述Python数据分析依赖的两个对象表格对象实现统计分析数据预处理Matplotlib数据可视化总结Python数据分析概述数据分析的概述数据分析：用适当的统计分析方法将收集来的大量数据进行分析，将他们加以汇总和理解并消化，以求最大化地开发数据的功能，发挥数据的作用。为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析的类别：描述性数据分析、探索性数据分析
3648766 天浊海 python pycharm sklearn
1.Python数据分析介绍及环境搭建1.1python数据分析简介【了解】1.1.1python做数据分析的优势可以独立完成数据分析的各种任务功能强大,有海量的开源包(pandas,numpy…)处理海量数据效率高开源免费1.1.2常用python数据分析开源库numpy:用于数组计算pandas:分析结构化数据的工具集series:类似一维数组的对象(一行数据或者一列数据)dataframe:
Python数据分析的基本步骤在焦虑的沙漠里种一棵树 python 数据分析开发语言
数据分析的基本步骤（基于Python）一、引言在当今数字化时代，数据已成为企业、科研机构等组织的重要资产。有效地进行数据分析可以帮助我们从海量的数据中提取有价值的信息，从而支持决策制定、优化流程、发现趋势等。Python作为一种强大的编程语言，拥有丰富的数据分析库，如Pandas、NumPy、Matplotlib等，为数据分析工作提供了极大的便利。本文将详细阐述基于Python的数据分析基本步骤，
Python数据分析从小白到高手--数据可视化分析王国平信息可视化 python 数据分析人工智能大数据数据挖掘开发语言
Python是一种功能强大的编程语言，也是一种流行的数据分析工具，其数据可视化能力也非常强大，本章我们将结合实际案例介绍Python的主要数据可视化库，包括Matplotlib、Pyecharts、Seaborn、Plotly、Altair、NetworkX等。7.1Matplotlib7.1.1Matplotlib库简介Matplotlib是Python中最流行的数据可视化库之一，基于Numpy
【无痛学Python】Pandas数据载入与预处理，看这一篇就够了！ Skrrapper Python python pandas 数据库
【Python数据分析】Pandas数据载入与预处理，看这一篇就够了！对于数据分析而言，数据大部分来源于外部数据，例如CSV文件、Excel文件以及数据库文件等等。我们要把各种格式的数据转换成Pandas可处理的Series和DataFrame数据格式，进行完数据分析与处理之后再重新存储到外部文件中，这就是Pandas的数据载入与预处理。数据载入其实对于读/写文件和存储文件来说，不同类型文件的函数
Python 数据分析：NumPy 库的使用小张在编程 python 数据分析 numpy
引言：为什么说NumPy是Python数据分析的“基石”？在Python数据分析领域，有这样一句话：“没有NumPy，就没有Pandas、Matplotlib和Scikit-learn”。作为Python科学计算的核心库，NumPy（NumericalPython）凭借高效的多维数组（ndarray）和向量化运算能力，成为了所有数据分析工具的底层支撑。无论是处理百万级别的销售数据，还是实现复杂的机
python数据分析期末_Python数据分析期末作业 xander Sun python数据分析期末
Python数据分析期末作业(50分)一、名称：国民经济核算季度数据分析可视化处理；二、需求：根据文件《国民经济核算季度数据.npz》提供的各年中每个季度的数据，完成如下操作处理：1、绘制直方图：(1)在一个画板中绘制2000年、2017年第一季度国民生产总值产业构成分布、行业构成分布直方图，其效果形式如下；(2)要求：?每个图形的标题、轴标签、刻度、图形颜色、柱形宽度与效果图中的完全一致；?在每
1、Python数据分析：数据的采集数字化与智能化 Python数据分析 python数据分析 python数据的采集
一、数据的采集数据采集是系统性工程，需平衡技术、成本与合规性。在实际操作中，建议从最小可行采集方案（MVP）起步，逐步迭代优化，同时建立数据治理规范，确保长期可持续性。1.数据采集的核心目标全面性：覆盖关键维度，避免信息缺失。准确性：确保数据真实反映现实，减少误差。时效性：数据需满足实时或近实时需求（如金融交易监控）。合规性：遵守隐私保护（如GDPR）、数据安全等法律法规。2.数据来源分类（1）第
如何进行Python数据分析？正确的“入门之路”三部曲白帽黑客麦叔 Python python 数据分析开发语言职场和发展 Python教程
前言Python是一种面向对象、直译式计算机程序设计语言，由于他简单、易学、免费开源、可移植性、可扩展性等特点，Python又被称之为胶水语言。下图为主要程序语言近年来的流行趋势，Python受欢迎程度扶摇直上。由于Python拥有非常丰富的库，使其在数据分析领域也有广泛的应用。一、为什么要用Python做数据分析？在我看来，大概有3大理由。广度：各行各业都有自己的商业场景，每一个行业都需要使用数
如何进行Python数据分析？正确的“入门之路”三部曲！_python医学数据分析入门 2401_84301948 程序员网络安全学习面试
给大家的福利零基础入门对于从来没有接触过网络安全的同学，我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。同时每个成长路线对应的板块都有配套的视频提供：因篇幅有限，仅展示部分资料网络安全面试题绿盟护网行动还有大家最喜欢的黑客技术网络安全源码合集+工具包所有资料共282G，朋友们如果有需要全套《网络安全入门+黑客进阶学习资源包》，可以扫描下方二维码
【数据分析】第四章 pandas简介（1）神秘敲码人数据分析 python pandas
4.1pandas:Python数据分析库pandas是一个专门为数据分析量身定制的开源Python库。在当今的Python数据科学界，无论是专业研究还是进行统计分析和决策，pandas都是每一位数据专业人士不可或缺的基础工具。这个强大的库由WesMcKinney于2008年开始设计和开发。到了2012年，他的同事SienChang也加入了开发团队。正是他们二人的共同努力，造就了Python社区中
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end