jin6872115

superset使用一

1、使用的python3.6，然后配置mysql数据库，报错

No module named ‘MySQLdb'

MySQLdb只支持Python2.*，还不支持3.*
可以用PyMySQL代替。安装方法：pip3 install PyMySQL

需要在下面的
 cd /usr/local/lib/python3.6/site-packages/sqlalchemy/dialects/mysql/
然后把 __init__.py中添加两行：
import pymysql
pymysql.install_as_MySQLdb()
就可以用 import MySQLdb了。其他的方法与MySQLdb一样。

然后重启后就可以连接mysql了

示例使用教程，根据下面示例跑一边，基本可以操作可以完成。

2.使用python虚拟环境

启动 . ./bin/activate

superset runserver

转自

前言

为了刺激自己学习和使用superset的欲望，可以点击这里，先看下github上的效果图，同时，个人感觉SQL Lab也是一个特别赞的功能。

关于superset

官网：
http://airbnb.io/projects/superset/
文档：
http://airbnb.io/superset/
主要功能：
- 快速创建可交互的、直观形象的数据集合
- 有丰富的可视化方法来分析数据，且具有灵活的扩展能力
- 具有可扩展的、高粒度的安全模型，可以用复杂规则来控制访问权限。目前支持主要的认证提供商：DB、OpenID、LDAP、OAuth、和Flask AppBuiler的REMOTE_USER
- 使用简单的语法，就可以控制数据在UI中的展现方式
- 与Druid深度结合，可快速的分析大数据
- 配置缓存来快速加载仪表盘

下面从安装开始介绍superset。

安装Python

需要注意的是：superset是在Python2.7和Python3.4下测试的，Airbnb生产环境使用的Python版本是2.7.x，并且Airbnb不打算支持Python2.6。
Python的安装步骤，在这里就不做说明了，因为Centos7自带的Python已经是2.7.x版本了，所以无需额外安装。可以通过python -V查看Python的版本。
本文是在以下环境下测试的：

操作系统：CentOS Linux release 7.3.1611 (Core)
Python：2.7.5
numpy：1.7.0
pandas：1.19.2
superset：0.18.2

安装setuptools

curl https://bootstrap.pypa.io/ez_setup.py | sudo python -

安装完成之后，验证一下：

[vagrant@hadoop-slave-1 ~]$ easy_install --version
setuptools 33.1.1 from /usr/lib/python2.7/site-packages/setuptools-33.1.1-py2.7.egg (Python 2.7)

安装依赖的软件包

sudo yum install -y gcc-c++ python-devel libffi libffi-devel openssl openssl-devel  cyrus-sasl-lib cyrus-sasl-devel cyrus-sasl gettext

安装flask

sudo easy_install flask

安装numpy 1.7.0

下载：

curl -o numpy-1.7.0.tar.gz  https://pypi.python.org/packages/e7/b8/0eec6203c783047760db02f86791814c860397a7c79c444ddabc8a2f1c69/numpy-1.7.0.tar.gz#md5=4fa54e40b6a243416f0248123b6ec332

解压：

tar zxf numpy-1.7.0.tar.gz

安装：

cd numpy-1.7.0/
sudo python setup.py install

安装pandas 0.19.2

下载：

curl -o pandas-0.19.2.tar.gz https://pypi.python.org/packages/08/9d/31ec596099f14528fc6ad39428248ac5360f0bb5205a3ee79a5d1cf260fb/pandas-0.19.2.tar.gz#md5=26df3ef7cd5686fa284321f4f48b38cd

解压：

tar zxf pandas-0.19.2.tar.gz

安装：

cd pandas-0.19.2/
sudo python setup.py install

安装superset 0.18.2

下载

curl -o superset-0.18.2.tar.gz  https://pypi.python.org/packages/56/53/83d8e2d6cd2c36d0318f82b7f611a07e534e7fb0afe3dd5424a57f114082/superset-0.18.2.tar.gz#md5=27ea370cc453a1937e9209778fc15ab0

解压：

tar zxf superset-0.18.2.tar.gz

安装：

cd superset-0.18.2/
sudo python setup.py install

至此，superset就安装完毕了，下面开始superset的入门教程。

superset入门教程

1，创建管理员账户

fabmanager create-admin --app superset

在输入用户名，姓名，邮箱，密码之后，fabmanager会在用户的主目录下创建.superset隐藏目录，并在该目录下创建一个sqlite3数据库。执行下面的命令可以看到上一步创建的用户被保存到了ab_user表中：

2，初始化数据库

superset db upgrade

3，加载一些测试数据

superset load_examples

4，创建默认的角色和权限

superset init

5，启动web服务器

superset runserver

web服务器的默认端口是8088，可以通过-p选项绑定其他的端口；也可以通过-d选项启动一个用于开发的服务器。
需要注意的是：
superset默认的应用服务器是gunicorn，但是gunicorn是无法在windows上工作的，所以在windows上只能使用用于开发的服务器。
启动web服务器之后，就可以使用浏览器访问superset了。

配置superset

可以通过创建一个叫做superset_config.py的模块，并将它放到PYTHONPATH下的方式，配置superset。下面是一个示例：

#---------------------------------------------------------
# Superset specific config
#---------------------------------------------------------
ROW_LIMIT = 5000
SUPERSET_WORKERS = 4

SUPERSET_WEBSERVER_PORT = 8088
#---------------------------------------------------------

#---------------------------------------------------------
# Flask App Builder configuration
#---------------------------------------------------------
# Your App secret key
SECRET_KEY = '\2\1thisismyscretkey\1\2\e\y\y\h'

# The SQLAlchemy connection string to your database backend
# This connection defines the path to the database that stores your
# superset metadata (slices, connections, tables, dashboards, ...).
# Note that the connection information to connect to the datasources
# you want to explore are managed directly in the web UI
SQLALCHEMY_DATABASE_URI = 'sqlite:////path/to/superset.db'

# Flask-WTF flag for CSRF
CSRF_ENABLED = True

# Set this API key to enable Mapbox visualizations
MAPBOX_API_KEY = ''

在这个配置模块中，也可以定义被Flask App Builder（superset所使用的web框架）使用的参数，关于这部分配置，请查看这里。
其中有两个需要改变的参数：

SQLALCHEMY_DATABASE_URI
它的默认值是~/.superset/superset.db，该参数用来指定保存superset元数据（比如slices、connections、tables、dashboards等）的数据库的Sqlalchemy连接字符串（要搜索的数据源的连接信息是由web UI直接管理的）
SECRET_KEY
它是一个很长的随机字符串

数据库依赖

默认情况下，superset是把元数据保存到sqlite中的，所以除了sqlite之外，superset不依赖任何数据库。如果想要把superset元数据保存到其它的数据中，那么需要安装相应的驱动以及给SQLALCHEMY_DATABASE_URI参数指定一个正确的值。下面是一些推荐使用的数据库、数据库驱动以及对应的SQLAlchemy URI前缀：

缓存

superset使用Flask-Cache来缓存数据。在superset_config.py中，可以通过CACHE_CONFIG参数配置缓存所使用的后端。
Flask-Cache支持多种缓存后端，比如Redis、Memcached、SimpleCache（in-memory）、local filesystem。以redis为例，首先应该安装Python的redis驱动：

sudo easy_install redis

然后在superset_config.py中增加如下的配置：

CACHE_CONFIG = {
        "CACHE_TYPE": "redis",
        "CACHE_REDIS_URL": "redis://[redis:<密码>]@:/",
        "CACHE_KEY_PREFIX": "A CACHE_KEY_PREFIX"
}

与SQLAlchemy的深度集成

在superset中可以通过SQLAchemy暴漏的参数调整数据库连接信息，在Database编辑页面，可以看到一个Extra域（值是一个Json串）：

在这个Json串中可以包含额外的配置选项。其中engine_params所指定的参数会传递给sqlalchemy.create_engine调用；metadata_params所指定的参数会传递给sqlalchemy.MetaData调用。更多详细信息，可以阅读SQLAlchemy的文档。

中间件

superset允许自定义中间件，方法是：

编写自己的WSGI中间件
在superset_config.py中增加ADDITIONAL_MIDDLEWARE参数，该参数的值是一个中间件类的列表

比如：

# superset_config.py

# other configuration...

class TestMiddleware(object):
    def __init__(self, app):
        self.app = app

    def __call__(self, environ, start_response):
        print("test middleware")
        return self.app(environ, start_response)
ADDITIONAL_MIDDLEWARE = [TestMiddleware]

升级superset

sudo easy_install --upgrade superset
superset db upgrade
superset init

SQL Lab

SQL Lab是一个非常强大的SQL IDE，它可以和所有与SQLAlchemy兼容的数据库一起使用。默认情况下，查询是在web请求的作用域中执行的，因此当web请求超时的时候，查询也会超时。
为了支持运行时间超过web请求的超时时间的查询，superset支持异步查询，配置异步查询的方式如下：

在创建数据源的时候，勾选Allow Run Async域

在superset_config.py模块中，通过CELERY_CONFIG配置celery的broker和result backend，注意：worker和web服务进程应该使用相同的配置
通过superset worker命令，启动一个或多个superset worker（本质上就是celery worker）
为了设置result backend，应该在superset_config.py配置模块中给RESULTS_BACKEND键指定为werkzeug.contrib.cache.BaseCache的一个派生类实例。可以使用自带的Redis、Memcache、S3、内存、文件系统cache实现，也可以自己编写cache实现

# superset_config.py

# other configurations ...

class CeleryConfig(object):
    BROKER_URL = 'redis://localhost:6379/0'
    CELERY_IMPORTS = ('superset.sql_lab', )
    CELERY_RESULT_BACKEND = 'redis://localhost:6379/0'

CELERY_CONFIG = CeleryConfig

from werkzeug.contrib.cache import RedisCache
RESULTS_BACKEND = RedisCache(
    host='192.168.30.2', port=6379, db=3,
    key_prefix="superset_results:")
```
SQL Lab在查询的时候，也支持Jinja模版，可以通过superset配置文件中的`JINJA_CONTEXT_ADDONS`参数配置默认的Jinja上下文。比如：  
```
JINJA_CONTEXT_ADDONS = {
    'my_crazy_macro': lambda x: x*2,
}

连接到新的数据库

登陆之后点击：

然后点击“+”，进入到Database view页面：

在database view页面，填写数据库的名字以及SQLAlchemy连接字符串，想要了解更多关于SQLAlchemy连接字符串，请点击这个链接：

然后点击“Test Connection”，如果运行superset服务的实例能够连接到数据库，会弹出类似下面的提示信息：

同时要注意以下几项：

执行“Test Connection”之后，在页面的底部会列出该数据库中都有哪些表

如果想要在SQL Lab中显示这个数据库，那么应该勾选：Expose In SQL Lab

保存之后，在SQL Lab中就可以看到这个数据库了：

如果允许用户异步地执行SQL查询，那么应该勾选“Allow Run Async”

最后点击“Save”按钮，这个数据库就建立完成了。

添加一个新的表

首先,在上一步添加的数据库中，创建一张新表：

CREATE TABLE `grade_test` (
  `course_id` int(10) unsigned NOT NULL,
  `student_id` int(10) unsigned NOT NULL,
  `grade` int(10) unsigned NOT NULL DEFAULT '0',
  `last_update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
  `course_name` varchar(100) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8

然后，插入一些测试数据：

insert into grade_test(course_id, student_id, grade, course_name) values(1,1,80,"english"),(1,2,85,"english"),(2,1,90,"math"),(2,2,70,"math"),(1,3,99,"english"),(2,3,88,"math");

接下来开始添加新的表：

保存之后，重定向到的页面顶部会有一条提示信息：

然后进入到“Table Model View”页面，点击新添加的表的表名前面的“Edit record”：

在结果页面上，点击“List Table Column”标签：

接下来，就可以定义对表中指定的列的使用方式了：

如果想要使用某个列进行分组，那么将该列标记为Groupable
如果想要使用某个列进行过滤，那么将该列标记为Filterable
如果想要在某列上进行count distinct，那么将该列标记为Count Distinct
如果想要对某列进行求和，或者进行简单的统计，那么将该列标记为Sum、Min、Max
任何时间或日期类型的列，都应该被标记为temporal

搜索数据

首先，进入到“Table Model View”：

然后点击表名：

默认情况下，展现的是Table View，并且默认的查询是获取表中的所有的记录数：

接下来看“Time”区：

Time Column：用来指定一个temporal类型的列
Time Grain：用来指定时间的粒度
Since过滤器：用来指定时间的下限（含）
Util过滤器：用来指定时间的上限（含）

“Time”区的下面是“Group By”区：

Group By：用来指定按照那些列进行分组
Metrics：用来指定对哪些列进行何种统计（比如对某列求平均值）

比如，想要求每个学生的平均成绩和成绩总和：

然后点击，左上角的Query，就可以在右侧看到结果了：

下面看一些其它有趣的功能：

Filters：

点击页面右上角的Query按钮：

Filters其实是以AND的方式加到where语句的条件中了

Options：

Row Limit：为SQL的limit子句指定一个值
Page Length：指定每页多少条记录

Superset支持很多表格类型，具体可以看官网提供的“画廊”。

创建slice和dashboard

一个被保存的查询叫做slice。点解Query按钮右侧的Save as按钮就可以创建一个slice：

点击Save as，在Save as窗口填写slice的名字，同时也可以将slice添加到一个新创建的dashboard中，或已经已经存在的dashboard中，当然也可以不添加到任何dashboard中（所以说，一个dashboard可以一起展示0个或多个slice）：

接下来，我们就可以在slice和dashboard中分别看到刚才新建的slice和dashboard：

进入到刚才新建的dashboard，可以通过拖拽表格的右下角，放大和缩小表格：

还可以通过右上角的 Move Chart来移动表格：

修改dashboard之后，需要点击保存按钮进行保存：

画出更漂亮的表格

在 superset入门教程小节中，已经介绍过，可以通过superset load_examples命令导入一些测试数据，其中包含若干slice和dashboard，因此可以通过研究这些slice，来学习画出比Table View更“漂亮”的表格。

遇到的问题

superset 0.18.2依赖pandas 0.19.2，pandas依赖numpy，但是当numpy版本高于1.7.0的时候，运行superset会报错，所以本文是先安装numpy 1.7.0，然后安装的pandas 0.19.2 和 superset 0.18.2，这点可能和其他的教程有所不同。

待解决的事项

用户的权限控制
与Apache kylin集成

你可能感兴趣的:(superset)

Superset二次开发之源码DependencyList.tsx 分析 aimmon Superset二次开发 Superset BI 二次开发 typescript 前端
功能点路径superset-frontend\src\dashboard\components\nativeFilters\FiltersConfigModal\FiltersConfigForm\DependencyList.tsx/***LicensedtotheApacheSoftwareFoundation(ASF)underone*ormorecontributorlicenseagre
开源的BI大屏设计工具易道合之逍遥峰开源工具信息可视化
开源的BI大屏设计工具提供了丰富的功能和灵活性，帮助用户快速构建和展示数据可视化大屏。以下是一些知名的开源BI大屏设计工具及其特点：ApacheSuperset定位：现代化的、企业级的数据探索与可视化平台。功能：提供丰富的数据源连接选项（如SQLAlchemy）和强大的可视化功能。用户可以自定义仪表板（Dashboards），快速创建数据大屏。特点：支持多种数据源，界面友好，适合有一定技术背景的用
python补集运算_Python 的集合（set）运算 weixin_39644494 python补集运算
数学里集合运算在Python语言的set数据类型中也有对应的运算。子集⊆、真子集⊂判断真子集的⊂符号，在Python语言中，对应set类型的运算表示包含的⊇符号，对应set类型的>=运算，和内置函数issuperset()A={1,2,3}B={1,2,3,4,5}B>=A#TrueB>A#TrueA>=A#TrueA>B#FalseA.issuperset(B)#FalseB.issuperse
python集合运算_Python 的集合（set）运算 weixin_39867296 python集合运算
数学里集合运算在Python语言的set数据类型中也有对应的运算。子集⊆、真子集⊂判断真子集的⊂符号，在Python语言中，对应set类型的运算表示包含的⊇符号，对应set类型的>=运算，和内置函数issuperset()A={1,2,3}B={1,2,3,4,5}B>=A#TrueB>A#TrueA>=A#TrueA>B#FalseA.issuperset(B)#FalseB.issuperse
Superset 连接elasticsearch 帅到无语 elasticsearch 大数据搜索引擎
官方文档https://superset.apache.org/docs/databases/elasticsearch/安装elasticsearch-dbapi库pipinstallelasticsearch-dbapi安装成功后有账号密码填入：elasticsearch+http://{user}:{password}@{host}:9200/
Superset二次开发之Superset架构理解 aimmon 架构 superset BI
技术框架框架作用前端React构建用户界面的JavaScript库ReduxJavaScript应用的状态管理库，管理组件间的状态共享Webpack前端资源打包工具BabelJavaScript编译器D3.js数据可视化的JavaScript库后端Flask轻量级的Pythonweb框架，处理HTTP请求、路由以及其他Web服务功能SQLAlchemySQL工具包和对象关系映射（ORM）工具，处理
初始化Superset数据库时提示：Refusing to start due to insecure SECRET_KEY（由于不安全SECRET_KEY而拒绝启动）阿年、嗯啊大数据 Superset 拒绝启动由于不安全的key 初始化数据库失败
水善利万物而不争，处众人之所恶，故几于道文章目录安装完Superset3.0.0后，初始化数据库的时候报错：设置一下这个变量的值：exportSUPERSET_SECRET_KEY="oh-so-secret"，然后重新初始化就好了pipinstallapache-superset==3.0.0-ihttps://pypi.douban.com/simple/安装完Superset3.0.0后，初
（三十五）大数据实战——Superset可视化平台搭建厉害哥哥吖大数据大数据
前言本节内容是关于ApacheSuperset可视化平台的搭建，ApacheSuperset是一个现代的数据探索和可视化平台。它功能强大且十分易用，可对接各种数据源，包括很多现代的大数据分析引擎，拥有丰富的图表展示形式，并且支持自定义仪表盘。本节内容使用的操作系统是centos7,使用的数据源是mysql，需要提前安装好mysql数据库，这里关于mysql数据库的安装不做介绍。由于Superset
使用Docker安装Superset并设置Oracle访问和使用PG作Meta数据库 flexitime Linux Oracle database
一、安装Docker安装一个linux，可以是Centos或Ubuntu，如果是Centos7.X，那么要注意先将系统自带的docker先删除。下文以Centos7.9为例#删除自带的不完整版本yumremovedockerdocker-clientdocker-client-latest\docker-commondocker-latest\docker-latest-logrotate\doc
python第五节：集合set（4）谷晓光 python 前端开发语言
集合其他方法：len(s)set的长度xinsx是否是s的成员xnotinsx是否不是s的成员s.issubset(t)是否s中的每一个元素都在t中s.issuperset(t)是否t中的每一个元素都在ss.union(t)返回一个新的set包含s和t中的每一个元素s.intersection(t)返回一个新的set包含s和t中的公共元素s.difference(t)返回一个新的set包含s中有但
可视化开源组件superset-1.3.0源码编译安装 cgkbfrd
【GitHub源码下载】gitclonehttps://github.com/apache/superset.git【创建虚拟环境】#安装虚拟环境构建工具pipinstallvirtualenv#创建虚拟环境virtualenvmy_project_env#进入虚拟环境：sourcemy_project_env/bin/activate******************若报错**********
Superset安装指南程序员劝退师_ docker linux 运维
Superset安装教程可以先安装docker–>安装dockercompose–>安装superset文章目录Superset安装教程可以先安装docker-->安装dockercompose-->安装superset在Ubuntu20.04上安装Docker以非Root用户身份执行Docker验证Docker安装过程在Ubuntu中安装DockerCompose使用Pip安装DockerCom
superset未授权访问漏洞（CVE-2023-27524）复现 fly夏天漏洞复现安全漏洞漏洞复现 superset
Superset是一个开源的数据探索和可视化平台。它由Apache软件基金会支持，旨在帮助用户通过直观的方式探索、分析和可视化复杂的数据集。Superset支持多种数据源，包括关系型数据库、NoSQL数据库和各种其他数据存储系统。ApacheSuperset2.0.1版本及之前版本存在安全漏洞。攻击者利用该漏洞验证和访问未经授权的资源。1.漏洞级别高危2.漏洞搜索fofatitle="Supers
Linux docker 容器安装superset全部过程（superset docker版本）荔枝味的真知棒 linux docker 运维
解释一波ApacheSuperset是一款由Python语言为主开发的开源时髦数据探索分析以及可视化的报表平台；她支持丰富的数据源，且拥有多姿多彩的可视化图表选择。官网：https://superset.apache.org/github：https://github.com/apache/superset如果你的机器上已经安装了docker，请忽略安装docker的操作1.安装docker1.1
如何在CentOS使用docker-compose部署Apache Superset并实现公网访问屿小夏 IT杂谈 centos docker apache 开源服务器
文章目录前言1.使用Docker部署ApacheSuperset1.1第一步安装docker、dockercompose1.2克隆superset代码到本地并使用dockercompose启动2.安装cpolar内网穿透，实现公网访问3.设置固定连接公网地址前言Superset是一款由中国知名科技公司开源的“现代化的企业级BI（商业智能）Web应用程序”，其通过创建和分享dashboard，为数据
superset安装和部署(超详细) 絲箹大数据 linux conda python
目录1.Superset入门1.1Superset概述1.2Superset应用场景2.Superset安装及使用2.1安装Python环境2.1.1安装Miniconda2.1.2创建Python3.7环境2.2Superset部署2.2.1安装依赖2.2.2安装Superset2.2.3启动Supterset2.2.4superset启停脚本1.Superset入门1.1Superset概述A
使用Docker部署Apache Superset结合内网穿透实现远程访问本地服务一棵西兰花 cpolar docker apache 容器 cpolar
文章目录前言1.使用Docker部署ApacheSuperset1.1第一步安装docker、dockercompose1.2克隆superset代码到本地并使用dockercompose启动2.安装cpolar内网穿透，实现公网访问3.设置固定连接公网地址前言Superset是一款由中国知名科技公司开源的“现代化的企业级BI（商业智能）Web应用程序”，其通过创建和分享dashboard，为数据
认识Typescript | Vue3源码举例白茶_别事
初次见面官方对其只用了一句话来描述TypeScriptisatypedsupersetofJavaScriptthatcompilestoplainJavaScript.Anybrowser.Anyhost.AnyOS.Opensource.大致意思为，TypeScript是开源的，TypeScript是JavaScript的类型的超集，它可以编译成纯JavaScript。编译出来的JavaScr
Superset环境配置与部署 You Only Live Once_2 python virtualenv
静态IP设置#修改网卡配置文件vim/etc/sysconfig/network-scripts/ifcfg-ens33#修改文件内容TYPE=EthernetPROXY_METHOD=noneBROWSER_ONLY=noBOOTPROTO=staticIPADDR=192.168.18.130NETMASK=255.255.255.0GATEWAY=192.168.18.2DEFROUTE=y
supervisor添加环境变量阿莱_1b6f
只需要在/etc/supervisord/文件夹下，找到程序的配置文件，如/etc/supervisord/superset.conf在配置文件中增加一行environment=SUPERSET_HOME=/home/qboxserver/.superset,SUPERSET_WEBSERVER_PORT=7070多个环境变量用逗号隔开，就可以了，一个完整的配置文件如下[program:super
ModuleNotFoundError: No module named ‘wtforms.ext‘ 不负长风 #python后端开发 python
flask运行报错：ModuleNotFoundError:Nomodulenamed'wtforms.ext'解决办法：python-mpipinstallWTForms==2.3.3参考：superset安装及连接clickhouse可视化_supersetclickhouse-CSDN博客
工作之后如何高效的学习？刘凯KAI 生活感悟
工作之后如何高效的学习？接近1年不太顺心的工作经历20年7月完成毕业论文答辩后，匆匆忙忙就进了职场。一开始对工作感到非常期待，刚入司的时候也是十分激动，准备大干一场，给自己定了一个小目标：弄出一个像Airbnb公司出品的superset的数据分析平台，从爬取数据源开始，到数据加工可视化，并包含一些简单的机器学习分析。因为本科研究生读的都是机械，所以在数据分析上，各方面技能都显得不足，于是拼命学习各
Python零基础入门篇 - 16 - Python中的集合，Python面试题2019 不放弃的小康程序员面试经验分享开发语言
文章目录什么是集合？定义集合与列表的区别特殊集合[常见运算操作](about:blank#_运算符|运算符-运算符&运算符^关键字in常见方法add(item)方法remove(item)方法clear()方法union()方法intersection()方法issubset()方法issuperset()方法小节[]()什么是集合？集合是一个无序、不重复的序列它的基本用法包括成员检测和消除重复元
BI工具调研有语忆语大数据之数据仓库 Superset
1、前言目前公司使用Tableau作为BI工具，但是感觉不是很好用，且国内市场已经不维护了，所以打算换下BI工具，因此需要针对当前市场开源和商业的BI工具进行调研，看看是买商业的还是用开源的。基于以下部分开源的做了一个表格对照。2、各个开源BI工具网站https://superset.apache.org/docs/databases/installing-database-drivers/htt
importlib_metadata.PackageNotFoundError: No package metadata was found for apache-superset Hi-CWJ Superset apache ubuntu linux superset
在superset新增页面之后需要supersetinit刷新权限，但是执行报错：(superset)cwj0@ubuntu:~/anaconda3/envs/superset/lib/python3.7/site-packages/incubator-superset$supersetinitTraceback(mostrecentcalllast):File"/home/cwj0/anacon
Superset二次开发之环境准备-Nodejs aimmon superset BI node.js npm
一、下载安装Nodejs①打开nodejs官网Node.js击下载LTS版本.不建议下载最新版,会有版本冲突.可以先查看一下所有版本PreviousReleases|Node.js,我下载的Node.js16.20.2,下载地址https://nodejs.org/dist/v16.20.2/node-v16.20.2-x64.msi②直接安装③这个位置可以勾选，也可以不勾选，勾选了后自动安装一些
Superset服务安装 jast_zsh Superset Superset 大数据
文章目录Superset概述Superset应用场景Superset安装及使用安装Python环境安装Miniconda下载Miniconda(Python3版本)安装Miniconda取消每次登陆自动激活`condabase`环境创建Python3.7(Superset)环境配置conda国内镜像创建`Superset`环境激活`Superset`环境查看python版本Superset部署安装
【TypeScript】TypeScript基础 the_fool_
API:https://ts.xcatliu.com/首先，我对TypeScript的理解如下：TypeScript是JavaScript的一个超集，主要提供了类型系统和对ES6的支持，它由Microsoft开发，代码开源于GitHub上。其次引用官网的定义：TypeScriptisatypedsupersetofJavaScriptthatcompilestoplainJavaScript.An
Trino Presto 等 SQL 连接客户端工具 tonglingtou1875 大数据数据库 trino presto sql
1、使用DBeaver连接【推荐】支持数据源多，功能丰富，使用方便。下载：Download|DBeaverCommunity2、使用TrinoCLI连接查询结果中文可能会乱码。dockerexec-ittrinotrino3、使用HUE连接HUE配置Trino文档：Connectors::HueSQLAssistantDocumentation4、使用SupersetSQLLab连接需要先选择数据
Superset二次开发之部署问题汇总（持续更新ing） aimmon Superset Superset BI 问题安装部署
1.ERROR:Couldnotbuildwheelsforpython-geohash,whichisrequiredtoinstallpyproject.toml-basedprojects#缺少geohashwhl文件,下载地址www.lfd.uci.edu/~gohlke/pythonlibs/pipinstallgeohash文件路径2.AttributeError:module'sql
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end