阿里出品的ETL工具dataX初体验

我的毕设选择了大数据方向的题目。大数据的第一步就是要拿到足够的数据源。现实情况中我们需要的数据源分布在不同的业务系统中，而这些系统往往是异构的，而且我们的分析过程不能影响原有业务系统的运行。为了把不同的数据归集起来，我开始了解和接触ETL。本篇介绍阿里的开源ETL工具dataX。

ETL&&常用工具

ETL，是英文 Extract-Transform-Load 的缩写，用来描述将数据从来源端经过抽取（extract）、转换（transform）、加载（load）至目的端的过程。

我的理解就是从业务系统中根据所要分析的主题，建立数据仓库的过程。大数据的应用已经非常广泛，ETL过程现在已经发展成为一个比较专门的职业，相关联的包括ETL工程师，BI分析师等等。

数据的迁移和集成都需要ETL来实现，一般来说在数据仓库的开发过程中ETL会占到70%到80%的时间，我了解到的ETL工具包括：

Kattle是一个开源的ETL工具，优点是免费，资料挺多。功能挺全面的，我折腾过一段时间，感觉不是很符合需要，想要在web上使用确实会有点困难，也可能是了解不深。
DataStage，这是IBM为其配套的DB2开发的ETL工具，也可以用于其它数据库数据的集成，这个工具不错，银行用的挺多的。
Informatica，这是美国的一个数据集成公司的开发的数据集成工具，有图形界面。
sqoop，这个是hadoop生态里的一个数据导入工具，但是它依赖于hadoop环境，也有点不符合我现在阶段的需要。

当然还有其他挺多，毕竟对于数据的处理需求从信息机书诞生开始就一直存在。上面提到的这些工具比较强大，功能全面，但可能目前知识技能有限，驾驭起来不是很方便，折腾过一段时间后放弃了。我们常用的一些数据库工具也会带有导入导出功能，通过文本文件，csv文件等都能完成一个数据中专过程，但相对比较麻烦，而且功能太少对数据处理不是很方便。

直到我去云栖大会听说了DataX ，这个简洁，高效，开箱即用的ETL工具，测试过后效率也不错，调试信息也很丰富，才发现这就是我需要的。官方介绍如下：

DataX 是一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、MaxCompute(原ODPS)、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。

dataX本身只是一个数据库同步框架，通过插件体系完成数据同步过程reader插件用于读入，writer插件用于写出，中间的framework可以定义transform插件完成数据转化的需要。
使用它之后，我们的数据同步工作就简化成了：根据数据源选择对应的reader或者writer插件，填写必要的一个配置文件，一句命令搞定全部。

dataX安装配置

系统环境windows 、linux均可，其他必须的依赖包括：
- JDK(1.8)
- Python(推荐Python2.6.X)
- Apache Maven 3.x （想通过源码编译的话需要，否则直接用二进制包即可）
安装
- 下载安装tar包（https://github.com/alibaba/DataX)
- 解压至本地某个目录，修改权限为755，进入bin目录，即可运行样例同步作业。
```
$ tar zxvf datax.tar.gz
$ sudo chmod -R 755 {YOUR_DATAX_HOME}
$ cd  {YOUR_DATAX_HOME}/bin
$ python datax.py ../job/job.json
```
  如果一切顺利就会看到样例输出，说明工具已经就绪可以使用了。

配置文件介绍

他的全部使用就如同安装配置部分所说,仅仅是执行一个python脚本，传入一个json配置文件。我们的关键工作就是定义这个json配置。在bin目录下也已经给出了样例配置，不过针对不同的数据源还是会有些许区别。
我们可以使用如下命令查看我们具体需要的配置文件样例：

 python datax.py -r {YOUR_READER} -w {YOUR_WRITER}

比如我现在需要的是从sqlserver读入，写到mysql，那么就可以尝试：
python datax.py -r sqlservereader -w mysqlwriter
输出如下：

{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "sqlserverreader",
                    "parameter": {
                        "connection": [
                            {
                               /***省略多条****/
                            }
                        ],
            "column": ["*"],
                         /***省略多条****/
                    }
                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                        "column": ['*'],
                        "connection": [
                            {
                                 /***省略多条****/
                            }
                        ],
                        "password": " /***省略多条****/",
                        "username": "root",
                        "writeMode": "insert"
                    }
                }
            }
        ],
        "setting": {
            "speed": {
                "channel": "5"
            }
        }
    }
}

大致也是非常容易理解的，配置数据库账号密码，配置同步的表名列名等等信息。
jdbcUrl，username，password，table，column，writeMode（insert/replace/update）等为必选项，见名知意。
按照json格式填写即可，reader支持配置多个连接，只要有一个连通即可，writer只能配置一个连接。
更详细的配置参考官方wiki：
https://github.com/alibaba/DataX/wiki/DataX-all-data-channels
Transformer的使用见下：
https://github.com/alibaba/DataX/blob/master/transformer/doc/transformer.md
windows下乱码修复
我把这个工具迁移到一台windows主机上使用时候看到控制台友好的中文提示居然都变成了乱码了（话说有中文提示也是我选择他很重要的理由啊）。还好官方也给出了解决方案：
1. 打开CMD.exe命令行窗口
2. 通过 chcp命令改变代码页，UTF-8的代码页为65001
  chcp 65001
  执行该操作后，代码页就被变成UTF-8了。但是，在窗口中仍旧不能正确显示UTF-8字符。
3. 修改窗口属性，改变字体
  在命令行标题栏上点击右键，选择"属性"->"字体"，将字体修改为True Type字体"Lucida Console"，然后点击确定将属性应用到当前窗口。

性能测试

单核8G的虚拟机，这个速度还算可以吧，可能是数据读写不在同一台机子上网络传输也消耗了不少时间。

MySQL系列之数据导入导出 ZHOU西口数据库 mysql 数据库备份与恢复 mysqldump load data
前言大数据与云计算作为当今时代，数据要素发展的“动力引擎”，已经走进了社会生活的方方方面。而背后承载的云服务或数据服务的高效运转，起了决定作用。作为数据存储的重要工具，数据库的品类和特性也日新月异。从树型、网络型到关系型，从集中式到分布式，均可胜任不同的业务场景和数据存储要求。在这个云时代（CloudAge），作为“轻、快、高”的代表，MySQL作为RDB的优等生，备受各行各业的青睐。从今天开始，
大数据导论（2）---大数据与云计算、物联网、人工智能冒冒菜菜大数据导论大数据导论云计算和物联网课程学习
文章目录1.云计算1.1云计算概念1.2云计算的服务模式和类型1.3云计算的数据中心与应用2.物联网2.1物联网的概念和关键技术2.2物联网的应用和产业2.3大数据与云计算、物联网的关系1.云计算1.1云计算概念 1.首先从商业角度给云计算下一个定义：通过网络、以服务的方式为千家万户（包含政府、企业和个人用户）提供非常廉价的IT资源。 2.云计算是一种全新的技术，包含了虚拟化、分布式存储、分布式计
大数据与云计算 | 华科软院2020年期末考试试题及答案哆啦一泓实验考试与课设
【注：答案为本人所写，仅供参考】1.就本课程最后一个实验，回答下列问题：(1)请描述该实验系统的功能和你所做的工作(8分)；(2)详细描述实验系统在云端的部署过程(6分)；(3)简述实验过程的难点/痛点和自己做实验的体会(6分)。(1)在阿里云ECS服务器上安装FTP、MySQL服务、JDK、Nginx、tomcat，并编写JavaWeb应用，部署到阿里云服务器，实现学生信息的增删查改、管理员登录
大数据技术原理与应用期末复习知识点全总结（林子雨版天玑y 期末复习大数据学习学习方法笔记 bigdata hdfs hadoop
目录1.第一章大数据概述：（一）三次信息化浪潮（二）人类社会数据产生方式的3个阶段（三）大数据的3个发展阶段（四）大数据4V概念（五）数据存储单位之间的换算关系（六）大数据对科学研究的影响（七）大数据对思维方式的影响（八）大数据技术的不同层面及其功能（九）大数据计算模式及其代表产品（十）大数据产业的6个层次（十一）大数据与云计算、物联网（十二）物联网体系架构（十三）大数据与云计算、物联网的关系第二
助推酒店产业智能化升级 I 喜尔康出席中国饭店协会成立三十周年总结展望大会智哪儿全屋智能智能家居智能家居
1月8日，中国饭店协会六届四次理事会暨中国饭店协会成立三十周年总结展望大会在广州隆重举办。作为中国饭店协会理事单位及此次大会的赞助商，喜尔康受邀出席大会。现场，喜尔康集团董事长吴锡山发表了《智能家居赋能后装修时代》的主题演讲，引发现场共鸣。1、智能家居势不可挡吴锡山表示，5G、大数据与云计算等新技术的发展，特别是科技巨头推动的人工智能大爆发，带来了生产关系的深刻变革。家居等各行各业，包括酒店、建筑
3-分布式存储之Ceph 师范大学通信大怨总分布式 ceph
任务背景虽然使用了分布式的glusterfs存储,但是对于爆炸式的数据增长仍然感觉力不从心。对于大数据与云计算等技术的成熟,存储也需要跟上步伐.所以这次我们选用对象存储.任务要求1,搭建ceph集群2,实现对象存储的应用任务拆解1,了解ceph2,搭建ceph集群3,了解rados原生数据存取4,实现ceph文件存储5,实现ceph块存储6,实现ceph对象存储学习目标能够成功部署ceph集群能够
大数据和智能数据应用架构系列教程之：大数据与云计算禅与计算机程序设计艺术 AI实战大数据AI人工智能 Python实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.背景介绍大数据简介大数据（英语：BigData），指的是一个涵盖多个不同主题、来源、传播方式的海量、复杂和不断增长的数据集合。由于数据的增长迅速、结构化程度高、采集渠道多样，使得大数据产生了新的分析需求、挖掘价值并推动产业革命。随着大数据的飞速发展，越来越多的人们发现自己正在被迫依赖于数据驱动的生产活动，包括金融服务、商业模式、个性化推荐等。同时，大数据也为各行各业
《云计算-刘鹏》学习笔记-第一章：大数据与云计算流动的风与雪其他云计算大数据 IaaS PaaS SaaS
文章目录0笔记说明1大数据时代2云计算——大数据的计算3云计算发展现状4云计算实现机制5云计算压倒性的成本优势0笔记说明参考书籍为《云计算-第三版》，作者为刘鹏。1大数据时代大数据的定义如下：海量数据或巨量数据，其规模巨大到无法通过目前主流的计算机系统在合理时间内获取、存储、管理、处理并提炼以帮助使用者决策。大数据具有以下的特征，即4V+1C：1、数据量大(Volume)：存储的数据量巨大，PB级
大数据与云计算技术---（二）Openstack云计算平台李牛克斯小学生. 六 Linux企业运维 openstack 云计算
一、环境主机网络控制节点服务器配置网络接口配置域名解析网络时间协议(NTP)控制节点服务器其它节点服务器OpenStack包启用OpenStack库安装OpenStack客户端SQL数据库安全并配置组件启动数据库服务消息队列安全并配置组件图形工具Memcached安全并配置组件启动Memcached服务认证服务安装和配置先决条件安全并配置组件c2cec39f898636bfa542配置Apache
大数据、人工智能与云计算的融合与应用 ShuYunBIGDATA 大数据
1引言人工智能、大数据与云计算三者有着密不可分的联系。人工智能从1956年开始发展，在大数据技术出现之前已经发展了数十年，几起几落，但当遇到了大数据与分布式技术的发展，解决了计算力和训练数据量的问题，开始产生巨大的生产价值；同时，大数据技术通过将传统机器学习算法分布式实现，向人工智能领域延伸；此外，随着数据不断汇聚在一个平台，企业大数据基础平台服务各个部门以及分支机构的需求越来越迫切。通过容器技术
JavaEE入门级别最全教程1--初学者必看 itLaity Java基础知识讲解与总结 javaee java 初学者
导读相信很多初入编程的小伙伴对于语言有种选择恐惧症，对于Java也不知怎么去学，这期文章J哥会给大家整理最适合小白学习的JavaEE教程。大数据的概述#大数据与云计算的学习概念:海量数据，具有高增长率、数据类型多样性、一定时间内无法使用常规软件进行捕捉、管理和处理的数据集合。特征:4V特征(是大家普遍认可的)大量多样高速价值#大数据能做什么？在海量的各种各样类型的价值密度低的数据中，我们要进行的是
架构师必知必会系列：大数据处理与架构禅与计算机程序设计艺术禅与计算机程序设计艺术架构师必知必会系列大数据AI人工智能大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.简介随着互联网、电子商务等新兴产业的发展，互联网企业在海量数据产生、收集、分析的过程中越来越依赖于大数据处理平台进行数据的存储、加工、计算。由于数据量的爆炸性增长，传统的数据处理技术已经无法满足实时分析需求。为了解决这一难题，云计算与大数据平台成为行业主要的发展方向。目前，云计算与大数据领域处于蓬勃发展阶段。大数据与云计算技术的广泛应用导致了大数据的“三驾马车”模型
大数据和智能数据应用架构系列教程之：大数据与云计算禅与计算机程序设计艺术禅与计算机程序设计艺术大数据AI人工智能大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.背景介绍云计算是现代IT技术中一个重要组成部分，它赋予了用户更多的灵活性、弹性、按需付费能力等，随着互联网和移动互联网的蓬勃发展，越来越多的企业开始转向云计算平台作为基础设施，构建自己的大数据和智能分析平台。而大数据的应用也越来越成为云计算平台的一个重要组成部分，包括数据采集、数据存储、数据处理、数据分析等。传统上，大数据应用架构往往存在以下几个难点：数据采集难度高
2019年华为网络精英挑战赛-大数据 Wakeupeme328514
1.1大数据的基本特征Volume：数量大；Variety：种类和来源多样化；Velocity：及时性要求高；Value：价值密度低。1.1.2Hadoop特点开放，全球生态；结构化、半结构化、非结构化；高性能、实时。1.2大数据理念变革与传统数据对比创新点1.3大数据与云计算、人工智能AI1.4企业级大数据关键技术1.4.2数据处理批处理：适用于传统数据库或分布式数据库；支持结构化与非结构化数据
大数据概述（林子雨慕课课程）几窗花鸢大数据应用大数据
文章目录1.大数据概述1.1大数据概念和影响1.2大数据的应用1.3大数据的关键技术1.4大数据与云计算和物联网的关系云计算物联网1.大数据概述大数据的四大特点：大量化、快速化、多样化、价值密度低1.1大数据概念和影响大数据摩尔定律大数据由结构化和非结构化的数据组成，非结构化的数据占比大，如图像数据结构化的数据就是关系数据库表中的图表数据非结构化的数据种类繁多大数据从数据的生成到消耗，时间窗口非常
hadoop生态现状、介绍、部署小小哭包服务器大数据 Linux hadoop 大数据分布式
一、引出hadoop1、hadoop的高薪现状各招聘平台都有许多hadoop高薪职位，可以看看职位所需求的技能---->hadoop是什么，为什么会这么高薪？引出大数据，大数据时代，大数据与云计算2、大数据时代的介绍大数据的故事，google根据海量数据所作出的一次流行病传播趋势预测，及时性和准确性都远超医疗体系根据传统方法所作出的预警，渲染大数据技术将给这个时代带来的巨大变革---->大数据的4
大数据与云计算实验一惑星撞地球大数据云计算
检查是否开启sudoservicedockerstatus开启服务sudoservicedockerstart运行服务sudodockerrun-itd-p8080:80nginx查询IDdockerps-all进入容器shellsudodockerexec-it/bin/bash找到/usr/share/nginx/html/index.html文件编辑完成
大数据与云计算——让我们进入数字化的新纪元 Sirius·Black 大数据云计算
当谈论大数据和云计算时，我们进入了一个数字化时代的新纪元。这两个领域在科技和商业领域都有着深远的影响，改变了我们如何处理和存储数据，以及如何进行计算和分析。本文将探讨大数据和云计算的基本概念，它们的关系以及它们在不同领域的应用。大数据与云计算——数字化的新纪元基本概念什么是大数据什么是云计算大数据与云计算的关系1.存储和处理大数据2.弹性和可扩展性3.数据分析和挖掘4.数据安全和隐私应用领域1.医
基于 KubeSphere 的应用容器化在智能网联汽车领域的实践云计算
公司简介某国家级智能网联汽车研究中心成立于2018年，是担当产业发展咨询与建议、共性技术研发中心、创新成果转化的国家级创新平台，旨在提高我国在智能网联汽车及相关产业在全球价值链中的地位。目前着力建设基于大数据与云计算的智能汽车云端运营控制中心平台。推进云端运营控制中心建设的过程中，运控中心平台的集成、部署、运维方案经历了3代的升级迭代过程。第一代部署方案是直接将平台的前后端各个模块手动部署在自有物
问道崂山 2018·中国（青岛）大数据应用与解决方案高峰论坛圆满落幕 chuntu1126 大数据嵌入式操作系统
12月6日-7日，“2018问道崂山·中国（青岛）大数据应用与解决方案高峰论坛-暨首届大快搜索合作伙伴生态系统大会&开发者技术沙龙”在青岛海天大剧院酒店成功举办。本次高峰论坛由青岛市大数据与云计算行业协会、山东省计算机学会大数据与智能计算专委会联合主办，大快搜索、青岛新闻网承办，论坛以“创新大数据汇聚新动能”为主题，依托本次活动主要承办方大快搜索全国合作伙伴资源，邀请了百余家知名大数据企业参会，共
大数据课程复习腹黑客大数据
信息科技为大数据时代提供技术支持存储设备容量不断增加CPU处理能力大幅度提升网络带宽不断增加大数据4V特征数据量大数据类型繁多处理速度快价值密度底大数据对思维方式的影响全样而非抽样效率而非精确相关而非因果云计算关键技术虚拟化分布式存储分布式计算多租户大数据与云计算，物联网的关系三者区别大数据侧重与对海量数据的存储，处理分析，从海量数据中发现价值，服务生产生活云计算本质旨在整合优化各种IT资源，通过
为什么这么多人都想学大数据？宁可放弃本职工作也要转行学习。大数据具有什么魔力色彩飞上天的猫神
首先大数据是什么：大数据(bigdata,megadata)，或称巨量资料，指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。2、大数据的4V特点：Volume（大量）、Velocity（高速）、Variety（多样）、Value（价值）。3、从技术上看，大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理，必须
大数据与云计算之间的关系是怎样的？大数据基础入门教程大数据 hadoop spark
如今，两种主流技术已成为IT领域关注的焦点-大数据和云计算。根本不同的是，大数据只涉及处理海量数据，而云计算则涉及基础架构。但是，大数据和云技术提供的简化功能是其被大量企业采用的主要原因。例如，亚马逊的“ElasticMapReduce”演示了如何利用CloudElasticComputes的功能进行大数据处理。两者的结合为组织带来了有益的结果。更不用说，这两种技术都处于发展阶段，但是它们的结合在
大数据与云计算 HappySSweet 大数据
大数据的4个特点：量大：存储大，计算量大样多：来源多，格式多快速：生成速度快，处理速度要求快价值密度低：价值密度的高低和数据总量的大小成反比云计算和大数据的关系：云计算是底层平台，大数据是应用，云计算作为底层平台整合计算和存储网络等资源，同时提供基础架构资源弹性伸缩的能力，大数据在云计算平台支撑下，调度下层资源进行数据源加载，计算和最终结果输出等动作。
基于 KubeSphere 的应用容器化在智能网联汽车领域的实践 KubeSphere 云原生 k8s 容器平台 kubesphere 云计算
公司简介某国家级智能网联汽车研究中心成立于2018年，是担当产业发展咨询与建议、共性技术研发中心、创新成果转化的国家级创新平台，旨在提高我国在智能网联汽车及相关产业在全球价值链中的地位。目前着力建设基于大数据与云计算的智能汽车云端运营控制中心平台。推进云端运营控制中心建设的过程中，运控中心平台的集成、部署、运维方案经历了3代的升级迭代过程。第一代部署方案是直接将平台的前后端各个模块手动部署在自有物
基于 KubeSphere 的应用容器化在智能网联汽车领域的实践云计算
公司简介某国家级智能网联汽车研究中心成立于2018年，是担当产业发展咨询与建议、共性技术研发中心、创新成果转化的国家级创新平台，旨在提高我国在智能网联汽车及相关产业在全球价值链中的地位。目前着力建设基于大数据与云计算的智能汽车云端运营控制中心平台。推进云端运营控制中心建设的过程中，运控中心平台的集成、部署、运维方案经历了3代的升级迭代过程。第一代部署方案是直接将平台的前后端各个模块手动部署在自有物
大数据与云计算柴玉宾
通俗讲解：未来云计算下面读两个故事一定弄懂“云计算”故事一公共电网抛弃了爱迪生爱迪生的牛气无法言说，这辈子有2000多项发明，在科学界他吃的盐比普通人吃的饭还多。但就是这么一个牛人，也曾被拍打在沙滩上：公共电网狠狠地抛弃了他。1878年，爱迪生决定开发一种新产品——电灯泡，为了持续地给它供电，他紧跟着又发明了电流表、发电机等，这是一套完整的供电系统：爱迪生灯具公司制造灯泡，爱迪生电器公司制造发电机
解锁潜力，驭数赋能：大数据与云计算的强强联合久数君数据可视化大数据云计算物联网信息可视化
随着数字化时代的来临，大数据和云计算已成为信息技术领域的两大热门话题。大数据指的是以海量、高速、多样化的数据为基础，通过分析和挖掘来获得有价值的信息和洞察。而云计算则是一种基于网络的计算模式，通过将数据和应用程序存储在云端服务器上，实现资源共享和灵活扩展。这两个领域的结合，为企业和组织带来了许多机遇和挑战。大数据和云计算的结合使得数据的收集、存储和处理更加高效和便捷。通过云计算的弹性和可扩展性，企
冲量在线荣获2021中关村国际前沿科技创新大赛TOP10 impulseonline 冲量在线人工智能区块链 big data
2021年11月，“中关村前沿大赛”大数据与云计算领域决赛在北京落下帷幕。经历初赛的激烈角逐，冲量在线团队凭借“冲量在线数据互联平台”从数百个参赛项目中脱颖而出，进入到决赛轮15强路演，并最终登顶大数据与云计算领域Top10。北京市科委和中关村管委会于2017年创设中关村国际前沿科技创新大赛，大赛得到了教育部、中科院、清华大学、北京大学、中国科协、中国证券投资基金业协会等部门的大力支持。2021年
云动力的大数据与云计算相辅相成 lxwei
传统的单机处理模式不但成本越来越高，而且不易扩展，并且随着数据量的递增、数据处理复杂度的增加，相应的性能和扩展瓶颈将会越来越大。在这种情况下，云计算所具备的弹性伸缩和动态调配、资源的虚拟化和系统的透明性、支持多租户、支持按量计费或按需使用，以及绿色节能等基本要素正好契合了新型大数据处理技术的需求;而以云计算为典型代表的新一代计算模式，以及云计算平台这种支撑一切上层应用服务的底层基础架构，以其高可靠
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

阿里出品的ETL工具dataX初体验

你可能感兴趣的:(大数据与云计算)