u013424982

技术培训 | 青云QingCloud 对象存储应用与实践

QingStor 对象存储服务提供可无限扩展的存储空间、快速的数据存取性能、高度的可靠性和数据的安全性、细粒度的权限控制及简单易用的接口，以向广大用户提供廉价、可靠的存储系统。本次分享，QingCloud 系统工程师 Osier 会分享青云QingCloud 对象存储的概念、实际的应用案例及进一步研发计划。

大家好，我是青云QingCloud 系统工程师 Osier Yang。今天我来和大家分享一些对象存储方面的内容。

“QingStor”为“青云对象存储”的项目及产品名称，为行文方便，下文将皆以“QingStor”代指“青云对象存储”。

今天交流内容包括：

什么是对象
企业 A 的存储方案演化历程
什么是对象存储
开源方案探讨
QingStor 的架构及特性
如何使用 QingStor
QingStor 用户案例 (Hash Data Warehouse – HDW)
QingStor 更进一步的产品规划

1、什么是对象

我们从一个故事开始。在我们的对象存储研发后期，一个潜在客户来交流，他们想了解怎么用对象存储。交流期间，其中的技术负责人问了这样一个问题: “你们这既然是对象存储，那么它的类是怎么定义的？“。由此可见，即便是技术人员，也可能对”对象存储“产生误解。

所以要想讲清楚到底什么是”对象存储“，很有必要先解释“对象存储”这四个字，“存储”二字不必多说，凡 IT 从业者应该都理解，关键点是: 什么是“对象”?

Wikipedia 对“Object”分各领域做了解释(https://en.wikipedia.org/wiki/Object)。别的领域我们不管，我们只看哲学领域的定义，因为哲学领域的定义更具有普遍意义。Wikipedia 对“Object”在哲学领域的定义是:

a thing, being, or concept

在汉语里，和其英文本意最符合的词也就是”东西“了吧？百科里关于”东西“的释义如下:

泛指各种具体或抽象的人、事、物。例如:

明朱有炖《豹子和尚自还俗》：“我又无甚希奇物，我又无甚好东西，他偷我箇甚的？”
《红楼梦》第三五回：凤姐笑道：”这一宗东西，家常不大做；今儿宝兄弟提起来了，单做给他吃。“
沙汀《闯关》一：“感情真是一种奇怪的东西。”

在计算机领域，“对象”(Object)除了在面向对象编程用来表示一个类(Class)的实例(Instance)外，还被常用来表示一个变量(Variable)，一个函数(Function)，一个数据结构(Data Structure)，一段在内存中的实体，等等，相信计算机领域的研发人员在各种各样的代码或工具里都见过。举个例子，Linux Kernel (Linux操作系统的核心)的模块名以“.ko”为后缀名，“ko”的全称为“Kernel Object”，这里的“Object”和 JAVA/C++ 语言里的“Object”显然不是一回事。

由此可见，在计算机领域，“对象” (Object)这个词也是一个泛指意义的词，其意义也可类比汉语中的“东西”。你可以指任何一个事物为“东西”，也即你可以指任何一个事物为“Object”。具体是什么“东西”，依场景不同而不同。至于到底“对象存储”里的“对象”是什么“东西”，请见后文。

2、企业 A 的存储方案演化历程

要想理解什么是对象存储，我们从另外一个故事开始。企业 A 有一个应用，允许用户上传图片及视频，视频和图片的大小都比较小。

2.1 企业 A 存储方案 1

因为业务发展前期用户量很小，产生的数据量也足够小，最简单直接的方案为(实际生产中应该没人用这种方案，但最简单的方案往往更有助于我们看清问题本质）：

这种最简单直接的方案几乎到处是缺点:

单盘容量限制。总存储量及可存储的单个最大文件的大小均受单盘容量限制。
无数据冗余。主机宕机会导致服务不可用，甚至数据丢失；硬盘损坏会导致数据丢失。
无数据备份。假设企业A的运维人员误删数据，恢复数据将变得困难。
文件系统的限制。当存储的文件数目越来越多时，文件系统的目录树会变大，变深，读写性能会越来越差，inode 总数也可能达到限制。

2.2 企业 A 存储方案 2

随着用户上传的数据量不断增加，我们假设容量率先增大了瓶颈，企业 A 为了解决容量问题，将存储架构改变为:

注:
* PV (LVM Physical Volume)
* VG (LVM Volume Group)
* LV (LVM Logical Group)

以上方案的利用 LVM 将众多硬盘空间抽象为一块大硬盘，突破了单个硬盘的容量限制，容量需求增加时，添加硬盘到 VG ，并对 LV 进行扩容即可。支持文件系统级别的 Snapshot , 可将数据回滚至某个点。但仍有缺陷:

单机容量限制。可挂的硬盘总数有限制，即总容量仍然有限制。
无数据冗余。虽然 LVM 支持文件系统级别 Snapshot ，但 snapshot 只能将数据回滚到某个点。并不能够应对灾难情况，比如物理机宕机，服务仍然不可用，数据也可能丢失；硬盘损坏时，数据仍然可能会丢失。
文件系统的限制。当存储的文件数目越来越多时，文件系统的目录树会变大，变深，读写性能会越来越差，inode 总数也可能达到限制。

2.3 企业 A 存储方案 3

假设企业 A 的存储容量需求在短时间内达不到单机的容量限制，但随着业务的发展，企业 A 开始重视数据的安全性。存储方案进一步演化为：

方案三引入了软 RAID 来做数据的冗余，同时保留了 LVM 带来了灵活性。但仍然有缺点:

单机容量限制。可挂的硬盘总数有限制，即总容量仍然有限制。
文件系统的限制。当存储的文件数目越来越多时，文件系统的目录树会变大，变深，读写性能会越来越差，inode 总数也可能达到限制。
不可靠。当宕机时，服务便不可用。

2.4 企业 A 存储方案 4

我们假设企业 A 随着业务的进一步发展，存储容量需求在短时间内仍然达不到单机的容量限制，但开始重视服务的可靠性。故将存储方案进一步演化为:

此方案保留软 RAID 及 LVM 的同时，引入了 DRBD，通过网络来做块设备级别的复制，可靠性提高了一倍。但仍然有缺点:

单机容量限制。可挂的硬盘总数有限制，即总容量仍然有限制。
文件系统的限制。当存储的文件数目越来越多时，文件系统的目录树会变大，变深，读写性能会越来越差，inode 总数也可能达到限制。

2.5 企业 A 存储方案 5

随着业务的进一步发展，单机容量已无法满足企业A的存储需求。此时只剩下一条路：分布式存储。企业 A 不想投入人力自己开发分布式存储，而开源分布式存储方案繁多，经反复调研与测试，最终将方案确定为 HDFS :

HDFS的引入去除了单机容量的限制，但仍有缺陷:

Name Node的设计限制了不能够存储太多的文件，当存储的文件为大量小文件时，可存储的文件个数会逐渐到达瓶颈。

3、什么是对象存储

“对象存储”来源于英文“Object Storage”或“Object-based Storage”。有人可能会想，照上文所述，那“Object Storage”岂不是该翻译为“东西存储”？如果谁这么翻译，告诉我，我家里的剑好久不用了。

翻译归翻译，术语归术语，都不妨碍我们将“Object Storage”理解为“存东西的存储”，那么“对象存储”存的到底是什么“东西”？

3.1 对象存储的大致目标

现在我们回顾一下企业A经历的存储方案历程，为了满足不断发展及增长的业务需求，企业 A 不断得在解决容量，数据安全，高可靠，可存储文件多少，读写性能等诸多问题，方案也变的越来越复杂。

像企业 A 这种有大量存储需求的企业不在少数，而不同企业，不同业务的数据特征千差万别。对象存储作为一种面向多租户的公共服务，除应该具备企业A的存储方案演变过程中不断追求的特性外，还应该通用，不能假设用户的数据特征(如类型，大小)。

我们先大致归纳一下对象存储应该有的特性:

多租户；
不假设数据，包括类型，大小等；
存储空间可无限扩展，且性能该随容量水平扩展而线性提升，不然数据量越大，请求越多，性能却不提升，就不好玩儿了。
数据安全；
高可靠。

3.2 对象存储的索引设计

前面我们以企业 A 的存储方案演进过程中所遇到的问题，归纳出了对象存储的大致目标，但还只局限于在数据存储层讨论。下面我们来看看索引层。

细心的同学可能已经发现，前文中我们一直在提一个问题：文件系统的限制。当存储的文件数目越来越多时，文件系统的目录树会变大，变深，读写性能会越来越差，inode 总数也可能达到限制。

文件系统层次的限制根源在于当前的文件系统的设计是为单机存储而设计的，树状的索引结构在非海量数据时代，很好的完成了数据索引的使命。但在面向海量存储时，就表现出了一些先天性问题，尤其面向海量小文件时。

避免文件系统面对海量数据时的缺陷可以有多种方案，其中最直接有效的方案是构建独立索引层，这样既能避免文件系统索引的问题，同时能利用文件系统的长久以来积累下来的优势。那么怎么设计独立索引层？如前所述，文件系统面对海量数据时的缺陷主要来自于树状索引结构，那新构建的独立索引层就应该将树状索引压扁，能压多扁压多扁，最终的索引结构如下 (其中 Bucket 这一级是不可避免的，无论如何，存储空间总是要区分开的）。

如上图所示，“Service”为顶层命名空间(Namespace)，其下可有任意多个 Bucket (存储空间)，Bucket 命名空间为第一级命名空间，其下可以有任意多 Object。

3.3 什么是对象

探讨完数据存储层及索引层，我们终于可以回到本节开头的问题了:“对象存储”的“对象”是个什么“东西”?

如果有人了解过文件系统的实现，定会发现文件系统的索引结构里包含了许多元信息，而对于对象存储系统而言，其中很多元信息无意义，我们创建了独立的索引层，自然也不想再带着这些无意义的元信息，我们希望独立的索引层存储的索引不多不少，足够精简，只保留基本且必须的元信息：如 “类型”，“大小”，“校验值”，“最后修改时间”。

对于多数业务来说，基本的元信息已经足够，但对于某些业务而言，可能还需要更多的元信息。比如一个歌曲文件，除了类型、大小、校验值，最后修改时间，用户的业务还可能需要额外的描述，如:

歌手是谁
歌曲属于哪张唱片
歌曲属于什么风格
……

如果对象存储的索引层能够允许用户自定义元数据。用户就不需要单独维护数据库去存储这些信息。

了解了”对象”(Object)的索引构成后，我们终于可以归纳一下”对象”(Object)”到底是什么”东西”了。

* 数据实体 (Data Entity)
* 数据实体的元数据 (Metadata)
* 数据实体的用户定义元数据 (User defined metadata)

下面是一个文件的元数据示例：

~
HTTP/1.1 200 OK
Server: QingStor
Date: Sun, 16 Aug 2015 09:05:00 GMT
Last-Modified: Fri, 14 Aug 2015 09:10:39 GMT
ETag: "0c2f573d81194064b129e940edcefe9b"
Content-Type: image/jpeg
Content-Length: 7987
Connection: close
Request-ID: aa08cf7a43f611e5886952542e6ce14
~

其中的“Last-Modified”, “Content-Type”, “Content-Type”, “ETag”(数据实体的 MD5 值)即为 QingStor 上一个“对象”(Object)的元信息。

4、开源方案探讨

每次交流时，都会有人问到对象存储相关的开源方案，问 Qingstor 为什么我们没有采取开源方案。我们在正式开发 QingStor 前，确实调研及测试过不少开源方案，但无一能够满足我们的目标。下面我们就选几个主流的开源方案探讨一下。

4.1 Openstack Swift

上面是 Openstack Swift 的架构图。下面是 Swift 的问题:

未对小文件进行合并。从上面的架构图中我们可以看到，其没有文件合并组件，当存储的小文件数量过多时，系统会在最底层的文件系统这一层就会开始出现瓶颈，读，写，列取，甚至 Swift 自身组件（如 replicator，数据迁移／修复) 都可能会出问题。具体见: http://engineering.spilgames.com/openstack-swift-lots-small-files
Object 索引是在文件扩展属性里的，获取 Object 元信息慢，尤其当文件数目过多时。
Object 索引是在文件扩展属性里的，支持用户自定义 Object 元数据会进一步加剧元信息获取性能问题。
Object 索引存储在文件扩展属性里的，除此之外没有别的索引。一个 Container (存储空间)的元信息对应一个 Sqllite 数据库，其中维护着该 Container 下的 Object 列表信息，这是为了 Workaround 从文件系统列取 Container 下 Objects 时糟糕的性能。但问题是当一个 Container 下 Object 过多时，Sqllite 数据库撑不住。即单个 Container 下存储不了多少 Object。

4.2 Ceph Radosgw

Ceph Radosgw 看起来很美好，但其糟糕的索引设计注定完全不能用于生产。这里不展开说了，感兴趣的可以看下面的链接:
https://github.com/ceph/ceph/pull/2187

4.3 Gluster

Gluster 的设计非常工程派。无单独所应；未对文件进行任何切割或合并操作；所做的所有事情都是为了一个目的：一个更大的文件系统。

这种设计带来的问题是，它并未解决文件系统本身的限制，因为它未对文件系统的语义做任何修改。当存储海量小文件时，性能会变的很差，尽管 Gluster 为此做了各种优化（有兴趣的可以查找 Gluster 关于小文件读写性能优化的各种 translator )，但并不能改变其根本。

5、QingStor 的架构与实现

5.1 接入层

在章节“3”中我们逐步探讨了数据存储层，索引层，及对象。但为了循序渐进，企业A的存储演化过程中，我们刻意省略掉了一个组件: 接入层。

传统存储的访问接口各不相同。块存储暴露给用户的是一个一个的 Block 。文件系统或网络文件系统(如 NFS )暴露给用户的是 POSIX 文件系统接口。但无论是哪一种接口，都有一个共通的问题: 数据流转不便。

而对象存储通过将资源 URL 化，数据的流转方式就方便多了。

对象存储接收请求的协议为 HTTP ，所有一定有 HTTP Server ，接收到用户的文件上传和下载请求后，需要有相应的处理方法。且作为面向多租户的公有服务，无法假设用户的请求行为，所有用户加起来的并发请求可能会很大。另外，接入层得高可用。所以得引入负载均衡。

我们把最前端的负载均衡，后端的 HTTP Server ，及各种处理方法，统称为接入层。接入层作为QingStor的最外层建筑，向用户暴露 RESTful 的 API 。

5.2 多区域(Zone)部署

青云QingCloud IaaS 服务为多区域部署，用户可根据自己的需求选择适合自己的区域部署服务。而 QingStor 作为存储服务，不应该远离计算资源（简单计算资源如主机，复杂计算资源如 QingCloud 的大数据平台， Spark、Storm、 Hadoop、etc)。所以我们把决定权交给了用户，由用户决定如何部署计算及存储资源。

QingStor 的多区域部署示意图如下:

为了进一步拉近计算与存储的距离。同一区域的计算资源访问 QingStor 走内部网络。

5.3 单区域(Zone)架构

文中已分别就“接入层”，“索引层”，及“数据存储层”进行了探讨。这里进一步阐述一下QingStor架构设计的核心思想:

数据安全；
各层次均须具备水平扩展能力。

各层次的具体设计如下:

接入层: 无状态，意味着接入层可以任意水平扩展。
索引层: 多slave，保证索引数据不丢失，且高可靠; 分库，分表; 二级索引; sharding，做到可任意水平扩展。
数据存储层: 多副本 (3份)，保证数据不丢；单集群可水平扩展; 为避免单集群过大时的通讯风暴，支持多集群调度进一步提高数据存储层扩展性，以达到容量可无限扩展。

“接入层”，“索引层”，及“数据层”构成了QingStor的架构主干。此外，还有“调度器”，”监控服务“，及异步服务如“垃圾回收”，“文件合并”，“碎片整理”等。

5.4 QingStor 特性

无限水平扩展：系统可无限水平扩展，且在存储容量水平扩展时，数据存取的性能线性提升。
多区域：和 QingCloud IaaS 一样，QingStor 亦为多区域部署的服务。用户可根据自己的业务需求在不同区域创建存储空间（Bucket）。
高可靠：无单点故障，支持实时多副本，具备无条件的数据恢复能力。
通用数据存储：每个用户可拥有多个存储空间。单个存储空间（Bucket）容量不限，可存对象（Object）数量不限，可存对象（Object）类型不限。普通对象（Object）最大可达 5G ，通过分段上传 API 上传的单个对象（Object）大小最大可达 50T ，每个分段最大 5G 。
与计算资源紧密结合：与 QingCloud IaaS 资源可通过内网进行数据传输，保证高效的数据传输与处理，并节省用户的成本。
标准用户接口：向用户提供标准、规范且简单的 API 接口和 SDK 工具包，并提供详尽的 API 文档。
分段上传：支持对文件进行分段上传，最大支持 10000 段，每段大小最大可达 5G 。以允许用户将大文件在尽可能短的时间内上传。
断点续传：下载支持断点续传，以允许用户在网络质量较差的环境中仍能够下载资源。
安全认证模式：基于对称加密的请求认证方式；存储空间（Bucket）级别的访问控制，用户可将存* 储空间的读或写权限开放给单个或多个 QingCloud 用户，或所有人；支持通过 SSL 加密数据传输。
多维度监控：监控条目包括内网出/入流量、外网出/入流量、容量、内网 API 调用次数、外网 API 调用次数，及容量。各条目监控最小粒度均为 1 小时。

6、如何使用QingStor

除 API 及用户指南文档外，目前我们支持 Python SDK，控制台图形化界面，命令行工具:

用户指南：https://docs.qingcloud.com/guide/object_storage.html
API 文档: https://docs.qingcloud.com/qingstor/api/index.html
SDK 文档: https://docs.qingcloud.com/qingstor/api/sdk/index.html
CLI 文档: https://docs.qingcloud.com/qingstor/api/cli/index.html
控制台: https://console.qingcloud.com

7、用户案例 (Hash Data Warehouse – HDW)

HDW(Hash Data Warehouse)是由北京酷克数据科技有限公司开发，类似 AWS Redshift 的云端数据仓库服务，产品将于今年 3 月底在青云QingCloud 上线。

HDW 基于 Greenplum Database ，为云计算平台做了大量的系统架构及工程优化。除了具有快速部署，简单易用和零前期投入（按使用量收费）等商业优势外，还有如下技术优势：

标准SQL数据库：ANSI SQL 2008标准，OLAP、JDBC/ODB
支持ACID，分布式事务
分布式数据库：线性扩展，支持上百个物理节点
与开源数据库兼容，良性生态系统
支持多种语言用户自定义函数（UDF）：PLPGSQL、PLPython、PLR、PLJava
内置常用机器学习算法
兼容常用ETL和BI工具，充分利用企业已有投入
软硬一体优化，极高的性价比
无缝集成IaaS云平台数据服务，融入云生态系统

下面演示 HDW 如何与 QingStor 集成。在这个演示中，我们将把数据从 QingStor 中导入到数据仓库，并将最终的查询结果回导至 QingStor 。

7.1 创建 Bucket (存储空间)

创建一个Bucket，名为”hdw-hashdata-cn”，并在其下创建两个目录“input”和”output”。

7.2 创建 API 密钥以访问 QingStor

7.3 创建输入文件

在本地创建文件 “persons.txt” 和 “orders.txt”，并将其上传至前面创建的 Bucket “hdw-hashdata-cn” 的 “input”目录里。

“persons.txt”内容:
~
1,Adams,John,Oxford Street,London
2,Bush,George,Fifth Avenue,New York
3,Carter,Thomas,Changan Street,Beijing
~
orders.txt 内容
~
1,77895,3
2,44678,3
3,22456,1
4,24562,1
5,34674,65
~

7.4 创建数据表

连接 HDW 数据仓库进入 Postgres 数据库，执行如下图所示命令创建相应的数据表(请将里面的 access_key_id 和 secret_access_key 换成你的 API 密钥)。

外部表 e_persons 对应前面上传的 persons.txt 文件，e_orders 对应 orders.txt 文件，e_result 对应 Bucket hdw-hashdata-cn 的 output 目录。

7.5 数据迁移

执行如下命令将数据从外部表（对应青云对象存储的 input 目录）导入到数据仓库中：

7.6 执行如下命令将查询结果导出到外部表（对应青云对象存储的 output 目录）

此时，可以看到 output 目录下多了两个文件（这是因为演示系统中用了两个 workers ，每个 worker 往外写一个文件对象）：gpqsext.0.0 和 gpqsext.1.0 。

下载 gpqsext.0.0 和 gpqsext.1.0 ，查看内容:

在这个例子中，我们演示了如何将数据从 QingStor 里导入到 HDW 数据仓库中，并将查询结果回导至青云对象存储里。基于这两个基本功能，我们可以构建更复杂的数据仓库管理功能，如在数据仓库空闲的时候，将元数据和用户数据备份到对象存储中，释放计算资源和存储资源，节省成本；当下次需要的时候，利用备份到对象存储中的数据恢复数据仓库，继续正常使用。

8、QingStor 的进一步产品规划

各种 Feature 这里就不多说了，主要说一下两个大个方向。

第一个方向面向性能。纵然我们在系统架构设计时就在各方面考虑了性能，比如多区域部署，同区域计算资源内网访问 QingStor。但为了应对更加复杂的场景，我们在性能方面会同时兼顾内外网。内网方面，我们在做内网加速，外网方面我们在做 CDN 。两者将兼于近期上线。

第二个方向面向数据处理。QingStor 作为海量数据存储池，将会与青云QingCloud 平台上的计算资源紧密整合，尤其是青云QingCloud 大数据平台，如 Hadoop、Spark、 Storm 等。同时我们非常欢迎第三方数据处理服务在青云QingCloud 平台上构建服务，如第 7 章节中的 HDW。

另外，我们也将开发一些特定的数据处理服务，比如图形图像处理，音视频处理等。

我的分享就到此结束，谢谢大家，谢谢北京酷克数据科技有限公司提供的 HDW 案例。

精彩QA

1、存储超过一定规模有好的性能解决方案吗？

答：这个问题不具体。所以我也只能不具体的回答。

存储是计算机里在时间和空间两个维度上冲突最为严重的组件。在存储系统的设计过程中，往往会顾此失彼。之前我在其它场合分享时曾经说过，QingStor的一个很重要的设计思想是: 折衷。也即大家常说的tradeoff，事实上tradeoff会出现在各种各样的场景里，甚至在一个函数的设计里都会体现。但据我个人经验，tradeoff在存储领域体现最为明显。

2、QingStor 有什么前端方案吗，方便集成在应用里。

答：没有特别理解。但应用可以直接调用QingStor的API。如文中所述，当前我们支持Python语言的SDK，接下来会支持其他主流语言的SDK。届时可直接使用。

3、我觉得 AWS 的 lambda 服务很好，青云有类似的打算么？

答：这个问题很好。说明提问者对云服务非常了解。事实上春节期间我们已经设计了一版草案，关于青云平台上的异步事件驱动的服务框架如何构建。由于QingStor是青云QingCloud众多服务中第一个对异步事件驱动的框架有明确需求的服务，所以该框架会融合在QingStor的研发进程中来实现。我们计划是下月或者5月份开始此事件驱动的框架研发。初步规划是，先构建异步事件框架，以开发外围服务，如图形图像处理。然后进一步抽象出类似于lambda的服务。

4、青云QingCloud 的对象存储技术对于既有数据百亿级，日产生新数据 5000 万到 2 亿的高写入并发，相对较低的查询并发场景下有什么方案？

答：并发的提升涉及到系统的各层次，和许多因素有关。这个简单说几个方面。1)存储服务有一个特性：数据流和控制流很难分离，对于对象存储尤其如此。所以对于对象存储系统而言要尽量减少数据传输过程中的中转；2) 扩大接入层的集群规模；3) 优化接入层的网络链路，比如尽量不走Linux kernel的TCP/IP协议栈；4) 利用缓存和队列缓冲数据的写入量。

5、单 Accout 支持多少桶，多少对象，存储空间？

答：初始状态限制2个存储空间，如果有需要可以提工单提高。如分享中所说，对象数量没有限制。

6、对象副本是多少或 EC 配比

答：是三副本，目前还不支持纠删码。纠删码的支持也是我们今年要做的Feature之一。

你可能感兴趣的:(云计算,大数据)

虚拟机VMware Workstation Pro安装集群+hadoop+spark+scala 落枫兮 hadoop spark scala
参考资料：参考视频教程链接：大数据实验虚拟机安装Hadoop和Spark_哔哩哔哩_bilibiliup主：孤独时代的硕硕namenode安装选择镜像、路径、磁盘（最好不要c盘）、内存和处理器编辑名称与位置可点击此处自定义硬盘进行设置。选择语言、时区、软件、位置和网络
大数据手写面试题Scala语言实现大全（持续更新）大模型大数据攻城狮大数据数据结构算法面试题面试宝典
在大数据领域，Scala语言因其强大的函数式编程特性和对并发处理的良好支持而成为了开发者们的热门选择。有些面试官，为了考验面试者的基本功，需要让手写一些面试题，以数据结构和算法类的居多。本文将为您提供一些常见的Scala手写面试题及参考答案，帮助您在面试或工作中更好地运用Scala。目录1.冒泡排序2.二分查找3.快速排序4.归并排序5.手写Spark-WordCount6.手写Spark程序求平
程序员转行做什么好：数据分析师、AI大模型工程师、产品经理和云计算工程师？雪碧没气阿人工智能产品经理云计算大模型训练 LLM AI大模型程序员
程序员转行做什么好先给结论再说理由：数据分析师、AI大模型工程师、产品经理和云计算工程师。这些领域不仅因应了当前技术发展的趋势，也为程序员提供了转型的广阔舞台和职业发展的新机遇。一起来看看吧！数据分析师：数据驱动决策的关键程序员转行时，应考虑当前市场上的热门行业和岗位需求。例如，AI大模型工程师、数据分析师、前端开发工程师、全栈开发工程师等都是当前市场上需求量较大的职位。就拿数据分析师来说，因其在
基于Python的三种主流网络爬虫技术吃肉肉335 python 爬虫开发语言
一、网络爬虫是什么网络爬虫，通常也被称为网络蜘蛛或网络机器人，是一种按照一定方法，获取网络各种信息的自动化脚本程序，也可以将其理解为一个在互联网上自动提取网页信息并进行解析抓取的程序。网络爬虫的功能不仅局限于复制网页内容、下载音视频文件，更包括自动化执行行为链以及模拟用户登录等复杂操作。在当前大数据背景下，无论是人工智能应用还是数据分析工作，均依赖于海量的数据支持。如果仅依赖人工采集这一种方式，不
PL/SQL语言的学习路线轩辕烨瑾包罗万象 golang 开发语言后端
PL/SQL语言的学习路线PL/SQL（ProceduralLanguage/StructuredQueryLanguage）是Oracle公司为其数据库系统开发的一种编程语言，它结合了SQL的强大数据处理能力和过程式编程的灵活性。PL/SQL被广泛应用于Oracle数据库开发中，能够有效地提高程序的执行效率和维护性。对于想深入学习PL/SQL的开发者来说，明确的学习路线至关重要。本文将为大家提供
Bash语言的数据库交互清妍琉璃包罗万象 golang 开发语言后端
Bash语言的数据库交互引言随着信息技术的飞速发展，数据库在各行各业中扮演着越来越重要的角色。无论是企业管理、数据分析，还是大数据处理，数据库都是基础设施的重要组成部分。对于开发者和系统管理员而言，能够高效地与数据库进行交互是一项必不可少的技能。在众多编程语言中，Bash作为一种脚本语言，以其简洁、高效和易用的特点，逐渐在数据库管理和交互中获得了一席之地。本文将深入探讨如何使用Bash进行数据库交
Java 大视界 -- Java 大数据文本分析与自然语言处理：从文本挖掘到智能对话一只蜗牛儿 java 大数据自然语言处理
在当今的信息化时代，数据成为了重要的资源。特别是文本数据，随处可见，如社交媒体、新闻网站、技术文档、客户反馈等，这些都包含着大量的潜在信息。因此，如何从海量的文本中提取有价值的信息，成为了大数据分析领域的重要课题。Java作为一种高效、灵活的编程语言，在大数据文本分析与自然语言处理（NLP）中发挥着至关重要的作用。本文将介绍如何利用Java开发大数据文本分析和自然语言处理（NLP）应用，带领你从文
Hadoop分布式文件系统-HDFS架构 Fancs2024 hadoop hadoop hdfs
一、HDFS的简介HDFS全称HadoopDistributedFileSystem，是分布式文件管理系统。主要是为了解决大数据如何存储的问题，跟一般文件系统不同的是，它可以通过扩展服务器结点来扩充存储量，可以用低成本的硬件构建出支持高吞吐量的文件系统。二、HDFS的特点高容错性：一个HDFS集群会包含非常多的结点，HDFS将文件分块存储，并且会保存多个副本到不同的机器节点上以保证数据的安全，而且
科技赋能，商贸物流新速度 —— 智慧供应链商城加速企业成长呆码科技科技
科技赋能，商贸物流新速度——智慧供应链商城加速企业成长随着科技的飞速发展，AI（人工智能）、大数据、物联网等先进技术正深刻重塑着商贸物流行业，推动其向更高效、更智能、更环保的方向迈进。这些技术的应用不仅提升了物流效率，降低了运营成本，还增强了供应链的透明度和可控性，为商贸物流行业带来了前所未有的变革。智慧供应链商城是一个集成了AI、大数据、物联网等先进技术的综合服务平台，旨在通过科技手段提升物流效
国内优秀的FPGA设计公司主要分布在哪些城市？博览鸿蒙 FPGA fpga开发
近年来，国内FPGA行业发展迅速，随着5G通信、人工智能、大数据等新兴技术的崛起，FPGA设计企业的需求也迎来了爆发式增长。很多技术人才在求职时都会考虑城市的行业分布和发展潜力。因此，国内优秀的FPGA设计公司主要分布在哪些城市？以下将对国内FPGA企业集中的城市进行梳理。北京北京在我国FPGA产业发展中有着重要地位，尤其在设计和应用领域有较大优势，形成了完整的研发和产业生态。目前，北京主要的产业
MDX语言的语法糖 ByteBlossom666 包罗万象 golang 开发语言后端
MDX语言的语法糖及其应用分析引言在当今数据驱动的时代，大数据分析和数据可视化已成为企业决策中不可或缺的一部分。MDX（MultidimensionalExpressions，多维表达式）作为一门专为分析多维数据而设计的查询语言，广泛应用于商业智能（BI）工具中。随着技术的发展，MDX语言逐渐演变，形成了其独特的语法糖，以提高开发者的效率和可读性。本文将深入探讨MDX语言的语法糖特性及其在实际应用
大数据的一些基本概念 weixin_49536779 大数据数据分析数据库 python
首先，大数据是什么？大数据是指数据集规模巨大且复杂，传统的数据处理软件无法高效处理它们。它是非常大的数据集。这种复杂性可能来自于数据的“3V”特性：体量（Volume）、多样性（Variety）和速度（Velocity）。体量（Volume）首先，什么是体量？体量指的是以PB（Petabytes）为单位的数据量，甚至是EB（Exabytes）。这种数据量远大于GB（Gigabytes）或TB（Te
TiDB 对 Hadoop 的影响：大数据时代的新选择狮歌~资深攻城狮 tidb 数据仓库数据分析数据库分布式
TiDB对Hadoop的影响：大数据时代的新选择随着大数据时代的到来，各种处理和存储海量数据的技术应运而生。Hadoop和TiDB都是这个时代的代表性技术，但它们的设计初衷、使用场景和应用方式却有所不同。那么，TiDB作为一个分布式数据库，它对传统的Hadoop生态系统产生了哪些影响呢？今天，我们就来聊聊这个话题。Hadoop简介：大数据的“老牌劲旅”首先，我们需要了解一下Hadoop的背景。Ha
MPP（Massively Parallel Processing）是什么？它的特点是什么？狮歌~资深攻城狮数据仓库数据分析数据库分布式
MPP（MassivelyParallelProcessing）是什么？它的特点是什么？在信息化、数据化的今天，处理大规模数据成为了很多行业的关键能力。我们常常听到“大数据”和“数据处理”的词汇，而MMP（MassivelyParallelProcessing，大规模并行处理）正是帮助我们解决大数据处理的利器。那么，MPP究竟有什么特点，让它能够高效处理海量数据呢？1.什么是MPP？MPP的全称是
大语言模型原理与工程实践：网页数据 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理与工程实践：网页数据1.背景介绍在当今信息爆炸的时代，网页数据成为了大数据的重要来源之一。网页数据不仅包含了丰富的文本信息，还包括了图像、视频、音频等多媒体内容。大语言模型（LargeLanguageModels,LLMs）作为自然语言处理（NLP）领域的前沿技术，能够从海量的网页数据中提取有价值的信息，进行文本生成、情感分析、问答系统等多种任务。大语言模型的成功离不开深度学习技术的
Azure 基础 SmallFatMan #Azure azure microsoft 运维 linux 服务器学习面试
Azure基础一、Azure基础知识简介二、云计算简介？三、责任共担四、你始终负责：五、云服务提供商始终负责：六、云模型1、私有云2、公有云3、混合云4、多云一、Azure基础知识简介MicrosoftAzure是一个云计算平台，提供一系列不断扩展的服务，可帮助你构建解决方案来满足业务目标。Azure服务支持从简单到复杂的一切内容。Azure具有简单的Web服务，用于在云中托管业务。Azure还支
云计算运维工程师面试道亦无名面试云计算运维
1.云计算运维工程师的角色和职责是什么？回答：云计算运维工程师负责确保云计算环境（包括硬件和软件系统）的高可用性和稳定性。他们的主要职责包括：监测系统和应用程序的性能，确保它们正常运行。故障排除，快速响应并解决系统或应用程序中出现的问题。容量规划，根据业务需求预测和规划未来的资源需求。升级和维护操作系统、应用程序及相关的基础设施。与开发团队紧密合作，确保新功能的顺利部署和现有功能的持续优化。2.请
Flink系列-2、Flink架构体系技术武器库大数据专栏 flink 架构 jvm
版权声明：本文为博主原创文章，遵循CC4.0BY-SA版权协议，转载请附上原文出处链接和本声明。大数据系列文章目录官方网址：https://flink.apache.org/学习资料：https://flink-learning.org.cn/目录Flink中的重要角⾊Flink数据流编程模型Libraries支持Flink集群搭建Local本地模式（开发测试）Standalone-伪分布环境（开
【原创】大数据治理入门（5）《数据生命周期管理：从采集到归档》入门必看高赞实用精通代码大仙数据库 hadoop python 大数据数据挖掘数据治理数据库 python
数据生命周期管理：从采集到归档引言：数据生命周期的概念数据生命周期管理（DataLifecycleManagement，DLM）是指从数据的创建、使用、存储到最终归档或销毁的全过程管理。在大数据时代，企业需要通过对数据生命周期的全面管理，确保数据的可用性、安全性和合规性。本文将详细介绍数据生命周期的各个阶段，以及相应的管理策略和技术工具。各阶段介绍：采集、存储、处理、分析、归档数据采集（DataC
Java 大视界 -- Java 与大数据分布式机器学习平台搭建（58）青云交大数据新视界 Java 大视界大数据分布式机器学习 Apache Spark Hadoop Apache Flink 平台搭建架构设计
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。一、欢迎加入【福利社群
基于MRS-Hudi构建数据湖的典型应用场景介绍华为云技术精粹云计算华为云
一、传统数据湖存在的问题与挑战传统数据湖解决方案中，常用Hive来构建T+1级别的数据仓库，通过HDFS存储实现海量数据的存储与水平扩容，通过Hive实现元数据的管理以及数据操作的SQL化。虽然能够在海量批处理场景中取得不错的效果，但依然存在如下现状问题：问题一：不支持事务由于传统大数据方案不支持事务，有可能会读到未写完成的数据，造成数据统计错误。为了规避该问题，通常控制读写任务顺序调用，在保证写
MySQL、HBase 和 Elasticsearch：特点与区别详解一休哥助手 mysql hbase elasticsearch
引言随着大数据和分布式计算的快速发展，数据库系统已从传统的关系型数据库（RDBMS）扩展到多种新型数据存储技术，包括NoSQL数据库和搜索引擎等。MySQL、HBase和Elasticsearch是其中三种非常常见的数据存储系统，它们在各自的领域都有着重要的应用。MySQL作为传统的关系型数据库，HBase则是一个分布式、可扩展的NoSQL数据库，而Elasticsearch则是一个分布式的搜索引
SRCA 证书免费考！2025 学习奋进，大显蛇通！数据库
社区的小伙伴们，你们的新年学习计划已开启！Rocky为你精心准备了一份特别的礼物–一个为期一个月的学习计划与免费的SRCA考证机会，助你在新的一年成为StarRocks专家，在大数据征程上大显神通。以下是本次新年学习的内容与SRCA考试获取方式：学习目标通过系统的学习，让你迅速提升StarRocks知识基础与解决实际问题的能力，为你的职业发展打下坚实基础。学习方式大家可以根据Rocky规划的课程在
深入MapReduce——引入黄雪超大数据基础 #深入MapReduce mapreduce 大数据 hadoop
引入前面我们已经深入了HDFS的设计与实现，对于分布式系统也有了不错的理解。但HDFS仅仅解决了海量数据存储和读写的问题。但要想让数据产生价值，一定是需要从数据中挖掘出价值才行，这就需要我们拥有海量数据的计算处理能力。下面我们还是老样子，来数据一下要实现海量计算处理能力，有些什么核心痛点大数据计算核心痛点量级大在稍微大一点的互联网企业，需要计算处理的数据量都开始以PB计了。而传统的计算处理模型中，
Kafka 迁移 AutoMQ 时 Flink 位点管理的挑战与解决方案 AutoMQ 云计算云原生 Kafka 消息计算大数据 AWS AutoMQ 阿里云腾讯云 GCP
编辑导读：AutoMQ是一款与ApacheKafka100%完全兼容的新一代Kafka，可以做到至多10倍的成本降低和极速的弹性。凭借其与Kafka的完全兼容性可以与用户已有的Flink等大数据基础设施进行轻松整合。Flink是重要的流处理引擎，与Kafka有着密切的关系。本文重点介绍了当用户需要将生产Kafka集群迁移到AutoMQ时，如何处理好Flink的位点来确保整体迁移的平滑过渡。引言在云
AI产品经理还不会数据挖掘❓看完这篇就够了脱泥不tony 人工智能产品经理数据挖掘 python tensorflow 开发语言 llama
前言在数字化时代的浪潮中，AI产品经理正成为推动科技与商业融合的重要力量。然而，面对海量的数据，如何从中挖掘出有价值的信息，为AI产品的开发提供有力支持？这已成为AI产品经理必须面对的挑战。今天，我们就来探讨一下数据挖掘在AI产品经理工作中的重要性，以及如何通过掌握数据挖掘方法论，打造卓越的AI产品。一、数据挖掘：AI产品经理的必备技能在AI产品的世界中，大数据是构建一切的基础。无论是算法组件、知
Presto 时间、日期及计算相关日期三生暮雨渡瀟瀟 presto big data presto
由于工作中在数据迁移，大数据平台数据查询引擎使用Presto，和传统的数据库时间函数有区别，整理一版，供大家参考，一起学习，有错误欢迎指正。1、查询当前日期selectcurrent_date;2、查询当前时间selectcurrent_timestamp;_col0---------------------------------------2022-01-0220:45:58.551Asia/
销售易CRM：引领数字化转型，助力企业智能增长人工智能程序员
在全球数字化浪潮下，企业对智能化、数字化转型的需求愈发迫切。销售易CRM作为中国领先的企业级智能CRM解决方案提供商，凭借其强大的产品能力、丰富的行业经验和卓越的服务品质，成为众多知名企业的首选合作伙伴。本文将深入分析销售易CRM的核心优势，以及其如何助力企业实现数字化转型与业务增长。一、销售易CRM的核心优势领先的技术实力销售易CRM基于自主研发的新一代智能商业引擎，将人工智能、大数据分析等前沿
销售易与Salesforce：CRM市场的龙争虎斗 crmsaas
在当今数字化时代，客户关系管理软件在企业运营中扮演着至关重要的角色。销售易和Salesforce作为两款备受瞩目的CRM软件，各自具有独特的特点和优势。销售易是连续8年成为唯一入选Gartner销售自动化魔力象限的中国CRM厂商，并且在多项能力指标上超越国际厂商。在中国，销售易在大中型企业市场占有率排名第一，它通过整合移动、社交、人工智能、大数据和物联网技术，提供了全面的业务管理解决方案，被多家5
Python自动化运维：一键掌控服务器的高效之道蒙娜丽宁 Python杂谈运维 python 自动化
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在互联网和云计算高速发展的今天，服务器数量的指数增长使得手动运维和管理变得异常繁琐。Python凭借其强大的可读性和丰富的生态系统，成为实现自动化运维的理想语言。本文以“Python自动化运维：编写自动化脚本进行服务器管理”为主题，深入探讨了如何利用Py
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts