马一特

大数据教程-01HDFS的基本组成和原理

一 Hadoop历史背景

起源于2003年谷歌的Google File System相关论文，随后Doug Cutting（我们下面就叫他切哥吧）基于GFS的论文实现了分布式文件系统，并把它命名为NDFS（Nutch Distributied File System）。

2004年谷歌又发表了一篇学术论文，介绍了自己的MapReduce编程模型，这个编程模型适用于大规模数据集（大于1TB）的并行分析运算。随后，切哥又基于MapReduce在Nutch搜索引擎实现了该功能，这回切哥没改名，估计是想不出比这更好的名字了吧。

2006年谷歌又发了论文，介绍了自己BigTable（一种非关系型数据库），后面的结果你们能猜到了哈，我们机智的切哥就把BigTable的思想引入到了Hadoop系统里面，并命名为HBase（学习借鉴，切哥在起名这块从来不手软）。

切哥这么牛逼，后来就加入了雅虎，然后又升级改造，一阵duangduangduang，然后就有了现在Hadoop的雏形。

按照国际惯例，你们猜猜看切哥有没有头发？

二 Hadoop简介

切哥果然没有头发，这下心里平衡了吧

Hadoop是Apache的一个开源的分布式计算平台，核心是以HDFS分布式文件系统和MapReduce分布式计算框架构成的，为用户提供了一套底层透明的分布式基础设施。

Hadoop的核心思想就是分布式计算和分布式存储，HDFS负责分布式存储，MapReduce负责分布式计算。

HDFS是Hadoop分布式文件系统，具有高容错性和高伸缩性，允许用户基于廉价硬件部署，构建分布式存储系统，为分布式计算存储提供了底层技术支持。

MapReduce其实就是一套封装好的API，用户可以在不了解底层细节的情况下，开发分布式并行程序，利用大规模集成资源，解决传统单机无法解决的大数据处理问题。

三 Hadoop1.0架构

我先来讲解Hadoop1.0的架构，因为当时的架构比较简单，理解起来比较容易。

NameNode

负责维护整个文件系统的文件目录树，包括文件目录的元信息和文件数据块索引（元信息是指文件路径，数据块索引是指某个大文件被分割成的文件块所处的位置），由于NameNode是一个JVM进程，一旦重启就丢失掉了，所以要永久保存，这些元信息是以FsImage和EditLog形式存储在本地。

FsImage相当于是一个元信息的镜像，当我们对目录树修改后，会把修改信息记录在EditLog中，然后定期做合并，生成一个新的FsImage。这个NameNode出现故障时，是不能对外提供服务的，因为它只有一个节点。

Secondary Name Node

这个并不是备份的，准确来说应该叫他CheckPoint Node，是负责做FsImage和EditLog定期合并。不接受客户端请求，作为NameNode的冷备份。当我们文件很多很大时，合并很消耗内存，NameNode要服务于线上的客户端读写，所以把它们拆开成了两个节点。

DataNode

实际存储数据的单元，数据以Block为单位，一个大文件在Hadoop存储时会切分成很多个Block，在Hadoop层面来讲存的是Block，不是文件，但是站在Linux层面来看，数据还是以文件形式保存在本地文件系统。

Client

通过一个API与HDFS交互，可以进行读写，创建目录，创建文件，复制，删除等等。HDFS提供了多种客户端：Shell命令行，Java API，Thrift接口，C library，WebHDFS等。

Data Block

文件是由Block组成的，假设每一块大小为64MB，实际上使用会设置相对大一点，这样切分时个数就会变少。Block越多，存储数据的元信息就会越多，使用时消耗的内存就会越大。所以，适当增大Block Size可以减少元信息数量，使用时更节省内存。

多出来40MB也是一个Block，即使是多出来1MB，也会是一个Block。

四数据块分布

为了保持系统的高可用性，每一个Block会存3个副本（可以调，一般是3个），也就是说一个100G的文件需要用300G的空间来存储。

默认存放规则（驾驶复制因子是3）：

第一份拷贝写入创建文件的节点，目的是能够快速写入
第二份拷贝写入位于不用rack的节点，是为了应对交换机故障（假设节点2和节点1不再同一机柜）
第三份拷贝写入和第二份副本同一个rack内的节点，为了减少跨rack的网络流量（交换机故障率极低，跨顶层交换机流量消耗大）

什么是rack？不同的机柜怎么定义？

如你所见，上方有三个机柜，每个机柜ip地址是不同的，通过ip地址找到不同的rack。

五 HDFS各角色交互

定时心跳

DataNode会定时给NameNode发送心跳，告诉NameNode我还活着，NameNode收到之后也会回复一些指令，比如请你下线。
WechatIMG408副本.jpg

HDFS读流程

客户端发送指令给NameNode，NameNode返回Block列表，然后客户端连接对应的Block，最后读出大文件，整个过程是流式的。

机架感知：拓扑距离

上面图中提到的拓扑距离排序，拓扑距离是怎么计算的？

计算方式是两个节点到达最近的共同祖先的距离总和。

Distance(d1/r1/n0,d1/r1/n0)=0 同一节点上的进程
Distance(d1/r1/n1,d1/r1/n2)=2 同一机架上的不同节点，两个节点各上1步到同一位置
Distance(d1/r2/n0,d1/r3/n2)=4 同一数据中心不同机架上的节点，两个节点各上2步到同一位置
Distance(d1/r2/n1,d2/r1/n1)=6 不同数据中心的节点

机架感知-再看副本放置策略

第一个副本在Client所处的节点上，如果客户端在集群外，随机选一个
第二个副本在另一个机架的随机一个节点
第三个副本在第二个副本所在的机架

HDFS写流程

首先是客户端发送写的指令给NameNode，然后NameNode告知客户端第一个Block的放置位置，接着客户端连接对应的DataNode每次小批量循环写入，比如Block为64MB，每次每个DataNode先写入64KB，写完了就换下一个DataNode，直到第一个Block写入完成换下一个Blcok，如此循环往复。
WechatIMG110副本.jpg

读写流程总结

读写的流程基本是类似的，都是流式进行的。
WechatIMG410副本.jpg

六 HDFS故障恢复流程

要保证系统的高可用性，容灾是必不可少的，主要的故障有以下几种。

DataNode容灾

如果DataNode坏掉，那么它对应的心跳就没有了，虽然还有其他的副本提供服务，但我们系统也要做一些恢复的操作。

因为复制因子是3，但在集群里面只有两个副本，系统会把下图DataNode1黑色的Block复制一份，其他的也是类似的，这样就能保证系统的高可用性。

也还有一种可能，刚才系统以为坏掉的DataNode只是网络断了，后面又恢复了，这样就会有的Block多出一个副本，这时系统会根据它的负载均衡删除一个多的就可以了。

机柜/交换机故障

其实机柜或者交换机故障与DataNode和磁盘故障是类似的，因为我们Block副本是在不同机柜的。

NameNode 容灾（Hadoop V2）

其实Hadoop1.0时候NameNode是一个单点，挂掉了必须重新启动起来，在Hadoop2.0时候有了一个备用的NameNode，注意这不是Secondary NameNode，这时候就有了主从模式，一个是active，另一个是standby

备用的NameNode也是可以接收心跳的，当主NameNode挂掉后，备用的NameNode可以立即接管。

FsImage和EditLog的作用

我们知道NameNode是没有HA结构的（High a Availability）,所以是一个单点故障，NameNode在内存中的元数据全部丢失，FsImage和EditLog的存在可以保证让重启的NameNode获得最新的宕机前的元数据。

FsImage是整个NameNode内存中元数据在某一时候的Snapshot(快照)。

FsImage不能频繁地构建，生成FsImage要消耗大量的内存
目前FsImage只在NameNode重启时才重新构建

EditLog记录的是从这个快照开始到当前所有元数据的改动

如果EditLog太多，EditLog加载会消耗大量的时间
这会导致NameNode重启消耗数小时之久

Secondary NameNode

Secondary NameNode就是来帮助减小EditLog文件的大小和更新FsIamge，以此来减小NameNode的压力。

NameNode Failure

来看4个小问题：

NameNode进程挂了怎么办？
NameNode进程挂了，启动不起来怎么办？
NameNode所在机器操作系统进不去怎么办？
NameNode机器无法开机怎么办？

进程挂了就重启，重启起不来就把机器上对应的FsImage和EditLog文件迁移到一台新的机器上，如果操作系统进不去，或许可以通过BIOS方式把文件取出来，但是如果开机都开不了，那就只能把Secondary NameNode勉强可以作为NameNode使用，就是把他的IP改成NameNode的IP，从Secondary NameNode机器上来重启。再如果Secondary NameNode也开不了机，你就跟老板说，你买的什么破机器，要坏都一块坏，u can u up,ur father is down.

你可能感兴趣的:(大数据教程-01HDFS的基本组成和原理)

CocoaPods 私有库创建 sanjieshenwu1987 iOS 私有仓库
总结流程和pod指令，以及自己操作遇到的问题。参考文章iOS组件化-基础iOS组件化-项目组件化Swift/Objective-C-使用Cocoapods创建/管理私有库（初中级用法）Swift/Objective-C-使用Cocoapods创建/管理私有库（高级用法）文章目录参考文章创建自己的私有库1、创建私有SpecRepo2、创建组件库3、提交组件库3.1验证本地库3.2提交到git3.3将
Axure高级功能深度解析一一高效原型设计的利器招风的黑耳 Axure
Axure作为一款专业的原型设计工具，凭借其强大的功能和灵活的交互设计，成为了众多设计师和开发者的首选。本文将深入探讨Axure的高级功能，帮助大家更好地利用这款工具，提升原型设计的效率和质量。一、Axure高级功能概览•变量管理：介绍局部变量和全局变量的使用场景、命名规则以及如何在原型设计中实现数据传递和交互逻辑。•动态面板：详细解析动态面板的工作原理，包括如何创建、编辑和管理动态面板状态，以及
动态规划算法优化在资源分配问题中的应用 suyang199312 课程设计
摘要资源分配问题广泛存在于各类生产与管理场景，合理分配资源以实现效益最大化至关重要。本文深入剖析动态规划算法在资源分配问题中的应用，详细阐述其基本原理与常规解法，针对常规解法的不足提出创新优化思路，并给出具体实现步骤。通过实际案例分析与实验验证，展示优化后的动态规划算法在提升资源分配效率和效益方面的显著优势，为相关领域的决策制定提供有力支持。引言在经济、工程、计算机科学等众多领域，资源分配问题无处
RabbitMQ 集群降配 Hover_Z_快跑 rabbitmq 分布式
这里写自定义目录标题摘要检查状态1.检查RabbitMQ服务状态2.检查RabbitMQ端口监听3.检查RabbitMQ管理插件是否启用4.检查开机自启状态5.确认集群高可用性6.检查使用该集群的服务是否做了断开重连实操1.负载均衡配置2.逐个节点降配（滚动操作）2.1停止RabbitMQ服务2.2调整ECS配置2.3恢复节点并重新加入集群2.4恢复负载均衡流量3.全局监控与验证4.降配后优化（可
ubuntu高并发内核参数调优 - （压测客户端调优） sj1163739403 Linux系统 ubuntu
业务上要求集群提供10w+并发，10w+并发听上去不是很难，但10w并发持续1小时呢在业务上线之前还需要我们自己对业务进行压测，俗称benchmark。压测的服务器也是需要进行性能调优的，以下列出调优前后的参数对比，更直观的分析和感受参数对程序的影响压测前内核参数自检#!/bin/bash#脚本名称:check_benchmark_server_kernel_params.sh#描述:查询压测服务
加密算法的性能优化与安全性平衡研究 sigen520520 笔记
摘要在数字化信息飞速发展的当下，数据安全至关重要，加密算法作为数据保护的核心手段，其性能与安全性直接关乎信息系统的稳定运行。本文深入剖析常见加密算法，详细分析其性能指标与安全性特点，全面探讨在提升加密速度的同时确保安全的有效方法与实践，旨在为构建高效、安全的加密体系提供理论支撑与实践指导。引言随着互联网的普及和信息技术的广泛应用，数据在传输与存储过程中面临诸多安全威胁，如数据泄露、篡改、伪造等。加
【十自然语言处理项目实战】【10.2 数据收集与预处理】再见孙悟空_ #自然语言处理人工智能知识图谱 transformer 自然语言处理数据收集自然语言处理预处理自然语言处理项目
各位在数据泥潭里打滚的勇士们，今天咱们要聊的这个话题，就像学做川菜必须掌握的"火锅底料炒制法"——数据收集与预处理！这玩意儿看着像脏活累活，实则是决定你模型上限的生死关卡。作为一个曾把BERT训成人工智障的老司机，这就把五年掉坑经验熬成一锅十全大补汤！（戴上橡胶手套准备掏数据）一、数据收集的野路子：比盗墓还刺激的冒险1.1公开数据集寻宝图（附藏宝坐标）①正道的光：Kaggle（数据界的沃尔玛）：搜
根据论文复现大模型方法以及出错处理技巧 Ai玩家hly 从0倒1 论文复现大模型复现 Ai大模型复现
复现一篇论文中的大模型搭建涉及以下几个关键步骤：理解论文的模型架构、数据集处理、超参数设置以及实验环境的搭建。这里给出一个基本的实现方法示例，假设我们选择复现一个图像分类任务中的经典模型，例如ResNet。实现步骤示例1.理解论文和模型架构选择一篇关于ResNet的论文作为示例，例如《DeepResidualLearningforImageRecognition》（Heetal.,2015）。2.
✨❤️CSDN标题党❤️，创意无极限，那不直接全网站都花的飞起？少年，又是你 icons ui设计搜索引擎大数据百度
这只是一张图。❤️CSDN标题党❤️想法由来如何化为己用总结想法由来那这个想法之初呢，是因为我看到好多博主的标题啊，文章中都存在一些精美的小图片，那我身为一个男生看这些都有些心动啊，实在是精美。那的确为了流量，大家也都是攒足了劲。那我就在想，这些是什么呢？我一搜发现，原来是表情符号。那我不知道你们的电脑是怎么样的，我反正只要按了windows键+句号(.)即可在任何应用程序中使用表情符号。好使的不
k8s 配置私有镜像仓库认证狗贤 Kubernetes kubernetes 容器
1.创建Docker注册表的Secret首先，创建一个类型为dockerconfigjson的Secret，用于存储Docker注册表的认证信息。方法1:使用DockerCLI和kubectl不适用于阿里云格式不一样登录Docker注册表：dockerlogin这会生成一个包含认证信息的配置文件，通常位于~/.docker/config.json。创建Secret：kubectl-npromcre
vue中实现element-ui dialog的弹窗拖拽+水平方向伸缩+最小化+展开/收缩胡八一、前端 vue.js ui javascript
dragPlus.js文件内容exportdefault{bind(el,binding,vnode,oldVnode){const{arg,value}=binding;//弹框可拉伸最小宽高letminWidth=400;letminHeight=300;//初始非全屏letisFullScreen=false;//初始非最小化letisMinimum=false;//当前宽高letnowWi
【使用 Element UI 实现手动上传文件：FormData 追加文件和其他参数，支持单文件覆盖上传】 Hermione_log vue.js elementui 前端
在开发Web应用时，文件上传是一个常见的需求。ElementUI提供了强大的el-upload组件，可以轻松实现文件上传功能。本文将详细介绍如何使用ElementUI实现以下功能：手动触发文件上传：用户选择文件后，点击按钮手动上传。使用FormData追加文件和其他参数：将文件和其他表单数据一起提交。单文件覆盖上传：只允许上传一个文件，新文件会覆盖旧文件。1.实现思路为了实现上述功能，我们需要以下
数据重放和数据倒灌的意思一样吗赛恩斯 android
数据重放与数据倒灌在机制上有相似性，但设计目的和适用场景存在本质差异：‌1.核心定义对比‌‌维度‌‌数据倒灌‌‌数据重放‌‌技术场景‌LiveData特有的现象，新观察者自动接收最后一次数据更新‌78通用异步流机制（如Flow的StateFlow/SharedFlow），允许新订阅者获取历史数据‌45‌设计意图‌LiveData的默认行为，旨在确保观察者始终获取最新数据‌38开发者主动配置的数据保
aixbt 被盗 55.5 ETH，本就孱弱的 AI 代理叙事会「雪上加霜」吗人工智能区块链以太坊
作者：Techub热点速递撰文：Yangz，TechubNews在大部分行业目光都投向币安「组合拳」引发的BNBChain热潮、OKX因合规问题暂停DEX聚合服务以及Solana深陷政治广告风波的同时，周一CT上爆出的关于头部AI代理aixbt被「钓鱼诈骗」55.5ETH一事再次引发了社区关于AI代理叙事可持续性的思考。不少用户担忧，目前本就孱弱的AI代理叙事是否会因此「雪上加霜」？周一下午，多名
HarmonyOS NEXT一行代码实现任意处弹窗
前言从Api9开始开发鸿蒙的大佬应该被自定义弹窗折腾得够呛，到目前为止我能想到的自定义弹窗方案有以下几种promptAction.openCustomDialog(options:CustomDialogOptions)(该方案@Builder装饰的视图(builder参数)必须定义在组件内部)CustomDialogController+CustomDialog(该方案CustomDialogC
基于 Websoft9 平台的 Odoo 教学实践：助力智能制造、物流与财务会计专业教师提升教学效果开源
Websoft9作为企业级开源软件的自动化部署与管理平台，为高校智能制造、物流与财务会计等专业提供了完整的Odoo（开源ERP）教学解决方案。以下从部署、维护及功能扩展三方面解析其核心价值：一、部署：开箱即用的企业级业务场景模拟一键构建复杂业务架构Websoft9预置了Odoo全模块集成模板，部署时可自动关联PostgreSQL数据库、Nginx负载均衡及Let'sEncryptSSL证书，还原真
2025React岗位前端面试题180道及其答案解析,看完稳了,万字长文,持续更新.... 祈澈菇凉前端
1.什么是React？它的主要特点是什么？答案解析：React是一个用于构建用户界面的JavaScript库，主要用于构建单页应用。其主要特点包括：组件化：React应用由多个可重用的组件组成，便于管理和维护。虚拟DOM：React使用虚拟DOM提高性能，通过最小化实际DOM操作来优化渲染过程。单向数据流：数据在组件之间以单向流动的方式传递，简化了数据管理和调试。声明式编程：React允许开发者以
Python 安装scipy失败 _不二_ python python
在使用pip安装scipy时会报错OSError:[Errno13]Permissiondenied:'/usr/local/lib/python2.7/dist-packages/scipy'网上查了，说是由于墙的原因，但我已经翻了墙的，任然报这个错误，下载速度特别慢，到11%或者27%就挂啦，最后很无赖，直接手动安装吧。先去官网搜索scipy选择合适的版本如下图下载完成后pipinstalls
win7下python3.6通过pip安装scipy报错的解决办法青松一夏 python
一、问题描述通过pip方式安装了numpy和sklearn，但是sklearn需要依赖于scipy，但当通过pip方式安装scipy时，报错：numpy.distutils.system_info.NotFoundError:nolapack/blasresourcesfound按照网上的教程，并没有找到真正的解决办法，后来我是通过如下方式解决的。二、我的解决方案（1）首先卸载numpypipun
书籍-《优化基础：理论、工具及应用（论文版）》机器学习人工智能
书籍：OptimizationEssentials:Theory,Tools,andApplications作者：FaizHamid出版：Springer编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《优化基础：理论、工具及应用（论文版）》01书籍介绍本书探讨了运筹学和数学优化领域的最新发展和令人兴奋的挑战。它以统一且精心编排的方式呈现了以下内容：(a)现实生活中出现的新颖优化问题，并突出每
从 DeepSeek 到 AI 工具箱：Websoft9 应用托管平台赋能高校教学与科研人工智能deepseek
从DeepSeek到AI工具箱：Websoft9应用托管平台赋能高校教学与科研人工智能技术的快速发展正在重塑高校的教学与科研生态。从智能教学辅助到跨学科研究，AI工具的应用场景不断扩展，而技术落地的复杂性也带来新的挑战。在这一背景下，如何将大模型能力与多样化AI工具无缝整合，构建安全、易用的科研教学环境，成为高校数字化转型的关键命题。一、高校智能化转型的三大痛点技术门槛高•AI工具部署依赖专业运维
Websoft9 开源多应用平台：培养学生数字化能力的实战工具开源实践
引言数字化教育转型的核心在于将技术工具与教学场景深度融合，但传统模式常因环境配置复杂、工具链割裂等问题阻碍实践教学效率。Websoft9开源多应用平台以标准化部署、多工具集成、轻量化运维为核心能力，为教育场景提供了一种技术门槛更低、协作效率更高的解决方案。本文基于实际教学需求与技术验证，探讨如何通过该平台构建数字化能力培养体系。一、技术特性与教育场景的适配性开源生态覆盖全技术栈，缩短教学准备周期平
WPF使用MVVM模式开发 pluto li .net .net
本文用到的有：WPF（.net5）Microsoft.Toolkit.Mvvm按钮不带参数/带参数点击事件绑定文本框Text绑定，点击事件绑定步骤如下：创建wpf项目：WpfMVVM创建Views、ViewModels两个文件夹nuget添加Microsoft.Toolkit.Mvvm在ViewModels文件夹添加类MainViewModelusingMicrosoft.Toolkit.Mvvm
你准备好迎接它了吗？英伟达CEO黄仁勋预言：人形机器人将成为未来主流杰克尼机器人人工智能
在近日举行的“CadenceLIVE硅谷2024”大会上，英伟达公司的首席执行官黄仁勋与大会主办方Cadence公司的CEO进行了一场富有深度的对话。在这场引人瞩目的交流中，黄仁勋大胆预测，未来人形机器人将成为主流，引领科技发展的新潮流。你准备好迎接它了吗？英伟达CEO黄仁勋预言：人形机器人将成为未来主流©由18183手游网提供黄仁勋坚信，在不久的将来，我们所有人都都要制造的设备将会是人形机器人。
Ubuntu 22.05编译OpenWrt 23.05实战诺依阁 ubuntu 数据库 linux
本篇文章原文地址:https://blog.nuoyis.net/posts/9990.html哔哩哔哩视频教程:https://www.bilibili.com/video/BV1rnsCe1ErV博主基本插件版本推荐编译配置:16核心20G内存150G硬盘用于存储数据包以及编译包等前情提要1.需要准备能访问到外网域名的加速器(自己斟酌)2.准备一个安装好的ubuntu虚拟机(或者直接使用海外服
聊聊关于Python与人工智能那些事小G-biu- python 人工智能 tensorflow
Python与人工智能：介绍Python在人工智能方面的应用Python是一种广泛使用的编程语言，也是人工智能领域中最受欢迎的语言之一。Python提供了许多用于构建和训练人工智能模型的库和框架。本文将介绍一些常见的人工智能技术以及Python在这些技术中的应用。OpenAIOpenAI是一个非营利组织，旨在推动人工智能的发展并促进其对人类的利益。OpenAI通过开发人工智能技术、研究人工智能的影
Matlab 基于最小二乘向量机 LSSVM + NSGAII 多目标优化算法的工艺参数优化前程算法屋私信获取源码工艺参数优化 matlab 算法多目标优化
Matlab基于最小二乘向量机LSSVM+NSGAII多目标优化算法的工艺参数优化一、引言1.1研究背景与意义在现代工业生产中，工艺参数优化占据着举足轻重的地位。它犹如工业生产的核心引擎，直接影响着企业的生产效率、产品质量以及成本控制。从生产效率角度看，优化工艺参数能够显著提升生产速度。合理的参数设置可使生产设备处于最佳运行状态，减少不必要的停机与等待时间，让生产流程更加顺畅。以汽车制造业为例，通
RAMS数据处理程序—垂直剖面分析程序 Hardess-god RAMS 人工智能算法
该程序的主要特点：使用Cartopy创建地图投影添加海岸线、国界线等地理要素绘制等值线图显示气象要素分布自动设置颜色标尺和标题支持不同层次的数据展示importmatplotlib.pyplotaspltdefplot_vertical_cross_section(data,start_lat,start_lon,end_lat,end_lon):"""绘制垂直剖面图"""#计算剖面线上的点num
【MALTAB递归预测未来】VMD-Bayes-LSTM单变量时序预测-递归预测未来 (单输入单输出) 前程算法屋私信获取源码 lstm 人工智能 rnn
VMD-Bayes-LSTM单变量时序预测递归预测未来MALTAB代码一、引言1.1单变量时序预测的背景和意义在当今快速发展的社会中，数据无处不在，而时间序列数据作为其中一种重要类型，在众多领域发挥着不可替代的作用。单变量时序预测，即对单一变量随时间变化趋势的预测，在工业、经济等领域具有极其重要的意义。工业生产是国民经济的支柱产业，其稳定运行对整个社会经济发展至关重要。在制造业中，设备是生产的基础
全网独家 | 超级POI数据集：27.3亿条，涵盖2018-2024年，7年44份，全国范围、同源、相同处理方法、字段丰富空间数据研究所全国同源历史POI数据空间数据研究所历史POI POI数据全国同源历史POI 兴趣点超级POI数据集
超级POI数据集概况时间范围：2018年12月至2024年12月覆盖区域：全国所有省、直辖市、自治区和特别行政区数据总量：2,731,535,499条数据格式：支持SHP、FileGDB、GeoJson、MIF/TAB、TXT、Excel、CSV坐标系统：可以提供WGS84、GCJ02、BD09等常见坐标系提供形式：本地矢量数据文件数据选择：可根据指定的城市、省，类别，时间提供相应数据文件数据来源
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他