oHouShanRen1

大数据架构师应该做到的

---- github地址
---- 关于软实力部分同步会更新场景落地
---- 直接访问ProcessOn脑图请点击
---- 高清大图
---- 脑图文件

技能图

大数据架构师该掌握的技能

主要分为两块硬能力与软实力
- 一.平台建设
- 二.数据搜集
- 三.数据价值
- 四.数据安全
- 五.质量保障
- 六.个人素质
- 七.技术能力
- 八.产品与运营思维
- 九.团队建设管理能力
- 十.人生开悟之路

硬能力

一：平台建设
- 1.行业平台
  - 1）大平台
    - 谷歌云
    - 亚马逊云
    - 阿里云
    - 腾讯云
    - 网易云
    - 华为云
  - 2）小平台
    - 国云
    - 国双
    - 青云
    - 勤思
  - 3）专业工具平台
    - 海致BDP
    - 永洪
    - 易观
  - 4）APP分析平台
    - mix panel
    - growing IO
    - 神策
    - 诸葛 IO
- 2.技术选型
  - 1）CDH
  - 2）HDP+HDF
  - 3）MAPR
  - 4）Transwarp
- 3.平台架构
  - 1）HDP Core(平台核心也是Hadoop core)
    - HDFS(存储)
    - MapReduce(批处理)
    - Yarn(基础资源调度)
      - 负责集群资源的统一管理和调度
      - 单节点资源管理和使用
      - 应用程序管理
      - 对任务运行环境的抽象
      - 支持运行长应用程序和短应用程序
      - 支持docker fpga
      - 期待更细粒度的资源控制
      - 对比Mesos
    - Oozie(任务调度编排)
      - 平台调度的基础保障
      - hadoop 各种任务的使用与调度
      - 对比 Azkaban Airflow
    - Slider(调度支持新版已经集成yarn)
  - 2）Enterpise Data Warehouse(企业数据仓库)
    - Pig(基础脚本服务)
      - 用类sql语言保证mr执行顺畅
      - pig latin 的执行环境
    - Hive(数据仓库存储)
      - 基础数据仓库(ods gdm dw app dim)
      - 基础ETL的运行实例
      - OLAP的数据存储(kylin)
      - 各种数据的hive外表用于查询
      - 对比impala
    - Druid(adhoc方案实时多维查询和分析)
      - 已处理数十亿事件和TB级数据
      - 实时查询分析高可用、高容错、高性能
      - 交互式聚合和快速探究大量数据
      - 为OLAP工作流的探索性分析而构建，支持各种过滤、聚合和查询
      - 对比 drill mdrill 等
    - Tez(简化增强hive)
    - Sqoop(数据导入导出工具)
  - 3）Data sclence(数据科学)
    - Spark(内存通用并行计算)
      - 推荐相关
      - 数据清洗
      - 特征抽取
      - 预测相关
      - 对比 flink storm
    - flink
    - Spark sql(结构化数据处理)
    - Spark streaming(spark流式处理)
    - Zeppelin(界面分析挖掘工具)
      - 基于R和python的单机界面使用工具(分析挖掘)
      - 基于spark kafka 的界面操作工具
      - 基于预测数据的使用与展现
      - 支持pandas numpy
      - 支持R
      - 支持hive hbase spark sparksql sparkstreaming
      - 支持keras matplotlib pysql
  - 4）Operational data store(操作KV存储)
    - Hbase(kv数据存储)
    - Phoenix(hbase 类sql查询)
  - 5）Securlty governance(安全治理)
    - Knox(鉴权工具)
      - 数据的权限鉴权通道
      - 平台跟外部的出入口
    - Ranger(权限管理工具)
      - 架构下各组件的权限管理
      - 记录操作日志到solr
    - Atlas(元数据溯源与数据治理工具)
      - 大数据平台下各种操作的元数据记录
      - 数据打标签(对于维度指标 ETL等)
      - 可查询hive storm spark sqoop oozie nifi 元数据，可自定义实现自己的需要查看和维护的工具
      - 数据流转流程的图像化展现
      - 元数据操作记录与各种信息查询
  - 6）Stream procressing(流式计算)
    - Storm(实时数据处理分析)
    - Kafka(分布式发布订阅消息系统)
    - Streaming Analytics Manager (流式数据处理界面工具)
      - 拖放可视化设计，开发，部署和管理流式数据分析应用程序
      - 进行事件关联，上下文衔接，复杂模式匹配，分析聚合以及创建警报/通知
    - MiNiFi(边缘数据处理)
      - 数据产生的源头收集和处理数据
      - 通过实现边缘设备智能(edge intelligence)来调整数据流的双向通信
      - 可以数据溯源(Data Provenance)
      - 可以集中管理和下发Agents
      - java agent
      - c++ agent
  - 7）Operations(平台运维工具)
    - Ambari(大数据平台管理工具)
    - Ambari Metrics(监控平台各类服务及主机的运行情况)
    - Ambari Infra
    - Zookeeper(基础分布式保证工具)
    - Solr(搜索应用操作日志存储)
  - 8）Data operation platform(数据操作平台)
    - NiFi(数据 ETL 数据流处理)
      - 日志清洗业务数据入库
      - 基础数据(mysql binlog业务库 )ETL
      - 部分外部数据
      - 自定义数据接入方式
      - 自定义数据流程处理
      - 数据输出出口
    - NiFi Registry(NiFi版本管理工具)
      - NIFI的版本记录回溯
      - NIFI Schema Registry 来统一文件定义(类配置中心)
      - 配合SwaggerAPI数据定义
    - Hue(大数据交互界面平台)
  - 9）Data visualization(数据可视化工具)
    - Superset(数据分析界面工具)
    - FineBI(BI界面分析工具)
      - 报表数据可视化
      - 部分OLAP分析
      - Fine Index
      - FIne Direct
      - 现场数据实时展示
    - (Cboard) 主用于数据导出
    - Metabase
      - 直接用来对接运营产品的数据交互工具
      - 支持问题模式,支持对数据进行标记
    - 对比 Saiku Tableau Qlikview
    - 自主研发
      - Echarts HighCharts
      - inMap
      - datav
  - 10）OnlineAnalytical processing(OLAP解决方案 adhoc)
    - Kylin(MOLAP方案)
      - 维度间交叉分析
      - 构建过程基于hive集群不需要单独搭建
      - 数据存储于hbase集群，主要消耗磁盘
    - HAWQ(SQL on Hadoop)
      - 符合ANSI SQL规范并且支持SQL 92、99、2003 OLAP
      - 包含关联子查询、窗口函数、汇总与数据库、广泛的标量函数与聚合函数的功能
      - TPC-DS针对具有各种操作要求和复杂性的查询定义了99个模板（例如，点对点、报告、迭代、OLAP、数据挖掘等）
      - HAWQ使用Apache Ambari作为管理和配置的基础
    - GreenPlum(MPP架构升级版PostgreSQL) 学习资料
      - 基于PostgreSQL
      - 采用两阶段提交和全局事务管理机制来保证集群上分布式事务的一致性
      - 建立在实例级别上的并行计算，可在一次SQL请求中利用到每个节点上的多个CPU CORE的计算能力
      - 解决大问题而设计的并行计算技术，而不是大量的小问题的高并发请求
    - PostgreSQL (单机ORDBMS) 学习资料
      - 天生就是为扩展而生的，可以在PG中用Python、C、Perl、TCL、PLSQL等来扩展
      - 强大 SQL 支持能力和非常丰富的统计函数和统计语法支持
      - hash join、merge join、nestloop join的支持方面做的较好
    - Presto(MPP-SQL交互式查询引擎)
      - 多数据源(Hive,Hbase,RDBMS)
      - 支持标准SQL 不支持UDF
      - 对表的连接以及 group by操作有比较严格的大小限制
      - 对集群结点的内存和CPU消耗较大
    - Elasticsearch
      - 横向可扩展，高可用分片机制
      - 单集群,索引缓存在内存中,单节点易造成内存溢出
      - 不支持复杂sql,无法实现关联统计分析
    - HashData(SQL on Cloud)
      - 托管于云平台，用户不再需要为基础设施投资，不再需要调优运维，仅为您使用的计算资源买单
      - 分布式架构，根据负载快速扩充计算能力，实现高性能计算，满足用户交互式查询的需求。
      - 云数据仓库,针对云平台订制设计。利用云计算的优势，实现数据仓库的高可用、快速恢复、弹性扩容
    - ClickHouse 学习资料
      - 实时数据更新
      - 关系型、支持SQL
      - 可以不依赖hadoop平台
      - 分布式并行计算，把单机性能压榨到极限
      - 列式存储数据库，数据压缩
  - 1. Graph database(图数据库) 对比图
    - Janus Graph(图数据库引擎)
      - 图的序列化, 图的数据模型和高效的查询
      - 依赖hadoop来做图的统计和批量图操作
      - 为数据存储,索引和客户端访问实现了粗粒度的模块接口
      - 模块架构能和和许多存储,索引,客户端技术集成. 可以简便的扩展新的功能
    - Dgraph(事务性的分布式图形数据库)
      - 解决企业在数据库增长超过单个服务器时面临的一些问题而构建
      - 可扩展的，分布式的，低延迟的图数据库
      - 超过 TB 的结构数据里，为用户提供足够低延迟的实时查询
    - Neo4j(NoSQL图数据库)
    - ArangoDB(NoSQL数据库)
      - 原生多模型数据库
      - 可以将逻辑功能加入V8的 js framework Foxx™中并可以完全访问所有功能
      - 可扩展性，JOINS, 复杂事务处理
- 4.资源申请
  - 1）基准测试
  - 2）资源预估(基于业务存量与增量)
  - 3）理解各组件的CPU IO 内存硬盘带宽的特性
  - 4）硬件知识(RAID 存储加速存储接口等 )
  - 5）瓶颈资源预判
  - 6）分阶段保障
- 5.日常维护
  - 1）bigdata devops
  - 2）权限授权
  - 3）瓶颈判断
  - 4）继续需求的二次开发
  - 5）组件版本关注与升级
  - 6）各种疑难杂症修复
  - 7）环境维护(正式测试)
- 6.技术调研
  - 1）机器学习
  - 2）IOT相关
  - 3）边缘计算
- 7.云平台化建设
二：数据获取
- 1.公司内结构化数据
  - 1）增量
  - 2）全量
  - 3）拉链
  - 4）binlog
  - 5）接口
  - 6）kafka需求对接
2.小程序
- 1）支付宝小程序
- 2）头条系小程序
- 3）微信小程序
3.公司内非结构化数据
- 1）日志
  - 接口
  - 内部埋点
    - 后端埋点方案
    - 无埋点方案
    - url规约系统
    - 用户级别
    - 页面级别
    - CMS块级别
    - 事件级别
  - 第三方埋点
    - GA
    - 百度
    - 友盟
    - 其他
  - 搜索
- 2）视频
- 3）图像
- 4）excel
- 5）文档
4.外部数据(非公司IT支撑)
- 1）爬虫平台开发利用推进
- 2）API对接
- 3）销售使用的外部工具数据取回
  - 启信宝
  - 企查查
  - 天眼查
  - 赤狐
  - 各种CRM
- 4）运营使用的外部工具数据取回
  - 广点通
  - 达摩盘
  - 知乎DSP
  - 今日头条系
  - 百度系
  - 微博营销工具
  - 个推
  - 腾讯信鸽
  - 各种统计平台
  - …
5.外部数据
- 1）数据报告
  - 199IT(100+)
  - 艾瑞(100+)
  - IT橘子
  - 国家互联网中心
  - 恒大研究院
  - 亿欧智库
  - 易观数据
  - 中国通信研究院
  - 腾讯数据实验室
  - 阿里研究中心
- 2）商业合作
  - 数据交换
  - 专项购买
  - 流量互补
- 3）竞品数据
  - 分析竞品列表
    - 风险信息商业环境
    - 正负面情绪
    - 新闻动态频率
    - 讨论度
    - 热点主题
    - 关联商家
    - 关联人物
    - 关联品牌
  - 爬虫获取商家商品评论等业务数据
  - 从一些公开平台获取统计数据
- 4）行业数据
  - 大盘数据
  - 行业动态数据
- 5）统计数据
  - Similar web
  - 新榜
- 6）数据资讯
  - 智东西
  - 大数据导航
三：数据价值
- 1.数据清洗
  - 日志数据清洗(UDF SparkStreaming )
  - 业务数据清洗
  - 维度数据抽取
  - NLP语义化
  - 图片识别等
- 2.数据仓库
  - 1）分层
    - Operational Data Store(ODS) 原始操作数据
    - General Data Mart(GDM)清洗后通用数据
    - Data WareHouse (DW)数据集市
    - Dimension Data(DIM)维度数据
  - 2）规范
    - 权限规范
    - ETL规范
    - 调度规范
  - 3）ETL
  - 4）元数据(Atlas查看和标记)
    - 业务元数据
    - ETL元数据
    - 数据元数据
- 3.统计报表
  - 分类
  - 维度
  - 指标
  - 数据可视化
- 4.商业智能
  - 关键指标与转化
    - 博弈分析法(找到博弈方，找到博弈方的冲突与矛盾)
    - 企业价值评估法(找到利益保持或者增长的关键点或者业务流程量化KPI)
    - 行业参考(标准行业的指标体系)
    - 保证少而精结果导向可衡量一致性
  - 影响业务决策
  - 影响运营决策
  - 影响老板决策
- 5.数据报告
  - 抓重点业务或关键路径
  - 体系化叙述
  - 重点数据解释
  - 编写参考玩转keynote
- 6.业务赋能
  - 用户画像
  - 推荐
  - 广告
  - 数据预警
  - 数据预测
  - 数据查询
  - 对运营支持的数据工具
  - 对业务销售支持的数据工具
- 7.数据产品
  - 2B
    - 行业标准与数据共享
    - 垂直行业指数项目
    - B端客户数据价值展示
  - 2C
    - 结合产品规划
    - 推荐
    - 搜索
    - 风控
    - 舆情监测
    - 用户画像
    - 反作弊
- 8.场景探索
四：数据安全
- 1.企业数据分级
  - 普通
  - 敏感
  - 机密
  - 绝密
- 2.数据隐私保护
  - Personal Identifiable Information(PII级别)
  - 用户唯一标识(因公司而异)
  - 核心业务数据订单优惠券等(掩码)
- 3.平台权限控制
  - 数据导出权限控制
  - 账号跟踪与密钥更换
  - 数据使用申请
- 4.数据流程规范
  - 需求对接规范
  - 数据订正规范
  - 业务数据变更修正
五：质量保障
- 1.平台与资源保障
- 2.数据质量
- 3.统一口径
- 4.故障跟进

软实力

一：个人素质
- 1.体系化建设
  - 1）快速了解一个体系
    - 渠道
      - 专业图书
      - 技术官网
      - github
      - processon 里的推荐功能
      - 技术博客
      - 知乎
      - 体系报告网站(参考数据获取-外部数据-数据报告)
      - 各种行业平台网站
      - 谷歌百度
      - 找朋友聊加微信QQ群
    - 记录整理
      - 找个工具记录散漫的疯狂阅读与吸取
      - 最好用表格来划分横向维度和纵向维度
    - 消除杂音
      - 刨除过程中一些过时的资料或者概念
      - 尽量找原版的设计与理解
  - 2）快速形成自己的理解
    - 聚合
    - 分类
    - 排序
    - 深入
  - 3）系统计划
  - 4）修正策略
  - 5）投资视角看公司
    - 商业模式
      - 完整的产品、服务和信息流体系，不完全决定着盈利模式但是衡量盈利模式的基础
      - 简单易懂一句话说明白的模式就是好模式
      - 在产业上下游关系所处的位置
      - 定价权在哪里
      - 企业和客户关系的好坏
    - 盈利模式
      - 探求企业利润来源、生产过程以及产出，对企业经营要素进行价值识别和管理关注持续力
    - 团队
      - 关注公司的团队架构，工作任务如何进行分工、分组和协调合作。关注CXO
        
        专一性
        
        创新性
        
        管理者优势
    - 用户来源
      - 关注在特定的公司下他们是如何获客的，获客的效果与方法是否可以持续健康的保持优势
    - 现金流
      - 公司对于内部价值的挖掘和在商业上的资金变现能力
    - 成本结构
      - 成本结构
      - 决定因素
      - 成本产业优化
      - 变现能力
    - 路径依赖
      - 公司内部对主营业务的依赖性，对于新业务拓展的阻碍。在快速调整方向时能动性的高低
    - 烧钱速度
    - 竞争对手
      - 赛道内竞争对手的强弱与个数，竞争对手的资方背景。竞争对手对红海的竞争性与蓝海的开拓性
    - (赛道)行业特性
      - 垂直行业内的一些特殊关注点和可能发现的价值挖掘点，也是可能构建护城河的点
    - 价值流失
      - 价值守护的能力，包括资产数据用户，针对于流失的方法策略是否有意识和具体的动作
    - 护城河
      - 抵御竞争者的保护措施
        
        财务效率
        
        边际成本
        
        回报率
        
        品牌效应
    - 天花板
      - 公司所在的行业是否已经进入饱和状态，是否供过于求
        
        关注行业或者需求拐点
        
        关注小行业的大公司
        
        关注新旧势力平衡关系
        
        关注面对天花板公司采取的策略
- 2.业务破局
  - 1）了解业务
    - 老板高管经理
      - 投其所好
        
        多渠道的了解老板画像
        
        试探数据价值的关注度
      - 换位思考
        
        从他们的角度去考虑他们遇到的困难，不解和所做的决定
        
        不要被他们的思维固化(在其位谋其政)影响你对于数据价值的思考
      - 全面的体系重要的分级
        
        全面的体系化建设(基于对行业业务数据的宽泛认知)
        
        永远要记住摸清主线
        
        按照重要程度(看势)做事情的分级
      - 观察对方的底线(长期)
    - 技术产品运营
      - 技术体系初步印象
        
        前端(ios android pc tv) 涉及到埋点日志事情
        
        后端(微服务链路数据库) 涉及到业务数据入库和日志收集
      - 掌握全局(局部)数据库
        
        先全面后局部的感觉下数据库设计(如果有ER图提供最好)
        
        感觉下量级与增速
      - 深入了解产品的规划
        
        找到契合点不要越界
        
        数据价值为主外层的展现为辅
        
        产品方向的数据价值多数来自C端所以推荐广告用户画像等为主不同的行业考虑下特性应用(O2O IOT 新零售 AI的落地应用)
      - 拿出诚意才会得到配合
        
        站在开发者角度去尽量减轻他们的负担
        
        日志与埋点的配合
        
        业务数据入库配合
        
        底层运维支持配合
        
        技术层面的分享带给别人更多理解相关技术的机会
      - 是否需要数据产品经理
        
        涉及到产品规划和业务赋能的最好有数据产品对接
        
        关于数据报表分析的最好让数据分析人员进入对接一线
    - 销售业务财务
      - 良好的沟通从兴趣开始
      - 数据价值来源于解决B端面临问题
        
        是否能提供有价值的数据让业务跑得更快
        
        能否提供销售更直接的客户服务数据
        
        财务的事情佛系对待
      - 合适的机会跟他们一起开会，反复强调的内容里面就有重点和痛点
      - 多花时间研究他们的工作流程
        
        流程最能体现价值(优化提速转化效率)
        
        接触工作流程中可以更深刻的理解业务
      - 关键指标一定会有所提及(不懂找资料学习再沟通) 绕不过的钱
        
        记录关键指标自己先琢磨在找懂的人沟通
        
        遇到不分享的可以先想办法解决他的一些问题，无论大小，展现诚意。记住自己的目标
  - 2）分析痛点
    - 将痛点归类(部门角色数据源数据价值)
    - 归类后痛点间的关联关系找主线
    - 能解决的痛点才是痛点
    - 缩小范围解决头部需求反手解决次类需求
  - 3）专注行动
    - 象限法(重要紧急四象限)
      - 优先处理重要且紧急紧急不重要的
      - 阶段性的处理重要不紧急的(这种事情要记录在本本上)
    - 行动前的影响与价值预估
      - 可能对其他部门或人造成的工作加重减轻与正负面影响
      - 行动能得到的可能价值(对需求方相关人团队自己)
    - 可拆解的任务才能行动
      - 行动计划保证在一个可控范围内(人员时间资源 )
      - 任务的串并行尝试
      - 人员维度的安排
      - 时间维度的安排
    - 行动中的修正与反馈
      - 寻找一个反馈对象(最好是需求方)
      - 修正来源于对结果的不可控(保证损失最小)
    - 拿到结果一定要说话(不要当哑巴付出得到回报天经地义)
      - 打算说给谁听
      - 准备好PPT(参见玩转keynote)
      - 时间地点
- 3.数据解读
  - 考虑受众
    - 想要说给谁听是重中之重
    - 了解对方的工作特性用类比方式的去阐述数据
  - 实事求是轻易不下结论
    - 全局意识
    - 局部业务专研分析思维
    - 小心求证，在给出数据前多做检验
  - 会看数据
    - 维度-指标-特征-缺失-差值-聚合-分类-排序
    - 比率-中数-众数-方差-维度相关性
    - 多维度的去思考和验证
    - 寻找数据点(点) - 寻找主数据(线) - 串联数据的顺序关系(面)
- 4.工具利用
  - 1）时间管理工具
    - Omni Focus
    - Tyme2
  - 2）快速记录工具
    - 备忘录
    - Wiki
    - Macdown
  - 3）扩展思维工具
    - MindNode
    - Processon
  - 4）学习成长工具
- 5.清醒复盘
  - 1）复盘前的思考
  - 2）何时复盘
  - 3）避坑总结
- 6.玩转keynote
  - 1）确定主题与讲述思路
    - 解决痛点模式
    - 突出主题模式
    - 流程讲解模式
    - 技术分享模式
    - 融资招商模式
    - 数据报告模式
  - 2）讲述靠说不靠堆叠
    - 言简意赅
    - 归纳总结
  - 3）利用模板来快速制作和辅助思路
    - 参考模板
      - Layouts for Keynote(App Store有售)
      - PC6合集
    - 辅助思路
      - 当有些思路阻碍可以看看模板上被人是如何处理和展现的
      - 运用模板的特殊元素来装扮自己的文案
  - 4）基础色调选取与排版建议
    - 色调选择
      - 运用模板的特殊元素来装扮自己的文案
      - 多用过度色原则上整体别超过5个
      - 颜色可以用吸管从浅入深或由深入浅波动选择
      - 黑白灰为常用过度配色
      - 分清极暖色极冷色暖色冷色微暖微冷
      - 色彩的对比平衡混合多练习
    - 排版建议
      - 建议用“细黑”的字体，比如冬青黑体，华文雅黑，微软雅黑light等
      - 节奏感：尺寸大小，上下位移，旋转，间距，就是不能让文字之间稳当地排在一起
      - 巧用各种图形可以更形象化的让人理解
      - 大纲最好列在每页的面包屑上
    - 巧用动画
- 7.行业关注
二：团队管理
- 1.遇见对的人
- 2.人尽其才
  - 组团队
  - 差异化
  - 重培养
- 3.上通下达
- 4.拒绝沉溺(不要给鱼)
- 5.老司机别翻车
  - 容忍与控制
  - 不要触碰底线
  - 没有什么是烧烤不能解决的如果有那就两顿
三：技术能力
- 1.编程
- 2.算法
- 3.数据仓库
- 4.工程
四：人生之路
- 1.平衡之道
  - 1. 规划VS变动
  - 1. 领导VS下属
  - 1. 个人VS团队
  - 1. 资源VS价值
  - 1. 家庭VS工作
- 2.破除心魔
  - 1）以结果导向
    - 理论上个人感受会是结果导向的障碍
    - 结果是个大家相对一致的预期结果
  - 2）接受一家公司代表要融入一种文化
    - 是否喜欢是个很重要的分水岭
    - 无论什么企业文化都会以结果为导向
    - 综合评定自己的容忍度
  - 3）敲碎or划清边界
    - 阻碍目标的大多都是边界内自己要做或者推动的
  - 4）多维度的看待事情
    - 不要再不同纬度观点下讨论事情，这样容易产生无谓的争执
    - 当一种角度理解不了某些人或事的时候那就切换下角度
    - 对一个事情或者一个人的评判一定不要单纯的一个角度下结论
    - 同样的维度之间切换自如有助于你讨喜
  - 5）信任之路且行且珍惜
  - 6）道德沦陷还是底线失守
    - 改变自己，做自己认为恶心的事情是不是就是道德沦陷
    - 底线是一个恒久不变的还是一个根据自己的发展阶段家人事业朋友动态调整的
- 3.推荐书籍
  - 1）技术类(不包含理论与技术框架)
    - 《数学之美》
    - 《数据仓库工具箱：维度建模的完全指南》
    - 《美团机器学习实践》
    - 《数据挖掘与数据化运营实战思路、方法、技巧与应用》
  - 2）业务类
    - 《无印良品的改革》
    - 《增长黑客》
    - 《智联网》
    - 《浪潮之巅》
    - 《京东平台化数据运营》
  - 3）管理与心理学
    - 《原则》
    - 《乌合之众》
    - 《说谎》
    - 《卓有成效的管理者》
    - 《九型人格》
    - 《影响力》

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
人生的每一步路都算数 sheli
如果你想打工，一直靠打工赚钱，那你就会不断的希望自己变得更专业，不断的希望能够获得更好的工作机会，升职加薪。如果你的目标志不在此，而是拥有自己的企业，那你的选择就会出现差别。在认真打工的人眼里，会“不务正业”，会总是选择不同岗位，甚至放弃高薪机会。但是这背后都是有更加长远的规划。成功富人所必需的管理技能包括：1．对现金流的管理。2．对系统的管理。3．对人员的管理。所以，在没有获得这些能力之前，只要
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
闲鱼鱼小铺怎么开通？鱼小铺开通需要哪些流程？高省APP大九
闲鱼鱼小铺是平台推出的一个专业程度的店铺，与普通店铺相比会有更多的权益，比如说发布的商品数量从50增加到500；拥有专业的店铺数据看板与分析的功能，这对于专门在闲鱼做生意的用户来说是非常有帮助的，那么鱼小铺每个人都能开通吗？大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
果然只有离职的时候，才有人敢说真话！ return2ok
今天公司出了神贴。今天中午吃饭，同事问我看了论坛上的神贴了吗？什么帖子？我问。同事显得很惊讶，你居然没看，现在那个帖子可能会成为年度最佳帖子。这么厉害？我等不及了，饭没吃完就快速的奔向办公室，打开公司论坛，我要一睹这个帖子的神奇。写这帖子的童鞋胆儿真肥。这哪里是一个帖子，这是很多个帖子，组成了一个系列。某人从公司文化、管理、人事、项目管理等多个方面分析了公司的概况，并抨击了公司的各种弊端，并提出了
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的

大数据架构师应该做到的

技能图

大数据架构师该掌握的技能

硬能力

软实力

你可能感兴趣的:(大数据,hadoop,大数据,架构,分析,技能)