更多v

Mysql

正文

order by
优化
性能监控
schema与数据类型优化
执行计划（explain）
通过索引进行优化
锁
- MyISAM
- Innodb
参数
- log
- cache
- innodb
查询优化
分区表

order by

order by返回的式游标而不是集合。唯一能重用列别名一步：语法顺序，执行顺序：（8）select （9）distinct (1) from【left_table】(3)join (2)ON (4)where(5)group by（6）with（7）having（10）order by.
使用order by后面接数字的方式来进行排序：select 姓名 as name，地址 as address，城市 as city from customers order by 1,2,3。第1，第2，第3个字段（也就是name，address，city）。请慎用order by加数字，尽量使用order by加列明或列别名。
表表达式式不能使用order by排序，表表达式包括视图，内联表值函数，派生表（子查询）和公用表表达式（CTE）。因为视图，内联表值函数，派生表（子查询）和公用表表达式（CTE）等返回的结果还需要进一步的去使用，加了order by进行排序是多此一举，反而会浪费系统资源。所以数据库的开发者不希望大家使用这样不规范的操作。
T-SQL(transact-sql是结构话查询语言的（sql）的增强版本)中表表达式加了top，offset或for xml可以使用order by的限制。因为带有order by的表表达式加了top后返回的是一个没有笃定顺序的表。子查询中不能使用order by的限制。

优化

count 1.不要使用count（1）或者count（*），要使用select 1 … limit 1.分页，1 id限定优化：id between … and … 2 使用临时表优化：使用临时存储的表来记录分页的id，使用分页的id。

性能监控

命令：看执行时间：set profiling=1；show profiles；show profile（for query 2）；show profile all/cpu。查看连接：show processlist。
performance库（87张表），show variables like ‘performance_schema’。

schema与数据类型优化

更小的更好，尽量用少的空间。简单就好，不同的数据格式，查询时间不同。ip用select inet_ATON(‘192.1.1.101’)和inet_NTOA(131351321).尽量避免null。
实际细则：整数类型：bigint(64)、tinyint（8）、int（32）、smalint（16）、mediumint（24）。字符和字符串类型：char：最大255，会自动删除末尾空格，效率比varchar高，存储密码，存储短字符串。varchar：存储长度波动很大的数据，存储字符串很少变更的场景，多字节字符。text。blob。datetime，占用八个字节，与时区无关，可以保存到毫秒，可保存的时间范围大，不要使用字符串存储时间，不仅占用空间还破坏函数便捷性。timestamp，占用四个字节，精确到秒，整形存储，依赖数据库设置的时区，1970-01-01–2039-01-19，自动更新列的值。date：3个字节，使用日期时间函数，1000-01-01—9999-01-19.自动更新列的值。date，3个字节，使用日期函数，1000-01-01—9999-12-31.用枚举类型代替字符串，create table enum_test （e enum（‘fish’，‘dog’）not null）。select e+0 from enum_test。
合理使用范式和反范式：范式：优点,更新比范式快。很少或者没有重复的数据。数据少，放在内存比较快。缺点：需要进行join。反范式：优点，避免关联。可以设计有效的索引。缺点，冗余多。三范式，列不可分，不能存在传递依赖，表的其他列必须唯一的以来主键。
主键的选择，代理主键，自然主键，推荐使用代理主键，不和业务耦合，因此更容易维护，通用的键策略能够减少源码数量，降低成本。
字符集的选择（utf8 mb4），纯拉丁字符尽量使用latin1，减少存储空间。不需要存放多种语言就没必要使用utf8和unicode。
存储引擎选择：InnoDB，数据和索引放在一起，B+树第三层存储的是实际的数据，聚簇，有覆盖索引。MyISAM，B+树第三层存储的是地址，多了一次IO，非聚簇，有覆盖索引。memory（用的hash散列），基于内存非常快，不能进行持久化。
适当的数据冗余，确保冗余字段被更新。
适当拆分，把不用的字段放到另外的表中。

执行计划（explain）

执行顺序，相同的从上往下，不同的越大越先执行。
属性值，select_type，type，类型，以何种方式访问数据，system-》const-》ref-》rang-》index-》all。id。table。possible_keys。key。key_len，越小越好。ref，显示索引那一列引用了，是一个常数，const表示常量值。rows预估值。extra，出现并不太好，using filesort、using where、using index（索引覆盖）、using index condition。

通过索引进行优化

底层存储用的B+树。链表节点树为8，总体为64会转为红黑树。红黑树是在AVL树的基础上牺牲了一部分查询效率级高了查询效率。一个索引就是一个树。磁盘预读，16k=4页。索引的优点，大大减少数据库需要扫描的数据量，帮助服务器避免排序和临时表，将随机io变为顺序io。索引的用处：1快速查找匹配where子句中的行 2 使用最少行的索引 3 左前缀查找行 4 当有表连接的时候，从其他表检索行数据 5 查找特定索引列的min和max的值 6 如果排序或者分组时可用索引的最左前缀完成的，则对表进行排序和分组 7 可以优化查询以检索数据值而无需查找数据行。
索引的类型：主键索引，唯一索引，普通索引，全文索引，组合索引，默认建立的索引是给唯一键建立的。面试技术名词：回表，从name列的B+树找主键，再从主键的B+树找到最终的数据。覆盖索引，select id ，id的值在回表的第一步就已经有了，就不需要第二步了，，就叫覆盖索引。最左匹配。索引下推。采用的数据结构，哈希表，B+树。索引的匹配方式，全值匹配，最左前缀匹配，匹配列前缀，匹配范围值，精确匹配某一列，并范围匹配另一列，只访问索引的查询。哈希索引，只有精确匹配所有列的查询才有效，只有memory存储引擎才支持。只存储对应的hash值，hash冲突，扰动函数，减少hash冲突。CRC32，循环冗余校验算法。组合索引。聚簇索引与非聚簇索引（数据存放的方式），聚簇索引，数据行跟紧邻的键值紧凑的存储在一起，非聚簇索引，先关掉索引，导入数据，打开索引，，防止索引更新。覆盖索引，索引存在与具体的文件里面，idb既有索引又有数据，MYD数据，MYI索引。
优化细节：当使用索引列进行查询的时候，尽量不要使用表达式，应该把计算放到业务层。尽量使用主键查询，而不是其他索引，因为主键查询不会触发回表查询。使用前缀索引，alert table table1 add key（city（7））前缀索引，select count（distinct left（city，3））/count（1），count（distinct left（city，4））/count（1） from emp。cardinality ，count（distinct（a））去重之后胃一直，基数。hyperloglog。使用索引进行排序，a=order by b，c 要么都是asc，要么都是desc。a=order by a，b；1 如果where里面的条件和order by的条件能组成最左匹配的话就用索引排序，如果where里面是范围就不能用了。2 如果order by的顺序和组合索引不一样没办法进行排序。
union all（union还得去重），in（oracle有个数限制为10000），or都能进行排序，推荐使用in，and优先级比or高，exist比in快，但写起来麻烦。范围列可以用到索引，但是范围列后面的列无法用到索引，索引最多用于一个范围列。<,>,<=,>=,between.强制类型转换会全表扫描，如果phone为varchar，使用select * from table where phone=112311111，不会触发索引。更新十分频繁，数据分区高度不高的字段上不宜建立索引，更新会变更B+树，更新频繁的字段建立索引会大大降低数据库性能，类似性别这类，不能有效过滤数据，一般区分度在80%以上就可以建立索引，区分度可以使用count（distinct（a））/count（1）。创建索引的列不允许为null，可能会得到不符合预期的结果。
join:当需要进行表连接的时候，最好不要超过三张表，因为需要join的字段数据类型必须一致。join…on…是为了区分连接字段和筛选字段。如果明确知道只有一条数据返回，可以使用limit 1提高效率。A constraint join B 强制先执行A在执行B。小表join大表。map join（小表先放内存对大表join）。join的方式，simple nested-loop join效率低，数据库开销大，index nested-loop join。block nested-loop join，join buffer大小256K，可以调，在mysql5.1.22之前是4G-1，之后在64位系统下可以设置为>4G，使用join buffer需要设置optimizer_switch的block nested-loop join为on，默认开启，show variables like “%optimizer_switch%”。大表join大表，使用分区表，筛选。
select * from t1 left join t2 on t1.id=t2.id；select * from t1 left join t2 on t1.id=t2.id and t1.name=‘张三’，on后面的一串条件，除了关联还要筛选name是‘张三’的，根据关联条件去t2表拿id与t1一样的，没有的话右侧全是null。使用相同的连接键。能使用limit的时候尽量使用limit。单表索引尽量控制在5个以内，索引数目多，对应的磁盘空间大，io量就会大。单索引字段锁不允许超过5以内（组合索引）。创建索引的时候应该避免以下错误概念，索引越多越好，越早优化，在不了解系统的情况下进行优化，应该是实际的优化步骤，不应该是一直说一大堆技巧。索引监控，参数，show status like ‘handler_read%’等。

锁

MyISAM

表共享读锁，对一个表加读锁，那么除了这个表之外的其他的表也能访问，目的是为了防止死锁，因为假如用户a锁住A表想查询B表，用户B锁住B表想查看A表会出现死锁。表独占写锁。如果table_locks_waited比较高，则说明存在这比较严重的表级锁争用情况。

Innodb

并发事务问题，脏读，不可重复度，幻读。如果锁争用比较严重，innodb_ROW_LOCK_WAITS和innodb_ROW_LOCK_TIME_AVG值会比较高。共享锁（读锁）log in share mode。排它锁（写锁）for update。意向共享锁。意向排它锁。自增锁，auto_increament自增列，表锁。间隙所。行锁针对索引加锁。如果where条件后面没有索引列，表示表锁，有的话就是行锁。mysql5.7之后引入了MTS,并行复制技术

参数

general，sock，客户端和服务端进行配置的。connection，max_user_connections，0表示不限制。show variables like ‘%back_log%’，在连接满时，等待堆栈维持的请求数。wait_TIMEOUT,关闭非交互链接等待时长。interactive_timeout，关闭非交互链接等待时长。长连接等待时长默认一小时。

log

redo，前滚日志，innodb，循环写，空间会用完，随机写。undo，回滚日志，innodb。bin log（默认不开启），服务端日志，mysql server，所有的引擎都可以有的，追加，顺序写。二阶段提交，三阶段提交：二阶段提交：先看内存有没有没有的话直接返回，更新数据，引擎将数据写入内存，同时写入redo，此时处于prepare阶段，并通知执行器执行完成，随时可以操作，执行器生成binlog，执行事务提交接口，引擎把redo的状态改为commit，更新完成；没有的话读磁盘。A原子性C一致性I隔离性D持久性，C最重要；A通过undo实现,I通过锁，D通过redo实现。commit，通过redo log写到log buffer再写到os buffer最后调用fsync（）写到磁盘。general_log，是否开启查询日志记录，默认关闭。general_log_file，指定查询日志文件名，用于记录所有的查询语句。show_query_log，show_query_log_file，long_query_time设置慢查询时间。log_show_admin_statements，是否将管理语句写入慢查询日志。ad_hoc即席查询。

cache

key_buffer_SIZE,索引缓存区大小。shpw status like ‘%qcache%’，query_cache_size。query_cache_limit。query_cache_min_res_unit缓存块最小大小，默认为4K，应该为4K整数倍。query_cache_type，0表示禁用，1表示缓存，2表示只有加sql_cache才会缓存。

innodb

innodb_buffer_pool_size，最大可以是物理内存80%.innodb_flush_log_trx_commit,写入日志文件并flush磁盘的时间点，0,1，2.innodb_thread_currency，跟核心数一致，或者是核心数的两倍。httpd用的BIO，nginx用的nio。read_rnd_buffer_size，随机读的缓存区大小，索引。

查询优化

查询慢的原因：网络，CPU,io，上下文切换，系统调用，生成统计信息，锁等待时间。优化数据库访问，查询性能低下的主要原因是访问的数据太多，某些查询不可避免的需要筛选大量的数据我们可以通过减少访问数据量的方式进行优化–IO,确定应用程序是否检索大量超过需要的数据，确认MySQL服务器层是否在分析大量超过需要的数据行，貌似是30%。是否向数据库请求了不需要的数据，查询不需要的记录，多表关联时返回全部列，严格避免*，表关联要加别名。总是取出全部列。重复查询相同的一些数据。查询缓存在mysql8就被干掉了，当库里的数据更新插入很频繁的时候（命中率比较低），意味着查询缓存会经常失效，其实缓存用redis更合适，如果内存满了，还要使用相应的淘汰策略（LRU）
执行过程优化，查询缓存。查询优化处理，语法解析器和预处理，AST tree（抽象语法树），calcite。查询优化器，RBU（基于规则的优化），CBU（基于成本的优化）。show status like ‘last_query_cost’最后一次查询所用的成本，结果是经历多少个数据页，基于：每个表或者索引的页面个数，索引的基数，索引和数据行的长度，索引的分布情况。在很多情况下，mysql通常会选择错误的执行计划，原因如下：1统计信息不正确2 执行计划的成本估算不等同于实际执行的脚本3mysql的最优可能跟你想的不一样4mysql不考虑其他并发的查询5 mysql不会考虑不受其控制的操作成本；优化器的优化策略：静态优化，直接对解析树进行优化并完成优化，动态优化，mysql对查询的静态优化只需要一次，但对动态优化每次执行前都需要重新评估。优化器的优化类型：重新定义关联表的顺序，将外连接转换为内连接，内连接效率高，因为内连接数据量少，使用等价变换规则，优化count，min，max；min和max的优化可以使用分组条件，因为分组可以使用索引，预估并转换为常数表达式，当mysql检测到一个表达式可以可以转换为一个常数的时候，就会把该表达式作为常数处理，例如：a>4 AND A<4可以转换为a！=4，索引覆盖，子查询优化，等值传播，谓词下推，先把数据过滤，再进行连接。关联查询，一般情况下，很少改优化器，select straight join a，b…从头读表。排序优化，一次传输数据，直接全取出来排序，当排序的列的总大小+order by列的大小超过max_length_for_sort_data,就用双次排序，反之。当然，用户可以自定义。
特定类型的优化，count，count（1），count（*），count（id）为null时不计算。优化关联条件，确保on或者using上有索引，创建索引时要考虑关联的顺序，确保orderby和group by只涉及到一个列。优化子查询，尽可能使用关联代替子查询。如果对关联查询做分组，并且是按照查询表中的某个列进行分组，那个可以采用查询表的标识列（关联字段）分组的效率比其他列高。
使用用户自定义变量，@p表示自定义变量，@@p表示系统变量；set@i：=1；selet @i；select @@autocommit，当前会话有效，开窗函数row_number over。current_date系统时间，优化排名语句，再给一个变量赋值的同时使用这个变量，变重复查询刚刚更新的数据，确定取值的顺序（执行顺序）。‘优化limit分页，id>XXX’,BETWEEN AND,INNER JOIN 使用覆盖索引。优化union，行转列（join，union，case when，DV,distinct value）。

分区表

应用场景：表很大以至于无法全部放入内存，或者只在标的最后部分有热点数据，其他都是历史数据，分区表的数据更容易维护，分区表的数据可以分布在不同的物理设备上，从而高效的利用多个物理设备，可以使用分区表避免某些特殊的瓶颈：ext3文件系统的inode锁竞争，innodb单个索引的互斥访问。可以备份和恢复独立的分区。
分区表的限制：一个表只能有1024个分区，在5.7的时候可以支持8196个分区，1G内存10万个文件，限制65535,5.5的mysql可以直接使用列进行分区，如果分区字段中主键或者唯一索引的列，那么所有的主键和唯一索引列都必须包含进来，分区表无法使用外键约束，因为数据文件在不同的设备上。
分区表的磁盘底层原理：分区表由多个相关的底层表实现，底层表也是有句柄对象表示。
分区表的类型：列分区，低版本int，高版本没有限制；hash分区；key分区；子分区；范围分区。
如何使用分区表：全量扫描数据，不要任何索引。索引数据，并分离索引。

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &