zxc123qwer

Datawhale组队学习——推荐系统Task03 离线物料系统的构建

以下学习笔记参考自Datawhale12月组队学习的推荐系统课程，内容主要为离线物料系统的构建。
项目原链接： https://github.com/datawhalechina/fun-rec

离线物料系统基本流程

物料侧画像的构建：首先添加新物料，新物料通过每天凌晨在新闻网站上爬取并存储在MongoDB中，对于旧物料画像，通过用户的交互记录（阅读，点赞，收藏）进行更新并将其拆分为静态和动态分别存入Redis中。
用户侧画像的构建：主要分为新注册用户画像的更新和老用户画像的更新两方面。用户通过前端注册页面，进行用户注册，新注册用户基本信息及其行为数据构造用户画像，存入MongoDB中的UserProtrai集合中。用户通过阅读、点赞及收藏新闻，将用户行为数据存入MySQL的用户阅读信息表（user_read）、用户点赞信息表（user_likes）和用户收藏信息表（user_collections）。
画像自动化构建：编写脚本定时完成一系列任务，先爬取新闻数据，这里需要注意的是，虽然是今天零点爬数据，但是实际上爬的是前一天的新闻。数据爬完之后，离线更新用户画像，物料画像及线上要存储再redis中的画像。最后是离线推荐的流程，离线将用户的排序列表存到redis中，线上取出即可。

scrapy进行新闻爬取

使用scrapy创建爬虫项目

输入以下命令即可创建scrapy项目：

scrapy startproject sinanews

爬取流程

调用start_request()方法开始爬取，并作为返回请求的迭代器。
调用parse()方法对scrapy下载的URL链接进行处理。
通过回调parse()方法，解析网页并返回在items.py中定义的对象，通过回调下一层的parse_content()方法，解析新闻内容。
每天凌晨定时从sina网站爬取新闻信息，将不重复的新闻存入MongoDB。

物料画像构建

物料画像更新逻辑

新物料添加到物料库这件事情肯定是发生在新闻爬取之后的，将新物料添加到物料库之前还需要对新物料做一些去重和其他简单的画像处理，具体则是将新物料画像添加到MongoDB的NewsRecSys库的FeatureProtrail 中
将用户的动态行为信息（阅读，点赞，收藏）更新到旧物料（新闻动态画像）中
将最新的物料库中的新闻信息往RedisProtrail物料库中写一份，并去掉一些前端展示不需要的字段内容，作为存储再redis中的新闻内容的备份内容。

核心函数功能

update_new_items（）：新物料画像的更新
update_dynamic_feature_protrail()：更新动态特征
update_redis_mongo_protrail_data()：redis展示新闻内容的备份

物料添加进redis数据库

    # 每次创建这个对象的时候都会把数据库中之前的内容删除
    news_redis_server = NewsRedisServer()
    # 将最新的前端展示的画像传到redis
    news_redis_server.news_detail_to_redis()

用户侧画像的构建

用户画像更新逻辑

将用户的新闻曝光数据保存到MySQL中，用于进行去重。
每日遍历用户日志，更新用户历史阅读的记录，对阅读、点赞和收藏三个用户行为表来做具体的用户兴趣相关画像。

核心函数功能

user_exposure_to_mysql()：用户曝光数据落在mysql
update_user_protrail_from_register_table()：更新用户画像

画像自动化构建

物料更新脚本:process_material.py，用户画像更新脚本: process_user.py，redis数据更新脚本：update_redis.py
将上面三个脚本穿起来的shell脚本：offline_material_and_user_process.sh
使用crontab定时任务，每天凌晨1点执行shell脚本

你可能感兴趣的:(mongodb,redis,推荐系统,mysql)

基于Elasticsearch的短视频平台个性化推荐系统设计与实现亲爱的非洲野猪 elasticsearch 音视频推荐算法
在当今内容爆炸的时代，个性化推荐系统已成为短视频平台的核心竞争力之一。本文将详细介绍如何利用Elasticsearch（ES）构建一个高效、可扩展的短视频个性化推荐系统。一、系统架构概述我们的推荐系统将采用混合推荐策略，结合协同过滤、内容相似度和热度推荐等多种方法。Elasticsearch作为核心搜索引擎和数据存储，将承担以下职责：用户画像存储与查询视频内容索引与检索实时行为日志分析推荐结果计算
MySQL CDC与Kafka整合指南：构建实时数据管道的完整方案亲爱的非洲野猪 mysql kafka 数据库
一、引言：现代数据架构的实时化需求在数字化转型浪潮中，实时数据已成为企业的核心资产。传统批处理ETL（每天T+1）已无法满足以下场景需求：实时风险监控（金融交易）即时个性化推荐（电商）物联网设备状态同步微服务间数据一致性本文将深入探讨如何通过MySQLCDC与Kafka的整合，构建高效可靠的实时数据管道。二、技术选型：三大CDC工具深度对比功能矩阵比较特性DebeziumCanalMaxWell多
2025年的前后端一体化CMS框架优选方案 skywalk8163 多媒体 web cms
以下是结合技术生态、开发效率和商业落地验证，整理的2025年前后端一体化CMS框架优选方案：一、‌主流成熟框架组合‌1.‌React+Node.js(Express/Next.js)‌‌前端‌：React生态成熟，配合Redux状态管理，适合复杂后台界面开发‌78。‌后端‌：Express轻量灵活，Next.js支持SSR优化SEO，无缝对接MongoDB/PostgreSQL‌810。‌案例‌：
【大数据入门核心技术-DolphinScheduler】（二）DolphinScheduler安装部署-集群模式 forest_long 大数据技术入门到21天通关大数据 spark hive hadoop 交互 flink mapreduce
目录一、部署模式1、单机模式2、伪集群模式3、集群模式二、部署安装1、下载2、创建mysql元数据库3、配置一键部署脚本4、初始化数据库5、一键部署DolphinScheduler6、访问DolphinSchedulerUI三、启停命令一、部署模式DolphinScheduler支持多种部署模式，包括单机模式（Standalone）、伪集群模式（PseudoCluster）、集群模式（Cluste
基于PHP音乐交流论坛的设计与实现(含源文件) 设计源码分享 java
欢迎添加微信互相交流学习哦！项目源码：https://gitee.com/oklongmm/biye摘要本系统采用PHP语言，在Windows平台上设计实现一个网络论坛，实现了论坛的的基本功能：账户申请、登陆、帖子分类管理、查看、发帖、回帖、送花、加好友、发短信；用户界面亲切友善，便于使用；后台管理简单。本系统之所以坚持PHP与MySQL数据组合，因为在众多的数据库中，MySQL数据库有着特殊的魅
Python 爬虫入门（九）：Scrapy安装及使用「详细介绍」 blues_C Python爬虫实战 python 爬虫 scrapy
Python爬虫入门（九）：Scrapy安装及使用「详细介绍」前言1.Scrapy简介2.Scrapy的安装2.1环境准备2.2安装Scrapy3.创建Scrapy项目3.1创建项目3.2项目结构简介4.编写爬虫4.1创建爬虫4.2解析数据4.3运行爬虫5.存储数据5.1存储为JSON文件5.2存储到数据库5.2.1MongoDB6.处理请求和响应6.1请求头设置6.2处理响应7.高级功能7.1使
Redis+Caffeine双层缓存策略对比与实践指南浅沫云归后端技术栈小结 Redis Caffeine 缓存
Redis+Caffeine双层缓存策略对比与实践指南在高并发场景下，缓存是提升系统性能和并发处理能力的关键手段。常见的缓存方案包括远程缓存（如Redis）和本地缓存（如Caffeine）。单层缓存各有优劣，结合两者优势的双层缓存架构已成为生产环境中的最佳实践。本文将基于SpringBoot，从方案对比分析出发，深入探讨Redis、本地Caffeine与双层缓存的实现与性能差异，并给出选型建议与实
【centos8服务如何给服务器开发3306端口】岁月玲珑 linux 服务器运维
在CentOS8中开放MySQL默认端口3306，需要配置防火墙和SELinux。以下是详细步骤：1.开放防火墙端口（Firewalld）CentOS8默认使用firewalld管理防火墙，执行以下命令开放3306端口：#开放TCP3306端口sudofirewall-cmd--permanent--add-port=3306/tcp#重载防火墙规则使其生效sudofirewall-cmd--re
加载properties文件username取不到值 bigStone. 问题总结 properties username properties配置文件
今天把Git上的项目（SSH整合）换台电脑Pull下来。竟然启动不了。在自己本上可以跑，换台电脑就不行了？各种报错，反正就是启动不来。错误信息不做展示了，三个小时后定位到错误位置为applicationContext.xml中加载外部jdbc.properties文件出错。jdbc.properties文件：jdbcUrl=jdbc:mysql://localhost:3306/hello
《ARM64 迁移深度实战：在飞腾 D2000+ 麒麟 V10 构建高可用全栈环境》 2301_82150492 python c++c语言 c#
从源码编译优化到容器跨架构迁移|附自研文档转换工具开发全记录目录（带锚点）环境深度适配：飞腾芯片+KylinOS安全内核特性基础组件迁移（源码级优化）2.1JDK17GraalVMARM编译指南（性能提升40%）2.2MySQL8.0深度适配（解决麒麟安全模块冲突）2.3Redis7.0内存池优化（ARMNUMA架构调优）容器化迁移企业级实践3.1Docker离线安装+麒麟内核模块编译3.2构建多
《ARM64 架构迁移实战：在银河麒麟系统部署全栈环境及容器化应用》副标题：从 MySQL 到 Docker+Nginx 的完整迁移适配指南 2301_82150492 架构 mysql docker
文章目录(带锚点跳转)环境准备：ARM64+KylinOS特性解析基础组件迁移安装2.1JDK（ARM优化版）2.2MySQL8.0（解决依赖冲突）2.3Redis6（源码编译优化）容器化迁移：Docker部署与镜像适配3.1Docker离线安装（适配麒麟内核）3.2拉取ARM版Nginx镜像3.3容器生命周期管理（启动/监控/删除）数据迁移实战：MySQL到Redis同步策略开发工具迁移：文档转
MySQL 8.0 权限审计实战：揪出那些“权力过大”的用户运维开发王义杰系统运维 mysql mysql android 数据库
在日常的运维和开发工作中，数据库的安全性是我们绝对不能忽视的一环。随着攻击手段的日益多样化，仅仅设置一个复杂的密码是远远不够的。我们需要定期对数据库的权限进行审计和加固，遵循“最小权限原则”（PrincipleofLeastPrivilege），确保每个用户只拥有其完成工作所必需的最小权限。在MySQL8.0中，权限管理变得更加精细。今天，我将带大家通过几个简单的SQL查询，快速锁定两类高风险用户
在 Redis 分布式锁场景中，锁超时但业务逻辑未完成解决方案程序媛青青 redis 分布式数据库
在Redis分布式锁场景中，锁超时但业务逻辑未完成是一个典型问题，通常称为锁过期与业务执行时间不匹配。以下是几种解决方案：方案一：自续期（看门狗机制）在获取锁的同时启动一个后台线程，定期检查业务是否仍在执行，若未执行完则自动延长锁的过期时间。示例代码（使用Redisson框架）：importorg.redisson.Redisson;importorg.redisson.api.RLock;imp
大数据 ETL 工具 Sqoop 深度解析与实战指南
一、Sqoop核心理论与应用场景1.1设计思想与技术定位Sqoop是Apache旗下的开源数据传输工具，核心设计基于MapReduce分布式计算框架，通过并行化的Map任务实现高效的数据批量迁移。其特点包括：批处理特性：基于MapReduce作业实现导入/导出，适合大规模离线数据迁移，不支持实时数据同步。异构数据源连接：支持关系型数据库（如MySQL、Oracle）与Hadoop生态（HDFS、H
python中操作数据库 seiseilalei python 数据库 python sql
python中cursor操作数据库（转）原文出处：http://doudouclever.blog.163.com/blog/static/175112310201284115340663/python操作数据库，要安装一个Python和数据库交互的包MySQL-python-1.2.2.win32-py2.5.exe，然后我们就可以使用MySQLdb这个包进行数据库操作了。操作步骤如下：1、建
2025年Java后端岗互联网大厂技术场景题的总结（附100w字面试题）小凡敲代码 java java后端 java面试 Java面试题互联网大厂求职 Java场景题
一、高并发与分布式系统设计1.百万级QPS秒杀系统问题：如何设计支持瞬时高并发的秒杀系统？解决方案：Redis预减库存：使用Lua脚本保证原子性操作，防止超卖。异步下单：通过MQ（如Kafka/RocketMQ）削峰，降低数据库压力。限流降级：Sentinel/Nginx限流，防止恶意请求。热点数据隔离：独立Redis集群存储秒杀商品数据。2.分布式事务一致性问题：跨服务下单如何保证数据一致性？方
docker映射了端口，宿主机不生效
1、问题产生原因dockerrun-d--namemy-redis-p6379:6379-v/usr/redis.conf:/usr/local/etc/redis/redis.confteam-redis:3.2redis-server/usr/local/etc/redis/redis.conf这容器跑起来了，端口6379没用。搞的我一直怀疑哪里出错了，查看配置文件啊，命令啊。2、发现问题源d
协同过滤算法：挖掘用户偏好，精准推荐商品 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
1.背景介绍协同过滤（CollaborativeFiltering，CF）作为推荐系统中的重要技术，其核心思想是利用用户和物品间的行为数据，挖掘用户隐性偏好，从而实现精准推荐。自20世纪90年代提出以来，协同过滤算法已经在电子商务、社交媒体、音乐视频等多个领域中广泛应用，取得了显著的推荐效果。协同过滤算法主要分为基于用户的协同过滤和基于物品的协同过滤两种。基于用户的协同过滤通过比较用户间的相似性，
mysql 内积_Python如何计算两行数据内积
Python计算两行数据内积的方法：首先使用【mat()】方法；然后将每组数据分别放到方法里转换为矩阵；再使两矩阵相乘；最后进行转换即可。>>>a=mat([[1],[2],[3]]);>>>b=mat([[0],[2],[3]]);>>>amatrix([[1],[2],[3]])>>>bmatrix([[0],[2],[3]])>>>a.T*bmatrix([[13]])上面为两个列向量的内积
MySQL · 特性分析 ·MySQL 5.7新特性系列挑战者666888 mysql mysql adb 后端
文章目录1.背景2.我们先大致看下InnoDB的undo在不同的版本上的一些演进:3.MySQL5.7的版本上3.1接下来我们详细看下5.7的InnoDBundo的管理：3.1.1undo表空间创建3.1.2rollbacksegment的分配如下：3.1.3InnoDBundo的空间管理简图如下：undo空间管理1.rsegslot2.rsegheader3.undosegmentheaderu
25年最新Java后端社招场景项目题总结！（附100w字面试题）小凡敲代码 java java面试 Java面试题 Java场景题程序员互联网大厂计算机
一、高并发与分布式系统设计百万级QPS秒杀系统核心问题：如何解决超卖、库存一致性、高并发请求？技术方案：Redis预减库存+异步扣减（Kafka/RocketMQ）分布式锁（Redisson）或乐观锁（CAS）限流策略（Nginx/Sentinel）扩展：热点数据隔离（独立Redis集群）、风控防刷（IP限流、验证码）。分布式文件存储系统（类似GFS）需求：支持海量文件存储、高可用、快速检索。关键
【MySQL基础】MVCC多版本并发控制 scj1022 MySQL mysql
文章目录MVCC-多版本并发控制一、MVCC概述1、三种并发场景2、当前读&快照读3、MVCC的作用4、结合MVCC处理并发问题二、MVCC实现原理1、隐式字段2、回滚日志UndoLog3、一致性视图ReadView1）什么时候生成？2）可见性判断3）可见性算法（属性）4）可见性算法（实现）5）可见性算法（小结）4、举例说明（版本链）三、MVCC与可重复读RR1、事务的启动时机2、事务A读取流程3
深入剖析MYSQL MVCC多版本并发控制+ReadView视图快照规避幻读问题 LiRuiJie MySQL mysql 数据库
一、剖析MVCC底层如何实现1.MVCC的目标在高并发场景下，MVCC实现：能力描述读写并发读不会阻塞写，写也不会阻塞读（大多数SELECT是非阻塞的）一致性视图每个事务看到的数据是其开始时的一致状态高性能避免频繁加锁，减少锁竞争开销2.InnoDB如何实现MVCCInnoDB使用以下两部分实现MVCC：UndoLog（撤销日志）：用于保存数据变更前的旧版本ReadView（读视图）：用于判断当前
MySQL EXPLAIN 关键字详解烟沙九洲数据库 mysql 数据库
EXPLAIN是用于分析SQL查询的执行计划。它能揭示MySQL如何执行查询（如是否使用索引、表连接顺序等），帮助我们定位性能瓶颈。基本用法EXPLAINSELECT*FROMusersWHEREage>25;输出列列名说明关键值示例id查询标识符（相同id表示同组查询，执行顺序从上到下；不同id值越大优先级越高）1（主查询）、2（子查询）select_type查询类型SIMPLE（无子查询）、P
Linux Docker 防火墙设置放通 MySQL(3306) Redis(6379) 端口
LinuxDocker防火墙设置放通MySQL(3306)Redis(6379)端口，使用firewalld防火墙或iptables，因此尝试重新启动firewalld服务，添加防火墙规则，并检查防火墙状态。以下是详细步骤：1.启动firewalld服务首先启动firewalld服务：sudosystemctlstartfirewalldsudosystemctlenablefirewalld2.
MySQL索引失效场景烟沙九洲数据库 mysql 数据库
MySQL索引优化是提升查询性能的关键手段之一，但有时使用不当会导致索引失效。今天我们一起来看看哪些情况下索引会失效。1、联合索引没有使用最左前缀失效示例：联合索引(a,b,c)SELECT*FROMtableWHEREb=1ANDc=2;--❌索引失效正确写法：WHEREa=?--✅WHEREa=?ANDb=?--✅WHEREa=?ANDb=?ANDc=?--✅--ps：MySQL对=条件的列，
如何在Ubuntu上检查MySQL是否启动并放开3306端口好奇的菜鸟服务器数据库 ubuntu mysql adb
在使用Ubuntu系统时，MySQL数据库是许多开发人员和系统管理员的常用工具。本文将详细介绍如何在Ubuntu上检查MySQL是否启动，以及如何放开MySQL默认的3306端口，以便允许外部访问。一、检查MySQL是否启动在进行任何操作之前，首先需要确认MySQL服务是否已经启动。以下是几种检查MySQL是否启动的方法：1.使用systemctl命令systemctl是Linux系统中用于管理服
分布式领域后端服务的限流算法实现大厂资深架构师 Spring Boot 开发实战分布式算法 wpf ai
分布式领域后端服务的限流算法实现关键词：分布式系统、限流算法、令牌桶、漏桶、滑动窗口、Redis、高并发摘要：本文深入探讨分布式系统中后端服务的限流算法实现。我们将从基础概念出发，详细分析各种限流算法的原理和适用场景，包括计数器算法、滑动窗口算法、令牌桶算法和漏桶算法。文章将提供Python实现代码和数学建模，并通过实际案例展示如何在分布式环境中使用Redis实现高效的限流机制。最后，我们将讨论限
大数据分析技术的学习路径，不是绝对的，仅供参考水云桐程序员学习大数据数据分析学习方法
阶段一：基础筑基（1-3个月）1.编程语言：Python：掌握基础语法、数据结构、流程控制、函数、面向对象编程、常用库（NumPy,Pandas）。SQL：精通SELECT语句（过滤、排序、分组、聚合、连接）、DDL/DML基础。理解关系型数据库概念（表、主键、外键、索引）。MySQL或PostgreSQL是很好的起点。Java/Scala：深入理解Hadoop/Spark等框架会更有优势。初学者
50个Java+SpringBoot+Vue毕业设计选题（含技术栈+核心功能） 21光年 java spring boot vue.js 毕业设计毕设
适合人群：计算机专业毕业设计/实战项目/求职作品技术亮点：前后端分离、主流技术栈、多领域覆盖一、电商与交易类智能推荐电商平台技术栈：SpringBoot+Vue+Redis+Elasticsearch核心功能：协同过滤推荐算法、秒杀系统、物流跟踪二手商品交易平台技术栈：SpringBoot+Vue+OSS存储核心功能：多维度检索、信用评分、实名认证社区团购管理系统技术栈：SpringBoot+Vu
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他