前言:
之前学习了用python爬虫的基本知识,现在计划用爬虫去做一些实际的数据统计功能。由于前段时间演员的诞生带火了几个年轻的实力派演员,想用爬虫程序搜索某论坛中对于某些演员的讨论热度,并按照日期统计每天的讨论量。
这个项目总共分为两步:
1.获取所有帖子的链接:
将最近一个月内的帖子链接保存到数组中
2.从回帖中搜索演员名字:
从数组中打开链接,翻出该链接的所有回帖,在回帖中查找演员的名字
获取所有帖子的链接:
搜索的范围依然是以虎扑影视区为界限。虎扑影视区一天约5000个回帖,一月下来超过15万回帖,作为样本来说也不算小,有一定的参考价值。
完成这一步骤,主要分为以下几步:
1.获取当前日期
2.获取30天前的日期
3.记录从第一页往后翻的所有发帖链接
1.获取当前日期
这里我们用到了datetime模块。使用datetime.datetime.now(),可以获取当前的日期信息以及时间信息。在这个项目中,只需要用到日期信息就好。
2.获取30天前的日期
用datetime模块的优点在于,它还有一个很好用的函数叫做timedelta,可以自行计算时间差。当给定参数days=30时,就会生成30天的时间差,再用当前日期减去delta,可以得到30天前的日期,将该日期保存为startday,即开始进行统计的日期。不然计算时间差需要自行考虑跨年闰年等因素,要通过一个较为复杂的函数才可以完成。
today = datetime.datetime.now() delta = datetime.timedelta(days=30) i = "%s" %(today - delta) startday = i.split(' ')[0] today = "%s" %today today = today.split(' ')[0]
在获得开始日期与结束日期后,由于依然需要记录每一天每个人的讨论数,根据这两个日期生成两个字典,分别为actor1_dict与actor2_dict。字典以日期为key,以当日讨论数目作为value,便于每次新增查找记录时更新对应的value值。
strptime, strftime = datetime.datetime.strptime, datetime.datetime.strftime days = (strptime(today, "%Y-%m-%d") - strptime(startday, "%Y-%m-%d")).days for i in range(days+1): temp = strftime(strptime(startday, "%Y-%m-%d") + datetime.timedelta(i), "%Y-%m-%d") actor1_dict[temp] = 0 actor2_dict[temp] = 0
3.记录从第一页往后翻的所有发帖链接
如图1所示,采用发帖顺序排列,可以得到所有的发帖时间(精确到分钟)。右键并点击查看网页源代码,可以发现当前帖子的链接页面,用正则表达式的方式抓取链接。
首先依然是获取30天前的日期,再抓取第i页的源代码,用正则表达式去匹配,获取网页链接和发帖时间。如图2所示:
比较发帖时间,如果小于30天前的日期,则获取发帖链接结束,返回当前拿到的链接数组,代码如下
def all_movie_post(ori_url):
i = datetime.datetime.now()
delta = datetime.timedelta(days=30)
i = "%s" %(i - delta)
day = i.split(' ')[0] # 获得30天前的日子
print day
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers = { 'User-Agent' : user_agent }
post_list = []
for i in range(1,100):
request = urllib2.Request(ori_url + '-{}'.format(i),headers = headers)
response = urllib2.urlopen(request)
content = response.read().decode('utf-8')
pattern = re.compile('.*? (.*?) ', re.S)
items = re.findall(pattern,content)
for item in items:
if item[1] == '2011-09-16':
continue
if item[1] > day: #如果是30天内的帖子,保存
post_list.append('https://bbs.hupu.com' + item[0])
else: #如果已经超过30天了,就直接返回
return post_list
return post_list
函数的传参是链接首页,在函数中修改页码,并继续搜索。
从回帖中搜索演员名字:
接下来的步骤也是通过一个函数来解决。函数的传参包括上一步中得到的链接数组,已经想要查询的演员名字(这个功能可以进一步扩展,将演员名字也用列表的形式传输,同时上一步生成的字典也可以多一些)。
由于虎扑论坛会将一些得到认可的回帖摆在前端,即重复出现。如图3所示:
为了避免重复统计,将这些重复先去除,代码如下:
if i == 0:
index = content.find('更多亮了的回帖')
if index >= 0:
content = content[index:]
else:
index = content.find('我要推荐')
content = content[index:]
去除的规则其实并不重要,因为每个论坛都有自己的格式,只要能搞清楚源代码中是怎么写的,剩下的操作就可以自己根据规则进行。
每个回帖格式大致如图4,
用对应的正则表达式再去匹配,找到每个帖子每一个回帖的内容,在内容中搜索演员名字,即一开始的actor_1与actor_2,如果搜到,则在对应回帖日期下+1。
最终将两位演员名字出现频率返回,按日期记录的字典由于是全局变量,不需要返回。
web_str = '(.*?) .*? .*?[\s]*[\s]*(.*?) ' #找到回帖内容的正则
pattern = re.compile(web_str, re.S)
items = re.findall(pattern,content)
for item in items:
#if '引用' in item: #如果引用别人的回帖,则去除引用部分
#try:
#item = item.split('')[1]
#except:
#print item
#print item.decode('utf-8')
if actor_1 in item[1]:
actor1_dict[item[0]] += 1
actor_1_freq += 1
if actor_2 in item[1]:
actor2_dict[item[0]] += 1
actor_2_freq += 1
至此,我们就利用爬虫知识,成功完成对论坛关键字的频率搜索了。
这只是一个例子,关键字可以任意,这也不只是一个针对演员的诞生而写的程序。将演员名字换成其他词,就可以做到类似“您的年度关键字”这样的结果,根据频率大小来显示文字大小。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。
你可能感兴趣的:(Python爬虫抓取论坛关键字过程解析)
Mysql回表查询:深入解析与实战应用
需要重新演唱
mysql mysql 数据库
Mysql回表查询:深入解析与实战应用今天,我们将深入探讨Mysql中的回表查询。回表查询是Mysql索引机制中的一个重要概念,理解它的工作原理和优化方法,对于提升数据库查询性能至关重要。让我们一起揭开回表查询的神秘面纱。1.什么是回表查询?回表查询(LookupQuery)是指在使用非聚集索引(Non-ClusteredIndex)进行查询时,如果需要获取的数据不在索引页中,就需要根据索引页中的
基于UC3845B的72V转12V DC-DC电源模块设计资料包
本文还有配套的精品资源,点击获取简介:本资料包详细介绍了使用UC3845B芯片实现从72V到12V的DC-DC电源转换的设计过程,涵盖了电源转换技术、UC3845B芯片的应用、电路设计原则,并提供了Altiu1.UC3845B芯片应用概述1.1UC3845B芯片简介UC3845B是一款经典的脉宽调制(PWM)控制器,广泛应用于开关电源的设计中,特别是在反激式和正激式转换器中。它集成了多种保护功能,
用 C++ 获取显示器信息:深入 WMI 与 COM 接口
在Windows系统中,获取显示器信息(如制造商、序列号和产品代码)是一项常见任务。本文将展示如何使用C++通过WindowsManagementInstrumentation(WMI)和ComponentObjectModel(COM)接口实现这一功能。我们将以WmiMonitorID类为例,逐步构建一个健壮的程序,并分享实现过程中的关键注意事项。背景显示器信息通常存储在硬件的EDID(Exte
Python可视化环境:Matplotlib_Seaborn+Conda配置
Python编程之道
Python人工智能与大数据 Python编程之道 python matplotlib conda ai
Python可视化环境:Matplotlib/Seaborn+Conda配置关键词:Python可视化、Matplotlib、Seaborn、Conda、环境配置摘要:本文主要探讨了如何利用Conda来配置Python可视化所需的Matplotlib和Seaborn环境。首先介绍了Python可视化的背景和重要性,明确目标读者为想要学习Python可视化的初学者和有一定基础的开发者。接着详细解析了
pythonselenium时间选择_使用pythonselenium选择特定日期(滚动日期)
xu534328661
所有人我们正在尝试自动化日期选择过程以供参考Clickhere。请参考出生日期和预约日期字段。我们选择日期的方式是不同的。我不知道如何为这两个字段选择日期。你能帮帮我吗?在我已经尽了我的最大努力,它与下面的代码除了日期字段Python版本:2.7硒3.8.0铬:48倍importseleniumimportsysfromseleniumimportwebdriverfromselenium.web
小米YU7智能座舱的技术栈推演分析
Alex艾力的IT数字空间
微服务 知识图谱 图像处理 数据分析 聚类 AudioLM nlp
小米YU7的智能座舱以“人车家全生态”战略为核心,深度融合小米在消费电子领域的优势与汽车智能化需求,构建了从硬件到软件、从交互到生态的完整技术体系。技术栈解析如下:一、硬件架构:高性能芯片与多屏交互旗舰级芯片组合高通骁龙8Gen3座舱SoC:采用4nm工艺,支持1.35秒极速启动应用、15分钟整车OTA升级,提供流畅的车机交互体验。英伟达DRIVEAGXThor平台:算力达700TOPS,基于Bl
LRU缓存C++
monicaaaaan
乐扣刷题 缓存 c++ spring
请你设计并实现一个满足LRU(最近最少使用)缓存约束的数据结构。实现LRUCache类:LRUCache(intcapacity)以正整数作为容量capacity初始化LRU缓存intget(intkey)如果关键字key存在于缓存中,则返回关键字的值,否则返回-1。voidput(intkey,intvalue)如果关键字key已经存在,则变更其数据值value;如果不存在,则向缓存中插入该组k
【图像处理入门】12. 综合项目与进阶:超分辨率、医学分割与工业检测
小米玄戒Andrew
图像处理:从入门到专家 图像处理 人工智能 深度学习 算法 python 计算机视觉 CV
摘要本周将聚焦三个高价值的综合项目,打通传统算法与深度学习的技术壁垒。通过图像超分辨率重建对比传统方法与深度学习方案,掌握医学图像分割的U-Net实现,设计工业缺陷检测的完整流水线。每个项目均包含原理解析、代码实现与性能优化,帮助读者从“技术应用”迈向“系统设计”。一、项目1:图像超分辨率重建(从模糊到清晰的跨越)1.技术背景与核心指标超分辨率(SR)是通过算法将低分辨率(LR)图像恢复为高分辨率
22. 括号生成
题目:数字n代表生成括号的对数,请你设计一个函数,用于能够生成所有可能的并且有效的括号组合。解题思路:我觉得本质上来说,就是从数组中[‘(’,‘)’]可重复地选择元素,生成一个长度为2n的括号组合。为了使这个括号组合是有效的,那么在选择的过程中就有一些约束:1、左括号的数量不能超过n。2、左括号的数量不能小于有括号的数量。3、当左括号和有括号的数量都等于n时,就是收获结果的时候。4、因为我们的pa
MySQL 连接指定端口后,为什么实际仍是 3306?
XMYX-0
mysql 数据库
文章目录MySQL连接指定端口后,为什么实际仍是3306?问题现象复现原因分析没有指定-h,默认走的是本地UnixSocket多实例环境中未显式指定目标地址正确的连接方法方法一:添加-h127.0.0.1方法二:添加--protocol=TCP验证是否连接成功附加说明总结✅建议MySQL连接指定端口后,为什么实际仍是3306?在日常运维或开发过程中,有时我们在使用mysql命令行工具连接MySQL
Linux内核启动:深入理解Initramfs与Initrd机制
CClaris
linux 服务器 嵌入式 嵌入式操作系统 操作系统
在Linux系统启动过程中,内核需要访问根文件系统来继续启动过程。然而,根文件系统可能位于内核无法直接访问的存储设备上,这就产生了一个"鸡生蛋,蛋生鸡"的问题:内核需要驱动程序来访问存储设备,而驱动程序又存储在这些设备上。为了解决这个问题,Linux引入了initrd和initramfs机制。本文将深入探讨这两种机制的工作原理、区别以及实际应用。问题的由来早期Linux系统的局限性在Linux系统
Python机器学习元学习库higher
音程
机器学习 人工智能 python 机器学习
higher是一个用于元学习(Meta-Learning)和高阶导数(Higher-ordergradients)的Python库,专为PyTorch设计。它扩展了PyTorch的自动微分机制,使得在训练过程中可以动态地计算参数的梯度更新,并把这些更新过程纳入到更高阶的梯度计算中。一、主要用途higher主要用于以下场景:元学习(Meta-Learning)比如MAML(Model-Agnosti
钉钉小程序摸索二:钉钉小程序开发过程中错误解决过程
钉钉小程序开过程中作为小白,很容易遇上各种问题,今天我就以自己开发过程的遇到的问题总结下解决过程或者思路,有小白的同学可以做下参考,发布文章不易,请点赞一下鼓励下,谢谢。目录:TypeError:my.requestisnotafunctionatObject.onSubmit1、钉钉开发过程中接口请求返回TypeError:my.requestisnotafunctionatObject.onS
Nagios监控系统插件套装:1.4.13版本深入解析
Kiki-2189
本文还有配套的精品资源,点击获取简介:Nagios是一款开源系统监控工具,用于实时监控网络服务、系统状态和IT基础设施,确保IT环境的稳定运行。本文详细解析了"Nagios-plugins-1.4.13.tar.gz"这个插件包,涵盖了Nagios核心功能、插件工作原理、安装配置、常见插件、自定义插件制作、故障报警与通知、性能数据记录以及扩展集成等方面。通过解压、编译安装和配置插件包中的内容,用户
Python 常用正则表达式大全
朱公子的Note
python 爬虫 正则表达式
你是否在写Python爬虫时,总是卡在“正则提取”这一步?明明页面源码已经拿到,却怎么也匹配不到目标数据……不是提取失败,就是提取不全,搞得调试半天还抓不到核心字段?别急!今天我们就来一次**“正则一网打尽”**,专为爬虫而生的表达式宝典,让你写起爬虫来如虎添翼!在当下数据驱动时代,网络数据是企业的“金矿”,而Python爬虫则是挖掘这金矿的“利器”!从电商价格到社交媒体评论,爬虫技术让数据采集变
《高并发系统性能优化三板斧:缓存 + 异步 + 限流》
猕员桃
10篇关于分布式和高并发 性能优化 缓存
高并发系统性能优化三板斧:缓存+异步+限流引言在互联网应用的高并发场景下,系统性能面临巨大挑战。以某电商平台会员活动为例,活动期间瞬时QPS可达10万+,若未进行有效优化,服务器将迅速崩溃。本文从缓存、异步、限流三个核心维度,结合实际案例详细解析高并发系统的性能优化策略,并分享全链路压测与问题定位的实战经验。一、缓存策略分层:从本地到分布式的立体防护1.1本地缓存选型与实战(Caffeine)本地
《去哪儿网Redis高并发实战:从问题定位到架构升级》
猕员桃
redis 架构 数据库
去哪儿网Redis高并发实战:从问题定位到架构升级在互联网行业竞争日益激烈的当下,高并发场景下的系统性能优化一直是技术团队面临的重要挑战。对于去哪儿网这类在线旅游平台来说,节假日期间的流量高峰更是对系统架构的严峻考验。本文将深入剖析去哪儿网在五一假期期间,针对Redis高并发问题的实战解决方案,从问题定位、优化策略到架构升级,全方位展现整个优化过程。一、案例背景:五一假期流量峰值挑战1.1业务场景
钉钉小程序开发中实现路由守卫拦截
脑袋大大的
钉钉生态创业者专栏 钉钉 小程序 科技 uniapp
上一篇文章描述了博主认为靠谱一点的技术选型文章地址:钉钉小程序开发的技术选型-CSDN博客本文将深入探讨如何在基于这些技术栈的小程序项目中实施路由守卫拦截。路由守卫的基本概念路由守卫主要分为全局前置守卫(beforeEach)、全局解析守卫(beforeResolve)、全局后置钩子(afterEach)、路由独享守卫以及组件内守卫等几种类型。它们分别用于不同的场景下对路由跳转进行控制或处理。其中
算法训练营|数组总结
慧泽huize
数据结构 算法 leetcode python c++
时间复杂度:算法执行语句的次数空间复杂度:算法在运行过程中临时占存储空间大小数组(C++):存放在连续内存空间的相同类型固定大小的数据的集合,不能删除,只能覆盖列表(Python):数据可以是不同类型,列表长度可变1.二分查找循环不变量原则,清楚区间定义时间复杂度:O(logn)空间复杂度:O(1)2.双指针法快指针找到新数组元素,慢指针指向新数组下标时间复杂度:O(n)空间复杂度:O(1)3.双
docker-compose配置文件解析
疯狂吧小飞牛
docker 容器 运维
原文地址:docker-compose配置文件解析–无敌牛欢迎参观我的个人博客:无敌牛–技术/著作/典籍/分享等我们在把服务docker化的时候,不仅需要把各个服务做成docker镜像,还需要编辑各个服务之间的启动方式。对于不需要暴露的端口,还需要通过虚拟网桥的方式,保证各个服务之间的正常通讯。这就需要用到docker-compose工具,并且需要编辑对应的DockerCompose配置文件来控制
校园志愿者系统前端代码实现及技术解析
创新工场
本文还有配套的精品资源,点击获取简介:本项目集中展示了Web开发中的关键技术和框架,包含PHP、Vue.js、ElementUI和Laravel在校园志愿者系统前台构建中的应用。首先,PHP用于后端开发,处理业务逻辑并与数据库交互。接着,Vue.js作为前端框架,实现交云动界面和用户交互。ElementUI提供企业级UI组件,加速开发流程,提高界面美观度。Laravel框架则用于搭建后端架构,处理
前后端分离与不分离解析,很全面!
涔溪
前端
从多个维度对前后端分离与不分离进行更加深入、系统的分析,包括技术架构、开发流程、部署维护、性能优化、团队协作、适用场景等方面全面理解两者的区别和优劣。一、概念定义1.前后端不分离(传统服务端渲染)前端页面由服务器端生成并返回给浏览器,如PHP、JSP、ASP.NET等。前端逻辑和后端业务耦合在一起,通常一个请求对应一个完整的HTML页面。2.前后端分离(现代Web开发模式)前端独立开发为一个完整的
如何搭建分公司到总部的专线网络?(SD-WAN双链路冗余+加密隧道配置全流程)
北极光SD-WAN组网
网络
#如何搭建分公司到总部的专线网络?(以北京→上海为例)在现代企业的网络架构中,分支机构与总部之间的高效、安全、稳定的网络通信是至关重要的。构建一条可靠的专线网络不仅能保障业务数据的高效传输,还能提升整体运营效率。本文将以北京到上海的分公司到总部为例,详细解析搭建专线网络的四步流程:**选服务商**→**部署SD-WAN设备**→**配置加密隧道**→**设置业务优先级策略**。##一、选服务商:选
跨区域组网如何支撑多监控点高效运营?—智能SD-WAN技术解析
北极光SD-WAN组网
网络
在连锁门店、工业园区、物流仓储等场景中,跨区域部署监控系统已成为企业数字化转型的重要组成部分。要实现总部实时查看各地监控画面、保障数据传输的稳定性和安全性,并同时满足成本和扩展需求,传统的组网方式正逐渐显现其局限性。本文将从技术角度出发,深入解析跨区域组网的常见痛点,并探讨如何通过智能SD-WAN技术实现高效的多监控点管理,助力企业构建灵活可靠的监控网络。一、多监控点组网的核心痛点与解决思路随着企
SD-WAN在智能仓储与物流管理中的应用解析:赋能制造业数字化转型
随着工业4.0与供应链数字化的推进,制造业在仓储与物流管理方面面临着前所未有的挑战和机遇。为实现仓储系统与生产系统、供应链系统的高度联动,网络的可靠性、灵活性和实时性成为关键问题。SD-WAN(软件定义广域网)技术凭借其高效、智能的网络管理能力,为智能仓储与物流管理提供了全新解决方案。在制造业中,仓储与物流管理是连接生产系统与供应链系统的重要环节,其高效运作直接影响到企业的生产效率和市场竞争力。随
SD-WAN 是否支持固定 IP?深度解析企业网络架构中的关键问题
北极光SD-WAN组网
网络 tcp/ip 架构
近年来,随着企业数字化转型的深化,SD-WAN(软件定义广域网)因其灵活性、高效性和成本优化而备受关注。许多企业在部署SD-WAN时,会产生这样一个疑问:**SD-WAN是否提供固定IP?能否满足对固定IP的需求?**本文将从技术原理、应用场景和具体实现等角度深入探讨这个问题,帮助企业在网络架构设计中做出明智选择。##一、SD-WAN的技术背景与架构SD-WAN是一种基于软件定义网络(SDN)技术
探秘阿里云Tair KVCache:大模型推理的加速引擎
云资源服务商
阿里云 云计算 人工智能
一、引言近年来,人工智能领域发展迅猛,大语言模型(LLM)不断取得突破,其应用场景也日益广泛。从智能客服到内容生成,从智能写作到智能翻译,大语言模型正在深刻地改变着我们的生活和工作方式。随着模型规模的不断扩大和推理需求的日益增长,大模型推理过程中的显存瓶颈问题逐渐凸显,成为制约其发展和应用的关键因素。在大模型推理中,KVCache技术作为一种优化手段,通过缓存历史Token的Key/Value向量
中断与其他函数共享变量、临界资源的保护
匠在江湖
C语言知识点 单片机 嵌入式硬件
volatilevolatile概念作用volatile(英译:易变的)是一个特征修饰符关键字,防止编译器对修饰的变量相关代码进行优化,每次使用都重新读取变量的值,而不是使用寄存器里的备份。volatile字面意思不太好理解,其实它是提醒编译器这个变量是易变的,不要去优化它!XBYTE[2]=0x55;XBYTE[2]=0x56;XBYTE[2]=0x57;XBYTE[2]=0x58;对外部硬件而
单片机中断
细水长流煮红豆{
单片机
1、中断是什么中断指的是在设备运行过程中,当某个事件或条件发生时,处理器能够暂停当前正在执行的程序,转而执行一段特定的代码(称为中断服务程序或中断处理程序),以响应这个事件或条件。中断处理完成后,处理器将返回到被中断的程序中继续执行。中断的主要目的是提高系统的响应能力和处理效率。通过中断机制,嵌入式系统可以实时地响应外部设备或内部状态的变化,而无需轮询或等待这些变化的发生。这使得嵌入式系统能够更加
OKHttp框架
一个快乐的小测试
自动化测试 okhttp android java 自动化
一、OKHttp简介初识OKHttpOkHttp是一个处理网络请求的开源项目,是Android端一个较新的轻量级网络框架,支持HTTP/HTTPS协议、请求头设置、响应解析等功能,并且支持异步调用,因此在接口测试中也是一种非常优秀的选择。OkHttp是一个高效的HTTP客户端,其特性包括:支持HTTP/2,并且允许同一个主机地址的所有请求共享同一个socket连接,这样能减少服务器的请求次数通过连
Java实现的基于模板的网页结构化信息精准抽取组件:HtmlExtractor
yangshangchuan
信息抽取 HtmlExtractor 精准抽取 信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件,本身并不包含爬虫功能,但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。
HtmlExtractor是为大规模分布式环境设计的,采用主从架构,主节点负责维护抽取规则,从节点向主节点请求抽取规则,当抽取规则发生变化,主节点主动通知从节点,从而能实现抽取规则变化之后的实时动态生效。
如
java编程思想 -- 多态
百合不是茶
java 多态详解
一: 向上转型和向下转型
面向对象中的转型只会发生在有继承关系的子类和父类中(接口的实现也包括在这里)。父类:人 子类:男人向上转型: Person p = new Man() ; //向上转型不需要强制类型转化向下转型: Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系
comsci
dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长....
首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义 日志文件
商人shang
storm cluster logback
Storm中的日志级级别默认为INFO,并且,日志文件是根据worker号来进行区分的,这样,同一个log文件中的信息不一定是一个业务的,这样就会有以下两个需求出现:
1. 想要进行一些调试信息的输出
2. 调试信息或者业务日志信息想要输出到一些固定的文件中
不要怕,不要烦恼,其实Storm已经提供了这样的支持,可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录
21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo
传递json对象数据,往往会出现http 415,400,500等错误,总结一下需要使用ajax提交json数据才行,ajax提交使用proxy,参数为jsonData,不能为params;另外,需要设置Content-type属性为json,代码如下:
(由于使用了父类aaa
一些排错方法
文强chu
方法
1、java.lang.IllegalStateException: Class invariant violation
at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228)
at o
Swing中文件恢复我觉得很难
小桔子
swing
我那个草了!老大怎么回事,怎么做项目评估的?只会说相信你可以做的,试一下,有的是时间!
用java开发一个图文处理工具,类似word,任意位置插入、拖动、删除图片以及文本等。文本框、流程图等,数据保存数据库,其余可保存pdf格式。ok,姐姐千辛万苦,
php 文件操作
aichenglong
PHP 读取文件 写入文件
1 写入文件
@$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab");
if(!$fp){
echo "open file error" ;
exit;
}
$outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别
AILIKES
数据结构 mysql 算法
Hash 索引结构的特殊性,其 检索效率非常高,索引的检索可以一次定位,不像B-Tree 索引需要从根节点到枝节点,最后才能访问到页节点这样多次的IO访问,所以 Hash 索引的查询效率要远高于 B-Tree 索引。
可能很多人又有疑问了,既然 Hash 索引的效率要比 B-Tree 高很多,为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现
百合不是茶
抽象 接口 实现接口
//抽象 类 ,方法
//定义一个公共抽象的类 ,并在类中定义一个抽象的方法体
抽象的定义使用abstract
abstract class A 定义一个抽象类 例如:
//定义一个基类
public abstract class A{
//抽象类不能用来实例化,只能用来继承
//
JS变量作用域实例
bijian1013
作用域
<script>
var scope='hello';
function a(){
console.log(scope); //undefined
var scope='world';
console.log(scope); //world
console.log(b);
TDD实践(二)
bijian1013
java TDD
实践题目:分解质因数
Step1:
单元测试:
package com.bijian.study.factor.test;
import java.util.Arrays;
import junit.framework.Assert;
import org.junit.Before;
import org.junit.Test;
import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制
bit1129
mongodb
MongoDB称为分布式数据库,主要原因是1.基于副本集的数据备份, 2.基于切片的数据扩容。副本集解决数据的读写性能问题,切片解决了MongoDB的数据扩容问题。
事实上,MongoDB提供了主从复制和副本复制两种备份方式,在MongoDB的主从复制和副本复制集群环境中,只有一台作为主服务器,另外一台或者多台服务器作为从服务器。 本文介绍MongoDB的主从复制模式,需要指明
【HBase五】Java API操作HBase
bit1129
hbase
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.ha
python调用zabbix api接口实时展示数据
ronin47
zabbix api接口来进行展示。经过思考之后,计划获取如下内容: 1、 获得认证密钥 2、 获取zabbix所有的主机组 3、 获取单个组下的所有主机 4、 获取某个主机下的所有监控项  
jsp取得绝对路径
byalias
绝对路径
在JavaWeb开发中,常使用绝对路径的方式来引入JavaScript和CSS文件,这样可以避免因为目录变动导致引入文件找不到的情况,常用的做法如下:
一、使用${pageContext.request.contextPath}
代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名,这样不管如何部署,所用路径都是正确的。
Java定时任务调度:用ExecutorService取代Timer
bylijinnan
java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由,我认为其中最重要的理由是:
如果TimerTask抛出未检查的异常,Timer将会产生无法预料的行为。Timer线程并不捕获异常,所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下,Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时,已经被
SQL 优化原则
chicony
sql
一、问题的提出
在应用系统开发初期,由于开发数据库数据比较少,对于查询SQL语句,复杂视图的的编写等体会不出SQL语句各种写法的性能优劣,但是如果将应用系统提交实际应用后,随着数据库中数据的增加,系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据,劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍,可见对于一个系统
java 线程弹球小游戏
CrazyMizzz
java 游戏
最近java学到线程,于是做了一个线程弹球的小游戏,不过还没完善
这里是提纲
1.线程弹球游戏实现
1.实现界面需要使用哪些API类
JFrame
JPanel
JButton
FlowLayout
Graphics2D
Thread
Color
ActionListener
ActionEvent
MouseListener
Mouse
hadoop jps出现process information unavailable提示解决办法
daizj
hadoop jps
hadoop jps出现process information unavailable提示解决办法
jps时出现如下信息:
3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现
dcj3sjt126com
PHP
<?php
class Image{
private $path;
function __construct($path='./'){
$this->path=rtrim($path,'/').'/';
}
//水印函数,参数:背景图,水印图,位置,前缀,TMD透明度
public function water($b,$l,$pos
IOS控件学习:UILabel常用属性与用法
dcj3sjt126com
ios UILabel
参考网站:
http://shijue.me/show_text/521c396a8ddf876566000007
http://www.tuicool.com/articles/zquENb
http://blog.csdn.net/a451493485/article/details/9454695
http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架
eksliang
java eclipse Web
建一个 JAVA 项目 :
mvn archetype:create
-DgroupId=com.demo
-DartifactId=App
[-Dversion=0.0.1-SNAPSHOT]
[-Dpackaging=jar]
建一个 web 项目 :
mvn archetype:create
-DgroupId=com.demo
-DartifactId=web-a
配置清单
gengzg
配置
1、修改grub启动的内核版本
vi /boot/grub/grub.conf
将default 0改为1
拷贝mt7601Usta.ko到/lib文件夹
拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹
拷贝wifiscan到bin文件夹,chmod 775 /bin/wifiscan
拷贝wifiget.sh到bin文件夹,chm
Windows端口被占用处理方法
huqiji
windows
以下文章主要以80端口号为例,如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器, 跨平台(html5, mobile),flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 !
天梯梦
mobile
CKplayer,其全称为超酷flv播放器,它是一款用于网页上播放视频的软件,支持的格式有:http协议上的flv,f4v,mp4格式,同时支持rtmp视频流格 式播放,此播放器的特点在于用户可以自己定义播放器的风格,诸如播放/暂停按钮,静音按钮,全屏按钮都是以外部图片接口形式调用,用户根据自己的需要制作 出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了,
简单工厂设计模式
hm4123660
java 工厂设计模式 简单工厂模式
简单工厂模式(Simple Factory Pattern)属于类的创新型模式,又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例,被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式,可以理解为是不同工厂模式的一个特殊实现。
maven笔记
zhb8015
maven
跳过测试阶段:
mvn package -DskipTests
临时性跳过测试代码的编译:
mvn package -Dmaven.test.skip=true
maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为,即跳过编译,又跳过测试。
指定测试类
mvn test
非mapreduce生成Hfile,然后导入hbase当中
Stark_Summer
map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase,让hbase的入库速度达到5w+/s,这可愁死了,4台个人电脑组成的集群,多线程入库调了好久,速度也才1w左右,都没有达到理想的那种速度,然后就想到了这种方式,但是网上多是用mapreduce来实现入库,而现在的需求是实时入库,不生成文件了,所以就只能自己用代码实现了,但是网上查了很多资料都没有查到,最后在一个网友的指引下,看了源码,最后找到了生成Hfile
jsp web tomcat 编码问题
王新春
tomcat jsp pageEncode
今天配置jsp项目在tomcat上,windows上正常,而linux上显示乱码,最后定位原因为tomcat 的server.xml 文件的配置,添加 URIEncoding 属性:
<Connector port="8080" protocol="HTTP/1.1"
connectionTi