chengliang69

python文章采集例子（爬取http://infoq.com）

写了个采集http://infoq.com资源的小程序，原理：从infoq.com上读取提供的RESS资源。然后根据资源中相关链接下载相应文章
RESS地址:http://www.infoq.com/cn/rss/rss.action?token=v4OEYqEXG7ltwOPp5IpH34Ky6WdtpXqz


   
- 
- 
  未注册用户的 InfoQ 个性化 RSS Feed - 请注册后升级！ 
  http://www.infoq.com/cn/ 
  本 RSS Feed 是一个个性化定制的 Feed，对于您在 InfoQ.com 上的帐号（无论注册与否）都是唯一的。您可以从 InfoQ 网站左侧栏中的“您的社区”选项框内选择感兴趣的社区，此外您还可以通过关闭子话题和标签的方式过滤掉您不感兴趣的内容。您所做的选择将影响到本 RSS Feed 显示的新闻——新闻内容将和您在网站首页中央的新闻栏看见的内容保持一致。如果您的 RSS Feed 没有反映出这样的相关性，那么可能是因为您使用的 Feed 链接没有与您的 InfoQ 帐号相关联。为了确保您所使用的 Feed 的正确性，请先在 InfoQ 上注册，然后从网站左侧菜单中的“个性化 RSS”链接获取新的 RSS Feed URL。祝您使用愉快！ 
- 
- 
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
  
  
  
- 
  PetaPoco：适用于.NET的微型ORM 
  http://www.infoq.com/cn/news/2011/06/petapoco 
  >PetaPoco是一款适用于.NET应用程序的对象关系映射器（ORM, Object Relational Mapper）。与那些功能完备的ORM（如NHibernate或Entity Framework）不同的是，PetaPoco更注重易用性和性能，而非丰富的功能。使用PetaPoco只需要引入一个C#文件，可以使用强类型的POCO，并支持
.........

得到一个RESS的标准XML文档，然后解析XML得相关文章信息，再进入解析，最后下载图片，保存文章信息到MYSQL数据库中

下面是代码：


#! /usr/bin/env python 
# -*- coding: utf-8 -*- 

import urllib
import re,sys
import string
from xml.dom.minidom import parseString
from sgmllib import SGMLParser  
import MySQLdb
reload(sys)
sys.setdefaultencoding('utf8')


class Constants():
    #站点
    HTML_SITE = "http://www.infoq.com";
    #聚体资源
    HTML_RESOURCE = HTML_SITE + "/cn/rss/rss.action?token=v4OEYqEXG7ltwOPp5IpH34Ky6WdtpXqz";  
    #数据库配置
    DB_HOST = "localhost"     
    #数据库用户名
    DB_USER = "root"
    #数据库密码
    DB_PASSWORD = "root"
    #数据库
    DB_DATABASE = "test"
    #数据库连接编码集
    CHARSET = "utf8"
    #代理服务器
    PROXY_ADRESS = ""
    #代理用户名
    PROXY_USERNAME = ""
    #代理用户密码
    PROXY_PASSWORD = ""
    #图片本地保存路径
    IMG_LOCALDSTDIR = "E:/image/"



class ListUrls(SGMLParser):  
    def reset(self):  
        self.imgs = []  
        SGMLParser.reset(self)  
    def start_img(self, attrs):  
        src = [v for k, v in attrs if k == 'src']  
        if src:  
            self.imgs.extend(src)
#数据库工具类
class DBUTIL():
    def  getConnectionDB(self):
        try:
            conn = MySQLdb.connect(host=Constants.DB_HOST, user=Constants.DB_USER, passwd=Constants.DB_PASSWORD, db=Constants.DB_DATABASE, charset=Constants.CHARSET)
            return conn
        except:
            print "EROOR: get ConnectionDB is FAIL"

#文章对象用于从网站中爬取然后存储在DB中
class  actrict():
    title = ''
    link = ''
    description = ''
    creator = ''
    createdate = ''
    identifier = ''
    content = ''

class webcrawlerhttpurl(): 
    #获取HTML内容   
    def getUrlInfo(self, weburl):
        try :
            #proxyConfig = 'http://%s:%s@%s' % (Constants.PROXY_USERNAME, Constants.PROXY_PASSWORD, Constants.PROXY_ADRESS)
            #inforMation = urllib.urlopen(weburl, proxies={'http':proxyConfig})
            inforMation = urllib.urlopen(weburl)
            #header = inforMation.info()            
            #contentType = header.getheader('Content-Type')           
            status = inforMation.getcode()           
            if status == 200:            
                html = inforMation.readlines()                        
                return html    
            else:
                return 'ERROR: get web %s% is fail and status=%s' % (weburl, status);
        except:
            print 'ERROR: get web %s% is fail' % (weburl);
        finally:
            inforMation.close()    

    #解析HTML
    def parseHtml(self, html, link):
        try:
            #body是一个list，需要转成string
            document = ""
            for line in html:
                if line.split():
                    document = document + line                
            #title
            title = document[re.search("title>", document).end():]   
            title = title[:re.search("title>", title).end() - 8]

            #content
            content = document[re.search("box-content-5", document).end():]
            content = content[:re.search("bottom-corners", content).end()]  
            content = document[re.search("", document).end():]  
            content = content[:re.search("


    
        你可能感兴趣的:(原创)
        
            
                
                    绘本讲师训练营【24期】8/21阅读原创《独生小孩》
                        1784e22615e0

                        24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
                    
                    【无标题】达瓦达瓦
                        JhonKI
考研
                        博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
                    
                    上图为是否色发
                        JhonKI
考研
                        博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
                    
                    143234234123432
                        JhonKI
考研
                        博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
                    
                    道阻且长，行则将至
                        sweet橘子

                        本文参与书香澜梦主题征文“行”文章原创首发，文责自负。我们每一个人都应该有属于自己的愿望或者是理想，人一但有了理想也就算是有了方向，它就会像灯塔一样指引我们前进的方向，哪怕是再远大的理想，如果坚持，那么我相信它就一定有收获。屈原是我最喜欢的一个浪漫主义的诗人，他曾今说过：“路漫漫其修远兮，吾将上下而求索。”人生的道路很长，但是为了实现自己的理想抱负我愿意付出我毕生的精力，只专注这一件事，因为“道阻
                    
                    【勾心原创】《去年夏天》
                        不勾心的豆角

                        （原创作者：不勾心的豆角）本期【勾心原创】，继续本人不勾心的豆角的现代诗创作之旅。《去年夏天》原创作者：不勾心的豆角那里芳草茵茵绿柳成行澄净蓝天下屋顶们相亲相爱闪着橙色紫色的馨香溪流温柔偎依着村庄牛儿羊儿信步徜徉还有成群的白鸽在尖顶的教堂盘旋歌唱孩子们是自由的蒲公英奔跑在希望的田野上任由天真的笑声肆无忌惮烂漫这人间天堂夜幕小心翼翼呵护着甜美的梦乡只剩尽职的晚风陪伴顽皮的星子们游荡快告诉我心爱的姑娘
                    
                    《如不承诺天长地久，怎会相遇细水长流》文/苏暖人
                        北京大数据苏焕之

                        《如不承诺天长地久，怎会相遇细水长流》文/苏暖人原创——莫转载粘贴有人选择昙花一现，如大理的花海，有人选择细水长流，如雨夜的浪漫。都说，五分喜欢的人恨不得将他挂在嘴边，十分喜欢的人却只舍得放在心里边了，在爱情眼里，对方说的每一句话都在乎你的感受，TA的眼里也只有你，我想也是这样！说起我的爱情，我也喜欢过一个忧郁的女孩，她喜欢的男孩不喜欢她，于是我成了她倾诉的朋友＋备胎，一年来我们互相推荐伤感的歌曲
                    
                    古风原创
                        慕白漓

                        【江南月】词:慕白漓曲:《庐州月》西厢一语惊醒梦中月光佳人为何素眉不添淡妆抚帕刺秀绵缎一缕清香南望飞雁又归西方城外又闻秋稻泛黄成殇细雨纷飞里春又归乡离家而去的你是否迷失彷徨一句诺言永记心上家书一封道尽咏平常青草才青暮色又飘扬等也难当回又何妨古拙的山水今又细水流长江南月光照耀湖旁如今的情也已不在心上十载月晃容颜覆黄问一句你今在他乡何方江南月光苏州城隍孤单的你可还记得夜凉西厢人忘你是否还在独唱却唱不出
                    
                    「原创」海丰阿东：人若不死生有何欢，长命百岁只是梦想
                        海丰阿东

                        「原创」海丰阿东：人若不死生有何欢，长命百岁只是梦想有生必有死，人生的规律如此，任何人都无法回避。但如果一个人能长命百岁，永远活着，其实也并不是一件好事情。你永远活着，在你身边那些熟悉的东西都渐渐的离你而去，你成了一个孤家寡人。最后你只能在回忆中生活着，一定是十分的孤独啊。其实有生必有死，因为死亡的存在，让生便有了意义。人活着才有价值，正是因为有死亡，才凸显出来了。编辑当然了，同样是活着也会产生不
                    
                    IBM反垄断史：一个什么都卖的兼并指挥家
                        竞争者的垄断梦

                        真事/故事/反垄断的故事/大公司垄断的故事曲创（原创）欢迎关注竞争者的垄断梦感谢已经看到这里的各位，因为间隔时间有点长，可能各位有点迷失。大家千万别误会，我们这一季的男一号既不是Hollerith，也不是Powers。到目前为止他俩的戏份真是不少，但只是因为必不可少，没有他俩发明的制表机，也就没有IBM；没有他俩相爱相杀的暧昧关系，也就没有后来数十年里IBM和反垄断的苦恋悲情。这是一个漫长的悲伤故
                    
                    淘陶居老袁藏品
                        东海堂

                        【造像艺术】文化遗产•汉地木造像的区域特征、古代精品造像欣赏。。。。。。（来源：蠢牛/颜旭茂）原创2016-06-12作者：作者：蠢牛（颜旭茂）木造像的地位一直挺尴尬的。国外大型博物馆的木造像基本都是宋元以前的，明代只藏极品。国内也就故宫、国博和上博有能力弄几尊宋木，山西省博貌似只有一尊顶级的明代菩萨能拿得出手，其他木雕大省的博物馆再怎么也应当展示些明清木雕吧，总比同时代那什么坛坛罐罐更有艺术性。
                    
                    每日头像|爱与时光，终年不遇
                        一宝先生

                        小可爱们晚上好呀今天晚上来推送一期情侣头像~喜欢的小可爱可以点赞收藏评论哟~部分素材来自网络，版权归原创者，如有侵权请联系删除今天的头像结束啦喜欢的小可爱可以点下关注哟~如果喜欢本期的内容可以转发分享哦~那我们下期再见咯~拜了个拜~
                    
                    2019 上海原创女装工作室创业一年 感悟 焦虑中带有恐慌感
                        女装设计师茜公子__

                        时间过的太快，跟不上脚步，真不想虚度光阴，2019开春立下的FLAG，至今一条没实现！想去✈️，每每看到世界那么大，也想去看看。就像是在诉说着我的心声，再看看日益缩水的钱袋，恨自己能力有限……想去的地方太多，被现实绊住脚步，要先生存立足，才能有所谓的诗和远方……我是80的尾巴，2018年6月果断辞了工作近8年的公司，当时也是思想斗争长达几个月，断了自己的后路，当时就想再工作几年又能怎么样？锁住了自
                    
                    酒店床装车出货
                        臧冰

                        一百多套的酒店床、圆床，床垫终于出货了，可惜还没装完，明天将继续出货，辛苦了各位小伙伴们！图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App我是两个孩子的宝妈，经营着一间软体家具厂，“伊力威斯”是我们的品牌。这是我的第178篇原创日记。栽一棵树最好的时间是十年前跟今天，写日记亦是如此，抓住今天，我们将收获更精彩的人生！
                    
                    毕业论文附录一般都写什么?大学生写论文是干嘛用的
                        写个原创论文
人工智能深度学习AI写作chatgpt论文阅读
                        毕业论文的附录通常包含一些在正文中不便于展示或详细阐述的内容，但对理解论文整体又具有重要意义的资料。具体来说，附录可能包含以下内容：AI论文，免费大纲，10分钟3万字，查重高于15%退费，支持数据图表！！AIPaperPass-AI论文写作指导平台AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，
                    
                    《爱情》
                        杜文霞

                        杜文霞坚持原创分享第39天（20190214）图片发自App对爱情的认识我越来越清晰了。真正的爱情是成年人的游戏，双方在关系中是平等的。就像舒婷《致橡树》中写的：我如果爱你——绝不学痴情的鸟儿，为绿荫重复单调的歌曲；必须是你近旁的一株木棉，作为树的形象和你站在一起。我们共享雾霭、流岚、虹霓。仿佛永远分离，却又终身相依。爱情中的爱是相互的，是爱与被爱的流动，不是控制和占有。如果一方总觉得另一方“应该
                    
                    怎样提高文章的点击率？
                        言一一2012

                        最近写文章，原创度那些都可以，就是这个用户喜爱度拖着我的后腿。我也试着去点击别人的文章，并评论，可是看自己文章的还是很少。真不知道这种情况该如何是好？哪位大神能不吝赐教，告诉小女子一声，怎样提高文章的点击率？
                    
                    正常化的同理
                        迷你旅客

                        郑璐宜昌焦点网络中级七期原创持续分享第214天SBFT的同理方式除了反应来访者的感受之外，更会暗示事情有其他可能性的存在，以试图动摇来访者的负面感受，改变她的自我觉知。其原则包括：1、将来访者所说的内容以“过去式”的动词（如：加上“曾经”）进行回应，暗示现在的负向可以成为过去。2、把来访者所用的含绝对性、强烈性的字眼，换为严重程度较低或发生比例较少的用字。例如，来访者说：“每天总是觉得快要发疯了。
                    
                    写作，让我静心反思与总结
                        薛森森的猫

                        坚持日更很开心。我可以把生活中的点滴感悟记录下来。慢慢总结，也顺带可以反思自己的人生。写作也锻炼了我的思维逻辑。生活给予我写作的灵感，而写作大纲让我写作更调理。当然还需要改进自己。欠缺的地方：读书少，积累更少。原创图片少。要上班了，继续努力！
                    
                    狼牙山人-画家张国富原创写意作品剖析第65帧《数枝浓艳对秋光啚》
                        张国富字腴田

                        狼牙山人-画家张国富原创写意作品剖析第65帧《数枝浓艳对秋光啚》2016年3月原創寫意作品《數枝農艷對秋光圖》。
                    
                    读《道德经》28
                        华南帝虎

                        甘德礼（读《道德经》28）原创分享609＋277天，光山心协智慧父母课堂持续分享第262天原文知其雄，守其雌，为天下谿。为天下谿，常德不离，复归于婴儿。知其白，守其黑，为天下式。为天下式，常德不忒，复归于无极。知其荣，守共辱，为天下谷。为天下谷，常徳乃足，复归于朴。朴散则为器，圣人用之则为官长，故大制不割。译文越是自己雄强刚猛，越是要守得住雌柔安静，就像山间低凹的溪水样。像溪水一样，那规律性的德就
                    
                    《向西游记取育儿经》启示二拜师菩提第二部分：腾云驾雾识世界，开阔眼界宽胸怀
                        暖暖的初春

                        图片发自App李苹瑕焦点网络初级5期平顶山持续原创分享第697天2019年04月07日星期日晴《向西游记取育儿经》启示二拜师菩提第二部分：腾云驾雾识世界，开阔眼界宽胸怀这几天恰逢清明小长假，许多家长都会带领孩子祭祖扫墓和清明踏春郊游。刚好我们这一周总第31期读书会主题：腾云驾雾识世界，开阔眼界宽胸怀。描述的是孙悟空成长初期师拜菩提所受到的启蒙教育，和现今各位家长注重孩子的早期成长和启蒙教育是不谋而
                    
                    《女子监狱》系列，Netflix自此走上牛B之路
                        IMTVS_cc

                        文|温水排版|不二今天小编要给大家推荐的是让Netflix大方打上“原创剧集”这个牛气标签，也让HBO这些老牌电视网倒吸一口凉气的美剧《女子监狱》。剧集播出后，IMDB得分在9分徘徊，媒体评价持续走高。从收视率及口碑上来看，《女子监狱》是网飞当之无愧的王牌，自上线以来斩获金球奖等重要奖项6次、提名19次，网络话题数不胜数。《女子监狱》的英文原名是“Orangeisthenewblack”，直译过来
                    
                    【原创小说】总是东风错丨第十三章
                        郭勒的鱼

                        郑重声明：文章系原创非首发，首发平台：头条号，ID：郭勒的鱼，文责自负。天刚亮，府外面一片嘈杂，门被拍的山响，这一夜苏府惊魂，人们吓得如同惊弓之鸟，听到这敲门声，连苏福都不敢贸然开门。趴在门缝往外一看，是大太太的哥哥舅姥爷虞南基来了，连忙着人开门，不但是虞南基来了，还领来一队三十多个全副武装的士兵。南竹看着哥哥。嘴扁了扁，蓦然鼻子一酸哭得泣不成声，虞南基很诧异。他这个妹妹他了解，外表的柔婉其实都是
                    
                    自媒体新手小白怎么做自媒体，3分钟教你快速上手
                        爱睡觉的木子

                        今天我们继续来聊一聊运营自媒体账号的五个重点内容！（本文由xxxomga原创）一、怎么选领域我们做任何事情都希望自己能成功，自然在做事情之前要有一定的认知和了解，也就是自己心里有一个预估和把握，当你刚刚踏入自媒体领域，对自身足够清楚的认知与了解极为重要，在选择日后想要深入的领域时，一定要注意以下几点：★领域了解程度。就是说我们要选择自己能够掌控的领域，对该领域有一定的了解，或者说有一定的兴趣，因为
                    
                    乡愁（原创诗歌）
                        诗之远方

                        乡愁一辈子被附在身上和乡音一起远离故乡乡愁啊，乡愁你是是爸爸做的冰糖葫芦你是妈妈哼唱的摇篮曲你是奶奶播种的菜园子乡愁啊，乡愁你是我走南闯北日日想念的家我年轻时乡愁你是一缕黑发现在啊，乡愁，你是母亲雪一样的白发总是梦到儿时的小院儿总是梦到小时候的故乡乡愁啊乡愁魂牵我这一辈子的乡愁啊请你慢些走，慢些走吧2018.03.08图片发自App
                    
                    男女交往没几天就去旅游合适吗？我采访8位女士，她们是这么说的
                        理想的李

                        文丨由三生知原创，切勿抄袭图片丨源自网络现在人们的生活好了，生活质量提高了，人们自然也就懂得享受了。尤其是现在的家庭，能够给孩子的物质保证也越来越多，质量也越来越高。年轻就要多走走，成了当今时代年轻人的口头禅。出去走走是好事，世界那么大，总要去看看。既然要去看外面的世界，自己去当然也是可以的，不过难免有些孤独，有时候遇到特别美好的事物想要与人分享，却发现自己形单影只。这时有个人陪伴自然最好，前不久
                    
                    重看《天道》，芸芸众生分为4个层次，看看你属于哪一层?
                        拂尘记

                        听说纯原创的公众号不超过7%，这是拂尘记的第701篇原创文章，字数1676，阅读大概需要3分钟最近用3天时间，重刷一遍《天道》，经典就是经典，每次看都能有不同的收获与感悟。这次最大的感悟是，纵观全剧，有以下4类人：1、俗人：为了名利面子，贪嗔痴，不停地追求索取。比如刘冰，退了股还想呆在格律诗，就为了那辆宝马以及北京的繁华，然而看着肖亚文忙里忙外，开始心态失衡：我们打下的江山，凭什么给你？殊不知，是
                    
                    那些口口声声说自己没要求的大龄女性，才是真正“要求高”的人!
                        早安收信人

                        本文由【早安收信人】原创点击右上角加“关注”，每天都能收到文章推送！还记得《亲爱的，热爱的》热播时，很多女生被李现饰演的韩商言圈粉，除了他英俊多金的身份外，他对佟年的一往情深和专一，尤其在他说：“我的小孩，我担待时”，那种肯定跟宠溺，会让每个情窦初开的女生沦陷。电视剧中有很多细节，代表了韩商言对佟年的爱，这个不太会表达甚至表面冷冰冰的男人用他自己的方式，守护他喜欢的女孩。韩商言之所以被“追捧”，就
                    
                    SFBT其他重要晤谈技巧与原则
                        金JJ

                        中原焦点团队坚持原创分享第1438天1.以“澄清式自我揭露”与“温和挑战”取代面质。Sfbt不建议咨询师告诉当事人有关自己的过去经验，而是用澄清的方式询问当事人，并仍然扣着目标导向与优势的观点，这样的自我阐述能催化当事人面对自己的挣扎，在澄清中看到自己的优势力量，进而愿意继续往解决导向的路线前进。SFBT咨询师不强烈面质当事人的不一致，而采用较为温和的自我揭露方式，来澄清咨询师所发现当事人矛盾之处
                    
                                SAX解析xml文件
                                    小猪猪08
xml
                                    1.创建SAXParserFactory实例 
2.通过SAXParserFactory对象获取SAXParser实例 
3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 
4.SAXParser实例的parse来获取文件 
    public static void main(String[] args) { 
 //
                                
                                为什么mysql里的ibdata1文件不断的增长？
                                    brotherlamp
linuxlinux运维linux资料linux视频linux运维自学
                                    我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。 
当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。 
一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： 
ibdata1存了什么？ 
当你启用了 i
                                
                                Quartz-quartz.properties配置
                                    eksliang
quartz
                                    其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。 
  
下面是这些默认值的解释 
#-----集群的配置
org.quartz.scheduler.instanceName =
                                
                                informatica session的使用
                                    18289753290
workflowsessionlogInformatica
                                    如果希望workflow存储最近20次的log，在session里的Config  Object设置，log  options做配置，save  session log :sessions  run  ;savesessio log for  these runs:20 
session下面的source 里面有个tracing 
                                
                                Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误
                                    酷的飞上天空
scrapy
                                    Scrapy版本0.14.4 
出现问题现象： 
  
ERROR: Error downloading <GET http://xxxxx  CRC check failed 
  
解决方法 
  
1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 
  
明确表示不支持任何形式的压缩格式，避免程序的解压
                                
                                java Swing小集锦
                                    永夜-极光
java swing
                                    1.关闭窗体弹出确认对话框 
  1.1   this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 
  1.2   
	this.addWindowListener (
				new WindowAdapter () {
					public void windo
                                
                                强制删除.svn文件夹
                                    随便小屋
java
                                      
        在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
                                
                                GET和POST有什么区别？及为什么网上的多数答案都是错的。
                                    aijuans
get post
                                      
    如果有人问你，GET和POST，有什么区别？你会如何回答？ 我的经历 
     前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。 
    这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
                                
                                谈谈新浪微博背后的那些算法
                                    aoyouzi
谈谈新浪微博背后的那些算法
                                    本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。 
微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
                                
                                Connection reset 连接被重置的解决方法
                                    百合不是茶
java字符流连接被重置
                                    流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置 
  
被重置的代码如下; 
  
客户端代码; 
package 通信软件服务器;

import java.io.BufferedWriter;
import java.io.OutputStream;
import java.io.O
                                
                                web.xml配置详解之filter
                                    bijian1013
javaweb.xmlfilter
                                    一.定义 
<filter>
	<filter-name>encodingfilter</filter-name>
	<filter-class>com.my.app.EncodingFilter</filter-class>
	<init-param>
		<param-name>encoding<
                                
                                Heritrix
                                    Bill_chen
多线程xml算法制造配置管理
                                    作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 
Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
                                
                                【Zookeeper】FAQ
                                    bit1129
zookeeper
                                    1.脱离IDE，运行简单的Java客户端程序 
#ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient   
  
1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 
2. 如果Zookeeper集群跨越多个机房，那么Leader/
                                
                                The user specified as a definer ('aaa'@'localhost') does not exist
                                    白糖_
localhost
                                    今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 
最后找原因发现删除操作做了触发器，而触发器里面有这样一句 
  
 /*!50017 DEFINER = ''aaa@'localhost' */ 
 原来最初
                                
                                javascript中showModelDialog刷新父页面
                                    bozch
JavaScript刷新父页面showModalDialog
                                    在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： 
      window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 
      在子页面使用w
                                
                                编程之美-买书折扣
                                    bylijinnan
编程之美
                                    


import java.util.Arrays;

public class BookDiscount {

	/**编程之美 买书折扣

书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。
下面用动态规划实现。
哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
                                
                                关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要
                                    chenbowen00
strutsWEB安全
                                    因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。 
下面记录下本次解决的过程以便后续 
1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议， 
而使用ftp协议默认会产生一个匿名用
                                
                                [电力与暖气]煤炭燃烧与电力加温
                                    comsci

                                     
      在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 
 
      不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? 
 
  &nbs
                                
                                oracle O7_DICTIONARY_ACCESSIBILITY参数
                                    daizj
oracle
                                    O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
                                
                                比较全面的MySQL优化参考
                                    dengkane
mysql
                                    本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 
  
1、硬件层相关优化 
  
1.1、CPU相关 
  
在服务器的BIOS设置中，可
                                
                                C语言homework2，有一个逆序打印数字的小算法
                                    dcj3sjt126com
c
                                    #h1# 
  
0、完成课堂例子 
1、将一个四位数逆序打印 
1234 ==> 4321 
实现方法一： 
# include <stdio.h>

int main(void)
{
	int i = 1234;
	int one = i%10;
	int two =  i / 10 % 10;
	int three = i / 100 % 10;

                                
                                apacheBench对网站进行压力测试
                                    dcj3sjt126com
apachebench
                                       ab 的全称是 ApacheBench ， 是 Apache 附带的一个小工具 ， 专门用于 HTTP Server 的 benchmark testing ， 可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。 
通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。 
                                
                                2种办法让HashMap线程安全
                                    flyfoxs
javajdkjni
                                    多线程之--2种办法让HashMap线程安全 
多线程之--synchronized 和reentrantlock的优缺点 
多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) 
  
  
HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全. 
  

                                
                                Spring Security（04）——认证简介
                                    234390216
Spring Security认证过程
                                    认证简介 
目录 
1.1     认证过程 
1.2     Web应用的认证过程 
1.2.1    ExceptionTranslationFilter 
1.2.2    在request之间共享SecurityContext 
   

1
                                
                                Java 位运算
                                    Javahuhui
java位运算
                                    // 左移( << ) 低位补0 
// 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： 
// 0000 0000 0000 0000 0000 0000 0001 1000 
System.out.println(6 << 2);// 运行结果是24 
 
// 右移( >> ) 高位补"
                                
                                mysql免安装版配置
                                    ldzyz007
mysql
                                    1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 
2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 
3、my-large.ini是为专用于一个SQL数据
                                
                                MFC和ado数据库使用时遇到的问题
                                    你不认识的休道人
sqlC++mfc
                                    =================================================================== 
第一个 
=================================================================== 
 
try{
		CString sql;
	sql.Format("select * from p
                                
                                表单重复提交Double Submits
                                    rensanning
double
                                    可能发生的场景： 
 
 
 *多次点击提交按钮  
 *刷新页面  
 *点击浏览器回退按钮  
 *直接访问收藏夹中的地址  
 *重复发送HTTP请求（Ajax） 
 
（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。 
这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： 
http://getbootstrap.co
                                
                                Java String 十大常见问题
                                    tomcat_oracle
java正则表达式
                                    　1.字符串比较，使用“==”还是equals()?   　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。   　　equals()判断两个字符串的值是否相等。   　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。   　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。   　 
　
                                
                                SpringMVC 登陆拦截器实现登陆控制
                                    xp9802
springMVC
                                    思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。 
  
实现方法： 
        1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23  
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.