小白爬完文字爬图片,目标百度贴吧。 其实是偶然的机会发现了这个:
当时就想,为什么创建这个“旅行吧”呀,从事物发展的规律来说,就是方便大伙儿各种晒图各种秀啊!能拿来晒的东西,敢情应该不会差到哪去(至少比一般的百度图片要好一些吧)
好了不多胡扯回归正题,几行代码,带足不出户的你,走遍万水千山! 先随便搜了个贴,好吧就是这个了
一、目标:
1、获取帖子标题、总页数、评论、图片 2、图片写入文件并保存 3、将各种信息实现打印(测试追踪) 4、输入帖子号便能实现以上操作(亦适用于其它帖子)
二、步骤:
1、获取源码 。这个简单,用requests的get请求方式即可。这里设置了random.randint()获取随机数,在一堆范围中获取user_agent,主要是为了伪装防止网站认出是爬虫而限制抓取。至于这一堆user_agents,额,网上搜的哈哈~ ''' #usr/bin/env python # -- coding: utf-8 - - def getSource(self,url): user_agents=['Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20130406 Firefox/23.0','Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/533+ (KHTML, like Gecko) Element Browser 5.0','IBM WebExplorer /v0.94', 'Galaxy/1.0 [en] (Mac OS X 10.5.6; U; en)','Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)','Opera/9.80 (Windows NT 6.0) Presto/2.12.388 Version/12.14','Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) \Version/6.0 Mobile/10A5355d Safari/8536.25','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) \Chrome/28.0.1468.0 Safari/537.36','Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.0; Trident/5.0; TheWorld)' index=random.randint(0,9) user_agent=user_agents[index] headers = {'User_agent': user_agent} html=requests.get(url,headers=headers) return html.text '''
2、获取标题、总页数、评论 主要是匹配正则 标题的正则 '''
pattern=re.compile('(.*?)',re.S)
items=re.search(pattern,result)
''' 页数的正则 '''
pattern=re.compile('(.*?)',re.S)
items=re.search(pattern,result)
''' 评论的正则 '''
pattern=re.compile('(.*?)',re.S)
items=re.search(pattern,result)
'''
3、获取晒图 用到BeautifulSoup,首先想到find_all()搜'img'标签,得到如下
龙蛇混杂呀,不仅包括各种旅行晒图,还有链接中包含'head'的头像图,含'emoticon'的表情图等等,宝宝内心是崩溃哒。 如何洗出我们想要的内容呢? 别着急,仔细观察这些个链接,逐个点开一试就会发现,凡是属于'晒图'的,接带有属性class='BDE_Image'。 我的天,直接find_all()限定范围,再循环打出item['src'],分分钟搞定链接!要有多简单就有简单,最后将链接保存至一个list中。
4、创建目录 用到makedirs(),值得注意的是,如果想将文件夹创建至非系统默认的地方,需要用到chdir()来更改环境变量。
5、保存晒图 万水千山走遍,目录也创建,接下来就是保存图片。又用到文件操作相关知识,千万注意,要想将图片成功保存至上面创建的目录,必需指定绝对路径,所以设置self.path是为了方便此处调用。
6、集合各操作并获取多页 两个循环,一个是多页,一个是多个图片的保存。关键在格式化每一页索引链接。 观察可发现规律,网页URL格式为:'http://tieba.baidu.com/p'+帖子号+'?pn='+页数,所以可以设置如下: '''
self.siteURL = 'http://tieba.baidu.com/p/' + str(Num)
self.url=self.siteURL+'?pn='+str(page)
'''
三、代码
以上就是基本的思路,接下来分享代码,如有错误还望指正 ''' #usr/bin/env python # -- coding: utf-8 - - author ='WYY' date ='2017.03.14'
#实战小项目:百度贴吧爬虫
import urllib2
import requests
import re
import os
import time
import random
from bs4 import BeautifulSoup
#定义一个Tool()类方便清洗数据
class Tool():
removeImg = re.compile('|{7}| ') # 去除img标签,1-7位空格,
removeAddr = re.compile('|') # 删除超链接标签
replaceLine = re.compile('||
|') # 把换行的标签换位\n
replaceTD = re.compile('') # 把表格制表 换为\t
replaceBR = re.compile(' | ||') # 把换行符或者双换行符换为\n
removeExtraTag = re.compile('.*?') # 把其余标签剔除
removeNoneLine = re.compile('\n+') # 把多余空行删除
def replace(self, x):
x = re.sub(self.removeImg, "", x)
x = re.sub(self.removeAddr, "", x)
x = re.sub(self.replaceLine, "\n", x)
x = re.sub(self.replaceTD, "\t", x)
x = re.sub(self.replaceBR, "\n", x)
x = re.sub(self.removeExtraTag, "", x)
x = re.sub(self.removeNoneLine, "\n", x)
return x.strip() # 把strip()前后多余内容删除
#定义一个Spider类
class Spider():
#初始化参数
def __init__(self):
self.tool = Tool()
#获取源码
def getSource(self,url):
user_agents=['Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20130406 Firefox/23.0','Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/533+ \(KHTML, like Gecko) Element Browser 5.0','IBM WebExplorer /v0.94', 'Galaxy/1.0 [en] (Mac OS X 10.5.6; U; en)','Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)','Opera/9.80 (Windows NT 6.0) Presto/2.12.388 Version/12.14','Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) \Version/6.0 Mobile/10A5355d Safari/8536.25','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) \Chrome/28.0.1468.0 Safari/537.36','Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.0; Trident/5.0; TheWorld)']
# user_agent在一堆范围中随机获取
# random.randint()获取随机数,防止网站认出是爬虫而访问受限
index=random.randint(0,9)
user_agent=user_agents[index]
headers = {'User_agent': user_agent}
html=requests.get(url,headers=headers)
return html.text
#获取帖子标题
def getTitle(self,url):
result=self.getSource(url)
pattern=re.compile('(.*?)',re.S)
items=re.search(pattern,result)
print u'这篇帖子标题为:',self.tool.replace(items.group(1))
#获取帖子总页数
def getPageNumber(self,url):
result=self.getSource(url)
pattern=re.compile('(.*?)',re.S)
items=re.search(pattern,result).group(1)
print u'帖子共有',items,u'页'
return items
#获取评论内容
def getContent(self,url):
result = self.getSource(url)
pattern=re.compile('(.*?) .*?=1:
print u'\n',u'共晒图',number,u'张,厉害了我的哥!!!'
else:
print u'喏,没有图......'
return images
#创建目录
def makeDir(self,path):
self.path=path.strip()
E=os.path.exists(os.path.join('F:\Desktop\code\LvXing', self.path))
if not E:
#创建新目录,若想将内容保存至别的路径(非系统默认),需要更环境变量
#更改环境变量用os.chdir()
os.makedirs(os.path.join('F:\Desktop\code\LvXing', self.path))
os.chdir(os.path.join('F:\Desktop\code\LvXing', self.path))
print u'正在创建名为',self.path,u'的文件夹'
return self.path
else:
print u'名为',self.path,u'的文件夹已经存在...'
return False
#万水千山走遍,接下来就是保存美图
def saveImage(self,detailURL,name):
data=urllib2.urlopen(detailURL).read()
fileName=name+'.'+'jpg'
#保存文件,一定要用绝对路径 `
#所以设置self.path,是为了方便后面函数无障碍调用
f=open(r'F:\Desktop\code\LvXing\%s\%s'%(self.path,fileName),'wb')
f.write(data)
f.close()
print u'成功保存图片',fileName
#集合所有的操作,并获取多页
def getAllPage(self,Num):
self.siteURL = 'http://tieba.baidu.com/p/' + str(Num)
#获取帖子标题
self.getTitle(self.siteURL)
#获取帖子页数
numbers=self.getPageNumber(self.siteURL)
for page in range(1,int(numbers)+1):
#格式化索引链接
self.url=self.siteURL+'?pn='+str(page)
print u'\n\n',u'正准备获取第',page,u'页的内容...'
#获取评论
print u'\n',u'正准备获取评论...'
self.getContent(self.url)
#每一页创建一个文件
self.makeDir(path='page'+str(page))
#获取图片
print u'\n',u'正准备获取图片...'
images=self.getImage(self.url)
print u'\n',u'正准备保存图片...'
number=1
#保存图片,先从之前的list中找链接
for detailURL in images:
name='page'+str(page)+'num'+str(number)
self.saveImage(detailURL,name)
time.sleep(0.1)
number+=1
print u'\n\n',u'完成第',page,u'页'
print u'\n\n',u'恭喜,圆满成功!'
#raw_input()实现和外部交互,想看哪个贴就看哪个贴
Num=int(raw_input('老哥儿/老妹儿,输入帖子号呗:'))
spider=Spider()
spider.getAllPage(Num)
'''
四、结果
终于写完代码啦,各种参数要注意处理好。 然后可以看到如下结果:
看看文件的变化,图片已经乖乖躺在文件夹中啦
五、扩展
爬完上面这个贴,又去胡乱搜寻,发现两有趣的贴。 喜爱摄影的盆友看过来啦~ 一个是:国外朋友的世界一周旅行记1,Uca姐的摄影好美(献给所有爱旅者) 另一个:背起画夹去旅行——且行且绘(陆续更新)
1)、前面这一个介绍了一个日本旅行摄影师的世界一周旅行记的故事,照片色彩明丽、利落干净,迎面满是异域风情。 举例几个图:
一共100页,一页也就四五十张图。。。不过摄影师的图还是相当的赞啊
2)另一个帖子更是好玩,楼主非常有才,把沿途所见所闻都一一画下,画风那叫一个清新雅致,不得不献上膝盖。 放几个图感受一下:
其实还有很多这样的帖子,随便输入帖子号便玩转贴吧,几行代码走遍万水千山,就是这样啦~
你可能感兴趣的:(玩转贴吧)
氧券邀请码是多少(最新app邀请码大全及填写步骤讲解)带你玩转
日常购物小技巧
一、氧券邀请码填什么填多少1、氧券邀请码填写:999999,这样可以获得高级合伙人,高佣金二、怎么才能有氧券邀请码氧券APP是淘宝天猫京东…全网优惠券+返利的搬运工,自购省钱,分享挣钱!注册氧券是必须要填写邀请码的,没有邀请码不能注册。1、填写上面邀请码注册,自己也会升级为高级合伙人,拥有自己的氧券邀请码2、会员自己购物可享受返佣,可以分享赚钱获得佣金三、氧券会员注册怎么弄1、手机下载氧券APP后
每天五分钟玩转深度学习PyTorch:模型参数优化器torch.optim
幻风_huanfeng
深度学习框架pytorch 深度学习 pytorch 人工智能 神经网络 机器学习 优化算法
本文重点在机器学习或者深度学习中,我们需要通过修改参数使得损失函数最小化(或最大化),优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim,我们可以使用它调用封装好的优化算法,然后传递给它神经网络模型参数,就可以对模型进行优化。本文是学习第6步(优化器),参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中,梯度下降算法是最常用的参数更新方法,它的公式
2022双十一省钱攻略(最全)_双十一怎么买省钱
高省_飞智666600
今年的双十一活动即将开始,又到了我们囤东西薅羊毛的日子了,今年的双十一各大平台依旧推出了超大的优惠,那双十一怎样买最省钱?下面请看2022双十一省钱攻略大揭秘,跟着小编一起轻松玩转双十一!活动期间,天猫及淘宝平台将发放双十一超级红包(打开手机淘宝搜索:红包到手11100双十一怎样买最省钱?1.签到红包:3元红包2.芭芭农场:集阳光兑换满60-8或满70-10红包(指定页面下单)3.家电价格都高,付
App推广新姿势:Xinstall带你玩转安装页面拉起功能!
Xinstall渠道统计
内容运营 大数据
在移动互联网时代,App已经成为我们生活中不可或缺的一部分。然而,随着App数量的不断增加,如何让自己的App在众多竞争者中脱颖而出,成为推广者面临的一大难题。今天,我们就来聊聊一个神奇的解决方案——Xinstall,它能帮助我们实现安装页面一键拉起App,极大提升用户体验,助力App推广。首先,让我们来了解一下什么是安装页面拉起App。简单来说,就是通过一个链接或者按钮,让用户在浏览网页时能够直
linux查看git log目录,教你玩转Git-查看提交历史
郁清叔叔
linux查看git log目录
导读Git是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。Git是LinusTorvalds为了帮助管理Linux内核开发而开发的一个开放源码的版本控制软件。Git与常用的版本控制工具CVS,Subversion等不同,它采用了分布式版本库的方式,不必服务器端软件支持。在使用Git提交了若干更新之后,又或者克隆了某个项目,想回顾下提交历史,我们可以使用gitlog命令查看。针
《熬夜整理》保姆级系列教程-玩转Wireshark抓包神器教程(6)-Wireshark抓包界面详解
北京-宏哥
1.简介在此之前,宏哥已经介绍和讲解过Wireshark的启动界面。但是很多初学者还会碰到一个难题,就是感觉wireshark抓包界面上也是同样的问题很多东西不懂怎么看。其实还是挺明了的宏哥今天就单独写一篇对其抓包界面进行详细地介绍和讲解一下。2.Wireshak抓包界面概览通过上一篇我们知道
认知杂谈62《颠覆认知的赚钱秘籍曝光,财富自由近在咫尺》
狂飙的张兴发
认知杂谈 学习方法 职场和发展
内容摘要: 嘿,家人们!如今“一分耕耘一分收获”未必全对。农民和打工者辛苦却钱紧,网红却轻松进账。赚钱需懂商业逻辑,创新产品、扩粉丝圈、成刚需。选择影响大,提升认知才能发现更多机会。转变思路,引流、设计销售、玩转数据营销。生意关键是现金流为王,要聪明工作。学习推荐书籍、关注大咖、加入社群。实践出真知,快踏上财富自由之路。今天分享有人说的一段争议性的话II一、赚钱观念需更新 嘿,家人们!咱今天就
捕捉小趋势,解锁春糖营销新姿势
优星库
春节已过,但品牌营销战场上硝烟仍未散去,在即将到来的3月糖酒会这个营销节点上,对于休闲零食来说,无论销量还是品牌造势,都是抢占市场高地的一个很好营销点。因此,如何争夺消费者注意力,让品牌从众多同质化品类中脱颖而出,如何呈现新的形象,让消费者主动、持续地消费,带动流量转化和变现,成为休闲零食行业的营销新话题。玩转代言,深度圈粉明星代言是品牌营销中最直接有效的形式之一,这一营销策略不仅有利于品牌形象建
每天五分钟玩转深度学习框架PyTorch:获取神经网络模型的参数
幻风_huanfeng
深度学习框架pytorch 深度学习 pytorch 神经网络 人工智能 模型参数 python
本文重点当我们定义好神经网络之后,这个网络是由多个网络层构成的,每层都有参数,我们如何才能获取到这些参数呢?我们将再下面介绍几个方法来获取神经网络的模型参数,此文我们是为了学习第6步(优化器)。获取所有参数Parametersfromtorchimportnnnet=nn.Sequential(nn.Linear(4,2),nn.Linear(2,2))print(list(net.paramet
每天五分钟玩转深度学习框架PyTorch:将nn的神经网络层连接起来
幻风_huanfeng
深度学习框架pytorch 深度学习 pytorch 神经网络 人工智能 机器学习 python
本文重点前面我们学习pytorch中已经封装好的神经网络层,有全连接层,激活层,卷积层等等,我们可以直接使用。如代码所示我们直接使用了两个nn.Linear(),这两个linear之间并没有组合在一起,所以forward的之后,分别调用了,在实际使用中我们常常将几个神经层组合在一起,这样不仅操作方便,而且代码清晰。这里介绍一下Sequential()和ModuleList(),它们可以将多个神经网
C++玩转模板之——函数萃取function traits
东川路徐先生
c++
目录前言一、实现原理(一)可调用类型萃取(二)成员函数萃取二、完整代码总结前言当笔者在实现一个类似函数包装器的类模板时(代码示意如下),希望能够传入一个可调用对象来构造,并自动推导出模板(C++17及以上)。但是,如何自动推导出任意一个可调用类型的返回值和参数类型,却成了一个问题。templateclassfunction{};templateclassfunction{std::function
二进制究竟有什么用?带你看看那些好玩儿的「位操作」
码农小光
文章来源于公众号码农田小齐,作者小齐本齐计算机说到底就是0和1,所有的数在内存中都是以二进制的形式储存的。而位操作,或者说位运算,就是直接对内存中的二进制位进行操作。位运算可以说是我们的基本功,今天这篇文章就从以下角度和大家一起玩转位运算。位运算究竟有什么用?原码反码补码7种位运算当然了,位运算还有很多奇技淫巧,如果大家还想看进阶篇,记得给我点赞或者留言告诉我哦~位运算的作用在实际生产中,位运算是
来学宝典怎么样?来学宝典正规吗?
轻轻的来学宝典来了
在备考小儿外科学执业技术考试的时候,就是用来学宝典来辅助的复习的。我知道现在肯定有很多同学有各种顾虑,担心花那么多时间和金钱做准备最后却都是做无用功,通过了考试还好,要是没通过考试的话,会感觉有很大的不值。而且一般到了选择买辅助资料来备考的话,都是决定人生命运的大考试,所以找个靠谱的学习途径真的是太重要了。不要问我为什么知道得那么清楚,我也是这样过来的。当时选择来学宝典是因为在逛贴吧的时候看到有人
恶意与肮脏都藏在阴暗处,不论个人还是社会
活到125
接着说前天我去烟台山公园,深秋的景色没的说,叶落玩转而落如蝴蝶舞翼。海边风景如画,不少人选择在这里拍婚纱照,在这里也能看到远处的烟台港。我一路循着美景,不知不觉走到一处小径,一条通向海边的小路。路的两边有一人多高的冬青,在路口看起来甚是幽僻,地上落叶稀疏少有人至。我喜欢幽静的地方,就循路走了下去。没想到走不过十几米,就被一片屎尿混合的气味包围,循路探幽的心转瞬消失。那感觉就像是有成千上万的臭烘烘的
一直以为加入会员去广告是转盘上的广告
腊月雪洛
加入会员后,没有广告!没有广告!没有广告!刚开始下载APP,没加入会员,手机登录的页面一直是这个样子的,没有广告。图片浏览主页,也没有广告。看到广告最多的地方就是天天转盘。看广告想翻倍,看广告,想转盘,除去免费的那2次,看广告。看广告好气哦!为了那点收益加成卡,每次都需要看25秒时长的广告!都说加入会员后,可双向去广告。为了不让自己心生烦脑,想想还是加入会员。会员的权利之一就是双向去广告,这样玩转
莆田鞋在哪个app买,十大靠谱的莆田鞋app汇总
美鞋之家
莆田鞋越来越受欢迎了,特别是年轻人极力簇拥,虽然已经过年了大家还是喜欢把自己打扮的时髦一些,显得自己比较时髦,那么哪个app专门卖莆田货呢?有没有靠谱的平台推荐啊?不要着急,我和大家一样也喜欢买莆田鞋,下面这些app或者渠道可以参考一下。详情咨询微信a43974哪个app专门卖莆田货?看看这6个app1、微商是卖莆田鞋蕞大的平台,从业众多,也是莆田鞋销售的中坚力量。他们活跃在微信群,贴吧,各大媒体
记录《销售就是玩转情商》
一颗大龙
本书主要讲的是销售中软技能的重要性,需要和对自身工作的专业度相辅相成(即硬技能)。此文章共两千六百多字,阅读需要点时间。都是自己看书时做的笔记以及自己的理解一丶面对压力,需要足够的能力去控制情绪二丶放空自己休息,自省所做的方式。1.是什么原因让我对客户做出那样的反应?2.开会时,怎样更积极的反馈?3.下次该怎么做,避免陷入困境?4.该向谁寻求帮助?5.如何重复好的行为?三丶做回原始人,创造与技术无
网络兼职正规网站打字,学生兼职打字赚钱软件
趣闲赚手机做任务赚佣金
正规免费打字兼职?现在各种打字兼职贴吧乌烟瘴气,去过的朋友都有体会,很少能遇到正规免费的打字兼职。最近逛各种论坛的时候专门就找免费的,遇到说“接不接受会费”我就直接拉黑了,可能背后被骂了千万遍吧。但是我和大家一样,最恨各种套路,浪费彼此时间还没意义。趣闲赚上面的任务单价也就是几块钱到几十元一单,做的多挣的多。【趣闲赚】拿着手机做赏金任务,1元提现秒到账,在家躺着也赚钱!点击链接或者扫码下载:htt
默纳克系统服务器怎么看抱闸,默纳克抱闸制动力检测怎么关闭
丹力
默纳克系统服务器怎么看抱闸
默纳克抱闸制动力检测怎么关闭2018-09-14直达号历史记录清除历史记录直达号反馈关闭全部问答贴吧资讯视频文库职位图片购物音乐应用地图默纳克3000怎样把抱闸检测功能关掉_百度知道1个回答-回答时间:2017年11月25日[最佳答案]N|CE3000一体机将F5一1~25代码中参数为39的改为00既可迖到你的要求。默纳克3000怎样用服务器关闭抱闸反馈2013年12月11日电梯默纳克系统故障码6
京东返利怎么走的呢?具体流程怎么操作?返利规则有哪些内容需要注意的
氧惠全网优惠
淘宝双11攻略2023:购物盛宴,玩转双十一一年一度的淘宝双11活动又来了,作为消费者,我们该如何把握这个购物盛宴,让自己的权益最大化呢?本文将从认知和攻略两个角度,为你解析淘宝双11的活动和玩法。大家好,我是氧惠的波西导师。在开始本文的交流之前,我想向大家介绍一款网购省钱利器——氧惠APP,同时也是一项难得的零投入零成本的创业项目。官方邀请码088886,此码注册直升v5等级,佣金更高!扶持更多
新教师入职,是进办公室好,还是当班主任好?
七月夜话
又是一年开学季,今年我们提前开学做好新学年的教学准备工作。这几天,又是开会,又是讨论方案,又是布置教室,还为一年级新生筹备了开学前的“玩转校园”的活动,大家真是忙得不亦乐乎。这几天,学校新来了2个女教师。领导安排一个在教导处办公室工作,另一个担任班主任工作。两个人都没有任主课,只担任了一些班级的副课教学工作。针对她们俩的工作安排,有的感慨还是坐办公室轻闲,有的却坚持觉得当班主任好。对于这个问题,我
少女心都萌化了?教你玩转微信朋友圈趣味翻译
前任博物馆APP
从昨晚开始,相信不少人的朋友圈都被“你是不是一只猪”这个萌萌哒的兔子刷屏了:只要长按这只可爱的兔子,选择“翻译”就会出现各种不一样意思的内容你就这么被微信翻译调戏啦!是不是觉得很好玩?想不想知道原理呢?其实,这是利用了微信翻译的一个Bug组成兔子手部的つ实际上是一个日语字符有了它,整句话就会被当成日语来翻译由于日语语法,疑问句就会因此翻译成肯定句就可以玩出很多玩法了!(当然,由于是Bug,翻译出来
翻车塔罗系列——工作
勒托
时间流三月份贴吧一个小姐姐的牌阵,问题是是否能找到工作,当时看第一感觉是可以找到,但是奔着工资高的去的。六月份中旬小姐姐反馈说到当月工作没有找到。牌阵为时间流星星星星逆出现在未来的位置上有着好高骛远的含义,现在位置出现的恶魔,事主想找一份高工资高待遇的工作,能力与工资不相匹配,本身就是无法逾越的鸿沟。还有方面关于行动力的问题,星星逆位,一方面是对于工作想的过于乐观,好高骛远;另一方面则是没有积极去
海尔创造“风口”:玩转生死游戏,创造物联网“生态品牌”
绩动人薪
关注【本号】,更多关于薪酬、绩效、股权、合伙人等内容免费与你分享!私信“视频”送您关于员工管理、绩效薪酬的干货视频。2018年3月7日,美国波士顿还在下雪,张瑞敏在哈佛大学商学院发表了《创建物联网时代的商业模式》的主题演讲。他第一次来哈佛是在20年前,哈佛教授林思·潘恩撰写了《海尔文化激活休克鱼》的案例,邀请他来讲课。如果说20年前,海尔还在努力学习美国公司,那么现在,海尔的模式探索已经失去对标,
数据库性能大揭秘:玩转MySQL监控指标状态变量
云掣YUNCHE
数据库 mysql
作者/文若编辑/姜至前言在本文中,我们将深入探讨MySQL数据库的性能监控世界。通过了解并应用一系列常用的监控指标,我们能够更精准地把握数据库的运行状况。这些指标,通常以状态变量(statusvariables)的形式呈现,是洞察数据库性能的关键。接下来,我们将逐一解析与连接相关的监控变量,包括当前连接数、活跃连接数、缓存线程数以及已创建的线程数。这些指标不仅帮助我们评估连接使用效率,还能预警潜在
数学建模国赛获奖技巧
数模加油站
数学建模 python 2024国赛 高教社杯 数模
一、团队分工合作的技巧(三角形配合)(1)队长要组织多沟通多交流;(2)建议定期开组会,互相讲授自己学习的东西,一人学习,三人收获。二、AI辅助思路解析(ChatGPT辅助)那如果拿到题目没有思路怎么办?GPT可以很好的辅助,当然不能过于依赖GPT,但不可否认的是它很有用。(提示词分享)【数学建模国赛神器】利用ChatGPT助你轻松玩转数模国赛!!(附ChatGPT使用方法)_哔哩哔哩_bilib
辞旧迎新,迎春纳福
阅读一生
今天是除夕,好忙碌的日子!一大早就开始忙活卫生,接着我和婆婆忙着包饺子。老公、儿子和女儿负责擦门窗、贴春联。把旧春联撕掉,贴上新的春联,他们在贴的时候,我透过窗户往外看,院内西屋的对联贴反了,下联贴在了右手边。我大声说错了,这大过年的,老公经不住我说他呀,立马说无所谓,我说那不行,得反过来,他直接罢工不干了并怒道:你贴吧,我不贴了。哼!没有你,我照样能贴呀,婆婆从来没有向着我说话,但今天一反常态地
国内类脑智能企业汇总
细节的温柔
OpenSNN推文 人工智能
OpenSNN开思通智网,官网地址:https://www.opensnn.com/2024年8月份“O站创作者招募计划”快来O站写文章,千元等你来拿!“一起来O站,玩转AGI!”灵汐科技官网:https://www.lynxi.com/企业介绍:北京灵汐科技有限公司是一家全球领先的类脑计算技术公司,致力于创造持续自主进化的新智能体。灵汐科技产品包括类脑芯片、计算模组、标准PCIe接口的计算板卡、
Python中pandas包的简单使用
细节的温柔
opensnn python pandas 开发语言
OpenSNN开思通智网,官网地址:https://w3.opensnn.com/2024年8月份“O站创作者招募计划”快来O站写文章,千元大奖等你来拿!“一起来O站,玩转AGI!”pandas主要用于数据分析,常用于处理结构化数据,如表格数据。下面是pandas的简单使用。1.导入pandas包首先,你需要导入pandas包:importpandasaspd2.创建DataFrameDataFr
但凡未得到,但凡已失去,总是最等对。
寡人坎
突然挖出14年的在贴吧的帖子/那个丢失多年的账号藏着的故事。回忆挺好,十年不长不短,感谢你陪着我走过学生时代,感谢一路陪我走过坎坷。以为认识时间越长对彼此越了解就能够陪着彼此走更远的路,只是遗憾后来发现你所懂得的不过是年少时候的我,而我也只是贪恋当时那种被你保护的感觉。断了联系的你和我,免使年少,光阴虚过。我知道你恨我,也知道你曾讨厌固执的我,但却不可否定你真的宠过我。感谢十年间隙的你,感谢被你爱
遍历dom 并且存储(将每一层的DOM元素存在数组中)
换个号韩国红果果
JavaScript html
数组从0开始!!
var a=[],i=0;
for(var j=0;j<30;j++){
a[j]=[];//数组里套数组,且第i层存储在第a[i]中
}
function walkDOM(n){
do{
if(n.nodeType!==3)//筛选去除#text类型
a[i].push(n);
//con
Android+Jquery Mobile学习系列(9)-总结和代码分享
白糖_
JQuery Mobile
目录导航
经过一个多月的边学习边练手,学会了Android基于Web开发的毛皮,其实开发过程中用Android原生API不是很多,更多的是HTML/Javascript/Css。
个人觉得基于WebView的Jquery Mobile开发有以下优点:
1、对于刚从Java Web转型过来的同学非常适合,只要懂得HTML开发就可以上手做事。
2、jquerym
impala参考资料
dayutianfei
impala
记录一些有用的Impala资料
1. 入门资料
>>官网翻译:
http://my.oschina.net/weiqingbin/blog?catalog=423691
2. 实用进阶
>>代码&架构分析:
Impala/Hive现状分析与前景展望:http
JAVA 静态变量与非静态变量初始化顺序之新解
周凡杨
java 静态 非静态 顺序
今天和同事争论一问题,关于静态变量与非静态变量的初始化顺序,谁先谁后,最终想整理出来!测试代码:
import java.util.Map;
public class T {
public static T t = new T();
private Map map = new HashMap();
public T(){
System.out.println(&quo
跳出iframe返回外层页面
g21121
iframe
在web开发过程中难免要用到iframe,但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中,这时我们就需要跳出这个iframe到达一个公共页面去。
首先跳转到一个中间页,这个页面用于判断是否在iframe中,在页面加载的过程中调用如下代码:
<script type="text/javascript">
//<!--
function
JAVA多线程监听JMS、MQ队列
510888780
java多线程
背景:消息队列中有非常多的消息需要处理,并且监听器onMessage()方法中的业务逻辑也相对比较复杂,为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列;2.使用一个监听器开启多线程监听。
对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子
布衣凌宇
spring mvc
第一步:导入需要的包;
第二步:配置web.xml文件
<?xml version="1.0" encoding="UTF-8"?>
<web-app version="2.5"
xmlns="http://java.sun.com/xml/ns/javaee"
xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer
aijuans
Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer,但是与后者相比,前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容,那么将使用上下文(配置的xml文件)中相应定义的值。如果properties文件中有bean属性的内容,那么就用properties文件中的值来代替上下
通过XSD验证XML
antlove
xml schema xsd validation SchemaFactory
1. XmlValidation.java
package xml.validation;
import java.io.InputStream;
import javax.xml.XMLConstants;
import javax.xml.transform.stream.StreamSource;
import javax.xml.validation.Schem
文本流与字符集
百合不是茶
PrintWrite()的使用 字符集名字 别名获取
文本数据的输入输出;
输入;数据流,缓冲流
输出;介绍向文本打印格式化的输出PrintWrite();
package 文本流;
import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置
bijian1013
ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时,传入的参数都用##标识,如下所示:
<resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO">
<res
java jvm常用命令工具——jdb命令(The Java Debugger)
bijian1013
java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试,里面包含了丰富的命令帮助您进行调试,它的功能和Sun studio里面所带的dbx非常相似,但 jdb是专门用来针对Java应用程序的。
现在应该说日常的开发中很少用到JDB了,因为现在的IDE已经帮我们封装好了,如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解
bit1129
controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解(http://bit1129.iteye.com/blog/2114084)中介绍了Autowired和Resource两个注解的功能,它们用于将依赖根据名称或者类型进行自动的注入,这简化了在XML中,依赖注入部分的XML的编写,但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配
bitray
super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改:
我们原来的代码
wsdl2java com.test.xxx -client http://.....
修改后的代
动态页面正文部分中文乱码排障一例
ronin47
公司网站一部分动态页面,早先使用apache+resin的架构运行,考虑到高并发访问下的响应性能问题,在前不久逐步开始用nginx替换掉了apache。 不过随后发现了一个问题,随意进入某一有分页的网页,第一页是正常的(因为静态化过了);点“下一页”,出来的页面两边正常,中间部分的标题、关键字等也正常,唯独每个标题下的正文无法正常显示。 因为有做过系统调整,所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面
bylijinnan
java
import java.util.Arrays;
import java.util.Random;
import ljn.help.Helper;
public class OddBeforeEven {
/**
* Q 54 调整数组顺序使奇数位于偶数前面
* 输入一个整数数组,调整数组中数字的顺序,使得所有奇数位于数组的前半部分,所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变
cfyme
网站架构
一个网站就像一个人,存在一个从小到大的过程。养一个网站和养一个人一样,不同时期需要不同的方法,不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1:积累是必不可少的
架构师不是一天练成的。
1999年,我作了一个个人主页,在学校内的虚拟空间,参加了一次主页大赛,几个DREAMWEAVER的页面,几个TABLE作布局,一个DB连接,几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么?
comsci
Gis
我们都知道一个事实,在行星内部的时候,因为地理信息的坐标都是相对固定的,所以我们获取一组GIS数据之后,就可以存储到硬盘中,长久使用。。。但是,请注意,这种经验在宇宙时代是不能够被继续使用的
宇宙是一个高维时空
详解create database命令
czmmiao
database
完整命令
CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话
datageek
1、人丑就该多读书。
2、你不快乐是因为:你可以像猪一样懒,却无法像只猪一样懒得心安理得。
3、如果你太在意别人的看法,那么你的生活将变成一件裤衩,别人放什么屁,你都得接着。
4、你的问题主要在于:读书不多而买书太多,读书太少又特爱思考,还他妈话痨。
5、与禽兽搏斗的三种结局:(1)、赢了,比禽兽还禽兽。(2)、输了,禽兽不如。(3)、平了,跟禽兽没两样。结论:选择正确的对手很重要。
6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误
dcj3sjt126com
PHP
原文地址:http://www.kafka0102.com/2010/08/281.html
因为需要,今天晚些在本机使用PHP做些测试,PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来,就报出类似下面的错误:“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes
dcj3sjt126com
ios
官方GUI
https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html
iOS中使用自动布局(一)
http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同,值不同】
梦见x光
sql 事务 批量执行
比如说:我有一个List需要添加到数据库中,那么我该如何通过PreparedStatement来操作呢?
public void addCustomerByCommit(Connection conn , List<Customer> customerList)
{
String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】
hanqunfeng
Linux常用命令
一.linux快捷键
Ctrl+C : 终止当前命令
Ctrl+S : 暂停屏幕输出
Ctrl+Q : 恢复屏幕输出
Ctrl+U : 删除当前行光标前的所有字符
Ctrl+Z : 挂起当前正在执行的进程
Ctrl+L : 清除终端屏幕,相当于clear
二.终端命令
clear : 清除终端屏幕
reset : 重置视窗,当屏幕编码混乱时使用
time com
NGINX
IXHONG
nginx
pcre 编译安装 nginx
conf/vhost/test.conf
upstream admin {
server 127.0.0.1:8080;
}
server {
listen 80;
&
设计模式--工厂模式
kerryg
设计模式
工厂方式模式分为三种:
1、普通工厂模式:建立一个工厂类,对实现了同一个接口的一些类进行实例的创建。
2、多个工厂方法的模式:就是对普通工厂方法模式的改进,在普通工厂方法模式中,如果传递的字符串出错,则不能正确创建对象,而多个工厂方法模式就是提供多个工厂方法,分别创建对象。
3、静态工厂方法模式:就是将上面的多个工厂方法模式里的方法置为静态,
Spring InitializingBean/init-method和DisposableBean/destroy-method
mx_xiehd
java spring bean xml
1.initializingBean/init-method
实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后,来执行初始化的工作,InitialzingBean仅仅指定了一个方法。
通常InitializingBean接口的使用是能够被避免的,(不鼓励使用,因为没有必要
解决Centos下vim粘贴内容格式混乱问题
qindongliang1922
centos vim
有时候,我们在向vim打开的一个xml,或者任意文件中,拷贝粘贴的代码时,格式莫名其毛的就混乱了,然后自己一个个再重新,把格式排列好,非常耗时,而且很不爽,那么有没有办法避免呢? 答案是肯定的,设置下缩进格式就可以了,非常简单: 在用户的根目录下 直接vi ~/.vimrc文件 然后将set pastetoggle=<F9> 写入这个文件中,保存退出,重新登录,
netty大并发请求问题
tianzhihehe
netty
多线程并发使用同一个channel
java.nio.BufferOverflowException: null
at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea]
at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode
wyz2009107220
NameNode
我们遇到的情况
Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。
我们的团队负责管理一个1200节点的集群(总大小12PB),目前是运行版本为Hadoop 0.20,transaction logs写入一个共享的NFS filer(注:NetApp NFS Filer)。
经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod