奔跑的犀牛先生

python3 爬虫相关学习9：BeautifulSoup 官方文档学习

目录

1 BeautifulSoup 官方文档

2 用bs 和 requests 打开本地html的区别：代码里的一段html内容

2.1 代码和运行结果

2.2 用beautiful 打开本地 html 文件

2.2.1 本地html文件

2.2.2 soup1=BeautifulSoup(html1,"lxml")

2.3 用requests打开本地 html 文件

2.3.1 本地html文件

2.3.2 print(html1)

3 用bs 和 requests 打开本地html的区别：一个独立的html文件

3.1 独立创建一个html文件

3.2 下面是新得代码和运行结果

3.3 用beautiful 打开本地 html 文件

3.3.1 语法差别 soup1=BeautifulSoup(open(path1))

3.4 用 read() 打开本地 html 文件

3.4.1 语法差别 with open(path1 ,"r") as f: 和 res=f.read()

3.5 用requests打开本地 html 文件

4 f.write(soup1.prettify()) 和 html 用 read()读出来差别很大

1 BeautifulSoup 官方文档

Beautiful Soup: We called him Tortoise because he taught us.https://www.crummy.com/software/BeautifulSoup/

Beautiful Soup 4.4.0 文档 — Beautiful Soup 4.2.0 中文文档https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/

Beautiful Soup 4.4.0 文档 — beautifulsoup 4.4.0q 文档https://beautifulsoup.readthedocs.io/zh_CN/latest/

2 用bs 和 requests 打开本地html的区别：代码里的一段html内容

2.1 代码和运行结果

#E:\work\FangCloudV2\personal_space\2learn\python3\py0003.txt

import requests
from bs4 import BeautifulSoup

#html文件内容
html1 = """
The Dormouse's story

The Dormouse's story

Once upon a time there were three little sisters; and their names were
Elsie,
Lacie and
Tillie;
and they lived at the bottom of a well.

...
"""

#"测试bs4"
print ("测试bs4")
soup1=BeautifulSoup(html1,"lxml")
print (soup1.prettify())

#"对比测试requests"
print ("对比测试requests")
#res=requests.get(html1)
res=html1
#print (res.text)
print (res)

2.2 用beautiful 打开本地 html 文件

#"测试bs4"

html1=""" ... """
print ("测试bs4")
soup1=BeautifulSoup(html1,"lxml")
print (soup1.prettify())

2.2.1 本地html文件

这次的本地html 文件是写在 python 脚本内容一起的一段文本
html1=""" ... """

2.2.2 soup1=BeautifulSoup(html1,"lxml")

正确写法
soup1=BeautifulSoup(html1,"lxml")
lxml 是解析方式
如果不写，默认也会采用 lxml的解析
如果写成 soup1=BeautifulSoup(html1) 可以正常运行，但是会提醒

lxml

html.parser

应该这几种都可以

2.3 用requests打开本地 html 文件

#"对比测试requests"
print ("对比测试requests")
#res=requests.get(html1)
res=html1
#print (res.text)
print (res)

2.3.1 本地html文件

这次的本地html 文件是写在 python 脚本内容一起的一段文本
html1=""" ... """
本地文件 html 已经是一段脚本内的文本 """ ..."""

2.3.2 print(html1)

本地文件 html 已经是一段脚本内的文本 """ ..."""

正确写法1
res=html1
print (res)

正确写法2
print (html1)

错误写法1
#print (res.text)
#print (html1.text)
只有html作为网页结构的时候，可以用 html.text 取到其中的string 内容
所以
requests.get(url)
requests.get(url).text

requests.exceptions.InvalidSchema: No connection adapters were found for 'The Dormouse\'s story\n\n

The Dormouse\'s story

\n\n

Once upon a time there were three little sisters; and their names were\nElsie,\nLacie and\nTillie;\nand they lived at the bottom of a well.

\n\n

...

\n'

错误写法2
#res=requests.get(html1)
一样的原因
因为这里的html1 不是网页，而已经是网页的内容string了！

AttributeError: 'str' object has no attribute 'text'

3 用bs 和 requests 打开本地html的区别：一个独立的html文件

3.1 独立创建一个html文件

3.2 下面是新得代码和运行结果

代码

#E:\work\FangCloudV2\personal_space\2learn\python3\py0003-1.txt
#E:\work\FangCloudV2\personal_space\2learn\python3\html0003.html


import requests
import os
import time
from bs4 import BeautifulSoup


path1=r"E:\work\FangCloudV2\personal_space\2learn\python3\html0003.html"
soup1=BeautifulSoup(open(path1))
print ("测试bs4")
print (soup1.prettify())

path2=r'E:\work\FangCloudV2\personal_space\2learn\python3\html0003-1.html'
if not os.path.exists(path2):              
    os.mkdir(path2) 

with open(path2 ,"a") as f:
    f.write("测试bs4")
    f.write(soup1.prettify())


print ("对比测试requests")
with open(path1 ,"r") as f:
    res=f.read()
print (res)

with open(path2 ,"a") as f:
    f.write("对比测试requests")
    f.write(res)



"""
#地址，路径，前都记得加 r, 因为string 内部包含\/等转义符，rawdata安全
url1="E:\work\FangCloudV2\personal_space\2learn\python3\html0003.html"
url1=r"E:\work\FangCloudV2\personal_space\2learn\python3\html0003.html"
res=requests.get(url1)
#本地地址不能像网址 url这样用，用的\/不同，即使用 raw r 也不行. 可以用转格式函数吗？
#https://www.baidu.com/
"""

运行结果

另存为的文件内容

3.3 用beautiful 打开本地 html 文件

3.3.1 语法差别 soup1=BeautifulSoup(open(path1))

最大的差别

soup1=BeautifulSoup(open(path1))
soup1.prettify() 输出格式化得内容

path1=r"E:\work\FangCloudV2\personal_space\2learn\python3\html0003.html"
soup1=BeautifulSoup(open(path1))
print ("测试bs4")
print (soup1.prettify())

path2=r'E:\work\FangCloudV2\personal_space\2learn\python3\html0003-1.html'
if not os.path.exists(path2):
os.mkdir(path2)

with open(path2 ,"a") as f:
f.write("测试bs4")
f.write(soup1.prettify())

3.4 用 read() 打开本地 html 文件

3.4.1 语法差别 with open(path1 ,"r") as f: 和 res=f.read()

和 read()读出来的内容（应该和 requests.get()得出来得内容一样）

print ("对比测试requests")
with open(path1 ,"r") as f:
res=f.read()
print (res)

with open(path2 ,"a") as f:
f.write("对比测试requests")
f.write(res)

3.5 用requests打开本地 html 文件

没试过
这种本体html没法试把？

4 f.write(soup1.prettify()) 和 html 用 read()读出来差别很大

和 read()读出来的内容（应该和 requests.get()得出来得内容一样）

soup1.prettify()

5 其他

soup1.text ? 全部文本内容？

soup1.a

soup1.find()

soup1.find_all()

soup1.

你可能感兴趣的:(爬虫,学习,beautifulsoup)

2019-8-12晚间日记故梦笙笙
今天是什么日子起床：7:00就寝：23:00天气：晴心情：一般纪念日：无叫我起床的不是闹钟是梦想年度目标及关键点：考博，毕业本月重要成果：无成功日志-记录三五件有收获的事务无财务检视正常人际的投入无开卷有益-学习/读书/听书无健康与饮食今日步数：14000今日锻炼：无今日饮食：正常好习惯打卡英语流利说打卡30分钟单词30
20211102成就感日志297/365 kidII
我是kid，这是我的18/365进化日课。20211102奋斗是人生的底色，你会经历很多人事物，学会更多的东西。从学习上掌握技能，从学习上享受生活，即便是辛苦也没有关系，生活没有不辛苦的，但是要辛苦的有意义。与其说平凡的过一辈子，不如吃苦耐劳，选择自己喜欢的生活，一点点的付出，积累很多的经验，未来才会有希望。虽然我们渴望成就感，但也需要平衡生活，让自己越来越幸福。1.【日思】：今日最重要的一件事。
OpenHarmony解读之设备认证：解密流程全揭秘陈乔布斯 HarmonyOS 鸿蒙开发 OpenHarmony harmonyos openHarmony 嵌入式硬件鸿蒙开发 respons
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）①鸿蒙应用开发与鸿蒙系统开发哪个更有前景？②嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~③对于大前端开发来说，转鸿蒙开发究竟是福还是祸？④鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？⑤记录一场鸿蒙开发岗位面试经历~⑥持续更新中……一、概述本文重点介绍客户端收到end响应消息之后的处理过程。二、源码分析这一模块的源码位于：/bas
前端学习笔记：React.js中state和props的区别和联系
文章目录1.`props`（属性）定义用途示例2.`state`（状态）定义用途示例3.核心区别4.常见使用场景props的场景state的场景5.交互模式父组件修改子组件状态子组件通知父组件6.最佳实践总结在React.js中，state和props是两个核心概念，用于管理组件的数据和数据流。它们的设计目的不同，但共同构成了React组件的状态管理系统。1.props（属性）定义外部传入的数据：
《道德经》学习第六十二天快乐大拙
图片发自App今日学习《道德经》天下篇的第六十七章“天下皆谓我道大”。本章指出，修道的关键在于要有“三宝”。其中，慈，是三宝之宝。有了慈，也就有了俭，有了不敢为天下先。【正文】天下皆谓我道大似不肖夫唯大故似不肖若肖久矣其细也夫！我有三宝持而保之：一曰慈二曰俭三曰不敢为天下先慈故能勇俭故能广不敢为天下先故能成器长今：舍慈且勇舍俭且广舍后且先死矣夫慈：以战则胜以守则固天将救之以慈卫之【直译】天下人都说
2018-05-04 赵廷芳
！一一日精进打卡2018年5月04姓名：赵廷芳企业名称：临沂鑫源研磨新材料有限公司组别241期利他2组【日精进打卡第199天】【知~学习】背诵六项精进2遍，大学2遍l【行~实践】一、修身：早起跑步锻炼身体二、齐家：早起送孩子上学三、建功：安排生产，组织发货【积善】：日行一善，【省~觉悟】是不是自私自利，有没有卑怯的举止。1.今天有点冲动，有了感性的烦恼，希望自己继续努力，努力向上提升，不要因为自己
Python你不知道的二三事（Python基础知识）日暮凡尘 python 开发语言
在上一篇中，我们介绍了Python解释器与编辑器的安装与使用，本次我们这是在进行Python程序的编译。我会根据我个人的学习进度进行更新，如有遗漏或错误，欢迎指正。变量与常量变量创建一个新的py文件，我们就可以开始编程了。关于变量，就是一些我们自定义的值，如a=10num=100其中a，num就是我所定义的变量，变量的命名较为自由，但也有一些规则需要遵守：1.变量由数字、字母、下划线（_）组成。n
三步解锁.NET Conf Student Zone：免费资源+实战项目全攻略！学生党必看！
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣.NETConfStudentZone三步称王第一步：注册与资源获取——“领取你的魔法钥匙”目标：用StudentZone的免费资源，告别“资源散落”困境。步骤1：注册账号（1分钟搞定！）//模拟注册流程（伪代码，实际需访问官网）stringemail="yo
《一本小小的红色写作书》｜学会这些写作原则，你也能写出10万+ 襟怀高远
两年前，我因为产前抑郁，每天写清晨日记，梳理自己的心灵成长和育儿生活感悟。写着写着，我就爱上了书写，可是我没有学习过写作方法，文笔虽然不错，但是写出来的文章主题不突出，内容混乱，缺乏条理性。于是开始报名各种写作课，以为这样就可以解决问题，但是依然写不出一篇主题分明、条理清晰、论证充分的出彩文章。学了很多写作技巧，下笔依然灵感枯竭。读了很多文笔优美的文章或书，语言依然繁冗。直到遇到了《一本小小的红色
《班主任微创意》学习所记五则瑾言_lw999
（一）人与人间,如果首先是“看不惯”，然后关系就会生疏，变成“看不懂”，等两个人生疏了后，互相就会“看不起”，这样会越来越生疏,其实这样已“看不远”了，最后你们的关系就会“来不及”了。任何人不可能脱离集体而独自存在。请多多帮助别人，赠人玫瑰，手留余香!刘宇航马上说:“老师，学习上的问题也是这样的。我们不喜欢哪个科目，先是看不惯，然后慢慢就看不懂，就越来越不喜欢这一科，就成了看不起，其实这个时候我们
摘暗裔咓嫟
（1）“读”加“写”。在掌握了50音图及一些基础发音之后，就要开始学习背诵词汇。背词时建议大家边写边读，写和读都可以加深对词汇的印象。读的时候要注意长音、促音和声调，这些地方经常被大家忽略，如果这些地方读错，可能就会变成另外一个单词。（2）在积累的同时，掌握规律。词汇量积累到一定程度的时候，词汇的背诵速度会越来越快，因为你会发现其实词汇的读音是有一些规律的。比如日语汉字结构相似，或者读音相同的汉字
好好学习，能上天——献给六一儿童节的金凤凰（王朝和） 2db504f9317c
今天是六一儿童节，祝普天下的儿童们好好学习，健康成长！要问好好学习，能干嘛？告诉你——能上天！最近，云南省保山市施甸县桃关镇的大山里飞出了金凤凰，他的名字叫桂海潮，很值得少年儿童学习。2023年5月30日，神舟16号载人飞船发射取得圆满成功。在这次进入太空的三名飞行员中，桂海潮是中国执行载人飞行任务的首位载荷专家，是中国唯一戴眼镜执行飞行任务的航天员，是首个非军人出身的航天员，也是中国首位最年轻飞
深入TA-Lib：量化技术指标详解
深入TA-Lib：量化技术指标详解本文系统讲解TA-Lib技术指标分析，涵盖基础、数据处理、趋势与动量指标、均量线、布林线等，并结合Python代码与大数据、机器学习实战案例，助力读者掌握量化交易实战技巧。本文系统梳理了TA-Lib技术指标分析的核心内容，包括TA-Lib基础、数据处理、趋势与动量指标、均量线、布林线等关键技术指标分析方法，并结合Python代码示例与大数据、机器学习的融合实战案例
天文图像处理：星系分类与天体定位 xcLeigh 计算机视觉CV 图像处理分类人工智能 AI 计算机视觉
天文图像处理：星系分类与天体定位一、前言二、天文图像处理基础2.1天文图像的获取2.2天文图像的格式2.3天文图像处理的基本流程三、天文图像预处理3.1去噪处理3.2平场校正3.3偏置校正四、星系分类4.1星系的分类体系4.2基于特征提取的星系分类方法4.3基于深度学习的星系分类方法五、天体定位5.1天体坐标系统5.2基于星图匹配的天体定位方法5.3基于深度学习的天体定位方法六、总结与展望致读者一
【python做接口测试的学习记录day6——pytest+yaml+allure自动化测试框架之URL拼接】小丫么小二郎~ 学习 pytest python 功能测试测试工具
在之前的测试框架中，可以发现的是，我们的yaml数据中所有的url中的除了路径不同外，其余都是相同的，我们想办法将这一部分自动化，这样的yaml中写用例url的时候就不用再每次都写上域名，只需要输入路径即可首先我们需要更改下之前的用例yaml文件中的url，将域名删除只留下路径即可，例如：接下来我们在根目录创建一个config.yam文件，用于存储我们的URL中的公共部分，这里由于公司相关，我隐藏
【python做接口测试的学习记录day9——pytest自动化测试框架之yaml数据驱动封装】小丫么小二郎~ pytest python pycharm 接口测试用例
之前我们的框架中，如果有多个测试用例，则需要在yaml文件中写入多个用例，而每个用例可能不同的仅仅只是个别参数值，这就导致很多重复代码，现在我们使用数据驱动就可以解决这个问题了。我依旧采用之前的登录接口为例，简单记录一下数据驱动封装的全过程一、DDT数据驱动yaml文件在根目录下创建包datas，用来存放我们的数据驱动yaml文件，在datas下新建一个get_token_data.yaml文件，
深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
2018-7-24 grace2039
一、学习与实践1.付出不亚于任何人的努力2.要谦虚，不要骄傲3.要每天反省4.活着，就要感谢5.积善行，思利他6.不要有感性的烦恼二、今日分享这几天财务部全体人员都在加班加点上传数据，因为系统不是很稳定，大家干一会儿后不得不陪着系统“休息”一下，听说昨天嵘姐在休息时一试系统可以操作了，于是自己马上抓紧录入，没顾得上通知其他人，过了一会儿被旁边的小伙伴发现后，大家都笑骂她吃独食，真是积极乐观的团队呀
2019.10.13 蚂蚁_caec
日精进打卡第203天姓名:李敏499期学员努力一组公司:上海缘缀包装材料有限公司【知～学习】《六项精进》1遍，共201遍；《大学》1遍，共201遍未背诵企业使命、愿景、价值观【经典名句分享】付出不亚于任何人的努力一、修身：练字调理身体纠正驼背垃圾分类反省养生二、齐家：与妈妈打电话与骆驼互道早安晚安与骆驼一起做饭三、建功：关注备案信息转发公众号文章关注公司活动沟通奖励票事宜四、【积善】：发愿从201
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
孩子厌学怎么办？怎么帮助孩子正确爱上学习？赖颂强讲孩子不上学
孩子厌学怎么办？怎么帮助孩子正确爱上学习？这是许多家长正在遭遇的难题，在这个问题上，很多家长尝试了多种办法，可都无法改掉孩子厌学的毛病。不仅如此，孩子除了厌学以外，甚至在家长的引导下更加讨厌学习，觉得是学习捆绑了自己的自由，学习剥夺了自己的快乐。那么到底有什么方法能让孩子正确地爱上学习呢？总能听到家长说自己的孩子最近不好好学习，成绩也不如以前优秀了，对学习没有兴趣，厌学。孩子厌学有哪些症状表现呢？
表态发言可爱婷好
何烊：.严格要求自己，强化教研，提高课堂效果黄磊：对领导，各科老师的肯定，英语老师课间抽几个学生进行指导，共同努力的结果。王康：讲故事，向敬佩的班主任学习脚踏实地，做好自己的事情，对学生真心负出，与学生关系好，创造一个舒适的学习环境，饭要一口一口的吃，事要一件一件的做，路要一步一步的走，踏实平稳地坚持下去，成功的把握好每"一步"的大小是成功的关键。李亦非：慈善之心太强赵件兵：对学生估计过高，重落实
穿过迷雾投资小白成长史
学习的内容就是1.如何去评估一项生意的价值2.如何看待市场价格的波动买入转机企业实现转机绝大部分会失败。行业很重要三组竞争优势：1.超低成本+诚实价格2.出色产品+优秀服务3.品质+品牌企业的护城河不是一直有。盖克保险营运成本低，波仙珠宝：控制成本支出，采购能力。短期目标和长期利益冲突，加宽护城河放在优先的地位。感觉现在对于保险是不是在中国跟多的考虑的是城市化进程对保险的影响，就是市场规模。资本支
Linux 系统进阶操作实践：目录管理与系统信息查看指南小任今晚几点睡 RHCSA linux 网络运维
文章摘要本文详细记录了Linux系统中通过Xshell远程管理的核心操作，包括系统信息查询、复杂目录结构创建与树形展示、多级目录快速生成、文件创建与删除、大文件制作等实践步骤。通过命令示例与输出解析，清晰呈现每一步操作的逻辑与效果，帮助读者掌握目录管理、系统信息查看及文件操作的实用技巧，适合Linux实操学习者参考。一、通过Xshell远程登录及系统信息查询使用Xshell通过root账户登录Li
畅远正面管教【爱的52种习惯】之21天践行打卡Day13~ 零花钱雪_8316
最早开始给孩子零花钱，主要目的是延迟满足，控制他每天路过好邻居都想买一个奇趣蛋的冲动。于是我们商定，每周有15元零花钱。他可以自己安排如何花，如果都用来买奇趣蛋，就只能买两次，如果用来买其他的小物件，也许有机会买更多东西。当然一开始很快把钱花光，会讨价还价，不行，我就要！这个时候是对父母的考验，尤其是有社会压力的情况下。让他从错误设想结果中学习的唯一方式，就是认可他们的感受，等待他平静下来，利用启
学点心理学，生活更健康上山打老虎_9cc7
心理学为我种下了一颗生命力的种子,那种感觉像有一颗绿色的种子在思想中疯狂地生长，长出枝干，长出绿叶，周围水气弥漫，给荒漠的心灵带来了水源和野性，原来光秃秃的山峦被一个个巨大的绿色触须拦腰穿过，暴风雨后，生机勃勃。这是学习《武志红的心理学课》后，我闭上眼睛脑中想到的画面。直观而震撼，心理学给了我很多地道、刁钻的角度来看待自己、看待生活、看待关系。我知道了过去我性格形成的原因，也知道了我那“含蓄”表达
如何从热恋走向婚姻结婚，并一直幸福？有才有闲
↑推荐阅读↑如何在荷尔蒙降低后还能保持甜蜜？爱情中的甜言蜜语和承诺，能不能在婚姻中兑现和延续，取决于双方会不会经营婚姻。只要会经营，还有可能超额完成任务。当然，还有个前提是双方都愿意并且会经营婚姻。（提示：婚姻经营是一门需要学习的学问）这里需要提到在一段关系中我们常说的四个时期：相爱期：大家用尽各种方法得到对方。热恋期：荷尔蒙爆发，粘在一起，什么都没法分开，越反对反而粘的越紧。磨合期：大多数人进入
易效能亲子时间管理践行第9天彼岸花践行日记
高效率慢生活就寝10:00早起6:30要有多自律就有多自由今日早起外面雾气漫天图片发自App第一个30天目标：孩子第一个30天目标：学会看清单妈妈第一个30天目标：每天写【今日青蛙】‍♀️早起写‍♀️参加天使班入门营毕业班会周打卡记录显示的起床时间比之前要早这个点早起时间还是不够用【健康】一杯五谷粉【学习】樊登读书会听书图片发自App【小确幸】由于开学初期较忙，新生还没有开始报名入园，只能先把宝贝
6月25日（第38天）三省吾身快乐姐星球
一.观人善（阳红梅老师）工作认真负责，性格直爽，有啥说啥，没心计，每天阳光灿烂，与人为善，对孩子很用心，很随和，很乐意助人二.察己过：天热心情烦躁三.日行一善：给朋友分享学校四.为学日益：学习临终安宁缓和医疗课程五.为道日损：天热对学生多一点耐心六.感恩:感恩秀田的自然万物,感恩学校的学生让我有机会种福田,感恩梁老师做了好吃的凉粉
新年舞步学习录迎恩
图片发自App听说过“鬼步舞”吧，是不是觉得是小青年的运动，动感的节奏配上烗酷的舞步，踢、点、旋转，跳起来极具喧染力，关健是能减肥。为了减掉爱人的大肚腩，终于在再次去市政府广场散步的时候报名加入。第一天，老师教我们基本小步，一开始就夸我俩姿势正确，学的快。嘿嘿，她不知道这之前我俩已在家就着视频自学了几次。抢跑了，当然上手比较快。只是步伐显的很笨重，好像全身的重量都压在腿上，一小会便会气喘吁吁，汗流
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他