理想年薪百万

【趣味案例】Python 教你 4 行代码开发新闻网站通用爬虫

GNE（GeneralNewsExtractor）是一个通用新闻网站正文抽取模块，输入一篇新闻网页的 HTML，输出正文内容、标题、作者、发布时间、正文中的图片地址和正文所在的标签源代码。GNE在提取今日头条、网易新闻、游民星空、观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻等数百个中文新闻网站上效果非常出色，几乎能够达到100%的准确率。

使用方式非常简单：

from gne import GeneralNewsExtractor

extractor = GeneralNewsExtractor()
html = '网站源代码'
result = extractor.extract(html)
print(result)

GNE 的输入是经过 js 渲染以后的 HTML 代码，所以 GNE 可以配合Selenium 或者 Pyppeteer 使用。

下图是 GNE 配合 Selenium 实现的一个 Demo：

对应的代码为：

import time
from gne import GeneralNewsExtractor
from selenium.webdriver import Chrome

driver = Chrome('./chromedriver')
driver.get('https://www.toutiao.com/a6766986211736158727/')
time.sleep(3)
extractor = GeneralNewsExtractor()
result = extractor.extract(driver.page_source)
print(result)

下图是 GNE 配合 Pyppeteer 实现的 Demo：

对应代码如下：

在学习过程中有什么不懂得可以加我的
python学习资源qun，855408893
群里有不错的学习视频教程、开发工具与电子书籍。
与你分享python企业当下人才需求及怎么从零基础学习好python，和学习什么内容 

import asyncio
from gne import GeneralNewsExtractor
from pyppeteer import launch

async def main():
    browser = await launch(executablePath='/Applications/Google Chrome.app/Contents/MacOS/Google Chrome')
    page = await browser.newPage()
    await page.goto('https://news.163.com/20/0101/17/F1QS286R000187R2.html')
    extractor = GeneralNewsExtractor()
    result = extractor.extract(await page.content())
    print(result)
    input('检查完成以后回到这里按下任意键')

asyncio.run(main())

如何安装 GNE

现在你可以直接使用 pip 安装 GNE 了：

pip install gne

如果访问pypi 官方源太慢，你也可以使用网易源：

pip install gne -i https://mirrors.163.com/pypi/simple/

安装过程如下图所示：

功能特性

获取正文源代码

在extract()方法只传入网页源代码，不添加任何额外参数时，GNE 返回如下字段：

title：新闻标题
publish_time：新闻发布时间
author：新闻作者
content：新闻正文
images: 正文中的图片（相对路径或者绝对路径）

可能有些朋友希望获取新闻正文所在标签的源代码，此时可以给extract()方法传入with_body_html参数，设置为 True：

extractor = GeneralNewsExtractor()
extractor.extract(html, with_body_html=True)

返回数据中将会增加一个字段body_html，它的值就是正文对应的 HTML 源代码。

运行效果如下图所示：

总是返回图片的绝对路径

默认情况下，如果新闻中的图片使用的是相对路径，那么 GNE 返回的images字段对应的值也是图片相对路径的列表。

如果你想始终让 GNE 返回绝对路径，那么你可以给extract()方法增加host参数，这个参数的值是图片的域名，例如：

extractor = GeneralNewsExtractor()
extractor.extract(html, host='https://www.kingname.info')

这样，如果新闻中的图片是/images/pic.png，那么 GNE 返回时会自动把它变为https://www.kingname.info/images/pic.png。

指定新闻标题所在的 XPath

GNE 预定义了一组 XPath 和正则表达式用于提取新闻的标题。但某些特殊的新闻网站可能无法提取标题，此时，你可以给extract()方法指定title_xpath参数，用于提取新闻标题：

extractor = GeneralNewsExtractor()
extractor.extract(html, title_xpath='//title/text()')

提前移除噪声标签

某些新闻下面可能会存在长篇大论的评论，这些评论看起来比新闻正文“更像”正文，为了防止他们干扰新闻的提取，可以通过给extract()方法传入noise_node_list参数，提前把这些噪声节点移除。noise_node_list的值是一个列表，里面是一个或多个 XPath：

extractor = GeneralNewsExtractor()
extractor.extract(html, noise_node_list=['//div[@class="comment-list"]', '//*[@style="display:none"]'])

使用配置文件

API 中的参数 title_xpath、 host、 noise_node_list、 with_body_html除了直接写到 extract()方法中外，还可以通过一个配置文件来设置。

请在项目的根目录创建一个文件 .gne，配置文件可以用 YAML 格式，也可以使用 JSON 格式。

YAML 格式配置文件


title:
   xpath: //title/text()
host: https://www.xxx.com
noise_node_list:
   - //div[@class=\"comment-list\"]
   - //*[@style=\"display:none\"]
with_body_html: true

JSON 格式配置文件

{
   "title": {
       "xpath": "//title/text()"
   },
   "host": "https://www.xxx.com",
   "noise_node_list": ["//div[@class=\"comment-list\"]",
                       "//*[@style=\"display:none\"]"],
   "with_body_html": true
}

这两种写法是完全等价的。

配置文件与 extract() 方法的参数一样，并不是所有字段都需要提供。你可以组合填写你需要的字段。

如果一个参数，既在 extract() 方法中，又在 .gne 配置文件中，但值不一样，那么 extract() 方法中的这个参数的优先级更高。

FAQ

GeneralNewsExtractor(以下简称GNE)是爬虫吗？

GNE不是爬虫，它的项目名称General News Extractor表示通用新闻抽取器。它的输入是HTML，输出是一个包含新闻标题，新闻正文，作者，发布时间的字典。你需要自行设法获取目标网页的HTML。

GNE 现在不会，将来也不会提供请求网页的功能。

GNE支持翻页吗？

GNE不支持翻页。因为GNE不会提供网页请求的功能，所以你需要自行获取每一页的HTML，并分别传递给GNE。

GNE支持哪些版本的Python？

不小于Python 3.6.0

我用requests/Scrapy获取的HTML传入GNE，为什么不能提取正文？

GNE是基于HTML来提取正文的，所以传入的HTML一定要是经过JavaScript渲染以后的HTML。而requests和Scrapy获取的只是JavaScript渲染之前的源代码，所以无法正确提取。

另外，有一些网页，例如今日头条，它的新闻正文实际上是以JSON格式直接写在网页源代码的，当页面在浏览器上面打开的时候，JavaScript把源代码里面的正文解析为HTML。这种情况下，你在Chrome上面就看不到Ajax请求。

所以建议你使用Puppeteer/Pyppeteer/Selenium之类的工具获取经过渲染的HTML再传入GNE。

对Python感兴趣或者是正在学习的小伙伴，可以加入我们的Python学习扣qun：855408893 ，从0基础的python脚本到web开发、爬虫、django、数据挖掘数据分析等，0基础到项目实战的资料都有整理。送给每一位python的小伙伴！每晚分享一些学习的方法和需要注意的小细节，学习路线规划，利用编程赚外快。点击加入我们的 python学习圈

GNE 支持非新闻类网站吗（例如博客、论坛……）

不支持。

你可能感兴趣的:(python,编程语言,爬虫,Python爬虫,web开发)

Python 机器学习基础之【常用机器学习库】 NumPy 数值计算库仙魁XAN Python 机器学习基础+实战案例 python 机器学习 numpy 数值计算
Python机器学习基础之【常用机器学习库】NumPy数值计算库目录Python机器学习基础之【常用机器学习库】NumPy数值计算库一、简单介绍二、Numpy基础1、安装NumPy2、导入NumPy3、创建数组4、数组操作5、常用函数6、矩阵运算7、广播机制8、随机数三、在机器学习中使用到Numpy的简单示例1、数据预处理1.1数据归一化1.2数据标准化2、特征工程1.1多项式特征3、简单线性回归
Python中的heapq介绍余弦的倒数 Python 学习笔记 python 开发语言
heapq是Python标准库中的一个模块，专门用于处理堆数据结构，它提供了一些非常便捷的函数来操作最小堆（元素按照从小到大的顺序排列，堆顶元素最小），以下是详细介绍：1.主要函数heapify(iterable)：功能：将一个可迭代对象就地转化为堆结构。这个操作的时间复杂度是O(n)O(n)O(n)，其中nnn是可迭代对象的元素个数。示例：importheapqmy_list=[3,1,4,1,
Numpy进阶第3关：Numpy迭代数组叶清歌数据分析 python
本关任务：利用本关相关知识，将一个ndarray类型的数组，顺时针旋转90度后输出。相关知识NumPy迭代器对象numpy.nditer提供了一种灵活访问一个或者多个数组元素的方式。利用nditer对象可以实现完成访问数组中的每一个元素，这项最基本的功能，使用标准的Python迭代器接口，可以逐个访问每一个元素。In:x=np.arange(6).reshape(2,3)In:foryinnp.n
（python）在一个Python文件中从位于该文件所在文件夹外的另一个文件导入函数或类 ZhangTao_zata python 开发语言
☆问题描述假设有如下目录结构project/│├──utils.py│└──subfolder/└──myfile.py在这种情况下，utils.py文件位于subfolder文件夹的外面。要从myfile.py中导入utils.py中的内容★解决方案要在一个Python文件中从位于该文件所在文件夹外的另一个文件导入函数或类，你需要确保两个文件都在Python的搜索路径中。假设你有如下的目录结构：
python引入另外一个文件中的函数 serve the people 日常琐问 python java 前端
在Python中，可以通过import语句引入另一个文件中的函数。下面是具体的步骤和示例：准备两个Python文件文件1：utils.py这是定义了函数的文件，假设它包含一个简单的函数：utils.pydefgreet(name):returnf"Hello,{name}!"文件2：main.py在这个文件中，我们将引入utils.py中的greet函数并使用它。main.py引入utils.py
python中的迭代器和生成器争xx鸣 python 迭代器生成器
自学python过程中会遗漏一些东西，当初看书的时候碰到这些都跳过了，在一次面试中被问到了生成器，才意识到它在使用中的重要性，然后重新翻回去看了书并总结如下。1、迭代器（Iterator）在Python中的for循环使用的就是迭代器的机制，与C语言的循环有所不同。由于使用了迭代器，for循环除了支持常见的序列（元组、列表）外，还支持字典和文件对象。对于任何的可迭代对象都有一个iter方法，使用it
深入理解Python中的生成器与迭代器：概念、区别与实战应用清水白石008 python Python题库开源软件 python 开发语言
深入理解Python中的生成器与迭代器：概念、区别与实战应用开篇在Python编程世界中，生成器（Generators）和迭代器（Iterators）是两个核心概念，它们在处理大型数据集、节省内存以及实现高效循环结构方面扮演着至关重要的角色。本文旨在通过详尽的介绍和实例解析，帮助开发者们全面理解和掌握这两种机制，并能够灵活运用到实际开发中。一、迭代器（Iterators）的基本概念迭代器是一种设计
Python中的迭代器：深入理解与实践应用傻啦嘿哟关于python那些事儿 python android 开发语言 1024程序员节
一、引言在Python编程语言中，迭代器（Iterator）是一种特殊类型的对象，它允许我们遍历数据集合（如列表、元组、字典等）中的每一个元素，而无需了解集合的底层实现细节。迭代器提供了一种统一的方法来访问集合中的元素，使得代码更加简洁、易读，并且能够高效地处理大量数据。本文将深入探讨Python中迭代器的概念、工作原理、实现方式以及实际应用案例，旨在帮助新手朋友全面理解并掌握迭代器的使用技巧。二
Leetcode ---119. 杨辉三角 II（数组） Zrf@ Leetcode 数组
119.杨辉三角II给定一个非负索引k，其中k≤33，返回杨辉三角的第k行。在杨辉三角中，每个数是它左上方和右上方的数的和。示例1：输入:3输出:[1,3,3,1]python思路：与杨辉三角的思路一致。classSolution:defgetRow(self,rowIndex:int)->List[int]:yh=[[]]*(rowIndex+1)forrowinrange(len(yh)):y
Python中的迭代器与生成器程序猿-张益达 Python进阶 python 开发语言
Python中的迭代器与生成器在Python中存在两种好用的功能：迭代器与生成器。以list容器为例，在使用该容器迭代一组数据时，必须事先将所有数据存储到容器中，才能开始迭代；而生成器却不同，它可以实现在迭代的同时生成元素。也就是说，对于可以用某种算法推算得到的多个数据，生成器并不会一次性生成它们，而是什么时候需要，才什么时候生成。迭代器迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一
使用brew报错:Bad credentials/GitHub API Error: API rate limit exceeded for weixin_33868027 git php python
2019独角兽企业重金招聘Python工程师标准>>>背景描述XHProf是一个轻量级的PHP性能分析工具.使用XHProf的时候，在点击[ViewFullCallgraph]查看结果分析图时，会报错，原因是缺少graphviz绘图软件。在使用brew安装graphviz软件出现了一些错误，特此记录一下.具体内容首先使用brew搜索是否存在graphviz软件，报错：$brewsearchgrap
什么是 Next.js 中的代码分割？如何提升性能？ javascript前端
CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读什么是Next.js中的代码拆分？它如何提升性能？代码拆分是现代Web开发中一个重要的性能优化技术，特别是在Next.js应用中。代码拆分的核心思想是将应用的代码分解成更小、更易管理的部分，并在需要时动态加载这些部分。通过减少应用的初始加载时间，这一技术显著提升了性能和用户体验。在本文中，我们将深入探讨代码拆分的概念、它在Next.
Python进阶————迭代器与生成器记得多吃点 Python进阶知识 python 开发语言
迭代器与生成器前言一、迭代器二、生成器2.1创建生成器的两种方式2.1.1生成器推导式2.1.2yield关键字2.2使用生成器生成批次数据三、区别与联系3.1区别3.2联系总结前言我们之前学习遍历的时候，系统会一下子给我们显示所有的数据，我们希望当我们需要数据的时候再给我们数据，那么，我们就需要迭代器与生成器的帮助。迭代器和生成器在Python中都是用来处理数据序列的重要工具，它们之间的主要区别
Python中的【迭代器】和【生成器】 Matthew575 Python python 开发语言
Python是一门被多层语法糖包装的编程语言，用户使用起来容易上手。但若不了解其底层机制，就无法精通其语言。最近研究了Python中的迭代器和生成器迭代器迭代是访问集合元素的一种方式，在Python中，迭代是通过for…in…语句来完成的。在Python中，可直接作用于for循环的对象都称为可迭代对象（Iterable），而可以作用于for循环的数据类型有以下两类：一类是集合数据类型，比如常见的s
Python Qt6快速入门-图形视图(Graphics View) 视觉与物联智能 Python编程实例 python pyqt6 qt6 GUI 开发语言
图形视图(GraphicsView)文章目录图形视图(GraphicsView)1、GraphicsView架构1.1场景(Scene)1.2视图(View)1.3项目(Item)2、GraphicsView坐标系统2.1项目坐标2.2场景坐标2.3视图坐标2.4坐标映射3、QGraphicsView使用实例GraphicsView提供了一个用于管理大量定制2D图形项目并与之交互的界面，以及一个用
爬虫守则--写爬虫，不犯法 Erfec
玩爬虫，技术当然是中立的，浏览了因为爬虫被捕入狱的案例，自己总结了如下爬虫守则，不吃牢饭！1、爬虫速度不要太快，不要给对方服务器造成太大压力2、爬虫不要伪造VIP，绕过对方身份验证，你可以真的买一个VIP做自动化，这没问题3、公民个人信息不要去碰4、爬取的数据不能用于盈利5、爬虫是模拟人，不要做人不能做到的事情
python入门教程jupyter_Jupyter Notebooks的安装和使用介绍 weixin_39953618
最近又开始重新学习Python，学习中使用到了一款编辑器JupyterNotebooks，非常想安利给初学python的同学。注：本文内容仅针对windows环境下安装和配置JupyterNotebooks。1.JupyterNotebooks简介国际惯例还是来一段官方的介绍：Notebooks其实就像是你的python笔记本一样，不仅可以运行书写的python代码，同时还支持markdown格式
第03课：Anaconda 与 Jupyter Notebook 红色石头Will 深度学习 PyTorch 极简入门人工智能深度学习 PyTorch
本文将为大家介绍深度学习实战非常重要的两个工具：Anaconda和JupyterNotebook。Anaconda为什么选择Anaconda我们知道Python是人工智能的首选语言。为了更好、更方便地使用Python来编写深度学习相关程序，可以使用集成开发环境或集成管理系统，最流行的比如PyCharm和Anaconda。本文我推荐使用Anaconda。之所以选择Anaconda，是因为Anacon
php软件开发--laravel框架周先森开发 laravel laravel
lv6开发测试站点：http://lv6.gqqf.xyz/admin/index/indexcomposer简介及安装：composer是PHP中用来管理依赖关系的工具一句话，composer是一个工具，是为php项目准备的软件管家。laravel简介，安装，目录结构，运行：PHPWeb开发框架compsoser下载laravel：composercreate-project--prefer-d
Python程序员爬取大量视频资源，最终面临刑期2年的惩罚！夜色恬静一人 python 爬虫开发语言 Python
Python程序员爬取大量视频资源，最终面临刑期2年的惩罚！近日，一名Python程序员因为涉嫌大规模爬取视频资源而被判处2年有期徒刑。这个案例引起了广泛的关注，也引发了对于网络爬虫合法性和道德问题的讨论。据了解，这名程序员利用Python编程语言开发了一套自动化爬虫工具，通过抓取网站上的视频链接，批量下载了超过13万部视频资源。这些资源包括电影、电视剧以及其他各种类型的视频内容。然而，尽管他成功
【PHP】Laravel 介绍史上最优雅的 PHP 框架 Ustinian_310 laravel php
1.Laravel介绍Laravel是一个开源的PHPWeb应用框架，由TaylorOtwell创建并于2011年6月首次发布。它遵循模型-视图-控制器（MVC）架构模式，旨在简化Web开发的任务，提供了一套丰富的功能，帮助开发者快速构建安全、可扩展的Web应用程序。附注：文末附有Laravel的社区入口，感兴趣的小伙伴可以去社区寻找更多学习资料以下是Laravel的一些主要特点和组件：核心特点M
PyDeequ库在AWS EMR启动集群中数据质量检查功能的配置方法和实现代码 weixin_30777913 python spark 大数据云计算 aws
PyDeequ是一个基于ApacheSpark的PythonAPI，专门用于定义和执行“数据单元测试”，从而在大规模数据集中测量数据质量。PyDeequ框架在PySpark代码中提供了全面的数据质量检查功能，能够帮助用户&有效地监控和提升大规模数据集的数据质量。它在PySpark代码中的数据质量检查功能主要包括以下几个方面：核心组件指标计算（MetricsComputation）：利用分析器（An
python实现简单的二维有限元计算成田日上曾经笔记 python 悬臂梁有限元结构力学
有限元算法依据常见的有限元法教材，简单复现悬臂梁在重力作用下的形变（为了变形更明显，重力大小扩大了10倍），还没来得及写注释。【卧槽快跑，没注释！】节点是随机函数撒的点，完全没有优化；meshpy库中的Delauny优化算法计算得到三角单元；pygame实现图形绘制，图形如下（文字是自己后来写上去的）：importnumpyasnpimportcopyimportpygame,sysfrompyg
Python报错：PermissionError: [Errno 13] Permission denied解决方案详解：642 python 开发语言
写项目时候出现了PermissionError:[Errno13]Permissiondenied:'C:\\Users\\lenovo\\AppData\\Local\\Temp\\tmpjbuaiz4w.wav'错误，测试了一下发现是项目中音频的错误，下方是测试代码frompydubimportAudioSegmentfrompydub.playbackimportplayaudio=Audi
01-ESP32开发的多语言选择及适用场景总结薇憨 ESP32学习经验篇开发语言嵌入式硬件
ESP32可以通过多种编程语言进行开发，最常见的包括：1.C/C++（ArduinoIDE）ArduinoIDE是开发ESP32的最流行的工具之一。通过使用Arduino框架和C/C++编程语言，开发者可以快速地编写、编译和上传代码。使用Arduino库的好处是有丰富的社区支持，许多库和示例代码使得上手开发非常方便。2.EspressifIDF（C/C++）EspressifIoTDevelopm
yolov8使用Python训练识别枫林古月 YOLO从零开始 YOLO python 开发语言
环境要求:根据《yolov8训练环境搭建》搭建好运行环境参考文献:1、yolo官方文档python版本：https://docs.ultralytics.com/usage/python/2、github文档https://github.com/ultralytics/ultralytics/blob/main/README.zh-CN.md3、标定源数据的生成使用labelImg来标定类别,输出
设计转换Apache Hive的HQL语句为Snowflake SQL语句的Python程序方法 weixin_30777913 python 数据仓库 hive sql
首先，根据以下各类HQL语句的基本实例和官方文档记录的这些命令语句各种参数设置，得到各种HQL语句的完整实例，然后在Snowflake的官方文档找到它们对应的SnowflakeSQL语句，建立起对应的关系表。在这个过程中要注意HQL语句和SnowflakeSQL语句的区别，比如Hive可以给单个用户加权限，但是Snowflake数据仓库是RBAC，也就是基于角色的权限控制，所以HQL语句中给用户加
【Python百日基础系列】Day25 - 真机安装Ubuntu20.04服务器版 + Mysql8 岳涛@泰山医院 Dash python ubuntu
文章目录一、Ubuntu服务器版下载二、制作启动U盘，RAW写入三、笔记本真机安装Ubuntu20.04服务器版3.1设置笔记本U盘启动，插入启动U盘3.2检查安装文件完整性，需要一两分钟3.3选择语言3.4确认语言和布局3.5确认网络连接3.6输入代理地址，默认空着就行3.7确认服务器地址，默认就行3.8设置磁盘，默认就行3.9再次确认磁盘分区，默认就行3.10输入用户名、电脑名和密码3.11安
C# 实现 “Hello World” 教程来恩1003 C#从入门到精通 c#java 开发语言 .NET .net
.NET学习资料.NET学习资料.NET学习资料C#作为一种广泛应用于.NET开发的编程语言，以其简洁、高效和类型安全等特性，深受开发者喜爱。在踏入C#编程领域时，编写经典的“HelloWorld”程序是重要的起点，它能帮助我们快速熟悉C#的开发流程与基本语法。下面，就让我们一同开启C#的“HelloWorld”之旅。一、开发环境搭建要编写C#程序，首先需要安装合适的开发环境。微软官方提供的Vis
Erpnext安装人间不值得T皿T 开源项目 python erp 开源项目 javascript
Erpnext安装环境要求Ubuntu23.04x86_64Python3.10.12pip23.0.1nodev18.16.0npm9.5.1yarn1.22.22MariaDB10.11.2Redis7.0.8wkhtmltox0.12.6.1bench5.22.6环境安装Reids安装//安装7.0.8也可不指定版本直接执行sudoaptinstallredis-serversudoapti
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他