zgclark

python开发的 dht网络爬虫

使用 libtorrent 的python绑定库实现一个dht网络爬虫，抓取dht网络中的磁力链接。

dht 网络简介

p2p网络

在P2P网络中，通过种子文件下载资源时，要知道资源在P2P网络中哪些计算机中，这些传输资源的计算机称作peer。在传统的P2P网络中，使用tracker服务器跟踪资源的peer。要下载资源，首先需要取得这些peer。

dht网络

tracker服务器面临一些版权和法律问题。于是出现了DHT，它把tracker上的资源peer信息分散到了整个网络中。dht网络是由分布式节点构成，节点(node)是实现了DHT协议的p2p客户端。P2P客户端程序既是peer也是node。DHT网络有多种算法，常用的有 Kademlia。

dht网络下载

P2P客户端使用种子文件下载资源时，如果没有tracker服务器，它就向DHT网络查询资源的peer列表，然后从peer下载资源。

Magnet是磁力链接

资源的标识在DHT网络中称为infohash，是一个通过sha1算法得到的20字节长的字符串。infohash是使用种子文件的文件描述信息计算得到。磁力链接是把infohash编码成16进制字符串得到。P2P客户端使用磁力链接，下载资源的种子文件，然后根据种子文件下载资源。

Kademlia 算法

Kademlia是DHT网络的一种实现，具体的算法参见：DHT协议

KRPC 协议

KRPC 是节点之间的交互协议，使用UDP来传送。

包括4种请求：ping，find_node，get_peer，announce_peer。其中get_peer和announce_peer是节点间查询资源的主要消息。

dht 爬虫原理

主要的思路就是伪装为p2p客户端，加入dht网络，收集dht网络中的get_peer和announce_peer消息，这些消息是其他node发送给伪装的p2p客户端的udp消息。

本文dht爬虫的实现

爬虫运行环境

linux 系统
python 2.7
libtorrent 库的python绑定
twisted 网络库
防火墙开启固定的udp和tcp端口

libtorrent 库的介绍

libtorrent库是p2p下载的客户端库，有丰富的接口，可以用来开发下载p2p网络上的资源。它有python的绑定库，本爬虫就是使用它的python库开发的。

在libtorrent中有几个概念需要解释下。 session 相当于p2p客户端，session开启一个tcp和一个udp端口，用来与其他p2p客户端交换数据。可以在一个进程内定义多个session，也就是多个p2p客户端，来加快收集速度。

alert是libtorrent中用来收集各种消息的队列，每个session都有一个自己的alert消息队列。KRPC协议的get_peer和announce_peer消息也是从这个队列中获取，就是用这两个消息收集磁力链接的。

主要实现代码

爬虫实现的主要代码比较简单

# 事件通知处理函数
    def _handle_alerts(self, session, alerts):
        while len(alerts):
            alert = alerts.pop()
            # 获取dht_announce_alert和dht_get_peer_alert消息
            # 从这两消息收集磁力链接
            if isinstance(alert, lt.add_torrent_alert):
                alert.handle.set_upload_limit(self._torrent_upload_limit)
                alert.handle.set_download_limit(self._torrent_download_limit)
            elif isinstance(alert, lt.dht_announce_alert):
                info_hash = alert.info_hash.to_string().encode('hex')
                if info_hash in self._meta_list:
                    self._meta_list[info_hash] += 1
                else:
                    self._meta_list[info_hash] = 1
                    self._current_meta_count += 1
            elif isinstance(alert, lt.dht_get_peers_alert):
                info_hash = alert.info_hash.to_string().encode('hex')
                if info_hash in self._meta_list:
                    self._meta_list[info_hash] += 1
                else:
                    self._infohash_queue_from_getpeers.append(info_hash)
                    self._meta_list[info_hash] = 1
                    self._current_meta_count += 1

    def start_work(self):
        '''主工作循环，检查消息，显示状态'''
        # 清理屏幕
        begin_time = time.time()
        show_interval = self._delay_interval
        while True:
            for session in self._sessions:
                session.post_torrent_updates()
                # 从队列中获取信息
                self._handle_alerts(session, session.pop_alerts())
            time.sleep(self._sleep_time)
            if show_interval > 0:
                show_interval -= 1
                continue
            show_interval = self._delay_interval

            # 统计信息显示
            show_content = ['torrents:']
            interval = time.time() - begin_time
            show_content.append('  pid: %s' % os.getpid())
            show_content.append('  time: %s' %
                                time.strftime('%Y-%m-%d %H:%M:%S'))
            show_content.append('  run time: %s' % self._get_runtime(interval))
            show_content.append('  start port: %d' % self._start_port)
            show_content.append('  collect session num: %d' %
                                len(self._sessions))
            show_content.append('  info hash nums from get peers: %d' %
                                len(self._infohash_queue_from_getpeers))
            show_content.append('  torrent collection rate: %f /minute' %
                                (self._current_meta_count * 60 / interval))
            show_content.append('  current torrent count: %d' %
                                self._current_meta_count)
            show_content.append('  total torrent count: %d' %
                                len(self._meta_list))
            show_content.append('\n')

            # 存储运行状态到文件
            try:
                with open(self._stat_file, 'wb') as f:
                    f.write('\n'.join(show_content))
                with open(self._result_file, 'wb') as f:
                    json.dump(self._meta_list, f)
            except Exception as err:
                pass

            # 测试是否到达退出时间
            if interval >= self._exit_time:
                # stop
                break

            # 每天结束备份结果文件
            self._backup_result()

        # 销毁p2p客户端
        for session in self._sessions:
            torrents = session.get_torrents()
            for torrent in torrents:
                session.remove_torrent(torrent)

运行效率

在我的一台512M内存，单cpu机器上。爬虫刚开始运行稍慢，运行几分钟后收集速度稳定在 180个每分钟，1小时采集10000左右。

运行状态

run times: 12

torrents:
  pid: 11480  time: 2014-08-18 22:45:01
  run time: day: 0, hour: 0, minute: 12, second: 25
  start port: 32900
  collect session num: 20
  info hash nums from get peers: 2222
  torrent collection rate: 179.098480 /minute
  current torrent count: 2224
  total torrent count: 58037

爬虫完整代码

完整的代码参见：https://github.com/blueskyz/DHTCrawler

还包括一个基于twisted的监控进程，用来查看爬虫状态，在爬虫进程退出后重新启动。

原文链接：python开发的 dht网络爬虫

你可能感兴趣的:(python,磁力链接,libtorrent,dht网络爬虫)

【MongoDB】MongoDb的“not master and slaveok=false”错误及解决方法 weixin_30900589 数据库 shell
链接mongodb报错如下2016-03-14T16:26:00.912+0800EQUERY[thread1]Error:listDatabasesfailed:{"ok":0,"errmsg":"notmasterandslaveOk=false","code":13435}:_getErrorWithCode@src/mongo/shell/utils.js:23:13Mongo.proto
【MongoDB】MongoDb的“not master and slaveok=false”错误及解决方法 mongo连接从库出现问题... weixin_33782386 数据库 shell php
链接mongodb报错如下2016-03-14T16:26:00.912+0800EQUERY[thread1]Error:listDatabasesfailed:{"ok":0,"errmsg":"notmasterandslaveOk=false","code":13435}:_getErrorWithCode@src/mongo/shell/utils.js:23:13Mongo.proto
MongoDb的“not master and slaveok=false”错误及解决方法 chen88358323 DB mongo
原文链接在SECONDARY查询出发现如下错误：SECONDARY>showcollections;SatAug415:29:00uncaughtexception:error:{"$err":"notmasterandslaveok=false","code":13435}这是正常的，因为SECONDARY是不允许读写的，如果非要解决，方法如下：SECONDARY>rs.slaveOk();
python的django后台管理_python3 django-admin 初始化后台管理项目(mysql) weixin_39582737
环境和工具python3djangomysqlPyCharm$python3--versionPython3.7.0$django-admin--version2.2python3和django安装django初始化项目使用django-admin来初始化一个项目$django-adminstartprojectmydjango$cdmydjango$tree.├──manage.py#与该Dja
Django之admin后台管理除却巫山不是云@ django python 后端
admin配置步骤：1.创建后台管理账号输入命令pythonmanage.pycreatesuperuser之后，设置用户名，密码，邮箱。输入命令pythonmanage.pyrunserver启动项目，打开127.0.0.1:8000/admin/进入后台管理界面，截图如下：输入设置的用户名和密码即可登录。如下所示：
open3d python 分割多个平面黄晓魚 halcon3d PCL点云处理深度神经网络点云处理 PCL库 Open3D库 Point++模型使用平面算法 open3d python
测试效果废话在Open3D中，detect_planar_patches方法用于从点云数据中检测平面区域（或称为平面补丁）。这个方法通过分析点云中各点之间的法线向量和方向性来识别具有相似法线向量的点群，从而识别出潜在的平面区域。下面是对你给出的代码行中各个参数的解释：normal_variance_threshold_deg:法线向量方差阈值（以度为单位）。这个参数设定了允许的点云中法线向量方向变
Django中的超级管理员相关操作胜天半月子 Web django 数据库 python
超级管理员操作场景描述添加超级管理员删除超级管理员更改超级管理员名称场景描述在进行管理员操作的时候，密码忘记，导致超级管理员无法使用，因此网上搜索相关操作，进行总结记录相关操作都是在控制台完成Terminal添加超级管理员pythonmanage.pycreatesuperuser(就是createsuperuser连接在一起)删除超级管理员pythonmanage.pyshellfromdjan
关于vs一个项目提示main被多次引用的解决方法 _DT9825 c++开发语言 visual studio ide
错误信息如图首先，在VisualStudio中遇到“多个main函数被引用”的报错，通常是因为同一个项目中存在多个包含main函数（程序入口点）的源文件。原因这是由于C/C++程序的入口规则，每个可执行程序（如.exe）必须且只能有一个入口点（即main函数）。如果项目中多个文件定义了main函数，编译器在链接阶段会因冲突而报错。第二个就是项目结构问题，VisualStudio默认将同一项目下的所
从热搜趋势到交易策略：Level2逐笔成交数据的应用之道银河金融数据库 level2逐笔成交逐笔委托区块链金融数据库 python
从热搜趋势到交易策略：Level2逐笔成交数据的应用之道为了促进学习和研究，我们在此分享一部分匿名处理的股票level2逐笔委托逐笔成交历史行情数据集。股票level2逐笔委托逐笔成交历史行情数据集链接:https://pan.baidu.com/s/1jSeHGNOs8akYsFfjs9WMSw?pwd=crfj提取码:crfj请注意，分享这些数据的目的是为了教育和研究，不构成任何投资建议。关键
Django后台新建管理员木制品123 Django django sqlite 数据库
在Django中，新建管理员用户通常涉及使用Django自带的命令行工具manage.py。以下是具体步骤：前提条件Django项目已创建：确保你已经创建了一个Django项目和应用。数据库已迁移：确保你已经运行了pythonmanage.pymigrate来应用所有数据库迁移。步骤启动开发服务器（可选）：虽然这一步不是必须的，但启动开发服务器可以帮助你确认项目是否正常运行。bash复制代码pyt
容器运行常见数据库树下一少年数据库数据库 opengauss oceanbase postgresql dm v8 mysql
一.涉及镜像压缩包均为amd架构版本：mysql:5.7.42、postgres:13.16、dm8:20250206_rev257733_x86_rh6_64、oceanbase-ce:v4.0、opengauss:5.0.2通过网盘分享的文件：db.tgz链接:https://pan.baidu.com/s/1EBbFPZj1FxCA4_GxjVunWg?pwd=563s提取码:563s二.m
《Python制作动态爱心粒子特效》后端工匠之道 Python爱心代码 python pygame 开发语言 python表白初学者入门生活爱心代码
一、实现思路粒子效果：–使用Pygame模拟粒子运动，粒子会以爱心的轨迹分布并运动。爱心公式：爱心的数学公式：x=16sin3(t),y=13cos(t)−5cos(2t)−2cos(3t)−cos(4t)参数tt的范围决定爱心形状。动态效果：粒子会从爱心轨迹出发，模拟旋转或扩散运动。二、完整代码后台私信三、运行效果运行代码后，你将看到：粒子围绕爱心形状分布，并不断扩散。爱心形状动态出现，粒子会随
选择开发代码审计工具的编程语言需要结合具体场景和技术需求，不同语言在性能、生态、开发效率等方面各有优劣 rockmelodies python 代码复审网络安全安全架构
选择开发代码审计工具的编程语言需要结合具体场景和技术需求，不同语言在性能、生态、开发效率等方面各有优劣。以下是主要语言的对比及适用场景：1.Python优势：快速开发：语法简洁，适合快速搭建原型或小型工具。文本处理：正则表达式和字符串操作能力极强，适合模式匹配（如漏洞规则扫描）。丰富生态：有Bandit、Semgrep（部分组件）等成熟工具的底层支持，可直接调用现成的安全分析库。跨语言支持：通过抽
python-推导式无铭-905
推导式推导式的定义：一、列表（list）推导式列表推导式的应用1、将lst中每一个元素进行平方后放入到一个新列表中2、求出lst中是奇数的值，然后放入到一个新列表中3、求列表中所有大于2的偶数进行平方计算4、将一个嵌套列表转换成一个一维列表5、现在有一列表lst=[[1,2,3],[4,5,6],[7,8,9]]要求出1/4/7和1/5/9元素6、面试题二、字典推导式字典推导式的应用1、将字典中的
java 反射创建对象作用_java反射机制(原理/应用场景/创建对象)详解文艺范理工生 java 反射创建对象作用
JAVA反射机制是在运行状态中，对于任意一个类，都能够知道这个类的所有属性和方法；对于任意一个对象，都能够调用它的任意方法和属性；这种动态获取信息以及动态调用对象方法的功能称为java语言的反射机制。JAVA反射(放射)机制：“程序运行时，允许改变程序结构或变量类型，这种语言称为动态语言”。从这个观点看，Perl，Python，Ruby是动态语言，C++，Java，C#不是动态语言。但是JAVA有
Anaconda下载库和本地下载库之间关系、达西先生 Anaconda linux
wherepython//确定本地使用的解释器路径D:\Anaconda\python.exeC:\Users\78630\AppData\Local\Microsoft\WindowsApps\python.exeC:\msys-2023\ucrt64\bin\python.exe我默认使用的是conda解释器，所以pip下载时，所有的东西会下载到Anaconda的lib\site-packag
MIE 1622H Portfolio Selection Strategies 后端
MIE1622H:Assignment1–Mean-VariancePortfolioSelectionStrategiesJanuary27,2025Due:Saturday,February15,2025,notlaterthan11:59p.m.UsePythonforallMIE1622Hassignments.Youshouldhandin:•Yourreport(pdffileandd
Python-推导式 caicai一一 python 开发语言
'''推导式：Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体根据得到的数据类型不同，分为：1、元组(tuple)推导式2、列表(list)推导式3、字典(dict)推导式4、集合(set)推导式''''''1、元组(tuple)推导式元素推导式可以利用range区间、元组、列表、字典和集合等数据类型，快速生成一个满足制定需求的元组基本格式：(out_e
Codeforces Round 1004（Div.2） B. Two Large Bags 补题 + 题解 python 查理零世 python 算法
B.TwoLargeBagshttps://codeforces.com/contest/2067/problem/B题目描述timelimitpertest:1secondmemorylimitpertest:256megabytesYouhavetwolargebagsofnumbers.Initially,thefirstbagcontainsnnnnumbers:a1,a2,…,ana_1
python小白的word转excel W~J~L python python
大概流程为：一、首先导入docx库以及xlwt库二、需要用到的文档的名称三、设置一个函数来写入excel，转为可识别通用的“utf8”，然后创建一个表格来将文档里的内容写入到表里去四、利用for循坏来设置表里多少个为一行五、在最后设置表的保存路径以及提示是否创建成功importdocximportxlwtdocFile="青年大学习.docx"defwrite_excel(path):doc=do
python 学习曲线函数_如何使用学习曲线来诊断你的LSTM模型的行为？（附代码）... weixin_39576066 python 学习曲线函数
LSTM是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。在自然语言处理、语言识别等一系列的应用上都取得了很好的效果。《LongShortTermMemoryNetworkswithPython》是澳大利亚机器学习专家JasonBrownlee的著作，里面详细介绍了LSTM模型的原理和使用。该书总共分为十四个章节，具体如下：第一章：什么是LSTMs？第二章：怎么样训练
python程序设计案例教程胡国胜第二章答案_Python程序设计案例教程长发在船头舞蹈
章Python基础知识1.1Python简介1.1.1Python语言特点1.1.2Python版本1.1.3Python语言的实现1.1.4安装Python1.2Python开发环境1.2.1启动IDLE1.2.2Python代码编辑器1.2.3个小程序习题1第2章数据类型2.1数值2.1.1数值类型2.1.2变量章Python基础知识1.1Python简介1.1.1Python语言特点1.1.
使用conda update python将python3.6更新到python3.7版本出现bug：苹果酱0567 面试题汇总与解析课程设计 spring boot layui 毕业设计 java
使用condaupdatepython将python3.6更新到python3.7版本出现bug：1）anacondanavigator无法打开，2）Jupyternotbook一直显示无法连接服务器解决办法：Anacondaprompt下操作：>condaupdate--lla>anaconda-navigator--resetqtpy.PythonQtError:NoQtbindingscou
15、Python面试题解析：列表推导式-条件推导与嵌套推导千层冷面 python python 开发语言
1.列表推导式简介列表推导式（ListComprehension）是Python中一种简洁的创建列表的方式。它允许我们通过一行代码生成列表，通常比传统的for循环更简洁、更易读。基本语法[表达式for元素in可迭代对象]表达式：对元素的处理逻辑。元素：从可迭代对象中取出的每个元素。可迭代对象：如列表、元组、字符串等。示例#生成0到9的平方列表squares=[x**2forxinrange(10)
【python】将word文档内容转换为excel表格师兄师兄怎么办 python word excel python
在日常工作中，我们经常需要将Word文档中的内容提取并转换为Excel表格，以便进行数据分析和处理。本文将介绍如何使用Python编写一个简单的程序，将Word文档中的内容转换为Excel表格。一.实例使用以下word文档作为例子：工具界面如下：第一个弹窗选择对应的文档后选择打开：第二个弹窗选择保存路径以及excel表格的名字：生成后的效果如下：二.环境准备我们将使用tkinter库创建一个图形用
Python中LLM的稀疏Transformer架构：Longformer与BigBird 二进制独立开发非纯粹GenAI GenAI与Python python transformer 架构开发语言分布式人工智能自然语言处理
文章目录1.Transformer架构的挑战2.稀疏Transformer架构的提出2.1Longformer2.1.1局部注意力2.1.2全局注意力2.1.3实现2.2BigBird2.2.1随机注意力2.2.2局部注意力2.2.3全局注意力2.2.4实现3.稀疏Transformer架构的优势4.稀疏Transformer架构的挑战5.未来发展方向5.1更高效的稀疏注意力机制5.2自适应稀疏注
POI按行读取word,并去掉属性标签内容：超链接 weixin_30535043
publicStringreadDoc(Filefile){StringBufferbuffer=newStringBuffer();InputStreaminput=null;WordExtractorextractor=null;String[]paragraphs=null;try{input=newFileInputStream(file);extractor=newWordExtract
【Pydantic】Pydantic：新的Python 数据验证库无糖气泡WU Python python
Python数据验证：PydanticPydantic简介Pydantic的主要特性Pydantic安装Pydantic使用Pydantic基本操作Field对象数据转换模型类转换为字典模型类转换为JSONPydantic简介Pydantic是一个在Python中用于数据验证和解析的第三方库。它提供了一种简单且直观的方式来定义数据模型，并使用这些模型对数据进行验证和转换。Pydantic的主要特性
一个财务做的python代码--PDF发票文件信息提取宾不可 pdf python 职场和发展
一、引言（我为什么做）随着国家不断推行数字发票，现在工作中越来越多的电子发票被收取和开具。这给财务人员高效登记大量发票信息提供了充足的环境。日常中，手动从每张发票中提取关键信息并录入Excel表格不仅耗时费力，还容易出错。本文提出了一种基于Python的自动化解决方案，该方案利用pdfplumber库从PDF格式的电子发票中提取文本信息，并结合正则表达式进行信息匹配和清洗，最后将整理好的数据自动写
Pydantic：强大的Python 数据验证库霍格沃兹测试开发学社 Python语法基础 python 开发语言单元测试
PydanticPydantic是一个在Python中用于数据验证和解析的第三方库。它提供了一种简单且直观的方式来定义数据模型，并使用这些模型对数据进行验证和转换。Pydantic的一些主要特性：类型注解：Pydantic使用类型注解来定义模型的字段类型。你可以使用Python内置的类型、自定义类型或者其他Pydantic提供的验证类型。数据验证：Pydantic自动根据模型定义进行数据验证。它会
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他