程序员小羊！

用爬虫玩转石墨文档细解

您好，我是程序员小羊！

前言

石墨文档是一款受欢迎的在线协作工具，它允许多人实时编辑和共享文档。通过爬虫技术，我们可以自动化地获取石墨文档中的内容，进行数据分析或备份。不过，在使用爬虫技术时，务必遵循相关法律法规及服务条款，确保不违反用户隐私或服务协议。

一、爬虫概述与基础知识

爬虫，也称为网络蜘蛛，是一种自动化程序，用于访问网页并提取信息。常见的爬虫工具包括 Python 的 requests、BeautifulSoup、Scrapy 等。通过爬虫技术，我们可以从互联网上大量收集数据，进行信息提取、数据分析等工作。

1.1 HTTP 基础

爬虫的工作原理基于 HTTP 协议，主要使用 GET 和 POST 请求与服务器通信。理解 HTTP 请求的构造与响应是编写爬虫的基础。以下是一个简单的 HTTP GET 请求示例：

import requests

response = requests.get('https://example.com')
print(response.text)

1.2 常见的反爬虫机制

许多网站会部署反爬虫机制，常见的手段包括：

User-Agent 过滤：通过检测请求头中的 User-Agent 字段，判断请求是否来自合法的浏览器。
IP 限制：限制单个 IP 地址的请求频率，防止爬虫通过大量请求获取数据。
验证码：要求用户输入验证码，以阻止自动化脚本。

为了规避这些反爬虫机制，我们可以随机化 User-Agent、使用代理 IP、或者尝试破解验证码（不过破解验证码可能违反服务协议，需谨慎使用）。

二、获取石墨文档内容

石墨文档虽然是一个在线文档工具，但它的内容是通过 Web 页面渲染的。我们可以通过分析 Web 页面的请求与响应，构建爬虫获取文档内容。

2.1 分析石墨文档的请求结构

首先，我们可以打开一个石墨文档，使用浏览器的开发者工具（通常是按 F12）来分析网络请求。找到加载文档内容的请求，通常是一个 GET 请求，URL 中包含文档的唯一标识符。

例如，某个文档的 URL 可能是：

https://shimo.im/docs/abcd1234

在浏览器中，我们可以看到文档内容的请求通常是一个 Ajax 请求，返回 JSON 或 HTML 数据。我们需要找到这个请求的 URL 模板，并通过爬虫程序构造请求。

2.2 模拟登录

有些石墨文档需要登录才能访问，这时我们需要模拟登录操作。模拟登录通常通过发送 POST 请求，附带用户名、密码等认证信息。成功登录后，服务器会返回一个 Session 或者 Token，我们需要在后续请求中携带这个认证信息。

以下是一个简单的模拟登录示例：

import requests

login_url = 'https://shimo.im/lizard-api/auth/password/login'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'
}
data = {
    'mobile': 'your_phone_number',
    'password': 'your_password'
}

session = requests.Session()
response = session.post(login_url, headers=headers, data=data)

if response.status_code == 200:
    print("Login successful!")
else:
    print("Login failed!")

登录成功后，session 对象会保存登录状态，后续的请求可以直接使用这个 session 对象。

2.3 获取文档内容

登录成功后，我们可以使用爬虫访问目标文档的 URL，并解析返回的内容。假设文档内容是以 JSON 格式返回的，我们可以使用 json 模块解析并提取信息。

doc_url = 'https://shimo.im/lizard-api/files/abcd1234/content'
response = session.get(doc_url, headers=headers)

if response.status_code == 200:
    content = response.json()
    print(content)
else:
    print("Failed to retrieve document content!")

三、数据解析与处理

获取到文档的原始数据后，我们可以根据需要对数据进行解析、处理和存储。常见的处理方式包括：

提取文本内容：如果文档内容以 HTML 格式返回，可以使用 BeautifulSoup 解析 HTML 并提取纯文本。
保存为本地文件：将文档内容保存为本地的 .txt 或 .md 文件，便于离线阅读或进一步分析。
数据分析：对文档内容进行文本分析，如词频统计、关键词提取等。

以下是使用 BeautifulSoup 提取文档纯文本的示例：

from bs4 import BeautifulSoup

html_content = response.text
soup = BeautifulSoup(html_content, 'html.parser')
text_content = soup.get_text()

with open('document.txt', 'w', encoding='utf-8') as f:
    f.write(text_content)

四、实际案例与注意事项

4.1 案例：备份石墨文档

假设我们想要定期备份某个石墨文档，可以编写一个定时任务，每天自动爬取文档内容并保存到本地。

import time

def backup_document():
    response = session.get(doc_url, headers=headers)
    if response.status_code == 200:
        html_content = response.text
        soup = BeautifulSoup(html_content, 'html.parser')
        text_content = soup.get_text()
        
        filename = time.strftime('%Y%m%d_%H%M%S') + '.txt'
        with open(filename, 'w', encoding='utf-8') as f:
            f.write(text_content)
        print(f"Document backed up as {filename}")
    else:
        print("Failed to retrieve document content!")

# 定时任务，每天备份一次
while True:
    backup_document()
    time.sleep(86400)  # 每隔24小时执行一次

4.2 注意事项

尊重隐私和版权：在爬取任何内容之前，请确保你有权访问和复制这些内容。未经授权抓取他人数据可能涉及法律问题。
避免过度抓取：请控制爬虫的抓取频率，避免对服务器造成过大压力，从而触发封禁或被视为恶意行为。
遵守网站的 robots.txt：许多网站通过 robots.txt 文件规定了禁止爬取的页面，尽量遵守这些规定。

五、结尾

通过爬虫技术，可以高效地获取石墨文档中的内容，进行自动化数据处理、备份或分析。在实施爬虫时，务必注意合法性和道德性，避免给目标网站带来不必要的负担或风险。

掌握了基本的爬虫原理和技术后，你可以根据实际需求进行调整和优化，充分发挥爬虫在数据收集与分析中的作用。

今天这篇文章就到这里了，大厦之成，非一木之材也；大海之阔，非一流之归也。感谢大家观看本文

你可能感兴趣的:(selenium自动化,爬虫,石墨文档)

spring boot 之整合 knife4j 在线接口文档我叫晨曦啊 spring boot spring boot 后端 java
pom依赖com.github.xiaoyminknife4j-spring-boot-starter3.0.3application.ymlknife4j:#开启增强功能enable:true#是否屏蔽生产环境production:true#设置是否开启账密验证以及账密，改为true后访问页面时需输入账密basic:enable:falseusername:adminpassword:admin
Spring框架详细教程文档 z小天才b Spring spring java 后端
目录1.Spring框架概述1.1什么是Spring框架1.2Spring的发展历程1.3Spring的核心特性1.3.1轻量级框架1.3.2控制反转(IoC)1.3.3面向切面编程(AOP)1.3.4容器功能1.4Spring的优势1.5Spring生态系统2.Spring核心概念2.1控制反转(IoC-InversionofControl)2.1.1什么是控制反转2.1.2控制反转的好处2.2
Linux部署MinIO与Spring Boot整合实战指南 luoqinqin linux spring boot 运维
一、MinIO简介与核心概念MinIO是一款高性能的分布式对象存储服务，兼容AmazonS3API，适用于存储图片、文档等非结构化数据。核心术语：Bucket：存储对象的容器（类似文件夹）Object：存储的基本单元（文件+元数据）AccessKey/SecretKey：身份验证凭证二、Linux环境MinIO部署1.单节点安装#下载二进制文件wgethttps://dl.min.io/serve
XML 命名空间 froginwe11 开发语言
XML命名空间引言XML（可扩展标记语言）是一种用于存储和传输数据的标记语言。在XML中，命名空间（Namespace）是一种用于区分不同元素和属性的方法，它有助于避免元素和属性名称的冲突，并提高XML文档的可维护性和互操作性。本文将深入探讨XML命名空间的概念、使用方法以及在实际应用中的重要性。命名空间的概念在XML中，命名空间是一个URI（统一资源标识符）字符串，用于标识一个元素或属性所属的命
Puppeteer 库简介：背景、用法与原理超级土豆粉 typescript javascript 前端 html 开发语言
Puppeteer库简介：背景、用法与原理一、背景Puppeteer是Google官方推出的一个Node.js库，最初于2017年发布。它为开发者提供了一个高级API，用于通过编程方式控制Chrome或Chromium浏览器。Puppeteer主要用于自动化网页操作、爬虫、UI测试、生成PDF截图等场景。随着Web自动化需求的增长，Puppeteer逐渐成为前端开发、测试和数据采集领域的重要工具。
pip方式安装MindSpore Ascend版本
pip方式安装MindSporeAscend版本参考：https://www.mindspore.cn/install/本文档介绍如何在Ascend环境的Linux系统上，使用pip方式快速安装MindSpore。安装MindSpore与依赖软件下表列出了安装MindSpore所需的系统环境和第三方依赖。软件名称版本作用Ubuntu18.04/CentOS7.6/EulerOS2.8/openEu
汇编语言：基于x86处理器（原书第7版）所有课后习题答案 Up to the mountain 汇编 masm
包含3-13章所有习题答案，覆盖率95%以上，除了意义不大和重复的，高难度题目我全做了包含vs2015工程，使用时将对应的习题拖到vs工程的源码底下，一次编译一个，如果莫名报错，请将文件名改成简单英文或数字名，如a31.asm---引用请注明出处---下载地址：汇编语言：基于x86处理器（原书第7版）所有课后习题答案_汇编语言基于x86处理器第七版课后答案-其它文档类资源-CSDN下载
《手把手教你》系列技巧篇（二十二）-java+ selenium自动化测试-webdriver处理浏览器多窗口切换上卷（详细教程）北京-宏哥 java selenium 测试工具开发语言自动化
1.简介上一篇讲解和分享了如何获取浏览器窗口的句柄，那么今天这一篇就是讲解获取后我们要做什么，就是利用获取的句柄进行浏览器窗口的切换来分别定位不同页面中的元素进行操作。2.为什么要切换窗口？Selenium在当前页面打开了新的窗口，此时就需要跳转到新的窗口去，就需要把窗口进行切换。宏哥这里简单举例一个测试场景，你在页面A点击一个连接，会在新的tab窗口打开页面B，这个时候，你在页面B点击一个连接，
Web-API-day1 DOM 文档对象模型码哥DFS 前端 javascript
获取DOM对象1.querySelector(")满足条件第一个元素2.querySelectorAll(")满足条件的元素集合返回伪数组3.了解其他方式1）getElementById2)getElementByTagname操作元素内容修改DOM文本内容1)innerText将文本内容添加/更细到任意标签位置，文本包含的标签不会被解析2)innerHTML将文本内容添加/更细到任意标签位置，文
【LLM】Llama-Index 架构 FOUR_A LLM llama 架构
数据源（DataSources）PDF/文档数据库API网页音频/视频知识库自定义源数据连接器（DataConnectors）用于从各种数据源提取和加载数据，以便进行索引和查询。1.SimpleDirectoryReader含义：简单目录读取器。功能：主要用于读取本地文件系统中的目录内容。它可以列出目录中的文件和子目录，通常用于文件管理或数据预处理阶段。例如，在一个数据处理项目中，你可能需要列出某
在WPF中使用CommunityToolkit.Mvvm——（一）为什么使用CommunityToolkit.Mvvm 永远的久远 wpf
前言阅读我文章的同学可能已经发现了，我总是会在一个系列文章的第一篇抛出问题，为什么要用到这个技术。因为一些成熟的库和技术会给我们带来生产力大幅的提升，同时通过学习一些优秀的开源项目，对我们个人的能力提升也会有帮助。接下来我们一起来看一下MVVMToolkit能为我们带来哪些惊喜～～CommunityToolkit.Mvvm是什么微软的官方文档这样介绍的CommunityToolkit.Mvvm包（
Java研学-MongoDB(三) 泰勒疯狂展开 #Java研学 java mongodb 开发语言
三文档相关7文档统计查询 ①语法：//精确统计文档数慢准dahuang>db.xiaohuang.countDocuments({条件})4//粗略统计文档数快大致准dahuang>db.xiaohuang.estimatedDocumentCount({条件})4 ②例子：//精确统计文档数name为奔波儿灞dahuang>db.xiaohuang.countDocuments({name:
【HarmonyOS】Web 组件的 PDF 文档预览功能详解
【HarmonyOS】Web组件的PDF文档预览功能详解一、前言应用开发中，PDF文档预览是一项常见需求。虽然官方提供了预览组件，但是在H5业务场景下，如何加载PDF呢？此时就需要Web组件提供了便捷的PDF预览能力。目前官方的ArkWeb，支持加载网络、应用沙箱内、本地资源等多种来源的PDF文档。本文将详细介绍如何使用Web组件实现PDF预览功能，包括不同场景下的加载方法、配置要点及动态切换技巧
Linux安装服务流程学习3人组 linux 运维服务器
1、Linux镜像下载2、最小版安装3、激活网卡4、激活SSH服务5、用本地XShell工具连接linux6、安装wget服务（本地传入，或者挂载ISO光盘镜像包）7、更新yum8、安装对应服务包smb（共享文档）VMware实现Linux访问CDRom光盘ISO镜像步骤：关闭虚拟机→右键选择“设置”→选择“CD/DVD”设备。勾选“启动时连接”→选择“使用ISO映像文件”→浏览并选择本地ISO文
【深度学习新浪潮】什么是上下文长度？小米玄戒Andrew 深度学习新浪潮深度学习人工智能 LLM 语言模型大模型模型优化上下文长度
大型语言模型（LLM）的上下文长度是指模型在处理当前输入时能够有效利用的历史文本长度，通常以token（如单词、子词或标点）为单位衡量。例如，GPT-4支持128Ktoken的上下文，而Llama4Scout甚至达到了10Mtoken的惊人规模。这一指标直接影响模型在长文档理解、多轮对话等复杂任务中的表现。一、上下文长度的合理范围上下文长度的选择需结合具体应用场景：日常对话：通常需要8K–32Kt
DeepSeek 帮助自己的工作
引言简述人工智能助手在职场中的普及趋势DeepSeek作为智能创作助手的核心功能概述DeepSeek的核心能力信息检索与整合：基于用户意图精准搜索并生成答案多场景应用：技术文档撰写、数据分析、代码生成等交互优化：遵循用户指定的格式与内容规范职场应用场景与实操案例技术文档撰写自动生成API文档框架根据需求补充技术细节示例代码块与公式的规范化输出数据分析支持快速检索行业数据并生成可视化建议数学建模中的
移动开发领域小程序的用户增长与留存策略移动开发前沿移动端开发宝典小程序 ai
移动开发领域小程序的用户增长与留存策略关键词：移动开发、小程序、用户增长、用户留存、策略摘要：本文聚焦于移动开发领域小程序的用户增长与留存策略。随着移动互联网的迅猛发展，小程序凭借其便捷性等优势在市场中占据重要地位。文章首先介绍小程序发展背景、研究目的与范围、预期读者、文档结构及相关术语；接着阐述小程序核心概念及生态系统架构；详细分析用户增长和留存的算法原理、数学模型及公式；通过项目实战展示代码实
python中的字符串操作北北大王 python 开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、字符串基础1.创建字符串2.字符串拼接二、字符串常用方法1.大小写转换2.字符串查找3.字符串替换4.字符串分割与连接5.字符串格式化6.字符串填充三、字符串与列表转换四、字符串切片操作前言Python字符串作为最基础且强大的数据类型之一，提供了全面而灵活的文本处理能力。从基础的创建与拼接，到高效的查找替换；从智能的大
【学习教程】遥感、GIS和GPS技术在水文、气象、灾害、生态、环境及卫生等领域中的应用
【内容简介】：第一讲3S技术及软件简介1.13S技术及应用案例文献解析1.23S技术软件（ArcGIS、ENVI）简介1.3如何快速掌握ArcGIS1.4ArcGIS界面及数据加载1.5文档保存方式第二讲ArcGIS数据管理2.1ArcGIS数据类型与数据结构2.2shapefile数据、个人地理数据库MDB和文件地理数据库GDB2.3地理空间数据建库的理论、方法和步骤2.4ArcGIS数据管理第
深入对比四大主流 JavaScript 包管理器：npm、Yarn、pnpm、Bun 止观止前端 javascript npm yarn pnpm Bun
引言在现代前端与Node.js开发中，包管理器（PackageManager）是构建高效工作流的关键工具，直接影响项目的安装速度、磁盘空间占用和团队协作效率。npm、Yarn、pnpm和Bun作为主流JavaScript包管理器，各有优劣。本文将基于权威资料（如npm官方文档、Yarn官方文档、pnpm官方文档、Bun官方文档），从核心原理、性能表现、依赖管理等维度进行深度解析，帮助开发者根据项目
软件项目中的静态缺陷是什么悟能不能悟 java
软件项目中的静态缺陷（StaticDefects）是指在不运行程序代码的情况下，通过分析源代码、配置文件或设计文档发现的代码质量问题或潜在风险。这类缺陷通常通过静态代码分析（StaticCodeAnalysis）工具（如SonarQube、ESLint、Checkstyle等）或人工代码审查识别。核心特点无需运行程序静态分析仅检查代码的结构和语法（例如变量定义、函数调用、控制流程），而不需要编译或
QueryBook常见问题解答：从查询失败到数据文档管理的完整指南汤力赛Frederica
QueryBook常见问题解答：从查询失败到数据文档管理的完整指南querybookQuerybookisaBigDataQueryingUI,combiningcollocatedtablemetadataandasimplenotebookinterface.项目地址:https://gitcode.com/gh_mirrors/qu/querybook查询执行问题排查当您在QueryBook
用matlab实现随机森林算法 showmethetime 算法 matlab 随机森林
用matlab实现随机森林算法，里面附有说明文档，参数可调节RandomForest_matlab/RandomForests/RF.mexw32,81920RandomForest_matlab/RandomForests/RF_demo.m,2536RandomForest_matlab/RandomForests/runRF.m,2616RandomForest_matlab/RandomF
前端全部文档 loodcover 任澎涛前端 xhtml javascript
HTML基础1.HTML文件中的DOCTYPE是什么作用？HTML超文本标记语言:是一个标记语言,就有对应的语法标准DOCTYPE即DocumentType，网页文件的文档类型标准。主要作用是告诉浏览器的解析器要使用哪种HTML规范或XHTML规范来解析页面。DOCTYPE需要放置在HTML文件的标签之前，如：...(目前主流)...(早期)2.HTML、XML、XHTML之间有什么区别？它们都属
前端技术博客汇总文档长路 ㅤ 文章目录汇总前端技术 HTML5 CSS3 JavaScript Vue.js
文章目录前言前端技术博客汇总链接基础知识点HTMLCSSJavaScript基础语法ES6语法扩展知识点Ajax&Fetch与跨域请求Canvas模块化WebpackNode.jsvite框架与实战VueVue.jsVue-routerVuexvue-cli(脚手架)微信小程序性能提升开源生态组件使用资料获取前言博主介绍：✌目前全网粉丝4W+，csdn博客专家、Java领域优质创作者，博客之星、阿
企业和个人基于业务知识和代码库增强的大模型生成代码实践程序员
作者：京东零售杨亚龙1.源起李明是今年刚加入某互联网公司的研发新人，满怀期待地开始了他的职业生涯。然而，短短两周后，他的热情就被现实浇了一盆冷水。第一周：当他第一次接手需求时，mentor只是简单交代了几句：“这个功能之前做过类似的，你参考下历史代码。”可当他打开代码仓库，却发现注释寥寥，变量名像密码一样难懂，更找不到任何需求文档。他硬着头皮修改，结果上线后引发了线上故障——原来有个隐藏的业务规则
python读取pdf文档 reblue520
python读取txt#coding=utf-8importrequests#爬虫规则url="https://en.wikipedia.org/robots.txt"#读取网络资源res=requests.get(url).text#打印print(res)读取pdf#coding=utf-8frompdfminer.pdfparserimportPDFParser,PDFDocumentfro
python读取PDF常用库简要介绍乙龙 python python 开发语言
Python中用于读取PDF文件并识别文字的库有多种，以下是一些常用的库：PyPDF2：可以拆分、合并、旋转、裁剪PDF页面，提取文本和元数据。pdfminer.six：高精度提取文本、图像和表格，支持复杂布局和字体。ReportLab：创建包含文本、图像、图形和表格的复杂PDF文档。PyMuPDF(fitz)：提取文本和图像，处理页面、注释和书签，渲染PDF页面。pdfplumber：高精度提取
RocketMQ-on-DLedge自动容灾切换集群搭建学亮编程手记后台编程 rocketmq
DledgerDledger快速搭建前言DLedger是一套基于Raft协议的分布式日志存储组件，部署RocketMQ时可以根据需要选择使用DLeger来替换原生的副本存储机制。本文档主要介绍如何快速构建和部署基于DLedger的可以自动容灾切换的RocketMQ集群。1.源码构建构建分为两个部分，需要先构建DLedger，然后构建RocketMQ。1.1构建DLedger$gitclonehtt
选择元素的基本方法
在百度自动输入关键词：如何使用Selenium定位和操作网页元素在使用Selenium自动化测试或数据采集时，一个常见任务就是模拟人在浏览器中输入关键词进行搜索。比如，我们希望在百度搜索框中输入“白月黑羽”并执行搜索。这类操作本质上是“控制网页中的界面元素”。操作网页元素的前提：先“定位”它们Selenium控制网页的第一步，是定位我们要操作的元素。也就是说，在输入、点击之前，必须让程序知道我们想
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他