数学难

数据采集与数据预处理（python）概述（一）

一，数据采集的概念

在处理海量事务时，我们经常需要针对特定条件进行数据的精准获取，这一过程被称为数据采集。数据采集的核心在于从多样化的数据存储形式中，根据具体需求进行有针对性的数据提取。这些数据存储形式丰富多样，涵盖了从简单的文本文档到复杂的数据库系统，再到多媒体文件等多个领域。

常见的数据存储方式包括：

文件系统（File System）：
- 文本文档：TXT, DOC, PDF, XLS(Excel), CSV等。
- 二进制文件：图片（JPG, PNG, GIF等），音频（MP3, WAV等），视频（MP4, AVI等）。
关系型数据库（Relational Database Management System, RDBMS）：
- MySQL
- Oracle
- SQL Server
- PostgreSQL
- DB2
- SQLite
这些数据库使用表格（table）、行（row）和列（column）来组织数据，并通过SQL（结构化查询语言）进行数据操作。
非关系型数据库（NoSQL）：
- 键值存储（Key-Value Stores）：Redis, Memcached
- 文档数据库（Document Databases）：MongoDB, CouchDB
- 列式数据库（Column-Oriented Databases）：Cassandra, HBase
- 图数据库（Graph Databases）：Neo4j, Dgraph
- 面向对象的数据库（Object-Oriented Databases）：ObjectDB, db4o
非关系型数据库不依赖传统的表格结构，而是使用键值对、文档、列或图等结构来存储数据。
内存数据库（In-Memory Databases）：
- 这些数据库将数据存储在RAM中，以提供极快的访问速度。例如，SAP HANA, VoltDB。
分布式文件系统（Distributed File Systems）：
- Hadoop Distributed File System (HDFS)：常用于大数据处理场景。
- GlusterFS
- Ceph
对象存储（Object Storage）：
- Amazon S3
- Google Cloud Storage
- Alibaba Cloud OSS
- MinIO
对象存储将数据作为对象进行存储，每个对象都包含数据、元数据（描述数据的属性）和唯一的标识符。
块存储（Block Storage）：
- 传统的硬盘驱动器（HDD）和固态硬盘（SSD）
- SAN（存储区域网络）和NAS（网络附加存储）
云存储服务：
- 各大云服务提供商（如Amazon, Google, Microsoft, Alibaba）提供的云存储解决方案。
图形数据库（Graph Databases）：
- 除了上面提到的Neo4j和Dgraph，还有其他如OrientDB, TigerGraph等。
时间序列数据库（Time-Series Databases）：
- 用于存储时间序列数据的数据库，如InfluxDB, Prometheus, TimescaleDB等

数据采集不仅仅局限于上述提到的存储方式，它也可以通过网络爬虫等技术从互联网中抓取数据。网络爬虫是一种特定的数据采集技术，专门用于从互联网上自动收集信息。接下来，我们将重点关注网络中的数据获取技术，特别是网络爬虫的应用与实现。

二，网络爬虫的概念

网络爬虫（又称为网页蜘蛛、网络机器人、网页追逐者等）是一种自动化程序，它模拟人类在网页上的行为，通过发送HTTP请求获取网页内容，并解析网页内容以提取所需信息。以下是关于网络爬虫的详细介绍：

1. 定义与背景

定义：网络爬虫是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。
产生背景：随着网络的迅速发展，万维网成为大量信息的载体，如何有效地提取并利用这些信息成为一个巨大的挑战。网络爬虫的出现解决了这一问题，帮助人们从互联网上快速、高效地获取大量数据。

2. 工作原理

发送HTTP请求：网络爬虫使用HTTP协议与服务器进行通信，通过发送GET或POST等请求方法获取网页内容。
解析网页：爬虫程序会解析网页内容，提取出需要的元素（如标签、属性、文本等）。对于HTML页面，可以使用解析库（如BeautifulSoup、Jsoup）进行解析；对于其他类型的数据（如JSON、XML），则使用相应的解析方法。
存储数据：爬虫程序会将抓取到的数据进行处理和清洗，然后存储到数据库、文件或其他存储介质中，以备后续使用。常见的存储方式包括关系型数据库（如MySQL、PostgreSQL）、NoSQL数据库（如MongoDB、Redis）和文件（如CSV、JSON）。

3. 关键技术

链接跟踪：在抓取过程中，爬虫程序会遇到页面中的链接。为了获取更多相关的数据，爬虫程序会跟踪这些链接，递归地进行抓取。通常使用广度优先搜索或深度优先搜索算法来管理抓取队列和遍历链接。
反爬措施应对：为了防止被过度访问和保护数据安全，一些网站可能会采取反爬措施。为了应对这些措施，爬虫程序可能需要处理验证码、模拟用户行为、使用代理IP等技术手段。

4. 应用场景

搜索引擎：搜索引擎是网络爬虫最重要的应用场景之一。例如，谷歌、百度、必应等搜索引擎都利用网络爬虫技术从互联网上采集海量的数据。
舆情分析与监测：政府或企业通过网络爬虫技术自动采集论坛评论、在线博客、新闻媒体或微博等网站中的海量数据，进行舆情热点发掘和跟踪。
聚合平台：如返利网、慢慢买等聚合平台，运用网络爬虫技术采集电商平台上的商品信息，为用户提供价格比较和优惠信息。
出行类软件：如飞猪、携程、去哪儿等出行类应用，使用网络爬虫技术访问交通出行的官方售票网站，以获取余票信息并通知用户。

5. 注意事项

合法合规：在使用网络爬虫时，必须遵守相关法律法规，尊重网站的robots.txt协议，不得采集涉及个人隐私或商业机密的信息。
尊重网站权益：高频率地访问网站可能导致服务器压力增大，甚至瘫痪。因此，在使用网络爬虫时，应合理控制访问频率，避免对网站造成不必要的负担。

三，网络爬虫的分类

1. 按爬取范围划分

宽搜索爬虫：这是搜索引擎的核心，用于抓取互联网上的所有内容，以构建搜索索引数据。它们会尽可能地覆盖整个互联网，以提供广泛的搜索结果。
深搜索爬虫：它是指爬取特定网站的全部链接，可以深入网站中的所有内容。这种爬虫通常用于对特定网站进行深度分析和数据挖掘。
聚焦爬虫：它针对特定的网站或网页，专门爬取某个网站的特定内容。例如，聚焦爬虫可以用于抓取某家商家的产品信息、价格等。

2. 按爬取层次划分

表层爬虫：这种爬虫主要爬取表面的内容，如新闻标题、概要等。它们通常用于快速获取网页的概览信息。
深层爬虫：深层爬虫会抓取深层页面的内容，如新闻正文、用户评论等。这种爬虫能够提供更加详细和全面的信息。
综合爬虫：综合爬虫结合了表层爬虫和深层爬虫的特点，能够同时获取网页的概览信息和详细内容。

3. 按爬取频率划分

实时爬虫：实时爬虫会定时访问某个网站，如果发现网页内容发生变化，就立即进行抓取。这种爬虫通常用于实时监测新闻、社交媒体等动态内容。
定时爬虫：定时爬虫按一定的时间间隔爬取网页的内容，如每小时、每天或每周爬取一次。这种爬虫适用于需要定期获取数据的情况。
触发爬虫：触发爬虫在特定的条件下触发进行网页抓取操作，例如在某个页面上访问某次后继续保持跟踪访问等。

4. 按系统结构和实现技术划分

通用网络爬虫：这种爬虫一般用于搜索引擎，如Google、Bing等。其特点是速度快、覆盖面广，但可能会给某些网站带来不必要的访问负荷。
聚焦网络爬虫：也叫主题网络爬虫，它针对特定主题或需求进行爬取，如针对某个行业的新闻网站进行爬取。这种爬虫能够节省大量的服务器资源和带宽资源。
增量式网络爬虫：增量式网络爬虫只爬取最新更新的网页或内容发生变化的网页，避免重复爬取已经存在的网页。这种爬虫能够高效地更新数据。
深层网络爬虫：深层网络爬虫能够抓取深层页面的内容，如需要提交表单或登录后才能访问的页面。这种爬虫需要处理复杂的页面逻辑和验证机制。

5. 其他分类方式

分布式爬虫：这种爬虫可以将任务分配给不同的爬虫程序进行处理，从而加快爬取速度和提高效率。分布式爬虫具有可扩展性强、效率高等特点。
批量型网络爬虫：这种爬虫限制抓取的属性，包括抓取范围、特定目标、限制抓取时间、限制数据量以及限制抓取页面等。
垂直网络聚焦爬虫：可以理解为无限细化的增量网络爬虫，可以细致地对诸如行业、内容、发布时间、页面大小等很多因素进行筛选。

四，robots协议

Robots协议（也被称为爬虫协议、网络蜘蛛协议或网络爬虫排除标准），全称为“Robots Exclusion Protocol”，是网站与搜索引擎爬虫之间的一种协议机制。其核心目的是告诉搜索引擎爬虫哪些页面可以被抓取，哪些页面不能被抓取，以保护网站的隐私和安全。以下是对Robots协议的详细介绍：

1. 协议定义与背景

定义：Robots协议是一种指导网络爬虫（或称为网络蜘蛛、机器人）访问和抓取网页的协议。
背景：随着搜索引擎技术的发展，网络爬虫成为搜索引擎获取网页内容的主要手段。然而，有些网站出于安全和隐私的考虑，不希望所有内容都被搜索引擎收录。Robots协议应运而生，为网站和搜索引擎之间提供了一种平衡机制。

2. 协议作用

保护网站隐私：通过指令告知搜索引擎爬虫哪些页面可以被抓取，哪些页面应该排除在搜索结果之外。
节省服务器带宽：可以屏蔽一些网站中比较大的文件，如图片、音乐、视频等，以减轻服务器压力。
方便搜索引擎抓取：可以设置网站地图连接，方便引导蜘蛛爬取页面。

3. 协议实现方式

网站管理员可以在网站域名的根目录下放一个名为robots.txt的文本文件。这个文件使用任何常见的文本编辑器都可以创建和编辑。
robots.txt文件中可以指定不同的网络爬虫能访问的页面和禁止访问的页面，指定的页面由正则表达式表示。
例如，文件中的一条指令“Disallow: /admin/”表示禁止爬虫访问网站根目录下名为“admin”的目录及其子目录。

4. 注意事项

非强制执行力：虽然Robots协议为网站和搜索引擎之间提供了一种平衡机制，但它并不是一个防火墙，也没有强制执行力。搜索引擎完全可以忽视robots.txt文件去抓取网页的快照。
并非法律意义上的协议：Robots协议是一个君子协定，供业内人士自觉遵守，并不具备法律上的“协议”效力。

5. 违反Robots协议的风险

如果爬虫程序违反了Robots协议，可能会面临法律风险，如不正当竞争、非法获取计算机信息系统数据罪等。
此外，违反Robots协议还可能损害网站及用户的隐私数据，引发安全隐忧。

6. 总结

Robots协议是网站出于安全和隐私考虑而设置的一种机制，用于指导搜索引擎爬虫访问和抓取网页。它通过robots.txt文件告诉爬虫哪些页面可以被抓取，哪些页面不能被抓取。然而，Robots协议并不具备强制执行力，搜索引擎可以选择遵守或忽视该协议。因此，网站管理员在设置Robots协议时，应充分考虑其实际效果和潜在风险。

五，编写网络爬虫的流程

确定爬取目标：
- 在开始编写爬虫之前，需要明确爬取的目标，即要获取哪些数据以及数据的来源。
- 可以是特定网站的某个页面、整个网站的所有页面、特定关键词的搜索结果等。
发送HTTP请求获取网页内容：
- 爬虫需要通过发送HTTP请求来获取目标网页的内容。
- 常见的请求方法有GET和POST。GET请求用于获取数据，而POST请求则用于提交数据。
- 在Python中，可以使用requests、urllib等库来发送HTTP请求，并获取网页的响应。
解析网页内容：
- 获取到网页的响应后，需要对网页内容进行解析，提取需要的信息。
- 常用的网页解析库有BeautifulSoup、lxml等。
- 通过标签选择器、正则表达式等方法，可以定位和提取感兴趣的内容。
数据处理和存储：
- 在提取到需要的数据后，可以进行一些必要的数据处理，如数据清洗、格式转换等。
- 可以使用Python中的数据处理库，如pandas、numpy等进行处理。
- 最后将数据保存到本地文件（如CSV、JSON等）或数据库中，以备后续使用。
反爬虫策略应对：
- 为了限制爬虫对网站的访问，防止恶意爬取和数据滥用，网站会采取一些反爬虫策略。
- 常见的反爬虫策略包括设置验证码、限制访问频率、检测爬虫的User-Agent等。
- 为了顺利完成爬虫任务，需要应对这些反爬虫策略，可以使用代理IP、设置随机请求头等方法绕过检测。
优化和扩展：
- 在爬虫编写完成后，可以根据实际需求进行优化和扩展。
- 例如，可以使用多线程或异步IO来提高爬虫的抓取效率。
- 还可以设置定时任务，让爬虫自动定时执行，以定期获取网页数据。
测试和调试：
- 在编写和修改爬虫的过程中，需要不断进行测试和调试。
- 可以使用打印语句、日志记录等方式来查看爬虫的运行情况和错误信息。
- 根据测试结果，对爬虫进行相应的修改和优化。
遵守法律法规和道德准则：
- 在编写和使用爬虫时，需要遵守相关的法律法规和道德准则。
- 不得非法获取、存储、使用他人的个人信息或商业机密。
- 在爬取数据时，应尊重网站的版权和隐私政策。

六，静态网页与动态网页

1、静态网页

定义：静态网页是指没有后台数据库、不含程序代码、不与服务器发生数据交互的网页。它的内容在发布到网页服务器上后，无论是否有用户访问，都保持不变。
特点：
- 每个网页都有一个固定的URL，且URL通常以.htm、.html、.shtml等文件格式存储。
- 内容相对稳定，容易被搜索引擎检索。
- 交互性较差，功能限制较大。
- 更新和维护相对困难，需要手动修改网页文件。
适用场景：适用于内容更新较少、功能需求简单的展示型网站。

2、动态网页

定义：动态网页是与静态网页相对的一种网页编程技术。它的内容可以随时间、环境或数据库操作的结果而发生改变。动态网页实际上是服务器上的程序，在用户请求时返回生成的网页内容。
特点：
- 以数据库技术为基础，可以大大降低网站维护的工作量。
- 可以实现更多功能，如用户注册、登录、在线调查、用户管理、订单管理等。
- 网页URL的后缀通常以.aspx、.asp、.jsp、.php、.perl、.cgi等形式存在，并且在URL中可能包含“?”。
- 交互性强，用户体验好。
技术实现：动态网页结合了HTML以外的高级程序设计语言和数据库技术。常用的编程语言有Java、VB、VC等，而数据库技术则包括MySQL、Oracle等。
适用场景：适用于内容更新频繁、功能需求复杂的网站，如电子商务网站、社交网络等。

七，HTTP的OSI七层网络模型

物理层（Physical Layer）
- 负责传输比特流，包括电缆、光纤等传输介质和物理接口。
- 功能：编码和解码比特流，定义传输速率、传输距离等物理特性。
数据链路层（Data Link Layer）
- 负责将比特流组装为帧，并进行可靠的传输。
- 功能：帧的封装与解封装，差错检测和纠正，流量控制。
网络层（Network Layer）
- 负责实现不同网络之间的数据传输和路由选择。
- 功能：IP地址管理，路由选择，数据分组与转发。
传输层（Transport Layer）
- 负责实现可靠的数据传输和连接管理。
- 功能：建立端到端的逻辑连接，数据分段与重组，流量控制和拥塞控制。
- 与HTTP相关的传输层协议主要是TCP（传输控制协议）。
会话层（Session Layer）
- 负责建立、管理和终止会话。
- 功能：同步不同设备上的应用程序之间的对话，控制会话的持续时间。
表示层（Presentation Layer）
- 负责数据的格式转换和加密解密等功能。
- 功能：数据压缩和解压缩，数据加密和解密，数据格式转换。
应用层（Application Layer）
- 提供用户与网络的接口，负责处理特定应用的数据。
- 功能：提供网络服务和资源，如HTTP、FTP、SMTP等协议。
- HTTP协议位于应用层，它定义了如何包装数据、如何发送请求和接收响应等规则。

八，urllib模块在python网络爬虫的常用函数

在Python中，urllib模块是用于处理URL和HTTP请求的基础库之一。然而，自Python 3起，推荐使用urllib.request、urllib.error、urllib.parse等子模块来替代以前单一的urllib模块。以下是urllib模块（特别是urllib.request）在Python网络爬虫中常用的函数和方法：

urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)
- 主要用于打开一个URL并返回一个http.client.HTTPResponse对象，该对象可以像文件对象那样被读取。
- url：要打开的URL。
- data：如果提供，则将其发送为POST请求的主体。
- timeout：设置超时时间（秒）。
Request(url, data=None, headers={}, origin_req_host=None, unverifiable=False, method=None)
- 创建一个urllib.request.Request对象，该对象可以包含额外的请求头、请求方法等。
- 通常与urlopen一起使用，以发送具有自定义请求头和方法的HTTP请求。
install_opener(opener)
- 安装一个全局的URL打开器。这通常用于自定义请求的处理方式，例如通过代理、SSL证书验证等。
build_opener([handler, ...])
- 创建一个OpenerDirector对象，该对象可以处理URL请求。可以使用各种处理器（如代理处理器、HTTP重定向处理器等）来定制OpenerDirector。
urlretrieve(url, filename=None, reporthook=None, data=None)
- 从指定的URL下载数据，并将其保存到本地文件。
- url：要下载的URL。
- filename：保存文件的路径和名称。如果未提供，则使用URL中的文件名。
- reporthook：一个回调函数，用于报告下载进度。
- data：如果提供，则将其发送为POST请求的主体。
urlcleanup()
- 清除缓存的URL打开器。这通常不需要在常规代码中使用，但在某些情况下（如测试）可能很有用。
quote(string, safe='/', encoding=None, errors=None)
- 将字符串转换为URL安全的格式。这通常用于将字符串作为URL的一部分（如查询参数）时。
unquote(string, encoding='utf-8', errors='replace')
- 对URL编码的字符串进行解码。

请注意，虽然urllib模块提供了基本的URL处理功能，但对于更复杂的网络爬虫任务，如并发请求、会话保持、Cookie处理等，可能需要使用更高级的库，如requests。

九，用户代理

用户代理（User Agent，简称UA）是一个由浏览器或其他客户端发送给服务器的HTTP头部字段，用于标识发起请求的客户端类型。以下是关于用户代理的详细介绍：

1. 定义与用途

定义：用户代理是一个特殊字符串头，它允许服务器识别客户使用的操作系统及版本、CPU类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等信息。
用途：
1. 允许服务器根据用户代理提供针对特定浏览器或操作系统优化的内容。
2. 帮助网站分析用户使用的设备、操作系统和浏览器类型，以更好地了解受众。

2. 组成与格式

组成：用户代理字符串通常包括浏览器标识、操作系统标识、加密等级标识、浏览器语言、渲染引擎标识和版本信息等。
格式：浏览器标识 (操作系统标识; 加密等级标识; 浏览器语言) 渲染引擎标识版本信息。

3. 示例

一个Chrome浏览器在macOS操作系统上的典型用户代理字符串可能是：Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36
- 浏览器：Chrome（版本号91.0.4472.124）
- 操作系统：macOS（版本10.15.7）
- 渲染引擎：AppleWebKit（版本537.36）

4. 重要性

用户体验：通过用户代理，服务器可以发送与客户端设备、操作系统和浏览器兼容的内容，提高用户体验。
安全性：一些服务器可能会根据用户代理阻止或限制来自某些浏览器或操作系统的请求，以增强安全性。

5. 伪装与限制

伪装用户代理：某些情况下，用户或开发者可能会选择伪装用户代理以绕过某些限制或获取特定内容。然而，这可能会违反某些网站的服务条款。
限制与滥用：用户代理字符串也可能被用于不合理的目的，如跟踪用户或展示不同的内容给不同的用户代理。因此，在使用或处理用户代理信息时，应遵守相关法律法规和道德准则。

6. 服务器请求中的用户代理

不仅是浏览器发起的请求中存在用户代理，服务器在发起请求时也可以设置用户代理。例如，当使用命令行工具如curl或wget发起请求时，它们会自动设置用户代理头。

通过了解用户代理的定义、组成、用途和重要性，可以更好地理解它在网络请求中的作用，并在开发或测试过程中根据需要设置或分析用户代理信息。

十，用户代理池

用户代理池（User Agent Pool）是一个用于存储、管理和分配用户代理（User Agent）字符串的系统或工具。以下是对用户代理池的详细介绍：

1. 定义与用途

定义：用户代理池是一个集合，其中包含多个不同的用户代理字符串。这些字符串用于标识和模拟不同的浏览器、操作系统或其他客户端设备。
用途：
1. 绕过限制：某些网站或服务可能会根据用户代理来限制或阻止某些类型的客户端访问。使用用户代理池可以绕过这些限制，提高访问的灵活性和成功率。
2. 数据采集：在网络爬虫和自动化脚本中，使用用户代理池可以模拟来自不同设备和浏览器的请求，从而避免被目标网站识别并阻止。
3. 广告推广：广告商可能会使用用户代理池来模拟不同用户的访问行为，以便更准确地测试和优化广告效果。

2. 工作原理

存储：用户代理池存储多个不同的用户代理字符串，这些字符串可以手动添加或从公共数据库导入。
选择：当需要发起网络请求时，系统会从用户代理池中随机选择一个用户代理字符串，并将其添加到请求的HTTP头部中。
请求：使用所选的用户代理字符串发起网络请求，目标服务器将看到该用户代理并据此响应。

3. 优点与考虑因素

优点：
1. 提高访问灵活性和成功率。
2. 避免被目标网站识别并阻止。
3. 模拟不同设备和浏览器的访问行为，以获取更准确的测试结果。
考虑因素：
1. 用户代理数量与质量：用户代理池中的用户代理数量应足够多，以覆盖不同的设备和浏览器类型。同时，用户代理字符串的质量也很重要，应确保它们能够准确模拟目标设备的访问行为。
2. 更新与维护：由于浏览器和设备不断更新换代，用户代理字符串也需要定期更新和维护。这可以通过从公共数据库导入新的用户代理字符串或手动添加来实现。
3. 合法性与道德性：在使用用户代理池时，应遵守相关法律法规和道德准则。不得滥用用户代理池来从事非法或不道德的活动，如恶意攻击、数据窃取等。

4. 与代理IP池的区别

用户代理池和代理IP池是两个不同的概念。用户代理池主要用于模拟不同的设备和浏览器访问行为，而代理IP池则提供多个不同的IP地址来隐藏或替换用户的真实IP地址。在某些情况下，这两个工具可能会结合使用以提高访问的灵活性和安全性。

5. 实际应用场景

网络爬虫：在网络爬虫中，使用用户代理池可以模拟来自不同设备和浏览器的请求，避免被目标网站识别并阻止。这有助于提高数据采集的效率和稳定性。
广告推广：广告商可以使用用户代理池来模拟不同用户的访问行为，以更准确地测试和优化广告效果。这有助于提高广告投放的效率和准确性。

你可能感兴趣的:(python,开发语言)

VScode 里面使用 python 去直接调用 CUDA NeRF_er python vscode pytorch
上一个帖子主要分享了如何去将C++程序打包成一个package。我们最后的目的实际上是想把CUDA的程序打包成一个Package，C++程序只是起到了桥梁的作用：首先：CUDA程序和C++的程序一样，都有一个.cu的源文件和一个.h的头文件。我们的文件包含Cpp文件组成，负责当作CUDA和Python的桥梁。还有对应的CUDA的源代码文件和头文件。将这个cpp文件命名成ext.cpp.#inclu
Python 库包 sentence-transformers 音程机器学习人工智能 python 开发语言
sentence-transformers是一个非常流行的Python库，专门用于将文本（句子、段落、文档）转换为高质量的语义向量（嵌入）。它基于Transformer架构（如BERT、RoBERTa、DistilBERT等）的预训练模型，并在大量语义相似性数据上进行了微调，能够捕捉句子之间的深层语义关系。什么是sentence-transformers？项目地址：https://www.sber
【python】解决No module named _sqlite3的问题欧阳秦穆
环境版本说明：centos7python3.6.4django2.0在创建django项目时候。报错以下信息详细错误信息如下：原因：未安装sqlite模块解决：1安装sqlite-develyuminstallsqlite-devel2重新编译pythoncd/usr/local/python3.6.4./configuremakemakeinstall
Python Scrapy的爬虫中间件开发 AI天才研究院 python scrapy 爬虫 ai
PythonScrapy爬虫中间件开发：从原理到实战的深度解析关键词Scrapy中间件、爬虫扩展、请求响应处理、反爬绕过、中间件生命周期、钩子函数、分布式爬取摘要本文系统解析Scrapy爬虫中间件（SpiderMiddleware）的开发方法论，覆盖从基础概念到高级实践的全链路知识。通过第一性原理推导中间件的核心机制，结合层次化架构分析（理论→设计→实现→应用），提供生产级代码示例与可视化流程模型
使用Python将PDF转换成word、PPT wh3933 python pdf word
在现代企业环境中，文档格式的转换是一项普遍且关键的需求。PDF（PortableDocumentFormat）作为一种最终的、通常不可编辑的“打印”状态格式，被广泛用于分发和归档。然而，内容的创建、协作和修改主要在MicrosoftOffice套件中进行，特别是Word（DOCX）和PowerPoint（PPTX）。因此，以编程方式弥合这两种格式之间的鸿沟，已成为数据提取、内容迁移和工作流自动化领
Python实现文件移动到指定文件夹 wh3933 python java 前端
在Python中，将文件从一个位置移动到另一个位置是一项常见的操作。无论是整理下载、归档旧文件，还是在复杂的项目中管理文件结构，掌握文件移动的技巧都至关重要。本文将全面介绍在Python中移动文件的各种方法，并提供详尽的代码示例，帮助您轻松应对不同场景下的文件管理需求。核心方法：shutil.move()在Python标准库中，shutil模块提供了高级的文件操作功能，其中的shutil.move
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
python中使用pyinstaller将python项目打包为exe可执行文件不吃西红柿丿 python windows
1、安装pyinstallerpipinstallpyinstaller-ihttps://pypi.tuna.tsinghua.edu.cn/simple2、打包应用2.1、使用命令行直接打包pyinstaller-F-w-iyour_path/log.icomain.py命令：-F将项目打包为单个exe文件，没有其它文件-D将项目打包为一个文件夹里面又有一个exe文件以及其它依赖，启动速度比-
如何解决pip安装报错ModuleNotFoundError: No module named ‘os’问题 lyzybbs 全栈Bug解决方案专栏 pip python pycharm 开发语言 pandas numpy beautifulsoup
【Python系列Bug修复PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘os’问题1.摘要在使用PyCharm2025的控制台执行pipinstall时，常常会遇到各种奇怪的安装失败或安装后仍然报ModuleNotFoundError的问题，例如“Nomodulenamed‘os’”。本文将从开发场景、环境
如何解决pip安装报错ModuleNotFoundError: No module named ‘sys’问题 lyzybbs 全栈Bug解决方案专栏 pip pycharm python pandas scrapy beautifulsoup matplotlib
【Python系列Bug修复PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘sys’问题摘要在使用PyCharm内置终端或控制台执行pipinstallsys等命令时，常常会遇到如下异常：ModuleNotFoundError:Nomodulenamed‘sys’该错误看似与常驻Python核心库sys有关，但
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
Java+Python智能化云盘【Day5-1】关沐吖 Java+Python Ai智能云盘项目开发专栏 python java 开发语言
RAG系统链路和数据加载Loaders技术OK啊昨天Day4-2，最后提及了很多的一些Loader加载器，有文档类型、数据库类型、网页加载器类型等等，它们其实都是属于langchain_community.document_loaders这个包下的类。今天来先复习一下都有哪些，再讲讲其中的代码运行的基本框架，和文档中有图片的处理方式。Loader的分类与常见类型文件加载器（FileLoaders）
Java+Python智能化云盘【Day3】关沐吖 Java+Python Ai智能云盘项目开发专栏 java python 开发语言
提示词工程Prompt简介：大模型必备Prompt提示词工程讲解什么是PromptEngineering提示词工程通过特定格式的文本输入引导AI模型生成期望输出的技术，明确地告诉模型你想要解决的问题或完成的任务也是大语言模型理解用户需求并生成相关、准确回答或内容的基础类比：给Java程序员的任务需求文档（越清晰明确，结果越符合预期）为什么需要学习？大模型就是你的员工，你可以有多个助手，OpenAI
Java+Python智能化Ai云盘[Day2]
OK啊，为了完成学校老师布置的UML作业主播也是开始拿自己的项目开始当成期末大作业来交了。顺道的我也把自己的项目整个的梳理了一通，如果大家最近有UML的大作业要交也可以自取，到时候我把文章word版本直接发到百度网盘上去。里面我只有类图、用例图、活动图、顺序图、状态图。这次也算是一个提前复习了一下项目了把，整个的文档文字都是拿ai去写的，图的话也是我先看了一遍代码，然后给ai说了一遍也算是自己理通
基于uniapp小程序的诗词学习系统附带文章源码部署视频讲解等
文章目录前言详细视频演示具体实现截图核心技术介绍小程序框架Uniapp前端框架Vue持久层框架MyBaits为什么选择我代码参考数据库参考测试用例参考源码获取前言博主介绍：✌CSDN特邀作者、资深全栈开发程序员，曾在互联网大厂担任高级职位、码云/掘金/华为云/阿里云/InfoQ/StackOverflow/github等平台优质作者、专注于Java、小程序、前端、python等技术领域毕业项目实战
Windows安装MySQL及Python操作MySQL数据库脚本实例详解
1、Windows上安装MySQL便于测试，笔者在windows上安装MySQL，如有现成Linux下的MySQL和Python环境，也可直接使用。MySQL的官网下载链接安装步骤1)下载后的mysql-5.7.23-winx64.zip安装包解压至某一位置，在mysql-5.7.23-winx64.zip根目录下创建my.ini文件添加以下内容：my.ini[mysql]default-char
（纯新手练习五）python基础代码，我手把手带你敲（类与对象，实例，构造函数__init__初始化对象属性，继承，方法重写，类的文档字符串，模块化）星期天要睡觉 python 开发语言
目录1.基本理论简述类与对象构造函数（Constructor）继承（Inheritance）方法重写（MethodOverriding）四者关系总结类的文档字符串（Docstring）2.练习开始3.代码模块化练习（纯新手练习五）python基础代码，我手把手带你敲（类与对象，实例，构造函数__init__初始化对象属性，继承，方法重写，类的文档字符串，模块化）（下一节课：文件操作）基本理论简述类
区间求最值问题高效解决方法东皇太星 python
对于区间求最值场景，如果区间不定长度的，可以使用稀疏表进行求解，如果区间是固定长度的，则可以使用分块的思想（与稀疏表原理类似），都是通过压缩状态个数，1关于稀疏表的原理详见：稀疏表（SparseTable，ST原理及应用场景下面是一个稀疏表的python实现classSolution:def__init__(self,nums):self.nums=numsself.init_value=-999
python优先队列使用_Python优先队列实现方法示例
本文实例讲述了Python优先队列实现方法。分享给大家供大家参考，具体如下：1.代码importQueueimportthreadingclassJob(object):def__init__(self,priority,description):self.priority=priorityself.description=descriptionprint'Newjob:',description
python优先队列使用_python 线程队列PriorityQueue（优先队列）（37）
在线程队列Queue/线程队列LifoQueue文章中分别介绍了先进先出队列Queue和先进后出队列LifoQueue，而今天给大家介绍的是最后一种：优先队列PriorityQueue，对队列中的数据按照优先级排序，那么具体怎么用呢？一.队列Queue分类：1.线程队列Queue—FIFO(先进先出队列)，即哪个数据先存入，取数据的时候先取哪个数据，同生活中的排队买东西；2.线程队列LifoQue
Python|Pyppeteer规避反自动化检测方法【最新方案】(33) 写python的鑫哥 Pyppeteer从入门到精通 python pyppeteer puppeteer 规避反自动化检测反爬虫
前言本文是该专栏的第33篇，结合优质项目案例持续分享Pyppeteer的干货知识，记得关注。相信有些同学在使用Pyppeteer框架进行某个自动化操作的时候，会触发平台的检测机制，让目标平台识别出当前是机器人在操作，而非人为操作，导致让你的程序无法继续进行下一步。对于上述这种情况，你是不是有很大的疑惑呢？别担心，本文笔者专门针对上述问题，来详细介绍在使用Pyppeteer的过程中，出现反自动化机制
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
取余和取模到底是不是一回事？对比Python、Java、C和C++中的%运算符霜叶桑 java python c语言 c++
取余和取模到底是不是一回事？对比Python、JAVA、C和C++中的%运算符数学中的「取余」和「取模」计算机领域中的「取余」和「取模」Python、Java、C和C++中的`%`运算符Python：取模运算Java：取余运算C和C++：取余运算为什么一般用正除数数学中的「取余」和「取模」在纯数学中，当我们谈论整数除法a÷ba\divba÷b（aaa是被除数，bbb是除数，且b≠0b\not=0
194、Django Channels实战：构建实时WebSocket应用多多的编程笔记 django websocket sqlite
DjangoChannels：实现WebSocket与实时通信本文将向您介绍Python开发框架Django中的一个重要组件——DjangoChannels，它使得在Django中实现WebSocket通信变得轻而易举。通过阅读本文，您将了解WebSocket的概念、DjangoChannels的工作原理以及如何在实际项目中使用它来实现实时通信。1.WebSocket：实现快速双向通信在介绍Dja
apache-dolphinscheduler-3.2.0调度器简介和集群部署详细安装文档
1、为什么选用apache-dolphinscheduler轻松管理复杂的任务工程支持跨项目和跨工作流程的任务依赖支持Kill、暂停和恢复操作任务支持以租户、Worker分组组和环境中隔离运行每个任务都可以修改输出参数，并将其传递给后续任务在一分钟内创建你的工作流程通过拖拉拽的工作流创建方式提高效率支持Python、Yaml和OpenApi的方式生成工作流支持将一个工作流作为另一个工作流的子流程执
基于python版本secsgem源码开发gem，该gem作为一个中间平台，既要连接EAP，又要连接探针台，应该如何设置devicetype、connectmode SunkingYang #SECS协议 python gem eap 中间平台三方连接设备类型
文章目录一、角色定义与连接模式设计1.中间平台的双向角色2.核心参数设置二、代码实现步骤1.创建两个独立连接实例2.数据转发逻辑实现三、高级配置与注意事项1.状态机管理2.多线程与异步处理3.协议兼容性4.调试与错误排查四、典型应用场景1.配方管理2.事件与报警处理五、扩展方案（多设备协同）总结基于Python的secsgem库开发中间平台需同时连接EAP（作为Host端）和探针台（作为Equip
Python 爬虫入门（九）：Scrapy安装及使用「详细介绍」 blues_C Python爬虫实战 python 爬虫 scrapy
Python爬虫入门（九）：Scrapy安装及使用「详细介绍」前言1.Scrapy简介2.Scrapy的安装2.1环境准备2.2安装Scrapy3.创建Scrapy项目3.1创建项目3.2项目结构简介4.编写爬虫4.1创建爬虫4.2解析数据4.3运行爬虫5.存储数据5.1存储为JSON文件5.2存储到数据库5.2.1MongoDB6.处理请求和响应6.1请求头设置6.2处理响应7.高级功能7.1使
python 会议室预约系统解决方案_会议预约管理系统解决方案 weixin_39963853 python 会议室预约系统解决方案
随着时代快速发展，各大会议中心都有密集的会议安排，同时企业也会有大大小小的会议安排。会议室没有管理，会造成会议室被争抢、重要会议被非重要会议挤占、会议室信息不能及时发布、会议室设备开会时不满足会议要求、会议室设备没有提前调试以及设备因没有及时检修造成故障、会中设备出现故障且没有应急预案等等问题。这些问题往往频繁发生，使人们平时习以为常，用时抱怨连连。如果任由问题发生、日积月累，则会产生严重影响，轻
python 会议室预约系统解决方案_智能会议预约系统解决方案 weixin_39914868 python 会议室预约系统解决方案
随着时代的发展，科技的进步，效率在工作中成为了评价工作能力的一项标准。人的工作效率，机器的工作效率等等，我们都是逐步在提高。达到高效的工作状态离不开智能的解决方案，在此我将分享上海铭港公司做的智能办公空间—会议预约系统的案例。上海铭港做的此项会议预约系统案例的解决方案围绕的主题中心即是：效率提到会议室，可能令大家的头疼的事情随之而来。特别是公司的行政部门人员。哪间会议室是在空闲状态？哪间会议室有人
python 会议室预约系统解决方案_会议室预约管理系统方案书.pdf
会议预约管理系统系统方案目录一、系统概述31.1什么是会议预约管理31.2会议管理趋势4二、系统功能52.1功能特点52.2系统优势62.3系统界面7三、系统部署103.1安装示意图103.2安装实景图11四、会议显示12五、应用行业135.1教育行业135.2法律行业135.3医疗保健135.4企业13一、系统概述为符合现代信息化的考虑，在办公楼的底楼进出大厅设置一套多媒体信息显示公告系统，用于
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS