CESM1.2.1移植使用说明 ༊.枕星＇听光.ঌ 人工智能 linux
文章目录概述环境配置cesm1_2_1配置部分环境软件压缩包改变CLM陆面模式结果文件的输出变量、特征值及频率小结概述记录用户如何在Linux系统上移植CESM1.2.1模型，并且使用CLM4.5模式创建并单点模拟算例I_2000_CLM45。环境配置1.更新系统软件源2.更新系统安装软件安装git、make、python等。3.安装MPI(openmpi4.1.5)//下载并解压进入文件夹wge
vs2019 Qt C++中调用python代码路奇怪 Visual Studio qt c++
目录1.添加依赖库，.lib，include2.修改python.h文件3.环境搭建好了下面是测试代码部分4.如果按照面上走可能会出现的问题：5.Qt+vs+python6.说一下这里调py的主要步骤借鉴几位大佬（吐槽一下各种坑啊）混合编程之——C++调用python2.7&python3.5-CSDN博客c++调用python(复杂版)_c++调用python复杂库-CSDN博客环境配置：1.添
python 基于混合式推荐算法的学术论文投稿系统 mosquito_lover1 python 知识图谱
基于混合式推荐算法的学术论文投稿系统是一个结合多种推荐技术（如基于内容的推荐、协同过滤、知识图谱等）来为研究者推荐合适期刊或会议投稿的系统。以下是实现该系统的关键步骤和Python代码示例。系统设计思路1.数据收集与预处理：-收集论文数据（标题、摘要、关键词、作者信息等）。-收集期刊/会议数据（领域、主题、影响因子、投稿要求等）。-对文本数据进行预处理（分词、去停用词、向量化等）。2.推荐算法设计
python hack库_这里有123个黑客必备的Python工具！ weixin_39637571 python hack库
123个Python渗透测试工具，当然不仅于渗透~如果你想参与漏洞研究、逆向工程和渗透，我建议你时候用Python语言。Python已经有很多完善可用的库，我将在这里把他们列出来。这个清单里的工具大部分都是Python写成的，一部分是现有C库的Python绑定，这些库在Python中都可以简单使用。一些强力工具(pentestframeworks、bluetoothsmashers、webappl
如何用爬虫根据关键词获取商品列表：一份简单易懂的代码示例 API小爬虫爬虫
在当今数字化时代，网络爬虫已经成为数据收集和分析的强大工具。无论是市场调研、价格监控还是产品分析，爬虫都能帮助我们快速获取大量有价值的信息。今天，我们就来探讨如何通过编写一个简单的爬虫程序，根据关键词获取商品列表。以下是一个基于Python语言的代码示例，适合初学者学习和实践。一、准备工作在开始编写爬虫之前，我们需要准备以下工具和库：Python环境：确保你的电脑上安装了Python。推荐使用Py
【Python】构建Web应用的首选：Flask框架基础与实战萧鼎 python基础到进阶教程 python 前端 flask
构建Web应用的首选：Flask框架基础与实战在Python的Web开发生态中，Flask框架以其轻量、灵活和易用的特性成为构建Web应用的首选之一。无论是快速搭建一个小型应用原型，还是构建复杂的后端服务，Flask都提供了便捷的接口和丰富的扩展支持。本博客将介绍Flask的基础知识和核心概念，并通过一个简单的实例展示如何用Flask构建Web应用。一、Flask框架简介Flask是由ArminR
CIR-DFENet：结合跨模态图像表示和双流特征增强网络进行活动识别是Dream呀神经网络计算机视觉人工智能神经网络深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和求职工作的先行者！【优惠信息】•新专栏订阅前200名享9.9元优惠•订阅量破200
fastapi和php,Sanic vs Fastapi 性能对比扫盲君 fastapi和php
Sanic，Fastapi都是优秀的pythonweb异步框架，找了半天没找到靠谱的性能对比测试，只能自己做一个。测试内容：纯get请求、异步ORM读测试工具：WRK测试代码：由于两者代码非常相似，本文就直接放上fastapi的代码demo了。1、纯get请求压测：1.1：代码代码demo1.2:结果1.2.1SanicRunning30stest@http://0.0.0.0:7006/4thr
基于异构特征融合与轻量级集成学习的软件漏洞挖掘方案设计与Python实现 rockmelodies 信息安全网络安全机器学习集成学习 python 机器学习人工智能
标题：基于异构特征融合与轻量级集成学习的软件漏洞挖掘方案设计与Python实现一、方案设计原理异构特征工程静态特征：基于AST的代码属性图（CPG）解析（使用Joern+NetworkX）动态特征：内存访问模式分析（通过QEMU模拟执行）上下文特征：CWE漏洞模式匹配（集成Semgrep规则引擎）轻量级模型架构
用Python打造智能家居安防系统，让科技守护你的家 Echo_Wish Python 笔记 Python 算法 python 智能家居科技
友友们好！我是Echo_Wish，我的的新专栏《Python进阶》以及《Python！实战！》正式启动啦！这是专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发
Python 爬虫实战：游戏论坛评论数据抓取与游戏热度分析西攻城狮北 python 开发语言爬虫
一、引言随着电子游戏产业的飞速发展，游戏论坛成为了玩家交流心得、分享体验的重要平台。通过分析游戏论坛的评论数据，我们可以了解不同游戏的热度、玩家的评价以及游戏的受欢迎程度。本文将详细介绍如何使用Python爬虫技术抓取游戏论坛的评论数据，并进行游戏热度分析。二、项目背景与目标2.1项目背景游戏论坛如Steam社区、贴吧、NGA等，拥有大量的用户和丰富的评论数据。这些数据反映了玩家对不同游戏的评价和
《Operating System Concepts》阅读笔记：p309-p330 操作系统
《OperatingSystemConcepts》学习第29天，p309-p330总结，总计22页。一、技术总结1.Python中的并发编程(1)semaphoreclassthreading.Semaphore(value=1)。(2)conditionvariableclassthreading.Condition(lock=None)书上使用的是Java,因本人在开发工作中使用的是Pytho
PDF合并工具，免费快捷开源。python脚本实例演示 zhangood pdf python 开源
主要功能：完全免费相当方便可以合并PDF合并后自动删除原始PDF可设置原始文件夹，和目标文件夹路径支持生成EXE可执行文件，可在非python环境运行通过python脚本编写的，先给大家看脚本，方便了解配置和学习。importosfromPyPDF2importPdfMergerfromosimportlistdirresource_path='D:/111111/'#设定源文件夹，把要合并的pd
Python虚拟环境和包管理，到底怎么选？ Python资讯站 python 开发语言 python学习编程学习虚拟环境搭建虚拟环境包包管理
包含编程资料、学习路线图、源代码、软件安装包等！【[点击这里]】！在Python开发中，虚拟环境和包管理工具是必不可少的利器。它们帮助我们隔离项目依赖，避免版本冲突，提高开发效率。然而，面对众多工具如"venv"、“virtualenv”、“conda”、“pipenv”、“poetry"和"uv”，许多开发者常常感到困惑：到底该选择哪一个？本文将从优势、使用方法和适用场景等方面，深度对比这些工具
Python包管理不再头疼：uv工具快速上手马岛 python uv 开发语言
Python包管理生态中存在多种工具，如pip、pip-tools、poetry、conda等，各自具备一定功能。而今天介绍的uv是Astral公司推出的一款基于Rust编写的Python包管理工具，旨在成为“Python的Cargo”。它提供了快速、可靠且易用的包管理体验，在性能、兼容性和功能上都有出色表现，为Python项目的开发和管理带来了新的选择。1.为什么用uv与其他Python中的包管
Java对比Python，谁才是编程王者？ Java学研大本营 python java 开发语言
Python和Java是目前编程最受欢迎的两种语言，本文从多角度比较二者的相同点和差异，帮助你更深入地了解两种语言的特点，最终能根据你自身的需求来进行选择。微信搜索关注《Java学研大本营》Python和Java是当今世界上最流行的两种编程语言。两者都被广泛用于各种行业和应用，从网络开发到机器学习再到数据分析。但是这两种语言哪个更好呢？在这本中，我们将多方面比较Python和Java，探索二者的历
利用python 执行统计模型: 渔好学 python
利用python执行统计模型:http://www.statsmodels.org/stable/index.html
Python广东广州二手房源爬虫数据可视化分析大屏全屏系统开题报告 2401_84688466 程序员信息可视化 python 爬虫
如果需要联系我，可以在CSDN网站查询黄菊华老师在文章末尾可以获取联系方式Python****广东广州二手房源爬虫数据可视化分析大屏全屏系统开题报告XXXX大学**/学校/**学院毕业论文（设计）开题报告书学生姓名所属学院学号专业班级论文（设计）题目Python广东广州二手房源爬虫数据可视化分析大屏全屏系统设计与实现指导教师姓名（职称）开题日期选题依据：1.研究背景与意义；2.国内外研究（应用与发
Python江苏南京二手房源爬虫数据可视化分析大屏全屏系统开题报告 2401_84562041 程序员信息可视化 python 爬虫
Python****江苏南京二手房源爬虫数据可视化分析大屏全屏系统开题报告XXXX大学**/学校/**学院毕业论文（设计）开题报告书学生姓名所属学院学号专业班级论文（设计）题目Python江苏南京二手房源爬虫数据可视化分析大屏全屏系统设计与实现指导教师姓名（职称）开题日期选题依据：1.研究背景与意义；2.国内外研究（应用与发展）现状。1**：研究背景与意义**Python江苏南京二手房源爬虫数据可
python和java的本质区别,python和java有什么关系 2301_81900386 python 开发语言人工智能
本篇文章给大家谈谈python和java的本质区别，以及python和java有什么关系，希望对各位有所帮助，不要忘了收藏本站喔。一、主要区别：1.Python比Java简单，学习成本低，开发效率高2.Java运行效率高于Python，尤其是纯Python开发的程序，效率极低3.Java相关资料多，尤其是中文资料4.Java版本比较稳定，Python2和3不兼容导致大量类库失效5.Java开发偏向
Python多版本环境管理UV 坐吃山猪 Python python uv 开发语言
Python多版本环境管理UV1-参考网址Python虚拟环境UV管理工具-官网Python虚拟环境UV管理工具-快速开始pyproject.toml使用指导2-核心知识点1）python项目维护requirements.txt2）python机器学习环境Anaconda3）python轻量级环境管理uv4）uvx快速上手使用3-上手实操1-安装UV虚拟环境管理工具UV官网安装教程#Windows
数据结构 -- 字符串 _安晓数据结构数据结构
字符串串的定义串，即字符串（String）是由零个或多个字符组成的有限序列，一般记为S=‘a1a2a3a4’（n≥0）其中，S是串名，单引号括起来的是字符序列是串的值；ai可以是字母、数字或是其他字符；串中字符的个数n称为串的长度。n=0时的串称为空串（用∅表示）。例：（不同语言可能使用的边界符不同，Java、c等使用双引号（“”）Python等使用单引号（’‘））S="HelloWorld！"T
Python湖南长沙二手房源爬虫数据可视化分析大屏全屏系统开题报告黄菊华老师大数据库可视化二手房源数据可视化系统
博主介绍：《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者，CSDN博客专家，在线教育专家，CSDN钻石讲师；专注大学生毕业设计教育和辅导。所有项目都配有从入门到精通的基础知识视频课程，免费项目配有对应开发文档、开题报告、任务书、PPT、论文模版等项目都录了发布和功能操作演示视频；项目的界面和功能都可以定制，包安装运行！！！在文章末尾可以获取联系方式Python湖南长沙二手房源爬虫
Java与Python详细比对 -- Java与Python优缺点知之为 python 开发语言 java
系列文章-Java与PythonPython和Java都是比较流行的编程语言，它们各自有着独特的特性和应用场景。python用途最多的是脚本，java用途最多的是web。文章目录系列文章目录-Java与Python前言一、Java与Python整体区别二、Java与Python详细区别2.1语法结构方面2.2编程特性方面2.3语言执行及内存管理方面2.4多线程及网络编程方面2.5开发工具及相关功能
Development Problems Based On PyTorch woxiwangxuehaocpp pytorch 深度学习人工智能
问题解决RuntimeError:unabletowritetofile:Nospaceleftondevice(28)问题描述：Traceback(mostrecentcalllast):File"/opt/conda/lib/python3.10/multiprocessing/queues.py",line244,in_feedobj=_ForkingPickler.dumps(obj)Fi
如何使用Flask或Django框架构建一个简单的Web应用？清水白石008 Python题库 python flask django 前端
如何使用Flask或Django框架构建一个简单的Web应用？Flask和Django是两个流行的PythonWeb框架，用于构建Web应用。Flask是一个轻量级、易于扩展的框架，而Django则是一个功能全面的框架，包含了更多开箱即用的工具和功能。下面将分别介绍如何使用Flask和Django构建一个简单的Web应用。使用Flask构建简单Web应用1.安装Flask首先，确保安装了Flask
Flask 高并发部署方案详细教程！爬遍天下无敌手
前言虽然标题写的是Flask，但是下面这个教程不仅仅只适用于Flask,还适用于其他Pythonweb框架，记得帮忙点赞！众所周知Flask是一个同步的框架，处理请求的时候是以单进程的方式，当同时访问的人数过多时，Flask服务就会出现阻塞的情况。就像我们买火车票一样，当买火车票的人多的时候，排队的人就会很多，队伍就会很长，相应的等待的时间会变得很长！因此Flask,Django，webpy等框架
flask mysql orm_Flask的ORM和查询操作碍事的尾巴 flask mysql orm
Flask的ORMSQLAlchemySQLAlchemy是Python编程语言下的一个嵌入式软件。提供了SQL工具包以及对象关系映射(ORM)工具。SQLAlchemy“采用简单的Python语言，为高效和高级的数据库访问设计，实现完整的企业级持久模型”。SQLAlchemy首次发行于2006年2月，并迅速地在Python社区中最广泛使用的ORM工具之一，不亚于Django的ORM框架。Flas
解锁高性能Web应用：Gunicorn、Flask与Docker的高并发部署秘籍我是瓦力前端 gunicorn flask
引言在当今的互联网时代，高并发Web应用已成为许多企业的核心需求。无论是电商平台、社交网络还是实时数据分析系统，高并发能力直接影响到用户体验和业务成败。本文将带你深入探讨如何利用Gunicorn、Flask和Docker，实现高性能、高并发的Web应用部署。Gunicorn、Flask和Docker的基本概念Gunicorn：GreenUnicorn(简称Gunicorn)是一个PythonWSG
【python】setuptools Eternal-Student Python python 开发语言
setuptools是Python的一个核心工具包，用于构建、打包和分发Python项目。它是Python生态系统中最重要的工具之一，主要用于定义项目的元数据（如名称、版本、依赖等）以及构建和安装过程。以下是关于setuptools的详细介绍：1.setuptools的主要功能setuptools提供了以下核心功能：项目元数据管理：定义项目的名称、版本、作者、描述、依赖等信息。通过setup()函
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

不败的将军无敌

初学Python之爬虫学习

为了满足自己的好奇心，想运用一下Python知识，然后和小伙伴要来了一个爬虫学习的B站博主的视频，教你学爬虫，真的很详细。

先上一个目录结构压压惊：

接下来就是贴代码笔记还有一个第三方库的目录：

1.requests的用法：

requests的基本使用

import requests

url = 'https://www.baidu.com'

res = requests.get(url=url)

#获取响应结果
print(res)
print(res.status_code)
print(res.content)
print(res.content.decode('utf-8'))
print(res.text)
print(res.url)
print(res.request.headers)
print(res.headers)

requests请求头

import requests

# 定义url
# url = 'https://www.lmonkey.com/'
url = 'https://www.xicidaili.com/nn'

#定义请求头信息  做个伪装身份
headers={
     
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.116 Safari/537.36'
}

#发起get请求
res = requests.get(url=url,headers=headers)
#获取响应状态码
code = res.status_code
print(code)
#响应成功后将响应内容写入文件中
if code == 200:
    with open('./text.html','w',encoding='utf-8') as fp:
        fp.write(res.text)

requests的post请求

import requests

url = 'https://fanyi.baidu.com/sug'

word = input('请输入要翻译的中文：')

headers = {
     

}

data = {
     
    'kw':word
}

res = requests.post(url=url,headers=headers,data=data)

code = res.status_code
print(code)
#返回的是文本数据
print(res.text)
#返回的是json数据
print(res.json())

if code ==200:
    print('请求成功')
    data = res.json()
    if data['errno'] == 0:
        print('响应成功')
        k = data['data'][0]['k']
        v = data['data'][0]['v'].split(';')[-2]
        print(k+'-->'+v)

requests的session方法

import requests

# 需要请求的目标地址
url = 'http://www.rrys2019.com/user/user'


# 登陆请求的地址
loginUrl = 'http://www.rrys2019.com/User/login/ajaxLogin'


#请求头
headers = {
     
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.116 Safari/537.36'
}


#如果需要爬虫程序主动记录cookie并且携带cookie 那么使用requests之前先调用session方法
#使用session方法返回的对象发送请求即可
req = requests.session()

#登陆请求时的数据
data = {
     
    'account' : '[email protected]',
    'password' : 'pyTHON123',
    'remeber' : '1',
    'url_back' : 'http://zmz2019.com/user/user'
}


#发起登陆请求
res = req.post(url=loginUrl,headers=headers,data=data)

#判断状态
code = res.status_code
print(code)

if code == 200:
    #发起新的请求，去获取目标数据
    res = req.get(url=url,headers=headers)
    with open('rr.html','w',encoding='utf-8') as fp:
        fp.write(res.text)

2.Xpath的使用

Xpath的基本操作

from lxml import etree

text ='''


	
		
		老白的登陆界面
		
	
	
		
			
				账号:
				

				密码:
				

				

				
				
			
		
	

'''

#第一种方法解析使用etree解析HTML字符串
html = etree.HTML(text)
#print(html)
#提取数据
r = html.xpath('/html/body/div/div/p/text()')
#['账号:', '密码:']
print(r)
#['账号:']
r = html.xpath('/html/body/div/div/p[1]/text()')
print(r)



#第二种方式读取一个HTML文件并解析
html = etree.parse('./test.html',etree.HTMLParser())
# print(html)
# result = etree.tostring(html)
# print(result.decode('utf-8'))
#提取数据
r = html.xpath('/html/body/div/div/p/text()')
print(r)

Xpath数据解析方法

from lxml import etree

#解析HTML文件
html = etree.parse('./test.html',etree.HTMLParser())

#提取数据
r = html.xpath('/html/body/div/div/p/text()')
print(r)
#双斜杠 这个查找方法可以找到所有P标签
r = html.xpath('//p/text()')
print(r)

#获取指定标签里面的 p 数据
r = html.xpath('//div[@class="bukuai"]/p/text()')
print(r)
#获取指定标签里面的 input 属性
r = html.xpath('//div[@class="bukuai"]/input/@value')
print(r)
#组合起来
t = html.xpath('//div[@class="teacher"]//li/a/text()')
h = html.xpath('//div[@class="teacher"]//li/a/@herf')
print(*zip(t,h))
res = list(zip(t,h))
print(res)

'''
/ 当前元素的直接子节点
// 当前元素的子节点或者子孙节点
text() 获取文本
@xxxx 获取对应属性的值
'''

Xpath实战登陆

#需求分析
import requests
from lxml import etree
#封装类进行学习猿地的登陆和订单获取
class LMonkey():
    #登陆路径的url
    loginurl = 'https://www.lmonkey.com/login'
    #账户中心地址URL
    orderurl = 'https://www.lmonkey.com/my/order'
    #请求头headers
    headers = {
     
        'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.116 Safari/537.36'
    }
    #请求对象
    req = None
    #token口令
    token = ''
    #订单号
    ordercode = 0
    #初始化方法
    def __init__(self):
        #请求对象的初始化
        self.req = requests.session()
        if self.getlogin():
            if self.postlogin():
                self.getorder()

    # 1.get 请求 login 页面， 设置cookie , 获取 _token
    #get 登陆页面 获取 _token
    def getlogin(self):
        res = self.req.get(url = self.loginurl,headers = self.headers)
        if res.status_code == 200:
            print('get登陆页面请求成功')
            html = etree.HTML(res.text)
            self.token = html.xpath('//input[@name="_token"]/@value')[0]
            print("token获取成功")
            return True
        else:
            print("请求错误")


    # 2.post请求 提交登陆数据，进行登录， 并且设置cookie
    #post 请求页面 设置cookie
    def postlogin(self):
        uname = input('手机号')
        passw = input('密码：')
        data={
     
            '_token':self.token,
            'username':uname,
            'password':passw
        }
        #发起post请求
        res = self.req.post(url=self.loginurl,headers=self.headers,data=data)
        if res.status_code == 200 or res.status_code == 302:
            print('登陆成功')
            # 请求订单数据
            return True
'''
17610195211
yichuan123
'''

    # 3.get请求，账号中心，获取默认订单号
    #get 请求账号中心 获取默认订单号
    def getorder(self):
        res = self.req.get(url=self.orderurl,headers=self.headers)
        if res.status_code == 200:
            print('账户中心请求成功，正在解析数据')
            html = etree.HTML(res.text)
            r = html.xpath('//div[@class="avatar-content"]//small/text()')
            print(r)
            self.ordercode = r


obj = LMonkey()

3.bs4的使用

bs4的基本操作_tag标签的获取

from bs4 import BeautifulSoup

html_doc = '''


	
		
		老白的登陆界面
		
	
	
		
			
				账号:
				

				密码:
				

				

				
				
			
		
	

'''
#创建一个 BeautifulSoup 对象 ，建议手动指定解析器
soup = BeautifulSoup(html_doc,'lxml')

#1.通过 tag 标签对象获取文档数据 获取的是 第一个
r = soup.title
print(r)
#获取属性
p = soup.p['class']
print(p)
#获取文本
p = soup.p.text
print(p)


# 2.通过搜索获取页面中的元素 find  find_all
# 查找所有p标签
r = soup.find_all('p')
print(r)
# 查找 指定内容
x = soup.find(id = 'link')
z = soup.find(class_='inpu')
print(x)
print(z)
# 获取可见的文本内容
r = soup.find('title')
r = r.get_text()
print(r)

#3.css选择器

#通过标签 选择元素
r = soup.select('title')
print(r)
#通过class 类名获取元素
r = soup.select('.inpu')
print(r)
#通过ID名获取元素
r = soup.select('#inpu')
print(r)
#通过空格 层级关系获取元素
r = soup.select('html body input')
print(r)
#通过逗号，并列关系获取元素
r = soup.select('p,input')
print(r)

bs4实战_学习猿地_猿圈

from bs4 import BeautifulSoup
import requests,json
'''
分析爬取的数据
数据源地址：https://www.lmonkey.com/t
数据内容：文章标题， 文章的链接， 作者， 发布时间
工具：
    python, requests, bs4, json
'''
#1.定义请求的URL和请求头
url = 'https://www.lmonkey.com/t'
headers = {
     
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.116 Safari/537.36'
}

#2.发送请求
res = requests.get(url=url,headers=headers)

#3.检测请求是否成功并获取请求的源代码（源数据）
if res.status_code == 200:
    #4.解析数据
    soup = BeautifulSoup(res.text,'lxml')
    #获取页面中所有的文章大列表
    divs = soup.find_all('div',class_="list-group-item list-group-item-action p-06")
    varlist = []
    for i in divs:
        r = i.find('div',class_="topic_title")
        if r:
            vardict = {
     
                'title':r.text.split('\n')[0],#解决换行问题
                'url':i.a['href'],
                'author':i.strong.a.text,
                'pubdate':i.span['title']
            }
            varlist.append(vardict)
    print(varlist)
    #5.写入数据
    with open('./yq.json','w') as fp:
        json.dump(varlist,fp)

bs4实战_学习猿地_猿圈_优化

from bs4 import BeautifulSoup
import requests,json
'''
分析爬取的数据
数据源地址：https://www.lmokey.com/t
数据内容：文章标题， 文章的链接， 作者， 发布时间
工具：
    python, requests, bs4, json
'''

#封装类
class Bs4Yq():
    #定义属性
    #请求的url
    url = 'https://www.lmonkey.com/t'
    #请求头
    headers = {
     
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.116 Safari/537.36'
    }
    #响应源代码的存放位置
    res_html = None

    #存储解析后的数据
    varlist = []

    #初始化方法
    def __init__(self):
        #发起一个请求
        res = requests.get(url=self.url,headers=self.headers)
        if res.status_code == 200 :
            print('请求成功')
            self.res_html = res
            if self.ParseData():
                self.WriteJson()
                print('写入成功')
        else:
            print('请求失败')


    #解析html数据
    def ParseData(self):
        soup = BeautifulSoup(self.res_html.text, 'lxml')
        try:
            # 获取页面中所有的文章大列表
            divs = soup.find_all('div', class_="list-group-item list-group-item-action p-06")
            varlist = []
            for i in divs:
                r = i.find('div', class_="topic_title")
                if r:
                    vardict = {
     
                        'title': r.text.split('\n')[0],  # 解决换行问题
                        'url': i.a['href'],
                        'author': i.strong.a.text,
                        'pubdate': i.span['title']
                    }
                    self.varlist.append(vardict)
            return True
        except:
            return False

    #写入json数据
    def WriteJson(self):
        if self.varlist !=[]:
            try:
                with open('./yq1.json', 'w') as fp:
                    json.dump(self.varlist, fp)
                return True
            except:
                return False
        else:
            print('无法获取当前解析的数据')
            return False


res = Bs4Yq()
print(res)

4.re模块的使用也就是正则表达式

re正则模块基本使用

import re
'''
正则表达式，就是使用普通字符，转义字符，特殊字符组成一个规则
使用这个规则对文本的内容完成一个搜索或匹配或替换的功能

正则表达式的组成
    普通字符：大小写字母，数字，符号...
    转义字符：\w \W \d \D \s \S ...
    特殊字符：. * ? + ^ $ [] {} ()
    匹配模式：I U ...
'''
#使用正则表达式进行匹配的 基本语法
#定义字符串
vars = 'iloveyou521tosimida'
#定义正则表达式
reg = '\d'
#调用正则函数方法
res = re.findall(reg,vars)
print(res)
#返回的是一个 迭代器
res = re.finditer(reg,vars)
for i in res:
    print(i)


vars = 'xyz'
reg = '^xy[a-z]?z'
print(re.search(reg,vars))

re正则表达式的定义和规则

# 正则表达式的规则和定义
import re

#1.普通字符
vars = 'iloveyou'
reg = 'love'
res = re.search(reg,vars).group()
print(res)

#2.转义字符 \w \W \d \D \s \S ...
varstr = 'ilove521you'
reg = '\d' #单个数字
res = re.search(reg,varstr)
print(res)
reg = '\D' #单个非数字
res = re.search(reg,varstr)
print(res)
reg = '\w' #单个字母，数字 下划线
res = re.search(reg,varstr)
print(res)
reg = '\W' #代表单个非字母，非数字，非下划线
res = re.search(reg,varstr)
print(res)
reg = '\s' #单个的 空格符或者制表符
res = re.search(reg,varstr)
print(res)
reg = '\S' #单个的 非空格符或者非制表符
res = re.search(reg,varstr)
print(res)

#3.特殊字符 . * + ？ 【】 {} （） ^ $
varstr = 'hello world 5211 iloveyou'
reg = '.'     # 点 . 代表 单个的 任意字符 除了换行符
res = re.search(reg,varstr).group()
print(res,len(res))
reg = '.*'    #  * 匹配次数 任意次数 特点：如果使用* 号，那么在匹配的开始处如果符合要求，则按照规则一直向后匹配，知道不符合规则并结束，并把前面符合的数据返回；如果再匹配的开始处就不符合要求，就返回空
res = re.search(reg,varstr).group()
print(res,len(res))
reg = '\w+'   # + 至少要匹配一次
res = re.search(reg,varstr).group()
print(res,len(res))
reg = '\w+?'  # ？ 拒绝贪婪，就是前面的匹配规则只要达成则返回
res = re.search(reg,varstr).group()
print(res,len(res))
reg = '\w{4}' # {}表示匹配次数 ，{4}表示必须匹配四次
res = re.search(reg,varstr).group()
print(res,len(res))
reg = '\w{2,5}' # {}表示匹配次数 ，{2,5}表示必须匹配2次到5次
res = re.search(reg,varstr).group()
print(res,len(res))
reg = '[a-z，A-Z，0-9，_]' # [] 表示字符的一个范围，[a-z，A-Z，0-9，_] == \w
res = re.search(reg,varstr).group()
print(res,len(res))
varstr = 'hello WORLD iloveyou5211'
reg = '\w+(\d{4})' # ()代表子组，括号中的表达式首先作为整个正则的一部分，另外会把符合小括号中的内容单独提取一份
res = re.search(reg,varstr)
print(res.group())
print(res.groups())

varstr = '17610105211'
#定义一个正则表达式的规则  匹配手机号的正则表达式
reg = '^1\d{10}$' # ^ 代表开头   $ 代表结尾
res = re.search(reg,varstr)
print(res.group())

#4.正则模式
varstr = 'iLOVEyou'
reg = '[a-z]+'
res = re.search(reg,varstr,re.I) # re.I 不区分大小写
print(res)

re模块相关函数

#re模块相关函数
'''
re.match()函数
    + 从头开始匹配
    + 要么第一个符合要求，要么不符合
    + 匹配成功则返回Match对象，否则返回None
    + 返回的结果可以使用group()方法获取返回的值
    + 返回的结果可以使用span()方法获取返回的值的下标范围区间
re.search()
    + 从字符串开头结尾开始搜索式匹配
    + 匹配成功则返回Match对象，否则返回None
    + 返回的结果可以使用group()方法获取返回的值
    + 返回的结果可以使用span()方法获取返回的值的下标范围区间

search() 和 match() 方法的区别：
    match()方法是从字符串的开头进行匹配，如果开始就不符合正则的要求，则匹配失败，返回None
    search()方法是从字符串的开始位置一直搜索到字符串的最后，如果在整个字符串中都没有匹配到，则失败，返回None

re.findall()
re.finditer()
re.sub()


'''
import re
vars = 'iloveyou521tosimida'
reg = 'love'
#调用 match()方法
res = re.match(reg,vars)
print(res)
reg = 'ilove'
res = re.match(reg,vars)
print(res)
print(res.group())
print(res.span())
#调用 search() 方法
vars = 'iloveyou521tosimida'
reg = 'love'
res = re.search(reg,vars)
print(res)
print(res.group())
print(res.span())

re模块相关函数_其他函数

'''
re.findall()
    + 按照正则表达式的规则在字符中匹配所有符合规则的元素，结果返回一个列表，如果没有找到则返回空列表


re.finditer()
    + 按照正则表达式的规则在字符中匹配所有符合规则的元素，返回一个迭代器

re.sub()
    + 搜索替换
    + 按照正则表达式的规则在字符中找到需要被替换的字符串，完成一个替换
    + 参数要求：
        - pattern：正则表达式的规则，匹配需要被替换的字符串
        - repl：替换后的字符串
        - string：被替换的原始字符串

compile()
    可以直接将正则表达式定义为 正则对象，使用正则对象直接操作

'''
import re

varstr = 'iloveyou521tosimida511'

reg = '\d'
res = re.findall(reg,varstr)
print(res)

reg = '\d{3}'
res = re.findall(reg,varstr)
print(res)

res = re.finditer(reg,varstr)
print(list(res))
print(res)

res = re.sub(reg,'AAA',varstr)
print(res)

reg = re.compile('\d{3}')
res = reg.findall(string=varstr)
print(res)
lines = [
    'i love 512 you',
    'i love 521 you',
    'i love 345 you',
    'i love 543 you',\
]
for i in lines:
    res = reg.search(i)
    print(res.group())

re正则实战_猿来如此

'''

数据地址： https://www.lmonkey.com/ask
数据字段： 问题 时间 作者 url链接

'''
import json
import re
import requests

# 1. 定义请求url 请求头

url = 'https://www.lmonkey.com/ask'
headers = {
     
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.116 Safari/537.36'
}

# 2.发起请求
res = requests.get(url=url,headers=headers)

#3.检测请求是否成功
if res.status_code == 200:
    #4.获取返回的数据
    res_html = res.text
    with open('./res.html','w',encoding='utf-8') as fp:
        fp.write(res_html)
    #5.进行数据解析

    #定义解析 问题标题的正则
    reg = '(.*?)
    titlelist_arr = re.findall(reg,res_html)
    # print(titlelist_arr,len(titlelist_arr))
    #定义解析 作者的正则
    reg = '(.*?)'
    author_list = re.findall(reg,res_html)
    # print(author_list,len(author_list))
    #定义解析 时间的正则
    reg = ''
    time_list = re.findall(reg, res_html)
    # print(time_list,len(time_list))
    #定义解析 链接的正则
    reg = ''
    href_list = re.findall(reg, res_html)
    # print(href_list,len(href_list))

    data = list(zip(titlelist_arr,author_list,time_list,href_list))



    #列表推导式
    datalist = [{
     'title':i[0],'author':i[1],'datetime':i[2],'url':i[3]} for i in data]
    print(datalist)

    #数据入库
    with open('./data.json','w',encoding='utf-8') as fp:
        json.dump(datalist,fp)
'''
    #常规方式处理数据
    datalist = []
    for i in data:
        res = {
            'title':i[0],
            'author':i[1],
            'datetime':i[2],
            'url':i[3]
        }
        datalist.append(res)

    print(datalist)
'''

初学Python之爬虫学习

为了满足自己的好奇心，想运用一下Python知识，然后和小伙伴要来了一个爬虫学习的B站博主的视频，教你学爬虫，真的很详细。

先上一个目录结构压压惊：

接下来就是贴代码笔记还有一个第三方库的目录：

1.requests的用法：

2.Xpath的使用

3.bs4的使用

4.re模块的使用也就是正则表达式

以上就是跟着那位博主学习的爬虫知识，学习爬虫后要多加练习，建议自己写一个前端代码然后自己爬，自己写自己爬，希望这些代码对你有用，如果没用，那去看那位博主的教学吧~

你可能感兴趣的:(Python)

初学Python之爬虫学习

为了满足自己的好奇心，想运用一下Python知识，然后和小伙伴要来了一个爬虫学习的B站博主的视频，教你学爬虫，真的很详细。

先上一个目录结构压压惊： 接下来就是贴代码笔记还有一个第三方库的目录：

1.requests的用法：

2.Xpath的使用

3.bs4的使用

4.re模块的使用 也就是正则表达式

以上就是跟着那位博主学习的爬虫知识，学习爬虫后要多加练习，建议自己写一个前端代码然后自己爬，自己写自己爬，希望这些代码对你有用，如果没用，那去看那位博主的教学吧~

你可能感兴趣的:(Python)

先上一个目录结构压压惊：

接下来就是贴代码笔记还有一个第三方库的目录：

4.re模块的使用也就是正则表达式