啊六六六

review第1遍，git版本控制，项目总结，220629，md+本地视频,

知识点05：Git管理的组成结构

掌握Git

本地版本控制Git服务器

工作区【Work Dir】：就是你开发和修改代码的地方

暂存区【Index】：临时存放你即将提交的版本的地方

所有需要保存的版本必须先添加到暂存区

本地版本仓库【HEAD】：本地的版本库，实现本地的版本的管理

所有暂存区的版本会被提交到本地版本库

远程版本仓库：用于共享项目代码版本

GitHub、Gitee

管理版本的组成结构

知识点06：本地仓库构建几种方式

基于自己的笔记本，在本地操作系统中实现Git本地仓库的构建

step1：准备
- 每个项目都可以基于Git构建版本库，每个项目都可以做版本管理
- 先创建一个目录，再创建三个子目录【三个本地库】
本地库只要构建成功就会创建一个隐藏目录.git

修改配置打开显示隐藏的项目

知识点07：Git基本操作--添加、提交

实现在Git本地工作区，添加文件到本地仓库

#添加一个或者多个文件到暂存区
git add [file1] [file2] ...

#添加指定目录到暂存区，包括子目录
git add [dir]

#添加当前目录下的所有文件到暂存区
git add .

#如何嫌命令难记，也可以使用下述的tortoiseGit工具操作

注意啊，这里点确定表示添加到暂存区，点击提交就一步提交到仓库了。

#前面我们使用 git add 命令将内容写入暂存区。

#git commit 命令将暂存区内容添加到本地仓库中。

#master涉及分支的管理，我们后面细说。

git commit -m [message]

提交的时候最好写上提交日志便于后续浏览排查。

知识点08：Git基本操作--修改、还原

实现基于本地版本库的修改提交

step1：修改文件

**step2：提交第二个版本*

还原：修改文件，但未提交

使用tortoiseGit工具，可以将工作区的内容还原至最后一个提交的版本。

知识点09：Git基本操作--版本差异比较、回退

修改文件

工作区与最新版本的差异

工作区与倒数第二个版本的差异

工作区与之前任意版本的差异比较

可以使用tortoiseGit工具选中文件、右键查看日志信息。

在日志信息中选中想要比较的版本和工作区的之间的差异。

版本回退

有时候用Git的时候，有可能commit提交代码后，发现这一次commit的内容是有错误的，那么有两种处理方法： 1、修改错误内容，再次commit一次

2、使用git reset 命令撤销这一次错误的commit 第一种方法比较直接，但会多次一次commit记录。第二种方法会显得干净清爽，因为错误的commit没必要保留下来。但是使用的时候等慎重，对于新手而言。

git reset 命令用于回退版本，可以指定退回某一次提交的版本，有3种模式可供选择，详见画图。

小结

注意：如果重置回到某个版本时，关闭了tortoiseGit日志窗口，这个版本之后的版本全部会被删除，无法再次回到之后的版本
重置git reset，只能倒退回退，如果有前进的需求怎么办？

导出需要重置到的版本，重新提交版本，将原来的一个老版本变成最新版本

知识点10：Git基本操作--删除

情况1：文件删除

直接将工作区的已经提交的文件删除之后，不做提交动作，可以使用还原操作。

知识点10：Git基本操作--删除
情况1：文件删除

直接将工作区的已经提交的文件删除之后，不做提交动作，可以使用还原操作。

情况2：删除版本

将工作区的已经提交的文件删除之后，做提交动作，可以通过日志还原。

情况3：删除管理

也就是所谓的摆脱Git的控制

知识点11：添加整个项目

复制工程到本地库

添加到暂存区

忽略不需要做控制的目录

**提交到本地库

知识点12：暂存区的设计

没有暂存区
- 在提交的时候，会让你选择那些文件需要提交
- 我们所提交的必然是一个完整的版本
- 毛病1
  - 文件特别多，挨个选非常麻烦
- 毛病2
  - 版本1：ABC
  - 版本2：ABD
  - 想要一个版本：ACD
设计暂存区
- 设计Git的时候考虑到上面两个问题的主要原因是提交版本修改的颗粒度太大了
- 将可能需要提交的版本放入暂存区
- 每一次只放一个部分
  - 第一次：A
  - 第二次：B
  - 提交一次：AB
  - 第三次：A，B，C
  - 提交一次：ABC版本
  - 第四次：A，C，D
  - 提交一次：ACD版本
- 理解：
  - 暂存区：相当于你买东西的先添加购物车
    - 将商品放入购物车的自由组合进行支付
  - 版本：就是一次支付

知识点13：Git远程仓库--GitHub创建公共仓库

了解Git远程仓库的设计

问题
- 如何实现多台机器之间共同协作开发版本的管理？
解决
- 公共代码版本托管平台
商业代码托管平台
- 国外：GitHub
- 国内：Gitee
- 可以将代码发布到这个平台上进行托管，其他的人可以从这个平台下载代码
  - 公共代码库：大家都可以看到的
  - 私有代码库：可以控制访问权限，但是收费
注册GitHub，并登陆
- 参考附录一：https://github.com/
- 如果访问不了，添加DNS解析

#GitHub
140.82.114.4 github.com
199.232.69.194 github.global.ssl.fastly.net

创建公共仓库

知识点14：本地与GitHub的SSH连接

实现本地仓库与GitHub公共仓库的连接

需求
- 即使是public的公共仓库，也只是所有人可读，但不是所有人可写
- 哪些人可写呢？
  - 需要配置SSH认证
  - 需要将本地机器的公钥填写在GitHub中，只有填写公钥的机器才能推送
本地秘钥生成
- step1：在自己Windows本地生成一对公私钥

ssh-keygen -t rsa

step2：找到自己的公钥的位置：当前用户的家目录下：C:\user\用户名 \ .ssh

step3：打开公钥的文件，并复制公钥的内容

将整个公钥的所有内容配置到SSH的key中，添加保存即可

实现本地仓库与GitHub公共仓库的连接

知识点15：同步到远程仓库

实现本地仓库代码同步到远程仓库

方式一：命令同步

#添加一个远程仓库的地址叫origin
git remote add origin [email protected]:Frank-itcast/repository1.git

练习中替换成自己的仓库地址
#git remote add origin [email protected]:AllenWoon/xls_1.git

#将本地master同步到远程的origin
git push -u origin master

**方式二：工具同步：SSH**

方式三：工具同步：HTTPS

知识点16：从远程仓库克隆

实现从远程仓库克隆到本地仓库

方式一：命令

git clone [email protected]:Frank-itcast/reps1.git

#git clone [email protected]:AllenWoon/xls_2.git

方式二：工具

知识点17：冲突问题

了解版本管理的冲突问题及解决方案

解决

本地reps3：拉取远程reps1中的版本，发现冲突的文件
修改冲突的文件
解决冲突
提交本地仓库
提交远程仓库

解决

如果别人已经提交了某个版本，自己再次提交这个版本，会失败
将两个冲突的版本合并，由开发者自行选择到底应该使用哪个版本
- step1：先拉取远程仓库中的当前的这个版本
step2：与自己的版本做比较
- step3：调整好确认的版本以后，再次提交

知识点18：分支的功能与分支管理

业务场景
- 开发一个APP
  - 普通的开发线
    - A、B、C
    - v1/v2/v3
  - VIP的开发线
    - A、B、C、D
    - v1/v2/v3
  - 测试开发线
    - A、B、C、D、E
    - v1/v2/v3
- 问题：如果一个项目中多条开发线都需要做版本控制怎么办？
- 解决：分支管理
分支管理
- 一个项目中可以有多个分支，每个分支独立管理各自的版本，默认只有一个分支：master

创建分支

注意：测试vip分支与master 分支

在vip分支中修改的这个版本，在master中是否能看到对应的修改？
- 看不到
- 所有的分支是独立的
在Master管理的文件或者版本，在vip中是否能看到？
- 看不到

删除分支

当前正在使用分支不允许删除
删除其他的分支

知识点19：分支合并

实现分支的合并

需求：将VIP的功能与普通的功能进行合并
- 普通的APP：master
  - ABCD
- VIP的APP：vip
  - ABCE
- 这个功能可以给普通用户使用
  - 希望得到普通用户的APP
  - ABCDE
分支的合并
- vip内容
- master内容
- 希望得到的结果：master分支合并vip的分支的内容
- 在Master中做一个新的版本
- 这个操作是不影响vip分支的

启动PyCharm，点击【File】→【Settings】→【Version Control】→【Git】，选择Git可执行文件路径（系统安装git后此处会默认显示路径），点击【Test】，路径下会显示当前Git版本。

如果不在某个具体的工程里面，则点击【Configure】→【Settings】→【Version Control】→【Git】

dg，完成一个文件就提交commit本地库，晚上下班就push到远程库，

Day10_新零售项目总结

#参考话术  只可意会 不可模仿

#1、通过sqoop将业务数据库中的数据采集同步到新零售数仓的ODS层中;
   可能问到：sqoop工具知识点
           几种同步方式及区别：全量覆盖、全量同步、增量同步（仅新增）、增量同步（新增及更新同步）
           sqoop如何实现几种同步的，尤其是增量同步？
           		要求业务系统表设计的时候有 create_time  update_time
           		sqoop --query  "select  where create_time between dt 00:00:00 23:59:59
           sqoop在同步数据中有遇到什么问题吗？怎么解决的？ 
           	数据格式ORC（HCatalog） 表数据量大--m  字段分隔符 --split-by 文本格式
           结合sqoop和hive建表如何使用
           
           扩展问题：你是否了解其他的EL抽取工具？（可能他们公司就是用的询问的那个工具，） 多款同类型软件之间的比较？ 知识视野宽度？
           		    sqoop能否进行实时采集？（不能） 哪个实时抽取？（canal（mysql） ogg（oracle））

#2、基于ODS层数据进行清洗转换处理的工作, 根据分析需求区分事实表、维度表，后将数据同步至DWD层, 同时在DWD层完成了历史数据维护工作,项目采用拉链表的方案；
	可能问到：清洗转换具体做了什么，怎么做的
				空值处理 
coalesce函数 （“COALESCE是一个函数， (expression_1, expression_2, ...,expression_n)依次参考各参数表达式，遇到非null值即停止并返回该值。） 
nvl函数 （NVL(E1, E2)的功能为：如果E1为NULL，则函数返回E2，否则返回E1本身。）
				日期转换  date timestamp
				枚举类型解释 1 2 3 3
				脱敏操作（mask）  手机号 身份证号码

mask（mask_first_n(string str[, int n])   可对前n个字符进行掩码处理。

mask_last_n(string str[, int n])   可对后n个字符进行掩码处理。

mask_show_first_n(string str[, int n])  是除了前n个字符，其余进行掩码处理。

mask_show_last_n(string str[, int n])  是除了后n个字符，其余进行掩码处理。

mask_hash(string|char|varchar str)  会返回字符串的hash编码。 

		    如何区分事实、维度，什么是事实、什么是维度--->这一扩展可能会扯到维度建模整个理论
		       （day03）
			    事实：你分析关注的内容
			    维度：分析问题的角度
			拉链表是什么？解决什么？如何实现拉链？
				拉链表使用的关键原因：需要记录维护历史状态、数据还不能冗余
				拉链实现的关键是开始时间 结束时间标识数据有效期  9999-12-31
				sql技术角度实现拉链过程：
                	1、从ODS层查询增量数据（包括更新和新增的） ---->结果集1
                	2、历史拉链表 left join 结果集1 ---->is not null -->修改历史数据的结束
                	3、将1、2的结果union all合并 新的拉链结果

#3、接着对DWD层基于业务模块进行数据维度退化处理工作, 将退化后的宽表数据灌入到DWB层中, 构建了整个集团数据中心
	可能问到：维度退化是什么？（维度表的核心字段退化到事实表中，）如何实现？
依据是什么？（ER图，业务流程）
优缺点？（不做退化，可能会涉及多表之间的来回join各种维度表，sql维护上，性能上，有问题，选择退化将需求中涉及的字段抽取出来，变成一张宽表，）
		实际中有两种操作：1、维度表退化到事实表中
					   2、多个事实表退化到一个核心的事实上
					   3、多个维度表退化到一个维度表中
sql技术上实现降维：
				select
					抽取核心字段
				from  事实 left join 维度1
                		  left join 维度2;
                		  
		优化：map join优化的问题（加分项）
			【Day07_DWS层建设实战-1\4、今日重点、项目优化】

#4、开始进行主题统计分析, 整个项目主题共有三个宽表(销售主题, 商品主题, 用户主题), 根据业务需求、分析师提供的维度和指标, 进行统计分析, 在统计的时候, 先进行提前聚合处理工作, 将聚合统计后宽表数据同步到DWS层中；
	可能问到：主题有哪些、指标、维度有哪些？主题、指标、维度怎么确定的？
			 主题有哪些表？
地址：Day06_DWB层建设实战、Presto计算引擎\1、笔记总结更新
三个宽表(销售主题, 商品主题, 用户主题)，由那些表查询而来？？（
订单明细宽表 **==dwb_order_detail
核心表: yp_dwd.fact_shop_order订单主表
		(也就说，其他表将围绕着订单主表拼接成为一张宽表)
退化维度表:
	fact_shop_order_address_detail:  订单副表 
		记录订单额外信息 与订单主表是1对1关系 (id与orderID一一对应) 
	fact_shop_order_group:  订单组表 
		多笔订单构成一个订单组 (含orderID)
	fact_order_pay:    订单组支付表
		记录订单组支付信息，跟订单组是1对1关系 (含group_id)
	fact_refund_order:  订单退款信息表
		记录退款相关信息(含orderID)		
	fact_order_settle:  订单结算表
		记录一笔订单中配送员、圈主、平台、商家的分成 (含orderID)
	fact_shop_order_goods_details:  订单和商品的中间表
		记录订单中商品的相关信息，如商品ID、数量、价格、总价、名称、规格、分类(含orderID)
	fact_goods_evaluation:  订单评价表
		记录订单综合评分,送货速度评分等(含orderID)        
	fact_order_delievery_item:  订单配送表
		记录配送员信息、收货人信息、商品信息(含orderID)
）（
DWB层搭建--店铺明细宽表-
核心表: yp_dwd.dim_store 店铺表
退化维度表:
	dim_trade_area 商圈表
		记录商圈相关信息，店铺需要归属商圈中(ID主键是店铺表中的外键，trade_area_id)
	dim_location 地址信息表
		记录了店铺地址
	dim_district 区域字典表
		记录了省市县区域的名称、别名、编码、父级区域ID
）
（
DWB层搭建--商品明细宽表
核心表: dim_goods 商品SKU表
		记录了商品相关信息
退化维度表:
	dim_goods_class 商品分类表
		记录了商品所属的分类信息：商品大类、商品中类、商品小类
	dim_brand 品牌信息表	
		记录了品牌信息		
）
如果表名和表个数张嘴说出来那就十分棒棒了。
			 	如果说不出来？业务不熟悉，打酱油的？项目没做过？培训的？
		     预聚合这里指的是什么？为什么要预聚合？
		     	先把粒度细的计算出来 便于后续上卷计算粒度粗的。


#4、后对DWS层进行细化上卷维度统计操作, 形成DM层数据；
	可能问题：上卷是？如何实现？下钻？---->这里可能延伸出OLAP多维分析  rollup  cube等

#5、最后根据报表系统应用要求, 从DM层获取相关的数据拼接, 同步到RPT层, 再通过presto将数据导出到mysql中, 后续供应用使用；
	可能问题：RPT是什么？报表系统直接使用DM数据行吗？为什么？  解耦合
		    presto导出数据怎么操作的？
		    为什么使用mysql存储最终数据？
		    
#以上每个步骤中，都可能会问到的是
	sqoop、hive、presto功能技术点 优化点
	你这这里做了什么工作？ 负责某个主题的完整实现
	遇到了哪些问题（回答好是强烈加分项 提前准备）
		问题怎么发现的？怎么思考的？怎么寻找解决方案？怎么测试方案的？最终解决了吗？ 有什么收获
	
	这个问题你用A解决，B你知道吗？  AB区别是？这个我不是很清楚但我有了解，到时候需要使用也容易上手，
	针对你做的有考虑什么优化方案吗？
		优化方案解决什么的？  查询效率 存储效率 逻辑清晰？
		为什么用这个方案，其他相同类似的你还知道吗？

公司地址？成都，
上司联系方式？

map join优化，

宽表--核心表--退化额度表，

DWB层搭建--店铺明细宽表

完成项目总结，边补充老师讲的，边汇总项目笔记，

已完成：：：：：：：：：：：：：：：

你可能感兴趣的:(Python,大数据)

使用Spire.Doc.Free在Python中为Word文档添加批注 Ven% python python word 批注
文章目录技术背景环境准备完整实现代码功能说明：注意事项：总结在文档协作和审阅过程中，批注是极其重要的功能。本文将详细介绍如何使用Python的Spire.Doc.Free库为Word文档添加批注，并提供一个完整的解决方案。技术背景Spire.Doc.Free是一个功能强大且免费的Python库，用于处理Word文档。虽然免费版本有一些限制（如文档处理页数限制等），但它提供了丰富的API用于文档操作
深入TA-Lib：量化技术指标详解
深入TA-Lib：量化技术指标详解本文系统讲解TA-Lib技术指标分析，涵盖基础、数据处理、趋势与动量指标、均量线、布林线等，并结合Python代码与大数据、机器学习实战案例，助力读者掌握量化交易实战技巧。本文系统梳理了TA-Lib技术指标分析的核心内容，包括TA-Lib基础、数据处理、趋势与动量指标、均量线、布林线等关键技术指标分析方法，并结合Python代码示例与大数据、机器学习的融合实战案例
【python做接口测试的学习记录day6——pytest+yaml+allure自动化测试框架之URL拼接】小丫么小二郎~ 学习 pytest python 功能测试测试工具
在之前的测试框架中，可以发现的是，我们的yaml数据中所有的url中的除了路径不同外，其余都是相同的，我们想办法将这一部分自动化，这样的yaml中写用例url的时候就不用再每次都写上域名，只需要输入路径即可首先我们需要更改下之前的用例yaml文件中的url，将域名删除只留下路径即可，例如：接下来我们在根目录创建一个config.yam文件，用于存储我们的URL中的公共部分，这里由于公司相关，我隐藏
【python做接口测试的学习记录day9——pytest自动化测试框架之yaml数据驱动封装】小丫么小二郎~ pytest python pycharm 接口测试用例
之前我们的框架中，如果有多个测试用例，则需要在yaml文件中写入多个用例，而每个用例可能不同的仅仅只是个别参数值，这就导致很多重复代码，现在我们使用数据驱动就可以解决这个问题了。我依旧采用之前的登录接口为例，简单记录一下数据驱动封装的全过程一、DDT数据驱动yaml文件在根目录下创建包datas，用来存放我们的数据驱动yaml文件，在datas下新建一个get_token_data.yaml文件，
AI 人工智能与 Copilot 碰撞出的火花 AI天才研究院 AI大模型企业级应用开发实战人工智能 copilot ai
AI人工智能与Copilot碰撞出的火花关键词：AI人工智能、Copilot、代码辅助、智能编程、人机协作、软件开发、技术创新摘要：本文深入探讨了AI人工智能与Copilot碰撞所产生的一系列效应。首先介绍了相关背景，包括目的、预期读者、文档结构和术语表。接着阐述了核心概念与联系，展示了其原理和架构的示意图及流程图。详细讲解了核心算法原理和具体操作步骤，并通过Python代码进行说明。同时给出了数
毕业设计基于python + flask +mysql + Layui新闻系统项目源码 love0everything flask python 课程设计
毕业设计基于python+flask+mysql+Layui新闻系统项目源码介绍该项目采用Flask框架开发，数据库采用mysql。这是一个作业项目。该项目采用Flask框架开发的一个新闻、论坛、博客系统。。前端采用的是layui框架，后端模板是X-admin下载地址：毕业设计基于python+flask+mysql+Layui新闻系统项目源码模块版本PyMysql1.0.2Flask1.1.2M
测试学习之——Pytest Day3 别在内卷了测试学习 pytest python
引言Pytest作为Python中最受欢迎的测试框架之一，以其简洁的语法、强大的功能和丰富的插件生态系统，极大地提升了自动化测试的效率和可维护性。在本文中，我们将深入探讨Pytest的两大核心特性：Fixture和插件管理，帮助您更高效地编写和管理您的测试用例。一、夹具fixtureFixture是Pytest中一个非常强大的特性，它允许您定义在测试用例执行之前或之后自动运行的代码。这对于设置测试
大数据时代下的时序数据库选型指南：基于工业场景的IoTDB技术优势与适用性研究 Loving_enjoy 计算机学科论文创新点机器学习 facebook 经验分享课程设计
>在宝钢集团的智能工厂里，5万多个传感器每秒产生150万+数据点，传统数据库系统每天积压3TB未处理数据——这揭示了工业4.0时代的核心矛盾：**海量时序数据处理能力已成为智能制造的关键瓶颈**。###工业时序数据的四大特殊性工业场景下的时序数据与传统互联网数据存在本质差异：1.**高精度时间要求**-数控机床振动监测需微秒级时间戳-电网故障定位要求时间同步精度≤1μs2.**多源异构性**```
linux安装Node.js 环境，Docker 环境，Ruby 环境，MongoDB 环境，PostgreSQL 数据库，Go 开发环境，Python 虚拟环境 2401_87017622 数据库 linux node.js
在Linux上安装其他常见的开发环境可以根据具体需求而定，以下是一些常见的安装步骤：1.Node.js环境Node.js是一个基于ChromeV8引擎的JavaScript运行环境，适用于服务器端开发。安装Node.js：通过包管理器安装：sudoyuminstall-ygcc-c++makecurl-sLhttps://rpm.nodesource.com/setup_14.x|sudo-Eba
Mac 下 python 安装 virtualenv 出错 stay_f_h
如果是安装了anaconda的机器，直接用pipinstallvirtualenv可能会由于版本的问题出错，建议使用sudocondainstallvirtualenv安装。
Python 数据分析与可视化：从基础到进阶的技术实现与优化策略女码农的重启 python 数据分析开发语言
数据分析与可视化是数据科学领域的核心技能，Python凭借其丰富的库生态和灵活的编程范式，成为该领域的首选工具。本文将系统讲解Python数据分析与可视化的技术栈实现，从基础操作到性能优化，结合实战场景提供可复用的解决方案。数据分析核心库技术解析Pandas数据处理引擎原理Pandas作为数据分析的基石，其核心优势在于基于NumPy的矢量运算和高效的内存管理。与Excel的单元格级操作不同，Pan
Python 字典(dict)和集合(set)新手指南
一、字典(dict)基础什么是字典？字典就像现实中的字典一样，通过"键(key)"快速查找对应的"值(value)"。#创建字典student_scores={"小明":90,"小红":85,"小刚":92}#查找成绩print(student_scores["小明"])#输出:90为什么字典查找快？字典使用哈希表实现，查找速度是O(1)级别，不会随着数据量增加而变慢。二、字典常用操作1.添加/修
Python函数参数`*args`和`**kwargs`详解：区别与使用指南北辰alk python python 服务器数据库
文章目录一、基本概念与区别概述1.1`*args`（非关键字参数收集）1.2`**kwargs`（关键字参数收集）1.3主要区别对比表二、深入理解`*args`2.1基本用法2.2工作原理2.3与其他参数配合使用2.4解包序列作为参数三、深入理解`**kwargs`3.1基本用法3.2工作原理3.3与其他参数配合使用3.4解包字典作为参数四、组合使用`*args`和`**kwargs`4.1完整参
【Leetcode】3201. 找出有效子序列的最大长度 I 想要AC的dly 练习题(记录做题想法)leetcode 算法职场和发展
文章目录题目题目描述示例提示思路分析核心观察有效子序列的四种模式算法思路代码实现Java版本C++版本Python版本优化版本复杂度分析时间复杂度空间复杂度示例验证总结题目题目链接题目描述给你一个整数数组nums。nums的子序列sub的长度为x，如果其满足以下条件，则称其为有效子序列：(sub[0]+sub[1])%2==(sub[1]+sub[2])%2==...==(sub[x-2]+sub
斗鱼大数据面试题及参考答案大模型大数据攻城狮大数据大数据面试 hadoop面试 spark面试 flink面试手撕SQL 手撕代码
GC（垃圾回收）相关知识一、常见的GC收集器SerialGCSerialGC是最基本的垃圾收集器，它是单线程的。在进行垃圾收集时，会暂停所有的用户线程，直到垃圾收集完成。它的工作过程比较简单，首先标记出所有的垃圾对象，然后将它们清除。例如，在一个小型的、对响应时间要求不高的Java应用程序中，如简单的命令行工具，SerialGC可以满足垃圾收集的需求。因为这种应用程序通常没有很高的并发要求，暂停用
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1179 数字统计
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P1179[NOIP2010普及组]数字
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1109 学生分组热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P1109学生分组-洛谷【题目描述】有n
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1449 后缀表达式热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P1449后缀表达式-洛谷【题目描述】所
Python 内存分析方法 focksorCr python 开发语言 linux
概述本文档描述了如何分析Python应用中各部分内存使用量的方法，不含削减方法（如果你知道问题出在哪里，那你就应该知道如何解决）。内存分析统计分析Python的tracemalloc模块可以跟踪Python应用中的内存开销情况。阅读链接上的文档可以解决你所有问题。下面是上述文档的一些摘抄。尽早开始跟踪要追踪Python所分配的大部分内存块，模块应当通过将PYTHONTRACEMALLOC环境变量设
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）青云交大数据新视界 Java 大视界 java 大数据机器学习金融情绪指数投资决策量化策略情绪分析
Java大视界--Java大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）引言：正文：一、Java构建的金融市场情绪数据采集与预处理体系1.1多源异构数据接入引擎1.2数据采集延迟测试报告1.3情绪数据预处理管道二、Java驱动的金融市场情绪指数构建模型2.1多维度情绪指数计算框架2.2情绪指数与投资决策的映射模型三、Java在金融投资决策支持中的实战应用3.1量化私募情绪
解决Python爬虫访问HTTPS资源时Cookie超时问题
一、问题背景：Cookie15秒就失效了？很多互联网图片站为了防止盗链，会把图片地址放在HTTPS接口里，并且给访问者下发一个带Path=/的Cookie，有效期极短（15s～60s）。常规Requests脚本在下载第二张图时就会401或403。本文以某壁纸站https://example-pics.com为例，演示如何：自动化获取并刷新Cookie；在下载高并发图片时维持Cookie活性；把方案
Python - 数据分析三剑客之Pandas MinggeQingchun Python Python Pandas
阅读前可参考NumPy文章https://blog.csdn.net/MinggeQingchun/article/details/148253682https://blog.csdn.net/MinggeQingchun/article/details/148253682‌Pandas是Python中一个强大的开源数据分析库，专门用于处理结构化数据（如表格、时间序列等），其核心数据结构为Seri
python网络爬虫(第一章/共三章：网络爬虫库、robots.txt规则（防止犯法）、查看获取网页源代码)
python网络爬虫(第一章/共三章：网络爬虫库、robots.txt规则（防止犯法）、查看获取网页源代码)学习python网络爬虫的完整路径：（第一章即此篇文章）（第二章）python网络爬虫(第二章/共三章：安装浏览器驱动，驱动浏览器加载网页、批量下载资源)-CSDN博客https://blog.csdn.net/2302_78022640/article/details/149431071?
mac mlx大模型框架的安装和使用 liliangcsdn python java 前端人工智能 macos
mlx是apple平台的大模型推理框架，对macm1系列处理器支持较好。这里记录mlx安装和运行示例。1安装mlx框架condacreate-nmlxpython=3.12condaactivatemlxpipinstallmlx-lm2运行mlx测试例以下是测试程序，使用方法和hf、vllm等推理框架基本一致。importosos.environ['HF_ENDPOINT']="https://
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite