胡涂阿菌

分享：新入职时，如何快速熟悉一个项目的代码

一、总体思路

昨晚是深夜撰文的阿菌，希望通过这篇文章和大家分享一下，初入职场时，如何才能快速地熟悉一个项目的代码。

说实话，感觉自己去年入职时上手项目的速度是比较慢的，可能是没有一些系统的方法论参考吧，这里看一点，那里看一点，很快就迷失了方向 T_T。

直到最近，我有机会负责一个小项目的开发，感觉自己对一个项目的构建有了更深的体会，得赶紧记录一下，否则以后就忘了。另外要着重感谢导师的指点，入职大半年，他 review 了我的每一行代码，给了我无数代码风格、结构，及工程相关的建议（虽然只能勉强吸收一丢丢皮毛 T_T）。

本文选用服务端项目为例子进行讲解，这个东西感觉触类旁通，或许对刚开始需要熟悉其他类型项目的小伙伴也能有所启发。

其实也是希望通过这个案例分析，把一个较为传统的 web 服务端项目结构梳理一遍。

阿菌先结合自己的心得分享一个参考顺序，罗列出一些事项点供同学们参考，后续我们将用一个实际的例子进行讲解：

第一步，我们要了解项目是干什么的，用于处理什么样的业务。虽然我们只是码农，但时刻保持基于业务的思考有助于提高我们对项目的整体认识。曾听一位大佬调侃，所谓当架构师，其实是在技术扎实的基础上，逐渐抬头，在技术落地与业务利益中谋求平衡。相信大家工作后也会有所体会。
第二步，我们要了解项目的部署方式。当下容器化在主流大厂是非常流行的，各种容器编排调度技术助力我们逐渐从物理机时代走向云端。作为开发者，在了解业务背景后，需要进一步了解自己项目的打包部署方式，至少要看一次自己项目的测试、灰度、生产环境。在这个过程中，我们可以重点留意一下参数的配置，毕竟绝大多数项目，都是通过配置来区分环境的。
第三步，了解公司各个办公区及机房的网络关系。现在的中、大型公司大都不止一片办公区，除了办公区，通常还有各地机房，由于国内互联网迭代发展迅猛，不少公司的网络布局是比较复杂的。新人接触项目的时候经常会出现各种连不上网的情况，这个时候往往会怀疑自己是不是哪里做错了，其实只是因为网络不通，了解清楚网络状况即可。
第四步，了解手头项目的依赖服务。大厂的项目模块划分通常比较细，自己的项目很可能会依赖不少别的项目模块，适当了解一下有助于我们开发及后续排查问题。
第五步，了解项目的代码结构。想要把项目跑起来，我们得从项目的入口文件开始看，看完启动的初始化逻辑后不要迷恋，立马把眼光切换至项目全局，根据项目的目录结构，了解项目的模块划分。在这个过程中，要顺便理清楚项目用到了什么技术，比如数据是如何存储的，用到了什么数据库？是否全是同步逻辑，异步处理的话用到了什么中间件？
第六步，搭建本地开发环境，选取合适的开发工具，配好开发用的数据库以及中间件，尝试创建一个分支，提交几行简单的代码到代码仓库，在这个过程中把一切需要配置的东西配好，从此进入开发状态。

二、具体案例分析

假设我们已经了解完了项目需要处理的业务，并且已经把项目的生产、灰度、测试环境看了个遍，接下来我就和大家分享一下我个人看项目代码的思路：

也希望通过这篇文章把个人当前对一个服务端项目的理解分享给大家

比如下面这个简单后端项目目录结构：

├── README.md
├── .gitignore
├── .gitlab-ci.yml
├── app
│   ├── __init__.py
│   ├── __main__.py
│   ├── views
│   ├── services
│   ├── dao
│   ├── schemas
│   └── utils
│   ├── conf
├── misc
│   ├── Dockerfile
│   ├── app.env
│   ├── compose
│   │   └── docker-compose.yml
│   └── requirements.txt
├── tests
├── scripts

提前声明，这样的目录结构不一定规范，但是估计还是比较清晰的。

个人感觉，看项目之前，自己心中得有一个大的框架，这个是和编程语言无关的。

以上的代码结构一眼望去能非常清晰地确认三点：

项目很可能基于 gitlab 做持续集成与构建，因为有 .gitlab-ci.yml 文件
项目大概率基于 Docker 部署，公司很可能有相关的容器平台，因为有 Dockerfile 文件
自己开发的时候可以使用 docker-compose 文件启动容器，app.env 大概率是前开发者留给我们的环境变量配置文件

以前在学校念书的时候，我对持续集成与部署的认知为零，进厂打工后才知道原来有这么有趣的工程化解决方案，这种解决思路其实能在很多传统制造业里看到影子。后来也和不同公司的小伙伴交流过 CICD 实践，发现成熟的研发体系在这一环都会做得比较好。

呃，反了，应该说很多传统工业经过多年大海淘沙留下来的工程思路，都映射到了近代互联网产业中。而互联网产业也在通过它独特的信息化浪潮，不断反哺我们的传统行业，催生了当下互联网+产业的繁荣景象。

1. 了解项目的启动

我们回看上面的目录结构，首先，不管多么大的项目，都是由一行行代码堆出来的，代码的执行总得有一个开始入口，也就是入口文件，比如上面 app 目录下的 __main__.py。

# 这里列举几行简单的示例代码：

def run_processor(args):
    # 运行消息队列的消费者模块
    processor.run()

def run_api(args):
    # 运行 api 模块
    app.run()


def arg_parser():
    # 设置参数解析器的具体逻辑
    # 当解析到指定 api 服务，则注册 args.func 为 run_api
    # 当解析到指定 processor 服务，则注册 args.func 为 run_processor


def main():
    # 设置参数解析器
    parser = arg_parser()
    # 解析命令行参数
    args = parser.parse_args()
    # 根据参数执行具体的应用
    args.func(args)


if __name__ == "__main__":
    # 整个程序的入口
    main()

在开始入口这，我们往往能了解到本项目划分了多少个单独运行的模块。假设我们的项目既需要对外提供 api，又要处理异步任务，为了能够共用项目中的业务逻辑及元素，往往会在入口文件中对不同模块的启动进行区分。

其实每个服务类型的程序原理都是相通的，通过循环不断接收 / 拉取业务。比如 api 模块，为了方便对外提供 api，我们一般会用现成的后端框架，因为后端框架会帮助我们封装好诸如 http 协议解析、路由转发、中间拦截器等一系列方便我们开发的功能。对于现成的后端框架，一般代码逻辑看到框架启动就够了，我们会在这个过程中会看到一系列关于框架运行的配置，框架的具体使用可以看框架的官方文档。

再如 processor 消息队列处理模块，这个处理的逻辑一般是开发自己写的，这个逻辑远没有后端框架那么复杂，所以可以耐心全部看完再动手开发。如果处理消息的逻辑封装好了，我们往往只需要编写业务逻辑。

看完入口文件后，心中应该会对项目的整体运行情况有一个非常清晰的认识，接下来只要把当前项目的业务层划分弄清楚，整个项目的骨架就非常清晰了。

2. 了解业务逻辑的处理划分

在看业务代码划分之前，阿菌先和大家做一个铺垫：

相信大家在初学服务端开发的时候会听过很多分层概念，比如要分视图层，业务层、数据层等等，而且大概率每个老师讲的都不一样，每个企业内部制定的研发规范可能也有所不同。

其实初学的时候，按照规范去操作是挺好的，但我们绝不能只停留在别人给我们圈定的概念里打转，我们要明白为什么有这些概念。

阿菌先举一个简单的例子，假设我们要对外提供一个添加学生信息的功能，如果我们只在一个函数里完成这个添加学生的功能，我们可以这样写（demo）：

@app.post("/", ......)
async def add_student(student: StudentModel = Body(...)):
    # 把学生信息存入数据库中
    student = jsonable_encoder(student)
    new_student = await db["students"].insert_one(student)
    # 根据返回的学生 id 查询这个学生的信息
    created_student = await db["students"].find_one({"_id": new_student.inserted_id})
    # 把学生的信息返回给客户端
    return JSONResponse(status_code=status.HTTP_201_CREATED, content=created_student)

我们可以思考一下这样写有没有什么不好的地方。

我们尝试着提出一个假设：假设我们平时还需要自己写脚本导入学生信息，但我们不希望通过 api 的方式导入数据，我们希望直接基于现有项目的数据库操作往数据库中添加信息，那这个时候我们就要写脚本了，比如脚本可以这样写：

# 把学生信息存入数据库中
student = get_student_from_somewhere()
new_student = await db["students"].insert_one(student)
# 根据返回的学生 id 查询这个学生的信息
created_student = await db["students"].find_one({"_id": new_student.inserted_id})

我们发现，其实这段逻辑和 api 中添加学生的逻辑是完全一样的，我们完全可以把这段逻辑抽取出来呀，比如封装一个类，在类中专门提供添加学生信息的方法：

class StudentService:

    @classmethod
    async def add_student(cls, student: StudentModel):
        # 把学生信息存入数据库中
        new_student = await db["students"].insert_one(student)
        # 根据返回的学生 id 查询这个学生的信息
        created_student = await db["students"].find_one({"_id": new_student.inserted_id})
        return created_domain

有了这层封装后，我们的 api 层逻辑就可以这样写了，简单来说就是把操作数据库的逻辑交给了学生信息的代理服务，代码瞬间简洁了很多：

@app.post("/", ......)
async def add_student(student: StudentModel = Body(...)):
    # 把学生信息存入数据库中
    student = jsonable_encoder(student)
    created_student = StudentService.add_student(student)
    # 把学生的信息返回给客户端
    return JSONResponse(status_code=status.HTTP_201_CREATED, content=created_student)

代码简洁了其实只是其中的一个好处，有了这个学生的代理服务，我们添加学生的脚本也能借用代理服务了，减少了写重复的代码：

# 把学生信息存入数据库中
student = get_student_from_somewhere()
created_student = StudentService.add_student(student)

瞬间我们的脚本也简洁易懂了很多。

其实，这样封装代码的好处远不止于让代码变好看，上面的代码用的是 mongo 数据库，假设有一天，我们要改成 mysql 数据库。如果我们没做这样的封装，我们就要分别改 api 和脚本中操作数据库的逻辑了，如果做了这样的封装，我们只需要在学生信息的代理服务层修改即可，工作量是会大幅减少的。

以后我们很可能还有别的服务代理层，比如班级的代理服务，可能也需要添加学生，这个时候我们就可以在服务代理层之间相互调用了。

不过咧，封装成这样还是差点意思

咱们再进一步思考一下：

假设随着业务发展，项目里的逻辑越来越多，我们不仅要对外提供增加学生的功能，还要提供查询、修改、删除等功能；更进一步，除了需要提供学生的增删改查，还要提供班级的增删该查，学校的增删改查等等。也就是说，操作数据库的地方会越来越多。

但大家会发现，我们对数据库的操作无外乎增删改查，所以其实我们可以在操作数据库这一层再添加一个代理层，把增加数据、删除数据、修改数据、查询数据等一系列操作再作一层封装，简单示例如下：

class DB:
    @classmethod
    def insert_one(cls, col, doc):
        """ 往集合中插入一个文档 """
        db = cls.get_db()
        return db[col].insert_one(doc)


    @classmethod
    def find_one_by_id(cls, col, id):
        pass
        
    @classmethod
    def update_one_by_id(cls, col, id, doc):
        pass
    
    @classmethod
    def delete_one_by_id(cls, col, id):
        pass

有了这层封装后，学生信息代理服务中添加学生的逻辑就可以这样写了：

class StudentService:
    
    col = "students"
    
    @classmethod
    async def add_student(cls, student: StudentModel):
        # 把学生信息存入数据库中
        new_student = DB.insert_one(col=cls.col, doc=student)
        # 根据返回的学生 id 查询这个学生的信息
        return DB.find_one_by_id(col=cls.col, id=new_student.inserted_id)

按照这样的层级封装代码，我们的代码除了更好维护外，可读性也会大幅提升。

有了以上的铺垫，我们再次回看示例项目的代码结构

相信经过这一番讲解，我们心中对业务代码分层这个事情应该有了一个比较本质的认识，了解了代码为什么要分层后，我们目光回到项目结构，只看核心部分：

├── app
│   ├── __init__.py
│   ├── __main__.py
│   ├── views
│   ├── services
│   ├── dao
│   ├── schemas
│   └── utils
│   ├── conf

现在应该很清晰了，一看到这种目录，类似 views/apis/controllers 这种目录，大概率放的就是 api 层的逻辑，api 层会把业务交给 services 代理服务层去完成，代理服务层操作数据的逻辑大概率会写在类似 dao/dal/db 这类型的目录中。

当然，我们不排除有的工程项目直接就把数据库操作写在 api 层。但只要我们深入了解过为什么要分层，再去看一些追求简便的设计就会变得非常简单。而且我们可以从一个更高纬度的角度去思考，如果要重构这个项目，如何才能做得更好？

当然项目不只有一种，我曾经也有过写前端的经历，按我现在的理解看，前端项目（甚至其他各种各样类型的项目）一样是可以合理分层的，重用代码的优雅封装永不过时，高内聚低耦合 yyds。

除了业务分层，项目里通常还有一个 model 目录，在这个示例里叫 schemas，其实表示的都是一样的意思，存放代码中用到的实体数据结构，比如学生的结构体，一些响应、请求的结构体等。

阿菌觉得实体数据结构设计要利用好继承关系

比如学生的基本信息类为：

class BaseStudentModel(BaseModel):
    # 姓名
    name: str = Field(...)
    # 年龄
    age: int = Field(...)

在更新学生信息的时候可以贯穿使用这个数据结构，避免传递过多的参数。

但在添加学生信息的时候，我们还需要指定一个 id 字段，这个时候就可以用继承（此处是操作 mongo 数据库的示例）：

class NewStudentModel(BaseStudentModel):
    id: PyObjectId = Field(default_factory=PyObjectId, alias="_id")

这样一来，我们就可以在工程中更灵活地使用实体数据结构传递参数了，也方便我们的项目基于类似 swagger 这样的工具自动生成 api 文档。

看完分层的目录后，剩下的就是一些工具类和配置类了，就这样，整个项目的轮廓就能了然于胸，剩下的就是啃具体的业务逻辑了。

最后，先在别人定义的概念下学习，然后跳出别人定义的概念去探究本质，这个算是我目前学习编程最大的心得了。其实第一步挺痛苦的，像我现在学 Kubernetes，简直要醉了，好多概念。不过好在一点都不怂，这些技术其实只是在各种计算机基础知识上不断封装组合，等我学透了再用大白话讲透它 T_T，老外创造概念的能力有点强啊…

往期推荐：

写代码解释什么是api，什么是sdk
飞机大战小游戏全制作过程分享
仿flappy bird小游戏制作分享
如何开始编写技术博客？markdown语法入门，分享使人进步
请求参数、表单参数、url参数、header参数、Cookie参数有什么区别？

python 命名实体识别_Python NLTK学习11（命名实体识别和关系抽取） weixin_39630762 python 命名实体识别
PythonNLTK学习11(命名实体识别和关系抽取)发表于:2017年7月27日阅读:18262除特别注明外，本站所有文章均为小杰Code原创本系列博客为学习《用Python进行自然语言处理》一书的学习笔记。命名实体识别命名实体识别(NER)系统的目标是识别所有文字提及的命名实体。可以分解成两个子任务：确定NE的边界和确定其类型。命名实体识别非常适用于基于分类器类型的方法来处理的任务。NLTK有
python断点调试出现问题_python的断点调试 weixin_39689870 python断点调试出现问题
在Python中也可以像gcc/gdb那样调试程序，只要在运行Python程序时引入pdb模块（假设要调试的程序名为d.py）：1$vid.py12345678#!/usr/bin/pythondefmain():i,sum=1,0foriinxrange(100):sum=sum+iprintsumif__name__=='__main__':main()1$python-mpdbd.py运行上
python命名实体识别工具,斯坦福大学使用NLTK命名实体识别器（NER）功能宇宙探索未解之迷 python命名实体识别工具
Isthispossible:toget(similarto)StanfordNamedEntityRecognizerfunctionalityusingjustNLTK?Isthereanyexample?Inparticular,IaminterestedinextractionLOCATIONpartoftext.Forexample,fromtextThemeetingwillbehel
android前台服务 Android西红柿 Android基础 android
关于作者：CSDN内容合伙人、技术专家，从零开始做日活千万级APP。专注于分享各领域原创系列文章，擅长java后端、移动开发、商业变现、人工智能等，希望大家多多支持。未经允许不得转载目录一、导读二、使用2.1添加权限2.2新建一个服务2.3构建通知消息2.4启动与停止服务三、推荐阅读一、导读我们继续总结学习基础知识，温故知新。今天记录下android前台服务（ForegroundService），
python做个游戏辅助_8个用于辅助项目的出色Python库 cumj63710 数据库 python java 大数据编程语言
python做个游戏辅助在Python/Django世界中我们有一句俗语：我们是为语言而来的，而是为社区而留下的。对我们大多数人来说都是如此，但是让我们留在Python世界中的另一件事是，有了一个想法并在午餐或晚上几个小时内快速地解决它是多么容易。本月，我们将深入研究我们喜欢用来快速擦除那些附带项目或午餐时间痒的Python库。即时将数据保存在数据库中：数据集当我们快速想要收集数据并将其保存到数据
用Python做一个绝地求生压枪版程序媛了了 python 开发语言
一、概述1.1效果总的来说，这种方式是通过图像识别来完成的，不侵入游戏，不读取内存，安全不被检测。1.2前置知识游戏中有各种不同的枪械，不同的枪械后坐力不一样，射速也不同。相同的枪械，装上不同的配件后，后坐力也会发生变化。枪械的y轴上移是固定的，x轴是随机的，因此我们程序只移动鼠标y轴。x轴游戏中手动操作。1.3实现原理简述通过python中的pynput模块监听键盘鼠标。监听鼠标左键按下，这个时
Python开发FastAPI从入门到精通赵梓宇 Python权威教程合集 fastapi python 前端
想用Python写API快到飞起？FastAPI就是你的“代码瑞士军刀”！这本书不讲玄学，只教真功夫——从零搭建高性能API，到微服务、分布式事务、熔断限流，连异步编程都能玩成魔法！小白也能变大神：路由、依赖注入、数据库集成手把手教学；老鸟直呼内行：服务网格、Saga模式、K8s部署实战全覆盖。附赠三个硬核项目：任务管理、在线商城、实时聊天系统，代码跑起来比老裁缝织毛衣还丝滑！别说我没提醒你：翻开
NLTK命名实体识别（NER） Mr数据杨 Python 自然语言技术 NLTK 自然语言处理 1024程序员节
命名实体识别（NamedEntityRecognition,NER）是自然语言处理（NLP）中的一项核心技术，旨在从文本中识别出具有特定意义的实体，如人名、地名、组织名等。通过对文本的自动化处理，NER能够帮助计算机理解和组织大量的非结构化数据，为信息抽取、搜索引擎优化、数据分析等领域提供强有力的技术支持。NLTK（NaturalLanguageToolkit）是一个广泛使用的Python库，提供
【算法】经典博弈论问题——威佐夫博弈 python 查理零世算法 python 开发语言
目录威佐夫博弈(WythoffGame)【模板】威佐夫博弈(WythoffGame)有两堆石子，数量任意，可以不同，游戏开始由两个人轮流取石子游戏规定，每次有两种不同的取法1)在任意的一堆中取走任意多的石子2)可以在两堆中同时取走相同数量的石子最后把石子全部取完者为胜者现在给出初始的两堆石子的数目，返回先手能不能获胜结论：小！=（大-小）*黄金分割比例，先手赢小=（大-小）*黄金分割比例，后手赢证
python 的sm2 生成密钥的方法，gmssl里没有提供密钥生成 CissSimkey python 算法机器学习
"""Author:tangleiDateTime:2024-11#importrandom#random不安全所以替换为secrets中的算法#选择素域，设置椭圆曲线参数"""importsecretsclassSM2_Key():default_ecc_table={'n':'FFFFFFFEFFFFFFFFFFFFFFFFFFFFFFFF7203DF6B21C6052B53BBF40939D
基于Python第三方模块fuzzywuzzy实现字符串匹配和相似度比较袁袁袁袁满 Python实用技巧大全 python 开发语言 fuzzywuzzy 符串匹配和相似度比较
文章目录一、引言二、安装三、核心模块与功能1.fuzz模块的主要函数2.process模块的主要函数四、应用场景五、性能与优化一、引言fuzzywuzzy是一个强大的Python库，专门用于执行模糊字符串匹配和相似度比较。由SeatGeek开发并开源，它基于Levenshtein距离（编辑距离）算法，能够处理字符串之间的拼写错误、格式差异以及部分匹配等问题。fuzzywuzzy在数据清洗、文本匹配
常见的反爬机制及应对策略极客点儿 #网络爬虫 Python 爬虫反爬
1.Headers:从用户的headers进行反爬是最常见的反爬策略,Headers是一种最常见的反爬机制Headers是一种区分浏览器行为和机器行为中最简单的方法，还有一些网站会对Referer（上级链接）进行检测从而实现爬虫。相应的解决措施：通过审查元素或者开发者工具获取相应的headers然后把相应的headers传输给python的requests，这样就能很好地绕过。2.IP限制一些网站
Python3 【函数】：见证算法的优雅与力量李智 - 重庆 Python 精讲精练 -从入门到实战算法 python 经验分享案例学习编程技巧学习方法
Python3【函数】：见证算法的优雅与力量一、问题描述使用3种不同的算法编写函数，实现如下功能：找出3个数中的最大数。二、算法实现使用if-elif-else语句实现defmax_of_three(a,b,c):ifa>=banda>=c:returnaelifb>=aandb>=c:returnbelse:returnc#示例调用print(max_of_three(10,20,15))#输出
【Python3爬虫】Scrapy入门教程 TM0831 Python3爬虫 Python3 网络爬虫
Python版本：3.5系统：Windows一、准备工作需要先安装几个库（pip，lxml，pywin32，Twisted，pyOpenSSL），这些都比较容易，如果使用的是Pycharm，就可以更方便的安装模块，在settings里可以选择版本进行下载。如果在命令行模式下输入pip-V出现'pip'不是内部或外部命令，也不是可运行的程序或批处理文件，先确保自己在环境变量中配置E:\Python3
GPTHUB @小马哥 AI chatgpt 文心一言
GPTHUB项目简介GPTHUB，基于AI大模型API实现的自建后端Chat服务，支持同步响应及流式响应，完美呈现打印机效果。支持一键切换ChatGPT(3.5、4.0)模型、月之暗面（Kimi）、文心一言(支持Stable-Diffusion-XL作图)、通义千问、讯飞星火、智谱清言(ChatGLM)等主流模型，后续模型持续对接中。项目包含java网页端、服务端、移动端及管理后台配置。使用参考下
Python 爬虫中的反爬策略及详细应对方法 winner8881 python 爬虫开发语言
在构建Python爬虫的过程中，网站为了保护自身资源和用户体验，常常会采取一系列反爬策略来限制或阻止自动化程序的访问。了解这些策略对于设计更智能、更合规的爬虫至关重要。以下是详细的反爬措施及其应对方法：1.User-Agent检测策略描述：许多网站会检查HTTP请求头中的User-Agent字段，以判断请求是否来自浏览器。如果发现是来自非标准用户代理（如Python默认的requests库），可能
1. Python Web 框架要点徐红珍 python django
PythonWeb框架要点1.Web应用程序处理流程2.Web程序框架的意义用于搭建Web应用程序免去不同Web应用相同代码部分的重复编写，只需关心Web应用核心的业务逻辑实现3.Web应用程序的本质接收并解析HTTP请求，获取具体的请求信息处理本次HTTP请求，即完成本次请求的业务逻辑处理构造并返回处理结果——HTTP响应百度ip地址：14.215.177.394.Web框架学习方法如何搭建工程
Miniforge详细安装教程（macOs和Windows）一直在学习的小白~ macos windows conda
(注：主要是解决商业应用anaconda收费问题，这是轻量级的代替，个人完全可以使用anaconda和miniconda)Miniforge是一个轻量级的包管理器，类似于Anaconda和Miniconda。它主要用于安装基于conda的Python环境，专注于兼容ARM架构的设备（如AppleM1/M2/M3芯片）和其它CPU架构。Miniforge使用conda-forge作为默认的包管理渠道
38个基于Python的Web 开发框架快乐星球没有乐 python 前端数据库
Web开发是Python应用中重要的一部分，下面总结了38个基于Python的Web开发框架！其中有的历史悠久，有的发展迅速，还有的已经停止维护，大家可以根据情况参考学习。1Django框架官网：https://github.com/django/django.gitDjango是一个开放源代码的Web应用框架，由纯Python写成，是目前Python语言中主流de三大Web框架之一(flask、
Python 简单爬虫教程 ANTennaaa Python python
就是突然想玩一下这里是一个下载网页内图片的例子环境Python3.7需首先安装pipinstalllxml-ihttps://mirrors.aliyun.com/pypi/simple#fromurllib.requestimporturlretrieve#第一种方法importrequests#第二种方法frombs4importBeautifulSoup'''Ifthetargetdirec
华为OD机试 - 字符串摘要（Python/JS/C/C++ 2023 B卷 100分）哪吒搬砖工逆袭Java架构师华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述给定一个字符串的摘要算法，请输出给定字符串的摘要值：去除字符串中
华为OD机试 - 疫情扩散时间计算 - 广度优先搜索（Python/JS/C/C++ 2024 C卷 200分）哪吒华为od 宽度优先 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述在一个地图中（地图有N*N个区域组成），有部分区域被感染病菌。感
华为OD机试 - 字符串统计（Python/JS/C/C++ 2024 C卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述给定两个字符集合，一个是全量字符集，一个是已占用字符集，已占用字
华为OD机试 - 服务器广播 - 并查集（Python/JS/C/C++ 2024 E卷 200分）哪吒华为od 服务器 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述服务器连接方式包括直接相连，间接连接。A和B直接连接，B和C直接
华为OD机试 - 单词搜索，找到它 - 回溯（Python/JS/C/C++ 2024 C卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述找到它是一个小游戏，你需要在一个矩阵中找到给定的单词。假设给定单
华为OD机试 - 乘坐保密电梯 - 回溯（Python/JS/C/C++ 2024 C卷 200分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述有一座保密大楼，你从0楼到达指定楼层m，必须这样的规则乘坐电梯：
华为OD机试 - 最长广播效应 - 广度优先搜索BFS（Python/JS/C/C++ 2024 C卷 200分）哪吒华为od 宽度优先 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述某通信网络中有N个网络结点，用1到N进行标识。网络中的结点互联互
华为OD机试 - 查找舆情热词（Python/JS/C/C++ 2024 C卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述网上新闻越来越多，希望对新闻进行热词处理并归类，方便获取信息，现
华为OD机试 - 考古问题 - 回溯、全排列问题（Python/JS/C/C++ 2024 C卷 200分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述考古问题，假设以前的石碑被打碎成了很多块，每块上面都有一个或若干
华为OD机试 - 机智的外卖员（Python/JS/C/C++ 2024 C卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述外卖员每天在大厦中送外卖，大厦共有L层（0<L<=10^5），
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后