shiter

大数据ETL实践探索（9）---- 使用pandas sqlalchemy 以及多进程进行百万级 postgresSQL 数据入库

文章大纲

0.基础性工作

连接类
sqlclchemy 基础操作
sqlalchemy 数据库shema 表样例
pandas 加速读取 excel

2.psycopg2 原生 api
3.pgAdmin 导入
4.pandas 数据清洗与to_sql方法录入数据

数据清洗

数据类型转换
数据脱敏
增加自增列

to_sql 数据录入

5.使用 sqlalchemy 批量录入方法

sqlalchemy 参数性能调优
PostgreSQL 参数优化
sqlalchemy DBsession 批量入数据

6.多进程配合 sqlalchemy 录入数据
7.使用cProfile 进行性能分析

cProfile
snakeviz可视化性能分析结果

参考文献

最近有个需求，需要将100W 40个字段左右的 excel 格式数据录入 postgreSQL 数据库。我想了几种办法：

使用psycopg2 原生 api
使用pgAdmin 页面建立好table 直接导入csv
使用pandas to_sql 方法
使用 sqlalchemy 批量录入方法
使用python 多进程，pandas 数据清洗后用 sqlalchemy 批量录入方法

先说一下结论吧，我实验的流程是读取3个文件大小分别是3000行，30万行，70万行，清洗合并后是一个111万行40 个字段的宽表。使用最后一种多进程批量入数据的方式，基本测试结果是，数据加载及清洗将近6分钟，数据入库6分钟。

我机器是i7 7500U 运行上述程序时候睿频加速到3.5GHz 左右，cpu 占用40%，数据清洗时候内存占用500-600MB 拆分入库阶段，内存占用飙升到2000MB - 4000MB 其中包含每个子进程单独占用70MB 左右。

后面且听我娓娓道来

0.基础性工作

连接类

主要作用是是数据库链接时候进行数据库链接字符串的管理

# data_to_database.py

class connet_databases:
    def __init__(self):
        '''
        # 初始化数据库连接，使用pymysql模块
        #
        '''
        _host = ''
        _port = 5432
        _databases = ''  # 'produce' #
        _username = ''
        _password = ''

        self._connect = r'postgres+psycopg2://{username}:{password}@{host}:{port}/{databases}'.format(
            username=_username,
            password=_password,
            host=_host,
            port=_port,
            databases=_databases)

sqlclchemy 基础操作

需要注意的一个细节是，sqlclchemy 对数据库的操作无论是 engine 这个客户端级别的还是 DBsession 这个级别的，在做完操作的时候，都应该关闭数据库链接。这在操作大量数据时候非常容易忽视。

使用：

DBSession.remove()
engine.dispose()



def init_sqlalchemy(dbname='',
                    Echo=True,
                    Base=declarative_base(),
                    DBSession=scoped_session(sessionmaker())):
    # 主要用来建立表
    print(dbname)
    engine = create_engine(dbname,
                           max_overflow=0,  # 超过连接池大小外最多创建的连接
                           pool_size=2,  # 连接池大小
                           pool_timeout=30,  # 池中没有线程最多等待的时间，否则报错
                           pool_recycle=-1,  # 多久之后对线程池中的线程进行一次连接的回收（重置）
                           echo=True)
    
    try:
        # engine = create_engine(dbname, echo=Echo)
        DBSession.remove()
        DBSession.configure(bind=engine, autoflush=False, expire_on_commit=False)

        Base.metadata.drop_all(engine)
        Base.metadata.create_all(engine)

        DBSession.flush()
        DBSession.commit()

    except Exception as e:
        error = traceback.format_exc()
        Multiprocess_loaddata_toDatabase.log.logger.error(error)

    finally:
        DBSession.remove()
        engine.dispose()





def get_conn(dbname, Echo=True):
    # 获取链接
    try:

        engine = create_engine(dbname, echo=Echo)
        DBSession = scoped_session(sessionmaker())
        #DBSession.remove()#scoped_session 本身是线程隔离的，这块不需要remove
        DBSession.configure(bind=engine, autoflush=False, expire_on_commit=False)

        return DBSession


    except:
        DBSession.rollback()
        raise

sqlalchemy 数据库shema 表样例


import sqlalchemy

from sqlalchemy import create_engine

from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import scoped_session, sessionmaker

from sqlalchemy import Column, TEXT, String, Integer, DateTime,Float
from sqlalchemy.ext.declarative import declarative_base


Base = declarative_base()

class DetailsOfDrugsItems(Base):
    '''
    # 定义诊疗项目明细对象:

    '''
    __tablename__ = 'details_of_drugs_items'

    # 表的结构:
    id = Column(String(64), primary_key=True)
    结算编号 = Column(String(64), index=True)
    单价 = Column(Float)
    数量 = Column(Float)
    总金额 = Column(Float)
    结算日期 = Column(DateTime)

    def __init__(self):
        pass

pandas 加速读取 excel

发现是应该可以加速读取csv，当然csv 怎么都快，使用modin 的pandas 比传统的快4倍其实就是加了个多进程或者线程，难点是加速读取大的excel，没有看到有效的解决方案。

官方文档：https://pypi.org/project/modin/
参考文档：https://www.jiqizhixin.com/articles/2019-04-13-2

pip install modin[dask]

import modin.pandas as pd


df = pd.read_csv("my_dataset.csv")

2.psycopg2 原生 api

文档链接：https://www.psycopg.org/docs/module.html

3.pgAdmin 导入

文档：https://www.pgadmin.org/docs/pgadmin4/development/import_export_data.html

导入文件支持3中方式：

binary for a .bin file.
csv for a .csv file.
text for a .txt file.

具体导入速度待测试

4.pandas 数据清洗与to_sql方法录入数据

数据清洗

pandas 数据清洗细节可以参考我的文章：

大数据ETL实践探索（5）---- 大数据ETL利器之 pandas

数据类型转换

# pandas_to_postgresql.py

def change_dtypes(col_int, col_float, df):
    '''
    AIM    -> Changing dtypes to save memory

    INPUT  -> List of column names (int, float), df

    OUTPUT -> updated df with smaller memory
    ------
    '''
    df[col_int] = df[col_int].astype('int32')
    df[col_float] = df[col_float].astype('float32')


def convert_str_datetime(df):
    '''
    AIM    -> Convert datetime(String) to datetime(format we want)

    INPUT  -> df

    OUTPUT -> updated df with new datetime format
    ------
    '''
    df.insert(loc=2, column='timestamp', value=pd.to_datetime(df.transdate, format='%Y-%m-%d %H:%M:%S.%f'))

from sqlalchemy import Column, TEXT, String, Integer, DateTime, Float


# 定义函数，自动输出DataFrme数据写入oracle的数类型字典表,配合to_sql方法使用(注意，其类型只能是SQLAlchemy type )
def mapping_df_types(df):
    dtypedict = {}
    for i, j in zip(df.columns, df.dtypes):
        if "object" in str(j):
            dtypedict.update({i: String(64)})
        if "float" in str(j):
            dtypedict.update({i: Float})
        if "int" in str(j):
            dtypedict.update({i: Float})
    return dtypedict

数据脱敏

几个数据脱敏的样例：

姓名脱敏


def desensitization_name(name):
    new_name = str(name)[0] + '**'
    return new_name

工作单位或者住址的脱敏

import random
def desensitization_location(location):
    length = random.randint(2, len(location))
    str_desensitization = ''
    for i in range(0, length):
        str_desensitization = str_desensitization + '*'
    temp_str = location[0:length - 1]
    new_location = location.replace(temp_str, str_desensitization)

    return new_location

#基本敏感信息进行脱敏
明细['姓名'] = 明细['姓名'].apply(pandas_to_postgresql.desensitization_name)
明细['单位名称'] = 住院明细['单位名称'].apply(pandas_to_postgresql.desensitization_location)

增加自增列

为了配合 sqlalchemy 的model 要求，每张表必须有主键，我们可以使用pandas 的dataframe 已经存在的 index 作为主键，或者使用一个自增的id。

使用index 作为id

pdf.rename(columns={'index': 'id'}, inplace=True)

需要注意的是，index 在join 或者连接操作后会带有dataframe 各自的信息，这会引起，主键不能重复的错误，所以，如果你的dataframe 直接从文件而来，不是拼接或者生成的可以直接使用index 如果是2次生成的，应该使用以下的方法生成自增唯一id


pdf = pdf.reset_index()

pdf['id'] = range(len(pdf))

to_sql 数据录入

参考文档：to_sql 方法文档


from sqlalchemy.types import Integer

engine = create_engine(data_to_database.connet_databases()._connect, echo=False)
df.to_sql('integers', con=engine, index=False,
          dtype={"A": Integer()})

5.使用 sqlalchemy 批量录入方法

不得不说的是sqlalchemy这个玩意的文档可读性真的很差。

sqlalchemy orm1.3 参考文档：https://docs.sqlalchemy.org/en/13/orm/index.html
PostgreSQL 支持参考文档（Support for the PostgreSQL database.）：https://docs.sqlalchemy.org/en/13/dialects/postgresql.html#module-sqlalchemy.dialects.postgresql.psycopg2

sqlalchemy 参数性能调优

其实本质就是加个create_engine参数：executemany_mode，别小看了这个参数，100万数据级别加上这个参数4个进程大概300s 入库完成，不加参数，4个进程入数据得将近一个小时，差了将近十倍。

简直是魔幻现实。

https://www.psycopg.org/docs/extras.html#fast-execution-helpers

Modern versions of psycopg2 include a feature known as Fast Execution Helpers , which have been shown in benchmarking to improve psycopg2’s executemany() performance, primarily with INSERT statements, by multiple orders of magnitude. SQLAlchemy allows this extension to be used for all executemany() style calls invoked by an Engine when used with multiple parameter sets, which includes the use of this feature both by the Core as well as by the ORM for inserts of objects with non-autogenerated primary key values, by adding the executemany_mode flag to create_engine():

engine = create_engine(
    "postgresql+psycopg2://scott:tiger@host/dbname",
    executemany_mode='batch')

Possible options for executemany_mode include:

None - By default, psycopg2’s extensions are not used, and the usual cursor.executemany() method is used when invoking batches of statements.

‘batch’ - Uses psycopg2.extras.execute_batch so that multiple copies of a SQL query, each one corresponding to a parameter set passed to executemany(), are joined into a single SQL string separated by a semicolon. This is the same behavior as was provided by the use_batch_mode=True flag.

‘values’- For Core insert() constructs only (including those emitted by the ORM automatically), the psycopg2.extras.execute_values extension is used so that multiple parameter sets are grouped into a single INSERT statement and joined together with multiple VALUES expressions. This method requires that the string text of the VALUES clause inside the INSERT statement is manipulated, so is only supported with a compiled insert() construct where the format is predictable. For all other constructs, including plain textual INSERT statements not rendered by the SQLAlchemy expression language compiler, the psycopg2.extras.execute_batch method is used. It is therefore important to note that “values” mode implies that “batch” mode is also used for all statements for which “values” mode does not apply.

For both strategies, the executemany_batch_page_size and executemany_values_page_size arguments control how many parameter sets should be represented in each execution. Because “values” mode implies a fallback down to “batch” mode for non-INSERT statements, there are two independent page size arguments. For each, the default value of None means to use psycopg2’s defaults, which at the time of this writing are quite low at 100. For the execute_values method, a number as high as 10000 may prove to be performant, whereas for execute_batch, as the number represents full statements repeated, a number closer to the default of 100 is likely more appropriate:

engine = create_engine(
    "postgresql+psycopg2://scott:tiger@host/dbname",
    executemany_mode='values',
    executemany_values_page_size=10000, executemany_batch_page_size=500)

PostgreSQL 参数优化

sqlalchemy DBsession 批量入数据



def insert_list(list_obj, DBSession):
    try:
       
        DBSession.add_all(list_obj)
        DBSession.flush()
        DBSession.commit()

    except:
        DBSession.rollback()
        raise



def bulk_insert(df_dict_list,DBSession,class_obj, BULK_SIZE):
    """
    将 pandas dataframe 转化成的字典，进行清洗后按照批次入库

    """
    try:

        nrows = len(df_dict_list)
        print(nrows)
        dataset = []
        
        for i in range(0,nrows):
# 直接使用 类对象内置的__dict__方法，对实例初始化
            temp_obj  = class_obj()
            line = df_dict_list[i]
            temp_obj.__dict__.update(line)

            dataset.append(temp_obj)

            if len(dataset) == BULK_SIZE:
                data_to_database.insert_list(dataset,DBSession)
                print('成功录入 %s 条记录'%(len(dataset)))
                Multiprocess_loaddata_toDatabase.log.logger.debug('成功录入 %s 条记录'%(len(dataset)))
                print(datetime.datetime.now())
                dataset = []
        if dataset:
            data_to_database.insert_list(dataset,DBSession)
            Multiprocess_loaddata_toDatabase.log.logger.debug('成功录入 %s 条记录' % (len(dataset)))
        print('录入完成')
        print(datetime.datetime.now())
    except Exception as e:
        error = traceback.format_exc()
        Multiprocess_loaddata_toDatabase.log.logger.error(error)
        return 0
    finally:
        DBSession.close()

6.多进程配合 sqlalchemy 录入数据

主要步骤有以下几个：

pandas 加载excel 中的数据
数据清洗，合并，过滤
dataframe 转化为dict 的list，并按照进程数进行分片

#pandas dataframe 转化为dict 的list，每行转化为单独的dict
pdf_dictList = pdf.to_dict(orient='records')


# 按照步长进行分片，步长实际上是 每次 录入的数据量

def get_fragmentation_lists(length, bulk_num):
    """获取所有对象 按照 bulk_num 拆分后的 下标列表
    length: 总记录数
    bulk_num: 拆分的步长
    """

    n = int(length / bulk_num)
    print("共计拆分的分片数量 ： %s" %n)
    Fragmentation_list = []
    for i in range(0, length, bulk_num):
        temp_list = []
        temp_list.append(i)
        if i + bulk_num - 1 >= length:
            temp_list.append(length)
        else:
            temp_list.append(i + bulk_num - 1)
        Fragmentation_list.append(temp_list)
    return Fragmentation_list

每个进程从队列中获取 dict_list[分片] 进行数据入库

import os
import time
import datetime
from sqlalchemy import create_engine
import multiprocessing
import pandas as pd
import traceback
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import scoped_session, sessionmaker
from multiprocessing import Pool

PROCESS_POOL = 4
BULK_NUM  = 1000



def insert_pg(dbname,class_obj,BULK_SIZE,df_dict_list):
    #
    print(dbname)
    engine = create_engine(dbname,
                           max_overflow=0,  # 超过连接池大小外最多创建的连接
                           pool_size=2,  # 连接池大小
                           pool_timeout=30,  # 池中没有线程最多等待的时间，否则报错
                           pool_recycle=-1, # 多久之后对线程池中的线程进行一次连接的回收（重置）
                           executemany_mode='values',
                           #executemany_values_page_size=10000, executemany_batch_page_size=500,
                        echo=True)
   
    try:


        #
        DBSession = scoped_session(sessionmaker())
        DBSession.configure(bind=engine, autoflush=False, expire_on_commit=False)
        print('insert_pg 开始插入 数据----')
        log.logger.debug('insert_pg 开始插入 数据----')
        pandas_to_postgresql.bulk_insert(df_dict_list,DBSession,class_obj, BULK_SIZE)
        DBSession.remove()
        #con.close()
    except Exception as e:
        error = traceback.format_exc()
        log.logger.error(error)

    finally:
        engine.dispose()





def run_insert_pool(df_dict,class_obj):
    '''
     传入的参数为 dataframe 转化为 dict
    '''
    start = time.time()

    print("开始切分 pandas dataframe dict")

    log.logger.debug('run_insert_pool 开始入库------')
    length = len(df_dict)
    fragmentation_list = get_fragmentation_lists(length, BULK_NUM)

    p = Pool(PROCESS_POOL)

    for fragmentation in fragmentation_list:
        
        log.logger.debug("多进程入库 %s"% str(fragmentation))
        tmp_dict_list = df_dict[fragmentation[0]:fragmentation[1]+1]
        p.apply_async(insert_pg, (data_to_database.connet_databases()._connect,class_obj,BULK_NUM,tmp_dict_list))

    print("---- run_insert_pool start----")
    p.close()
    p.join()
    end = time.time()
    print("Finish to insert data to pg spend:{}s".format(end - start))

7.使用cProfile 进行性能分析

cProfile

python profile 分析器

cProfile 和 profile 提供了 Python 程序的确定性性能分析。 profile 是一组统计数据，描述程序的各个部分执行的频率和时间。这些统计数据可以通过 pstats 模块格式化为报表。

Python 标准库提供了同一分析接口的两种不同实现：

对于大多数用户，建议使用 cProfile ；这是一个 C 扩展插件，因为其合理的运行开销，所以适合于分析长时间运行的程序。该插件基于 lsprof ，由 Brett Rosen 和 Ted Chaotter 贡献。

profile 是一个纯 Python 模块（cProfile 就是模拟其接口的 C 语言实现），但它会显著增加配置程序的开销。如果你正在尝试以某种方式扩展分析器，则使用此模块可能会更容易完成任务。该模块最初由 Jim Roskind 设计和编写。

注解 profiler 分析器模块被设计为给指定的程序提供执行概要文件，而不是用于基准测试目的（ timeit 才是用于此目标的，它能获得合理准确的结果）。这特别适用于将 Python 代码与 C 代码进行基准测试：分析器为Python 代码引入开销，但不会为 C级别的函数引入开销，因此 C 代码似乎比任何Python 代码都更快。

主函数使用

if __name__ == '__main__':
    multiprocessing.freeze_support()
    cProfile.run('main()', filename='result.out')
    import pstats
    p = pstats.Stats('result.out')
    # 按照运行时间和函数名进行排序
    # p.strip_dirs().sort_stats("cumulative", "name").print_stats(0.5)
    p.strip_dirs().sort_stats("cumulative", "name").print_stats(30)

Finish to insert data to pg spend:364.9579029083252s
Thu Jun 18 10:41:48 2020    result.out

785784290 function calls (785779755 primitive calls) in 765.932 seconds

   Ordered by: cumulative time, function name
   List reduced from 2347 to 30 due to restriction <30>

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
     47/1    0.000    0.000  765.933  765.933 {built-in method builtins.exec}
        1    1.498    1.498  765.933  765.933 Multiprocess_loaddata_toDatabase.py:345(main)
        1    0.208    0.208  764.433  764.433 Multiprocess_loaddata_toDatabase.py:245(insert_join_table)
        1    0.026    0.026  364.957  364.957 Multiprocess_loaddata_toDatabase.py:101(run_insert_pool)
        1    0.000    0.000  363.166  363.166 pool.py:550(join)
       17  362.958   21.350  362.958   21.350 {method 'acquire' of '_thread.lock' objects}
        6    0.000    0.000  362.937   60.490 threading.py:1000(join)
        6    0.000    0.000  362.937   60.490 threading.py:1038(_wait_for_tstate_lock)
        3    0.000    0.000  304.676  101.559 _base.py:270(read_excel)
        3    0.000    0.000  284.175   94.725 _base.py:812(__init__)
        3    0.000    0.000  284.174   94.725 _xlrd.py:11(__init__)
        3    0.000    0.000  284.165   94.722 _base.py:339(__init__)
        3    0.000    0.000  284.164   94.721 _xlrd.py:29(load_workbook)
        3    0.034    0.011  284.164   94.721 __init__.py:33(open_workbook)
        3    0.039    0.013  284.102   94.701 xlsx.py:784(open_workbook_2007_xml)
        4   18.369    4.592  282.878   70.720 xlsx.py:543(own_process_stream)
 34955476    5.731    0.000  197.262    0.000 ElementTree.py:1219(iterator)
    41510    0.062    0.000  163.220    0.004 ElementTree.py:1263(feed)
    41522    0.092    0.000  163.199    0.004 ElementTree.py:1627(feed)
    41541   50.586    0.001  163.107    0.004 {method 'Parse' of 'pyexpat.xmlparser' objects}
        1    0.000    0.000   82.747   82.747 frame.py:1304(to_dict)
        1    9.112    9.112   82.742   82.742 frame.py:1428(<listcomp>)
 34957080   47.454    0.000   72.091    0.000 ElementTree.py:1544(_start)
  1117359   48.202    0.000   66.051    0.000 xlsx.py:622(do_row)
 48962848   14.969    0.000   57.198    0.000 frame.py:1428(<genexpr>)
 50075640   37.530    0.000   47.326    0.000 common.py:85(maybe_box_datetimelike)
 34955468   14.041    0.000   40.430    0.000 ElementTree.py:1512(handler)
 34957080   14.921    0.000   23.842    0.000 ElementTree.py:1556(_end)
        3    0.000    0.000   20.501    6.834 _base.py:829(parse)
        3    0.045    0.015   20.501    6.834 _base.py:390(parse)



Process finished with exit code 0

ncalls
调用次数
tottime
在指定函数中消耗的总时间（不包括调用子函数的时间）
percall
是 tottime 除以 ncalls 的商
cumtime
指定的函数及其所有子函数（从调用到退出）消耗的累积时间。这个数字对于递归函数来说是准确的。
percall
是 cumtime 除以原始调用（次数）的商（即：函数运行一次的平均时间）

snakeviz可视化性能分析结果

SnakeViz is a viewer for Python profiling data that runs as a web application in your browser. It is inspired by the wxPython profile viewer RunSnakeRun.
snakeviz 文档

本地会启动一个页面，进行性能分析文件的展示

snakeviz result.out

可见函数的很大部分时间用来读取excel 了。

参考文献

Python大型文件数据读取及并行高效写入MongoDB代码分享
Python 多进程导入数据到 MySQL
性能分析与提升
好用的 Python Profile（性能/耗时分析）工具

活在当下：解锁生命中最珍贵的时刻
你是否常常发现自己陷入对过去的懊悔或对未来的焦虑？我们总是忙着追忆昨天或计划明天，却忽略了生命中唯一真实的存在——当下。哲学家和灵性导师们常说，时间是一种幻象，而当下才是我们生命的真正核心。这篇文章将带你探索“当下”的珍贵之处，以及如何通过专注于此刻，改变你的思维方式，活出更充实的生活。时间：我们自造的幻象我们习惯用时间来框定生活：昨天的遗憾、明天的目标，甚至下个月的计划。然而，哲学和灵性传统提醒
Android音视频探索之旅 | C++层使用OpenGL ES实现音频渲染慢行的骑兵音视频 android 音视频 NDK
一.前言OpenGLES实现视频渲染已经实现-在Android音视频探索之旅|C++层使用OpenGLES实现视频渲染中，这一次我们使用OpenGLES实现音频渲染。二.通过OpenSLES播放音频2.1.整体流程1.创建OpenSL引擎2.创建混音器3.创建播放器4.执行播音操作（OpenSLES的播音过程比较特别，不像视频那样每放完一帧就主动休眠，而是每帧音频播放结束会自己回调，在回调的时候才
推荐：React与WebRTC构建的1对1视频聊天应用潘俭渝Erik
推荐：React与WebRTC构建的1对1视频聊天应用去发现同类优质开源项目:https://gitcode.com/在这个数字化的时代，实时通信技术为我们提供了无限的可能性，而WebRTC（WebReal-TimeCommunication）正是其中的佼佼者。今天，我们向您推荐一个基于React框架实现的简单1对1视频聊天室示例项目，它集成了WebRTC和屏幕共享API，为学习和实践WebRTC
Android音视频探索之旅 | Webrtc 1对1音视频通话核心流程分析慢行的骑兵音视频 android 音视频 webrtc
一.前言使用Webrtc实现1对1的音视频通话，先从Web端进行学习要比直接从Android端进行学习要轻松许多（若没有JS和Html以及Node基础，查找相关基础教程，能梳理代码的逻辑即可）。本文Android端接入Webrtc是通过引入官方的sdk来实现的。本文涉及到的Demo代码包含三部分，服务器端、Web端、Android端。服务器端使用的是Node，Web使用的是Html和JS，Andr
签署提效85%，法大大电子合同赋能来伊份HR数字化创新
在数字化转型及创新成为企业发展主旋律的当下，电子合同作为富有“新基建”属性的基础设施之一，已成为企业数字化转型的“标配”，助力企业合同签署及管理降本增效的同时，有效提升了企业员工及客户的签约体验，更建立了企业在业内积极引领数字化建设的标杆形象。法大大基于丰富的客户合作经验，以及对各行业需求趋势的洞察，深度剖析不同行业知名企业电子合同应用的成功实践，以期为更多企业应用电子合同提供参考。本期我们将为大
是应该忍一时之气还是应该潇洒离开？轻嗅荷香
图片发自App在激烈的社会竞争中，我们也许想着在实践中锻炼自己的能力，希望通过工作来积累经验，从而维持生计、养家糊口。然而，找到一份适合自己的工作却难如登天。对于初入职场的新人来说，他们往往是同事中最容易受到老板批评的对象。也许是因为刚入职场，业务不熟悉而容易出错或业绩低下，也许是因为上级领导心中烦躁而令其无辜躺枪……当这种情况发生时，我们难免会产生激烈的情绪波动。要么是觉得老板咄咄逼人、尖酸刻薄
How to install and setup PostgreSQL on Ubuntu?
1.InstallationStepsforPostgreSQLonUbuntu1.1UpdatethePackageListOpenaterminalandrunthefollowingcommandtoensureyourpackagelistisup-to-date:sudoaptupdate1.2InstallPostgreSQLUsethefollowingcommandtoinstal
Python自动化神器：Pyautogui库实战指南码界奇点 Python python 自动化开发语言 python3.11 ui
欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。持续学习，不断总结，共同进步，为了踏实，做好当下事儿~非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。✨✨欢迎订阅本专栏✨✨TheStart点点关注，收藏不迷路文章目录1.PyAutoGUI简介1.1什么是PyAutoGUI？1.2安装
【学术会议投稿】Vue.js组件开发实战：从零构建高效可复用组件小周不想卷艾思科蓝学术会议投稿 vue.js
【IEEE出版|会后3-4个月EI检索】第三届云计算、大数据应用与软件工程国际学术会议(CBASE2024）_艾思科蓝_学术一站式服务平台更多学术会议请看：https://ais.cn/u/nuyAF3目录引言一、Vue.js组件开发基础二、构建高效可复用组件三、Vue.js组件的高级特性四、Vue.js的优点与缺点Vue.js的优点Vue.js的缺点引言在现代前端开发中，Vue.js凭借其简洁的
《世法哲言》（十三）生命在一呼一吸之间
南无羌佛说《世法哲言》（十三）『凡事应三思之弗觉，体实而再行之，不可闻言而从，亦不可听之否虚，三思之下实施无道者，当进而穷根之研，欲觅高天彩虹而遇乌云之布，则疑于霞辉之弗成也，是为过失。』古人有「三思而行，再思可矣」之说，实际上，光「三思而行，再思可矣」是不够的，在三思之后，还要具体去实践以观察真实效果，这也就是说，我们绝不可以听说一件事情就立刻不加思索地去办，而必须要加以认真思考和实践，但同时，
原创日更824篇——#用一年的时间重生#。三月小女子23点前睡觉
前两天我上床时我老公对我老二说，不能多吃零食，你看看你妈的腿那么粗，然后我上床叫上老二一起打他，其实是闹着玩的结果第二天，我再上床，我老二说，哇，妈妈，你的腿真细，把我笑得不行。今天晚上我又锻炼了，上床时问小猪猪妈妈腿细吗？小猪猪玩着电脑头也不抬说道：细细细，听我的，我说的对！哈哈哈(ಡωಡ)hiahiahiaDay6/21年度关键词：探索、践行、分享【输入】1.个人商业画布2.点评日记【输出】1
关于猫头虎，认识猫头虎，建联猫头虎，商务合作，产品评测，产品推广，个人自媒体创作，超级个体，涨粉秘籍，一起探索编程世界的无限可能！猫头虎猫头虎精品博客专栏 CSDN开发云人机交互交互程序人生程序员创富创业创新学习方法
猫头虎建联猫头虎，商务合作，产品评测，产品推广，个人自媒体创作，超级个体，涨粉秘籍，一起探索编程世界的无限可能！猫头虎是谁？大家好，我是猫头虎，别名猫头虎博主，擅长的技术领域包括云原生、前端、后端、运维和AI。我的博客主要分享技术教程、bug解决思路、开发工具教程、前沿科技资讯、产品评测图文、产品使用体验图文、产品优点推广文稿、产品横测对比文稿，以及线下技术沙龙活动参会体验文稿。内容涵盖云服务产品
浅析Vue3(vue3笔记之进阶篇) 唆键盘的小前端 Javascript 前端 vue 笔记 vue.js 前端前端框架 javascript windows
本文是结合实践中和学习技术文章总结出来的笔记(个人使用),如有雷同纯属正常((✿◠‿◠))喜欢的话点个赞,谢谢!有问题欢迎指正!!前面已经讲了基本的Vue生命周期和入门知识,本篇重点介绍Vue3的一些进阶知识1.vue-router路由Vue的路由对比React真是舒服太多了,路由守卫不需要自己配置,还可以方便自己添加一些自定义逻辑,比如在beforeEach加载进度条之类的,这里以Hash路由为
时序数据库的工业级对决：对比 Apache IoTDB 和 InfluxDB 时序数据说时序数据库 apache iotdb 数据库大数据开源
在数字化浪潮中，物联网（IoT）与工业大数据领域蓬勃发展，时序数据呈爆发式增长。时序数据库作为管理这类数据的核心工具，其性能、功能和适应性直接影响到整个系统的运行效率与价值实现。ApacheIoTDB和InfluxDB作为时序数据库领域的佼佼者，被广泛应用于各类场景。深入剖析二者区别，对开发者、企业架构师和数据管理者而言，不仅能为项目选型提供科学依据，还能助力挖掘数据的最大价值。一、诞生背景与社区
时序数据库IoTDB与OpenTSDB的对比分析时序数据说时序数据库 iotdb opentsdb 数据库大数据
在物联网与大数据场景下，时序数据库的选择对于系统性能、数据存储与分析能力至关重要。本文将围绕ApacheIoTDB与OpenTSDB这两款开源时序数据库进行对比分析，从分布式架构、部署易用性、分析与计算能力、性能表现以及产品迭代与维护情况五个关键维度展开，旨在为面临海量设备接入和实时数据分析需求的物联网架构师提供客观的技术选型参考。一、分布式架构‌ApacheIoTDB‌：IoTDB原生支持分布式
【Network Management】ComM模块中的PNState和ChannelState间的关系汽车电子嵌入式 AUTOSAR精进之路 AUTOSAR COM ComM PNC
目录前言正文1.ComMPNC状态机1.1进入COMM_PNC_FULL_COMMUNICATION的条件1.2.进入COMM_PNC_FULL_COMMUNICATION后执行的动作2.ComMChannel状态机3.ComMUser，Channel，PNC的关系4.总结前言在《【NetworkManagement】AUTOSAR局部网络管理从0到1配置实践》一文中我们介绍了如何从0到1配置PN
探索图形知识梳理[3.29] 虫zi
【课题名称】人教版数学五年级下册第三单元——探索图形【学习时间】2022年3月29日上午8：30-9：10【学习平台】国家中小学网络云平台(https://ykt.eduyun.cn/)【学习准备】准备笔记本和草稿本，边观看边记录。适时控制播放，按老师指令完成相应的课上练习。【学习任务】（1）进一步认识和理解正方体的特征。（2）通过观察、列表、想象等活动，经历发现正方体涂色和位置的规律的全过程，获
精读《能断金刚》（14）：六时书一心船长
6:471上一篇介绍到，要想将“万物潜能和意识铭印”这一套理念转化为个人事业上的成功，最好的实践方式是建立一个追踪体系，你用这个体系来积累你的行为。在西藏，这套体系被称为“undruk”，意思是“一天六次”，我们称之为“六时书”。具体如何实施？出门给自己买一本可以随身携带的小记事本。然后回顾之前提到的46个商业问题，从中找出自己最相关的三个问题。这些是你最棘手的三大问题。当某个问题化解或者情况有所
EFK架构日志采集系统
以下是基于‌Filebeat+Elasticsearch+Kibana（EFK）‌构建日志采集系统的核心要点及部署指南，综合多来源最佳实践整理：一、架构核心要点‌组件角色‌‌Filebeat‌：轻量级日志采集器，实时监控文件/目录变化，高效转发日志数据（资源占用仅为Logstash的1/10）。‌Elasticsearch‌：分布式搜索引擎，存储日志并提供实时检索与分析能力。‌Kibana‌：可视
生产环境PostgreSQL逻辑复制与高可用架构实战经验分享浅沫云归后端技术栈小结 PostgreSQL 逻辑复制高可用
生产环境PostgreSQL逻辑复制与高可用架构实战经验分享在大规模业务场景中，数据可靠性与可用性至关重要。本文结合真实生产环境案例，分享基于PostgreSQL逻辑复制（LogicalReplication）与流复制（StreamingReplication）建设高可用架构的全流程，包括选型、部署、故障切换与优化思考，为有一定数据库运维和后端基础的读者提供可落地的实战经验。一、业务场景描述业务特
鸿蒙实战开发（HarmonyOS ）网络连接管理
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）简介网络连接管理提供管理网络一些基础能力，包括WiFi/蜂窝/Etherne
鸿蒙开发进阶（HarmonyOS ）应用启动框架AppStartup应用实践案例你我皆是牛马星人鸿蒙开发 HarmonyOS OpenHarmony 1024程序员节 harmonyos 华为鸿蒙前端 android 鸿蒙系统
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）启动框架应用场景大型应用在启动过程中会加载大量的模块或SDK，各个模块或SD
2023-08-21 de5ea6d11ab2
易佳npdp学习笔记NPDP（NewProductDevelopmentProfessional）是产品经理国际资格认证。NPDP由美国产品开发与管理协会（PDMA）所发起，是国际公认的唯一的新产品开发专业认证，集理论、方法与实践为一体的全方位知识体系，为公司组织层级进行规划、决策、执行提供良好的方法体系支撑。经IBM采用后来被华为公司引入并取得巨大商业成功的IPD（IntegratedProdu
开源模型应用落地-OpenAI Agents SDK-集成多个MCP Servers与Qwen3-8B模型的创新应用探索（九）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言在人工智能技术迅猛发展的今天，如何让AI代理更高效地理解和操作外部资源成为行业关注的焦点。模型上下文协议（MCP）应运而生，作为一项由Anthropic推出的开源标准，它为AI系统提供了一种统一的方式来发现、检索和理解数据。与此同时，OpenAIAgents通过支持多种MCP服务器的集成，为开发者提供了更大的灵活性和扩展性。结合强大的Qwen3-8B模型，其不仅具备快速响应的能力，还能在复
Android NDK开发实战详解大王算法 android c++开发语言
目录一、概念二、AndroidNDK的作用三、开发中需要注意的问题3.1、明确使用场景3.2、JNI（JavaNativeInterface）3.3、ABI（应用二进制接口）兼容性3.4、内存与线程安全3.5、调试与工具链3.6、安全风险3.7、构建配置（CMake/ndk-build）3.8、兼容性与版本管理3.9、异常处理四、工程实践建议4.1、隔离原生代码：4.2、单元测试：4.3、渐进集成
种子实践计划第93天殷琴
目标:我可以轻松的实现在2019年1月份以后的每一个月的工资，将都是完完全全的属于我自己的，可以随意支配的了！动机：1我可以每个月安安心心的稳定的给妈妈和婆婆每人100元的孝顺金；感恩她们对子女的付出，希望可以让她们感受到更多的爱，和对金钱的安全感。2我有能力给孩子创造一个好的学习环境，给她一个快乐又充满智慧的童年！3自己也可以随心的购买自己想要的化妆品，衣服，等自己喜欢的东西，还可以存钱去上我一
2/7 关于正念冥想的几点注意方知方行
这是得到课程《怎样学会正念冥想》的部分学习笔记，把平时我在冥想的桑侯没有注意和意识到的问题总结下，以备后续练习实践：1有意的关注（平时练习时，通过调整赞成注意力的方式在做）。2非评判的态度（这里的意思并不是说不评判，而是意识到到评判，不要被自己的评判牵着走。产生评判是自然的。我之前的认知是：不能产生评判）。3理解当下（“当下”是我们身心所体验到的一切。大体分为两类：一类是发生在我们的内在体验，也可
Kotlin flow实践总结 Android技术圈
Flow是什么按顺序发出多个值的数据流。本质就是一个生产者消费者模型，生产者发送数据给消费者进行消费。冷流：当执行collect的时候（也就是有消费者的时候），生产者才开始发射数据流。生产者与消费者是一对一的关系。当生产者发送数据的时候，对应的消费者才可以收到数据。热流：不管有没有执行collect（也就是不管有没有消费者），生产者都会发射数据流到内存中。生产者与消费者是一对多的关系。当生产者发送
如何提高JPA项目的扩展性：模块解耦的实践与策略
在企业级开发中，JPA（JavaPersistenceAPI）因其对象关系映射的强大能力，常被用于构建业务层与数据层之间的桥梁。然而，随着项目复杂度增加，JPA项目常常面临模块之间强依赖、跨模块实体耦合、难以演进等问题，严重影响系统的可扩展性和可维护性。相比之下，MyBatis项目由于其“SQL即服务”的特性，天然具备更强的解耦性。本文将分析JPA项目中常见的模块依赖问题，探讨其背后的原因，并提供
Java 领域 Dubbo 服务注册与发现机制详解 Java大师兄学大数据AI应用开发 java dubbo 开发语言 ai
Java领域Dubbo服务注册与发现机制详解关键词：Dubbo、服务注册、服务发现、微服务、RPC、Zookeeper、负载均衡摘要：本文深入剖析了Dubbo框架中的服务注册与发现机制，从核心概念到实现原理，再到实际应用场景和最佳实践。我们将通过源码分析、架构图解和实战案例，全面讲解Dubbo如何实现高效的服务治理，包括注册中心的作用、服务提供者与消费者的交互流程、负载均衡策略等关键内容。文章还将
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$