weixin_30565199

写python代码的一点感想

记得之前写过一篇文章，html2javaben,并发布了一个相关的组件，大概的功能就是把抓取的html页面后抽取其中的结构化数据进行二次加工。最近在用python也在写一个好玩的抓取网页的东西，也想封装一个python版的这样的组件用，想不到前后大概花了2个小时构思，2个小时编码就搞定了。想起了以前用java写这个东西时，总是免不了最后出来的东西让你特别有“成就感”,看这包名结构就知道了，呵呵。

现在就用python去实现这个功能，感受下这个愉快的过程.

我们还是以之前文章中的html代码做为示例：

"height: 306px; width: 99%;">
    
        "width: 100px;" align="left">
            姓名：
        
            tony
        
    
    
        "left">
            员工编号：
        
            ite00395
        
    
    
        "left">
            性别：
        
            man
        
    
    
        "left">
            Email：
        
            [email protected]
        
    
    
        "left">
            MSN：
        
             [email protected]
        
    
    
        "left">
            公司电话：
        
            13712548548
        
    
    
        "left">
            移动电话：
        
            1371489634
        
    
    
        "left">
            所属部门：
        "middle">
            P后台项目组
        
    
    
        "left">
            部门地址：
        "middle">

"width: 100px;" align="left"> 姓名：	tony
"left"> 员工编号：	ite00395
"left"> 性别：	man
"left"> Email：	[email protected]
"left"> MSN：	[email protected]
"left"> 公司电话：	13712548548
"left"> 移动电话：	1371489634
"left"> 所属部门：	"middle"> P后台项目组
"left"> 部门地址：	"middle">

现在我们需要抽取的数据是这样的格式：

{'Name':'tony',
'Work':'ite00395',
'Sex':'man',
'Email':'[email protected]',
'Msn':'[email protected]',
'Phone':'13712548548',
'Mobile':'Mobile',
'Department':'P后台项目组',
'DeptAddress':''}

我希望封装的解析组件能完成如下的代码：

html_regular = {'Name':r'(.+?)',
                'Work':r'(.+?)',
                'Sex':r'(.+?)',
                ........}
HtmlParser(html_regular).parse(html)

上面两句代码的意思很明确：第一句代码是定义了html字符中我们待抽取的结构化数据的组织形式，即通过什么样的正则表达式去把这些数据匹配出来。第二句代码就是构造一个解析器去解析指定的html参数，输出我们想要的结构化数据.

对于比较复杂的数据结构，如List对象，嵌套对象，等等，我们也要提供支持。

list_regular = [{'groupKey':r'在html源码中分隔List数据的分隔符代码'},
                {'description':r'匹配description的正则表达式',
                 'date':r'匹配date的正则表达式'}]

以上结构是抽取List重复数据时的表达式定义：List中必需有且只有两个元素，第一个'groupKey'是对当前List结构在Html源码中的分隔字符，第二个元素是List组成元素的正则表达式匹配描述。

还是以前面的Html源码举例，如果现在的Html中有多个这个的数据：

<table style="height: 306px; width: 99%;">
    <tr>
        <th style="width: 100px;" align="left">
            姓名：th>
        <td>
            <span id="lblName">tony1span>
        td>
    tr>
    ....
    ....
    ....
table>
<table style="height: 306px; width: 99%;">
    <tr>
        <th style="width: 100px;" align="left">
            姓名：th>
        <td>
            <span id="lblName">tony2span>
        td>
    tr>
    ....
    ....
    ....
table>  
<table style="height: 306px; width: 99%;">
    <tr>
        <th style="width: 100px;" align="left">
            姓名：th>
        <td>
            <span id="lblName">tony3span>
        td>
    tr>
    ....
    ....
    ....
table>

可以看到这里的结构就是List，且有三个元素数据。所以这时的regular表达式应该这样描述：

list_regular = [{'groupKey':r''},
                {'Name':r'(.+?)',
                   ...}] 
以上描述完了我们希望的这个组件所具有的功能后，我们再看下具体的实现代码：
 
     1 # encoding: utf-8
 2 
 3 import re
 4 
 5 """
 6 Translate string of html to obj by specified regular
 7 """
 8 
 9 class HtmlParser():
10     def __init__(self,regular):
11         self.regular = regular
12 
13     def parse(self,html):
14         return parseNode(self.regular,html)
15 
16 
17 def processReg(exp,html):
18     p = re.compile(exp,re.DOTALL)
19     m = p.search(html)
20     if m:
21         try:
22             return m.group(1).strip()
23         except IndexError:
24             pass
25 
26 
27 
28 
29 def parseNode(node,html):
30     if type(node) is list:
31         objList = []
32         for itemStr in getSubHtmlGenerator(node[0]['groupKey'],html):
33             objList.append(parseNode(node[1],itemStr))
34         return objList
35     else:
36         obj = {}
37         for name,regular in node.items():
38             if type(regular) is str:
39                 obj[name] = processReg(regular,html)
40             else:
41                 obj[name] = parseNode(regular,html)
42         return obj
43 
44 
45 
46 def getSubHtmlGenerator(groupKey,html):
47     while True:
48         start = html.find(groupKey)
49         if start != -1:
50             end = html[start+len(groupKey):].find(groupKey)
51             if end!= -1:
52                 yield html[start:end + start + len(groupKey)]
53                 html = html[end+start+len(groupKey):]
54             else:
55                 yield html[start:]
56                 break
57         else:
58             break 
   
可以看到，包括注释加空行，总共58行代码，如果大家遇到过这样的需求和看过上面所写的这些，应该知道这58行代码所做的事，是不是很简单?
总结：
我写这篇文章不是说想介绍我写的这个组件，因为它都称不上一个组件，只是写了一个类，提供了一个方法。我真正的想说的是python这个语言所强在的东西，数据结构即代码，所写的，即是所表达的意思，简单清晰。
转载于:https://www.cnblogs.com/jcli/archive/2013/03/04/2942935.html

                    
                        
                        
                             
                        
                        
                        
                            
                        
                        
                        
                            
                        
                    
                

        你可能感兴趣的:(写python代码的一点感想)
        
            
                
                    2025.2.20总结
                        天真小巫
总结总结
                        今晚评测试报告，评到一半，由于看板数据没有分析完，最后让我搞完再评.尽管工作了多年的同事告诉我，活没干完，差距比较大，没资格评报告，但还是本着试试的态度，结果没想到评审如此严苛.内心多少有些受打击，毕竟，加班加点的工作，只为能取得个好的结果，但感觉无论怎么努力，还是把交代的工作干成了烂泥，有时候也会有些怀疑，到底能否胜任这份工作.为什么努力了，还是没能把事情做好.难道是我工作的方式有问题吗？工作中
                    
                    Conda 常用命令全解析
                        melck
conda
                        在Windows系统中，Conda是一款功能强大的包管理和环境管理工具，尤其对于数据分析、科学计算等场景有着重要的作用。本文将详细介绍Conda在Windows系统中的常用命令，帮助你高效地管理虚拟环境和软件包。一、环境管理命令1.1查看Conda版本conda--version该命令用于确认Conda是否成功安装以及查看其版本号。这对于确保Conda的兼容性和功能性非常重要。1.2创建新环境co
                    
                    CH340N的使用注意事项
                        鹿屿二向箔
单片机嵌入式硬件
                        使用CH340N将MCU的串口（UART）转换为USB输出是一种常见的方案，适用于需要将嵌入式设备连接到电脑的场景。以下是详细的连接方法和步骤：1.CH340N简介功能：CH340N是一款USB转串口芯片，支持USB2.0协议，可将UART信号转换为USB信号。特点：内置晶振，无需外部晶振。支持5V和3.3V电源电压。封装为SOP-8，体积小，适合紧凑设计。2.硬件连接以下是CH340N与MCU（
                    
                    nginx反向代理jupyter
                        jerry-89
jupyterlabnginxjupyterpython
                        1.jupyter配置打开配置文件/home/jack/.jupyter/jupyter_notebook_config.py2.反向代理配置这个/jack/与上面添加的对应location/jack/{proxy_passhttp://192.168.196.164:8888/jack/;proxy_set_headerHost$host;proxy_set_headerX-Real-IP$re
                    
                    动态规划之背包问题
                        于冬恋
动态规划算法
                        动态规划是一个重要的算法范式，它将一个问题分解为一系列更小的子问题，并通过存储子问题的解来避免重复计算，从而大幅提升时间效率。目录01背包问题完全背包问题多重背包问题二维费用背包问题（1）01背包问题给定n个物体，和一个容量为c的背包，物品i的重量为wi，其价值为应该如何选择装入背包的物品使其获得的总价值最大。可以用贪心算法，但是不一定能达到最优解，所以用动态规划解决创建一个数组dp[i][j]i
                    
                    欧*雅WCS项目总结
                        十五001
项目归档后端java程序人生
                        项目介绍使用系统APRISO下发任务与wcs交互，wcs包含与海康agv对接，以及APRISO不纳入管理的库位（包括线边库位、码头库位、暂存区库位、空栈板库位）。wcs的主要定位就是高度定制化贴合生产业务，可以说wcs成为了agv和APRISO之间的桥梁。APRISO下发任务时候，通过生成xml文件实现的，这时候wcs会监听该文件目录新建的xml文件来生成任务。刚开始部署后不到一周出现了监听失效问
                    
                    生产企业使用系统大全
                        十五001
其他笔记经验分享其他
                        作为一般企业员工可能只负责或对其中部分系统比较熟悉，其实如果是一个生产型企业完整的系统大全应该包含以下这些，但由于系统之间可能存在的边界模糊，会把其他系统的功能给进行合并，但不影响我们了解成熟系统所对应的职责，以下就是十大系统的功能：图来源于：白话聊IT一、MES（制造执行系统）核心作用：宛如一座桥梁，衔接企业的计划层（由ERP系统代表）与工厂的实际控制系统，专注于对工厂生产现场进行实时、精准的管
                    
                    JMM(Java内存模型)讲解
                        十五001
基础javajvm
                        JMM（JavaMemoryModel，Java内存模型）是Java并发编程中的一个非常重要的概念，它帮助我们理解Java程序在多线程环境下内存操作的行为。别担心，我会用简单易懂的方式来讲解，让你轻松掌握它的核心内容。1.什么是JMM？定义JMM是Java内存模型的简称，它定义了Java程序中内存操作的规则和规范。简单来说，JMM规定了Java程序中的变量存储在内存中的方式，以及线程如何读取和写入
                    
                    JavaScript 闭包与作用域的深度解析
                        小钟H呀
JS知识手册javascript开发语言ecmascript
                        引言在JavaScript世界里，闭包和作用域是两个核心概念，理解它们对于编写高效、可维护的代码至关重要。本文将深入探讨JavaScript闭包与作用域的原理、应用及注意事项。一、作用域的概念（一）什么是作用域作用域是指变量和函数的可访问范围。在JavaScript中，主要有全局作用域和局部作用域。全局作用域：在代码的任何地方都可以访问到的变量和函数，通常在脚本的最外层或通过全局对象（如windo
                    
                    如何快速定位并解决 Linux 系统性能瓶颈：终极全攻略
                        BitTalk
性能优化linux服务器java
                        在现代IT环境中，Linux系统被广泛应用于服务器、嵌入式设备和超级计算机等各类场景。随着系统负载的增加，性能瓶颈不可避免地会影响系统的可靠性和效率。因此，了解如何有效地诊断和解决Linux系统中的性能问题至关重要。本篇博客将深入探讨Linux性能瓶颈的可能来源，介绍各种性能评估方法和概念，并最终提供使用Linux命令查找性能瓶颈的实用指南。性能瓶颈的可能来源在Linux系统中，性能瓶颈可能出现在
                    
                    Python wifi 安装手机app
                        yichengace
python
                        目的当测试机数量越来越多时，测试包的安装会成为一个问题，用wifi安装来解决这个问题，并且用脚本语言来批量控制思路思路就是py调用pc端的adb命令，向手机发送请求，无线是因为，如果未来测试机越来越多，一台电脑的usb接口数量肯定不够准备工具python，adb，pycharm，测试用app，这里选择qq（https://qd.myapp.com/myapp/qqteam/AndroidQQ/mo
                    
                    【人工智能时代】- AI 聚合平台
                        xiaoli8748_软件开发
人工智能时代人工智能
                        最近听朋友介绍，国内有个团队开发了一个全功能的AI聚合平台，包含主流的GPT和绘画功能，以及一些其他的衍生功能，几乎应有尽有。于是，对AI很感兴趣的我，便也来瞧瞧这是个什么样的存在，以下便是我的真实使用感受。除此以外，作为一个程序员，我还使用了该平台提供的API接口，开发了一个简单的小程序。文章的末尾，我将提供免费的AI机器人，以及小程序体验地址，记得查收哦~官方网站：https://302.ai
                    
                    在瑞芯微RK3588平台上使用RKNN部署YOLOv8Pose模型的C++实战指南
                        机 ＿ 长
YOLO系列模型有效涨点改进深度学习落地实战YOLOc++开发语言
                        在人工智能和计算机视觉领域，人体姿态估计是一项极具挑战性的任务，它对于理解人类行为、增强人机交互等方面具有重要意义。YOLOv8Pose作为YOLO系列中的新成员，以其高效和准确性在人体姿态估计任务中脱颖而出。本文将详细介绍如何在瑞芯微RK3588平台上，使用RKNN（RockchipNeuralNetworkToolkit）框架部署YOLOv8Pose模型，并进行C++代码的编译和运行。注本文全
                    
                    国内大厂面试一般流程——扫盲
                        weixin_49526058
面试职场和发展
                        中国大型互联网企业的面试流程通常分为若干轮，具体轮数和考察内容可能因公司、岗位及招聘需求有所不同，但一般来说，大致可以分为以下几轮：1.简历筛选考察内容：主要看简历是否符合岗位要求，关注工作经历、项目经验、技术栈、学历背景等。如果简历突出，通常会进入下一轮面试。2.电话/视频初面（HR面）考察内容：HR面试主要是了解你的基本情况、动机和软技能。一般会问一些关于简历的问题，了解你对公司的了解、为什么
                    
                    transformer模型构建
                        AI耽误的大厨
自然语言处理nlptransformer算法人工智能神经网络word2vec
                        2.6模型构建学习目标掌握编码器-解码器结构的实现过程.掌握Transformer模型的构建过程.通过上面的小节,我们已经完成了所有组成部分的实现,接下来就来实现完整的编码器-解码器结构.Transformer总体架构图:编码器-解码器结构的代码实现#使用EncoderDecoder类来实现编码器-解码器结构classEncoderDecoder(nn.Module):def__init__(se
                    
                    深度学习之目标检测的常用标注工具
                        铭瑾熙
人工智能机器学习深度学习深度学习目标检测目标跟踪
                        1LabelImgLabelImg是一款开源的图像标注工具，标签可用于分类和目标检测，它是用Python编写的，并使用Qt作为其图形界面，简单好用。注释以PASCALVOC格式保存为XML文件，这是ImageNet使用的格式。此外，它还支持COCO数据集格式。2labelmelabelme是一款开源的图像/视频标注工具，标签可用于目标检测、分割和分类。灵感是来自于MIT开源的一款标注工具Label
                    
                    34、深度学习-自学之路-深入理解-NLP自然语言处理-RNN一个简单的程序，可以从程序中理解RNN的基本思想。
                        小宇爱
深度学习-自学之路深度学习自然语言处理rnn
                        importsys,random,mathfromcollectionsimportCounterimportnumpyasnpf=open('tasks_1-20_v1/en/qa1_single-supporting-fact_train.txt','r')raw=f.readlines()f.close()tokens=list()forlineinraw[0:1000]:tokens.ap
                    
                    ug12在win8计算机名错,我电脑是win8.1的 装ug8.0 装ug为什么会提示错误??
                        zc791022
ug12在win8计算机名错
                        可以安装，64位的可能要通用许可证才能安装。安装NX8.0.0.25之前，最好卸载掉“大于4.0”的许可服务(因为你只要装了8.0的许可服务，7.0/6.0/5.0都可以启动的)，安装后打不开NX8.0的，重启电脑试试！1.用记事本方式打开安装文件夹下的“crack\UGSLicensing\NX8.0.lic”(把里面SERVERthis_hostID=20110555528000里面的this
                    
                    ug12无法连接服务器系统,NX许可证错误：无法连接至许可证服务器系统。SPLM_LICENSE_SERVER错误[-15]...
                        逍遥药师
ug12无法连接服务器系统
                        问题原因这个问题可以说只要用过NX软件的工程师，都会遇到过，是最常见的NX许可证错误，可以说没有之一，因为这个提示只是告诉你，你的当前NX许可服务没有启动，就算是你安装完NX主程序不安装许可服务，也是这个提示。所以这个警告提示，实际上对你的问题参考没多大帮助。能让NX许可服务不能启动的原因有很多，所以只能自己去排查以下几种情况。解决方案1、检查你的NX许可服务有没有安装。(这是最基本，一般情况下不
                    
                    DeepSeek-R1 技术全景解析：从原理到实践的“炼金术配方” ——附多阶段训练流程图与核心误区澄清...
                        雪停时偶遇一叶春
流程图
                        合集-人工智能(5)1.如何改进AI模型在特定环境中的知识检索2024-09-242.深度学习与统计学中的时间序列预测2024-10-033.《使用coze搭建一个会搜索、写ppt、思维导图的Agent》2024-10-294.深入浅出：Agent如何调用工具——从OpenAIFunctionCall到CrewAI框架01-145.DeepSeek-R1技术全景解析：从原理到实践的“炼金术配方”—
                    
                    heidisql连接远程数据库_【已解决】HeidiSQL连接（登录）MySQL数据库报错10061问题...
                        weixin_39589511
heidisql连接远程数据库
                        windows核心编程---第六章线程的调度每个线程都有一个CONTEXT结构,保存在线程内核对象中.大约每隔20mswindows就会查看所有当前存在的线程内核对象.并在可调度的线程内核对象中选择一个,将其保存在CONTEXT结构的值载入c...【转】SQLite提示databasediskimageismalformed的解决方法SQLite有一个很严重的缺点就是不提供Repair命令.导致死
                    
                    计算机程序制作的小作品,义乌市中小学生电脑作品制作比赛201203
                        东南前哨
计算机程序制作的小作品
                        《义乌市中小学生电脑作品制作比赛201203》由会员分享，可在线阅读，更多相关《义乌市中小学生电脑作品制作比赛201203(4页珍藏版)》请在人人文库网上搜索。1、浙江省义乌市教育研修院关于举办2012年义乌市中小学生电脑作品制作比赛暨首届青少年网络道德建设专题创作活动的通知各中小学：为进一步推进和加强中小学信息技术教育，普及信息技术知识，培养学生创新精神和实践能力，提高信息技术水平，根据上级文件
                    
                    Python 舆论风向分析爬虫：全流程数据获取、清洗与情感剖析
                        西攻城狮北
python爬虫开发语言实战案例
                        引言在当今信息爆炸的时代，互联网上充斥着海量的用户言论和观点。了解舆论风向对于企业、政府机构以及研究者等具有重要的意义，可以帮助他们及时把握公众情绪、调整策略与决策。Python作为一种强大的编程语言，在数据爬取与分析方面具有得天独厚的优势，能够助力我们高效地实现舆情监测与深入剖析。一、环境搭建与目标确定1.环境搭建为了顺利完成爬虫与数据分析任务，首先需要确保你的开发环境已经安装了以下Python
                    
                    最新版AndroidStudio踩坑(新建项目无法正常运行)
                        沙漠蓝色披头
androidstudio
                        2023.7.20日雨今天花了六个小时才搞定新版AS创建app应用并可以运行，所以记录一下as版本是：AndroidStudioFlamingo|2022.2.1Patch2新建一个app应用，结果gradle一直下载不下来，提示connectrefuse，如果你配置了代理，建议设置为无代理同时要记得把.gradle/gradle.properties里面相关的代理设置给清除了，如果设置了代理的话
                    
                    Android. WebView出现net::ERR_UNKNOWN_URL_SCHEME错误
                        沙漠蓝色披头
小技巧webviewandroid
                        1.仔细观察图中url可以发现这是一个自定协议的url，究其原因，就是拦截webview中的url,如果url是自定义协议(如:tel,weixin,alipays等等)开头的,就url转换成原生调用(intent跳转),因为webview只能识别http,https这样的协议.webview其实就相当于pc端的浏览器,遇到http/https开头的url时会向host发起一个请求,而遇到自定义的
                    
                    Flutter一直停在 flutter pub get 的解决方法
                        沙漠蓝色披头
Flutter移动开发
                        设置用户变量FLUTTER_STORAGE_BASE_URL：https://storage.flutter-io.cnPUB_HOSTED_URL：https://pub.flutter-io.cn重启androidstudio亲测有效
                    
                    【HarmonyOS Next】鸿蒙监听手机按键
                        GeorgeGcs
HarmonyOS解决方案OpenHarmony知识体系harmonyos华为onKeyEvent按键监听事件按下鸿蒙
                        【HarmonyOSNext】鸿蒙监听手机按键一、前言应用开发中我们会遇到监听用户实体按键，或者扩展按键的需求。亦或者是在某些场景下，禁止用户按下某些按键的业务需求。这两种需求，鸿蒙都提供了对应的监听事件进行处理。onKeyEvent默认的按钮监听事件onKeyPreIme这是优先级最高的监听回调，别上面多了一个return开关，用于告诉系统监听事件是否再向下传递。窗口是第一级接收按钮事件的实体。
                    
                    【vue】Mammoth.js的使用：将.docx转换成HTML
                        暴富暴富暴富啦啦啦
1024程序员节
                        mammoth.convertToHtml(input,options）：把源文档转换为HTML文档mammoth.convertToMarkdown(input,options)：把源文档转换为Markdown文档。mammoth.extractRawText(input)：提取文档的原始文本。这将忽略文档中的所有格式。每个段落后跟两个换行符。npminstallelement-uimammot
                    
                    麒麟v10安装mysql5.7（ARM架构）
                        qqxinxi
arm开发
                        下载路径：华为云镜像麒麟v10是潮流时代的新时髦的linux操作系统，但随着ARM架构流行，出现了一些卡点，不以为然，没当回事的大吃一惊。经常卡住。例如:在安装mysql5.7（ARM架构）最简单：使用rpmmysql-5.7.27.1.el7.aarch64.rpm文件比较小下载完之后rpm-ivhmysql-5.7.27.1.el7.aarch64.rpm比较简单常用的方法，再不能连接互联网时
                    
                    YOLOv8 Pose使用RKNN进行推理
                        い不靠譜︶朱Sir
实用项目部署YOLO人工智能pythonlinuxpip
                        关注微信公众号：朱sir的小站，发送202411081即可免费获取源代码下载链接一、简单介绍YOLOv8-Pose是一种基于YOLOv8架构的姿态估计模型，能够识别图像中的关键点位置，这些关键点通常表示人体的关节、特征点或其他显著位置。该模型在COCO关键点数据集上训练，适合多种姿势估计任务。二、ONNX推理1.首先需要先将Pytorch模型转换为Onnx模型，下载pt模型这里给出官方的权重下载地
                    
                                TOMCAT在POST方法提交参数丢失问题
                                    357029540
javatomcatjsp
                                    摘自http://my.oschina.net/luckyi/blog/213209 
昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。 
 
检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。 
 
恢复较多数据后跟踪提交FORM DATA ，发现数
                                
                                在MyEclipse中增加JSP模板 删除-2008-08-18
                                    ljy325
jspxmlMyEclipse
                                    在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp  目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。 
然后在 D:\Progr
                                
                                JavaScript常用验证脚本总结
                                    eksliang
JavaScriptjavaScript表单验证
                                         转载请出自出处：http://eksliang.iteye.com/blog/2098985   
     下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! 
&nb
                                
                                微软BI（4）
                                    18289753290
微软BI SSIS
                                    1） 
Q:查看ssis里面某个控件输出的结果：  
A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 
这是我们在包里面定义的变量 
2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 
3) 
Q：ssis里面如果将多个数据源的数据插入目的端一
                                
                                定时对大数据量的表进行分表对数据备份
                                    酷的飞上天空
大数据量
                                    工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。 
  
分表工具：linux的shell + mysql自身提供的管理命令 
原理：使用一个和原表数据结构一样的表，替换原表。 
  
linux shell内容如下： 
=======================开始 
                                
                                本质的描述与因材施教
                                    永夜-极光
感想随笔
                                      
       不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。 
       我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 
  
     &
                                
                                很迷茫。。。
                                    随便小屋
随笔
                                    小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。 
  
先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
                                
                                23种设计模式的意图和适用范围
                                    aijuans
设计模式
                                    Factory Method  意图 定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。  　　适用性 当一个类不知道它所必须创建的对象的类的时候。  　　当一个类希望由它的子类来指定它所创建的对象的时候。  　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。  
Abstr
                                
                                Java中的synchronized和volatile
                                    aoyouzi
javavolatilesynchronized
                                    说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
                                
                                js数组的操作和this关键字
                                    百合不是茶
js数组操作this关键字
                                    js数组的操作; 
  
一:数组的创建: 
1、数组的创建

var array = new Array();　//创建一个数组

var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度

var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
                                
                                别人的阿里面试感悟
                                    bijian1013
面试分享工作感悟阿里面试
                                    原文如下：http://greemranqq.iteye.com/blog/2007170 
        一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ 
   &nb
                                
                                淘宝的测试框架Itest
                                    Bill_chen
springmaven框架单元测试JUnit
                                    Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心， 
集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。 
近期项目中用了下，有关itest的具体使用如下： 
1.在Maven中引入itest框架： 
<dependency> 
  <groupId>com.taobao.test</groupId&g
                                
                                【Java多线程二】多路条件解决生产者消费者问题
                                    bit1129
java多线程
                                    package com.tom;

import java.util.LinkedList;
import java.util.Queue;
import java.util.concurrent.ThreadLocalRandom;
import java.util.concurrent.locks.Condition;
import java.util.concurrent.loc
                                
                                汉字转拼音pinyin4j
                                    白糖_
pinyin4j
                                     以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： 
  
  

import java.util.HashSet;
import java.util.Set;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin
                                
                                org.hibernate.TransactionException: JDBC begin failed解决方案
                                    bozch
ssh数据库异常DBCP
                                    org.hibernate.TransactionException: JDBC begin failed:     at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68)    at org.hibernate.impl.SessionImp
                                
                                java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合
                                    bylijinnan
java
                                    
import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashMap;
import java.util.HashSet;
import java.util.Iterator;
import java.util.List;
import java.util.Map;
import java.ut
                                
                                Java PrintWriter打印乱码
                                    chenbowen00
java
                                    一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。 
读文件： 
BufferedReader 
从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。 
 
可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。 
 
通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
                                
                                [天气与气候]极端气候环境
                                    comsci
环境
                                     
 
      如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 
 
 
     那么地球上的国家应该做什么样的防备工作呢? 
 
 
 &n
                                
                                oracle order by与union一起使用的用法
                                    daizj
UNIONoracleorder by
                                    当使用union操作时，排序语句必须放在最后面才正确，如下： 
 
 
只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So： 
如果unoin的几个子查询列名不同，如 
Sql代码  
select supplier_id, supplier_name  
from suppliers  
UNI
                                
                                zeus持久层读写分离单元测试
                                    deng520159
单元测试
                                    本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 
1.ZeusMasterSlaveTest.java 
package com.dengliang.zeus.webdemo.test;

import java.util.ArrayList;
import java.util.List;

import org.junit.Assert;
import org.j
                                
                                Yii 截取字符串(UTF-8) 使用组件
                                    dcj3sjt126com
yii
                                    1.将Helper.php放进protected\components文件夹下。 
2.调用方法： 
  Helper::truncate_utf8_string($content,20,false);   //不显示省略号  Helper::truncate_utf8_string($content,20);  //显示省略号  
&n
                                
                                安装memcache及php扩展
                                    dcj3sjt126com
PHP
                                    安装memcache    tar zxvf memcache-2.2.5.tgz     cd memcache-2.2.5/     /usr/local/php/bin/phpize (?)    ./configure --with-php-confi
                                
                                JsonObject 处理日期
                                    feifeilinlin521
javajsonJsonOjbectJsonArrayJSONException
                                        写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException  原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说  直接上代码 
 &n
                                
                                Ehcache（06）——监听器
                                    234390216
监听器listenerehcache
                                    监听器 
  
       Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。 
 
                                
                                activiti 自带设计器中chrome 34版本不能打开bug的解决
                                    jackyrong
Activiti
                                      在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以， 
经证实为bug，参考 
http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 
 
修改为，找到 
oryx.debug.js 
 
在最头部增加 
 

if (!Document.
                                
                                微信收货地址共享接口-终极解决
                                    laotu5i0
微信开发
                                       最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。 
   如果你能搜到本贴，说明你已经碰到了各种 ed
                                
                                关于人才
                                    netkiller.github.com
工作面试招聘netkiller人才
                                    关于人才 
每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。 与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。 
总结就是“盲目推荐，以量取胜”。  
目前现状 
许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。 
企业招聘，通常是需要用人的部门提出招聘条件，由人
                                
                                搭建 CentOS 6 服务器 - 目录
                                    rensanning
centos
                                    (1) 安装CentOS 
ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox） 
详细内容 
 
 
(2) Linux常用命令 
cd、ls、rm、chmod...... 
详细内容 
 
 
(3) 初始环境设置 
用户管理、网络设置、安全设置...... 
详细内容 
 
 
(4) 常驻服务Daemon
                                
                                【求助】mongoDB无法更新主键
                                    toknowme
mongodb
                                           Query query = new Query();            query.addCriteria(new Criteria("_id").is(o.getId()));                    &n
                                
                                jquery 页面滚动到底部自动加载插件集合
                                    xp9802
jquery
                                    很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 
1. jQuery ScrollPagination 
jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 
2. jQuery Screw 
S
                                
                
            
        
    

    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    

    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.