zenRRan

关于Scikit-Learn你（也许）不知道的10件事

点击上方，选择星标或置顶，每天给你送干货！

阅读大概需要6分钟

跟随小博主，每天进步一丢丢

作者 | Rebecca Vickery

原文 | 见页面左下角『阅读原文』

编译 | NewBeeNLP公众号

写在前面

Scikit-learn是使用最广泛的Python机器学习库之一。它有标准化和简单的接口，用于数据预处理和模型训练、优化以及评估。

这个项目最初是由David Cournapeau 开发的Google Summer of Code 项目，并于2010年首次公开发布。自创建以来，该库已经发展成为一个丰富的生态系统，用于开发机器学习模型。随着时间的推移，该项目开发了许多方便的功能，以增强其易用性。在本文中，我将介绍你可能不知道的10个关于Scikit-learn最有用的特性。

1. 内置数据集

Scikit-learn API内置了各种toy和real-world数据集^[1]。这些可以便捷地通过一行代码访问，如果你正在学习或只是想快速尝试新功能，这会非常有用。

你还可以使用make_regression()、make_blobs()和make_classification()生成合成数据集。所有加载实用程序都提供了返回已拆分为X（特征）和y（目标）的数据选项，以便它们可以直接用于训练模型。

2. 获取公开数据集

如果你想直接通过Scikit-learn访问更多的公共可用数据集，请了解，有一个方便的函数datasets.fetch_openml，可以让您直接从openml.org网站^[2]获取数据。这个网站包含超过21000个不同的数据集，可以用于机器学习项目。

3. 内置分类器来训练baseline

在为项目开发机器学习模型时，首先创建一个baseline模型是非常有必要的。这个模型在本质上应该是一个“dummy”模型，比如一个总是预测最频繁出现的类的模型。这就提供了一个基准，用来对你的“智能”模型进行基准测试，这样你就可以确保它的性能比随机结果更好。

Scikit learn包括用于分类任务的DummyClassifier() 和用于基于回归问题的 DummyRegressor()。

4. 内置绘图api

Scikit learn有一个内置的绘图API，允许你在不导入任何其他库的情况下可视化模型性能。包括以下绘图：部分相关图、混淆矩阵、精确召回曲线和ROC曲线。

5. 内置特征选择方法

提高模型性能的一种技术是只使用最好的特征集或通过删除冗余特征来训练模型。这个过程称为特征选择。

Scikit learn有许多函数来执行特征选择。一个示例为 SelectPercentile()，该方法根据所选的统计方法选择性能最好的X百分位特征进行评分。

6. 机器学习pipeline

除了为机器学习提供广泛的算法外，Scikit learn还具有一系列用于「预处理」和「转换数据」的功能。为了促进机器学习工作流程的再现性和简单性，Scikit learn创建了管道（pipeline），允许将大量预处理步骤与模型训练阶段链接在一起。

管道将工作流中的所有步骤存储为单个实体，可以通过「fit」和「predict」方法调用该实体。在管道对象上调用fit方法时，预处理步骤和模型训练将自动执行。

7. ColumnTransformer

在许多数据集中，你将拥有不同类型的特征，需要应用不同的预处理步骤。例如，可能有分类数据和连续数据的混合，你可能希望通过one-hot编码将分类数据转换为数字，并缩放数字变量。

Scikit-learn管道有一个名为ColumnTransformer的函数，它允许你通过索引或指定列名来轻松指定要对哪些列应用最适当的预处理。

8. 管道的HTML形式

管道通常会变得非常复杂，尤其是在处理真实世界的数据时。因此，scikit-learn提供了一种方法来输出管道中步骤的HTML图表^[3]，非常方便。

9. 可视化树模型

plot_tree() 函数允许你创建决策树模型中的步骤图。

10. 丰富的第三方扩展

许多第三方库可以更好地扩展scikit-learn的特性。举个栗子，category-encoders库，它为分类特性提供了更大范围的预处理方法，以及ELI5包以实现更大的模型可解释性。这两个包也可以直接在Scikit-learn管道中使用。

本文参考资料

[1]

toy和real-world数据集: https://scikit-learn.org/stable/datasets/index.html

[2]

openml.org网站: https://www.openml.org/home

[3]

HTML图表: https://scikit-learn.org/stable/modules/compose.html#visualizing-composite-estimators

- END -

说个正事哈

由于微信平台算法改版，公号内容将不再以时间排序展示，如果大家想第一时间看到我们的推送，强烈建议星标我们和给我们多点点【在看】。星标具体步骤为：

（1）点击页面最上方“深度学习自然语言处理”，进入公众号主页。

（2）点击右上角的小点点，在弹出页面点击“设为星标”，就可以啦。

感谢支持，比心。

投稿或交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐两个专辑给大家：

专辑 | 李宏毅人类语言处理2020笔记

专辑 | NLP论文解读

整理不易，还望给个在看！

你可能感兴趣的:(关于Scikit-Learn你（也许）不知道的10件事)

ros2 rclpy 详解 --创建 python类型节点 Lntano__y ros2学习 python python ros2 rclpy
rclpy是ROS2(RobotOperatingSystem2)中用于Python的客户端库。它提供了与ROS2系统交互的API，使开发者能够使用Python编写ROS2节点、发布和订阅消息、调用服务、定时器等。rclpy是ROS2的核心库之一，为Python开发者提供了与ROS2系统进行通信的能力。rclpy的基本功能创建节点：提供创建和管理ROS2节点的功能。发布/订阅消息：支持创建发布者和
静态路由原理与配置影龙帝皖网络
目录一.路由1.概述2.路由表的形成2.1直连网段2.2非直连网段1.定义和原理2.获取方式二.路由的种类及配置方式三.路由器转发数据包的封装过程四.小结一.路由1.概述从源主机到目标主机的转发过程。2.路由表的形成2.1直连网段在路由器的接口上配置IP地址，并开启接口，即可自动生成相关的直连网段路由。2.2非直连网段1.定义和原理路由器不是通过自身直连接口所获得的通往其他网络的路径信息，需要借助
Next.js 是一个基于 React 的轻量级框架，它大数据后端
简介Next.js是一个基于React的轻量级框架，它使得构建服务端渲染(SSR)和静态站点生成(SSG)的React程序变得简单和高效。它拥有一系列特性和优势，包括但不限于:服务器端渲染（SSR）：Next.js支持开箱即用的服务器端渲染，这有助于提高首次加载页面的速度和SEO效果。静态站点生成（SSG）：可以提前生成静态文件，在请求时直接返回HTML文件，适合博客、文档等不经常变化的内容。增量
架构设计：负载均衡层设计方案（2 xjdwlq2022 Java 经验分享架构 java
./configure–prefix=/usr/nginx-1.8.0make&&makeinstall整个验证、编译、安装过程不应该报任何错误。如果您使用prefix设置了安装目标目录，那么可能您还需要在/etc/profix文件中设置环境变量：2.3、安装验证和启动下面介绍几个nginx常用的命令，如果您可以正常使用这些命令，那么说明nginx已经安装成功了。nginx：直接在命令行键入ngi
防火墙的负载分担双机热备 IT_小薇子华为防火墙网络 linux 运维
一、认识负载分担双机热备：基于VRRP实现负载分担双机热备如果要两台FW工作在负载分担模式，两台FW上都要有状态配置为active的VRRP备份组。如图1所示，FW_A的VRRP备份组1和3状态被配置成active，VRRP备份组2和4状态被配置成standby。FW_B的VRRP备份组2和4状态被配置成active，VRRP备份组1和3状态被配置成standby。正常情况下，两台设备的VGMP组
95%开发者不知道的调试黑科技:Apipost让WebSocket开发效率翻倍的秘密
95%开发者不知道的调试黑科技:Apipost让WebSocket开发效率翻倍的秘密在现代Web开发中，Websocket作为一种常见的Web协议，与RestfulAPI有着本质的不同。RestfulAPI是基于请求-响应模式的单向通信，而WebSocket提供全双工通信渠道，允许客户端和服务器之间进行实时双向数据传输。这种特性使得它在需要实时交互的场景中大放异彩，比如IM系统、聊天系统、客服系统
EDPose：探讨端到端的实时多人姿态估计烧技湾 AI &Computer Vision HPE 人体姿态估计端到端检测
作者：曾爱玲（港中文博士，现已入职腾讯）单位：IDEA（深圳数字经济研究院）源码：github/ED-Pose该篇论文取得效果如下：这篇文章的优势在于：在复杂的多人场景下能够取得不错的性能提升，虽然在COCO等数据集上的提升不明显。这种端到端的方法，优势在于检测到人体是检测到关键点的一个保证。目录摘要一、介绍二、相关工作2.1.单阶段多人姿态估计2.2检测变压器：三、重新思考单阶段多人姿态估计3.
使用Python从酷狗音乐网站下载音乐 0zxm 爬虫实战项目 python 网络爬虫前端 xhtml
当然可以！以下是你的博客文章的Markdown格式：使用Python从酷狗音乐网站下载音乐!!!本程序仅供学习参考1.程序介绍这个程序使用了Python的requests库，以及一些哈希算法来实现从酷狗音乐网站搜索歌曲并下载的功能。下面是它的主要功能：从酷狗音乐网站搜索歌曲展示搜索结果列表选择并下载指定的歌曲2.代码实现#代码实现部分，包括get_signature、get_list、show_l
FTP 与 TFTP 的详细异同点忧虑的乌龟蛋记录网络 tftp 计网 ftp 端口号应用层 network
文章目录前言一、协议对比FTP（FileTransferProtocol）TFTP（TrivialFileTransferProtocol）二、异同点对比三、详细分析3.1协议类型3.2功能3.3用户认证3.4使用场景3.5安全性3.6传输速度四、适用场景FTP的适用场景TFTP的适用场景前言在网络文件传输协议中，FTP（FileTransferProtocol）和TFTP（TrivialFile
如何解决SQL Server占用内存过多的问题云服务器sqlserver运维
在数据库管理中，SQLServer占用过多内存是一个常见的问题。这可能会导致响应缓慢、查询性能低下等问题。整体流程下面的表格展示了处理SQLServer占用内存过多的基本流程。步骤操作说明步骤1查看SQLServer的内存使用情况步骤2分析内存使用情况步骤3优化SQLServer配置步骤4对查询进行优化步骤5监控改善效果步骤详解步骤1：查看SQLServer的内存使用情况首先，我们可以通过运行一条
Java集合_八股&场景题吃海鲜的骆驼面试专题 java 开发语言
Java集合在Java开发中，集合框架是面试和实际开发中非常重要的内容。以下是一些常见的Java集合八股文问题和场景题，以及详细答案和示例代码。1.Java集合框架的结构是什么？答案：Java集合框架主要分为三大接口：Collection、Map和Queue。Collection：是集合的顶级接口，它又分为List和Set。List：有序集合，允许重复元素，如ArrayList、LinkedLis
Java多线程和锁_八股&场景题吃海鲜的骆驼面试专题 java 开发语言
Java多线程_八股&场景题Java多线程是面试和实际开发中非常重要的内容。以下是一些常见的Java多线程八股文问题和场景题，以及详细答案和示例代码。1.Java中创建线程的几种方式？答案：主要有以下几种方式：继承Thread类：重写run()方法，通过start()启动线程。实现Runnable接口：实现run()方法，通过Thread类启动线程。实现Callable接口：通过FutureTas
JVM常见八股问题学Java的skyyyyyyyy jvm java
1.什么是JVM?回答：JVM是Java虚拟机，负责将Java字节码转换为机器码并执行。它提供了内存管理、垃圾回收、线程管理等功能，使得Java程序能够在不同操作系统上运行而无需修改。2.JVM的内存结构是什么？JVM内存结构主要包括以下几个部分：方法区：存储类的结构信息，如类名、访问修饰符、常量池、字段描述等。堆区：存储对象实例，几乎所有的对象都在这里分配内存。栈区：每个线程都有一个栈帧，用于存
程序员效率革命：DeepSeek深度使用手册与实战技巧全揭秘后端
最近在技术社区里总能看到DeepSeek的身影，让我想起去年那个加班到凌晨三点的项目——当时为了调试分布式系统中的异步任务，整个团队在会议室里对着满墙的报错日志抓耳挠腮。直到后端老张突然掏出DeepSeek的实时监控模块，那些原本像天书一样的日志突然就变得脉络清晰起来。今天的程序员工具箱里，这个来自中国的AI开发平台正在掀起一场静悄悄的效率革命。刚接触DeepSeek时，我和很多同行一样，以为它就
Training-Free Transformer Architecture Search WithZero-Cost Proxy Guided Evolution（预览版本）境心镜 transformer 深度学习人工智能
摘要Transformers已表现出卓越的性能，然而，其架构设计是一个耗时的过程，需要专业知识和反复试验。因此，研究通过Transformer架构搜索(TAS)自动搜索高性能Transformers的有效方法是值得的。为了提高搜索效率，基于无训练代理的方法已在神经架构搜索(NAS)中得到广泛采用。然而，这些代理被发现不足以很好地推广到Transformer搜索空间，这一点已被多项研究和我们自己的实
python数据分析一周速成2.连表查询【含数据库实战项目】噼里啪啦噼酷啪Q 数据分析数据分析 CDA python
连表查询结合数据库实战（sql和hive跨库取数）数据准备#前面省略数据库连接，提示：可以用pymysql和pyhive模块pre_sql="""selectap,timefrombiaoyiawherea.time>20250101"""sql_df=run_mysql(pre_sql)pre_hive="""selectapplication_number,activation_dtefrom
程序员必看！手把手教你玩转DeepSeek大模型的5个实战技巧后端
上个月在克拉玛依云计算产业园，我亲眼见到值班工程师用DeepSeek-R1大模型自动生成油田设备监测报告，原本需要3小时的工作现在10分钟就能完成。这让我突然意识到，这个刷爆朋友圈的AI工具，已经悄悄改变了程序员的工作方式。今天就跟大家聊聊，怎么让这个"代码外挂"真正成为你的生产力加速器。最近广东15个城市的政务系统集体升级，背后的秘密武器就是DeepSeek大模型。深圳程序员48小时完成全栈适配
程序员如何用DeepSeek提升开发效率？这些隐藏技巧让你少走弯路后端
昨天凌晨三点，我盯着屏幕上死活调不通的接口文档，咖啡杯在桌角堆成金字塔。就在即将砸键盘的前一刻，突然想起同事老王推荐的DeepSeek。没想到这个看似普通的工具，竟让我半小时就定位到了跨域请求的配置错误。看着窗外泛起鱼肚白的天际线，突然意识到——程序员与Bug的战争，可能就差一个好工具的距离。很多新手容易把DeepSeek当作高级版搜索引擎，其实它的代码理解能力堪比资深架构师。上周帮实习生小张排查
第N4周：NLP中的文本嵌入 OreoCC 自然语言处理人工智能
本人往期文章可查阅：深度学习总结词嵌入是一种用于自然语言处理（NLP）的技术，用于将单词表示为数字，以便计算机可以处理它们。通俗的讲就是，一种把文本转为数值输入到计算机中的方法。之前文章中提到的将文本转换为字典序列、one-hot编码就是最早期的词嵌入方法。Embedding和EmbeddingBag则是PyTorch中的用来处理文本数据中词嵌入（wordembedding）的工具，它们将离散的词
PostgreSQL的学习心得和知识总结（一百二十四）|深入理解PostgreSQL数据库开源扩展pgreplay的安装说明和使用场景孤傲小二~阿沐数据库 postgresql 开源
目录结构注：提前言明本文借鉴了以下博主、书籍或网站的内容，其列表如下：1、参考书籍：《PostgreSQL数据库内核分析》2、参考书籍：《数据库事务处理的艺术：事务管理与并发控制》3、PostgreSQL数据库仓库链接，点击前往4、日本著名PostgreSQL数据库专家铃木启修网站主页，点击前往5、参考书籍：《PostgreSQL中文手册》6、参考书籍：《PostgreSQL指南：内幕探索》，点击
华为OD面经 - 二战失利C++视觉算法华为题库c++cjava
24届河南大学本，计算机科学与技术专业。因为考研没有成功，毕业后一直在家准备二战，二战再次失利，gap半年后决定找工作，找了一些国企和私企的面试机会，但一直没有找到满意的offer。经过朋友推荐，决定尝试华为OD的岗位。由于本科期间有做过一些C++相关的项目和开源贡献，投递了C++视觉算法岗位。机考准备：因为考研期间的刷题基础还在，所以准备机考并没有花太多时间。主要集中在数据结构和算法题目上，尤其
MPPT与PWM充电原理及区别详解程序员
MPPT（最大功率点跟踪）和PWM（脉宽调制）是太阳能充电控制器中常用的两种技术，它们在原理、效率和适用场景上有显著区别。以下是两者的详细对比：1.工作原理PWM（脉宽调制）核心机制：通过快速开关（MOSFET等）调节太阳能板与电池之间的连接，使太阳能板电压被强制拉低至电池电压水平。充电过程：初期以大电流快速充电（电池电压较低）。当电池接近充满时，通过调节脉冲宽度（占空比）减少电流，防止过充。电压
python爬取房源数据_python爬取安居客二手房网站数据（转） weixin_39897758 python爬取房源数据
之前没课的时候写过安居客的爬虫，但那也是小打小闹，那这次呢，还是小打小闹哈哈，现在开始正式进行爬虫书写首先，需要分析一下要爬取的网站的结构：作为一名河南的学生，那就看看郑州的二手房信息吧！在上面这个页面中，我们可以看到一条条的房源信息，从中我们发现了什么，发现了连郑州的二手房都是这么的贵，作为即将毕业的学生狗惹不起啊惹不起还是正文吧！！！由上可以看到网页一条条的房源信息，点击进去后就会发现：房源的
二维码标签制作攻略：如何选择苗木树牌制作工具？二维码标签
如果你曾在城市街道或公园里驻足观察，会发现许多树木都挂着一块小小的金属或塑料标牌，上面印着名称、科属等基本信息。这些传统树牌看似“尽职尽责”，实则作用有限：信息量不足：一块巴掌大的标牌，最多只能写下树木的学名、科属和简短介绍。对于游客感兴趣的趣味科普（如古树历史故事）以及突发事件的应急指引（比如，台风天气后树木倾倒上报），传统标牌却无能为力。更新维护成本高：树木危死补种后，传统标牌需要整体更换，不
【Pandas】pandas Series repeat liuweidong0802 Pandas Series pandas
Pandas2.2SeriesComputationsdescriptivestats方法描述Series.argsort([axis,kind,order,stable])用于返回Series中元素排序后的索引位置的方法Series.argmin([axis,skipna])用于返回Series中最小值索引位置的方法Series.argmax([axis,skipna])用于返回Series中最
linux防火墙开放端口 linux
查看防火墙状态：systemctlstatusfirewalld开启防火墙systemctlstartfirewalld查询列表信息firewall-cmd--list-all添加需要开放的端口号firewall-cmd--zone=public--add-port=15672/tcp--permanent使更改生效。firewall-cmd--reload暂时关闭防火墙systemctlstop
寻找通义灵码 AI 程序员 {头号玩家} ，体验 QwQ-Plus、DeepSeek 满血版的通义灵码云原生
2025年1月，通义灵码AI程序员全面上线，同时支持VSCode、JetBrainsIDEs，是国内首个真正落地的AI程序员。近期，通义灵码能力再升级全新上线模型选择功能，目前已经支持QwQ-plus、DeepSeek满血版模型，用户可以在VSCode和JetBrains里搜索并下载最新通义灵码插件，在输入框里选择模型，即可轻松切换模型。通义灵码联合CHERRY中国全网发起寻找AI程序员{头号玩家
html程序国庆节祝福,2019国庆节祝福语送给朋友微信皆苦52 html程序国庆节祝福
1.十月金秋来到，百花吐芳争艳。红旗迎风飞舞，人人绽开笑颜。歌声飘扬天外，舞步随处翩跹。国庆佳节来到，思念只增不减。愿你快乐无限，生活幸福平安！2.十月里的第一天，让好运第一个找你。但愿，我是第一个问候你的人。用十足的真诚祝福你，愿你魅力十足，生活十全十美，过一个快乐的国庆节。3.十月天高云淡，秋日阳光灿烂，喜庆枫叶红遍，千山层林尽染。大街小巷快乐弥漫，东南西北烟火璀璨，国庆佳节绽放笑颜，衷心祝您
都快报名了，很多人软考的第一步就走错了不是小盆友软考软考高项苏景一软考软考高级计算机网络信息项目管理师 pat考试
都快报名了，很多人软考的第一步就走错了不管有没有开始备考，姐妹们可以看看，看了不亏啊！-✅25年上软考考试时间：5月24日——5月27日✅25年上软考报名时间：3月11日开始(要看地方通知，每个地方具体时间不同)✅报考条件：不限学历、年龄、工作年限✅报考地址：中国计算机技术职业资格网✅软考是可以跨级别报考的，也就是说初次考都可以直接报考中、高.级，但是一次只能报考一门科目哦-️备考思路✅是否要报班
如何免费制作简历二维码，让你的简历脱颖而出二维码
又到了金三银四求职季，如何让自己的简历脱颖而出？纸质简历受限于篇幅和形式，往往难以全面展示个人能力。通过在简历上添加二维码，HR可以通过手机扫码，访问更多无法直接呈现在纸面上的内容——包括个人作品集、视频介绍、设计稿、详细项目经历甚至是动态的职业成长记录，让招聘者可以更全面的了解你。一、简历二维码模板介绍草料二维码提供了“个人简历”二维码模板，方便大家可以更快的上手使用。模板内容已经预设了基本信息
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他