a1570853041

常用python机器学习库总结

开始学习Python，之后渐渐成为我学习工作中的第一辅助脚本语言，虽然开发语言是Java，但平时的很多文本数据处理任务都交给了Python。这些年来，接触和使用了很多Python工具包，特别是在文本处理，科学计算，机器学习和数据挖掘领域，有很多很多优秀的Python工具包可供使用，所以作为Pythoner，也是相当幸福的。如果仔细留意微博和论坛，你会发现很多这方面的分享，自己也Google了一下，发现也有同学总结了“Python机器学习库”，不过总感觉缺少点什么。最近流行一个词，全栈工程师（full stack engineer），作为一个苦逼的程序媛，天然的要把自己打造成一个full stack engineer，而这个过程中，这些Python工具包给自己提供了足够的火力，所以想起了这个系列。当然，这也仅仅是抛砖引玉，希望大家能提供更多的线索，来汇总整理一套Python网页爬虫，文本处理，科学计算，机器学习和数据挖掘的兵器谱。

1. Python网页爬虫工具集

一个真实的项目，一定是从获取数据开始的。无论文本处理，机器学习和数据挖掘，都需要数据，除了通过一些渠道购买或者下载的专业数据外，常常需要大家自己动手爬数据，这个时候，爬虫就显得格外重要了，幸好，Python提供了一批很不错的网页爬虫工具框架，既能爬取数据，也能获取和清洗数据，也就从这里开始了：

1.1 Scrapy

Scrapy, a fast high-level screen scraping and web crawling framework for Python.

鼎鼎大名的Scrapy，相信不少同学都有耳闻，课程图谱中的很多课程都是依靠Scrapy抓去的，这方面的介绍文章有很多，推荐大牛pluskid早年的一篇文章：《Scrapy 轻松定制网络爬虫》，历久弥新。

官方主页：http://scrapy.org/
Github代码页: https://github.com/scrapy/scrapy

1.2 Beautiful Soup

You didn’t write that awful page. You’re just trying to get some data out of it. Beautiful Soup is here to help. Since 2004, it’s been saving programmers hours or days of work on quick-turnaround screen scraping projects.

客观的说，Beautifu Soup不完全是一套爬虫工具，需要配合urllib使用，而是一套HTML / XML数据分析，清洗和获取工具。

官方主页：http://www.crummy.com/software/BeautifulSoup/

1.3 Python-Goose

Html Content / Article Extractor, web scrapping lib in Python

Goose最早是用Java写得，后来用Scala重写，是一个Scala项目。Python-Goose用Python重写，依赖了Beautiful Soup。前段时间用过，感觉很不错，给定一个文章的URL, 获取文章的标题和内容很方便。

Github主页：https://github.com/grangier/python-goose

2. Python文本处理工具集

从网页上获取文本数据之后，依据任务的不同，就需要进行基本的文本处理了，譬如对于英文来说，需要基本的tokenize，对于中文，则需要常见的中文分词，进一步的话，无论英文中文，还可以词性标注，句法分析，关键词提取，文本分类，情感分析等等。这个方面，特别是面向英文领域，有很多优秀的工具包，我们一一道来。

2.1 NLTK — Natural Language Toolkit

NLTK is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning, and an active discussion forum.

搞自然语言处理的同学应该没有人不知道NLTK吧，这里也就不多说了。不过推荐两本书籍给刚刚接触NLTK或者需要详细了解NLTK的同学: 一个是官方的《Natural Language Processing with Python》，以介绍NLTK里的功能用法为主，同时附带一些Python知识，同时国内陈涛同学友情翻译了一个中文版，这里可以看到：推荐《用Python进行自然语言处理》中文翻译-NLTK配套书；另外一本是《Python Text Processing with NLTK 2.0 Cookbook》，这本书要深入一些，会涉及到NLTK的代码结构，同时会介绍如何定制自己的语料和模型等，相当不错。

官方主页：http://www.nltk.org/
Github代码页：https://github.com/nltk/nltk

2.2 Pattern

Pattern is a web mining module for the Python programming language.

It has tools for data mining (Google, Twitter and Wikipedia API, a web crawler, a HTML DOM parser), natural language processing (part-of-speech taggers, n-gram search, sentiment analysis, WordNet), machine learning (vector space model, clustering, SVM), network analysis and canvas visualization.

Pattern由比利时安特卫普大学CLiPS实验室出品，客观的说，Pattern不仅仅是一套文本处理工具，它更是一套web数据挖掘工具，囊括了数据抓取模块（包括Google, Twitter, 维基百科的API，以及爬虫和HTML分析器），文本处理模块（词性标注，情感分析等），机器学习模块(VSM, 聚类，SVM）以及可视化模块等，可以说，Pattern的这一整套逻辑也是这篇文章的组织逻辑，不过这里我们暂且把Pattern放到文本处理部分。我个人主要使用的是它的英文处理模块Pattern.en, 有很多很不错的文本处理功能，包括基础的tokenize, 词性标注，句子切分，语法检查，拼写纠错，情感分析，句法分析等，相当不错。

官方主页：http://www.clips.ua.ac.be/pattern

2.3 TextBlob: Simplified Text Processing

TextBlob is a Python (2 and 3) library for processing textual data. It provides a simple API for diving into common natural language processing (NLP) tasks such as part-of-speech tagging, noun phrase extraction, sentiment analysis, classification, translation, and more.

TextBlob是一个很有意思的Python文本处理工具包，它其实是基于上面两个Python工具包NLKT和Pattern做了封装（TextBlob stands on the giant shoulders of NLTK and pattern, and plays nicely with both），同时提供了很多文本处理功能的接口，包括词性标注，名词短语提取，情感分析，文本分类，拼写检查等，甚至包括翻译和语言检测，不过这个是基于Google的API的，有调用次数限制。TextBlob相对比较年轻，有兴趣的同学可以关注。

转载来源http://www.cnblogs.com/Fighting365/p/6132707.html

官方主页：http://textblob.readthedocs.org/en/dev/

Github代码页：https://github.com/sloria/textblob

2.4 MBSP for Python

MBSP is a text analysis system based on the TiMBL and MBT memory based learning applications developed at CLiPS and ILK. It provides tools for Tokenization and Sentence Splitting, Part of Speech Tagging, Chunking, Lemmatization, Relation Finding and Prepositional Phrase Attachment.

MBSP与Pattern同源，同出自比利时安特卫普大学CLiPS实验室，提供了Word Tokenization, 句子切分，词性标注，Chunking, Lemmatization，句法分析等基本的文本处理功能，感兴趣的同学可以关注。

官方主页：http://www.clips.ua.ac.be/pages/MBSP

2.5 Gensim: Topic modeling for humans

Gensim是一个相当专业的主题模型Python工具包，无论是代码还是文档，我们曾经用《如何计算两个文档的相似度》介绍过Gensim的安装和使用过程，这里就不多说了。

官方主页：http://radimrehurek.com/gensim/index.html

github代码页：https://github.com/piskvorky/gensim

2.6 langid.py: Stand-alone language identification system

语言检测是一个很有意思的话题，不过相对比较成熟，这方面的解决方案很多，也有很多不错的开源工具包，不过对于Python来说，我使用过langid这个工具包，也非常愿意推荐它。langid目前支持97种语言的检测，提供了很多易用的功能，包括可以启动一个建议的server，通过json调用其API，可定制训练自己的语言检测模型等，可以说是“麻雀虽小，五脏俱全”。

Github主页：https://github.com/saffsd/langid.py

2.7 Jieba: 结巴中文分词

“结巴”中文分词：做最好的Python中文分词组件 “Jieba” (Chinese for “to stutter”) Chinese text segmentation: built to be the best Python Chinese word segmentation module.

好了，终于可以说一个国内的Python文本处理工具包了：结巴分词，其功能包括支持三种分词模式（精确模式、全模式、搜索引擎模式），支持繁体分词，支持自定义词典等，是目前一个非常不错的Python中文分词解决方案。

Github主页：https://github.com/fxsjy/jieba

3. Python科学计算工具包

说起科学计算，大家首先想起的是Matlab，集数值计算，可视化工具及交互于一身，不过可惜是一个商业产品。开源方面除了GNU Octave在尝试做一个类似Matlab的工具包外，Python的这几个工具包集合到一起也可以替代Matlab的相应功能：NumPy+SciPy+Matplotlib+iPython。同时，这几个工具包，特别是NumPy和SciPy，也是很多Python文本处理 & 机器学习 & 数据挖掘工具包的基础，非常重要。最后再推荐一个系列《用Python做科学计算》，将会涉及到NumPy, SciPy, Matplotlib，可以做参考。

3.1 NumPy

NumPy is the fundamental package for scientific computing with Python. It contains among other things:

1）a powerful N-dimensional array object

2）sophisticated (broadcasting) functions

3）tools for integrating C/C++ and Fortran code

4） useful linear algebra, Fourier transform, and random number capabilities

Besides its obvious scientific uses, NumPy can also be used as an efficient multi-dimensional container of generic data. Arbitrary data-types can be defined. This allows NumPy to seamlessly and speedily integrate with a wide variety of databases.

NumPy几乎是一个无法回避的科学计算工具包，最常用的也许是它的N维数组对象，其他还包括一些成熟的函数库，用于整合C/C++和Fortran代码的工具包，线性代数、傅里叶变换和随机数生成函数等。NumPy提供了两种基本的对象：ndarray（N-dimensional array object）和 ufunc（universal function object）。ndarray是存储单一数据类型的多维数组，而ufunc则是能够对数组进行处理的函数。

官方主页：http://www.numpy.org/

3.2 SciPy：Scientific Computing Tools for Python

SciPy refers to several related but distinct entities:

1）The SciPy Stack, a collection of open source software for scientific computing in Python, and particularly a specified set of core packages.

2）The community of people who use and develop this stack.

3）Several conferences dedicated to scientific computing in Python – SciPy, EuroSciPy and SciPy.in.

4）The SciPy library, one component of the SciPy stack, providing many numerical routines.

“SciPy是一个开源的Python算法库和数学工具包，SciPy包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。其功能与软件MATLAB、Scilab和GNU Octave类似。 Numpy和Scipy常常结合着使用，Python大多数机器学习库都依赖于这两个模块。”—-引用自“Python机器学习库”

官方主页：http://www.scipy.org/

3.3 Matplotlib

matplotlib is a python 2D plotting library which produces publication quality figures in a variety of hardcopy formats and interactive environments across platforms. matplotlib can be used in python scripts, the python and ipython shell (ala MATLAB®* or Mathematica®†), web application servers, and six graphical user interface toolkits.

matplotlib 是python最著名的绘图库，它提供了一整套和matlab相似的命令API，十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件，嵌入GUI应用程序中。Matplotlib可以配合ipython shell使用，提供不亚于Matlab的绘图体验，总之用过了都说好。

官方主页：http://matplotlib.org/

4. Python 机器学习 & 数据挖掘工具包

机器学习和数据挖掘这两个概念不太好区分，这里就放到一起了。这方面的开源Python工具包有很多，这里先从熟悉的讲起，再补充其他来源的资料，也欢迎大家补充。

4.1 scikit-learn: Machine Learning in Python

scikit-learn (formerly scikits.learn) is an open source machine learning library for the Python programming language. It features various classification, regression and clustering algorithms including support vector machines, logistic regression, naive Bayes, random forests, gradient boosting, k-means and DBSCAN, and is designed to interoperate with the Python numerical and scientific libraries NumPy and SciPy.

首先推荐大名鼎鼎的scikit-learn，scikit-learn是一个基于NumPy, SciPy, Matplotlib的开源机器学习工具包，主要涵盖分类，回归和聚类算法，例如SVM，逻辑回归，朴素贝叶斯，随机森林，k-means等算法，代码和文档都非常不错，在许多Python项目中都有应用。例如在我们熟悉的NLTK中，分类器方面就有专门针对scikit-learn的接口，可以调用scikit-learn的分类算法以及训练数据来训练分类器模型。

官方主页：http://scikit-learn.org/

4.2 Pandas: Python Data Analysis Library

Pandas is a software library written for the Python programming language for data manipulation and analysis. In particular, it offers data structures and operations for manipulating numerical tables and time series.

Pandas也是基于NumPy和Matplotlib开发的，主要用于数据分析和数据可视化，它的数据结构DataFrame和R语言里的data.frame很像，特别是对于时间序列数据有自己的一套分析机制，非常不错。这里推荐一本书《Python for Data Analysis》，作者是Pandas的主力开发，依次介绍了iPython, NumPy, Pandas里的相关功能，数据可视化，数据清洗和加工，时间数据处理等，案例包括金融股票数据挖掘等，相当不错。

官方主页：http://pandas.pydata.org/

4.3 mlpy – Machine Learning Python

mlpy is a Python module for Machine Learning built on top of NumPy/SciPy and the GNU Scientific Libraries.mlpy provides a wide range of state-of-the-art machine learning methods for supervised and unsupervised problems and it is aimed at finding a reasonable compromise among modularity, maintainability, reproducibility, usability and efficiency. mlpy is multiplatform, it works with Python 2 and 3 and it is Open Source, distributed under the GNU General Public License version 3.

官方主页：http://mlpy.sourceforge.net/

4.4 PyBrain

PyBrain is a modular Machine Learning Library for Python. Its goal is to offer flexible, easy-to-use yet still powerful algorithms for Machine Learning Tasks and a variety of predefined environments to test and compare your algorithms.

PyBrain is short for Python-Based Reinforcement Learning, Artificial Intelligence and Neural Network Library. In fact, we came up with the name first and later reverse-engineered this quite descriptive “Backronym”.

“PyBrain(Python-Based Reinforcement Learning, Artificial Intelligence and Neural Network)是Python的一个机器学习模块，它的目标是为机器学习任务提供灵活、易应、强大的机器学习算法。（这名字很霸气）

PyBrain正如其名，包括神经网络、强化学习(及二者结合)、无监督学习、进化算法。因为目前的许多问题需要处理连续态和行为空间，必须使用函数逼近(如神经网络)以应对高维数据。PyBrain以神经网络为核心，所有的训练方法都以神经网络为一个实例。”

4.5 Theano

Theano is a Python library that allows you to define, optimize, and evaluate mathematical expressions involving multi-dimensional arrays efficiently. Theano features:

1）tight integration with NumPy – Use numpy.ndarray in Theano-compiled functions.

2）transparent use of a GPU – Perform data-intensive calculations up to 140x faster than with CPU.(float32 only)

3）efficient symbolic differentiation – Theano does your derivatives for function with one or many inputs.

4）speed and stability optimizations – Get the right answer for log(1+x) even when x is really tiny.

5）dynamic C code generation – Evaluate expressions faster.

6） extensive unit-testing and self-verification – Detect and diagnose many types of mistake.

Theano has been powering large-scale computationally intensive scientific investigations since 2007. But it is also approachable enough to be used in the classroom (IFT6266 at the University of Montreal).

“Theano 是一个 Python 库，用来定义、优化和模拟数学表达式计算，用于高效的解决多维数组的计算问题。Theano的特点：紧密集成Numpy；高效的数据密集型GPU计算；高效的符号微分运算；高速和稳定的优化；动态生成c代码；广泛的单元测试和自我验证。自2007年以来，Theano已被广泛应用于科学运算。theano使得构建深度学习模型更加容易，可以快速实现多种模型。PS：Theano，一位希腊美女，Croton最有权势的Milo的女儿，后来成为了毕达哥拉斯的老婆。”

4.6 Pylearn2

Pylearn2 is a machine learning library. Most of its functionality is built on top of Theano. This means you can write Pylearn2 plugins (new models, algorithms, etc) using mathematical expressions, and theano will optimize and stabilize those expressions for you, and compile them to a backend of your choice (CPU or GPU).

“Pylearn2建立在theano上，部分依赖scikit-learn上，目前Pylearn2正处于开发中，将可以处理向量、图像、视频等数据，提供MLP、RBM、SDA等深度学习模型。”

SVG 在 VSCode 中的使用与优势
SVG在VSCode中的使用与优势引言SVG（可缩放矢量图形）是一种基于可扩展标记语言的图形图像格式，与传统的位图格式（如JPEG或PNG）相比，SVG图像具有更高的灵活性和可缩放性。随着前端开发领域的不断发展，SVG在网页设计中的应用越来越广泛。本文将介绍SVG在VisualStudioCode（VSCode）中的使用方法及其优势。SVG简介SVG是一种矢量图形格式，与位图不同，矢量图形由直线和
厂房起火3D消防灭火安全救援模拟演练 VRARvrnew3d 3d vr 虚拟现实 VR仿真 VR公司消防厂房
深圳VR公司华锐视点依托前沿的VR虚拟现实制作、三维仿真和图形图像渲染技术，将参训者带入栩栩如生的火灾现场。佩戴VR头盔，参训者将真切体验火势蔓延的紧张与危机，身临其境地感受火灾的恐怖。并且消防安全VR虚拟现实演练系统精心模拟了住宅、工厂火灾及交通事故等多种场景，让参训者在虚拟环境中进行实战演练，显著增强应对火灾的实战能力。不受时间、空间限制，多次体验火灾现场，深化应急处理技巧，提升应变能力。同时
位运算详解之移位运算的神奇操作 GG不是gg leetcode #算法分析与设计算法
位运算详解之移位运算的神奇操作一、移位运算基础概念1.1移位运算的定义与本质1.2移位运算的分类二、左移位运算（>）3.1运算规则3.2神奇应用场景3.2.1快速除法运算3.2.2提取二进制位的特定部分3.2.3符号扩展与数据类型转换四、无符号右移位运算（>>>）4.1运算规则4.2神奇应用场景4.2.1处理无符号整数4.2.2哈希算法与加密领域4.2.3图形图像处理五、移位运算的组合与高级应用5
5、探索Android图形世界：从基础到高级 laforet Android图形处理 OpenGL ES Canvas绘图
探索Android图形世界：从基础到高级1.引言：图形的重要性在移动应用开发中，图形是至关重要的组成部分。无论是用户界面、游戏还是数据可视化，图形都能显著提升用户体验。本篇文章将深入探讨Android平台上的图形处理技术，从基础到高级，逐步解析如何利用Android的图形绘制和合成设施，以及如何通过桌面工具开发图形图像、纹理和图标等元素，帮助开发者在应用中融入丰富的视觉效果。2.使用Android
VR教育：开启教育新时代的钥匙广州华锐视点 vr VR教育
VR教育，即虚拟现实教育，是将虚拟现实技术(VirtualReality，简称VR)应用于教育领域的一种创新教育模式。它借助计算机技术、图形图像技术、传感器技术等，创建出高度逼真的虚拟学习环境，让学生通过头戴式显示设备、手柄、体感设备等硬件，身临其境地感受和探索各种学习场景，实现沉浸式学习。VR教育这种创新模式，正逐渐改变着传统教育的面貌。想象一下，在往日略显沉闷的历史课上，学生们不再是对着那些陈
002_初识 Photoshop CS5 Ramboooooooo
文章目录一、PS简介二、初识位图和矢量图三、图像颜色模式四、图像的文件格式一、PS简介 PhotoShopCS5是Adobe公司推出用于平面设计和图片处理和合成等多功能于一体的强大处理软件，PS是二维的图像合成软件，可以围绕已有的素材进行艺术再加工。二、初识位图和矢量图在计算机领域中，图形图像分为两种类型，即“位图图像”和“矢量图形”。1、位图位图也称为点阵图，是由许多点组成，这些点被称
PHP生成PDF方法我是我们村的村长 php php
TCPDF具有以下特性：1、支持页面页脚；2、支持HTML标签代码；3、支持jpg/png/gif/svg图形图像；4、支持表格；5、支持中文字符；（有些PDF类不支持中文或者处理中文相当麻烦）6、自动分页，自动页码，等等。如何使用您可以从TCPDF官网获取最新版本：http://www.tcpdf.org。官网提供了几十个示例以及说明文档，下载解压后一定要注意文件路径，如何使用TCPDF，可以从
QML之Canvas dreamliweiming QML项目编程 qt
Canvas详细描述Canvas支持绘制直线，曲线，简单和复杂的形状，图表以及引用的图形图像。它还可以添加文本，颜色，阴影，渐变和图案并进行低级像素操作。Canvas的输出可以保存为图像文件或序列化为URL.在Canvas上进行渲染是通过Context2D对象(getContext(“2d”)来实现的，通常是在绘制信号（painted）触发式完成的。目前，Canvas仅支持二维渲染环境。1、画线C
SDL2常用函数&结构分析:SDL_Texture&SDL_CreateTexture&SDL_UpdateTexture SuperDali SDL SDL2 SDL_Texture
SDL_TextureSDL_Texture是计算机图形图像中，如何在屏幕上显示图像的一个数据的抽象。中文也已翻译为纹理。这种概念在OpenGL中也有出现。对于SDL_Texture本身来说，它包含了显示驱动用于显示的特定数据结构。SDL_Texture的创建一半通过SDL_CreateTexture创建，创建一次后，可以重复使用，通过SDL_UpdateTexture函数更新数据。SDL_Cre
《Python NumPy 模块：从基础到实战的科学计算之旅》明灯L Python python numpy 开发语言内置模块
NumPy模块NumPy（NumericalPython）是Python中用于科学计算的基础库，它提供了高性能的多维数组对象和处理这些数组的工具【主要针对线性代数图形图像大批量数据计算方程求解】。pippip是Python的包管理工具，下面是一些pip的常用命令：显示pip的版本：pip--version查看pip命令的帮助信息：pip--help查看已安装的包：piplist安装最新版本的包：p
VC++网络资源集合 bcbobo21cn VC++VC
http://www.jizhuomi.com/software/257.html第一部分：VS2010/MFC开发环境第二部分：VS2010/MFC应用程序框架第三部分：对话框第四部分：常用控件第五部分：菜单、工具栏与状态栏第六部分：文档、视图和框架第七部分：MFC常用类第八部分：字体和文本输出第九部分：图形图像第十部分：Ribbon界面开发http://www.jizhuomi.com/cat
OpenSceneGraph 概览 zhouschina OSG osg
OSG包含了一系列的开源图形库，主要为图形图像应用程序的开发提供场景管理和图形渲染优化的功能。它使用可移植的ANSIC++编写，并使用已成为工业标准的OpenGL底层渲染API。因此，OSG具备跨平台性，可以运行在Windows，MacOSX和大多数类型的UNIX和Linux操作系统上。大部分的OSG操作可以独立于本地视窗系统。但是OSG也包含了针对某些视窗系统特有功能的支持代码，例如PBuffe
matlab脑电地形图怎么画,脑电地形图绘制.ppt 阿依图娜 matlab脑电地形图怎么画
脑电地形图绘制脑电地形图绘制报告内容数据可视化脑电地形图的意义脑电地形图绘制的关键离线地形图实时地形图Ⅰ数据可视化概念：借助图形化手段，将数据以图形图像形式表示，并利用数据分析和开发工具发现其中未知信息的处理过程。意义：提供象人眼一样的直觉的、交互的和反应灵敏的可视化环境。手段：图象、曲线、二维图形、三维体和动画等。应用领域医学金融气象航空航天石油勘探Ⅱ脑电地形图的意义脑电地形图(BEAM)是一种
第六届地质、测绘与遥感国际学术会议（ICGMRS 2025）禁止默人工智能地质测绘遥感
重要信息官网：www.icgmrs.com时间：2025年4月25-27日地点：中国·湖北·武汉部分信息主题测绘遥感遥感技术应用海洋通信-摄影测量-航空摄影测量-制图学-城市大脑、智能海洋和数字地球-计算机制图-图形图像复制技术-传感器技术-测绘技术-测绘仪器...-光学遥感-微波遥感-大气环境遥感-行星遥感和测绘-遥感信息工程-地理信息系统-全球导航卫星系统-卫星导航与定位-空间数据库-地球监测
JavaSE——语法基础篇芸瑶笔记基础 java 编程语言
一.概述1.计算机组成部分计算机主要分为硬件和软件。硬件是可看到的一些物理部分（一些电子元器件）。常见的硬件:1)CPU:CenterProcessingUnit中央处理器-------指令控制和数值计算（日常工作任务)。2)内存：临时存储数据的存储设备---RAM------内存不通电的时候，数据也就不见了。3)显卡GPU：GraphicProcessingUnit图形图像处理单元------计
深剖VR，AR和MR三者之间关系物联研究物联网研究 VR AR MR
作者简介：赵刚，京东研发体系集团架构部总监，京东VR/AR实验室技术总负责人。北京航空航天大学通信与信息系统博士,iTechClub资深成员，京东第一届架构委员会常务委员，入选《京东技术解密》牛人篇（第三位），长期研究计算机图形图像与智能技术，涉足虚拟现实技术16年，拥有多项专利与软著，第十八届中国专利金奖提名，曾参与研发国内最先进军用无人直升机，神舟五号载人飞船虚拟现实仿真系统，获得部级科技进步
SVG 参考手册 lsx202406 开发语言
SVG参考手册引言SVG（可缩放矢量图形）是一种基于可扩展标记语言（XML）的图形图像格式。它允许用户创建具有高度可缩放性的矢量图形，这些图形可以在任何分辨率下清晰显示，而不失真。SVG格式广泛应用于网页设计、移动应用开发以及各种图形处理领域。本手册旨在为读者提供关于SVG的全面参考，帮助读者更好地理解和应用SVG技术。SVG基础SVG定义SVG是一种矢量图形格式，它允许用户创建具有高度可缩放性的
OpenHarmony 5.0.2 Release来了！ MardaWang
版本概述OpenHarmony5.0.2Release版本对标准系统的能力进行持续完善，以快速迭代的方式推出API14，相比5.0.1Release版本，重点做出了如下特性新增或增强：进一步增强ArkUI、图形图像的能力，提供更多组件的高级属性设置，支持更多精致动效；进一步增强Web能力，满足更多应用诉求；针对2in1设备特点，新增一系列窗口管理和控制的能力及窗口生命周期行为管理；新增一批企业定制
Android 11.0 camera2关于拍照预览方向旋转90度和拍照图片镜像功能实现安卓兼职framework应用工程师 android 11.0 Rom定制化高级进阶 android 旋转拍照方向旋转90度拍照拍照旋转90度拍照镜像
1.前言在11.0的系统rom产品定制化开发中，在camera2的一些图形图像中有些是不正常的功能，比如在拍照和预览画面和手机屏幕不一致，或者在保存拍照图片的时候发现图片翻转保存了等问题，所以就需要分析下相关的问题来解决实现功能2.camera2关于拍照预览方向旋转90度和拍照图片镜像功能实现的核心类packages\apps\Camera2\src\com\android\camera\one\
C# 图形图像技术（通过Graphics绘制图像）萨达大 c#开发语言
文章目录创建Graphics对象画笔与画刷画笔画刷SolidBrush类HatchBrush类LinerGradientBrush类基本图形绘制矩形椭圆圆弧扇形创建Graphics对象privatevoidForm1_Load(objectsender,Eventargse){Graphicsghs=this.CreateGraphics();}画笔与画刷画笔构造函数publicPen(Color
OpenGL ES基本概念 Irino
OpenGLES的版本OpenGLES1.X：用于固定功能流水管线硬件OpenGLES2.X：用于可编程功能流水管线硬件OpenGLES3.X：OpenGLES2.0的拓展EGL（EmbeddedGraphicsLibrary）OpenGLES命令需要渲染上下文和绘制表面才能完成图形图像的绘制渲染上下文：存储相关OpenGLES状态绘制表面：是用于绘制图元的表面，它指定渲染所需要的缓存区类型，例如
培养一两项无用的兴趣爱好，一定有用霖小姐慢半拍
图片发自App学习Photoshop（一款图形图像处理软件）是今年年初定下的计划之一，直到最近才开始付诸行动，之所以拖到现在，是因为PS对于我来说，暂时是项「没用」的技能。又之所以决定赶在跨年前学会它的基本操作，一方面是因为年初定下过计划，我有一定程度的强迫症状，计划列表里的事情没完成，心里会觉得各种别扭。另一方面，更重要的一个原因，是因为它「没用」，所以我要去学。是的，你没看错，我年初定下学习P
计算机科学引论2021英文,计算机科学引论= Computing Essentials : 英文弗雷德里克·雷蒙德计算机科学引论2021英文
摘要：本书概括地介绍了计算机科学与信息技术的主要领域,各种应用及其对社会的影响.全书由15章和一些附录组成,主要内容包括:信息技术概述;因特网,万维网与电子商务;基本应用软件(包括字处理,表处理,数据库管理系统,文字和图形演示,集成化软件包等);专用软件(包括图形图像处理,音频与视频,多媒体,Web创作以及虚拟现实和专家系统等新兴应用);操作系统等系统软件;计算机系统组成部件;输入/输出及相关外部
图形图像处理算法(1) ---- HDR 技术简介小猪佩奇TONY 图像处理算法
随着HDR技术的发展，越来越多的视频平台和技术厂商持续推动HDR内容的制作和传播，HDR可以提供更加丰富的细节，更宽广的色域和更加自然的色彩过度，为了呈现更高的图像品质，给体验者带来更加沉浸的感受，HDR的概念既可以是指显示设备，表示显示设备支持更高的色深，更广的色域范围，能显示更高和更低的亮度，也可以是指数字媒体内容，比如视频，表示视频的编码使用了更高的色深，更广的色域范围，支持更高更低的亮度并
图形图像处理算法(2) ---- ToneMapping 技术小猪佩奇TONY 图像处理
1.色调映射（ToneMapping）定义1.1视觉的形成和特点影像系统的核心功能之一就是图像显示，好的显示效果能真实的再现原始场景，给人的感觉就是和直接观察原始场景一样。色调映射使影像再现系统的一个重要组成部分，它能将原始场景的光照映射成显示设备的发光强度。一个好的影像系统需要考虑人的视觉系统是如何处理光线的，场景辐射的光线被人类视网膜上是视杆细胞和视锥细胞捕捉，形成电信号，并传递到视觉神经通道
【图形图像的C++ 实现 01/20】 2D 和 3D 贝塞尔曲线无水先生 BOOST C++人工智能 c++3d 人工智能
目录一、说明二、贝塞尔曲线特征三、模拟四、全部代码如下五、资源和下载一、说明以下文章介绍了用C++计算和绘制的贝塞尔曲线（2D和3D）。贝塞尔曲线具有出色的数学能力来计算路径（从起点到目的地点的曲线）。曲线的形状由“控制点”决定。所讨论的曲线最重要的特征是平滑度。在许多应用和领域中，平滑度是不可或缺的。我们可以考虑机器人或其他机器的运动，其中运动必须是可预测的，以确保人员和硬件的安全（
OpenGL-01-常见专业名词解析宇宙那么大丶
一、图形API首先我们要知道什么是OpenGL以及其他相关的API有哪些。OpenGL：（OpenGraphicsLibrary）是一个跨平台、夸编程语言的编程图形程序接口，它将计算机的资源抽象称为一个个OpenGL的对象，对这些资源的操作抽象为一个个OpenGL指令。【针对PC端（Mac、Windows）的图形图像渲染处理】OpenGLES：（OpenGLforEmbeddedSystems）是
计算机图形学复习玛卡巴卡_qin 课程学习
第一章绪论1.什么是计算机图形学计算机图形学是借助计算机生成图形图像的艺术或科学2.计算机图形学研究内容图形生成、图形变换、交互技术3.计算机图形学与数字图像处理的异同相同点：像素层面图像和图形是一致的不同点：处理过程是互逆的计算机图形学是从目标描述产生图形显示数值图像处理是对图像进行描述第三章图元生成1.直线生成算法：思路、判别参数定义DDA算法y=mx+byk+1=yk+msetpixel(x
js,java中的无符号右移位符,左移位符,有符号右移位符 ABCDEF_7c48
移位运算就是对二进制进行有规律低移位。移位运算可以设计很多奇妙的效果，在图形图像编程中应用广泛。“>”运算符“>>”运算符执行有符号右移位运算。与左移运算操作相反，它把32位数字中的所有有效位整体右移，再使用符号位的值填充空位。移动过程中超出的值将被丢弃。把数值1000向右移8位，则返回值为3。console.log(1000>>8);//返回值3用算式进行演示，如图所示。在这里插入图片描述把数值
OpenGL(七)-图形图像渲染中的深度缓冲区 king_jensen
logo.jpg什么是深度?深度其实就是该像素点在3D世界中距离摄像机的距离,Z值什么是深度缓冲区?**深度缓存区**,就是⼀块内存区域,专门存储着每个像素点(绘制在屏幕上的)深度值.深度值(Z值)越⼤大,则离摄像机就越远.为什么需要深度缓冲区?在不使用深度测试的时候,如果我们先绘制一个距离比较近的物理理,再绘制距离较远的物体,则距离远的位图因为后绘制,会把距离近的物体覆盖掉.有了深度缓冲区后,绘
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

常用python机器学习库总结

你可能感兴趣的:(图形图像)