Renaissancer

数学之美_读书笔记

目录

1、自然语言处理
2、信息熵
3、搜索引擎-布尔代数
4、图论与网络爬虫
5、pagerank-网页质量度量
6、查询与网页相关性
7、卫星定位，地址识别，路线规划
8、新闻分类
9、矩阵运算、文本分类
10、信息指纹
11、网页搜索排名作弊
12、计算权威度（搜索引擎过滤噪音，类似通信系统）
13、最大熵模型
14、拼音输入法
15、布隆过滤器
16、贝叶斯网络（加权有向图）-马尔科夫链的扩展
17、条件随机场
18、维特比算法（适用于解决隐马尔可夫模型问题）
19、期望最大化算法（EM）
20、逻辑回归(指数模型)
21、云计算
22、人工神经网络
23、大数据
24、算法

1、自然语言处理

从规则到统计
统计语言模型(马尔可夫假设，局限性，上下文相关性跨度大)
模型训练(大数定理，语料选取)
零概率问题(平滑折扣)
LDC（标准语料库组织）
务于精纯，观其大略

2、信息熵

不确定性的多少
H=-(p1logP1+p2logP2+…+Pn*logPn)
条件熵H(X|Y)
H(X)>=H(X|Y)，知道了Y，X的不确定性变小了，二元模型的不确定性小于一元模型，同理H(X|Y)>=H(X|Y,Z)，无关时等号成立
互信息I(X;Y)=H(X)-H(X|Y)，完全相关为1，不相关为0
相对熵(交叉熵)，越大差异越大，可度量两个随机分布的差异性

3、搜索引擎-布尔代数

下载、索引、排序

4、图论与网络爬虫

bfs
七桥问题-度-偶数
调度系统-优先队列
url表记录已处理过的网页–hash分类，批处理

5、pagerank-网页质量度量

线性代数，矩阵乘法–分布式计算，mapreduce
不同网页权重影响-迭代收敛
用户点击量
稀疏矩阵-平滑

6、查询与网页相关性

TF*IDF+…
词频，单文本中词的权重
逆文本频率指数，出现该词的文本在所有文本中的权重log(D/Dw)

针对不同关键词（信息量），再对不同TF进行加权

查询排名-相关性与pagerank乘积

7、卫星定位，地址识别，路线规划

有限状态机（编译器）
加权有限状态转换器WFST（自然语言理解，语音识别解码器，拼音输入法、语法纠错，生物序列分析）-每个状态由当前输入输出定义
基于概率的有限状态机
动态规划-

贪心算法（最优子结构，贪心选择性质-每一步选择都会导致最终的最优解，包含上一步最优解，不保留）贪心不能保证求得的最后解是最佳的，一般复杂度（只有特殊情况才会使用）
动态规划（最优子结构，重复子问题-消除重叠子问题，全局最优解包含某个局部最优解，不一定是上一步，所以要记录所有局部最优解，本质是穷举，复杂度高）贪心是最简单最特殊的动态规划
傅里叶变换（函数-》正弦函数（保真度，特征向量））

8、新闻分类

余弦定理-计算向量夹角，描述相关性
cosA=/(|b|*|c|) 向量内积/长度乘积
(x1x2+y1y2)/()

9、矩阵运算、文本分类

奇异值分解（SVD）-双对角矩阵，拆分三个矩阵
Amn=XmmBmnYnn
粗分类–》向量余弦，迭代，精确分类

10、信息指纹

网址去重
url（任意长度整数）-伪随机数PRNG，生成指定长度的伪随机数（平方取中间几位数，梅森旋转算法）

密码
统计破解-多对一随机映射
大素数，非对称加密，费马小定理

集合比较（顺序，排序比较，一个集合hash散列表映射，计算两个集合指纹（每个元素指纹相加，加法交换律））
应用-网页内容比较（idf最大的几个词组成的集合）
网页，论文转载检测
视频盗版检测（关键帧和特征提取）

11、网页搜索排名作弊

隐藏关键词，新增网络连接数，高质量落地页脚本跳转，出链接页向量余弦距离
加强信源编码抗干扰能力，消除传输噪音

12、计算权威度（搜索引擎过滤噪音，类似通信系统）

句法分析，互信息，词组聚类

13、最大熵模型

一个好方法在形式上是简单的
满足所有已知条件，对未知不做任何主管假设，训练一组特征的参数
迭代算法GIS(使用每次迭代后的模型估算分布，超过就减小参数，否则增大参数，计算量大)
改进后IIS

14、拼音输入法

信息熵、图最短路径问题、个性化语言模型（与通用模型线性插值）

15、布隆过滤器

（实际上是一个很长的二进制向量和一系列随机映射函数，基本原理：两个随机数字冲突概率很小）
用于判断元素是否存在于一个集合中，快速，省空间，但是有一定的误识别率（白名单）

16、贝叶斯网络（加权有向图）-马尔科夫链的扩展

结构训练，参数训练
图像处理、文字处理（语义近义词）、支持决策、生物统计、博弈论

应用：文本分类-文章、概念（关键词聚类），关键词组成贝叶斯网络
结构训练-贪心，防止进入局部最优（保留互信息较大的节点，或用许多随机数检验）
理论简单，模型复杂

17、条件随机场

随机变量看作节点，两节点相关则连接，若干随机变量，形成一个有向图，构成一个网络
若该网络是一个有向无环图，则称贝叶斯网络
若退化成线性链，则称马尔可夫模型
可看作每个时刻或空间的相关变化，从随机过程的视角，则称马尔可夫过程
无向图模型，则称马尔可夫随机过程或马尔可夫网络
给定某些条件，则称条件随机场CRF
若用条件随机场研究标注问题，进一步网络变成线性，则称线性链条件随机场

文法分析、预防犯罪、模式识别、机器学习、生物统计

18、维特比算法（适用于解决隐马尔可夫模型问题）

针对篱笆网络
动态规划解决最短路径问题
不超过O(N*D^2) - N层，最多D个状态
只要处理每个状态的时间比说话、打字快，就能做到实时

FDMA频分多址
TDMA时分多址
CDMA码分多址

19、期望最大化算法（EM）

文本分类-（随机选点，根据到点距离分类，重新计算中心，迭代统计使得选点到新中心偏移最小）
定义一个最大化函数就行了，迭代
凸函数前提
不一定收敛到全局最优解

20、逻辑回归(指数模型)

将一个事件出现的概率适应到一条逻辑曲线上(值域0-1)，与概率分布联系
z=B0+B1x1+B2x2+…+Bkxk
f(z)=1/(1+e^-z)
搜索广告，预测点击(训练方法，迭代算法GIS)
生物统计

21、云计算

分治算法(google，MapReduce，拆分调度负载均衡)，矩阵计算
归并排序

22、人工神经网络

分层有向图
模式分类
设计结构(层数，节点)
神经元函数(对输入变量线性组合后进行一次非线性变换)
参数训练，有监督训练，成本函数，转变为最优化问题，梯度下降法(沿着斜率变化最快的方向)
无监督训练，设计一个成本函数，多维空间的模式分类问题，到聚类中心距离
人工神经网络同贝叶斯网络，遵从马尔可夫假设(每一层节点取值只取决于前一级节点)，人工神经网络更标准化，神经元函数为非线性函数，各个变量只能先线性组合，再进行非线性变换，较简单，只能识别单个字，而贝叶斯更灵活，任意函数，较复杂，更易考虑前后相关性，可作解码器，解码一个输入序列
google大脑(采用人工神经网络，通用性，稳定，简单易并行)，随机梯度下降法(降低每一次的计算量，随机抽取少量数据计算成本函数，牺牲一点准确性)，L-BFGS(减少迭代次数，每次根据距目标远近调整迭代步长，易并行)

23、大数据

数据准确性，代表性
网页数据(索引)，点击数据(60%-80%)，浏览器，输入法数据

24、算法

多项式函数复杂度：算法的计算量不超过N的多项式函数
P问题：一个问题存在多项式复杂度的算法(计算机可有效解决)
非P问题：高于N的多项式函数计算量(理论上可解决，实际上做不到，如围棋的每一步最佳走法)
NP问题：非确定的多项式问题(能在多项式复杂度的时间里证实一个答案是否正确，则不论能否找到多项式复杂度算法，都称为NP问题)
NP?=P，如果被证实相等，加密问题(因数分解)将会易破解
NPComplete问题：NP完全问题，NP问题中最困难的，所有NP问题都能在多项式时间里归约到NPC问题
NPHard问题：计算复杂度大于等于NPComplete问题
NP问题思路：减少指数值，近似解

寻找一个问题的计算机算法，首先要寻找多项式复杂度的算法(找不到的，如贝叶斯网络训练算法，只能利用数学方法简化求近似解)

你可能感兴趣的:(读书笔记)

【读书笔记】「等到 Linux 6.17 就分手」：Bcachefs 背后的技术与流程之争 CodeWithMe 读书笔记 linux linux 服务器运维
「等到Linux6.17就分手」：Bcachefs背后的技术与流程之争“我真的不太愿意继续参与。而我们唯一真正达成一致的，大概就是——‘我们已经结束了’。”——LinusTorvalds最近，Linux内核社区再次爆发激烈争论，主角是近年备受关注的新一代文件系统——Bcachefs，以及它的作者KentOverstreet与内核“守门人”LinusTorvalds之间的冲突。这场争议的焦点，并不在
PostgreSQL 16 Administration Cookbook 读书笔记：第1章 First Steps
本章为PostgreSQL简介及如何用psql和pgAdminGUI连接PostgreSQL。1.PostgreSQL16简介开源，低TCO，30多年持续开发，符合SQL:2023标准，高度可扩展，多模。1.1PostgreSQL有何不同？PostgreSQL的功能集与Oracle或SQLServer的相似度比与MySQL更高。PostgreSQL知名用户包括苹果、巴斯夫、基因泰克、Heroku、
《移动App测试实战》读书笔记 xh15 2017笔试面试修炼软件测试移动测试读书笔记
最近看完了《移动App测试实战》，这里做一点笔记，后面可以重温。功能测试自动化轻量接口自动化测试（JMeter）：JMeter是一款开源测试工具，多用于接口测试用例的分层：CGI：通用网关接口，常称为单个业务接口Function：请求组合，包含多个CGI层接口的调用TestCase：单个测试用例TestSuite：多个测试用例的集合UI层的自动化面向Android：AndroidSDK提供的UIA
CS:APP读书笔记--信息的表示和处理你都会上树？ CS:APP 笔记程序人生
信息的存储和表示字节端序在内存中按照从最低到最高有效字节的顺序存储对象，这种最低有效字节在最前面的方式，称为小端法。在内存中按照从最高到最低有效字节的顺序存储对象，这种最高有效字节在最前面的方式，称为大端法。例如：对于int32类型变量，其存储地址位于0x100，其十六进制值为0x12345678，其地址范围为ox100~0x103：//大端法地址：0x1000x1010x1020x1031234
数智读书笔记系列035《未来医疗：医疗4.0引领第四次医疗产业变革》 Allen_Lyb 数智读书笔记健康医疗人工智能笔记经验分享
探索医疗4.0：开启未来医疗新时代——读《未来医疗：医疗4.0引领第四次医疗产业变革》有感引言：医疗变革的浪潮在科技飞速发展的当下，我们正处在一个充满变革的时代，各行各业都在技术的驱动下发生着翻天覆地的变化，医疗行业也不例外。从听诊器、体温计到如今的基因检测、远程医疗，医疗技术的每一次进步都深刻地改变了人类的生活。而在众多探讨医疗未来趋势的著作中，《未来医疗：医疗4.0引领第四次医疗产业变革》犹如
《python 数据分析从入门到精通》读书笔记｜了解数据分析｜数据分析基础知识
《python数据分析从入门到精通》读书笔记第一章：了解数据分析1.1什么是数据分析数据分析是利用数学、统计学理论与实践相结合的科学统计分析方法，对Excel数据、数据库中的数据、收集的大量数据、网页抓取的数据进行分析，从中提取有价值的信息并形成结论进行展示的过程。数据分析实际上是通过数据的规律来解决业务问题，以帮助实际工作中的管理者做出判断和决策。数据分析包括以下几个主要内容：（1）现状分析：分
《ORANGE’S：一个操作系统的实现》读书笔记（三十八）尾声（二）
这篇文章是尾声的第二部分，记录如何将Orange’S安装到硬盘上，并实现从硬盘启动。目录从硬盘引导编写硬盘引导扇区和硬盘版loader“安装”hdboot.bin和hdldr.bingrub小结从硬盘引导虽然我们的硬盘上已经有不少内容了，但到目前为止，我们的系统始终是从软盘启动的。下面我们要做的事情就是将Orange’S安装到硬盘上，并实现硬盘启动。我们先回忆一下从软盘启动的过程：BIOS将引导扇
Learning PostgresSQL读书笔记: 第8章 Triggers and Rules dingdingfish PostgresSQL postgresql database architecture tutorial
本章将讨论以下内容：•探索PostgreSQL中的规则•管理PostgreSQL中的触发器•事件触发器探索PostgreSQL中的规则文档中的这段话阐述了rule和trigger的区别：PostgreSQL规则系统允许定义在数据库表中插入、更新或删除时执行的替代操作。粗略地说，当对给定表执行给定命令时，规则会执行其他命令。或者，INSTEAD规则可以用另一个命令替换给定命令，或者导致命令根本不执行
读书笔记（世界上最神奇的24堂课）
1、我们的思想才是能力和力量的源泉，因为依靠外在的帮助才使我们变得软弱，只要你愿意，你就可以成为帮助别人的强者而不是被帮助的弱者。2、事凡有果，势必有因。人们如果想要实现自己的志向抱负，就得为这一愿望创造出它所必需的特定条件。3、思维是精神过程的惟一活动方式，而观念，是思维活动的惟一产物。4、每个人的客观环境和一切生活际遇，都是主观思维在客观世界中的反映。我们的思想主导着我们的行动。5、所有的成就
《内心强大不怯场》读书笔记4 mitt_ 笔记
40.面对忙碌与压力，应保持从容，做事前静心规划，可提升效率。41.人际交往中，以德抱怨，得理饶人，能收获人心，利于营造良好关系。42.宽容是可贵品质，不仅非懦弱，还能在退让中得拥戴，让人际关系保持良好。43.人生要懂得舍取，不盲目坚持，适时放弃才能抓住更重要的事，保持幸福。44.面对错误要坦然，从中汲取经验，还应宽容他人错误。45.要善于从错误中成长，聪明人愿及时发现并改正缺点。46.愤怒易让人
《内心强大不怯场》读书笔记1 mitt_ 笔记
1.树立理想：尽早确定可奋斗的理想，有野心才能驱动行动。2.面对不如意，积极行动比抱怨更能解决问题。3.希望是生活前进动力，绝境中也别放弃希望。4.提前按理想状态生活，能更快接近梦想。5.别把命运交给他人，努力为自己当家做主。6.人生难有顺遂，无论普通人还是成功者遇挫折，要主动迎接命运，勇敢面对才能主宰命运。7.艰难坎坷的遇境能促人成长，面对命运应改变态度，提升自我，坚持跨越困难。8.改变命运需大
《内心强大不怯场》读书笔记2 mitt_ 笔记
11.自信的人了解并接纳自己，坚定且有魅力，易赢得他人信任，利于融入团队，取得成功，还能感染他人增强团队凝聚力。12.面对生活中的不如意，与其对抗外界，不如改变自己的心态，内心的转变能影响对世界的感受。13.积极的自我心理能带来幸福，要学会用积极的心态看待日常，幸福是一种可选择的习惯。14.懂得拒绝至关重要，有利于提高我们的工作效率和生活质量。15.要懂得拒绝，拒绝使自己快乐，拒绝利于提升工作生活
《内心强大不怯场》读书笔记3 mitt_ 笔记
26.看待人和事物要从多角度出发，这样才能客观公正，找到处理问题的最佳解决方法，避免片面判断。27.转换角度思考能带来新发现，突破思维方式，助力解决问题，取得成功。28.面对生活困苦要保持乐观坚强，自尊自爱，相信不幸会过去，美好会到来。29.勇气是事业成功的基础，缺乏勇气一事无成，要克服内心畏惧，凭借勇气和坚韧战胜挫折。30.实现梦想需勇气相伴，面对坎坷挫折，要有勇气坚持不放弃。才能抵达梦想彼岸。
《开窍·开悟·开智》读书笔记 mitt_ 笔记
1.打破常规思维，不被习惯束缚去看待事情。2.真是自己的情绪，别让负面情绪主导行为。3.真诚倾听他人观点，别急于表达自己。4.制定清晰计划，合理分配时间，提高效率。5.全面认识自己，挖掘潜在优势和隐藏不足。6.运用一些方法训练专注力，如限时任务。7.用积极乐观的心态，主动迎接挑战。8.与他人交往多付出真心，而非只考虑自身利益。9.树立终身学习观念，不断更新知识储备。10.面对压力通过运动，倾诉等方
《内心强大不怯场》读书笔记5 mitt_ 笔记
54.雄心是成就起点，能激发潜能，让人坚持进取，助开拓财富路。55.要学习狼的顽强生命力，斗志，忠诚合作，助力应对竞争。56.与困难别装可怜，自强自立才易获真正帮助，获他人敬佩。57.突发状况时，务必保持镇定，冷静应对才能解决问题。58.面对突发问题，可佯装镇定，想出办法保护自身安全。59.相变强大需越挫越勇，强者从不因小磨难放弃，要抓住机遇。60.告别软弱，学会掌控大局，别因他人操控失去自我，要
《网络是怎样连接的》读书笔记（自用） Hunter_11 网络
第一章浏览器生成消息1.1生成HTTP请求信息1.1.1从输入网址开始用户输入url指定浏览器的运作方式，常见的url开头有http（访问web服务器）、ftp（访问FTP服务器，上传下载文件时使用）、file（读取本地文件）、mailto（发送电子邮件）、news（读取新闻）。格式见书P6。1.1.2解析url根据url解析出来我们需要的信息，最基本的有运作方式（http等，//后面跟的是服务器
【传习录-叶圣陶校注版】-绪论内容读书笔记 MicrowaveM 人生笔记程序人生职场和发展学习方法微信其他
【心即理】王阳明的学说都有其前提，此外诸说都是从这个前提上演绎出来的，即：“心即理”。此处所谓的“理”便是天理、原则、规律，也就是至善。理是整个的，不可分析的，人心天生即具有理，自然具有它的整体，不是一枝一节，所以王阳明说“心即理”。“理”的最高境界便是“至善”，既然人心本就具有“理”，那不是人人都是善人了？为什么世上又存在形形色色的恶人呢？于是他们认为这主要是由于：私欲。由于人的私欲的存在，遮蔽
网络安全应急响应技术实战指南读书笔记之数据泄露安全应急响应
网络安全应急响应技术实战指南读书笔记之数据泄露安全应急响应今日分享知识点与归纳总结，可用于各种场合，比如应急培训等等等。1、数据泄露概述。2、常规处置方法。3、常用工具。
网络安全应急响应技术实战指南读书笔记之勒索病毒安全应急响应 K1jxm3 安全网络安全
今日分享的是勒索病毒网络安全应急响应，技术操作指南内容比较多，单独拿出来给大家分享。1、勒索病毒钙素2、常规处置方法3、错误处置方法4、常用工具
2021.11.20【读书笔记】|差异可变剪接事件及DTU分析穆易青 RNA-seq 二代读书笔记数据分析自动化业务流程测试
一、可变剪接(AlternativeSplicing)定义：同一前体mRNA分子，可以在不同的剪接位点发生剪接反应，生成不同的mRNA分子，最终产生不同的蛋白质分子的一种RNA剪切方式。意义：1.AS是形成生物多样性的重要原因之一2.AS是基因表达调控的重要组成部分，与基因表达的时空性息息相关3.由于可变剪接直接造成表达产物的差异，因此可变剪接在一些性状、疾病中发挥重要作用。识别：分成了7个类型识
《数据密集型应用系统设计》读书笔记：第七章忍者算法数据密集型应用系统设计系统架构
我们进入《DDIA》第7章：事务（Transactions）。这是全书中最核心的一章之一，也是理解数据库和分布式系统一致性保障机制的关键。第7章：事务（Transactions）一、事务的基本定义一个事务就是一组操作的组合，这些操作要么全部成功，要么全部失败，系统状态不会处于“中间状态”。Martin用这个模型描述事务特性：ACIDACID四大特性：特性含义解释A-原子性（Atomicity）要么
【C++基础】第四十课：函数指针 x-jeff C++基础 c++
【C++基础】系列博客为参考《C++Primer中文版（第5版）》（C++11标准）一书，自己所做的读书笔记。1.函数指针函数指针指向的是函数而非对象。和其他指针一样，函数指针指向某种特定类型。函数的类型由它的返回类型和形参类型共同决定，与函数名无关。例如：//比较两个string对象的长度boollengthCompare(conststring&,conststring&);该函数的类型是bo
《思维力：高效的系统思维》读书笔记04 - 我的裁剪版 - 构建框架的4大步骤郑文强读书笔记读书笔记思维能力
构建框架是系统化思维进行解决问题、沟通表达、高效学习和结构写作的最重要的步骤，需要各种思维方式的支持，例如：发散思维、收敛思维、水平思维等，也需要一些基础思考工具的支持，例如：思维导图、逻辑树和MECE（相互独立、完全穷尽，或简称不重叠不遗漏）。根据我的经验和理解，实现MECE中的CE，完全穷尽是很困难的，但是我们至少尽量实现ME，即同一层次的分类应该是相互独立，或者在同一个维度进行的，例如：红色
读书笔记—颠覆式创新：移动互联网时代的生存法则 weixin_33688840 操作系统嵌入式移动开发
颠覆式创新：移动互联网时代的生存法则作者：李善友引言有一个非常著名的哥德尔第一定理。它这样讲：任何一个体系，它必是内部和外部自洽的，这样才能有效运行。但是任何一个内部逻辑完全自洽的体系，一定存在自身的边界，一旦越过边界，这套体系一定是失效的，边界外是另一个新的体系。哥德尔是一个数学家，他的体系是一个纯粹的数学体系，即便是这样的数学体系，也会存在逻辑陷阱，何况其他体系呢？我们生活在一个已知的世界，往
202560读书笔记|《和你在一起（轻经典）》—— 祝你今天愉快。你明天的愉快留着我明天再祝程序媛一枚~ 读书笔记读书笔记恢复能量的100件小事治愈系无需抱怨可以抱我
《和你在一起（轻经典）》李银河王小波，很浪漫的一本小情书。印象里我看过他俩的一本书，从相遇相知到靠近，那是我大学毕业不久后的日子。印象里看他俩之间拥有彼此的过程也多多少少影响了一点我后来的恋爱经历。但不记得书名了。偶然看到这本就开看，蛮受感动的，似乎随着书信里的情绪，感受了他和她彼此的吸引与喜爱。感情是极致的，真诚的，恋爱的酸甜味。“你好哇，李银河”开场，“祝你愉快”结尾。一天一封，太浪漫了，在那
《数据建模-经典教程》读书笔记七：键小木谈数数据建模-经典教程读书笔记数据库
一、理解候选键、主键及备用键键由一个或多个属性构成，其目的在于实施规则，有效数据检索，而且允许从一个实体导航到另一个实体。候选键是一个或多个可以唯一标识实体实例的属性。候选键具备以下4个基本特征：1）唯一性:候选键必须不能标识多于一个实体实例(或现实世界中的事物)。2）强制性:候选键不能为空，每个实体实例要求必须能被一个特定的候选键值标识，候选键取不同值的数目，始终与不同的实体实例数目一致。如果实
《CUDA并行程序设计-GPU编程指南》读书笔记--(2)CUDA内存处理 SigalHu 读书笔记 cuda编程
CUDA内存处理高速缓存不仅要思考如何高效地访问全局内存，也要时刻想办法减少对全局内存的访问次数，尤其在数据会被重复利用的时候。CPU与GPU架构的一个主要区别就是CPU与GPU映射寄存器的方式。CPU通过使用寄存器重命名和栈来执行多线程。为了运行一个新任务，CPU需要进行上下文切换，将当前所有寄存器的状态保存到栈(系统内存)上，然后从栈中恢复当前需要执行的新线程上次的执行状态。这些操作通常需要花
CHAPTER 17 Information Extraction boywaiter Speech and Language Processing ed3 NLP
CHAPTER17InformationExtractionSpeechandLanguageProcessinged3读书笔记Thischapterpresentstechniquesforextractinglimitedkindsofsemanticcontentfromtext.Thisprocessofinformationextraction(IE),turnstheunstructu
《管理的常识》读书笔记 hebeind100 奇文分享管理的常识读书笔记
管理的常识1、管理的理解管理没有对错，只有面对事实解决问题。第一，管理就是让下属明白什么是最重要的管理所要求的合格决策，就是让下属明白什么是最重要的。我们常常看到企业的管理者每日忙于决定他们认为重要的问题，但是对于下属应该做什么，对于每一个岗位应该做什么却从来不作分析，不作安排，结果每一个员工都是凭着自己对于这份工作的理解，凭着自己对于企业的热情和责任在工作，出现的工作结果就很难符合标准。第二，管
推荐算法介绍-基础算法盒子6910 运维视角下的广告业务算法推荐算法机器学习 c++java python
本系列教程也可以称为【深度学习-推荐系统】的读书笔记，该书系统化讲解了现代推荐系统的演进历程和工程实现，是一本非常优秀的推荐系统入门教程一、推荐系统架构1.1推荐系统介绍概述：获得“用户信息”、“物品信息”、“场景信息”的基础上，推荐系统要处理的问题可以形式化的定义为对于用户U(user)，在特定场景C(context)下，针对海量的“物品信息”，构建一个函数f(U,I,C)，预测用户对特定候选物
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他