17岁boy想当攻城狮

计算机编码详解_什么是计算机编码？计算机编码的起源与操作系统是如何解码的。

前言

编码是什么？

操作系统是如何绘制编码的

编码的起源

Unicode和Utf-8的区别

什么是抽象码？它与编码的区别

Utf-8与Utf-16

目前是谁在维护编码统一性？

宽字符与窄字符的区别

1.窄字符

2.宽字符

多字节字符

文件编码与程序编码

如何设置你的程序编码

在程序运行过程中，是谁来将二进制编码转换成字符集的？

如何解码？

c语言如何控制编码

不同编码的处理速度

前言

你是否有过这样的疑惑？

1.我的代码里面中文注释在自己电脑上是可以正常显示的，但是换了别的电脑出现了乱码。
2.想写跨平台程序，但是在Windows上明明正常的，到了Linux下源代码全变乱码，甚至编译都过不去还会出现一些乱七八糟的错误。
3.不知什么是wchar、utf-8和utf-16的区别，更不知什么是gbk2312。
4.看到别人代码里有针对wchar和char两种字符集写法，不知为何这样做
5.完全不知何时用宽字符和单字符
6.不知道计算机是如何显示编码的
7.分不清unicode和utf-8的区别

如果想成为资深程序员编码是必须要走的路，因为资深程序员的代码都较为严谨，写出来的程序能应对不同平台，不同的情况。

你是否发现自己的程序健壮性始终不如别人？这是因为别人比你考虑得多且思路清晰。

考虑得多得前提下是你要对这个行业里得规则，也就是原理了解得透彻才能在这基础之上去加入你自己得想法。

当然衡量程序健壮性得因素有很多，编码几乎算不上，但是如果想要让你得程序适应性更强，那么编码少不了。

不然可能会出现你得程序在当前系统下运行好好的，换了个系统有些字就变成了乱码，这种情况就代表你得程序适应性很差。

本篇文章的代码以C/C++的语法编写

编码是什么？

在介绍编码之前先说一下操作系统是如何显示我们平时所看见的字符的

屏幕对于操作系统来说就是一个二维数组，也就是一个像素点阵，有宽和高，那么计算机如果想在这个2X2的像素点阵里显示一个字符是也很简单

举个简单的列子：

如果想要在像素点阵里显示一个1，那么操作系统需要根据预设x和y的坐标来确定像素位置，然后在这个位置开始绘制1，同时要确定1的大小，占多少像素范围，那么操作系统会在本地建立一个表，就像列表一样的东西，里面存储不同的字符如何绘制的，比如1应该在每行中点亮哪些像素点，而2应该在每行中点亮哪些像素点，这个表就叫字符集，而这个方式就叫编码。

人们把不同的字符写入到字符集里，明确规定计算机应该怎样绘制不同的字符，这个过程就叫编码。

操作系统是如何绘制编码的

如简单的一个江字

可以把上面的格子看成数组，每个白格代表一个元素，然后告诉计算机每行哪个元素应该被绘制，这样计算机就会在每行里绘制一个点，点的颜色根据用户的设置来决定，当点密集起来就会让你感觉它像一个字。

所以字符集里存储的都是数，比如{23,76,88}，23的二进制代表10111，那么计算机就会根据10111为规则，在第一行里第一个元素绘制一个点，第二个元素不绘制，凡是BIT为1的都依次绘制点，然后依次类推下一行，就组成了一个字。

其实下面一张图可以很好的解释我上面的解释

这张图我相信学过自制操作系统的或者上过操作系统课的同学一定不陌生，我就是从操作系统原理上学到计算机是如何显示字符的。

简单点来说：

编码就是制作字符集时的规则，字符集里包含了一个字符的绘制方法，方法都是以十六进制数存储的，操作系统到时候会解出这个数的BIT位，然后在每行的像素矩阵里如果BIT位为1的绘制一个点，为0则不绘制。

字符集需要规定字符站的宽度，高度，这些都是需要来控制，所以一般我们叫编码规则，编码规则只是规范一个编码的显示方式。

通常情况下一个字是有锯齿的因为像素点本身就是紧凑一起的，不是一条线直连的。

之所以我们平时看不到锯齿是因为像素比较高，你把屏幕像素改低点你就能看见字符变得锯齿明显，不美观。

现代计算机一般会用模糊的方式来消除锯齿，就是模糊算法将锯齿边缘使用模糊算法模糊掉，也就是平滑操作，使其看起来更美观，消除锯齿，就跟PS的羽化功能一样。

编码的起源

最初设计编码是为了让计算机能显示更多的东西，因为一开始计算机只能处理数字，且自认0101，后来人们发现计算机性能逐渐强大，不光只能用于计算还能用来做别的事情。

但是计算机那个年代又被限制死了，只认0101所以就需要操作系统来帮忙解决这一问题，人们把不同的字符转化成0101，然后计算机根据0101通过编码表解码出来，就是想要的信息了，就如我上面说的一样。

最初的编码EBCDIC是IBM在1963年制定的，在1964年完善的，最开始每个操作系统内部都带了这种编码规则的字符集用来显示字符。

到后来计算机逐渐广泛，应用于世界各地，人们需要更大的编码表来显示不同国家的语言，所以就横空出世了许多的编码规则

如：

ASCII

GBK

Unicode

CCCII

等等，这些编码都是针对不同国家语言诞生的，同时Unicode和GBK是目前最广泛的编码，其背后是不同的操作系统在支持。

Unicode是Linux默认编码，GBK是Windows。

Unicode和Utf-8的区别

Unicode是编码规则

utf-8是字符集

utf-8是根据Unicode的编码规则来指定的字符集。

什么是抽象码？它与编码的区别

如一个字符集里的A是这样的：

{53,66,77,12,64,18,23}

里面的数字就代表抽象码

抽象即与目标有联系，有本质的相同点但又不能代表目标，但是可以被抽象出来为目标。

但是如何知道这段抽象码代表谁？

答：

编码就像数据库的key一样，一个key对应一段数据，通过key找到这段数据。

Utf-8与Utf-16

utf-8和utf-16的区别就是一个是占8位一个是占16位，占16位的编码意味着可以存储更大更繁琐的字，如中文，所以Utf-8一般用来显示英文，但是现在Utf-8已经能够显示中文了，但是不能显示较为复杂的文字，比如象形文字。

目前是谁在维护编码统一性？

ISO/IEC组织标准组织，为了防止编码乱七八糟，它们指定了一个规则，如果你想发明新的字符集需要根据它们的规定来，否则你的编码无法在别的机器上跑起来，除非你自己编写操作系统，不去符合POSIX标准。

宽字符与窄字符的区别

1.窄字符

窄字符就是char类型，char为1字节大小，也就是8bit，最大只能表示ASCII码表里的256个基础字符与符号，它只能用于ASCII码表，若您的计算机不支持ASCII码表，那么你的程序里用char存储的字符都无法正常显示，但是现在基本上不存在这种情况，现代计算机全部都支持ASCII码。

为什么说它只能用于ASCII码呢？因为只有ASCII的编码支持1字节大小的抽象码。

当你用char存储一个汉字，是无法正常打印的

如：

 char f = '喊';
 printf("%c\n", f);

打印结果：

这里来说一下当你是窄字符并且使用utf-8编码时为什么可以打印，明明窄字符是1字节

答：字符集里不同的字符有不同的复杂程度，同时也有不同大小的描述

比如当你使用的是UTF-8编码，而你个char里只写了一个简单的字符‘A’，在UTF-8编码里，A只占了一个字节，可以轻松描述。

大部分中文占用两个字节，所以utf-8也一样可以表示，所以你也无需担心使用UTF-16会不会让程序体积增加这样的情况产生。

实际的ASCII码也会转换成utf-8编码

表一 UTF-8转换表
Unicode/UCS-4	bit数	UTF-8	byte数	备注
0000 ~ 007F	0~7	0XXX XXXX	1
0080 ~ 07FF	8~11	110X XXXX 10XX XXXX	2
0800 ~ FFFF	12~16	1110 XXXX 10XX XXXX 10XX XXXX	3	基本定义范围：0~FFFF
1 0000 ~ 1F FFFF	17~21	1111 0XXX 10XX XXXX 10XX XXXX 10XX XXXX	4	Unicode6.1定义范围：0~10 FFFF
20 0000 ~ 3FF FFFF	22~26	1111 10XX 10XX XXXX 10XX XXXX 10XX XXXX 10XX XXXX	5	说明：此非unicode编码范围，属于UCS-4 编码早期的规范UTF-8可以到达6字节序列，可以覆盖到31位元（通用字符集原来的极限）。尽管如此，2003年11月UTF-8 被 RFC 3629 重新规范，只能使用原来Unicode定义的区域， U+0000到U+10FFFF。根据规范，这些字节值将无法出现在合法 UTF-8序列中
400 0000 ~ 7FFF FFFF	27~31	1111 110X 10XX XXXX 10XX XXXX 10XX XXXX 10XX XXXX 10XX XXXX	6

在说一个小插曲：

同时ASCII码其实是七位bit的，而char是八位bit的，最高位是为了表示符号位用的，很多人都说char能表示8^2次方这么多字符，其实这一点是有误的。

char是最大也只用到了7位bit，同时ASCII码最大也只能存储7^2次方个字符，还有一位是用来表示大小写的，这是ASCII码的规范。

2.宽字符

宽字符即多个字节表示一个字符，一般应用于unicode、gbk等等国际编码。

在编程语言中用wchar_t来表示宽字符，一般是16位即utf-16，同时编译器还提供了许多针对宽字符操作的API，如最经典的WindowsAPI就提供了两套API实现函数，一种是普通的ASCII码的，一种是unicode编码的。

如：

SetWindowsA 这个是ASCII码的

SetWindowsW 这个是宽字符的

一般来说使用char类型的都为ASCII码的API函数。

在宽字符里它可以存储更复杂的编码，通常情况下跨国际开发都会采用wchar_t.，微软会比较推wchart_t，这个原因大概就是微软是跨国企业。

unicode编码是推荐大家使用的，因为现在操作系统包括windows xp这种老系统都默认支持unicode编码，所以当你的程序是使用unicode编码时编译发布到世界任何一台电脑上都不会出现乱码这种糟糕的情况产生。

多字节字符

多字节字符就是char*，它是由多个char窄字符组成的一连串字符集，当你使用这种类型的变量时，它就可以存储宽字符也可以存储窄字符，具体大小由你的多字节字符控制。

通常情况下只要你的多字节字符集够大，就能存储编码里的所有字符，也不需要宽字符来处理更复杂的编码，但是坏处在于，你无法确定它究竟有多大。

比如char* ff = "你好“

你想取出这个里面有多少个汉字。

你使用strlen函数却发现返回的是4

这是因为中文在utf-8里占两个字节，而strlen是以char为单位来遍历，直到找到\0为结尾。

而当ff=”ab“的时候你使用strlen就返回了2，这是因为不同的编码，utf-8编码表里所占的字节不同，越简单的字符越容易描述，所以占用字节就越少。

所以通常在未知的情况下，你无法确定utf-8这种可变长字符究竟有多大，你也无法知道用户输入的是中文还是英文，还是中英夹杂的字符。

文件编码与程序编码

文件编码是你当前在编辑源代码时，代码里的字符串是以什么样的编码存储，这也是为什么很多人在windows上写的代码到linux下进行编译就会出现乱码以及编译器无法解析的字符串，一些莫名其妙的问题。

程序编码是程序运行之后在处理字符串时所使用的编码。

如何设置你的程序编码

在Linux环境下，若用户不去指定你编码格式则默认是UTF-8，在Windows环境下则默认是GBK2312。

在Linux环境下使用GCC编译器可以使用-fexec-charset参数来指定应用程序采用的编码。

当然你也可以指定GCC使用什么样的编码去解析你的源代码，比如你在Windows上使用了GBK的编码来编辑你的源代码，那么在Linux下难免不会出现报无法识别的编码之类的问题，你可以在Linux下装上与Windows端对应的编码

然后使用-finput-charset参数来指定。

示列：

gcc test.c -fexec-charset=utf-8 -finput-charset=gbk2312

可以写一个简单的程序验证一下

下面代码会打印出每个字符的16进制码

#include 
int main(int argc, char **argv) 
{ 
	int i = 0;
	unsigned char *str = "1234中";
 
	while(str[i])
	{
		printf("%02x ",str[i]);
		i++;
	}
	printf("\n");
	return 0; 
}

输出：

31 32 33 34 e4 b8 ad

根据这些输出可以在utf-8码表里去看一下

字符	编码10进制	编码16进制	Unicode编码10进制	Unicode编码16进制
中	14989485	E4B8AD	20013	4E2D

可以看到验证是正确的。

那么在Windows环境下如何指定呢？

如果你想设置当前源代码文件中char使用的字符集可以使用如下编译器命令：

#if _MSC_VER >= 1600
       #pragma execution_character_set("utf-8")
 #endif

需要你的msvc编译器大于1600

当然如果你想设置当前解决方案上的所有源文件使用统一编码，在visual studio上你可以这样做

在项目的属性页里设置

第一种方法只是针对于某个单一文件，通常情况下我们是将这个代码写成一个头文件，然后让每个源文件都包含它，来指定编码，但是visual studio这个方法会更加便捷。

visual studio无法主动设置文件编码，这里推荐一个方法，如果你发现使用visual studio打开文件乱码，可以使用记事本先打开然后另存时选择你的编码就可以了。

在程序运行过程中，是谁来将二进制编码转换成字符集的？

当源代码编译成可执行程序后，里面的字符都会被编译器翻译成当前环境使用的编码对应的十六进制数。

但是当你的程序运行时不是由编译器给你写代码来去当前操作系统里的编码表里转换的，而是操作系统。

如printf这个函数，它其实调用的是操作系统内核提供的打印输出函数，编译器只负责根据当前使用的字符集，来将你的字符串转换成对应的编码，最后的解析是由你调用了的那些打印输出函数或者显示函数来完成转换。

所以准确一点来说是由操作系统内核来完成这系列工作的。

如何解码？

通过前面的知识，我们知道了是谁来生成字符集的编码，谁来处理它们，如我们前面说的，utf-8编码是可变长不规则的编码，它的大小不定，那么在一连串的编码里是如何识别出来它的呢？

比如：

1234中，这样的字符串，当编译之后就是31 32 33 34 e4 b8 ad

那么printf实际在处理时看到的是31323334e4b8ad这样的字符集，它怎么知道谁是谁的呢？

比如1占两个字节，而中占四个字节它是如何区分的呢？

其实很简单

utf-8编码在开始时，是有开始位和结束位，开始一般是：

111这样的bit位，比如：

10 这样的开始位就代表这个占一个字节，那么printf取一个字节然后转换成16进制的编码去utf字符集里去找就可以了。

如果是110则代表两个字节，前面有多少个1代表这个编码占多少个字节。0对于utf就是分隔符的意义。

其中还有一些其它的特点，比如当这个编码占4个字节的时候，utf要求第4个字节的开始位设置为10，剩下的6个bit位才能使用。

utf是没有结束位的，一般通过最开始的1确认几个字节之后在以当前为第一个字节往后读，然后在以utf特定的算法转去除标志位然后在转为16进制的编码去字符集里去找就可以了。

c语言如何控制编码

在c语言独写文件时候必不可少的是fopen，其实fopen是可以用来控制编码的

fopen("newfile.txt", "rw, ccs=");

把里面的encoding替换成你对应的编码就可以了。

如：unicode,utf-8,utf16-le

不同编码的处理速度

刚刚说到utf-8编码是比较快的编码，它是可变长的编码不像有些编码是固定长度的，所以当有些字符比较小的时候一个字节就能表示时，有些固定编码的字符集就要求多个字节，然后多的字节则填0，这就很占strcpy或者printf处理的时间，包括传输上也是。

字节越少就越快，所以一般情况下大家都会选择这种可变长的unicode编码。

你可能感兴趣的:(其他,编码学,操作系统)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
其二十八尾喵
你知道吗？图片发自App我今天知道了你有喜欢的人，不是我。心空空的，整个人都不是我的了。可，怎么办？还是要好好的活着，毕竟你喜欢的人，我不能杀，可是我可以杀其他喜欢你的人呀！也罢，此生无缘，来世再见。鱼干
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
学霸父母学渣娃，这孩子真是亲生的？太扎心了！东北SK皇家成长中心
现在的社会，每个家庭基本都把孩子的教育放在第一位，哪怕父母平时上班再苦再累也不敢在孩子的教育上有丝毫的马虎，平时对孩子的照顾真的是无微不至，每天早起送孩子上学，晚上回家辅导孩子写作业，有的父母的文化程度非常高，但是每每到了辅导孩子写作业这个时候，父母们内心都有这样一种想法，这个孩子真的是我亲生的吗？真想一巴掌拍死他，我上辈子是做了什么孽生出这么一个智障的孩子，家里每每就要上演全武行，看看这些孩子到
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
厉国刚：新闻学与传播学到底有何区别微观大道
厉国刚：新闻学与传播学到底有何区别头几天，有人在知乎上问我：新闻学与传播学到底有何区别。他是一位想要跨专业考研的学生，对新闻传播学学科可谓了解甚少，甚至一头雾水，想要让我帮他解释解释。在研究生学硕层面，新闻传播学是一级学科，分成新闻学、传播学这两个二级学科。有些高校，还自设了广告学、出版发行学等其他二级学科，但从官方角度，新闻传播学一级学科下，正统的就是那两个二级学科。招生时，一般会按一级学科招，
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
2021-01-24 9ce517ee104c
【打卡素材】《香帅金融学讲义》【标题】公司治理：怎样同床异梦地过下去【日期】2021.1.24【字数】公司本质上是一连串的合约关系。降低合同执行中的各种摩擦是公司正常有效运行的基础。协同各方的利益、制衡各方的权力是关键。为解决利益冲突问题、协同各方利益，进行权力制衡的机制设计就是公司治理机制。001什么是公司治理治理是管理的基础，治理机制越好，权、责、利就越清晰，管理的目标也就会更容易实现。002
2023-08-08 2023梦启支教团张牧泽
学汉字历史，行传统书法——中国矿业大学梦启支教团梦启三班开展书法文化课7月20日上午8时，中国矿业大学梦启支教团在贵州省金沙县西洛街道彩虹小学开展了“书法文化”课程。该课程意在向孩子们传授汉字演变的相关知识，围绕书法发展历史讲解不同时期的字形字体特点。此课程由梦启支教团成员王耀民讲授，梦启三班全体成员参加。中国文字的发展有数千年的历史，从早期雏形的象形文字到殷商时期的甲骨文、金文，再到西周、秦朝的
如何培养兴趣绽蕊向阳
今天读李笑来的书《与时间做朋友》，读到有关兴趣部分，深有感触。书中提到，好多人说对某事没有兴趣，实际上是没有能力把这件事做好，做这件事时的感受很不好，有挫败感，每个人对自己不擅长做不好的事情，都本能的容易逃避，所以就以为自己对这件事不感兴趣，他们真正感兴趣的是其他事情。可事实上，出现这种感觉应该仅仅是因为还没有开始做那件事情，也还没有在那件事情上遭受挫折而已。其实，很多人真的放弃原来做的事情，转去
戴容容中原焦点团队.网络初级第33期,坚持分享第19天 2022年3月9日 TessDai
《每个人眼中的世界都是不同的》“一千个人眼里有一千个哈姆雷特”世界是多元的,每个人都有自己的道理,人人按照自己的理解去看待这个世界的人和物.我们如此,其他人也是如此.因此,任何事情,我们要放下自己以为的真理,去理解他人认为的真理,只有同频方能共振.孩子在慢慢长大的过程中慢慢学会独立,甚至对抗.尤其当孩子处于青春期的时候,他们开始有很多自己独立的想法,和一些特立独行的做法,家长常常会觉得不可思议,觉
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l