馨颖

『Python』快速复盘【泰坦尼克获救预测分析】·动手学数据分析（未完待续）

半年前为了学习机器学习的分类模型，首次写下这篇博客泰坦尼克获救预测分析，如今为了巩固python分析基础（提醒自己基础熟练的重要性！！！），还有分享如何快速“动手学数据分析”，快速复盘这个案例。

Python数据分析流程

一、数据基本操作

1.数据加载

1.1载入数据
1.2初步观察
1.3保存数据

2.Pandas基础

2.1认识Pandas中两数据结构：DateFrame和Series
2.2查看数据
2.2数据筛选

3.探索性数据分析

3.1利用Pandas-describe()函数查看数据基本统计信息
3.2利用Pandas对示例数据进行排序，要求升序
3.3利用Pandas进行算术计算，计算两个DataFrame数据相加结果

二、数据清洗与重构

1.数据清洗及特征处理

1.1缺失值观察
1.2缺失值处理
1.3重复值观察与处理
1.4特征观察与处理

2.数据重构1

2.1数据的合并
2.2

3.数据重构2

三级目录

4.数据可视化

三级目录

三、建模和评估

二级目录

三级目录

一、数据基本操作

1.数据加载

1.1载入数据

数据集下载： https://www.kaggle.com/c/titanic/overview
1.1.1 导基本包

1.1.2 导数据
(1) 使用相对路径载入数据
(2) 使用绝对路径载入数据
也可以把地址赋给一个变量，之后引用这个变量即可。

备注：电脑是Mac系统，我得到绝对地址的方法是：把文件直接拖拽到终端里，自动会显示此文件的绝对地址。

1.1.3每1000行为一个数据模块，逐块读取文件

问题：什么是逐块读取?
答案：利用chunksize参数，来控制每次块数据的大小。它的本质就是将文本分成若干块。其实，每次进行迭代的时候还是一个DataFrame类型的数据结构。
问题：为什么要逐块读取呢?
答案：使用pandas来处理文件的时候，经常会遇到大文件，而有时候我们只想要读取其中的一部分数据，这时对文件进行逐块处理。

1.1.4将表头改为中文，索引改为乘客id

1.2初步观察

1.2.1查看数据的基本信息

1.2.2观察表格前10行的数据和后15行的数据


1.2.3判断数据是否为空，为空的地方返回True,其余地方返回False

量化一下：

1.3保存数据

将你加载并作出改变的数据，在工作目录下保存为一个新的文件train_chinese.csv

2.Pandas基础

2.1认识Pandas中两数据结构：DateFrame和Series

总结：
1、Series是一种类似于一维数组的对象。它由一组数据（各种Numpy数据类型）以及一组与之相关的数据标签（即索引）组成。Series只有行索引。
2、DataFrame是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔型值）。DataFrame既有行索引也有列索引，它可以被看做由Series组成的字典（共同用一个索引）。
3、dataframe类型的每一列都是Series类型。

2.2查看数据

2.2.1加载上面保存的"train_chinese.csv"文件。

2.2.2查看数据的某列的所有项

注意：取值时用[]包含才是dataframe，否则取出来就是Series

2.2.3删除某些列
①del df[]
②df.drop([],axis = 1)

#方法一
del test_df['某一列']
#方法二
test_df.drop(['乘客ID','姓名','年龄','票价'],axis=1)

2.2数据筛选

表格数据中，最重要的一个功能就是要具有可筛选的能力，选出我所需要的信息，丢弃无用的信息。用实战来学习pandas这个功能。

2.3.1 以‘age’为筛选条件，显示年龄在10岁以下的乘客信息

2.3.2以‘Age’为条件，将年龄在10岁以上和50岁以下的乘客信息显示出来，并将这个数据命名为midage

Ps:小心标注的符号吼！！！

2.3.3数值筛选

原本是这样的，如果想要按索引筛选，需要重置索引。

总结：loc和iloc的区别:
loc：只能通过选取行标签索引数据；
iloc：只能通过选取行位置编号索引数据。

3.探索性数据分析

3.1利用Pandas-describe()函数查看数据基本统计信息

说明：
·count : 样本数据大小
·mean : 样本数据的平均值
·std : 样本数据的标准差
·min : 样本数据的最小值
·25% : 样本数据25%的时候的值
·50% : 样本数据50%的时候的值
·75% : 样本数据75%的时候的值
·max : 样本数据的最大值

分析：
仅对于票价分析
一共有891个票价数据，
平均值约为:32.20，
标准差约为49.69，说明票价波动特别大， 25%的人的票价是低于7.91的，50%的人的票价低于14.45，75%的人的票价低于31.00，票价最大值约为512.33，最小值为0。

3.2利用Pandas对示例数据进行排序，要求升序

代码解析：
pd.DataFrame() :创建一个DataFrame对象
np.arange(8).reshape((2, 4)) : 生成一个二维数组(2*4),第一列:0，1，2，3 第二列:4，5，6，7
index=['2, 1] :DataFrame 对象的索引列
columns=[‘d’, ‘a’, ‘b’, ‘c’] :DataFrame 对象的索引行

sort_values这个函数中by参数指向要排列的列，ascending参数指向排序的方式(升序还是降序)

排序总结：
·让行索引升序排序 df.sort_index()
·让列索引升序排序df.sort_index(axis = 1)
·让列索引降序排序df.sort_index(axis= 1,ascending = True)
·任选两列数据进行排序 df.sort_values(by = [])

3.2.1对泰坦尼克号数据（trian.csv）按票价和年龄两列进行综合排序（降序排列）

分析：排序后，如果我们仅仅关注年龄和票价两列。根据常识知道发现票价越高，客舱越好，所以明显看出，票价前10中有8位幸存，票价后15中（除去Null和0）仅仅有1人幸存。
我们后面可以进一步分析一下票价和存活之间的关系，年龄和存活之间的关系。

3.3利用Pandas进行算术计算，计算两个DataFrame数据相加结果

说明：两个DataFrame相加后，会返回一个新的DataFrame，对应的行和列的值会相加，没有对应的会变成空值 NaN。

3.3.1计算出船上最大的家族有多少人？
最大的家族计算公式=兄弟姐妹个数+父母子女个数

算完没有用的话，请删除

二、数据清洗与重构

我们拿到的数据通常是不干净的，所谓的不干净，就是数据中有缺失值，有一些异常点等，需要经过一定的处理才能继续做后面的分析或建模，所以拿到数据的第一步是进行数据清洗，我们将从缺失值、重复值、字符串和数据转换等操作，将数据清洗成可以分析或建模的形式。

1.数据清洗及特征处理

1.1缺失值观察

1.1.1查看每个特征缺失值个数，有两种方法：

1.1.2查看Age， Cabin， Embarked列的数据

1.2缺失值处理

两种处理办法
1.2.1 删除缺失值


1.2.2 填充缺失值


总结：
fillna()和dropna()默认会返回一个替换后的新对象，不改变源数据，这个时候将替换后的数据赋值给新的表，如果要改变源数据，通过传入inplace=True进行更改。

1.3重复值观察与处理

1.3.1查看数据中的重复值

1.3.2处理数据中的重复值
对于重复值我们一般是进行删除处理,使用的方法是drop_duplicates()。

1.4特征观察与处理

我们对特征进行一下观察，可以把特征大概分为两大类:
数值型特征:Survived ，Pclass， Age ，SibSp， Parch， Fare，其中Survived， Pclass为离散型数值特征，Age， SibSp， Parch， Fare为连续型数值特征
文本型特征:Name， Sex， Cabin，Embarked， Ticket，其中Sex， Cabin， Embarked， Ticket为类别型文本特征。
数值型特征一般可以直接用于模型的训练，但有时候为了模型的稳定性及鲁棒性（一些异常情况下它的效果能否继续相对稳定）会对连续变量进行离散化。文本
型特征往往需要转换成数值型特征才能用于建模分析。

1.4.1 [数值型特征] 对年龄进行分箱（离散化）处理


1.4.2 [文本型特征] 对文本变量进行查看

方法一：value_counts()

方法二：unique()和nunique()

1.4.3 [文本型特征] 对文本变量进行转换
1、将文本变量Sex， Cabin ，Embarked用数值变量12345表示

方法一：replace
方法二：map
方法三：使用sklearn.preprocessing的LabelEncoder

2、将文本变量Sex， Cabin， Embarked用one-hot编码表示

1.4.4 从纯文本Name特征里提取出Titles的特征(所谓的Titles就是Mr,Miss,Mrs等)

知识拓展1：pandas中字符数据的处理方法：
Series.str.extract(pat, flags=0, expand=None)
pat : 字符串或正则表达式
flags : 整型,
expand : 布尔型,是否返回DataFrame
知识拓展2：正则表达式’([A-Za-z]+).’
[A-Za-z]+：由26个字母组成的字符串。
[]:字符集，一个字符的集合，可匹配其中任意一个字符。
+:匹配前一个元字符1到多次。

\.:反斜杠后面接一个字符，表示匹配某种类型的一个字符。因为点是一个元字符，直接出现在正则表达式中，表示匹配任意的单字符，不能表示.这个字符本身的意思了。如果我们要搜索的内容本身就包含元字符，就可以使用反斜杠进行转义。
\s: 匹配任意一个空白字符，包括空格，tab，换行符等。
\S: 匹配任意一个非空白字符。

2.数据重构1

2.1数据的合并

使用pandas的concat方法
使用DataFrame自带的join和append方法
使用pandas自带的merge和append方法

总结：
1、merge、join只能横向合并数据，concat可以横向也可以纵向合并数据。

2.2

3.数据重构2

三级目录

4.数据可视化

三级目录

三、建模和评估

二级目录

三级目录

你可能感兴趣的:(「数据处理能力」之编程技术)

快手极速版能赚钱吗？解析快手极速版赚钱的3个方法！ U客直谈APP
快手极速版相信大家都有一定的了解吧，它作为快手打造的轻量化app，在应用市场上占据着一席之位。而对于其能赚钱的说法，更是引得大家的热烈追捧。那么快手极速版能赚钱吧？其赚钱是真的吗？快手极速版怎么赚钱？快手极速版一天赚50元的技巧有哪些呢？本篇文章就将解大家所疑，解析快手极速版赚钱的3个方法，帮助大家成功在该平台赚取收入，达到快手极速版一天赚50元的目标。一、快手极速版能赚钱吗答案显然是肯定的！快手
官途之红颜多娇(陈阳丁若烟)免费小说全集_阅读免费小说官途之红颜多娇陈阳丁若烟六小升
《官途之红颜多娇》主角：陈阳丁若烟，简介：领导葬礼上，美艳的夫人遭受欺凌，小车司机陈阳挺身而出，俘获夫人芳心，从此平步青云，潇洒花丛。陈阳走进卧室，把丁若烟丢在床上。“呆子，过来！”丁若烟羞涩地靠在床头，对他勾了勾手指。陈阳喉咙动了，目光落在床上那件性感的蚕丝吊带睡裙上。“怎么，想看我穿上呀？”丁若烟似笑非笑。“想！”陈阳用力点头。“这可是我新买的，他都还没体验过呢，让你尝个鲜。”丁若烟红着俏脸。
中医强化训练打卡第三十四天 5d8242021a46
桂枝加附子汤：太阳病，发汗，遂漏不止，其人恶风，小便难，四肢微急，难以屈伸者，桂枝加附子汤主之。桂枝汤很温和，所以不称为发汗，那用了麻黄，让人的汗孔被撑开，汗水流出来，我们才称为发汗。但是我们这个地方其实也不用那么严格的限制是桂枝汤还是麻黄汤，因为这跟人的体质也有关系。就是啊，有的时候用桂枝汤或者麻黄汤让这个人出汗，然后这个人如果本来就是一个阳气虚的人，这个汗一出，他的人就会产生一种脱阳的状态。桂
一文快速了解.NET项目文件(.csproj) ，基础而重要的文件【代码之美系列】 Microi风闲【开源】NET Core 跨平台 .net c#
代码之美系列目录一、C#命名规则规范二、C#代码约定规范三、C#参数类型约束四、浅析B/S应用程序体系结构原则五、浅析C#Async和Await六、浅析ASP.NETCoreSignalR双工通信七、浅析ASP.NETCore和MongoDB创建WebAPI八、浅析ASP.NETWebUI框架RazorPages/MVC/WebAPI/Blazor九、如何使用MiniProfilerWebAPI分
AI Agent开发学习系列 - langchain之示例选择器2：相关性与多样性兼得-MaxMarginalRelevanceExampleSelector在LangChain中的用法 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
MaxMarginalRelevanceExampleSelectorMaxMarginalRelevanceExampleSelector是LangChain中用于Few-ShotPrompt的一种智能示例选择器。它的作用是：在众多示例中，自动选择与当前输入最相关、同时彼此多样性最大的示例，插入到prompt里。主要特点相关性优先：优先选择与用户输入最相似的示例。多样性保证：避免选到内容高度重复
AI Agent开发学习系列 - langchain之memory(1)：内存中的短时记忆 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
内存中的短时记忆，在LangChain中通常指ConversationBufferMemory这类“对话缓冲记忆”工具。它的作用是：在内存中保存最近的对话历史，让大模型能理解上下文，实现连续对话。对话缓冲记忆”工具主要特点只保留最近的对话内容（如最近N轮），不会无限增长，节省内存和token。适合短对话、上下文关联不深的场景。支持多种变体，如窗口记忆（ConversationBufferWindo
力扣热题100 - 矩阵：矩阵置零菲英的学习笔记力扣热题100 leetcode 矩阵算法 c++go
本题主要考察代码能力。题目描述：题号：73给定一个mxn的矩阵，如果一个元素为0，则将其所在行和列的所有元素都设为0。请使用原地算法。解题思路：思路一：利用第一行第一列记录0算法思路：1、用2个变量记录矩阵第1行、第1列有没有02、遍历矩阵，如果遇到0则将其对应的第1行和第1列元素置03、遍历矩阵，若元素对应的第1行或第1列元素为0则将其置0时间复杂度：O(N)空间复杂度：O(1)C++//C++
Python 进阶学习之全栈开发学习路线 Microi风闲【胶水语言】Python python 学习开发语言
文章目录前言一、Python全栈开发技术栈1.前端技术选型2.后端框架选择3.数据库访问二、开发环境配置1.工具链推荐2.VSCode终极配置3.项目依赖管理三、现代Python工程实践1.项目结构规范2.自动化测试策略3.CI/CD流水线四、部署策略大全1.传统服务器部署2.容器化部署3.无服务器部署五、性能优化技巧1.数据库优化2.异步处理3.静态资源优化结语前言Python作为当今最流行的编
【第921篇】新学期的说写课程要开始啦杜香开花2008
2021年12月的时候，带领五年级的孩子进行了55天的说写，后来五年级的很多孩子都有了自己的说写文集，这也是她们人生的第一本文集。孩子们很兴奋，很有成就感，觉得这是他一个学期最大的收获。2022年春季开学，我不在带五年级那个班了，又接手了一个新的班级——三年级七班。因为对说写的情缘，觉得说写不仅锻炼孩子的写作能力，同时，还能够训练孩子的思维，最后，让孩子达到出口成章。我决定这学期要带着三年级的孩子
天使之吻胜鬘夫人传递者
【天使之吻】(Bisoud’unAnge)文／胜鬘夫人（月光诗人-Véronique）在梦中Dansmonrêve,你给了我一个吻Tumedonnesunbisou,轻轻的吻在脸颊上Unbisoudetendressesurlevisage.那个来自于天堂净土的女孩Lafillevientduparadis轻盈飘逸的身影Lasilhouettelégère留下了天使之吻Melaisseunbiso
python3异步爬虫：asyncio + aiohttp + aiofiles（python经典编程案例）数据知道 python3案例和总结 python
更多内容请见：python3案例和总结-专栏介绍和目录文章目录1.安装依赖库2.异步爬虫的基本流程3.实现异步爬虫3.1代码实现3.2代码说明4.运行效果5.扩展功能5.1设置请求头5.2处理异常5.3限制并发数5.4爬取图片6.总结使用Python的异步编程技术（asyncio+aiohttp+aiofiles）可以实现高效的异步爬虫。以下是详细的使用指南和代码示例。1.安装依赖库首先安装所需的
上清剑道论 Yuner2000 现代哲学剑法养生
引言：剑道基础剑之本义：兵器、法器与载道之器道教剑法之流变：从兵戈之术至修真之途上清剑法之独契：内丹、符箓与剑术之融贯本书著述旨趣：阐明剑道真谛，指引修真路径第一篇剑道溯源：上清剑法之本宗与义理1.1.上清宗脉与剑法渊流考1.1.1.上清派道法体系概述：存思、炼神与内丹1.1.2.弦月剑法之名蕴：天象、易理与道法自然之契合1.1.3.剑法传承谱系：自魏华存夫人以降之隐秘流传1.1.4.剑仙之考辨：
0018-基于单片机颜色识别系统设计小新单片机单片机设计库单片机嵌入式硬件 51单片机颜色识别
传送门其他作品题目速选一览表其他作品题目功能速览概述在现代工业生产、智能机器人、自动化分拣等领域，颜色识别技术有着广泛的应用需求。传统的颜色识别多依赖人工判断，不仅效率低下，而且容易受到人为因素的干扰，导致识别准确性不高。随着自动化技术的不断发展，对颜色识别的自动化、智能化要求日益提高。单片机以其体积小、成本低、控制能力强等特点，成为构建小型化、低成本颜色识别系统的理想核心控制器。然而，目前市面上
有啥了不起離離原上_7e6a
你有甚么了不起？你承袭的是父辈的江山你接手的是前任的辉煌就连上位都和你的能力无关你骄傲甚么？你有甚么了不起？被别人侵占的家业，你不曾收复分毫。四处抛撒的金银换回的仅是些冷讽热嘲。上学无钱，治病无药的妻儿老小，你心疼过多少？你显摆牛逼的是甚么？你有甚么了不起？你不缺何不食肉糜的愚蠢你不缺同时向十六国宣战的狂妄好大喜功的是你奢侈无度的是你草木皆兵的还是你这几年下来，曾经一把欣欣向荣的好牌，被你打得稀巴
黔西南在哪有做亲子鉴定的(附2024年8月最新亲子鉴定办理流程) 成之嘉_基因检测
2024年黔西南最新亲子鉴定收费标准：个人隐私亲子鉴定收费标准：￥2000-￥2400，常见用途：怀疑孩子的父亲身份，想私下偷偷检测；无创胎儿亲子鉴定收费标准：￥4500-￥5000，常见用途：孩子未出世，怀疑胎儿的父亲身份，想思想偷偷检测；司法亲子鉴定收费标准：￥2400-￥3600，常见用途：上户口、移民；免费领取详细办理流程资料：15021537790（微信同号）成之嘉亲子鉴定优势1、全程匿
煤海放飞青春梦尘飞扬兮
青春像一首诗，任凭年青的心灵创作；青春像一碗心灵鸡汤，令失去它的人午夜梦回念念不忘；青春更像一个梦，让无数选煤儿女兢兢业业为之奋斗，为之耕耘！在美丽的准格尔煤田，一批批怀揣青春梦的青年们前仆后继破碎站——梦开始的地方驰骋煤海，他们在这里播种青春梦，收获了事业的成功更实现了人生的价值！阳光倾洒而下，轻柔曼妙，轻地仿佛怕惊动了沉睡的煤尘。嘎吱一声响，岗位室的门开了，一个头戴红色安全帽，系黑色帽带，穿橘
自媒体平台靠什么盈利？自媒体平台盈利方式是什么？氧惠全网优惠
自媒体确实能赚钱，但不是每一个人都能赚钱。而且赚多赚少都是看个人能力的。能力强就赚得多，能力一般就赚的少。那自媒体平台靠什么盈利?给大家一个2023年黑马副业项目，电商淘客全新模式，团队有滑落，佣金真的高！0投资，最快63天，月入10万！【氧惠邀请码006600】，此码注册，可享官方扶持！抢先注册，占位即捡钱！团队有滑落，佣金真的高，平时喜欢网购的用户一定不要错过了这款软件。大团队对接总部，一对一
和孩子同玩“蛋仔派对”，是利远大于弊的事情草根宇
前阵子，媒体采访了几位考上世界和全国名校的学生，他们说的话，让我至今印象深刻：“我只是会了一些学习方法，在学习之外，我也每天玩游戏啊，为什么不玩？”是啊，在传统教育中，家长过于关注孩子的记忆、考试和表现，对游戏唯恐避之而不及。可我们忽略了，“游戏和玩耍”在孩子成长过程中，扮演着关键角色，喜欢玩是人类的天性，“会玩才会学”，家长只有适当引导，才可以收获正向的结果。举个自己的例子。在孩子们四五岁的时候
2022-08-05日学录当年观棋
月的最后一天，睡了很长的时间。外面的天气是燥热的，在宿舍的房间里有一丝微凉。实验说到底来说还是想法的验证，但在远远超出自己知识和能力范围的假设，自己也奈何估算不出来。对一些高级仪器的使用还在处于一个基本的阶段。后续在研二的这个阶段，要全身心投入到毕业论文的内容撰写之中去。其实想法有很多，但是真正估计出来可以做的其实也就一两个。这就最终决定了自己毕业论文的宽度。哈哈哈哈哈哈哈哈哈哈
2023-05-15 越来越好崔
2023-05-15中原焦点网中级36学员李灵芝坚持分享第364儿童技能教养法的学习过程中，我们要帮助孩子建立信心。让孩子相信他有能力学会这个技能。无论我们说的理由是多么的理性或者是无厘头。重要的是让孩子听到有这么多人才告诉他。有这么多人都确信他能学会。我们告诉孩子，你对他有信心的时候，并把你的信心传递给他。并帮助他建立了信心。这是点燃孩子学习激情的不可或缺的火花。但掌握技能的唯一方法就是一遍一遍
python排序算法之桶排序华强笔记 python数据结构和算法 python 算法
桶排序主要适用于全是数字的列表排序代码如下：defbuckrt_sort(li,n=100,max_num=10000):bucket=[[]for_inrange(n)]
常见Hash算法 LUCIAZZZ 算法哈希算法 java spring boot 操作系统 spring 密码学
部分内容来源：JavaGuide什么是Hash算法哈希算法也叫散列函数或摘要算法，它的作用是对任意长度的数据生成一个固定长度的唯一标识也叫哈希值、散列值或消息摘要哈希算法的是不可逆的，你无法通过哈希之后的值再得到原值哈希值的作用是可以用来验证数据的完整性和一致性哈希算法可以简单分为两类：加密哈希算法：安全性较高的哈希算法，它可以提供一定的数据完整性保护和数据防篡改能力，能够抵御一定的攻击手段，安全
yolov8涨点系列之C2f模块改进主分支没脾气的小玩家 YOLO 目标检测
文章目录C2F模块介绍定义与基本原理应用场景C2f模块修改步骤(1)C2f_up模块编辑(2)在__init_.py+block.py中声明（3）在task.py中声明yolov8引入C2f_up模块yolov8.yamlyolov8.yaml引入C2f_up模块C2f改进对YOLOv8检测具有多方面的好处C2F模块介绍定义与基本原理 C2F（Coarse-to-Fine）模块通常是一
yolov8涨点系列之替换幽灵卷积GhostConv 没脾气的小玩家 yolov8涨点系列 YOLO 目标检测
文章目录核心思想主要步骤优势yolov8.yaml文件增加CBAMyolov8.yamlyolov8.yaml将Conv卷积替换成GhostConv 幽灵卷积（GhostConv）是一种新颖的卷积操作方法，旨在解决传统卷积神经网络中参数量和计算量过大的问题，尤其适用于资源受限的设备。以下是对幽灵卷积的详细介绍：核心思想常规的卷积操作会产生大量的特征图，其中存在一定的冗余信息。幽灵卷积的核心思
《论语•子罕篇》（八）守正出奇赢辉煌未来
《论语•子罕篇》之十三.jpg《论语•子罕篇》之十四.jpg子贡曰：“有美玉于斯，韫椟①而藏诸？求善贾而沽诸？”子曰：“沽之哉！沽之哉！我待贾②者也。”注：①“椟”也作“匵”。②“我待贾者也”的“贾”同“价”。见《论语集释》子欲居九夷。或曰：“陋，如之何？”子曰：“君子居之，何陋之有？”原句译文子贡说：“这儿有一块美玉，是把它放在匣子里珍藏起来呢，还是找位识货的商人卖掉呢？孔子说：“卖掉它吧！卖掉
Apache Ignite 的并发控制：实现高性能事务处理的关键 AI天才研究院 AI实战 AI人工智能与大数据 LLM大模型落地实战指南大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着大数据时代的到来，数据量的增长和计算能力的提升使得传统的数据库和计算模型已经无法满足业务需求。为了应对这些挑战，分布式计算和存储技术得到了广泛的研究和应用。ApacheIgnite是一款高性能的分布式数据库和计算平台，它可以提供实时性能和高可用性，同时支持事务处理和并发控制。在这篇文章中，我们将深入探讨ApacheIgnite的并发控制机制，以及如何实现高性能事务处理。我们将从以下
家长也是小学生之《家庭教育口传书》124 井蛙读书
在我们高度关注如何进行家庭教育的时候，似乎忽略了一个问题——作为家庭教育关键环节的家长一环够不够强。家长的格局决定孩子的未来，可如何提升家长的格局又不是一时三刻的事。每一个家长都是从第一次开始的，成为家长的那一刻，家长与孩子是一样的，对未来的一切都是现学现用的。要想在家长这个身份上做的够好够强，就要不停地学习，以小学生的心态终身学习，陪孩子一起成长。今天继续分享《家庭教育口传书》——一本我被序言吸
早醒来，星期舒畅勇往直前向前走
今天早醒来昨晚早睡去昨下午哭了一顿，星期是舒畅多了的也是坚定了要离开的心差点就把这个话直接发过去了我即使什么都不会即使能力不太够
霜降李龙邦
霜降，是二十四节气之第十八个节气。斗指戌；太阳黄经为210°；每年公历10月23—24日交节。霜降是秋季的最后一个节气，是秋季到冬季的过渡。霜降节气特点是早晚天气较冷、中午则比较热，昼夜温差大，秋燥明显。由于“霜”是天冷、昼夜温差变化大的表现，故以“霜降”命名这个表示“气温骤降、昼夜温差大”的节令。霜降时节，万物毕成，毕入于戌，阳下入地，阴气始凝。俗话讲“霜降杀百草”，霜降过后，植物渐渐失去生机，
每日心语：让生命之花绚烂绽放把平平凡凡的生活过成诗与远方
我一直坚信，有生命就要有梦想。有梦想生命才无价！我的梦想——把平平凡凡的生活过成诗与远方。听起来很有诗意对吧。可想把平平凡凡的生活过成富有诗意的诗与远方，是需要觉醒的。实现梦想的过程正是一次次觉醒生命的历程。（一）认知生命我初中是在坡胡三中上的。记得初中上早读时，尤其大冬天，从家出门，天还黑洞洞一片呢！去学校的途中，要经过王庄村东头的一片坟地。当时上学时，经常是村上我们三五个男生女生结伴而行。男生
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他