小肥鱼2020

2020美赛C题的一些想法总结

2020年的C题是一道典型的数据分析的题目，基于大数据分析处理进行相关建模。对于这道题而言，最难之处莫过于各个数据项关系的梳理总结，以及对数据的挖掘建模。网上很多大神给了很多高级的方法（深度学习、神经网络等）。其实作为小白，很多参赛的同学并不了解这方面的算法，以及背后的数学原理，很多人指望一两个高级算法就能解决问题，只想着盲目套用，只会贻误比赛的时间。
以下皆是本人对这题的一些粗浅的看法，仅供参考。

问题解决的要点：

一、数据的预处理

对于数据的预处理，个人首推Excel，简单方便快捷
导入数据：
题目所给数据时tsv文本形式的数据，需要导入Excel进行数据的预处理
原始数据集的各个数据项：

marketplace	customer_id	review_id	product_id	product_parent	product_title	product_category
所属地区/国家简写码	用户的ID	评论的唯一标识ID	产品的ID	产品所属父类的标识ID	产品的标题	产品所属类别

star_rating	helpful_votes	total_votes	vine	verified_purchase	review_headline	review_body	review_date
产品星级	赞成数（点赞数）	评论总的获赞数(赞成与反对)	Amazon Vine的一个认证，评论具有一定的可信度和准确性	是否以较低折扣购买相关产品	评论的标题	评论的内容	评论的日期

注：对于verified_purchase，我是基于对英文注释的理解，也有很多人将其理解为购买认证，即评论的人是否在亚马逊平台上购买了相关产品。亚马逊上好像不买东西也可以评论，迷之操作。

利用Excel可以数据查重，缺失值填充，数据转换等预处理操作，至于怎么利用Excel进行各种预处理的操作就不赘述了
       例如：可以利用Excel查重，确定数据集的各个数据项之间的关系，可以发现顾客数据项不是唯一的，即不是每一个数据都对应一个用户，存在一个顾客购买多个产品的现象，产品的ID以及产品父类也是，只有每个评论的ID是唯一的。这样的一些处理分析可以让我们更加了解这个数据集中各个数据项之间的关系。
这里就想提醒两个容易忽视的基本操作：
1、文本信息数值化
       数据分析，分析的是数据，一般我们很不喜欢处理非数值的信息，因此需要将非数值的一些文本信息数值化，查找替换，将非数值的信息数值化便于后面的数据处理分析。
2、顾客评论标题以及评论内容的预处理
       由于顾客评论中可能存在许多拼写错误，我们可以利用Excel的拼写检查对这部分的信息进行预处理。方便之后的评论种类的划分，以及评论的情感分析。

二、产品的综合评价

对于产品的综合评价，初始考虑使用主成分分析，将影响产品评价的几个量关联起来，进行数据降维，再计算因子得分，按总分排序来对排名靠前产品进行，但结果并不理想（捂脸）。【这里用的是Excel的数据透视表，去除部分无关信息，以产品ID为行标签将同一个产品ID的数据整合】
分析结果：

后面就直接结合主成分分析结果利用对原始数据集比对分析，再综合层次分析法（权重+结合数据）进行对产品的综合评定（烂尾）。

三、评论种类的区分

       本题解题的另一个关键是将评论划分种类，可以简单地划分为好评、差评或者好评、中评、差评，可以将划分好种类的评论简单地利用数字-1,0,1来表示。评论的种类划分可以基于以下几步：
1、基于评论标题以及内容进行提词
       对数据项中的评论部分进行提取，利用python正则表达式进行字符匹配并分词，将评论提取为一个个的词汇，去除提取的词汇中的常用停用词，无效字符，数字等，构建相关产品的常用评论词汇库。【提词过程的代码可以多跑几次，观察提词结果再优化】

2、分析提词结果构造产品评论词库
       基于提取的相关产品的常用词汇库，选取部分对划分评论种类有用的词，对词库中的词进行划分，构建产品评论相关词库。【下面为初步结果，可以结合代码进行优化】
3、依据词库对评论种类进行划分
       对与这部分可以直接利用Python NLTK进行比对，但考虑到NLTK相关语料库下载速度惊人，直接忽略。结合常用评价词汇修正词库，加入部分常用词汇，构建评论判别词汇库，对评论进行判别归类，将评论分为三类：好评、中评、差评。简单直接的方式就是自己构建词库进行分析，以下方法如果词库构建较为完善，结合评论内容，顾客所打星级，对初步划分结果进行修正，基本可以得到较好的评论分类结果。【网上也有很多简单粗暴的方式利用NLTK的相关词库以及算法直接莽】
参考代码：

# -*- coding: utf-8 -*-
"""
Created on Fri Mar  2020

@author: Good
"""

# NLP python自然语言处理
import re
import numpy as np
import pandas as pd
from nltk.corpus import stopwords

# 导入相关数据
data = pd.read_csv('C:/Users/Good/Desktop/Problem_C_Data/pacifier.tsv',sep = '\t')

# 获取数据标签
data_label = data.columns.values.tolist()

# 缺失观测的检测填充   
print('数据集中是否存在缺失值:',any(data.isnull()))
data.fillna(method = 'ffill') 
print('缺失值已前向填充!')

#------------------------------------------------------------------------------
# 获取语言文本
review_headline = pd.DataFrame(data.loc[:,data_label[12]])
review_body = pd.DataFrame(data.loc[:,data_label[13]])

# 情感词库
positive = ['happy','great','five','four','good','perfect','love','loves',
            'faster','excllent','super','thanks','amazing','powerful','quickly',
            'fine','awesome','nice','helpful','like']
negative = ['one','two','bad','no','abandon','amiss','badly','blind','awful'
            'terrible','awfulness','helpless','useless']
# 以上词库仅初始词库，为了更好的效果，可以多跑几次，完善词库，这里仅做参考

#------------------------------------------------------------------------------
# 对文本信息进行相关处理，构造单词列表,并对评论进行归类
# 基于评论标题的评论分类
sentiment = np.zeros((np.size(review_headline),1))
for i in range(0,np.size(review_headline)):
    review_headline.iloc[i,0] = str(review_headline.iloc[i,0])
    review_headline.iloc[i,0] = review_headline.iloc[i,0].lower()
    review_headline.iloc[i,0] = re.sub(r'[0-9]|\s|\,|\.|\!|\-|\(|\)|\<|\>|\:|/|\*|\;|\?|\`',
                        ' ',review_headline.iloc[i,0])
    for k in '&#$':        
        review_headline.iloc[i,0] = re.sub(k,'',review_headline.iloc[i,0])    
    temp = review_headline.iloc[i,0].split()
    handle_temp = []
    for m in range(0,np.size(temp)):
        if temp[m] not in stopwords.words('english'):
            handle_temp.append(temp[m])
    for j in handle_temp:
        if j in positive:
            sentiment[i,0] = 1
        elif j in negative:
            sentiment[i,0] = -1
            
#------------------------------------------------------------------------------            
# 基于评论内容的评论分类，对初步分类结果进行修正
for i in range(0,np.size(review_body)):
    review_body.iloc[i,0] = str(review_body.iloc[i,0])
    review_body.iloc[i,0] = review_body.iloc[i,0].lower()
    review_body.iloc[i,0] = re.sub(r'[0-9]|\s|\,|\.|\!|\-|\(|\)|\<|\>|\:|/|\*|\;|\?|\`',
                    ' ',review_body.iloc[i,0])
    for k in '&#$':        
        review_body.iloc[i,0] = re.sub(k,'',review_body.iloc[i,0])    
    temp = review_body.iloc[i,0].split()
    body_temp = []
    for n in range(0,np.size(temp)):
        if temp[n] not in stopwords.words('english'):
            body_temp.append(temp[n])
    for j in body_temp:
        if j in positive and sentiment[i,0] == 0:
            sentiment[i,0] = 1
        elif j in negative and sentiment[i,0] == 0:
            sentiment[i,0] = -1

#------------------------------------------------------------------------------
# 基于评论星级，点赞数的评论归类的三次修正
star_rating = pd.DataFrame(data.loc[:,data_label[7]])
for i in range(0,np.size(star_rating)):
    if star_rating.iloc[i,0] > 3 and sentiment[i,0] == -1:
        sentiment[i,0] = 1
    elif star_rating.iloc[i,0] == 3 and sentiment[i,0] == 1:
        sentiment[i,0] = 0
    elif star_rating.iloc[i,0] == 3 and sentiment[i,0] == -1:
        sentiment[i,0] = -1
    elif star_rating.iloc[i,0] < 3 and sentiment[i,0] == 1:
        sentiment[i,0] = 0

四、评论的情感分析

情感分析与上述评论分析有很多相似的地方，最简单直接的方式就是根据评论中正面词汇以及反面词汇的个数进行加权平均，可以直接考虑利用Python textblob库，网上有现成的代码，不过推荐自己写，这样可以通过建模学到更多的东西。

这里的权重，如果嫌麻烦可以直接就对半开，如果想要客观公正的话，可以构建程度词库，结合程度词权重的方式进行模型的优化，例如：extremely等程度词在正面情感词汇前面可以怎样（可以对程度词划分级别，赋予权值，相关资料中提供了程度词词库）。主要思想就是，将正面情感词汇与负面情感词汇进行加权平均得到情感倾向。【很多NLP智能算法的做法与我这上面的想法类似，不过过程更规范，识别更准确，不过思想是相通的，也有利用机器学习的算法做的，可以去了解一下】

五、相关资料

1、题目(PDF) 链接：https://pan.baidu.com/s/1mJOawF3gibrQFnQwDaMNIQ 提取码：d60g
2、题目(Word) 链接：https://pan.baidu.com/s/1nn3E5MBdt6H4iqtYgXdyAg 提取码：dowd
3、数据链接：https://pan.baidu.com/s/1FXrNLUYA0Ev64-HYcYHhlA 提取码：18mm
4、网上搜集的词库 链接：https://pan.baidu.com/s/1Tpk0PIev2slGZ0XYY_P2Lg 提取码：b482

六、小结

给大家也是我自己的建议，不要老想着利用某个超级算法解决问题，坐等拿奖。对于一些算法，如果我们能掌握其原理，并能灵活运用最好，如若知识水平不够，不妨尝试利用自己已有的知识去解决这类问题。我非常喜欢的xu老师曾多次教导我对于一个问题，最应该想的就是怎么利用自己已有的知识进行求解，条条大路通罗马，拘泥于一种方法往往会思维受限，钻入死胡同。我想分享给大家，也希望大家通过数学建模都能有所收获，学到更多的知识，提高分析和解决问题的能力！

不怎么喜欢码字，累且没人看，之前还一时兴起，写了几篇博客，后面嫌麻烦就一直没写，疫情原因，后面有时间再分享不同建模题我的一点粗浅的思考。

一台适合普通办公使用的电脑推荐thinkpadE475 sam_1c14
图片发自App图片发自App缺点是内存只有4G。胜在便宜。14寸，很轻薄。给老婆买的。应该不能用来编程，会很慢的，真要用可以自己加根内存条，最大扩展到32G。图片发自App
2005年高考英语北京卷 - 阅读理解C 让文字更美
Howcouldwepossiblythinkthatkeepinganimalsincagesinunnaturalenvironments-mostlyforentertainmentpurposes-isfairandrespectful?我们怎么可能认为把动物关在非自然环境的笼子里——主要是为了娱乐目的——是公平和尊重的呢？Zooofficialssaytheyareconcernedab
2020-11-12 写单片机内存的脚本 nc openocd 事务自动测试 linuxScripter
这是写单片机内存的脚本：z@z-ThinkPad-T400:~/zworkT400/EDA_heiche/zREPOgit/simple-gcc-stm32-project$catz.wholeRun.oneCase.cmdcattmp6.toWrite|awk'{system("echomwb"$1""$2"|nclocalhost4444");}'catUSER/DEBUG/debug.h|g
内网穿透之EW使用、判断服务器是否出网板栗妖怪学习内网渗透
环境搭建使用的是下面文章的环境记一次学习--内网穿透-CSDN博客ew代理然后同样通过thinkphp漏洞写入文件，然后通过蚁剑连接然后上传ew的Linux版本，然后加权执行一层代理正向代理设置正向代理（在ubuntu上），然后kali在proxychain配置文件中连接ubuntu的192.168.244.154的代理端口反向代理在ubuntu上设置反向代理，将连接反弹到kali上的某个端口。然
python基于django/flask的NBA球员大数据分析与可视化python+java+node.js QQ_511008285 python django flask java spring boot 数据分析
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以本文针对NBA球员的大数据进行
Java基于spring boot的国产电影数据分析与可视化python+java+node.js QQ_511008285 java spring boot 数据分析 python django vue.js flask
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以该系统使用进行大数据处理和
【漏洞分享】2018年-2024年HVV 6000+个漏洞 POC 合集分享漏洞文库-Web安全漏洞复现 web安全 python 安全测试工具网络安全
此份poc集成了Zabbix、用友、通达、Wordpress、Thinkcmf、Weblogic、Tomcat等下载链接:链接:https://pan.quark.cn/s/1cd7d8607b8a
【漏洞利用】2018年-2024年HVV 6000+个漏洞 POC 合集分享 baiolkdnhjaio 漏洞复现网络安全 web安全安全
此份poc集成了Zabbix、用友、通达、Wordpress、Thinkcmf、Weblogic、Tomcat等下载链接:链接:https://pan.quark.cn/s/1cd7d8607b8a
linux json编译报错 nancynull c++Linux linux c++编译
背景：ubuntu16.04，使用apt-get安装过jsoncpp问题一：编译时报找不到json.h问题二：编译.so时，提示/usr/bin/ld:cannotfind-ljson解决方案：https://stackoverflow.com/questions/36861355/fatal-error-with-jsoncpp-while-compiling具体翻译如下：针对问题一：修改#in
【刷题】Leetcode1683. Invalid Tweets J_caicaicai 数据结构与算法 python pandas mysql
QuestionTable:Tweets+----------------+---------+|ColumnName|Type|+----------------+---------+|tweet_id|int||content|varchar|+----------------+---------+tweet_idistheprimarykey(columnwithuniquevalues)f
妙贼警探第1季第4集中英台词整理和单词统计 littleori
妙贼警探第1季第4集中英台词整理和单词统计英文中文Whatareyouthinking?你在想什么I'mthinkingitwastheaccountant.我想是那个会计Inthelawoffice.律师事务所里的那个Withtheillegalwiretransfer?非法电汇Eitherthat,orcolonelmustardinthelibrary.要么是他要么就是图书馆里的芥末上校[推
QMessageBox使用方法 m0_45352606 python qt
提示：关于更多pyqt5内容请关注QMessage前言一、QMessageBox介绍？二、使用步骤1.引入库2.QMessageBox的枚举类型3.QMessageBox的对话框展示1critical消息对话框2question消息对话框3warining消息对话框前言Qt中的QMessage详解：QMessageBox是Qt框架中常用的一个类，可以生成各式各样、各种用途的消息对话框。提示：以下是
D17:中四句的复习断刺飘雪
原材料引用（Materials）:文章的5-8句.信息和事实（Facts）：questions、flowing的读音还要再练习加强感受与评价（Comments）：元音不够饱满，是今天练习的问题发现。如without、starts、however、flowing等词，在有意识地读时，就比较能发音准确。一旦四句一起练习，就会有想赶时间的想法，因此在读的时候就会不自觉加速略过。归结原因，还是练习得不够。
We are talking about 《WAR IS A LIE》 MichaelSure
图片发自App图片发自AppTodayIreadabookwhichiscalledWarisalie.ThisisabookwrittebyDavidSwanson,anAmericanwriterwhofightsagainstthewar.WarisawordalwaysrelatetotheUnitedStatesandDavidthinkhismotherlandisthebiggest
【保研面试/考研复试】英语口语常见问答（二）九九jiujiu 面试考研保研英语问答保研经验分享
英语口语常见问答FrequentlyAskedQuestionsonSpokenEnglish目录英语口语常见问答FrequentlyAskedQuestionsonSpokenEnglish7.为什么选择跨专业考研？8.讲述一下你的本科专业？（跨专业）9.你最突出的优点是什么？（跨专业）10.当你没听清楚面试官问题时！11.当遇到时间来不及思考或者一时语塞时12.当再次没听懂老师问题时7.为什么
c语言练习：POJ 1005 我想我需要一艘船屋（I Think I Need a Houseboat）七月初七淮水竹亭～ C语言入门 c语言
题目相关信息描述弗雷德·马珀（FredMapper）正在考虑在路易斯安那州购买一些土地来建造他的房子。在调查这片土地的过程中，他了解到，由于密西西比河造成的侵蚀，路易斯安那州实际上每年都在缩小50平方英里。由于弗雷德希望一辈子都住在这所房子里，他需要知道他的土地是否会因侵蚀而消失。在做了更多的研究之后，弗雷德了解到正在失去的土地形成了一个半圆形。这个半圆是以（0,0）为中心的圆的一部分，将圆平分的
『Day96星球晨间复盘』佳霏老师
一、Do冥想每日计划阅读《活法》瑜伽笔的故事二、Feel4点多窗外就非常热闹了，有一户人家在拉二胡之类的乐器，还是放什么民间小调，但这样的一种嘈杂，并没有影响我做过自己的事情聊完瑜伽，老师放了一首很好听的音乐stutterbug三、Think持续抱有强烈的愿望。在我们的人生中想要做成某件事，我们首先要描画它的理想状态，然后把实现它的过程在头脑里模拟演练，一直到看见他的结果为止，换句话说就是对这件事
Thinkphp中where()条件的使用 2401_84875852 程序员服务器 java 网络
|notin|notin|$map[‘id’]=array(‘notin’,‘1,5,8’);|idnotin(1,5,8)||and（默认）|and|$map[‘id’]=array(array(‘gt’,1),array(‘lt’,10));|(id>1)AND(id3)OR(idwhere(User->where(User−>where(map)->select();相当于sql语句：nam
微缩屋工匠第1季第2集中英台词整理和单词统计 kuailexuewaiyu
微缩屋工匠第1季第2集中英台词整理和单词统计英文中文Whatwereyouthinking,Marin?你在想什么马琳AgirlinAssendelftdiedtryingtoloseababywithpoison.阿森德福特有个女孩因试图喝毒药堕胎而死Howfargoneareyou?你怀了多久了Six,sevenmonths.六七个月Perhapsmore.也许更久Howdidyouhidei
Thinking，fast and slow CH6 哇620
Chapter6Norms，SurpriseandCausesThemainfunctionofSystem1istomaintainandupdateamodelofyourpersonalworld,whichrepresentswhatisnorminit.我们对这个的认知是由系统1快速作出反应的，比如听到“桌子”这个词，我们马上能知道他是个什么样子，这也是类人能够沟通的基础。而这些认知是不
豆豆鹿祝大家圣诞节快乐！Merry Christmas！ DDDeer豆豆鹿
ThinkingofyouatChristmaswithawishthatiswarmandsincere.HaveawonderfulChristmasandjoyousNewYear!MerryChristmas！
Python 常用的第三方库 akenseren python
作者：VictorZhang链接：https://www.zhihu.com/question/20501628/answer/126155557来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。数学计算三件套：numpy简单介绍：只要涉及到数值计算，基本上三件套都会用上链接：NumPy—NumPyscipy简单介绍：只要涉及到数值计算，基本上三件套都会用上链接：Sci
规律的生活才是王道大方呀
规律的生活才是王道，指规律的正向生活习惯。例如，keep住阅读、写作、早睡早起阅读，故事型的牧羊人之旅、月亮与六便士中人物能给予你力量，我如何感受到阅读的影响；解答型的小学问、糟边往事，给予思考的火花。写作，不仅仅是记录生活，更是从过往的经历，againandagain汲取经验。把思考写下来，促进更进一步的thinking。规律的睡眠作息。省去费力令自己早睡的麻烦。闭眼睡眠时，大脑分泌血清洗干净整
1.2 【python】tkinter一个有趣的小项目手机电脑789 python python
#tk常见的消息框fromtkinter.commondialogimportDialog#图标ERROR="error"INFO="info"QUESTION="question"WARNING="warning"ABORTRETRYIGNORE="abortretryignore"OK="ok"OKCANCEL="okcancel"RETRYCANCEL="retrycancel"YESNO=
java程序员 thinkpad_JAVA程序员笔记本电脑推荐？ stratisplatform java程序员 thinkpad
如果主要是做JAVA开发，那其实需要考虑的因素有：CPU性能必须过得去，因为java相对来说比较消耗CPU资源，当然是大型java应用，题主如果学习java的时候，倒不是特别重要，基本上2020年主流笔记本CPU都可以应对。内存，题主也说了，是因为idea特别吃内存才更换的笔记本，所以这里推荐16G内存起步，如果购买轻薄本的话，基本上内存就固定死了，不能更换；如果购买游戏本，那么可以增加到32G内
自然语言处理常用单词 ChenVast NLP 机器学习算法理论与实战单词自然语言处理 NLP
AA-not-Aquestion正反问句A-over-AA-上-A原则abbreviation缩写[省略语]ablative夺格(的)abrupt突发音accent口音/{Phonetics}重音accusative受格（的）acousticphonetics声学语音学acquisition习得actionverb动作动词active主动语态activechartparser活动图句法剖析程序ac
THINKPHP like between 的array用法 kang1919 TP
if($title!=''){$_where['title']=array('LIKE','%'.$title.'%');}if(''!=$url){$_where['url']=array('LIKE','%'.$url.'%');}if(0<$start_time&&$start_time<$end_time){$_where['create_time']=array('between',ar
基于ThinkPHP5的旧衣回收小程序——二手交换废物系统的设计与实现 IT实战课堂—x小凡同学 Java毕业设计项目小程序
摘要：随着社会的快速发展和人们生活水平的提高，旧衣物数量迅速增加，传统的旧衣处理方式已难以满足现代社会的需求。为了有效减少资源浪费，提高旧衣物的利用率，本文基于ThinkPHP5框架设计并实现了一款旧衣回收小程序——二手交换废物系统。该系统通过线上平台，实现旧衣物的回收、分类、展示、交换等功能，为用户提供了一种便捷、环保的旧衣处理方式。本文将从系统需求分析、系统设计、系统实现、系统测试与评估等方面
thinkphp5支持php,如何让swoole完美支持ThinkPHP5呢坎布里奇大脸猫 thinkphp5支持php
视频教程推荐TP5与workerman实战在线客服首先开启swoole的http服务开启swoole的http服务并设置提供给url访问页面的文件的根目录，代码如下。这样在浏览器只能访问…static下面的文件，而无法访问其他目录下的文件。http.serverset(['enable_static_handler'=>true,'document_root'=>"/usr/local/openr
ThinkPHP发邮件配置教程？群发功能安全吗？ Aoksend 服务器运维 java 开发语言 sql 数据库安全
ThinkPHP发邮件的注意事项？如何优化邮件发送的性能？无论是用户注册、密码重置还是消息提醒，发送邮件都是一个常见的需求。AokSend将详细介绍如何在ThinkPHP框架中配置和发送邮件，帮助开发者轻松实现邮件功能。ThinkPHP发邮件：了解需求在开始配置之前，我们需要明确邮件发送的具体需求。在ThinkPHP发邮件的过程中，常见的需求包括注册验证邮件、密码重置邮件、用户通知邮件等。了解这些
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》