孤独时代的老狗

《软件工程》结对：作业二

软件工程结对作业二

结对队友、博客链接、GitHub项目地址、分工

作业链接 https://edu.cnblogs.com/campus/fzu/FZUSoftwareEngineering1816W/homework/2160
结对成员
- 我的队友
- 博客地址：http://www.cnblogs.com/52wu244/
- 分工：负责项目各个模块功能的实现
- 我
- 博客地址：https://www.cnblogs.com/wang371091997/p/9781183.html
- 分工：负责爬取部分，附加题部分，一起Debug，解决问题
GitHub地址：https://github.com/xiaozhirensan/PairProject-C

PSP表格

PSP2.1	Personal Software Process Stages	预估耗时（分钟）	实际耗时（分钟）
Planning	计划	30	20
• Estimate	• 估计这个任务需要多少时间	10	30
Development	开发	600	900
• Analysis	• 需求分析 (包括学习新技术)	300	480
• Design Spec	• 生成设计文档	60	50
• Design Review	• 设计复审	10	5
• Coding Standard	• 代码规范 (为目前的开发制定合适的规范)	20	15
• Design	• 具体设计	30	30
• Coding	• 具体编码	600	1020
• Code Review	• 代码复审	120	60
• Test	• 测试（自我测试，修改代码，提交修改）	120	60
Reporting	报告	120	90
• Test Repor	• 测试报告	60	30
• Size Measurement	• 计算工作量	30	20
• Postmortem & Process Improvement Plan	• 事后总结, 并提出过程改进计划	120	50
	合计	2210	2810

解题思路描述与设计实现说明

爬虫使用

我的python爬虫学习过程：https://blog.csdn.net/FZUMRWANG/article/details/82944100
我的思路

import requests
from bs4 import BeautifulSoup #引入BeautifulSoup模块
i=0
res = requests.get('http://openaccess.thecvf.com/CVPR2018.py') #通过监听网页可知使用get方法
res.encoding='utf-8' #若是有中文则需要加上utf-8编码
soup = BeautifulSoup(res.text,'html.parser') #将get到的内容放入BeautifulSoup包中，并且使用html.parser解析由requests.get所得到的html页面内容
head='http://openaccess.thecvf.com/' #由于所得到的链接可能不全，因此加上前面的总链接，有时候不用
for news in soup.select('.ptitle'): #ptitle是通过观察每一个标题的分隔符而得到的，通过Chrome的检查功能中的选择功能来选择标题然后何可看出每一个标题是使用ptitle分隔，不同网页可能不同，如果ptitle是class的话用.，如果是id的话用#
    if len(news.select('a'))>0: #由于得到的list可能为空，因此加此判断
        a=head+news.select('a')[0]['href'] #选择ptitle下标签中的href链接
        #print(h2,head+a)
        res2 = requests.get(a) #通过get方法得到网址的回应
        res.encoding='utf-8'
        soup2 = BeautifulSoup(res2.text,'html.parser')
        h2=soup2.select('#papertitle')[0].text.strip()
        article=soup2.select('#abstract')[0].text.strip()
        #print('Title:',h2)
        #print('Abstract:',article)
        with open('D:\\result.txt','a',encoding='gb18030',errors='ignore') as f:
            f.write(str(i))
            f.write('\n')
            f.write('Title: '+h2)
            f.write('\n')
            f.write('Abstract: '+article)
            f.write('\n')
            f.write('\n')
            f.write('\n')
        i=i+1

我爬取的结果

爬取结果附件：https://files.cnblogs.com/files/wang371091997/result.zip

代码组织与内部设计实现&&算法流程图

说明算法的关键

单词统计：只有连续四个是字母就是一个单词，有分隔符隔开就重新开始判断，并且将单词加入Hash，然后通过判断w以及单词所在的位置将value值+10或者+1
词组统计：在单词判断的基础之上进行词组的统计，即将m个单词以及单词之间的分隔符加入词组，并且将词组加入Hash，然后通过判断w以及词组所在的位置将value值+10或者+1
行数统计：直接使用getline按行读取，然后去除掉不在统计范围内的行即可
权值的计算：就如同上面的单词和词组统计，判断w然后Hash中value+10或者+1

关键代码解释

命令行解释类

struct Command {
	bool _i;		//是否按照指定路径读入文件
	bool _o;		//是否按照指定路径读出文件
	bool _w;		//是否加入词频权重统计
	bool _m;		//是否开启词组词频统计功能
	bool _n;		//是否开启自定义词频统计输出
	char inFile[MAX_PATH_LENGTH];		//读入文件路径 
	char outFile[MAX_PATH_LENGTH];      //读出结果路径
	int m;          //词组中单词数
	int n;          //数组数
	Command() {
		_i = false;
		_o = false;
		_w = false;
		_m = false;
		_n = false;
		strcpy_s(inFile, "input.txt");  //将初始读入文件设置为input.txt
		strcpy_s(outFile, "output.txt");	//将初始读出文件设置为result.txt
		m = 1;
		n = 10;
	}
	void commandAnalyse(char commandStr[], Command &command);
	int swiftNumber(char str[]);
};

Command类用于解析用户输入的命令行，将自定义参数设置为bool型变量，同时给各参数赋予初值，第一次写的代码纯粹为一个函数，各种变量纷杂，可读性很差。经过改进之后，此程序可移植性高，结构清晰，且封装较好。

词组频数统计函数

void WordList::wordCount(string fileName, WordList &wordList, int m, bool _w)
{
	char word[MAX_WORD_LENGTH] = { 0 };
	char wordStr[2000] = { 0 };
	string str;
	ifstream inFile;
	inFile >> noskipws;
	inFile.open(fileName);
	int wordposition = 0;
	int wordPosition = 0;
	char c;
	int delta = 'a' - 'A';
	int i = 0, j = 0; //记录字符当前位置
	int n = m;     
	while (getline(inFile, str))
	{
		if (str[0] != 'T'&&str[0] != 'A')
			continue;
		c = str[0];
		while (c != '\0')
		{
			c = str[i];
			if (c <= 'Z'&&c >= 'A') c += delta;
			bool separator1 = (c >= 'a'&&c <= 'z');
			bool separator2 = (c >= '0'&&c <= '9');
			if (separator1)
			{
				wordposition++;
				wordStr[wordPosition] = c;
				wordPosition++;
			}
			if (separator2)
			{
				if (wordposition < 4)
				{
                    memset(wordStr, '\0', sizeof(wordStr));
					wordposition = 0;
					wordPosition = 0;
				}
				else
				{
					wordStr[wordPosition] = c;
					wordPosition++;
				}
			}
			if (!separator1 && !separator2 && wordposition < 4)
			{
				
				memset(wordStr, '\0', sizeof(wordStr));
				memset(word, '\0', sizeof(word));
				n = m;
				wordPosition = 0;
				wordposition = 0;
				j = i;
			}
			if (c==':' && wordposition >= 4 && strcmp(wordStr, "title") == 0)
			{
				state = 1;
				wordPosition = 0;
				wordposition = 0;
				memset(wordStr, '\0', sizeof(wordStr));
			}
			if (c == ':' && wordposition >= 4 && strcmp(wordStr, "abstract") == 0)
			{
				state = 2;
				wordPosition = 0;
				wordposition = 0;
				memset(wordStr, '\0', sizeof(wordStr));
			}
			if (!separator1 && !separator2 && wordposition >= 4 && n >= 1)
			{
				if (n > 1)
				{
					wordStr[wordPosition] = c;
				}
				strcat_s(word, wordStr);
				memset(wordStr, '\0', sizeof(wordStr));
				if (n == m)
					j = i;
				if (n == 1)
				{
					wordList.addWord(word, _w);
					memset(word, '\0', sizeof(word));
					n = m+1;
					i = j;
				}
				wordPosition = 0;
				wordposition = 0;
				n--;
			}
			i++;
		} 
	     memset(word, '\0', sizeof(word));
	     memset(wordStr, '\0', sizeof(wordStr));
	   i = 0;
	}
	inFile.close();
}

此函数为单词处理类WordList中的一个函数，功能为抽取单词，并将文本字符串转换为词组存储进入链表，这部分花费了较多时间并进行了多次改进。

代码签入记录

附加题设计与展示

爬取了论文作者和论文时间
- 文本链接：https://files.cnblogs.com/files/wang371091997/author.zip
- 结果截图：

统计2018年热度最高的十个名词并且制作成饼图展示数据
- 饼图链接：http://myecharts.applinzi.com/bingtu.html
- 结果展示

可视化代码

<!DOCTYPE html>
<html>
<head>
    <meta charset="utf-8">
    <title>ECharts</title>
    <!-- 引入 echarts.js -->
    <script src="js/echarts.js"></script>
</head>
<body>
    <!-- 为ECharts准备一个具备大小（宽高）的Dom -->
    <div id="main" style="width: 1200px;height:500px;"></div>
    <script type="text/javascript">
        // 基于准备好的dom，初始化echarts实例
        var myChart = echarts.init(document.getElementById('main'));

        // 指定图表的配置项和数据
        
		option = {
		    title : {
		        text: 'CVPR论文热词',
		        subtext: '2018年',
		        x:'center'
		    },
		    tooltip : {
		        trigger: 'item',
		        formatter: "{a} 
{b} : {c} ({d}%)"
		    },
		    legend: {
		        orient : 'vertical',
		        x : 'left',
		        data:['image','network','learning','model','method','deep','data','approach','vedio','papper']
		    },
		    toolbox: {
		        show : true,
		        feature : {
		            mark : {show: true},
		            dataView : {show: true, readOnly: false},
		            magicType : {
		                show: true, 
		                type: ['pie', 'funnel'],
		                option: {
		                    funnel: {
		                        x: '25%',
		                        width: '50%',
		                        funnelAlign: 'left',
		                        max: 1548
		                    }
		                }
		            },
		            restore : {show: true},
		            saveAsImage : {show: true}
		        }
		    },
		    calculable : true,
		    series : [
		        {
		            name:'访问来源',
		            type:'pie',
		            radius : '55%',
		            center: ['50%', '60%'],
		            data:[
		                {value:1224, name:'image'},
		                {value:973, name:'network'},
		                {value:971, name:'learning'},
		                {value:762, name:'model'},
		                {value:662, name:'method'},
		                {value:640, name:'deep'},
		                {value:521, name:'data'},
		                {value:500, name:'approach'},
		                {value:475, name:'vedio'},
		                {value:474, name:'paper'}
		            ]
		        }
		    ]
		};
        // 使用刚指定的配置项和数据显示图表。
        myChart.setOption(option);
    </script>
</body>
</html>

性能分析与改进

描述你改进的思路

改进思路可归纳为三点

第一，将命令行解析函数抽象为一个类，类包括属性和方法，变量抽象为属性，字符串解析函数为方法。
第二，将单词加入链表时，启用hash函数形成单词词表，将每次添加如链表的单词利用其ASCCI码值抽象为一个数值，这样可以快速找到所需单词。
第三，将逐个字符读取文件转换为逐行读取文件，这样处理字符串会更加方便，减少了代码量。
展示性能分析图和程序中消耗最大的函数

void WordList::wordCount(string fileName, WordList &wordList, int m, bool _w)
{
	char word[MAX_WORD_LENGTH] = { 0 };
	char wordStr[2000] = { 0 };
	string str;
	ifstream inFile;
	inFile >> noskipws;
	inFile.open(fileName);
	int wordposition = 0;
	int wordPosition = 0;
	char c;
	int delta = 'a' - 'A';
	int i = 0, j = 0; //记录字符当前位置
	int n = m;     
	while (getline(inFile, str))
	{
		if (str[0] != 'T'&&str[0] != 'A')
			continue;
		c = str[0];
		while (c != '\0')
		{
			c = str[i];
			if (c <= 'Z'&&c >= 'A') c += delta;
			bool separator1 = (c >= 'a'&&c <= 'z');
			bool separator2 = (c >= '0'&&c <= '9');
			if (separator1)
			{
				wordposition++;
				wordStr[wordPosition] = c;
				wordPosition++;
			}
			if (separator2)
			{
				if (wordposition < 4)
				{
                    memset(wordStr, '\0', sizeof(wordStr));
					wordposition = 0;
					wordPosition = 0;
				}
				else
				{
					wordStr[wordPosition] = c;
					wordPosition++;
				}
			}
			if (!separator1 && !separator2 && wordposition < 4)
			{
				
				memset(wordStr, '\0', sizeof(wordStr));
				memset(word, '\0', sizeof(word));
				n = m;
				wordPosition = 0;
				wordposition = 0;
				j = i;
			}
			if (c==':' && wordposition >= 4 && strcmp(wordStr, "title") == 0)
			{
				state = 1;
				wordPosition = 0;
				wordposition = 0;
				memset(wordStr, '\0', sizeof(wordStr));
			}
			if (c == ':' && wordposition >= 4 && strcmp(wordStr, "abstract") == 0)
			{
				state = 2;
				wordPosition = 0;
				wordposition = 0;
				memset(wordStr, '\0', sizeof(wordStr));
			}
			if (!separator1 && !separator2 && wordposition >= 4 && n >= 1)
			{
				if (n > 1)
				{
					wordStr[wordPosition] = c;
				}
				strcat_s(word, wordStr);
				memset(wordStr, '\0', sizeof(wordStr));
				if (n == m)
					j = i;
				if (n == 1)
				{
					wordList.addWord(word, _w);
					memset(word, '\0', sizeof(word));
					n = m+1;
					i = j;
				}
				wordPosition = 0;
				wordposition = 0;
				n--;
			}
			i++;
		} 
	     memset(word, '\0', sizeof(word));
	     memset(wordStr, '\0', sizeof(wordStr));
	   i = 0;
	}
	inFile.close();
}

此函数为功能为抽取合法词组，是最消耗时间的函数段。

void WordList::addWord(char word[],bool _w)
{
	//将word这个单词添加到词频统计表中（或者词频+1）
	int  p_index = Hash(word);
	WordIndex* pIndex = index[p_index];
	while (pIndex != nullptr)
	{
		Word *pWord = pIndex->pWord;
		if (!strcmp(word, pWord->word))
		{
			if (_w == true && state == 1)
				pWord->num += 10;
			else
				pWord->num++;
			Word *qWord = pWord->previous;
			while (qWord->num < pWord->num) 
			{
				if (qWord == pWordHead) return;
				shiftWord(pWord);

				qWord = pWord->previous;
			}
			while (strcmp(qWord->word, pWord->word) > 0) 
			{
				if (qWord->num > pWord->num) return;
				shiftWord(pWord);
				qWord = pWord->previous;
			}
			return;
		}
		pIndex = pIndex->next;
	}
	Word *pWord;
	if (_w == true && state == 1)
		pWord = new Word(word, 10);
	else
		pWord = new Word(word, 1);
	pWord->previous = pWordTail->previous;
	pWord->next = pWordTail;

	pWordTail->previous->next = pWord;
	pWordTail->previous = pWord;

	pIndex = new WordIndex(pWord, index[p_index]);
	index[p_index] = pIndex;

	Word *qWord = pWord->previous;
	while (strcmp(qWord->word, pWord->word) > 0) {
		if (qWord->num > pWord->num) return;
		shiftWord(pWord);
		qWord = pWord->previous;
	}
}

此函数功能为开启链表，存储词组，是空间消耗最大的函数。

遇到代码模块异常或者结对困难及解决方法

问题描述
- 问题1：无法识别标识符
- 问题2：执行之后某个文件无法使用
- 问题3：执行大文本文件之后不出现越界终端
做过哪些尝试
- 问题1尝试：卸载了vs…然后重装，i am sorry，我就是这么特立独行的蠢，然后在网络上查找资料
- 问题2尝试：不断的查找错误，修改代码，换使用函数，在网络上查找解决方法
- 问题3尝试：改变读取方法，将字符数组改成字符串
是否解决
- 问题1：已解决，是因为无法识别头文件，将头文件路径更新即可
- 问题2：已解决，是因为…我们删除并且改变使用函数之后解决了
- 问题3：已解决，是因为我们开的数组不够大
有何收获
- 解决的问题的过程中我又get到一种排查错误的方法
- 增强自己的抗压能力
- 明白了程序员的真正意义，我们笑谈：“我一直把头藏在帽子里是为了遮挡我头上的鸟窝，并且思考着我的代码”，这个梗我只有我和队友get到…

评价你的队友

值得学习的地方：队友很能熬夜，我熬不过他，他能熬到五点，我只能熬到四点；他的抗压能力很强，能够在紧张的代码之余还能够玩场游戏，然后问题就解决了，这告诉我们，学习的时候可以适当放松，他有坚韧不拔的意志，这是我值得学习的地方
需要改进的地方：希望他爱惜身体，不要熬夜太晚，只要熬到四点就好了，不用五点的
我们需要改进的地方：我们一开始看完题目，脑中想了一下，OK，很简单，应该花不多时间，所以没有特别的重视，然后，我们开始上手的时候，竟然会出现各种问题，困扰了我们很久，所以，任何事情还是先做为好，很多事情不是以人意志为转移的

学习进度条

python爬虫：18/10/3
结对项目开发：18/10/8-18/10/12

数值分析——LU分解（LU Factorization）怀帝阍而不见计算数学 c++
本系列整理自博主21年秋季学期本科课程数值分析I的编程作业，内容相对基础，参考书:DavidKincaid,WardCheney-NumericalAnalysisMathematicsofScientificComputing(2002,AmericalMathematicalSociety)目录背景LU分解（LU-Factorization）辅助部分Doolittle分解Cholesky分解定
半导体物理怎么学？哪里是重点？半导体物理考研路
无论是半导体物理考研专业课，还是本科课程学习，搭建框架都挺重要的。不知道哪里是重点？这篇文章介绍《半导体物理学》的框架，有助于初学者了解这个科目的整体结构。面对比较复杂的科目，初学者可能会遇到这种情况——学了好几章，仍然云里雾里，不知自己在学什么，接下来又要学什么。等到学完，只记得一些零零散散的知识点，无法形成完整体系。这可能是因为忽略了一些内容，那就是这个科目的框架。接下来以刘恩科《半导体物理学
《反脆弱》第16章混乱中的秩序文倩定投人生
2020年6月21日共学《反脆弱》Day20今天我们共学的是：第16章混乱中的秩序阅读与思考：问题一：杠铃策略应用到教育领域的体现是？杠铃策略应用到教育领域的体现是：一个自学成才的人，与一个用“填鸭”式方法教出来的人，即他们的知识仅限于课堂教材。这两类人之间的区别，不在于他们在官方的本科课程学习上的差异，每个人都知道这种差异即使很小，也会被分数放大，他们之间的真实差异实际上存在于课堂之外。当塔勒布
深度学习本科课程实验3 网络优化 11egativ1ty 深度学习本科课程深度学习人工智能
一、在多分类任务实验中实现momentum、rmsprop、adam优化器1.1任务内容在手动实现多分类的任务中手动实现三种优化算法，并补全Adam中计算部分的内容在torch.nn实现多分类的任务中使用torch.nn实现各种优化器，并对比其效果1.2任务思路及代码importtorchimporttorch.nnasnnimporttorch.optimasoptimimportnumpyas
机器学习本科课程大作业多元时间序列预测 11egativ1ty 机器学习本科课程机器学习人工智能
1.问题描述1.1阐述问题对某电力部门的二氧化碳排放量进行回归预测，有如下要求数据时间跨度从1973年1月到2021年12月，按月份记录。数据集包括“煤电”，“天然气”，“馏分燃料”等共9个指标的数据（其中早期的部分指标notavailable）要求预测从2022年1月开始的半年时间的以下各个部分的排放量二氧化碳的排放情况具体分为九项指标：CoalElectricPowerSectorCO2Emi
深度学习本科课程实验5 循环神经网络 11egativ1ty 深度学习本科课程深度学习 rnn 人工智能
循环神经网络实验任务内容理解序列数据处理方法，补全面向对象编程中的缺失代码，并使用torch自带数据工具将数据封装为dataloader分别采用手动方式以及调用接口方式实现RNN、LSTM和GRU，并在至少一种数据集上进行实验从训练时间、预测精度、Loss变化等角度对比分析RNN、LSTM和GRU在相同数据集上的实验结果（最好使用图表展示）不同超参数的对比分析（包括hidden_size、batc
机器学习本科课程实验5 贝叶斯分类 11egativ1ty 机器学习本科课程机器学习分类 python
实验1.使用sklearn的GaussianNB、BernoulliNB、MultinomialNB完成肿瘤预测任务实验内容：使用GaussianNB、BernoulliNB、MultinomialNB完成肿瘤预测计算各自十折交叉验证的精度、查准率、查全率、F1值根据精度、查准率、查全率、F1值的实际意义以及四个值的对比阐述三个算法在肿瘤预测中的表现对比1.读取数据集importpandasasp
机器学习本科课程实验6 聚类实验 11egativ1ty 机器学习本科课程机器学习聚类人工智能
第一题：使用sklearn的DBSCAN和AgglomerativeClustering完成聚类实验内容：使用sklearn的DBSCAN和AgglomerativeClustering在两个数据集上完成聚类任务对聚类结果可视化对比外部指标FMI和NMI1.导入模块importnumpyasnpimportmatplotlib.pyplotasplt%matplotlibinlineimportw
深度学习本科课程实验4 卷积神经网络 11egativ1ty 深度学习本科课程深度学习 cnn 人工智能
二维卷积实验1.1任务内容手写二维卷积的实现，并在至少一个数据集上进行实验，从训练时间、预测精度、Loss变化等角度分析实验结果（最好使用图表展示）（只用循环几轮即可）使用torch.nn实现二维卷积，并在至少一个数据集上进行实验，从训练时间、预测精度、Loss变化等角度分析实验结果（最好使用图表展示）不同超参数的对比分析（包括卷积层数、卷积核大小、batchsize、lr等）选其中至少1-2个进
机器学习本科课程实验4 支持向量机 11egativ1ty 机器学习本科课程机器学习支持向量机人工智能
第一题：支持向量机的核函数实验内容：了解核函数对SVM的影响绘制不同核函数的决策函数图像简述引入核函数的目的1.导入模型importnumpyasnpimportmatplotlib.pyplotasplt%matplotlibinlinefrommatplotlib.colorsimportListedColormapimportwarningswarnings.filterwarnings('
深度学习本科课程实验1 Pytorch基本操作 11egativ1ty 深度学习本科课程深度学习人工智能
一、Pytorch基本操作考察1.1任务内容使用初始化一个×的矩阵和一个×的矩阵，对两矩阵进行减法操作（要求实现三种不同的形式），给出结果并分析三种方式的不同（如果出现报错，分析报错的原因），同时需要指出在计算过程中发生了什么①利用创建两个大小分别×和×的随机数矩阵和，要求服从均值为0，标准差0.01为的正态分布；②对第二步得到的矩阵进行形状变换得到的转置^；③对上述得到的矩阵和矩阵$^$求矩阵相
编译原理本科课程专题4 算符优先语法分析设计原理与实现 11egativ1ty 编译原理网络
一、程序功能描述本程序由C/C++编写，实现了：算符优先文法、最左素短语、算符优先矩阵、优先函程序等概念的定义及实例。以专题1词法分析程序的输出为语法分析的输入，实现算符优先分析算法，完成以下描述算术表达式的算符优先文法的算符优先分析过程：G[E]:E→E+T∣E-T∣TT→T*F∣T/F∣FF→(E)∣i二、主要数据结构描述关于具体的数据结构，主要使用了C语言的数组，其中字符数组运用最多，主要用
编译原理本科课程专题5 基于 SLR(1)分析的语义分析及中间代码生成程序设计 11egativ1ty 编译原理 c++
一、程序功能描述本程序由C/C++编写，实现了赋值语句语法制导生成四元式，并完成了语法分析和语义分析过程。以专题1词法分析程序的输出为语法分析的输入，完成以下描述赋值语句SLR(1)文法的语义分析及中间代码四元式的过程，实现编译器前端。G[S]:S→V=EE→E+T∣E-T∣TT→T*F∣T/F∣FF→(E)∣iV→i二、主要数据结构描述关于本程序的数据结构，首先用map存储了非终结符及终结符的编
编译原理本科课程专题3 LL(1)语法分析设计 11egativ1ty 编译原理 java 数据库服务器
一、程序功能描述本程序由C/C++编写，运用了自顶向下语法分析的设计方法和实现原理，实现了：LL（1）分析表的构造、LL(1)分析过程、LL(1)分析器的构造。程序以专题1词法分析程序的输出为语法分析的输入，实现了LL(1)分析中控制程序（表驱动程序），完成了以下描述赋值语句的LL(1)文法的LL(1)分析过程：G[S]:S→V=EE→TE′E′→ATE′|εT→FT′T′→MFT′|εF→(E)
机器学习本科课程实验1 线性模型 11egativ1ty 机器学习本科课程机器学习人工智能
第三章线性模型3.1一元线性回归3.2多元线性回归3.3对数几率回归，线性判别分析（二选一）3.4类别不均衡3.1一元线性回归——Kaggle房价预测使用Kaggle房价预测数据集：打乱数据顺序，取前70%的数据作为训练集，后30%的数据作为测试集分别以LotArea,BsmtUnfSF,GarageArea三种特征作为模型的输入，SalePrice作为模型的输出在训练集上，使用最小二乘法求解模型
机器学习本科课程实验3 决策树处理分类任务 11egativ1ty 机器学习本科课程机器学习决策树分类
实验3.1决策树处理分类任务使用sklearn.tree.DecisionTreeClassifier完成肿瘤分类（breast-cancer）计算最大深度为10时，十折交叉验证的精度(accuracy)，查准率(precision)，查全率(recall)，F1值绘制最大深度从1到10的决策树十折交叉验证精度的变化图1.读取数据importnumpyasnpimportpandasaspddat
按照原计划目标来做20200309--今日复盘-459-406 黄花儿香
23：20—23：55用时40分钟今日复盘：每天三件事回顾、反思、探究、提升一、今天完成了哪些工作今天的三个目标1、读书完成本科课程的作业和试卷测试，争取达到80分以上。总计划用时3小时。实际：未做2、今日头条最后一次输出《非你莫属》文章是3月5日，6、7、8三天的未写，去掉周日休息的一次，带上明天当天的，至少需要写出三篇文章来。明天的任务艰巨。准备工作做下来可能就需要四个小时，文章输出是它的倍数
2021-03-05 吴阳_b2d6
今天是周五，合肥下雨了。孩子来电说纽约大学给了学习计算机工程专业的学习机会，但偏硬件一些，他昨天发邮件争取CS专业，被拒，今天问我是否还需要争取数据科学专业，我给了肯定的答案，并为他写了邮件内容：“首先非常感谢贵校能给我转专业的机会，我非常向往能够到贵校读书，纽大不仅是全美学子的梦想学校，也是我最想上的学校。虽然竞争异常激烈，但我还是想争取一下数据科学专业，一是该专业与我本科课程以及实习经历有着密
【自控实验】1. 线性系统串联超前校正实验 Jun-llj 大学课程整理笔记学习笔记
本科课程实验报告，有太多公式和图片了，干脆直接转成图片了仅分享和记录，不保证全对串联超前校正实验：频域设计计算(校正装置)，时域观察验证(校正结果)使用matlab中的simulink进行仿真
【自控实验】2. 采样控制系统特性 Jun-llj 大学课程整理笔记学习笔记 matlab
本科课程实验报告，有太多公式和图片了，干脆直接转成图片了仅分享和记录，不保证全对通过对二阶连续系统、二阶采样系统和具有保持器的二阶采样系统仿真实验，比较三种系统的特性，加深对采样控制系统的了解使用matlab中的simulink进行仿真
终于按时完成目标一次20200225--今日复盘-446-393 黄花儿香
23：10—23：50用时40分钟今日复盘：每天三件事回顾、反思、探究、提升一、今天完成了哪些工作昨日三个目标1、读书继续学习本科课程科目，第五章后一节内容比较多，尽量腾时间安排学习。计划用时4小时。实际：今天的目标完成了，时间累计用了4个小时。上午两个半，下午一个半小时。今天在今日头条里看到一个关于书评的讲座，兴冲冲去听了一下，还不错。讲课人叫付如初，是文学博士。学历是非常厉害的，讲得内容也不错
倾听更大共同体的声音小蓝的小本本
最近听到的几个让我惊呼“卧槽”的故事1.天下的小龙虾是一家，大家手中正在享用的小龙虾可能都是同一只小龙虾自体繁殖的。手中的香蕉95%是来自同一块香蕉。2.费曼试图编写量子物理的本科课程，后来他发现他无法将量子物理解释得让本科生一听就懂的水准，最后他说这就说明人类对量子物理的理解还不够深。3.安徒生——汉斯的故事：汉斯是故事里唯一的一个成年人。/恐惧是自恋的表现：因为你的恐惧来自于担心别人对自己的评
【DAY1|SQL自学打卡】基础查询祖国滴花骨朵儿小白SQL自学打卡数据库 sqlserver sql
前言马上大四找实习了，最近这段时间看了很多互联网大厂的招聘要求，其中一条就是——熟悉SQL-Server数据库我使用的学习平台：牛客刷题网推荐的原因：能够在线编程，非常方便，有题，还能判断对错，也能看到各路大神的解题思路。本阶段学习SLogan：利用有限的时间，撸起袖子加油干！既要面包也要玫瑰！！！我的本科课程当中有一门课程——数据库系统原理与应用，好了，废话不多说了，开干！学习界面：直达传送门请
【“任务式婚姻”之殇】兴时态_198812
【“任务式婚姻”之殇】图片发自App今天上午，咱睡眠心理中心，来访者秋葵小姐在给我讲她的故事之前，先说了一小段对我的溢美之词，故事讲完后还不忘对我送出祝福语。看得出来，她为人非常礼貌，处事情商也不低，是那种很好打交道的姑娘。秋葵小姐大学学的是日语专业，上大三那年她顺理成章去日本留学，在日本读完剩下两年的本科课程，然后顺理成章地读了研究生，再顺理成章地留在日本工作。异国生活充满寂寥和艰辛，再加上她觉
微机原理与接口技术考前冲刺和巩固小明指示说笔记
《微机原理与接口技术》复习练习题与答案适用于专接本考试和本科课程期末考试一、填空题1、8086/8088CPU内部结构按功能分为两部分，即由执行单元和总线接口单元组成。2、若CPU的数据线宽度为16位，则它的字长为16位；地址线宽度为20位，则它的寻址空间为1MB。3、8086CPU为了适应各种应用场合有两种工作模式，即是最小模式和最大模式。4、8086/8088CPU复位后，CS的内容为0FFF
IT世界里的“国境线”（芯片与算法篇）小猿君 IT 互联网
首先分析下概念，对于芯片，相信大家已经比较了解，就不做过多的解释。我们说一下算法，虽然算法是应用在IT领域，但我相信学数学的同学，特别是学习计算数学的，对算法应该更加熟悉。记得在本科课程中，专门有一门课叫做“算法设计”。从概念上来讲，算法指的是解决问题的方法和流程，是一段逻辑，一系列解决问题的清晰指令。或者更通俗一点来讲，算法是从A到B，所有可能的计算方式。一、芯片与算法的关系芯片和算法并不是独立
美国大学是不是“宽进严出”？很难毕业？雨言
美国学校并没有什么“宽进严出”的特点。首先，学生的竞争越来越激烈，学校的录取率也越来越低，是“严进”而非“宽进”。其次，只要学生能够保证上课的出勤率，按时按量交作业，都可以顺利拿到毕业证，因此也没有“严出”的现象。我们中国的学生，一般只有一种情况会被学校要求退学，就是因为语言能力不好，自己也不努力，不去上课，不写作业，不去考试。学生只要有八十分的托福水平，就已经可以应付美国的本科课程了，或者说，毕
这样读书就够了读后感向前的丁丁
一.明确不同的书对你而言，有不同的意义。首先，你得知道你选择的这本书它讲的是什么，你能从中收获哪些方面的东西。数理化益智，文史哲怡情，本科课程可以训练思维方式，读研究生课程能掌握科学方法。人活在世上，无非就是那么几件事情，工作学习生活感情。这一生，我们会遇到很多的问题，然后再去不断地解决，你遇到的这些问题，往往你不知道要怎么去处理，你会按照自我的意识去做，这里的自我意识也就是说，发生一件事情之后你
白衬衣的”变形记“ 时尚日常的穿搭
对于专业从事时尚设计，时尚管理专业的上外贤达国际时尚教育中心而言，时尚感，是专业必须具备的。当然，这是可以在相应的学习和探讨中逐渐形成的。上外贤达招生简章中提到，开设时尚设计，时尚营销与管理的国际本科课程，是培养具有专业素质和全球视野的创新时尚产业的领导者。提到白衬衣，我们首先就想到的是职场，严肃，板正。其实，白衬衣不仅仅是职场的代表，他也同样能给你日常服装搭配增添不一样的韵味。同时，白衬衣也绝对
我眼中的自律慢茶单
距离整顿一个月，已经过去了半个月了。这半个月的时间里，我断断续续的更文。刚刚去翻看了一下，拾柒四篇，知乎2篇，想法2篇。一共才8篇，看到这情形我对自己挺失望。半个月15天，15天里文章才8篇，有7天我是没有更文，这7天我在干嘛呢？看书、学习本科课程……我唯一一直坚持下来只有文案训练营的课程和听书，其他的习惯在整顿以来都是断断续续在进行。我一直以为自己自控能力有所改善了，平常的习惯做起来也花不了自己
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo