ReedSun

MIT 6.00 1X Lecture 7 Debugging 学习笔记

l MIT6.00 1x (麻省理工：计算机科学和Python编程导论)

Lecture 7 Debugging 调试

7.1 TESTING AND DEBUGGING 测试和调试

Testing and Debugging 测试和调试

• Would be great if our code always workedproperly the first $me we run it! 如果我们的代码总能在第一次运行就完美运行，那就太棒了

• But life ain’t perfect, so we need: 但是人生不完美的，所以我们需要

– Testing methods 测试方法

• Ways of trying code on examples to determine if running correctly 使用不同的例子测试代码并查看他是否正确

– Debugging methods 调试方法

• Ways of fixing a program that you know does not work as intended 修改不正常程序的方法

When should you test and debug? 应该在什么时候测试和调试

• Design your code for ease of testing anddebugging 提前弄清楚我们的代码将使我们测试和调试变得简单

– Break program into components that can be tested and debuggedindependently 它们将代码分解成独立的模块，从而独立的进行测试和调试

– Document constraints on modules 写出好的文档

• Expectations on inputs, on outputs 我对输入和输出的期望是什么

• Even if code does not enforce constraints, valuable for debuggingto have description 即使通过测试，代码没有超过限制，这对我们调试的描述也是有用的，特别是当你准备追查一段代码为啥没有按照预期执行时

When are you ready to test? 什么时候准备好了测试

• Ensure that code will actually run 保证代码可以正常运行

– Remove syntax errors 剔除语法错误

– Remove static semantic errors 删除静态语义错误

– Both of these are typically handled by Python interpreter python程序会发现这些东西

• Have a set of expected results (i.e.input-output pairings) ready 提前摸索出一套预期的结果对于一个特定的输入，我们会期待程序有怎样的输出

7.2 TEST SUITES 测试套件

Testing 测试

• Goal:

– Show that bugs exist 证明错误却是存在

– Would be great to prove code is bug free, but generally hard 如果能证明代码没问题，那非常棒，但是那是非常难以做到的没有错误的

• Usually can’t run on all possible inputs to check 一个原因是我们无法做到所有的测试

• Formal methods sometimes help, but usually only on simpler code 有一些正式的方法，它们基于数学，有时候会帮我们证明代码没有错误，但是通常只对简单代码有效

Test suite 测试套件

• Want to find a collection of inputs thathas high likelihood of revealing bugs, yet is efficient 找到一系列输入，它们很有可能会暴露错误，这样的测试实际上非常有效，这就是所谓的测试套件

– Partition space of inputs into subsets that provide equivalentinformation about correctness 其思想史我们将输入分解成子集，为代码的正确性提供等效信息

• Partition divides a set into group of subsets such that eachelement of set is in exactly one subset 我们要做的就是将所有可能的输入集分割成一系列的子集，并保证每一个元素都现在一个子集里

– Construct test suite that contains one input from each element ofpartition 然后我将构建一个测试集，其中至少包含每个子集的一个元素

– Run test suite 运行测试集，并检查它能否成功运行

Example of partition 分解成子集的例子

def isBigger(x, y):

“““Assumes x and y are ints returns True if xis less than y else False”””

假定x和y是整数，如果x比y小返回真否则返回假

• Input space is all pairs of integers 输入空间包含所有成对的指数

• Possible partition 可能的分区

– x positive, y positive xy都是正数

– x negative, y negative xy都是负数

– x positive, y negative x正y负

– x negative, y positive x负y正

– x = 0, y = 0 xy都是0

– x = 0, y != 0 x是0 y不是0

– x != 0, y = 0 x不是0 y是0

Why this partition? 为什么要这样分区

• Lots of other choices 我们有很多其他的选择

– E.g., x prime, y not; y prime, x not; both prime; both not 例如，x是质数而y不是，y是质数而x不是，xy都是质数，xy都不是质数（但是这与问题不相关）

• Space of inputs often have naturalboundaries 一些输入空间经常有些自然界限

– Integers are positive, negative or zero 整数要么是正数要么是负数要么是0

– From this perspective, have 9 subsets 但是从这个方面考虑，应该有九种可能性啊

• Split x = 0, y != 0 into x = 0, y positive and x =0, y negative 但是例如我们数的下是0 y不是0就包含了两种，x是0 y是正数和x是0 y是负数的可能性

• Same for x != 0, y = 0 还有 x不是0 y是0也包含两种可能性

Partitioning 分区

• What if no natural partition to inputspace? 输入空间没有自然分区怎么办

– Random testing – probability that code is correct increases withnumber of trials; but should be able to use code to do better 我可以做随机测试，用一大堆例子来不断尝试，试验次数越多，代码的正确率越高，但是这种情况我们可以使用代码来达到更好的效果

两类测试

– Use heuristics based on exploring paths through the specifications– black-box testing 一是通过特定分类使用启发式的方法探索路径，我们称之为黑盒测试

– Use heuristics based on exploring paths through the code –glass-box testing 二是通过代码本身使用启发式的方式探索路径，我们称之为白盒测试

7.3 BLACK-BOX TESTING 黑盒测试

Black-box testing 黑盒测试

• Test suite designed without looking atcode 这个测试套件的设计使人们无需查看代码

– Can be done by someone other than implementer 他的优点在于制作代码以外的人可以用它来测试代码

– Will avoid inherent biases of implementer, exposing poten.al bugsmore easily 让其他人来进行测试可以避开制作代码的人的固有偏见

– Testing designed without knowledge of implementation, thus can bereused even if implementation changed 另一个好处是，测试不需要知道编写代码的知识，因此我们可以重复使用测试套件即使代码改变了

Paths through a specification 通过规范的路径

• Paths through specification: 规范的路径有两种情况

– x = 0

– x > 0

• But clearly not enough 清晰，但还不够

• Also good to consider boundary cases 还要考虑边界情况

– For lists: empty list, singleton list, many element list 对于列表：空列表，单例列表，多元素列表

– For numbers, very small, very large, “typical” 对于数字来说数字很小或者数字很大还有其他非常“典型”的情况（对于不同的情况，典型的情况是不同的）:

Example 例子

• For our sqrt case, try these: 对于上面的平方根例子，试试这些输入值（图在下面）

– First four are typical 前四个是典型的

• Perfect square 完美的平方数

• Irrational square root 没有整数平方根的数

• Example less than 1 小于1的小数

– Last five test extremes 后五个输入值

• If bug, might be code, or might be spec (e.g. don’t try to findroot if eps tiny) 如果出现bug了，可能是由于代码的原因，也可能是由于规格（输入值）的原因（比如本例中，如果eps（精确度）太小了，可能会找不到平方根

7.4 GLASS-BOX TESTING 白盒测试

Glass-box Testing白盒测试

• Use code directly to guide design of testcases 使用代码本身来引导测试用例的设置

• Glass-box test suite is path-complete if every potential paththrough the code is tested at least once 一个好的白盒检验套件也被称为 穷举路径测试，其中代码片段每一条可能的路径都会被至少检测了一次

– Not always possible if loop can be exercised arbitrary times, orrecursion can be arbitrarily deep 这经常是不可能的比如一个循环被执行了任意次，或者递归被执行了任意深度

• Even path-complete suite can miss a bug, depending on choice ofexamples 特别注意即使是穷举路径测试，也可能会错过一个bug，这基于例子的选择

Example 例子

• Test suite of {-2, 2} will be pathcomplete 测试套件是{-2.2}的情况就可以包含所有测试路径 -2是if函数后的路径，+2是else函数后的路径

• But will miss abs(-1) which incorrectlyreturns -1 但是会错过一个bug -1的绝对值在本例中仍然是-1 而不是我们周知的+1 （边界条件）

– Testing boundary cases and typical cases would catch this {-2 -1, 2} 测试边界条件和典型条件 (-2，-1，2)

Rules of thumb for glass-box testing 白盒检验的基本规则

• Exercise both branches of all ifstatements 确保测试了if语句的所有分支

• Ensure each except clause is executed 确保每一个except语句都被测试了

• For each for loop, have tests where: 对于for循环语句，我不能执行所有的例子，但我可以执行三个案例

– Loop is not entered 没有进入循环

– Body of loop executed exactly once 循环主体只执行了一次

– Body of loop executed more than once 循环主体被执行了好多次

• For each while loop, 对while语句

– Same cases as for loops 和for循环一样的例子

– Cases that catch all ways to exit loop 额外的方面（捕捉所有的跳出循环的不同路径

• For recursive functions, test with norecursive calls, one recursive call, and more than one recursive call 对于递归函数，我们可以测试如果没有递归会发生什么，如果递归了一次会发生什么，如果递归了不止一次会发生什么

7.5 TEST DRIVERS AND STUBS 测试驱动程序和存根

Conducting tests 进行测试

• Start with unit testing 从单元测试的方法入手

– Check that each module (e.g. function) works correctly 单元测试会检测一个模块(比如函数)检测他是否正确 (算法错误)

• Move to integration testing 接着进行集成测试，

– Check that system as whole works correctly 检验作为整体的系统是否正常工作（集成错误）

• Cycle between these phases 修改完成后再倒回去进行单元测试和集成测试，直到找到所有的bug

Test Drivers and Stubs 测试驱动程序和存根

• Drivers are code that 驱动就是代码

– Set up environment needed to run code 我们将建立环境，，也就是说我们将建立一段代码，从而绑定全局变量、数据结构以及其他需要我做测试的东西

– Invoke code on predefined sequence of inputs 在每一种检测手段都运行一遍这段代码（输入序列）

– Save results, and 保存结果

– Report 输出报告

• Drivers simulate parts of program thatuse unit being tested 驱动的好处是他基本会模拟正在进行测试的单元

• Stubs simulate parts of program used byunit being tested 存根仅仅模仿了程序的一部分，这部分被正在进行测试的单元所使用

– Allow you to test units that depend on softwarenot yet written 存根的好处在于它可以测试一些依赖于软件的单元，即便你未曾写过他，可以做到这点

Good testing practice 好的测试实践是什么样子的

• Start with unit testing 从单元测试开始

• Move to integration testing 然后进行集成测试

• After code is corrected, be sure to do regression testing: 当我完成调试并且纠正完所有的错误的时候，记得做回归测试

– Check thatprogram still passes all the tests it used to pass, i.e., that your code fixhasn’t broken something that used to work 返回去，测试一下程序是否仍然能通过所有它之间已经通过的检验，即使之前的代码片段已经通过检验。

因为我已经进行了修改，我不确定是否改乱了之前的代码

7.6 DEBUGGING 调试

Debugging 调试

• The “history” of debugging 调试的历史

– Often claimed that first bug was found by team at Harvard that wasworking on the Mark II Aiken Relay Calculator 第一个bug是被哈佛的一个小组发现的，它们的项目后来被称为马克II型艾肯中继器计算机

– A set of tests on a module had failed; when staff inspected theactually machinery (in this case vacuum tubes and relays), they discoveredthis: 在这个计算机的里的模块测试总是失败，当时的工作人员爬进了电脑里，找到了bug的原因，是一只飞蛾（飞蛾英文bug）

A real bug! 现在我们所理解的bug

• However, the term bug dates back evenearlier: 然后bug这个词出现的可能更早

– Hawkin’s New Catechism of Electricity, 1896 1896年的一本教科书中说

• “The term ‘bug’ is used to a limited extent to designate any faultor trouble in the connections or working of electrical apparatus.” “bug”这个词从某种程度上是指电子器械链接或者工作过程中出现的任何错误或麻烦

下面先讲一下bug的类型

Runtime bugs 运行中的bug分类

• Overtvs. covert: 显性错误和隐形错误

– Overt has an obviousmanifestation – code crashes or runs forever 显性意味着一个很明显的变化，代码崩溃了或者代码一直运行

– Covert has no obviousmanifestation – code returns a value, which may be incorrect but hard todetermine 隐形错误更加不易察觉，它没有明显的变化，代码返回一个值，但是这个值不好判断他正不正确，

•Persistent vs. intermittent: 永久性错误和间歇性错误

– Persistent occurs everytime code is run 永久性错误在代码每次运行时都会发生

– Intermittent onlyoccurs some times, even if run on same input 间歇性错误仅仅在有些时候发生，有时候它仅仅在特定输入时发生，有时候输入相同还是会偶尔发生错误

Categories of bugs bug的分类

• Overt and persistent 显性永久代码

– Obvious to detect 很容易发现

– Good programmers use defensiveprogramming to try to ensure that if error is made, bug will fall into thiscategory 好的程序员会使用防御性编程，来确保如果错误发生了，错误将会落入到一个显而易见的范畴里

• Overt and intermittent 显性间歇性代码

– More frustrating, can be harder to debug, but if conditions thatprompt bug can be reproduced, can be handled 很不幸，更难通过调试来解决，但是如果可以重现出现错误的情况，我们也就可以试着解决它

• Covert 隐形错误

– Highly dangerous, as users may not realize answers are incorrectuntil code has been run for long period 隐形错误非常危险，不明显不易察觉，它可能是间歇性错误，那就更麻烦了！

7.7 DEBUGGING AS SEARCH 调试搜索

Debugging skills 调试技巧

• Treat as a search problem: looking forexplanation for incorrect behavior 将调试看作搜索问题：我想找到一种解释，解释代码中为什么会出错

– Study available data – both correct test cases and incorrect ones 研究手头的数据，正确的测试用例和错误的测试用例都要看

– Form an hypothesis consistent with the data 建立一个和数据一致的假设

– Design and run a repeatable experiment with potential to refutethe hypothesis 设计和运行一个可重复的试验，但会包含驳回假设的可能性

– Keep record of experiments performed: use narrow range ofhypotheses 保持在试验中纪录，使用范围更小的假设

Debugging as search 把调试堪称搜索

• Want to narrow down space of possiblesources of error 选出可能出现错误的范围，然后把他不断缩小

• Design experiments that exposeintermediate stages of computation (use print statements!), and use results tofurther narrow search 设计一些东西，帮我们暴露代码计算的中间环节（通过使用print语句（将我期望的信息和实际输出的信息对比）），然后使用结果缩小搜索范围

• Binary search can be a powerful tool forthis 二分法对于调试搜索来说是个好办法

这个函数的功能是想问一个字符串是不是回文结构

Ps assert是断言函数，我们将在下一章详细学习他

Stepping through the tests 步进试验

• Suppose we run this code: 假设我们开始运行这段代码了（silly）

– We try the input ‘abcba’, which succeeds 我们运行abcba 正确！

– We try the input ‘palinnilap’, which succeeds 我们输入 palinnilap 正确

– But we try the input ‘ab’, which also ‘succeeds’ 我们输入ab 他却不正确了

• Let’s use binary search to isolate bug(s) 我们可以用二分法分离出错误的具体位置

• Pick a spot about halfway through code,and devise experiment 在代码的中间的位置，并设计一个试验

– Pick a spot where easy to examine intermediate values 选择这点，因为很容易检测他的中间值，在这里放置一个print语句

在代码中间（循环之后）加了一个print（result）语句

• At this point in the code, we expect (forour test case of ‘ab’), that result should be a list [‘a’, ‘b’] 这个时候代码中我们期待的结果是输出一个列表[”a”，”b”]（我们输入的是ab）

• We run the code, and get [‘b’]. 我们运行程序，却只得到了[“b”]

• Because of binary search, we know that atleast one bug must be present earlier in the code 由于二分搜索，我们知道了至少一个bug在print语句之前的代码中

• So we add a second print 所以我们添加第二个print语句

在循环中添加一个print语句

Stepping through一步一步通过

• When we run with our example, the printstatement returns 当我们运行这个例子的时候，输出语句会返回

– [‘a’] 第一次输入a，返回a

– [‘b’] 第二次输入b 返回b (应该返回a，b的列表)

• This suggests that result is not keepingall elements 这个现象说明，result没有保留有所有的元素经过观察我们发现 result在每次循环都会重新定义

– So let’s move the initialization of result outside the loop andretry 所以我们将结果的初始化移动到循环之外，然后重试

现在我们第二次输入b后显示的是正确的值（值是[a,b]）了

但是程序依然返回了yes，说明ab结构仍然是回文结构，说明这段代码仍然有问题

• So this now shows we are getting the datastructure result properly set up, but we still have a bug somewhere 它表示数据结构已经构建完毕，但是我们仍然有一个bug在一些地方

– A reminder that there may be more than one problem! 这是一个很好的提醒，意味着仅仅修正了一个代码的问题，其他地方就没有错误了

– This suggests second bug must lie below print statement; let’slook at isPal 这其实也暗示了第二个代码一定在输出语句的下面，那其实应该是ispal的定义有问题

– Pick a point in middle of code, and add print statement again 重复上述过程，选择一个代码的中点，把输出语句加入进去

我们把输出语句 print(temp,x)加入到了代码中，这个输出语句可以表示出两个变量，而且这两个变量应该是相反的。

但是事实上并不是这样的，x和temp这两个变量是完全一样的

• At this point in the code, we expect (forour example of ‘ab’) that x should be [‘a’, ‘b’], but temp should be [‘b’,‘a’], however they both have the value [‘a’, ‘b’] 在这个地方，x应该是[“a”,”b”]，temp应该是[“b”,”a”]，但是他们的值却都是[“a”,”b”]

• So let’s add another print statement,earlier in the code 所以让我们继续添加print语句，在代码更往前的地方

在temp = x之后，temp.reverse之前

添加了一个print（temp,x）语句，继续检测变量的值

我们发现两个print语句输出的值是一样的，temp和x的值也都是一样的

• And we see that temp has the same valuebefore and after the call to reverse 我们可以看到temp和x的值是一样上，无论reverse之前还是之后

• If we look at our code, we realize wehave committed a standard bug – we forgot to actually invoke the reverse method 让我们看一看代码，我们就发现了代码，我们用错了代码，reverse语法应该是这样的，列表名.reverse（）

– Need temp.reverse() 语句需要改成这样temp.reverse（）

• So let’s make that change and try again 把这个错误改正过来然后重试一下

现在我们改正了错误再来运行一下代码，看看有没有问题

我们又发现了问题，第二次print语句输出的temp值和x的值都反向了，这不对了啊

• But now when we run on our simpleexample, both x and temp have been reversed!! 但是现在我们运行我们的例子的时候，x和temp都反向了啊！！！

• We have also narrowed down this bug to asingle line. The error must be in the reverse step 我们可以确定错误一定处在两个print语句中夹着那句反向语句中，因为它们之前的语句正确，之后的语句却错误

• In fact, we have an aliasing bug –reversing temp has also caused x to be reversed 事实上，我们可能遇到了别名错误，，反转temp变量，也把x变量反转了

– Because they are referring to the same object 因为他们指向了同样的变量

（当我对某物进行反向时，我创建的另一个名称却指向了同样的东西，这就导致了另一个反向）

我们修复一下它（用的是列表的克隆的方法），即不让temp指向x的值，而让temp指向x的副本，把temp=x这个语句换位 temp=x[:]

然后我们再来运行一下他

这次的输出结果是第一次 [“a”,”b”]，[“a”,”b”]

第二次[“a”,”b”] ，[“b”,”a”]

正确啦~~

• And now running this shows that beforethe reverse step, the two variables have the same form, but afterwards onlytemp is reversed. 这次的运行显示，反向之前两个变量有相同的值，反向之后却是不同的值了

• We can now go back and check that ourother tests cases still work correctly 我们要返回去，用其他的值检测一下他是不是依然正确

Some pragmatic hints 一些实用的提示

• Look for the usual suspects 查看最长犯错误的地方，（典型错误）（忘了边缘条件，传入的参数是错误的，反向参数的顺序，忘记了调用函数的方法，到底是调用还是仅仅访问了一下）

• Ask why the code is doing what it is, notwhy it is not doing what you want 不要问代码为什么没有做你想做的事，而是问代码正在做什么事（尝试关注代码正在做什么，而不是尝试找出错误发生的地方）

• The bug is probably not where you thinkit is – eliminate locations bug可能不在你想象的位置（排除错误可能出现的位置，通常是用二分法）

• Explain the problem to someone else 试一试跟别人解释这个问题，（对问题的说明常常会帮助你发现错误可能的位置

• Don’t believe the documentation 不要相信说明文档! (这是一类很糟糕的文档，它很容易延迟你的调试时间，而且有时说明文档也是错误的)

• Take a break and come back to the buglater 如果有困难的话，可以休息一下出去散散心，再回来解决它

总结

这一节我们学习了测试和调试，测试分为黑盒测试和白盒测试，

黑盒测试我们通过特定规范的执行路径，而白盒测试我们通过代码内部的结构来确定我们的输出序列

我们还讨论了调试的相关知识，也就是说，定位出我们代码错误的位置

特殊之处在于，我们将会调试做为一个搜索，并使用二分搜索的方法，并检测错误的来源

你可能感兴趣的:(MIT6.00,1X,python)

php amp 字符串处理,php字符串处理之全角半角转换布博士 php amp 字符串处理
半角全角的处理是字符串处理的常见问题，本文尝试为大家提供一个思路。一、概念全角字符unicode编码从65281~65374(十六进制0xFF01~0xFF5E)半角字符unicode编码从33~126(十六进制0x21~0x7E)空格比较特殊,全角为12288(0x3000),半角为32(0x20)而且除空格外,全角/半角按unicode编码排序在顺序上是对应的所以可以直接通过用+-法来处理非空
遥感影像数据处理-大图滑窗切分为小图 GIS潮流遥感语义分割
功能需求据所周知，遥感影像的尺寸有大有小，大的达到几万x几万像素，而图像分割算法模型在训练中尺寸适中，比如256x256，512x512，1024x1024等等，如果直接将遥感影像的原图输入模型中进行训练，大概率会提示内存和显存不足，因此针对遥感影像的模型训练，一般都需要将影像裁剪为小图。裁剪后的效果图如下：解决思路基于上面的需求，写了一套裁剪算法流程。主要考虑的是在裁剪过程中，从左往右、从上到下
Python 数据分析：numpy，抽提，基本索引。听故事学知识点怎么这么容易？好开心啊没烦恼 numpy python 数据分析 numpy 开发语言数据挖掘人工智能机器学习
目录1示例代码2欢迎纠错3免费爬虫------以下关于Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导
Python 数据分析：pandas 的 DataFrame，抽行、抽列、抽行列。df[] / df.loc[] / df.iloc[]，位置索引 / 标签索引，切片 / 不切片好开心啊没烦恼 Python数据分析 python 数据分析 pandas 开发语言数据挖掘
目录1预备知识：Series1.1生成1.2抽提（1）单条（2）多条不连（3）多条连1.3取值2正文：DataFrame2.1生成df2.2抽提2.2.1抽列（1）单列df[]df.loc[]df.iloc[]（2）多列不连df[]df.loc[]df.iloc[]（3）多列连df[]←不存在这种抽提法！df.loc[]df.iloc[]2.2.2抽行（1）单行df[]df.loc[]df.ilo
Python 数据分析：numpy.transpose() ，转换维度。听故事学知识点怎么这么容易？好开心啊没烦恼 numpy numpy python 开发语言数据分析数据挖掘人工智能机器学习
目录1一维数组2二维数组3三维数组4欢迎纠错5免费爬虫------以下关于Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowch
Python 编辑器：Geany，不是内部或外部命令，系统找不到指定路径
目录1找到设置选项2开始设置2.1complie2.2execute3欢迎纠错4免费爬虫------以下关于Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，
Linux程序设计：什么时候选择开发内核模块？ mzhan017 kernel 笔记 linux 网络设计
最近看一个CPU使用率高的问题，从perf里看，是下面的一个占用的比较多是下面一个OverheadSource:LineSymbolSharedObject-8.48%[vdso][1129]0x1129B[.]0x0000000000001129
基于django+Spark+大数据+爬虫技术的国漫推荐与可视化平台设计和实现(源码+论文+部署讲解等) 阿勇学长大数据项目实战案例 Java精品毕业设计实例 Python数据可视化项目案例大数据 django spark 国漫推荐与可视化平台毕业设计 Java
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
【有源码】基于爬虫+python的美食数据分析与可视化flask热门美食推荐系统的设计与实现 Q2643365023 Python 大数据 python 爬虫计算机毕设选题毕业设计源码计算机毕设项目数据分析美食推荐系统
注意：该项目只展示部分功能，如需了解，文末咨询即可。本文目录1.开发环境2系统设计2.1设计背景2.2设计内容3系统展示3.1功能展示视频3.2系统页面4更多推荐5部分功能代码1.开发环境开发语言：Python采用技术：flask、爬虫数据库：MySQL开发环境：PyCharm2系统设计2.1设计背景在现代社会中，人们对美食的兴趣和需求日益增长。互联网和社交媒体的普及使得各种美食信息、评论和推荐变
【零基础学AI】第10讲：线性回归 1989 0基础学AI 人工智能线性回归算法 python 回归 numpy 开源
本节课你将学到理解线性回归的原理和应用场景掌握最小二乘法的基本思想使用Python构建房价预测模型学会评估回归模型的性能指标开始之前环境要求Python3.8+JupyterNotebook或任何PythonIDE需要安装的包pipinstallscikit-learnpandasmatplotlibseabornnumpy前置知识第9讲：机器学习概述基本的Python和数据处理能力核心概念什么是
【零基础学AI】第9讲：机器学习概述 1989 0基础学AI 人工智能机器学习 python numpy devops 开源
本节课你将学到理解什么是机器学习，以及它与传统编程的区别掌握监督学习、无监督学习的基本概念使用scikit-learn完成你的第一个机器学习项目构建一个完整的iris花朵分类器开始之前环境要求Python3.8+JupyterNotebook或任何PythonIDE需要安装的包pipinstallscikit-learnpandasmatplotlibseaborn前置知识基本的Python语法（
python递归实现乘法_算法-递归 weixin_39817012 python递归实现乘法
我们在前面学习过递归函数，递归函数采用的就是递归算法，前面我们通过最常见的菲波那切数列去学习了递归函数，这一节我们再来详细了解一下递归算法。1.递归算法递归算法(英语：recursionalgorithm)在计算机科学中是指一种通过重复将问题分解为同类的子问题而解决问题的方法。递归式方法可以被用于解决很多的计算机科学问题，因此它是计算机科学中十分重要的一个概念，递归算法有三个特点：1)递归的过程一
RK3568-适配rgb接口屏幕 Paper_Love RK3568 linux
RK3568适配rgb接口屏幕从芯片手册中我们可以看出RGB显示最大支持1920x1080@60Hz硬件连接R[7:0]8根红色数据线。G[7:0]8根绿色数据线。B[7:0]8根蓝色数据线。DE数据使能线。VSYNC垂直同步信号线。HSYNC水平同步信号线。PCLK像素时钟信号线。DE模式和HV模式RGBLCD一般有两种驱动模式：DE模式和HV模式，这两个模式的区别是DE模式需要用到DE信号线，
华为路由器典型配置（附案例） normanhere 华为智能路由器 iphone
案例拓扑：#主用路由器R_ShenZhen_1配置displaycurrent-configurationsysnameR_ShenZhen_1#SNAT调用，将IPSEC流量排除aclnumber3000rule5denyipsource10.2.0.00.0.255.255destination10.4.0.00.0.255.255rule10permitipsource10.0.0.00.2
算法-基础算法-枚举算法（Python）总裁余(余登武) 算法与数据结构算法 leetcode
文章目录前言解题思路题目1两数之和2计数质数前言枚举算法（EnumerationAlgorithm）：也称为穷举算法，指的是按照问题本身的性质，一一列举出该问题所有可能的解，并在逐一列举的过程中，将它们逐一与目标状态进行比较以得出满足问题要求的解。在列举的过程中，既不能遗漏也不能重复。枚举算法的核心思想是：通过列举问题的所有状态，将它们逐一与目标状态进行比较，从而得到满足条件的解。由于
NLP随机插入 Humbunklung 机器学习自然语言处理人工智能 python nlp
文章目录随机插入示例Python代码示例随机插入随机插入是一种文本数据增强方法，其核心思想是在原句中随机选择若干位置，插入与上下文相关的词语，从而生成新的训练样本。这种方法能够增加句子的多样性，提高模型对不同词序和表达方式的鲁棒性。示例原句：机器学习可以提升数据分析的效率。随机插入后（插入“显著”）：机器学习可以显著提升数据分析的效率。Python代码示例下面是一个简单的随机插入实现，假设我们有一
Python全栈数据工程师养成攻略-全部代码实战详解国营窝窝乡蛮大人
本文还有配套的精品资源，点击获取简介：本攻略提供全面资源，帮助初学者系统掌握Python全栈数据工程师的核心技能，包括数据处理、分析、数据库管理及Web开发。攻略详细指导如何使用.gitignore保持项目整洁，通过README.md文档深入了解项目内容，以及如何操作data目录中的数据集和codes目录中的Python代码，实现从数据处理到Web应用构建的全流程。学习内容涵盖数据ETL、Pand
python爬虫登录校验之滑块验证、图形验证码（OCR） yuwinter Python python 爬虫 ocr 滑块验证
在爬虫过程中，验证码和滑块验证是常见的反爬措施。针对这些挑战，通常采用OCR识别图形验证码和模拟滑块拖动来处理滑块验证。以下是如何处理这两种类型验证的详细方法。1.图形验证码（OCR）a.使用tesserocr和Pillow处理图形验证码tesserocr是基于TesseractOCR引擎的Python封装，常用来识别简单的图形验证码。如果验证码不太复杂，可以用它来识别文本。步骤：安装依赖：pip
完美解决SSL访问认证 sun.security.validator.ValidatorException: PKIX path building failed cqwuliu jAVA工具 TCP/IP ssl 网络协议网络
一、创建createIgnoreVerifySSL绕过SSL、TLS证书importjavax.net.ssl.SSLContext;importjavax.net.ssl.TrustManager;importjavax.net.ssl.X509TrustManager;importjava.io.IOException;importjava.security.KeyManagementExce
python + selenium通过滑块验证 weixin_51144854 python selenium 爬虫 opencv
1、介绍使用python进行自动化操作或者爬虫过程中，可能会遇到需要进行验证的情况。本文介绍了两种通过滑块验证的方法：轮廓检测通过OpenCV进行轮廓检测，找到滑块背景中缺口的位置，计算缺口到滑块的距离。模板匹配通过OpenCV分析滑块背景图与滑块的相似度，找到滑块背景图中与滑块最相似的区域就是缺口的位置，然后计算缺口到滑块的距离。2、轮廓检测测试地址：https://accounts.douba
安卓端某音乐类 APP 逆向分享（二）协议分析泡泡以安爬虫技术 #安卓逆向安卓逆向爬虫安全
以歌曲搜索协议为例，查看charles中歌曲搜索协议详情拷贝出搜索协议的Curl形式curl-H'Host:interface3.music.xxx.com'-H'Cookie:EVNSM=1.0.0;NMCID=oufhty.1667355455436.01.4;versioncode=8008050;buildver=221010200836;resolution=2392x1440;devi
Python爬虫实战：研究MarkupSafe库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 MarkupSafe
1.引言1.1研究背景与意义随着互联网数据量的爆炸式增长，网页内容自动提取与分析技术在信息检索、舆情监控、数据挖掘等领域的需求日益凸显。网络爬虫作为获取网页内容的核心工具，能够自动化采集互联网信息。然而，直接渲染爬取的网页内容存在安全隐患，特别是跨站脚本攻击（XSS）风险。攻击者可能通过注入恶意脚本窃取用户信息或破坏网站功能。MarkupSafe作为Python的安全字符串处理库，能够有效处理不可
Python爬虫实战：研究sanitize库相关技术 ylfhpy 爬虫项目实战 python 爬虫网络开发语言安全 sanitize
1.引言1.1研究背景与意义在当今数字化时代，互联网已成为人们获取信息、交流互动的重要平台。随着Web2.0技术的发展，用户生成内容(UGC)、社交媒体嵌入、第三方插件等功能极大丰富了网页的内容和交互性，但也带来了严峻的安全挑战。根据Web应用安全联盟(WAS)的统计数据，2025年全球范围内因网页安全漏洞导致的数据泄露事件超过15万起，造成的经济损失高达250亿美元。其中，跨站脚本攻击(XSS)
Python爬虫实战：研究xmltodict库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 xmltodict
1.引言1.1研究背景与意义气象数据在农业生产、交通规划、灾害预警等多个领域具有重要应用价值。传统的气象数据获取方式主要依赖于气象部门发布的统计信息，存在更新不及时、数据维度有限等问题。随着互联网技术的发展，气象网站提供了丰富的实时气象数据，但这些数据通常以HTML、XML等非结构化或半结构化形式存在，难以直接利用。因此，开发高效的数据采集与解析系统具有重要的现实意义。1.2国内外研究现状网络爬虫
Nacos适配GaussDB超详细部署流程，通过二进制包、以及 Docker 打通用镜像包部署保姆级教程 Mr.L-OAM linux系统运维 gaussdb docker 经验分享
1部署openGauss官方文档下载https://support.huaweicloud.com/download_gaussdb/index.html社区地址安装包下载本文主要是以部署轻量级为主要教程，系统为openEuler，ip:192.168.1.151.1系统环境准备操作系统选择系统AARCH64X86-64openEuler√√CentOS7×√Docker√√1.2软硬件安装环境版
Pthon httpx 使用代理下载文件（qbit）
前言技术栈Python3.11.8httpx0.28.1示例代码#encoding:utf-8#author:qbit#date:2025-06-30#summary:httpx使用代理下载文件importhttpxproxy='http://127.0.0.1:8081'defDownFile(url,file):withopen(file,'wb')asf:withhttpx.stream('
python网络安全实战_基于Python网络爬虫实战 weixin_39907850 python网络安全实战
文件的操作：一般都要使用os模块和os.path模块importos.pathos.path.exists('D:\\Python\\1.txt')#判断文件是否存在abspath(path)#返回path所在的绝对路径dirname(p)#返回目录的路径exists(path)#判断文件是否存在getatime(filename)#返回文件的最后访问时间getctime(filename)#返回
Java流式处理太阳伞下的阿呆 java 生成器迭代器 stream 流式处理
在Java中，没有直接类似Python生成器的语法，但可以通过迭代器（Iterator）和流式处理（如使用Spliterator或ReactiveStreams）来实现类似生成器的功能。此外，也可以通过BlockingQueue和线程的组合实现异步文件解压流。以下是几种实现方式：**方法1：使用****Iterator**实现一个Iterator，在每次调用next()时返回解压完成的下一个文件名
导数：微积分的核心概念与实用解析你一身傲骨怎能输数学分析导数
文章摘要导数是描述函数瞬时变化率的数学工具，定义为极限值(f’(a)=lim⁡h→0f(a+h)−f(a)h)\lim_{h\to0}\frac{f(a+h)-f(a)}{h})limh→0hf(a+h)−f(a))，若存在则称函数在点a可导。其几何意义是函数图像在点(a,f(a))处切线的斜率。导数计算的是函数值增量与自变量增量比值的极限，反映瞬时变化率。例如，(f(x)=x^2)的导数为(f’
【Python系列PyCharm控制台pip install报错】如何解决pip安装报错ModuleNotFoundError: No module named ‘numpy’问题
【Python系列PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘numpy’问题摘要在日常Python开发过程中，pipinstall相关的问题频繁困扰着新手和老手。尤其是在PyCharm控制台下执行pipinstallnumpy后，仍然报ModuleNotFoundError:Nomodulenamed'n
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不