大数据v

神操作：教你用Python识别恶意软件

导读：本文将利用静态分析技术揭示这些恶意软件的功能。

作者：约书亚·萨克斯（Joshua Saxe）、希拉里·桑德斯（Hillary Sanders）

来源：大数据DT（ID：hzdashuju）

在本文中，我们将介绍恶意软件静态分析的基础知识。静态分析是对程序文件的反汇编代码、图形图像、可打印字符串和其他磁盘资源进行分析，是一种不需要实际运行程序的逆向工程。虽然静态分析技术有欠缺之处，但是它可以帮助我们理解各种各样的恶意软件。

通过细致的逆向工程，你将能够更好地理解恶意软件二进制文件在攻击目标后为攻击者提供的好处，以及攻击者可以隐藏并继续攻击受感染计算机的方式。正如你将看到的，本文结合了描述和实例，每个部分都介绍了静态分析技术，然后说明其在实际分析中的应用。

本文的代码和数据，可以在公众号后台回复恶意软件获取下载方式。你将在数据目录/ch1中找到本文示例中使用的恶意软件示例。为了演示本文讨论的技术，我们在演示中使用ircbot.exe，这是一个互联网中继聊天（Internet Relay Chat，IRC）机器人，也在日常广泛监测中最常见的恶意软件的示例之一。

严格来说，当连接到IRC服务器时，这个程序被设计常驻在目标计算机上。在ircbot.exe控制目标后，攻击者可以通过IRC控制目标计算机，执行控制指令，例如打开网络摄像头偷偷捕获视频、提取目标的地理位置和桌面的截图，以及从目标机器中提取相关文件等。

01 微软Windows可移植可执行文件格式

要进行恶意软件静态分析，你需要了解Windows PE文件格式，该格式描述了如.exe、.dll和.sys等当今Windows程序文件的结构，并定义了它们存储数据的方式。PE文件包含x86指令、图像和文本等数据，以及程序运行所需的元数据。

PE格式最初的设计是用来进行下面的操作。

1）告诉Windows如何将程序加载到内存中

PE格式描述了文件的哪些块应该加载到内存中，以及在哪里加载。它还告诉你，Windows应该在程序代码里的哪个位置开始执行程序，以及哪些动态链接代码库应该加载到内存中。

2）为运行程序提供在执行过程中可能使用的媒体（或资源）

这些资源可以包括字符串，如GUI对话框或控制台输出的字符串，以及图像或视频。

3）提供安全数据，例如数字代码签名

Windows使用这些安全数据来确保代码出自受信任的来源。

PE格式通过利用图1-1中所示的一系列结构来完成以上工作。

▲图1-1 PE文件格式

如图1-1所示，PE文件格式包括一系列头（header），用来告诉操作系统如何将程序加载到内存中。它还包括一系列节（p）用来包含实际的程序数据。Windows将这些节加载到内存中，使其在内存中的偏移量与它们在磁盘上的显示位置相对应。

让我们从PE头开始，来更详细地探讨这个文件结构。我们将略过对DOS头的讨论，这是20世纪80年代微软DOS操作系统的遗留产物，仅仅出于兼容性原因而存在。

1. PE头

如图1-1底部所示，在DOS头❶的上面是PE头❷，它定义了程序的一般属性，如二进制代码、图像、压缩数据和其他程序属性。它还告诉我们程序是否是针对32位或64位系统而设计的。

PE头为恶意软件分析师提供了基本但有用的情景信息。例如，头里包括了时间戳字段，这个字段可以给出恶意软件作者编译文件的时间。通常恶意软件作者会使用伪造的值替换这个字段，但是有时恶意软件作者会忘记替换，就会发生这种情况。

2. 可选头

可选头❸实际上在今天的PE可执行程序中无处不在，恰恰与其名称的含义相反。它定义了PE文件中程序入口点的位置，该位置指的是程序加载后运行的第一个指令。

它还定义了Windows在加载PE文件、Windows子系统、目标程序（例如Windows GUI或Windows命令行）时加载到内存中的数据大小，以及有关该程序其他的高级详细信息。由于程序的入口点告诉了逆向工程师该从哪里开始进行逆向工程，这个头信息对逆向工程师来说是非常宝贵的。

3. 节头

节（p）头❹描述了PE文件中包含的数据节。PE文件中的一个节是一块数据，它们在操作系统加载程序时将被映射到内存中，或者包含有关如何将程序加载到内存中的指令。

换句话说，一个节是磁盘上的字节序列，它要么成为内存中一串连续字节的字符串，要么告知操作系统关于加载过程的某些方面。

节头还告诉Windows应该授予节哪些权限，比如程序在执行时，是否应该可读、可写或可执行。例如，包含x86代码的.text节通常被标记为可读和可执行的，但是不可写的，以防止程序代码在执行过程中意外修改自身。

图1-1描述了许多节，如.text和.rsrc。执行PE文件时，它们会被映射到内存中。其他如.reloc节的特殊节不会被映射到内存中，我们也将讨论这些节。下面我们来浏览图1-1中显示的节。

1）.text节

每个PE程序在其节头中包含了至少一个标记为可执行的x86代码节；这些节几乎总是命名为.text❺。

2）.idata节

.idata节❻，也被称为导入节，包含导入地址表（IAT），它列出了动态链接库和它们的函数。IAT是最重要的PE结构之一，在对PE二进制文件进行最初的分析时需要查看它，因为它指出了程序所调用的库，然而这些调用反过来又可能会泄露恶意软件的高级功能。

3）数据节

在PE文件结构中的数据节可以包括.rsrc、.data和.rdata等节，它们存储程序使用的鼠标光标图像、按钮图标、音频和其他媒体等。例如，图1-1中的.rsrc节❼包含了程序用于将文本呈现为字符串的可打印字符串。

.rsrc（资源）节中的信息对恶意软件分析师是非常重要的，因为通过检查PE文件中的可打印字符串、图形图像和其他资产，他们可以获得关于文件功能的重要线索。

在03节中，你将了解如何使用icoutils工具包（包括icotool和wrestool）从恶意软件二进制文件的资源节中提取图形图像。然后，在04节中，你将学习如何从恶意软件资源节中提取可打印的字符串。

4）.reloc节

PE二进制文件的代码并非是与位置独立的，这意味着如果将它从预期的内存位置移动到新的内存位置，它将无法正确执行。.reloc❽在不破坏代码的情况下通过允许移动代码来解决这个问题。

如果一个PE文件的代码已被移动，它就告诉Windows操作系统将该文件的代码中进行内存地址转换，这样代码仍可以正确运行。这些转换通常涉及在内存地址中添加或减去偏移量。

02 使用pefile解析PE文件格式

由Ero Carerra编写和维护的Python模块pefile已经成为解析PE文件的一个行业标准的恶意软件分析库。在本节中，我将向你展示如何使用pefile来解析ircbot.exe。代码清单1-1假设ircbot.exe已位于你当前的工作目录中。

输入以下命令安装pefile库，以便我们可以在Python中导入它：

$ pip install pefile

现在，使用代码清单1-1中的命令启动Python，导入pefile模块，然后使用pefile打开并解析PE文件ircbot.exe。

代码清单1-1 加载pefile模块并解析PE文件（ircbot.exe）

$ python
>>> import pefile
>>> pe = pefile.PE("ircbot.exe")

我们实例化pefile.PE，它是PE模块实现的核心类。它解析PE文件，以便我们可以查看它们的属性。通过调用PE构造函数，我们加载并解析指定的PE文件，在本例中为ircbot.exe。现在我们已经加载并解析了这个文件，运行代码清单1-2中的代码从ircbot.exe的pe字段中提取信息。

代码清单1-2 遍历PE文件的各个节并打印有关它们的信息

#基于 Ero Carrera的示例代码(pefile库的作者)
for p in pe.ps:
  print(p.Name, hex(p.VirtualAddress),
    hex(p.Misc_VirtualSize), p.SizeOfRawData)

代码清单1-3显示了打印输出的内容。

代码清单1-3 使用Python的pefile模块从ircbot.exe中提取节数据

如代码清单1-3所示，我们从PE文件五个不同的节中提取了数据：.text、.rdata、.data、.idata和.reloc。输出是以五元组的形式给出，每提取一个PE节对应一个元素。每一行的第一个条目标识PE节。（你可以忽略一系列的\x00空字节，它们只是C语言样式的空字符串终止符。）其余字段告诉我们，一旦将每个节被加载到内存中，它的内存利用率将是多少，以及一旦被加载，它将在内存中的何处被找到。

例如，0x1000❶是加载这些节的虚拟内存地址基址，也可以将其视为节的内存地址基址。在虚拟大小（virtual size）字段中的0x32830❷指定了节被加载后所需的内存大小。第三个字段中的207360❸表示该节将在该内存块中所占用的数据量。

除了使用pefile解析程序的节之外，我们还可以使用它列出二进制文件将加载的DLL文件，以及它将在这些DLL文件中所请求的函数调用。我们可以通过镜像（dump）PE文件的IAT来实现这一点。代码清单1-4显示了如何使用pefile镜像ircbot.exe的IAT。

代码清单1-4 从ircbot.exe中提取导入信息

$ python
pe = pefile.PE("ircbot.exe")
for entry in pe.DIRECTORY_ENTRY_IMPORT:
    print entry.dll
    for function in entry.imports:
        print '\t', function.name

代码清单1-4会生成如代码清单1-5所示的输出（为了简洁起见，输出进行了截断）。

代码清单1-5 ircbot.exe的IAT表内容，其显示了这个恶意软件使用的库函数

如代码清单1-5所示，这个输出对于恶意软件分析很有价值，因为它列出了恶意软件声明和将引用的丰富的函数数组。

例如，输出的前几行告诉我们，恶意软件将使用WriteFile❶写入文件，使用CreateFileA❷打开文件，并使用CreateProcessA❸创建新的进程。虽然这些只是关于恶意软件的基本信息，但它们是了解恶意软件更为详细行为的开始。

03 检查恶意软件的图片

要了解恶意软件是如何设计来捉弄攻击目标的，让我们看看在它的.rsrc节中所包含的图标。例如，恶意软件二进制文件常常被设计成伪装的Word文档、游戏安装程序、PDF文件等常用软件的图标来欺骗用户点击它们。

你还可以在恶意软件中找到攻击者自己感兴趣程序中的图像，例如攻击者为远程控制受感染机器而运行的网络攻击工具和程序。

回到我们的样本图像分析，你可以在本文的数据目录中找到名为fakepdfmalware.exe的这个恶意软件样本。这个样本使用Adobe Acrobat图标诱骗用户认为它是一个Adobe Acrobat文档，而实际上它是一个恶意的PE可执行文件。

在我们使用Linux命令行工具wrestool从二进制文件fakepdfmalware.exe中提取图像之前，我们首先需要创建一个目录来保存我们将提取的图像。代码清单1-6显示了如何完成所有这些操作。

代码清单1-6 从恶意软件样本中提取图像的Shell命令

$ mkdir images
$ wrestool -x fakepdfmalware.exe -output=images
$ icotool -x -o images images/*.ico

我们首先使用mkdir images创建一个目录来保存提取的图像。接下来，我们使用wrestool从fakepdfmalware.exe中提取图像资源（-x）到/images目录，然后使用icotool提取（-x）并将Adobe中.ico图标格式中的所有资源转换（-o）为.png图形，以便我们可以使用标准的图像浏览工具查看它们。

如果你的系统上没有安装wrestool，你可以从这里下载：

http://www.nongnu.org/icoutils/

一旦你使用wrestool将目标可执行文件中的图像转换为PNG格式，你就可以在你喜欢的图像浏览工具中打开它们，并以各种分辨率查看Adobe Acrobat图标。

正如我在这里给出的例子所示，从PE文件中提取图像和图标相对简单，可以快速显示与恶意软件二进制文件相关的有趣且又有用的信息。同样地，我们可以轻松地从恶意软件中提取可打印字符串来获取更多信息，我们接下来会做这项工作。

04 检查恶意软件的字符串

字符串是程序二进制文件中可打印字符的序列。恶意软件分析师通常依赖恶意样本中的字符串来快速了解其中可能发生的情况。这些字符串通常包含下载网页和文件的HTTP和FTP命令，用于告诉你恶意软件连接到的地址的IP地址和主机名等类似信息。

有时，即使用于编写字符串的语言也有可能暗示恶意软件二进制文件的来源国，尽管这可能是伪造的。你甚至可以在一个字符串中找到一些文本，它们用网络用语解释了恶意二进制文件的用途。

字符串还可以显示有关二进制文件的更多技术信息。例如，你可能会发现有关用于创建二进制文件的编译器、编写二进制文件所使用的编程语言、嵌入式脚本或HTML等信息。

虽然恶意软件作者可以对所有这些痕迹进行混淆、加密和压缩等处理，但是即便是高水平的恶意软件作者也经常会暴露并留下一些痕迹，因此在分析恶意软件时，对镜像的字符串进行细致检查显得尤为重要。

1. 使用字符串程序

查看文件中所有字符串的标准方法是使用命令行工具strings，按照以下语法进行使用：

$ strings filepath | less

该命令将文件中的所有字符串逐行打印到终端上。在末尾添加 | less可以防止字符串在终端上跨屏显示。默认情况下，strings命令查找所有最小长度为4字节的可打印字符串，但是你可以设置不同的最小长度并更改“命令手册”中所列各种其他参数。

我建议只使用默认的最小字符串长度4，但是你可以使用-n选项更改最小字符串长度。例如，“string -n 10 filepath”只提取最小长度为10字节的字符串。

2. 分析镜像字符串

现在我们镜像了一个恶意软件程序的可打印字符串，但是挑战在于要理解这些字符串的含义。例如，假设我们将ircbot.exe中的字符串镜像到ircbotstring.txt文件中，这在本文前面的内容中，我们使用pefile库已经进行了探讨，如下所示：

$ strings ircbot.exe > ircbotstring.txt

ircbotstring.txt的内容包含数千行文本，但其中一些行应该突出显示出来。例如，代码清单1-7显示了从字符串镜像中提取出来的一串以单词DOWNLOAD开头的行。

代码清单1-7 显示恶意软件可以将攻击者指定的文件下载到目标计算机的字符串输出

这些行表示ircbot.exe将尝试把攻击者指定的文件下载到目标计算机上。

我们来尝试分析另一个。代码清单1-8所示的字符串镜像表明ircbot.exe可以起到Web服务器的作用，在目标机器上侦听来自攻击者的连接。

代码清单1-8 显示恶意软件有一个攻击者可以连接的HTTP服务器的字符串输出

代码清单1-8显示了ircbot.exe用于实现HTTP服务器的各种HTTP样板程序。此HTTP服务器可能允许攻击者通过HTTP连接到目标计算机以发出命令，例如获取受害者桌面的屏幕截图并将其回传给攻击者的命令。

我们在整个代码清单中看到了HTTP功能的证据。例如，从Internet资源请求数据的GET方法❶。HTTP/1.0 200 OK❷这一行是一个返回状态代码200的HTTP字符串，表明HTTP网络事务都运行良好，而Server:myBot❸表明HTTP服务器的名称是myBot，这是ircbot.exe附加的一个内置HTTP服务器。

所有这些信息都有助于理解和阻止特定的恶意软件样本或恶意活动。例如，知道恶意软件样本有一个HTTP服务器，当你连接到它时，它会输出特定的字符串，这样你就可以借此扫描你的网络来识别受感染的主机。

05 小结

在本文中，你大致对静态恶意软件分析有了一定的认识，其中包括在不实际运行的情况下检查恶意软件程序。

你了解了定义Windows操作系统.exe和.dll文件的PE文件格式，还了解了如何使用Python库pefile解析实际场景中的恶意软件ircbot.exe二进制文件。

你还使用图像分析和字符串分析等静态分析技术，从恶意软件样本中提取更多的信息。

关于作者：约书亚·萨克斯（Joshua Saxe）是专业安全企业Sophos的首席数据科学家，他在Sophos公司负责领导一个安全数据科学研究团队。他还是Sophos公司基于神经网络的恶意软件检测器的主要发明者，它可以保护数以千万计的Sophos客户防范恶意软件。

希拉里·桑德斯（Hillary Sanders）是Sophos公司的高级软件工程师和数据科学家，她在为Sophos公司发明和产品化神经网络、机器学习和恶意软件相似性分析安全技术方面发挥了关键作用。她曾在加州大学伯克利分校学习统计学。

本文摘编自《基于数据科学的恶意软件分析》，经出版方授权发布。

延伸阅读《基于数据科学的恶意软件分析》

点击上方链接了解及购买

转载请联系微信：DoctorData

推荐语：本书侧重在将数据科学应用于恶意软件，旨在更全面地展示如何将数据科学技术应用于解决重大的网络安全问题。通过了解恶意软件的数据科学，你将能够更好地将数据科学应用到其他网络安全领域，比如网络攻击、钓鱼邮件或可疑用户行为等检测工作。

有话要说????

Q: 恶意软件还有哪些特征？

欢迎留言与大家分享

猜你想看????

用户画像标签体系包括哪些维度？有哪些应用场景？（附完整导图）
创建字节跳动之前，张一鸣读过哪些硬核技术书？
手把手教你做用户画像：3种标签类型、8大系统模块
怎样成为一名真正的数据科学家？这10本书就是答案

更多精彩????

在公众号对话框输入以下关键词

查看更多优质内容！

PPT | 读书 | 书单 | 硬核 | 干货

大数据 | 揭秘 | Python | 可视化

AI | 人工智能 | 5G | 中台

机器学习 | 深度学习 | 神经网络

合伙人 | 1024 | 大神 | 数学

据统计，99%的大咖都完成了这个神操作

????

Python绘制数据地图-MovingPandas 懒大王爱吃狼 Python数据可视化 python 信息可视化开发语言 Python基础 python学习
MovingPandas是一个用于时空数据分析的Python库，它扩展了Pandas和GeoPandas，使得处理和分析带有时间戳的地理数据变得更加方便。虽然MovingPandas本身不直接提供数据可视化功能，但你可以结合其他库如matplotlib、folium或plotly来绘制数据地图。以下是一个简单的示例，展示如何使用MovingPandas和matplotlib来绘制带有时间戳的地理数
智能图像识别系统设计与实现算法机器学习人工智能
摘要本文讨论了图像识别技术在安防领域的应用，详细介绍了如何利用AI设计实时图像识别系统解决传统监控系统的不足，包括快速识别潜在威胁和提高实时性。文章包含可运行的代码模块（基于Python和OpenCV），并通过实际案例展示如何应对技术挑战。引言传统监控系统主要依赖人工监控，面临效率低、实时性差等问题。而人工智能和图像识别技术的发展为安防领域带来了革命性的改变。通过基于AI的实时图像识别系统，可以快
Python系列之：Dash从入门到精通系列一快乐骑行^_^ 大数据 python Dash从入门到精通
Python系列之：Dash从入门到精通系列一一、安装Dash二、Dash布局入门案例详解三、开启和关闭热加载四、Dash设置Html样式和颜色五、Dash可重用组件六、Dash组件Graph七、Dash核心组件八、简单的交互式Dash应用程序九、带有图形和滑块的Dash应用程序布局十、具有多个输入的Dash应用程序十一、具有多个输出的Dash应用程序十二、带有链式回调的Dash应用程序十三、带状
多版本并发控制：MVCC的作用和基本原理 koping_wu mysql 数据库
多版本并发控制：MVCC的作用和基本原理1、MVCC简介1.1快照读与当前读的区别1.1.1快照读1.1.2当前读1.2数据库的读写问题1.3MVCC的作用2、MVCC实现原理之ReadView2.1什么是ReadView2.2ReadView的设计思路2.3MVCC整体操作流程1、MVCC简介1.1快照读与当前读的区别mysql在读数据的场景下，根据是否加锁分为了2种读的方式：1.1.1快照读不
Windows Server 虚拟化环境中SR-IOV网络I/O增强功能 xidianjiapei001 虚拟化技术 windows 网络 SR-IOV 虚拟化 IO虚拟化
WindowsServer虚拟化环境中SR-IOV网络I/O增强功能目录详细文章症状原因解决方案受影响的产品总结：戴尔技术中心的戴尔操作系统和应用解决方案-包括ProjectSputnik、微软Windows、红帽Linux、SUSE、Ubuntu等详细文章症状微软在WindowsServer2012Beta操作系统中引入了对网络领域多项功能的支持。其中一项重要且有趣的功能是单根I/O虚拟化（SR
SAP API开发方法大全
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
使用基于 WebRTC 的 JavaScript API 在浏览器环境里调用本机摄像头
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
【Python Dash】零基础也能轻松掌握的学习路线与参考资料 weishaoonly python dash 学习
PythonDash是一个可视化框架，可以帮助开发者快速构建交互式仪表板和应用程序。它基于Plotly.js库建立，提供了一种易于使用的Python界面，用户可以通过简单的Python代码创建仪表板和应用程序。本篇文章将介绍PythonDash的学习路线，并给出参考资料和优秀实践，并对PythonDash应用的未来趋势进行了展望。一、PythonDash的学习路线以下是学习PythonDash的建
SkyWalking 小馋喵知识杂货铺性能 skywalking
SkyWalking是一款开源的APM（ApplicationPerformanceManagement）工具，主要用于监控、追踪和诊断微服务架构中的应用性能。它支持多种语言，包括Java、Go、Node.js、Python等，能够提供强大的分布式追踪、日志分析、性能监控等功能，是微服务和云原生架构中重要的性能管理工具之一。SkyWalking最初由ApacheSoftwareFoundation
android服务的启动过程,Android Service启动流程 weixin_39968640 android服务的启动过程
一、Service生命周期首先我们先回忆一下Service的声明周期image第一次调用startServie():Service.onCreate()->Service.onStartCommand()第二次调用startService():Service.onStartCommand()本周主要分析上面两步操作,Service的启动行为。二、Service启动分析image阶段一:app进程s
mac 安装多版本python weixin_34208283 python shell ruby
2019独角兽企业重金招聘Python工程师标准>>>python俩个版本是不兼容的，在语法上有一点区别，但是对于我这种有轻度强迫症的人，一般软件或者程序版本都希望用最新的，但是python很多的扩展库都不支持3版本，所以想办法装多个版本的python安装配置Python版本管理器pyenv1.安装pyenvbrewinstallpyenv安装的过程中发现没有安装brewhttps://brew.
macOS 安装和管理多个Python版本 weixin_30590285 python 操作系统 shell
?John'sblog?说明目前Python同时更新与维护Python2和Python3，选择Python2还是选择Python3，取决于当前要使用的库、框架支持哪个版本，所以经常会遇到切换版本的情况。那么应该怎样有效的更改呢？很多小伙伴一定会想到修改环境变量，指定Python的默认路径，这样当然可以，然而不够优雅。那么怎样的方法才算优雅呢？当然是一条命令了?。这里通过brew安装pyenv，再用
Mac上安装多个版本的Python 冷读者技术 Python Python Mac
简介利用Mac包管理工具brew安装pyenv，pyenv用来管理所有python版本。如果没有安装brew，先安装一下吧。安装pyevn$brewinstallpyenv$pyenv-vpyenv1.2.6查看所有的python版本（pyenv管理的所有版本）$pyenvversions*system(setby/Users/xxx/.pyenv/version)*表示当前正在使用的版本，sys
【Python】Numpy详解 frimiku python numpy 开发语言大数据人工智能
Numpy详解相关教程【Python】Numpy详解【Python】Pandas详解【Python】Matplotlib详解一、Numpy介绍数据分析三剑客之一的Numpy，是一个用于处理数组的Python包【基于数组对象的科学计算库】。其全名为“NumericPython”，是一款开源的Python库。Numpy相当于Python中的列表（List），但只能存放相同的数据类型。引入Numpy的目
python dash框架时雨h 数学建模 python 信息可视化 dash 数据分析
Dash是一个用于创建数据分析型web应用的Python框架。它由Plotly团队开发，并且可以用来构建交互式的web应用程序，这些应用能够包含图表、表格、地图等多种数据可视化组件。Dash的特点：易于使用：Dash使用Python语法，对于熟悉Python的用户来说很容易上手。交互性：Dash支持用户交互，例如点击事件、下拉列表选择等。服务器端渲染：Dash应用程序在服务器端渲染，然后将结果发送
React 前端框架开发详细操作编码小袁前端框架
一、引言在当今的web开发领域，React作为一款流行的前端框架，以其高效的组件化开发模式、虚拟DOM带来的高性能以及灵活的生态系统，受到了广大开发者的青睐。无论是开发小型的单页应用还是大型的企业级项目，React都能展现出强大的能力。本文将详细介绍React前端框架的操作使用方法，帮助开发者快速上手并深入理解React开发。二、环境搭建在开始使用React进行开发之前，需要先搭建好开发环境。以下
Python函数的5个核心概念昊昊该干饭了 python python 开发语言
Python函数是编程的基石之一，也是提高代码复用性和可读性的关键工具。本文将从零开始，详细剖析Python函数的五个核心概念：定义、参数、返回值、作用域，以及嵌套函数。通过深度解析与实践案例，让大家彻底掌握Python函数的精髓。目录1.什么是函数？1.1函数的定义1.2函数的优点2.核心概念一：函数的定义与调用3.核心概念二：函数的参数3.1参数的种类3.2参数解包4.核心概念三：函数的返回值
Python数据类型与操作昊昊该干饭了 python 数据结构 python 开发语言
Python是一种动态类型的编程语言，拥有丰富的数据类型，这些类型在编程中无处不在，掌握它们是学习Python的第一步。本篇文章将以循序渐进的方式，从字符串、数字，到列表、元组，再到字典，全面讲解它们的定义、常见操作以及应用场景，帮助大家打好Python基础。目录一、字符串：文本处理的基础1.字符串的定义与基本操作常见操作统计字符串中单词个数2.字符串的方法二、数字：Python的数值操作1.数字
为什么redis会开小差？Redis 频繁异常的深度剖析与解决方案磐基Stack专业服务团队 redis 数据库缓存
文章目录导读为什么redis会开小差？1.连接数过多2.bigkey3.慢命令操作4.内存策略不合理5.外部数据双写一致性6.保护机制未开启7.数据集中过期8.CPU饱和9.持久化阻塞10.网络问题结论导读提起分布式缓存，想必大多数同学脑海中都会浮出redis这个名字来……但是，对于它，你真的玩转了吗？为什么你的redis会慢，会卡顿，会崩溃？现在带你一探究竟。为什么redis会开小差？本文主要简
python中os.path.join的用法 Ian_Wonder code问题记录
os.path.join()函数：连接两个或更多的路径名组件1.如果各组件名首字母不包含’/’，则函数会自动加上2.如果有一个组件是一个绝对路径，则在它之前的所有组件均会被舍弃3.如果最后一个组件为空，则生成的路径以一个’/’分隔符结尾例1：importosPath1='home'Path2='develop'Path3='code'Path10=Path1+Path2+Path3Path20=o
docker实践与应用举例周盛欢 docker
第一步：搞清楚Docker是啥玩意儿Docker是个啥？简单来说，它就像是一个“打包神器”。你可以把你的程序、代码、运行环境（比如Python、Java、数据库之类的）全部打包成一个“盒子”，然后这个“盒子”可以放到任何地方运行，不用担心环境问题。这就像是你把一个玩具打包好，不管带到哪里，都能拿出来玩，而且不会坏。为啥要用Docker呢？因为它能解决“在我电脑上能运行，但到你电脑上就报错”的问题。
十分钟精通MinIO：minio的原理、部署、操作周盛欢 minio java springboot spring
一、认识MinIOMinio是一个简单易用的云存储服务，就像是一个放在网络上的大文件柜。想象一下，你有一间放满了各种文件的房间，有时候你需要把这些文件分享给朋友或者在不同地方访问它们。Minio就是帮你做到这一点的工具，它让你可以轻松地把文件上传到互联网上，这样无论你在哪里，只要有网络，就能访问或分享这些文件。现在，如果你想要从这个仓库里取出一张图片或一段视频，让网站的访客能看到或者下载，Mini
两款开源的微信对话生成器，做成了在线小工具 Java潘老师项目源码微信
如果你也想在社交媒体上、视频创作中或者日常娱乐里，展现出与众不同的一面，那么微信对话生成器绝对是你不可错过的好帮手。今天，就让我们一起走进3M万能在线工具箱https://3m.panziye.com中的两款微信对话生成器，看看它们如何为我们的创意插上翅膀。微信对话在线生成器这款微信对话在线生成器，可谓是功能丰富且操作便捷。它基于GitHub上的开源项目搭建而成，能够满足你对微信对话的各种想象。无
Python库-pandas详解 m0_67403240 面试学习路线阿里巴巴 python 数据挖掘数据分析经验分享 spring
Python库-pandas详解1.pandas介绍2.Series3.DataFrame3.1DataFrame结构3.2DataFrame属性与方法3.2DataFrame索引的设置4.基本数据操作4.1索引重命名4.2通过索引操作数据4.3排序5.DataFrame运算5.1算术运算5.2逻辑运算5.3统计运算5.4自定义运算6.pandas画图7.文件的读取和存储8.数据的高级处理8.1缺
贪心算法之区间选点问题阿贾克斯的黎明 java 贪心算法算法
目录贪心算法之区间选点问题1.区间选点问题概述2.基本区间选点问题的贪心策略（1）策略思路（2）具体示例3.区间选点问题变体及处理（1）变体描述（2）贪心策略调整（3）示例演示4.Java实现代码及解释（1）定义区间类（2）贪心算法实现（3）代码解释5.性能优化（1）当前实现的性能问题（2）树状数组优化思路（3）示例代码片段（树状数组相关操作）（4）优化后的性能分析6.总结与展望（1）区间选点问题
2025年美赛数学建模 MCM 问题 B：可持续旅游管理详细解析和代码（持续更新中，matlab和python代码，2025美赛） 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模 matlab 2025年数学建模美赛 B题可持续旅游管理 2025美赛 2025
目录问题一：1.模型概述1.1主要因素1.2约束条件2.模型的构建2.1变量与函数定义2.2目标函数2.3额外收入支出计划3.敏感性分析4.Python代码实现5.结果与建议MATLAB代码实现解释问题二：1.如何适应不同旅游目的地的模型：a.游客消费模式和收入：b.游客数量与收入关系的调整：c.环境影响和保护成本：d.社会成本：2.平衡吸引力较少的景点和位置：a.优化游客分布：b.定价和激励措施
C#连接MySQL操作详解 TechPr c#mysql android C#
C#连接MySQL操作详解在这篇文章中，我们将详细介绍如何使用C#连接和操作MySQL数据库。我们将提供完整的源代码和相应的描述，以帮助您更好地理解。步骤1：引用MySQLConnector/Net首先，您需要安装并引用MySQLConnector/Net，这是一个官方提供的用于在C#中连接MySQL数据库的库。您可以从MySQL官方网站上下载并安装这个驱动程序，然后在您的项目中添加对MySQLC
pandas介绍 June � 可视化 python 数据分析大数据机器学习
本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。pandas是python第三方库，是基于Numpy的一种工具，经常与numpy与matplotlib一起使用，该工具是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。它是
2024年最新办公室文员必备python神器，将PDF文件表格转换成excel表格！ 2401_84691713 程序员 python pdf excel
初始化DataFrame数据对象、用于DataFrame数据保存data_frame=pd.DataFrame()读取PDF表格pdf文件路径pdf_file=‘/usr/load/data.pdf’读取pdf数据pdf_data=pdfplumber.open(pdf_file)遍历PDF数据forpageinpdf_data.pages:每一页的Tbale表格数据table=page.extr
Python中time模块用法示例详解阿鈞ajunwiwx 谜之操作 python 人工智能机器学习目标检测 opencv
前言仅供个人学习用，如果对各位朋友有参考价值，给个赞或者收藏吧^_^一、time模块介绍time模块是Python中处理时间相关操作的核心工具，提供了时间获取、格式化、转换、延迟以及计时等多种功能。总的来说time模块中时间可以有3种格式：时间戳，时间元组和时间字符串，其中时间字符串可以自行定制格式。time模块的方法大部分是针对这几种时间格式进行输出，处理和转化。时间戳：是指格林威治时间1970
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

神操作：教你用Python识别恶意软件

你可能感兴趣的:(神操作：教你用Python识别恶意软件)