markvivv

【译】使用 Python Beautiful Soup 进行网络抓取的小窍门

原文地址：Web Scraping with Python Beautiful Soup: Cheat Sheet

BeautifulSoup 是一个流行的 Python 库，用于抓取网络并处理 XML 和 HTML 文档。它是一个从网站上抓取和检索数据的工具。BeautifulSoup 简化了从指定网页中轻松提取指定元素、内容和属性的过程。

本文结束时，我们将对 BeautifulSoup 的基础知识有一个很好的了解。我们将了解 BeautifulSoup 的安装、安装后的问题、提取不同类型的数据元素以及数据提取中的挑战。

1. 网络抓取和 BeautifulSoup 简介

1.1. 什么是网页抓取？

网页抓取是指从网站上自动提取数据。这包括访问网页，检索网页内容，并使用脚本或工具从网页的 HTML 结构中提取特定数据。

在网站抓取过程中，脚本会向目标网站的服务器发出 HTTP 请求，寻找特定页面或页面集合的 HTML 内容。获取 HTML 内容后，刮擦器会对文档结构进行解释和导航，以便找到所需的数据，其中包括文本、链接、图像和表格。

收集到的信息可以有组织的格式保存，如数据库或 CSV 文件，以供日后研究或使用。

1.2. BeautifulSoup 如何帮助进行网页抓取？

BeautifulSoup4 有许多有用的功能，能让网页抓取更高效、更易用。

BeautifulSoup 的部分功能如下：

HTML 和 XML 解析：为了处理多种结构化信息，BeautifulSoup 能够解析 XML 和 HTML 文档。
搜索和过滤：可使用 CSS 选择器、正则表达式和自定义过滤方法等多种技术搜索和过滤标签。
编码检测： Beautiful Soup 能自动识别文档的源编码并将其转换为 Unicode，从而简化了各种字符编码的处理。
强大的错误处理功能：该库可优雅地处理结构不良或其他错误的 HTML/XML 文档，这在抓取真实网站时可能会发生。
美化输出：使用该库可以通过适当的缩进结构改进文档的输出，从而使文档更易于阅读。
跨版本支持：由于 Beautiful Soup 在 Python 3 和 Python 2 上的功能，Python 版本之间可以相互兼容。
与其他库的协调：其他库（如用于检索网站的 requests 库和用于处理和解析 XML 文档的 lxml 库）可与 Beautiful Soup 配合使用。

2. BeautifulSoup 小抄

让我们准备一份小抄，以便快速参考这些函数的用法。

请注意，class 在 Python 中是一个保留字，不能用作变量或参数名。因此，BeautifulSoup 为类选择器添加了下划线。

或者，您也可以用引号括住 class。

2.1. 使用 BeautifulSoup

安装 beautifulsoup4 库和 lxml 解析器。

pip install beautifulsoup4
pip install lxml

从本地系统加载 HTML 文档

from bs4 import BeautifulSoup

soup = BeautifulSoup(open("index.html"))
soup = BeautifulSoup("data")

从远程 URL读取 HTML 文档

import requests

url = "http://books.toscrape.com/"

response = requests.get(url)
if response.status_code == 200:
    html_content = response.text
else:
    print("Failed to retrieve the webpage. Status code:", response.status_code)

soup = BeautifulSoup(html_content, 'lxml')

2.2. find() 和 findAll() 方法

可使用的方法有：

find_all(tag, attributes, recursive, text, limit, keywords)

find(tag, attributes, recursive, text, keywords)

方法	描述
soup.find(“p”) soup.find(“header”)	按标签名称查找元素
soup.find(id=”unique_id”)	根据 ID 查找元素
soup.find(‘div’, id=”unique_id”) soup.find(‘div’, {‘id’:’unique_id’})	根据 ID 查找 DIV 元素
soup.find_all(class_=”class_name”)	根据 class_name 查找元素
soup.find_all(a, class_=”class_name”) soup.find_all(a, {‘class’:’class_name’})	根据 class_name 查找 A 标记
soup.find_all(string=”text”)	查找包含"text"文本的所有元素
soup.find_all(text=”Example”, limit=3)	查找包含文本 “Example” 的前 3 个元素
soup.find_all(“a”)[“href”]	获取 A 标记的 “href” 属性

2.3. 使用正则表达式

方法	描述
soup.find_all(string=pattern) soup.find_all(text=re.compile(pattern))	搜索包含与给定模式匹配的文本的元素。
soup.find_all(attrs={‘attribute’: re.compile(pattern)})	搜索属性值符合模式的元素。
soup.select(‘tag:contains(pattern)’)	使用 :contains 伪类，通过包含特定文本的标记名来选择元素。

2.4. 使用 CSS 选择器

方法	描述
soup.select(‘element’)	选择具有指定标记名称的所有元素。
soup.select(‘.class’)	选择具有指定类别的所有元素。
soup.select(‘#id’)	选择具有指定 ID 的元素。
soup.select(‘element.class’) soup.select(‘element#id’)	选择具有特定标记、ID 或类别的元素。
soup.select(‘element.class1.class2’)	选择具有指定多个类别的元素。
soup.select(‘element[attribute=”value”]’)	选择具有指定属性名和值的元素。
soup.select(“p nth-of-type(3)”)	选择第三个元素。
soup.select(“p > a:nth-of-type(2)”)	选择作为元素直接子元素的第二个元素。
soup.select(“#link1 ~ .sister”)	选择与 ID 为 "link1 "的元素同级的所有姐妹类元素。

2.5. 导航

方法	描述
element.find_next(tag)	查找并返回当前元素之后出现的第一个标记。
element.find_all_next(tag)	查找并返回在当前元素之后出现的所有标记。
element.find_previous(tag)	查找并返回当前元素之前第一次出现的标签。
element.find_all_previous(tag)	查找并返回当前元素之前第一次出现的标签。
element.find_parent(tag)	查找并返回标签在父元素中的首次出现。
element.find_all_parents(tag)	查找并返回标签在父元素中的所有出现次数列表。

如果您想深入了解各项任务的细节，请继续阅读。

3. 设置BeautifulSoup

3.1. 安装 BeautifulSoup4

BeautifulSoup 并不是 Python 发行版的内置模块，因此我们必须在使用前安装它。我们将使用 BeautifulSoup4 软件包（也称为 bs4）。

在 Linux 机器上安装

运行以下命令，利用系统软件包管理器在 Linux 上安装 bs4

sudo apt-get install python-bs4 (for python 2.x)
//or
sudo apt-get install python3-bs4 (for python 3.x)

如果使用系统打包程序安装失败，也可以使用 pip 或 easy_install 安装 bs4。

easy_install beautifulsoup4
//or
pip install beautifulsoup4

在 Windows 机器上安装

在 Windows 机器上安装 Beautifulsoup4 非常简单，使用以下命令即可完成安装

pip install beautifulsoup4

3.2. 安装解析器

请注意，BeautifulSoup 只是一个用于解析和导航 HTML 和 XML 文档的高级界面。它不能解析文档，而是依赖外部解析器来完成对文档结构的实际解析。

BeautifulSoup 默认支持 Python 标准库内置的 “HTML 解析器”，但它也能与许多其他独立的第三方 Python 解析器协同工作，如 lxml 解析器和 html5lib 解析器。

使用下面给出的命令安装 html5lib 或 lxml 解析器：

在 Linux 机器上

apt-get install python-lxml
apt-get insall python-html5lib

在 Windows 机器上

pip install lxml
pip install html5lib

一般来说，lxml 更擅长解析 “混乱” 或畸形的 HTML 代码。它很宽容，能修复未闭合的标记、嵌套不当的标记以及缺少 head 或 body 标记等问题。

虽然 lxml 比 html.parser 稍微快一些，但好的网页抓取代码一般都注重稳健、易读的实现，而不是巧妙的处理优化，因为网络延迟很容易让这些优化相形见绌。

和 lxml 一样，html5lib 也是一个宽容度极高的解析器，它能更主动地纠正损坏的 HTML。

4. 加载和解析网页，生成 Beautiful Soup 和请求模块

要抓取一个网页，我们必须先从其主机服务器上获取 HTML 或 XML 字符串，然后才能解析其内容。

例如，我们可以使用 Python 的 requests 库来获取网页的 HTML 内容。如果我们还没有安装 requests，请务必安装：

import requests

url = "http://books.toscrape.com/"
response = requests.get(url)

if response.status_code == 200:
    html_content = response.text
else:
    print("Failed to retrieve the webpage. Status code:", response.status_code)

现在，我们可以运行各种命令，从解析后的文本中获取精确数据。在本演示中，我们将使用网站 (http://books.toscrape.com/) 进行抓取。

现在我们有了网页的 HTML 内容，可以创建一个带有解析器的 BeautifulSoup 对象：

import requests
from bs4 import BeautifulSoup

url = "http://books.toscrape.com/"
response = requests.get(url)

if response.status_code == 200:
    html_content = response.text
else:
    print("Failed to retrieve the webpage. Status code:", response.status_code)

soup = BeautifulSoup(html_content, 'lxml')

print(soup.h1)
print(soup.h1.text)
print(soup.h1.string)

程序只输出页面上找到的第一个 h1 标签实例。

<h1>All productsh1>
All products
All products

请注意，使用 bs4 可以有多种路径到达 HTML 结构中的一个节点。事实上，以下任何函数调用都会产生相同的输出结果：

print(soup.html.body.h1)
print(soup.body.h1)
print(soup.html.h1)

5. 使用 BeautifulSoup 进行网络打包的基础知识

5.1. find() 和 findAll() 方法

在使用 BeautifulSoup 进行网页抓取的过程中，我们有两个方法 find() 和 findAll() 可以从解析的 HTML 文档中定位和提取特定的 HTML 元素。这些方法使得在 Python 中浏览和操作 HTML 数据变得非常容易。

find() 方法根据元素的名称 (标记)、属性、文本内容或它们的组合，定位并检索与指定条件相匹配的特定 HTML 元素的第一次出现。该方法会返回一个元素，如果没有找到匹配元素，则返回 None。
findAll() 方法会查找并返回与上述提供的条件相匹配的特定 HTML 元素的所有出现列表。它会返回一个匹配元素列表，如果没有找到匹配元素，则返回空列表。

find_all(tag, attributes, recursive, text, limit, keywords)

find(tag, attributes, recursive, text, keywords)

让我们举个例子。

from bs4 import BeautifulSoup

html = """
Hello, world!

    Item 1
    Item 2
    Item 3

"""

soup = BeautifulSoup(html, 'html.parser')

element = soup.find('p', class_='my-class')
print(element.text)  # Prints "Hello, world!"

items = soup.find_all('li')
for item in items:
  print(item.text) # Prints "Item 1" "Item 2" "Item 3"

5.2. 使用 CSS 选择器进行精细提取

CSS 选择器是一种模式，可根据属性和关系指定应选择页面上的哪些元素。我们可以使用 select 和 select_one 方法应用 CSS 选择器，并提取与选择器匹配的元素。

select 方法返回一个与 CSS 选择器匹配的所有元素的列表。如果没有元素匹配选择器，则返回空列表。
select_one 方法返回与 CSS 选择器匹配的第一个元素。如果没有元素匹配选择器，则返回 “无”。
我们可以使用这些方法从使用普通方法可能难以触及的元素中收集数据。

elements = soup.select_one(selector)

例如，要从选择器为 “div.col-sm-6.product_main > h1” 的元素中获取数据，我们将使用下面给出的代码。

selector = "div.col-sm-6.product_main > h1"

element = soup.select_one(selector)

element_text=element.text

if element:
    print("Element Text:", element_text)
else:
    print("Element not found on the page.")

程序输出：

Element Text: A Light in the Attic

5.3. 使用正则表达式

正则表达式是通过文本过滤数据模式的强大工具。BeautifulSoup 主要处理结构化 HTML，但与 regex 结合使用时，它可以改进从元素内容中收集数据的工作。

让我们通过下面的示例来了解这一点

import re

pattern = re.compile(r"(\d{3})-\d{3}-\d{4}")

phone_numbers = soup.find_all(text=pattern)

上面代码中给出的正则表达式(\d{3})-\d{3}-\d{4}) 正在查找格式为 "###-###-####"的电话号码，其中每个 "#"代表一位数字。因此，运行这段代码后，我们将得到 HTML 页面上的电话号码列表。

现在，假设我们想查看该网页上的所有价格，那么我们将使用下面给出的代码。

pattern = re.compile(r"£\d+\.\d{2}")
prices = soup.find_all(text=pattern)

if prices:
    for price in prices:
        print("Price:",price)
else:
    print("Element not found on the page.")

这段代码获取一个网页，解析其 HTML 内容，并使用正则表达式提取和打印所有格式为"£XX.XX "的价格。

Price: £51.77
Price: £51.77
Price: £51.77
Price: £0.00

6. 实际网络抓取

让我们看看上述命令的几个示例，了解它们的运行情况。

6.1. 查找所有标题

我们可以通过以下代码查找 HTML 文档中的所有标题。

soup = BeautifulSoup(html_content, 'lxml')

headings = soup.find_all(['h1','h2','h3','h4','h5','h6'])

# Iterate over the headings and print their text
for heading in headings:
    print(heading.text)

6.2. 抓取表格和结构化数据

在处理表格等结构化数据时，BeautifulSoup 的导航和数据提取功能仍然非常有用。要仔细提取表格数据，我们可以专注于特定的单元格和行。

让我们通过一个例子来了解语法和流程：

table = soup.find("table")

for row in table.find_all("tr"):
    cells = row.find_all("td")
    for cell in cells:
        print(cell.text)

上述代码将找出 HTML 表格，然后遍历每一行及其单元格。提取每个单元格的内容后，将其打印到控制台。

让我们通过一个示例来更好地理解这一点：

table = soup.find("table")

if table:
    for row in table.find_all("tr"):
        cells = row.find_all("th")
        cells += row.find_all("td")
        for cell in cells:
            print(cell.text)
else:
    print("Table not found on the page.")

程序输出：

UPC
a897fe39b1053632

Product Type
Books

Price (excl. tax)
£51.77

...

6.3. 抓取图片和媒体文件

尽管 BeautifulSoup 主要用于解释 HTML，但我们仍然可以从照片等媒体资产中提取数据。

让我们举另一个例子来更清楚地理解这一点。现在，假设我们想把网页上的一个图像下载到本地磁盘，那么我们将使用下面给出的代码：

from bs4 import BeautifulSoup
import requests
import os
from urllib.parse import urljoin  # Import the urljoin function

# Define the URL of the web page you want to scrape
base_url = "http://books.toscrape.com/catalogue/a-light-in-the-attic_1000/index.html"
url = base_url

# Send an HTTP GET request to the URL
response = requests.get(url)

# Check if the request was successful (status code 200)
if response.status_code == 200:
    html_content = response.content
else:
    print("Failed to retrieve the web page. Status code:", response.status_code)
    exit()

# Create a BeautifulSoup object to parse the HTML content
soup = BeautifulSoup(html_content, 'html.parser')

image_tags = soup.find_all("img")

if image_tags:
    for img in image_tags:
        img_url_relative = img.get("src")
        
        # Construct the complete URL by joining the relative path with the base URL
        img_url_absolute = urljoin(base_url, img_url_relative)
        
        img_response = requests.get(img_url_absolute)
        if img_response.status_code == 200:
            # Generate a unique filename based on the image URL
            img_filename = os.path.basename(img_url_absolute)
            with open(img_filename, 'wb') as fp:
                fp.write(img_response.content)
                print(f"Image '{img_filename}' downloaded and saved.")
        else:
            print("Failed to download image from URL:", img_url_absolute)
else:
    print("No image tags found on the page.")

该代码提取该图片的相对 URL，并将其与基本 URL 结合，创建一个完整的图片 URL。向这些 URL 发送 HTTP 请求后，它会检查响应的状态代码是否为 200（表示成功）。

如果成功，它就会以唯一的文件名将图片保存到本地目录，并打印下载图片的信息。如果图像下载失败，则会打印一条错误信息。如果网页上没有图像标记，则会显示一条提示信息。这段代码的目的是从网页中抓取并下载图片以供进一步使用。

输出：

Image 'fe72f0532301ec28892ae79a629a293c.jpg' downloaded and saved.

6.4. 处理缺失元素和错误

抓取时搜索的元素有时可能不存在。为了解决这个问题，我们可以使用条件语句或返回 find() 方法的结果来防止出错。

element = soup.find("text")

if element:
    print(element.text)
else:
    print("Element not found")

数据提取中的挑战

现在，让我们来讨论一些在网络刮擦中经常出现的挑战。

7.1. 带 JavaScript 和动态内容的网站

从包含动态内容的网站提取数据可能比较棘手，因为这些网站通常使用 JavaScript 来加载和更新信息。事实上，BeautifulSoup 并不理解 JavaScript，这给标准的网络搜刮造成了障碍。

异步请求（即在初始页面加载后加载数据）会使数据捕获变得更加复杂。此外，浏览复杂的网页结构以及处理身份验证、验证码和速率限制等任务也带来了挑战。网站可能会经常更改布局，这就要求不断更新刮擦脚本。法律和道德方面的问题也会产生影响，因为刮擦动态网站可能会违反服务条款和版权法。

为了应对这一挑战，有各种解决方案和库可供使用。

例如，Selenium 或 Puppeteer 等Headless浏览器可以呈现 JavaScript 驱动的内容并与网页交互。当标准 HTML 解析能力不足时，它们就能派上用场。我们还可以使用 Selenium 来显式等待和处理初始页面加载后动态加载的内容。

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

element = WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.ID, "my_element")))
data = element.text

7.2. 处理分页和无限滚动

想象一下网页上一长串项目。分页表示有多个页面的项目，您需要一页一页地浏览才能获得所有数据。无限滚动意味着当你向下滚动时会不断出现新的项目，你必须不断滚动才能收集到所有数据。这就好比要从不断移动的传送带上收集所有的糖果。

传统的网络搜索工具可能无法胜任这一工作。要解决这个问题，您需要了解网站工作原理的定制工具。这些工具可以模仿你滚动和翻阅页面的动作。它们还能确保不会重复收集相同的糖果。

为了应对这一挑战，有各种解决方案和库可供使用，如 Scrappy、Selenium 等。

import requests
from bs4 import BeautifulSoup

url = "https://example.com/api/data"
headers = {"User-Agent": "BrowserAgent"}
params = {"param1": "value1", "param2": "value2"}

response = requests.get(url, headers=headers, params=params)

if response.status_code == 200:
    # If the response is JSON, parse it directly
    data = response.json()

    # If the response is HTML, parse it with BeautifulSoup
    soup = BeautifulSoup(data, 'html.parser')
    # Now, you can navigate and extract data from 'soup'

#7.3. 需要身份验证的网站

从需要用户身份验证的网站提取数据会遇到各种障碍。首先，要进入网站内容就必须进行用户身份验证管理，包括提交用户名和密码等登录信息。这可能是一个复杂的安全自动化过程。认证成功后，必须保持会话状态并处理 cookie，以便访问网站的受保护区域。

此外，可能还需要应对速率限制、验证码测试或多因素身份验证（MFA）方法等挑战，从而增加了复杂性。此外，经过身份验证的页面结构往往与可公开访问的页面有很大不同，因此有必要调整刮擦脚本。

最后，考虑法律和道德方面的问题也很重要，因为对经过验证的网站进行刮擦可能会违反服务条款或隐私法规。因此，需要谨慎合规和符合道德规范的数据使用方法。

为了应对这一挑战，我们可以使用 Python 中的请求库来管理身份验证、会话控制和 Cookie 持久性。

import requests

url = 'https://example.com/login'
payload = {'username': 'your_username', 'password': 'your_password'}

# Perform authentication
session = requests.Session()
response = session.post(url, data=payload)

if response.status_code == 200:
    # You are now authenticated and can make requests as an authenticated user

7.4. 处理速率限制

为了避免收到来自一个 IP 地址的过多请求，网站经常使用速率限制技术。在收集数据时处理速率限制有点像在自助餐厅里一次只能吃一盘菜，而且要等一会儿才能吃到更多。同样，有些网站为了避免出现问题，会放慢收集数据的速度。

你需要慢慢收集数据，必要时休息一下，并考虑到网站的资源。这可能意味着在两次数据请求之间要等待一段时间，并留意是否有任何迹象表明你收集数据的速度过快。关键是要找到合适的节奏，既能获得想要的数据，又不会造成任何问题。

我们可以使用 time.sleep() 函数在请求之间引入延迟。这是一种确保不超过允许请求速率的简单方法。

import requests
import time

max_retries = 3
retry_delay = 5  # Wait for 5 seconds between retries

for _ in range(max_retries):
    response = requests.get('https://example.com')
    if response.status_code == 200:
        # Process the response
    elif response.status_code == 429:
        time.sleep(retry_delay)
    else:
        break  # Exit the loop on other status codes

8. 道德方面的考虑

8.1. 理解网站服务条款

在抓取任何网页之前，必须阅读并理解其所有服务条款或使用条件。虽然有些网站的协议明确不鼓励抓取，但其他网站可能会有特别的建议或限制。请始终遵守这些规则，以确保良好的行为。

8.2. Robots.txt 和尊重网站权限

Robots.txt 文件通常被网站用来与网络爬虫交互，并指明网站中禁止抓取和刮擦的特定区域。在抓取网站之前，查看网站的 robots.txt 文件至关重要。遵守 robots.txt 允许的准则是对网站意愿的尊重。

8.3. 爬虫礼貌和避免过度请求

对爬虫的尊重包括发送可接受的请求，以避免给网站服务器造成压力。如果在短时间内向网站服务器发送过多请求，网站的性能可能会受到影响。如果要确保刮擦活动不令人讨厌，可以使用延迟和节流等策略。

8.4. 数据隐私和用户同意

在使用用户输入的信息进行网站搜刮时，要注意安全问题。确保不违反任何隐私规则，避免在获得适当同意之前收集个人信息。符合道德规范的网站搜刮实践必须始终尊重数据的保密性。

8.5. 在请求标题中发送您的姓名和电子邮件

如果您的抓取活动导致出现任何问题，只要您在请求标题中包含您的电子邮件地址和姓名，网站管理员就能识别您的身份并与您联系。这种开放性鼓励了合乎道德和可接受的网络抓取。

9. 常见问题

9.1. ImportError “No module named HTMLParser“（没有名为 HTMLParser 的模块）

在 Windows 上，您可能会遇到以下错误

ImportError “No module named HTMLParser”- 该错误表示您正在 Python 3 下执行 Python 2 版本的代码。
ImportError “No module named html.parser”（没有名为 html.parser 的模块）——这个错误表示您正在 Python 2 下执行 Python 3 发布的代码。
解决上述两个问题的唯一方法是完全卸载之前的安装，然后重新安装 BeautifulSoup。

9.2. Invalid Syntax: ROOT_TAG_NAME = u’[document]’（无效语法：ROOT_TAG_NAME = u’[document]’）

如果您在 ROOT_TAG_NAME = u’[document]'这一行收到了语法错误，即 “语法无效”，您必须将 Python 2 代码更改为 Python 3，下载 python3 软件包即可。

python3 setup.py install

或运行 Python 在 bs4 目录中的 2 到 3 转换代码，方法是使用

2to3-3.2 -w bs4

10. 结论

我们已经从网络抓取的经验中掌握了数据提取的基础知识。为了高效地解析和提取数据，我们使用了 BeautifulSoup 和 CSS 选择器。考虑到道德方面的细微差别，如关注 robots.txt、遵守网站协议和保护数据隐私等，这些都凸显了遵循道德来使用这项技术。网络搜索的未来将以创造力、技术和合乎道德的数据处理为特征。

随着技术的发展，同时要适应不断变化的网络技术和规章制度所带来的困难，网络搜索对于从庞大的数字生态系统中获得洞察力至关重要。

学习愉快！

你可能感兴趣的:(Python,python,开发语言)

Python环境管理新利器：UV工具详解云水木石 python uv 开发语言
Python包和环境管理最好的工具无疑是Anaconda，但我在之前的一篇文章《注意，使用这款Python软件可能会带来麻烦》写过，个人使用完全没有问题。如果在公司内使用，就需要格外小心，可能会招来官司。在我们公司，Anaconda（包括Miniconda）就是禁止安装的软件之一。但是在工作中，确实又存在需要切换不同Python版本的需求，比如编译Chromium需要Python3.8以上的版本，
Python新手入门 python流程控制基础1——条件语句if~~else；if~elif~else；不爱纸片人 python
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、条件语句是什么？二、语句使用方法1.if.....2.if.......elif......3.if.......elif......else.......总结一、条件语句是什么？在Python中，条件语句用于根据不同的条件执行不同的代码块二、语句使用方法一共有三种if…if’…elif…if…elif…else…1.if
使用 NetworkX 进行图论分析与可视化 aiweker 跟我学python 图论 python
使用NetworkX进行图论分析与可视化NetworkX是一个用于创建、操作和研究复杂网络的Python库。它提供了丰富的图论算法和数据结构，适用于各种网络分析任务。本文将分点介绍NetworkX的主要功能，并通过代码示例进行详细说明。1.安装NetworkX在开始使用NetworkX之前，首先需要安装它。可以通过pip进行安装：pipinstallnetworkx2.创建图NetworkX支持多
使用 UV 管理 Python 项目 | python小知识 aiweker 跟我学python uv python 人工智能
使用UV管理Python项目|python小知识1.引言在Python开发中，项目管理工具是必不可少的。常见的工具如pip、pipenv、poetry等，它们各有优缺点。近年来，uv作为一个新兴的Python项目管理工具，逐渐受到开发者的关注。uv旨在提供更快的依赖解析和安装速度，同时保持与现有工具的兼容性。本文将详细介绍uv的功能和应用场景，并通过代码示例展示其使用方法。最后，我们将对比uv与其
Python 常用内建模块-HTMLParser 赔罪 Python 系统学习 python 开发语言
目录HTMLParser小结练习HTMLParser如果我们要编写一个搜索引擎，第一步是用爬虫把目标网站的页面抓下来，第二步就是解析该HTML页面，看看里面的内容到底是新闻、图片还是视频。假设第一步已经完成了，第二步应该如何解析HTML呢？HTML本质上是XML的子集，但是HTML的语法没有XML那么严格，所以不能用标准的DOM或SAX来解析HTML。好在Python提供了HTMLParser来非
Python 常用内建模块-venv 赔罪 Python 系统学习 python 开发语言
目录venv小结venv在开发Python应用程序的时候，系统安装的Python3只有一个版本：3.x。所有第三方的包都会被pip安装到Python3的site-packages目录下。如果我们要同时开发多个应用程序，那这些应用程序都会共用一个Python，就是安装在系统的Python3。如果应用A需要jinja2.7，而应用B需要jinja2.6怎么办？这种情况下，每个应用可能需要各自拥有一套“
python Qt Solkatt's
最近帮朋友做了一个将文本文件按条件导出到excel里面的小程序。使用了PyQT，发现Python真是一门强大的脚本语言，开发效率极高。首先需要引用fromPyQt4importQtGui,uic,QtCore很多控件像QPushButton是从QtGui的空间中得来的，下面def__init__(self,parent=None)中定义了界面的设计及与控件相互联系的方法。classAddressB
pyspark学习rdd处理数据方法——学习记录亭午学习
python黑马程序员"""文件，按JSON字符串存储1.城市按销售额排名2.全部城市有哪些商品类别在售卖3.上海市有哪些商品类别在售卖"""frompysparkimportSparkConf,SparkContextimportosimportjsonos.environ['PYSPARK_PYTHON']=r"D:\anaconda\envs\py10\python.exe"#创建Spark
实时光线追踪技术：Ray Tracing_2024-07-21_02-55-16.Tex chenjj4003 游戏开发 python 算法人工智能矩阵线性代数骨骼绑定开发语言
实时光线追踪技术：RayTracing实时光线追踪技术教程基础知识光线追踪原理光线追踪是一种渲染技术，它通过模拟光线在场景中的传播和反射来生成图像。在实时光线追踪中，这一过程被优化以在有限的时间内完成，通常用于游戏和实时动画。其核心原理是逆向追踪，即从观察者（摄像机）发出光线，而不是从光源发出，这样可以减少计算量。示例：光线追踪的基本算法#Python示例代码，展示如何计算光线与场景中物体的交点c
PyQt和PySide的区别和比较 PgosOcaml pyqt mfc c++
PyQt和PySide的区别和比较PyQt和PySide是两个用于创建图形用户界面(GUI)的Python库。它们都是基于Qt框架，Qt是一个跨平台的应用程序和UI开发框架。本文将介绍PyQt和PySide之间的区别和比较，并提供相应的源代码示例。开发者许可证：PyQt的开发者许可证是商业许可证，因此如果您想在商业项目中业项目中使用PyQt，您需要购买相应的许可证。而Py业项目中使用PyQt，您需
Python 错误处理赔罪 Python 系统学习 python 开发语言
目录try调用栈记录错误抛出错误练习小结在程序运行的过程中，如果发生了错误，可以事先约定返回一个错误代码，这样，就可以知道是否有错，以及出错的原因。在操作系统提供的调用中，返回错误码非常常见。比如打开文件的函数open()，成功时返回文件描述符（就是一个整数），出错时返回-1。用错误码来表示是否出错十分不便，因为函数本身应该返回的正常结果和错误码混在一起，造成调用者必须用大量的代码来判断是否出错：
【Python Qt 基本概念】深入探讨 PySide6 与 PyQt6：选择、共存与最佳实践泡沫o0 Qt应用开发 -探索Qt的魅力与实践 Python 基础教程 mfc c++qt 开发语言 python 嵌入式 linux
目录标题第一章:Python绑定的Qt库——PySide6与PyQt6的比较1.1PySide6与PyQt6的基本介绍1.1.1PySide6：Qt官方推荐的Python绑定1.1.2PyQt6：成熟的第三方Python绑定1.1.3主要差异：许可证1.2两者的相似性与差异性1.2.1功能和性能差异1.2.2API差异与兼容性1.3总结：选择的自由与责任第二章:在VSCode中使用PySide6与
《AI大模型趣味实战》第8集：多端适配个人新闻头条基于大模型和RSS聚合打造个人新闻电台(Flask WEB版) 2 带娃的IT创业者 AI大模型趣味实战人工智能 flask 前端
《AI大模型趣味实战》第8集：多端适配个人新闻头条基于大模型和RSS聚合打造个人新闻电台(FlaskWEB版)2摘要本文末尾介绍了如何实现新闻智能体的方法。在信息爆炸的时代，如何高效获取和筛选感兴趣的新闻内容成为一个现实问题。本文将带领读者通过Python和Flask框架，结合大模型的强大能力，构建一个个性化的新闻聚合平台，不仅能够自动收集整理各类RSS源的新闻，还能以语音播报的形式提供"新闻电台
LeetCode剑指offer题目记录3 t.y.Tang LeetCode记录学语言 c++leetcode 哈希算法
leetcode刷题开始啦,每天记录几道题.目录剑指offer05.替换空格题目描述思路pythonC++剑指offer06.从尾到头打印链表题目描述思路1python思路2pythonC++剑指offer05.替换空格题目描述让我们实现一个函数,把字符串s中的每个空格替换为%20.思路这个题目我只能想到遍历,在空间控制上应该有原地修改的办法会省一些.python如果用python,那直接用spl
Python 中的 Iterable、Iterator 与生成器 CavenWang python python 开发语言
Python中的Iterable、Iterator与生成器Iterable（可迭代对象）Iterator（迭代器）生成器（Generator）Iterable、Iterator与生成器的关系实际应用生成器的高级用法（send()）总结在Python中，Iterable、Iterator和生成器是三个密切相关的概念，它们都与迭代操作有关，但各自扮演不同的角色。本文将深入探讨它们的定义、区别以及实际应
Python Lambda 函数详解 2201_75491841 python 开发语言 lambda函数
一、引言在Python编程中，我们经常会遇到一些简单的函数，这些函数可能只在某个特定的地方使用一次，而且逻辑非常简单。如果为了这些简单的功能定义一个常规的函数，不仅会增加代码的冗余，还会使代码结构变得不够简洁。这时，lambda函数就派上用场了。lambda函数也被称为匿名函数，它为我们提供了一种简洁的方式来定义小型的、一次性使用的函数。在本文中，我们将深入探讨Python中的lambda函数，包
小白学AI量化：DeepSeek+Python构建强大的金融数据挖掘与多维分析机器人老余捞鱼 AI顾投高级策略 AI探讨与学习人工智能 python 金融 deepseek
作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：在机构主导的量化交易时代，普通投资者如何用一杯奶茶的钱（15元/天）打造专业级智能量化产品？本文将为您揭秘一个革命性的解决方案——基于国产大模型DeepSeek和Python构建的智能数据挖掘分析机器人。它不仅适用于通用网页数据抓取，更能深度应用于金融领域，精准捕捉市场信号。本文“干货”很多，请务必耐心读完。一、颠覆认知的性价比革命1.
python processpoolexecutor_Python多进程解决方案multiprocessing ProcessPoolExecutor weixin_39599046 python
大多数编程语言都会有多线程和多进程的概念，至于线程和进程的概念，大家可以百度一下。作为一门胶水语言，Python毫不意外，也可以利用多线程和多进程处理并发问题，但是多线程由于GIL的存在，起作用范围大打折扣，仅限于在IO等场景可以发挥点作用。所以，今天要跟大家分享的是Python多进程方案，更好地利用系统多核，从而提升性能。基础方案一：利用Process新建一个子进程，在子进程执行任务。我们写一个
python processpoolexecutor_Python线程和进程池并行编程三千香蕉三千 python
Python3.2版本之后发布了concurrent.futures模块，用以支持和管理并发编程，内容涵盖了进程和线程池(ThreadandProcessPooling)、非确定性执行流(NondeterministicExecutionFlows)以及进程和线程同步。本文通过将带有可选参数的任务提交(Submit)给执行器(Executor)来实例化futures对象。执行器是线程或者进程执行池
python 底层原理processpoolexecutor_Python 并发编程：PoolExecutor 篇风投小虾 python
个人笔记，如有疏漏，还请指正。使用多线程(threading)和多进程(multiprocessing)完成常规的并发需求，在启动的时候start、join等步骤不能省，复杂的需要还要用1-2个队列。随着需求越来越复杂，如果没有良好的设计和抽象这部分的功能层次，代码量越多调试的难度就越大。对于需要并发执行、但是对实时性要求不高的任务，我们可以使用concurrent.futures包中的PoolE
机器学习实战第一章机器学习基础 LuoY、 Machine Learning 机器学习算法人工智能
第一章机器学习1.1何谓机器学习1.2关键术语1.3机器学习的主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤1.6Python语言的优势1.1何谓机器学习 1、简单地说，机器学习就是把无序的数据转换成有用的信息； 2、机器学习能让我们自数据集中受启发，我们会利用计算机来彰显数据背后的真实含义； 3、机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的
数据挖掘实战-基于机器学习的垃圾邮件检测模型艾派森数据挖掘实战合集数据挖掘机器学习人工智能 python
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
conda篇----在已有conda环境的基础上升级python包心惠天意 conda python jvm
conda篇----在已有conda环境的基础上升级python包原先的python版本第一步：condaupdate--all(py11)[xxx@aivrs01xxx]$condaupdate--allCollectingpackagemetadata(current_repodata.json):doneSolvingenvironment:done==>WARNING:Anewervers
conda：一个当下最流行的Python虚拟环境工具 Wang_AI
点击上方“AI派”，选择“设为星标”最新分享，第一时间送达！作者：LeonWang，现为中科院特别研究助理(博士后)，在AI、数据科学和科学计算等方面相关的工程实践上积累了丰富的经验。编辑：王老湿前面的文章中，为大家介绍过Python下的虚拟环境和包管理。在实际中，更为流行的是用Conda来管理Python环境。今天这篇文章就为大家介绍这方面的相关内容。Conda环境Conda简介Conda是目前
轻松上手：Matplotlib的基本用法全知道大数据方向陪跑私教 python
《轻松上手：Matplotlib的基本用法全知道》嗨，小伙伴们！之前咱们了解了好多厉害的Python包，今天咱们来好好讲讲Matplotlib这个在数据可视化方面超棒的包。**Matplotlib到底该怎么用呢？**这就像是探索一个新的游乐场，每个功能都是一样好玩的项目。一、安装Matplotlib在开始使用Matplotlib之前，得先把它安装好。如果你已经安装了Python的包管理工具pip，
Python 高手编程系列一千七百零八：在事件循环中使用 executors 杨琴1 python 开发语言
Executor.submit()方法返回的Future类实例在概念上非常接近异步编程中使用的协程。这就是为什么我们可以使用执行器在协同多任务和多进程或多线程之间进行混合。此解决方法的核心是事件循环类的BaseEventLoop.run_in_executor(executor,func,*args)方法。它会在进程池或线程池中调度执行由executor参数表示的func函数。这个方法最重要的是它
conda将python低版本环境升级到高版本 dkgee conda python 开发语言
conda将python低版本环境3.7.16升级到高版本3.81.激活你的Conda环境2.升级Python版本3.验证升级4.处理依赖问题5.测试环境注意事项可以将Conda环境中的Python版本从3.7.16升级到3.8。以下是具体步骤：1.激活你的Conda环境首先，你需要激活你想要升级Python版本的环境。假设你的环境名为myenv，你可以使用以下命令激活它：condaactivat
python 爬取某乎某选全部内容路笑笑
在发布了python爬取知乎盐选文章内容后，没想到居然这么快就要更新新的内容了。在下午思考第一篇python爬取知乎盐选文章内容的时候，其实就把自动爬取目录内的其他内容的方法想出来了，但是本来没想这么快更新的，哈哈。不过思来想去还是发出来吧，毕竟要不哪天就忘了。fromDecryptLoginimportloginfrombs4importBeautifulSoupimportreimportba
（含import）两行代码，将ppt的每一页幻灯片保存为图片。（如果你没装office，只装了WPS也可以，只不过更麻烦一些）几道之旅人工智能智能体及数字员工 powerpoint wps
文章目录第一步:安装包第二步：写代码，运行第三步：如果你是Office，现在已经搞定了。但我是WPS，会报错：第四步：直接去包里改代码第五步：保存对包中代码的修改，重新运行咱最开头的代码第六步：成功了第一步:安装包pipinstallpython-office第二步：写代码，运行#安装库：pipinstallpython-officeimportoffice#单页转图片office.ppt.ppt
Python知识分享第十四天闵少搞AI python 开发语言
“”"1.面向对象相关概述概述面向对象是一种编程思想强调的是以对象为基础完成的各种操作它是基于面向过程的扩展Python中是同时支持面向对象和面向过程这两种编程思想的思想特点更符合人们的思考习惯把复杂的问题简单化把人们(程序员)从执行者变成了指挥者2.面向对象三大特征介绍封装继承多态封装概述封装就是隐藏对象的属性和实现细节仅对外提供公共的访问方式举例:插板电脑手机好处提高代码的安全性弊端代码量增加
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f