阿拉丁吃米粉

利用Networkx分析历年数学家间继承关系与数学学科发展

本作品采用知识共享署名-非商业性使用-禁止演绎 3.0 中国大陆许可协议进行许可。

介绍

Mathematics Genealogy Project是一个面向网络收集数学家家谱资讯的网站。网站上资料来源于该项目自身搜集与网友提供。资料包括数学家的学生，数学家的导师，毕业年份，毕业学校，国籍，研究领域等。目前收集到的资料将近20万笔，并且还在不断增加中。

我们从该网站上抓取所有（实际上并不是所有的）的数学家资料并绘制成网络图，旨在分析数学界中的聚类情况与师生间继承关系；同时还可研究数学科学的发展历程以及数学教育与国家经济发展和时代发展的关系，期望以这样的资料分析科学发展的模式和轨迹（实际并没有这么高大上）。

资料收集

所有的数学家资料是一棵树的结构，也可以用图表示，一个数学家就是一个节点。因此从一个数学家开始，遍历该数学家所有的学生以及他的导师，然后针对他的导师和每一个学生再重复上述步骤，与深度优先遍历类似。首先使用一个队列存储所有待遍历的节点（数学家），以此获取他的学生列表，导师列表，国籍，毕业学校，毕业年份，研究领域等。然后不断重复上述过程，直到队列为空为止。

资料收集过程使用python语言，使用了bs4和selenium来crawl资料，使用了networkx来构造图。定义了一个类Scientst来存储节点的属性。完整的代码见最后。

资料分析

最后收集了1871~2010年间的数学家关系图，原始数据一共64019个点。但有些节点缺少年份和国籍信息，最后分析时过滤掉没有年份属性和国家属性的数据，以每十年为一个阶段分析。下面选取几个时段进行分析。

1871-1890年

网络图如下图所示。箭头连接的两个节点表示两个数学家是师生关系，箭头指向的节点表示这个数学家是学生。此时德国在数学界的发展雄霸天下。

图中红色表示德国，绿色是波兰（只有一个点），蓝色是美国。

1871-1900年

此时正值一战前夕，德国数学家的比例仍占绝对优势，也可以看到一些德国数学家是某些美国数学家的指导教授。有趣的是后来国际数学学科的中心渐渐由德国偏向美国，而一些美国数学家的导师是德国人，或者说是后来很多德国数学家都移民去了美国？

1871-1910年

一战前的十九世纪末期，产生了集合论形成了现代数学的基础。德国数学家D. Hilbert提出了著名的23个问题，几乎左右了本世纪数学发展的进程。其中大约有三分之二以解决或基本解决的问题都伴随着一个个新学科的发展。

如下图所示，上图是该时期的数学家图谱，下图是该图betweenness示意图，节点越大表示betweenness值越大。本时期的核心人物就是D. Hilbert，Klein (克莱因)和Minkowsiki (闵科夫斯基)。闵科夫斯基就是betweenness图中最大的节点。

betweenness示意图：

1871-1920年

该时期恰逢一战爆发。图中绿色节点表示德国，红色是美国。betweenness图中节点最大的数学家名叫C.L. Ferdinand Lindemann，同时他也是这段时期所带学生最多的数学家，学生数量为45个，该记录直到1960年之后才被美国数学家打破。如下表所示。

表1：各时段各数学家学生数量

out-degree	1871~1900	1871~1910	1871~1920	1871~19300	1871~1940	1871~1950	1871~1960	1871~1970	1871~1980	1871~1990	1871~2000	1871~2010
largest out-degree	12	35	43	45	45	45	45	51	63	65	65	105
largest out-deg. name	C.L. Ferdinand Lindemann	C.L. Ferdinand Lindemann	C.L. Ferdinand Lindemann	C.L. Ferdinand Lindemann	C.L. Ferdinand Lindemann	C.L. Ferdinand Lindemann	C.L. Ferdinand Lindemann	Patrick Ledden(US)	David Blackwell	David Blackwell	David Blackwell	C.C.Jay Kuo

可以清楚看到这段时期C.L. Ferdinand Lindemann的学生都是的国人，但其学生的学生有外国人（蓝色节点）。而之前提到的D. Hilbert就是C.L. Ferdinand Lindemann的学生。

betweenness示意图：

1871-1930年

一战结束，百废待兴。1920~1930年十年间，betweenness最大的数学家被Maxime Bocher取代。Maxime Bocher的betweenness最大的记录一直到1980年之后才被美国数学家Joseph Doob打破。如下表所示：

表2：各时段betweenness

betweenness	1871~1900	1871~1910	1871~1920	1871~19300	1871~1940	1871~1950	1871~1960	1871~1970	1871~1980	1871~1990	1871~2000	1871~2010
largest betweenness			1355	3560	3560	7994	26152	93587	198013	337041	679789
largest btw. name			C.L. Ferdinand Lindemann	Maxime Bocher	Maxime Bocher	Maxime Bocher	Maxime Bocher	Maxime Bocher	Maxime Bocher	Joseph Doob	Joseph Doob	Joseph Doob

可推断假设，当所带学生群体中有外国人时，该节点的betweenness将有机会提升。根据该网络图的特性，betweenness比较高的节点可能有以下两个原因：

数学家所带学生中又有很多学生成为大学教授，进而形成若干小团体
数学家所带的学生有外国学生，如此该节点就有机会与其他国家的小团体相连

因此，某种程度而言，betweenness可以代表一个数学小圈子的繁荣状况。

1871-1940年

从图中可以看出，学成后一些美国数学家又带了很多美国学生，进而在最后提升了美国数学家人数所占之比例。

这个时期，美国数学家所占比例与德国数据学家人数比例逐渐缩小。推断：因为希特勒上台，德国政局动荡，使得大批德国数学家赴美，再加上之前德国数学家所带的美国学生，使得美国数学家数量可以赶超德国（？）；或者，当时德国在集权统治下，有由于战争需要，科学发展繁荣，使得大批美国赴德学习（？）。但无论何种原因，此时恰逢二战爆发，世界数学中心开始由德国向美国转移。

1871-1960年

这个时期第三次科技革命开始，加剧了资本主义各国之间发展的不平衡，使资本主义各国的国际地位发生了新的变化。并且社会主义国家在与西方资本主义国家抗衡的斗争中，贫富差距逐渐拉大，促进了世界范围内社会生产关系的变化。

或许近现代数学的开端是在德国，或是德国家里了系统的近现代数学体系？而后被美国反超，而且德国被远远甩在美国后面。

1871-2000年

此时美国数学家比例已经占绝对优势。

1871-2010年间数学家数量变化

下图是1871至2010年之間每隔10年的結點數量曲線圖。由圖可知該網站收錄的數學家呈指數遞增。表明數學學科的發展越來越繁榮，也越來越細分。

中国数学家情况

该网站上收录的中国数学家共135个（抓取的数量），占全世界的比例相当少。想必是大部分中国数学家后来都已转国籍。如下图，不同颜色表示不同的毕业学校。

台湾数学家

台湾数学家一共60个（抓取的数量），大部分毕业于台湾大学。从图上看中国和台湾两个地区的数学家都喜欢单打独斗，基本没有形成一个完整的社群网络。而且基本都毕业与台湾的学校。而实际上台湾知名院校的教授几乎都有留学经历，因此该部分值得进一步讨论。

缺陷

该分析作为一个简单的研究实例，实际上有许多缺陷

betweenness的选择。实际上数学家关系图应该是一个有向图，但是有向图的betweenness并不容易分析。因此在分析中betweenness的计算均是基于无向图的计算
有些数据未能抓取到国籍与年份信息，也未能抓取该网站的所有数据，造成数据集不完整，影响分析。
不同年代的网络尺度不同，对closeness与betweenness进行归一化比较恰当。但是归一化后会出现多个最大值一样的情况，给分析造成不便，考虑到并没有进行横向比较，因此最后没有计算归一化的值

资料抓取代码python

版本：python 2.7

# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
from selenium import webdriver
import urllib2
import time
from collections import deque # 隊列
import networkx as nx
#import matplotlib.pyplot as plt 
from networkx.readwrite import json_graph
import json

t = time.time()
today = str(time.strftime('%m/%d', time.localtime(t)))
spans = list()
titles = list()
hrefs = list()
sciDict = {} # 空字典，用於存放整個scientist的網絡結構，key為id


baseUrl = "http://genealogy.math.ndsu.nodak.edu/"
# seedID = 'id.php?id=7298' # 從David Hilbert開始
seedID = 'id.php?id=17946' # 從Gustav Peter Lejeune Dirichlet開始，測試從不同的人開始中心性的排序是否會有所不同


class Scientst(object):
    """docstring for Scientst"""
    def __init__(self):
        self.idURL = ""
        self.name = ""
        self.year = ""
        self.num = ""
        self.country = ""
        self.school = ""



def readPage(url):

    webURL = urllib2.urlopen(baseUrl + url)
    content = webURL.read()
    soup = BeautifulSoup(content)
    return soup

def readPage2(scientistID):

    webURL = urllib2.urlopen(baseUrl + scientistID)
    content = webURL.read()
    soup = BeautifulSoup(content)
    return soup


def isEighteen(soup):

    return soup.find(True, {'class':['over18-notice']})


def clickSubmit(board):

    driver = webdriver.Firefox()
    driver.get("https://www.ptt.cc/bbs/" + board + "/index.html")
    button = driver.find_element_by_class_name('btn-big')
    button.click()
    soup = BeautifulSoup(driver.page_source)
    driver.quit()
    return soup


def getDivInformation(div):
    span = div.findChildren('span')[0].text
    try:
        if int(span) >= 80 and len(div.findChildren('a')) > 0:
            href = div.findChildren('a')[0].attrs['href']
            title = div.findChildren('a')[0].text
            spans.append(int(span))
            titles.append(title)
            hrefs.append(href)
    except:
        if len(div.findChildren('a')) > 0:
            href = div.findChildren('a')[0].attrs['href']
            title = div.findChildren('a')[0].text
            spans.append("爆")
            titles.append(title)
            hrefs.append(href)

# 獲取一個scientist頁面中該scientist的信息
# 其它信息很難取，先取國家
def getSciInfo(idURL):
    country = ""
    year = ""
    soup = readPage(idURL)
    divs = soup.findAll('div', {"id": "paddingWrapper"})
    if len(divs) > 0:
        img = divs[0].findChildren('img')
        if len(img) > 0:
            country = img[0]['title']
        else:
            country= ""
        spans = divs[0].findChildren('span')
        if len(spans) > 0:
            year = spans[0].text
            year = year[-4:] # 年份為text的最後四位
    else:
        country = ""
        year = ""

    sciItem = Scientst()
    sciItem.country = country
    return sciItem

def getCountry(idURL):
    country = ""
    soup = readPage(idURL)
    img = soup.findAll('div', {"id": "paddingWrapper"})
    if len(img) > 0:
        img2 = img[0].findChildren('img')
        if len(img2) > 0:
            country = img2[0]['title']
        else:
            country= ""
    else:
        country = ""

    return country

# 在學生的頁面找該學生的advisor，因此傳入學生的id
def findAllAdvisor(idURL):
    advList = list()

    soup = readPage(idURL) # 打開這個學生的頁面，advisor在該學生的頁面中
    divs = soup.findAll('div', {"id": "paddingWrapper"})
    if len(divs) > 0:
        advisorPras = divs[0].findChildren('p') # 有很多個p
        for advisorP in advisorPras:
            advisorTag = advisorP.text
            if "Advisor" in advisorTag : # 多個advisor都在同一個p標籤下
                advisorA = advisorP.findChildren('a')
                for advisorInfo in advisorA: # 取每一個advisor的信息
                    idURL = advisorInfo.attrs['href']
                    name = advisorInfo.text
                    sciItem = getSciInfo(idURL)
                    sciItem.name = name
                    sciItem.idURL = idURL
                    advList.append(sciItem)
                break
    return advList



def findAllStudent(soup):
    sciList = list()
    trows = soup.findAll('tr') #找到table中的每一行
    for trow in trows:
        tds = trow.findChildren('td')
        if len(tds) <= 0:
            continue
        else:
            idURL = tds[0].findChildren('a')[0].attrs['href']
            scientistName = tds[0].text
            school = tds[1].text
            year = tds[2].text
            descendants = tds[3].text
            sciItem = Scientst()
            sciItem.idURL = idURL
            sciItem.name = scientistName
            sciItem.year = year
            sciItem.num = descendants
            #sciItem.country = country # 國家信息應針對每個scientist找一遍
            sciItem.school = school
            sciList.append(sciItem)
    return sciList

def currentPageArticleGetter(soup):

    divs = soup.findAll(True, {'class':['r-ent', 'r-list-sep']})
    for div in divs:
        if div.attrs['class'][0] == "r-list-sep":
            break
        elif len(div.findChildren('span')) > 0:
            getDivInformation(div)


def previousPageArticleGetter(soup, flag):

    for link in soup.findAll(True, {'class': 'btn wide'}):
        if '上頁' in str(link):
            soup = readPage(link.get('href'))
            for div in soup.findAll(True, {'class':['r-ent', 'r-list-sep']}):
                if div.attrs['class'][0] == "r-list-sep":
                    break
                elif len(div.findChildren('span')) > 0 and str(div.find(True, {'class': 'date'}).text)[1:] in today:
                    getDivInformation(div)
                elif str(div.find(True, {'class': 'date'}).text)[1:] not in today:
                    flag = 1
    return soup, flag


def articleFilter(soup):

    flag = 0
    currentPageArticleGetter(soup)
    while flag == 0:
        soup, flag = previousPageArticleGetter(soup, flag)  

####################################################################

d = deque() # student隊列
advQueue = deque() # advisor隊列

G = nx.DiGraph()
G.add_node(seedID) # 添加第一個scientist，該scientist的信息需要完善
sciInfo = {}
sciInfo['name'] = ""
sciInfo['year'] = ""
sciInfo['school'] = ""
sciInfo['country'] = ""
sciDict[seedID] = sciInfo
soup = readPage(seedID)
sciList = findAllStudent(soup)

# 添加第一個scientist的advisor信息
advisorList = findAllAdvisor(seedID)
for advisor in advisorList:
    advQueue.appendleft(advisor) # advisor入隊列，一般是1到2個advisor
    G.add_node(advisor.idURL, name = advisor.name, year = advisor.year, school = advisor.school, num = advisor.num, country = advisor.country)
    G.add_edge(advisor.idURL, seedID)

index = 1
errorCount = 0
printstr = ""

# seedID是advisor，目前queue中的每個sci都是seedID的學生，添加邊
for sci in sciList:
    d.appendleft(sci)
    G.add_node(sci.idURL, name = sci.name, year = sci.year, school = sci.school, num = sci.num, country = sci.country)
    index += 1
    printstr = sci.idURL + "    " + str(index)
    print printstr
    G.add_edge(seedID, sci.idURL)

# 將學生信息加入圖中
while d:
    seedSci = d.pop()
    try:
        soup = readPage(seedSci.idURL) # 打開一個scientist的頁面
        # 獲取學生信息
        if seedSci.num == "": # 該scientist沒有學生，但是要取該scientist的國家信息
            continue
        sciList = findAllStudent(soup)
        for sci in sciList:
        # 先獲取該scientist的advisor信息
            advisorList = findAllAdvisor(sci.idURL)
            for advisor in advisorList:
                if advisor.idURL == seedSci.idURL: # 如果這個advisor和seedSci是同一個人，則跳過；否則加入隊列，因為有些scientist可能有一個以上的advisor
                    continue
                advQueue.appendleft(advisor) # advisor入隊列，一般是1到2個advisor
                G.add_node(advisor.idURL, name = advisor.name, year = advisor.year, school = advisor.school, num = advisor.num, country = advisor.country)
                G.add_edge(advisor.idURL, sci.idURL)

            country = getCountry(sci.idURL) # 獲取每個scientist的國家信息
            sci.country = country
            d.appendleft(sci) # 入隊列
            G.add_node(sci.idURL, name = sci.name, year = sci.year, school = sci.school, num = sci.num, country = sci.country)
            index += 1
            printstr = sci.idURL + "    " + str(index)
            print printstr
            G.add_edge(seedSci.idURL, sci.idURL)
    except Exception, e:
        continue


# 將advisor信息加入圖中
# advisor的信息可能不完整（例如沒有num，沒有school，沒有year等），因此需要重新從頁面中讀取學生信息
while advQueue:
    seedSci = advQueue.pop()
    try:
        soup = readPage(seedSci.idURL) # 打開這個advisor的頁面
        sciList = findAllStudent(soup) # 獲取這個advisor所有的學生
        for sci in sciList:
            if not G.has_node(sci.idURL):
                G.add_node(sci.idURL, name = sci.name, year = sci.year, school = sci.school, num = sci.num, country = sci.country)
                index += 1
                printstr = sci.idURL + "    " + str(index)
                print printstr
            if not G.has_edge(seedSci.idURL, sci.idURL):
                G.add_edge(seedSci.idURL, sci.idURL)
    except Exception, e:
        continue

data = json_graph.node_link_data(G)
filePath = "scientistNetwork_test.txt"

with open(filePath, 'w') as outfile:
    json.dump(data, outfile)

print "Finished!"

# pos = nx.random_layout(G)
# nx.draw_networkx(G, pos=pos, width = 0.5, node_size = 15, with_labels = False, alpha = 0.5)
# plt.show()

我的编程学习之旅 Stars·ꦿ໊ོ 学习
大家好，我是一名编程领域的初学者，怀揣着对代码世界的无限热忱，踏上了这充满挑战与惊喜的学习之路。我并非本科出身，在过往的学习，逐渐被编程的魅力所吸引。日常里，我喜欢拆解电子产品、探究其原理，这份好奇心也驱使我深入代码的海洋，期望能从软件层面创造更多“奇迹”。如今，我选择从C语言开始敲开编程世界的大门，它作为一门基础且强大的编程语言，有着广泛的应用场景，无论是底层系统开发、嵌入式编程，还是对理解计算
从 0 到万粉的 AI 公众号博主教程 hikktn 从0到万粉的AI公众号博主教程公众号
《从0到万粉的AI公众号博主教程》专栏简介作为一名深耕品牌领域二十余载的资深专家，我深刻感受到当下商业环境的剧变。去年，我开始探索AI技术在内容创作中的应用，短短4个月内，我的公众号突破万粉，这让我意识到AI时代带来的巨大机遇。在与众多职场人士交流的过程中，我发现很多人都面临着相似的困境：想要利用AI进行个人品牌升级，但不知如何入门？拥有专业积累，但难以转化为个人IP？尝试做自媒体，但始终无法突破
Vue2与Vue3组件开发全维度对比实战指南 Forever丿顾北专题文章 vue.js 前端前端框架
Vue2与Vue3组件开发全维度对比实战指南一、组件基础架构对比1.1组件定义方式演进Vue2OptionsAPI详解在Vue2中，组件主要通过OptionsAPI来定义。OptionsAPI将组件的不同方面，如数据、方法、生命周期钩子等，分开定义在一个对象中。这种方式对于初学者来说，易于理解和上手。以一个简单的计数器组件为例：{{count}}增加exportdefault{data(){ret
android发送自定义广播 Android洋芋 android
简介在Android中，自定义广播（CustomBroadcasts）主要用于应用程序内部或不同应用程序之间的通信。它们是Android四大组件之一——BroadcastReceiver——的主要功能之一。自定义广播在以下场景中尤其有用：组件间通信：应用程序的不同部分（如不同的Activity、Service或BroadcastReceiver）之间可以使用自定义广播来传递信息。例如，当一个Act
JavaScript基础-API 和 Web API 難釋懷前端 javascript 开发语言
在现代Web开发中，API（应用程序接口）是连接不同软件组件或系统之间的桥梁。对于前端开发者来说，JavaScript与WebAPI的结合使用尤为重要，它使得我们可以访问浏览器提供的各种功能和服务，从而构建出交互性更强、用户体验更好的网页应用。本文将介绍API的基本概念，重点探讨WebAPI及其在JavaScript中的应用。一、什么是API？API全称为“ApplicationProgrammi
微软 LIDA 库：基于大模型的自动化数据分析与可视化窝窝和牛牛 microsoft 数据分析
微软LIDA库：基于大模型的自动化数据分析与可视化一、核心架构与LLM交互流程调用LLM生成数据摘要基于LLM推理分析目标LLM生成可视化代码结合图像生成模型优化原始数据Summarizer模块结构化摘要GoalExplorer模块可视化目标列表VizGenerator模块可执行图表代码Infographer模块风格化信息图表二、LLM交互核心功能1.多模型支持架构兼容主流LLM服务商：通过统一接
微服务架构中的服务发现与负载均衡 egzosn 架构微服务服务发现负载均衡云原生
1.引言在微服务架构中，服务发现(ServiceDiscovery)和负载均衡(LoadBalancing)是两个核心组件，它们确保了服务之间的高效通信和资源的合理分配。本文将深入探讨服务发现和负载均衡的基本概念、实现方式以及在实际应用中的最佳实践。2.服务发现2.1什么是服务发现？服务发现是微服务架构中的一个关键机制，它允许服务动态地找到并与其他服务通信。由于微服务通常运行在动态环境中，服务的实
C++中map和set的详解程序员Hagei c++算法开发语言
C++中map和set的介绍与使用在C++编程中，map和set是标准模板库（STL）中两种非常重要的关联容器。它们基于平衡二叉搜索树（通常是红黑树）的数据结构来实现，提供了高效的数据存储和检索功能。本文将详细介绍map和set的特点、用法以及一些常见的操作示例。一、map的介绍与使用1.map的基本概念map是一个键值对容器，其中每个键都是唯一的，且按照升序排序。map的内部结构是红黑树，这使得
堆数据结构：从基础原理到高效算法实现的技术探讨 Everyrt 课程设计
摘要堆作为一种特殊的树形数据结构，在多种算法场景中发挥着核心作用。本文深入剖析堆的基础原理，详细阐述堆的构建、插入、删除等操作的实现细节，并探讨其在优先队列、堆排序等高效算法中的应用，助力读者全面掌握堆数据结构及其应用技术。一、引言堆数据结构以其独特的特性，能够高效地获取集合中的最大（或最小）元素。无论是操作系统中的进程调度，还是搜索算法中的最优解筛选，堆都扮演着不可或缺的角色。理解堆的原理与实现
CST Microwave Studio助力射频电路多物理场耦合分析 FindEveryone 课程设计
摘要本文重点阐述CSTMicrowaveStudio在射频电路多物理场耦合分析中的关键作用。通过解析射频电路中涉及的电磁场、热场、机械场等多物理场耦合现象，详细介绍如何运用CSTMicrowaveStudio构建多物理场联合模型，进行全面的仿真分析。结合具体案例，深入探讨多物理场耦合对射频电路性能的影响，并依据仿真结果提出有效的优化策略，为提升射频电路在复杂工作环境下的可靠性和稳定性提供理论依据与
Nginx负载均衡策略详解：从轮询到智能分发，打造高可用服务架构 egzosn nginx 负载均衡架构运维
Nginx负载均衡策略详解：从轮询到智能分发，打造高可用服务架构一、负载均衡的核心价值当单台服务器无法承载高并发流量时，负载均衡通过将请求分发到多台服务器，实现：横向扩展：突破单机性能瓶颈故障隔离：自动剔除异常节点动态调度：根据策略优化资源利用率二、Nginx原生负载均衡策略1.轮询(RoundRobin)配置示例：upstreambackend{server192.168.1.10:8080;s
C语言基础与进阶学习指南（附运行效果图及术语解析）算法练习生 C语言 c语言开发语言
C语言基础与进阶学习指南（附运行效果图及术语解析）目录C语言标准与编译流程CPU与内存基础C语言基础语法数据类型详解变量与内存管理运算符与表达式输入输出函数函数与内存管理指针与内存操作结构体与高级应用1.C语言标准与编译流程1.1C语言标准演进K&RC（1978）：最初由DennisRitchie和BrianKernighan开发，无标准，依赖文档。ANSIC/C89（1989）：首个国际标准，定
Vue相关面试题努力的搬砖人. vue.js
以下是150道Vue相关面试题及详细答案：Vue基础1.Vue.js是什么？Vue.js是一个用于构建用户界面的渐进式JavaScript框架，专注于视图层，允许开发者以声明式的方式构建用户界面，具有轻量、高效、易上手等特点。2.Vue实例的作用是什么？Vue实例是应用程序的核心，它管理数据、方法、生命周期钩子等，通过数据双向绑定将数据与视图层连接起来，实现数据驱动视图。3.如何创建一个Vue实例
文本转语音常用的几个python库天蓝海乡 python 开发语言人工智能 nlp 语音识别
在Python编程领域，文本到语音（Text-to-Speech,TTS）的转换是一个常见的需求，尤其是在开发能够与用户交互的应用程序时。以下是几个流行的Python库，它们可以帮助开发者实现文本到语音的转换，并且有的可以将转换后的语音保存为MP3文件。gTTS(GoogleText-to-Speech)gTTS是一个依赖于Google的文本转语音API的Python库。它能够将文本转换为自然听起
网络管理 Introducing Meraki – Your Complete Network Management S AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Meraki网络管理平台是一款专为企业级网络管理员设计的网络安全解决方案。它帮助用户轻松管理和监控其组织中的所有网络设备、VLANs及其设置。Meraki网络管理平台包括许多内置功能，如集中管理，安全，可视化分析等。此外，Meraki还提供强大的RESTAPI接口，开发者可以利用这些API来定制属于自己的应用。通过将现有工具、流程和工具合成为一体的网络管理解决方
算法设计与分析4（变治法） songx_99 算法设计与分析算法
变治法将问题转化为一个或数个有一定关联当形式上不同的更加简单或更加好解决的子问题。变治法的应用：预排序思想用预排序可以简化许多问题，如检查元素唯一性，检查出现次数最多的元素等堆算法堆的定义首先它是一个完全二叉树，完全二叉树表明树的每一层都是满的，只有最后一层最右边的元素有可能缺位。且父结点的值大于它的两个子节点，则称是一个大根堆，若值小于两个子节点，称小根堆堆化有向下调整，向上调整两种，大致思路相
Spring Boot详解这河里吗l SpringBoot spring boot 后端 java spring
目录1.SpringBoot介绍1.1什么是SpringBoot1.2SpringBoot特点1.3Javaweb、spring、springmvc和springboot有什么区别？1.4SpringBoot的Starter2.SpringBoot入门HelloWorld3.SpringBoot的全局配置文件3.1properties配置文件3.2yml配置文件3.3yml与properties的
理解 Node.js 中的 process`对象与常用操作 red润前端 node.js 前端 javascript
理解Node.js中的process对象与常用操作在Node.js中，process是一个全局对象，提供了与当前Node.js进程相关的信息和操作。无论是获取进程信息、处理信号、访问环境变量，还是控制进程行为，process都是不可或缺的工具。看到process不犯怵了1.获取进程信息process提供了许多属性和方法来获取当前进程的信息。process.pid：获取当前进程的PID（进程ID）。
npm详解：掌握 Node.js 包管理的艺术 Lv_Jin_Gang npm
在现代软件开发领域，包管理和依赖处理是任何项目不可或缺的一部分。对于基于Node.js的应用程序而言，NPM（NodePackageManager）不仅是安装和管理第三方库的标准工具，也是发布、共享和重用代码片段的核心平台。本文将深入探讨NPM的各个方面，从基础概念到高级用法，旨在为你提供一个全面而深入的理解。一、NPM简介与安装1.1NPM的诞生与重要性NPM伴随着Node.js的诞生而出现，它
SNMP协议以及JAVA实战代码展示 potato_h java
SNMP协议以及代码实现主要是为了实现：Java通过SNMP协议和交换机进行交互JAVA开发SNMP明细第一步：（1）首先安装SNMP服务。（控制面板→添加与删除工具→添加与删除组件→管理和监视工具→详细信息→选择“简单网络管理协议”→确定）。（2）启动snmp服务。（3）下载snmp4j.jar（4）新建项目，加如snmp4j.jar，编写代码编写的代码中需要的内容：（1）枚举网元类型（目前只有
如何用Function Calling解锁OpenAI的「真实世界」交互能力？（附Node.js 实战） hongkid AI编程
一、FunctionCalling：大模型的「手脚延伸器」1.1核心定义FunctionCalling是OpenAI在2023年6月13日推出的革命性功能（对应模型版本gpt-3.5-turbo-0613和gpt-4-0613），允许开发者通过自然语言指令触发预定义函数，实现大模型与现实世界系统的交互。如同给语言模型安装「手脚」，使其不仅能思考，还能执行具体操作。openai官方说明：https:
基于PyCATIA的工程图视图锁定工具开发实战解析 Python×CATIA工业智造 CATIA二次开发 python 自动化
引言本文针对CATIA工程图设计中视图误操作问题，基于PySide6与PyCATIA库开发了一款轻量化视图锁定工具。通过Python二次开发实现全视图/选定视图快速锁定、非模态交互界面及状态实时反馈功能，有效提升大型装配体工程图操作效率。文章深度解析代码架构设计、关键技术实现及工程应用价值，提供完整的开发方法论。一、工具功能与工程应用场景1.1核心功能模块功能模块技术指标应用场景全视图锁定批量操作
位图思想详解：用一个小小的比特征服整个世界 Joseit 优选算法 java 算法
位图思想详解：用一个小小的比特征服整个世界一、什么是位图？二、位图的形象理解三、位图的Java实现四、位图的算法原理剖析五、实际应用案例：网站用户活跃度统计五、真实的应用场景：布隆过滤器的基础六、算法题：判断字符是否唯一（easy）一、什么是位图？位图是一种超级节省空间的数据结构，他利用二进制位（0/1）来表示某个元素是否存在或某种状态是否为真。想象一下，用一个小小的比特位就能记录一个信息，这简直
Python中Pyttsx3库实现文本转化成语音MP3格式文件定星照空 python
Pyttsx3库介绍pyttsx3库是一个功能强大且使用方便的Python本地文本转语音库。它不仅能在离线下将文本转换为语音MP3格式文件，也能在Windows、MacOS和Linux等多个操作系统上实现语音播报。同时，还可以调整语音播报的语速、音量和音色。安装与基本使用安装：cmd命令行中执行pipinstallpyttsx3。基本使用示例：importpyttsx3#初始化语音引擎engine
Node.js 包与 npm 详解：使用 npm 的重要注意事项与最佳实践还是鼠鼠 node.js node.js javascript vscode 前端
目录Node.js包与npm：使用npm的其它注意点详解1.package.json与package-lock.json的作用什么是package.json？什么是package-lock.json？示例：package-lock.json片段2.语义化版本（SemVer）与依赖版本管理3.全局安装vs.本地安装本地安装（默认）全局安装4.npm缓存管理与优化清理npm缓存5.依赖冲突与node_
复习Linux的常用指令一直开心 linux 常用指令的学习笔记
https://zhuanlan.zhihu.com/p/385065437https://zhuanlan.zhihu.com/p/385065437参考：tar指令的学习linux常用命令(2)：tar命令(压缩文件/解压缩文件)_tar压缩-CSDN博客zip指令的学习Linuxzip命令|菜鸟教程tar的工作过程主要分为两个步骤，正向是打包与压缩，反向是解压缩与还原。打包指的是将一大堆文件
计算机毕业设计指南晴天毕设课程设计毕业设计 java 毕设开发语言
毕业设计是计算机专业学生展示综合能力的重要环节，不仅是对所学知识的总结，也是进入职场或深造前的实战演练。本文将从选题、需求分析、系统设计、编码实现、测试优化、论文撰写、答辩准备等方面，为你提供一份详细的毕业设计指南。如果有其他问题，可以点击文章末尾名片咨询，可免费分享源码1.选题阶段选题是毕业设计的起点，直接影响后续工作的难度和完成质量。选题原则兴趣驱动：选择自己感兴趣的方向，能够激发研究动力。创
Adb与monkey命令学习总结你醉牛啤手机测试 adb 软件测试
主要内容adb构成和工作原理adb常用命令查看当前连接设备安装apk文件卸载APP获取包名和界面名adbshellam/pmadb文件传输其他常用命令monkey常用命令事件数频率–throttle(毫秒)，延时操作指定执行的应用–p日志-v调试选项完整应用monkey命令进行稳定性测试adb构成和工作原理全称：AndroidDebugBridge就是起到调试桥的作用。顾名思义，adb就是一个de
3.20 补题（二分模板，反向搜索） ZZZS0516 深度优先算法图论 c++
目录D-填涂颜色（搜索）题目描述思路分析代码实现F-跳石头（二分模板）题目描述思路分析代码实现D-填涂颜色（搜索）链接：P1162填涂颜色-洛谷题目描述由数字000组成的方阵中，有一任意形状的由数字111构成的闭合圈。现要求把闭合圈内的所有空间都填写成222。例如：6×66\times66×6的方阵（n=6n=6n=6），涂色前和涂色后的方阵如下：如果从某个000出发，只向上下左右444个方向移动
解析大模型归一化：提升训练稳定性和性能的关键技术秋声studio 口语化解析深度学习人工智能大模型归一化
引言在深度学习领域，特别是在处理大型神经网络模型时，归一化（Normalization）是一项至关重要的技术。它可以提高模型的训练稳定性和性能，在加速收敛方面发挥了重要作用。本文将深入探讨大模型归一化的原理、常见方法及其应用场景，并结合实际案例和代码示例进行说明。一、归一化的作用与理论基础归一化的主要目的是为了提高模型的训练稳定性和性能。具体来说，归一化有以下几个关键作用：提高训练稳定性：在神经网
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><