浩浩的科研笔记

np.argsort排序问题(关于位次)-含GitHub上在numpy项目下提问的回复-总结可行方案

np.argsort 与获取位相关问题

位次: 数组中的数据在其排序之后的另一个数组中的位置
[1,0,2,3] 中 0的位次是1 1的位次是2 2的位次是3 3的位次是4

这里先直接给出结论，np.argsort()返回的索引排序与实际位次在确实在某些情况下会出现一致，但后来numpy的开发人员给我举例回复这是巧合，如果想获取位次，可以考虑使用scipy.stats.rankdata()方法，也组合numpy中其他函数。

如果你是想解决问题的开发人员直接根据目录跳转到最后方法总结查看示例代码，或者按照函数名直接搜索官方文档即可
如果你有相关问题的思考想直接看一下我和开发人员的探讨内容，直接点击链接去GitHub中查看即可
链接: https://github.com/numpy/numpy/issues/25601

我当时以为没有重复数据的时候就可以返回位次，但是有重复数据的时候不行，所以提问的标题是当时以为的情况，但后续讨论就是我这篇博客标题说的内容了

如果你想了解一下问题产生的原因和和听我絮叨拆解补充分析一下一下我俩对话的内容，可以扫一下下面的内容，或者根据经验自己跳着读。

1.问题的产生

事情是这样的在做项目的时候我遇到了这样一个问题，我要对某一个对象的收入进行分析，emmmm, 还是要举一个实际的例子，假设我要对一种奶茶店的收入进行分析，例如我要分析10个店面的这个月的收入情况，每个店面的收入由三部分组成，奶茶，果茶，冰淇淋。

店铺编号	总收入	果茶收入	奶茶收入	冰淇淋收入
店铺1	1954	100	911	754
店铺2	1663	300	949	705
店铺3	1765	200	822	388
店铺4	1437	500	911	252
店铺5	1410	400	105	932

首先先根据总收入这一列的数据对每一行进行排序
以下是常用的代码

# 原始列表
original_list = [
    ['店铺1', 1954, 100, 911, 754],
    ['店铺2', 1663, 300, 949, 705],  
    ['店铺3', 1765, 200, 822, 388],  
    ['店铺4', 1437, 500, 911, 252],
    ['店铺5', 1410, 400, 105, 932]
]

# 使用.sort()方法根据总收入对列表进行排序
original_list.sort(key=lambda x: x[1], reverse=True)

那么从大到小的排序结果如下，按照顺序其实就是总收入的排名

店铺编号	总收入	果茶收入	奶茶收入	冰淇淋收入
店铺1	1954	100	911	754
店铺3	1765	200	822	388
店铺2	1663	300	949	705
店铺4	1437	500	911	252
店铺5	1410	400	105	932

好那接下来我想在这个表里在果茶收入，奶茶收入，冰淇淋收入前面各加一列，分别为果茶收入排名，奶茶收入排名，冰淇淋收入排名。

店铺编号	总收入	果茶收入排名	果茶收入	奶茶收入排名	奶茶收入	冰淇淋收入排名	冰淇淋收入
店铺1	1954	待计算	100	待计算	911	待计算	754
店铺3	1765	待计算	200	待计算	822	待计算	388
店铺2	1663	待计算	300	待计算	949	待计算	705
店铺4	1437	待计算	500	待计算	911	待计算	252
店铺5	1410	待计算	400	待计算	105	待计算	932

那这个排名怎么得到，首先拿出奶茶这一列的数据。

然后就想用什么函数, 这时候忽然依稀的想起，数据对应的位置就是索引+1, 例如索引为0的数据实际上是列表的第1个数据，也就是位置为1，然后好像记得np.argsort()就是返回排序的索引，索引+1表示的应该就是他的位置，又排序了又有位置，虽然下意识有点怀疑感觉哪里不对，但是决定还是直接用一下再说，
然后我就使用了类似于果茶排名的数据进行了下面的操作(默认从小到大)

import numpy as np
data = [100, 200, 300, 500, 400]
rank = np.argsort(data) + 1
print(rank)
# [1 2 4 5 3]

呀（二声）!?
从小到大的看∑( 口 ||好像是对的哈，是位次

然后我就对所有的列都这样操作了将返回结果作为了位序的结果，由于收入数据很少有一样的而且数量很多所以其实不太好一眼看出逻辑错误，可能就观察了前几个，发现相对关系好像没问题就没再仔细检查了，但是在后续实际数据中由于有一些数据不存在，所以我直接都给赋值成了-1我认为这样的话他会被排在两边，但是存在大量的-1之后发现了问题。

如果按照位次的逻辑，下面的结果不就是胡排八排吗
默认是从小到大排的-1对应的位置是4，和3 在中间是怎么回事，1，2才是对的把，或者两个都是1

import numpy as np
data = [1, -1, 3, -1, 4]
rank = np.argsort(data) + 1
print(rank)
# [2 4 1 3 5]

在浏览了各种资料之后，有人说可能是排序方式选择的问题，默认是快速排序，快速排序有可能有问题，我就把文档里的np.argsort()的四种排序方式实验了一遍，加上好像其他人好像也都是对有重复数据的排序结果产生了质疑。此时我把我同样做算法的也是刚毕业的研究生航宝(昵称)叫了过来，让其帮我在stackflow上也简单搜索了下,也有人提出了这个问题，但是但是没有能直接一眼瞄到的问题的答案(也不排除看的不认真)。我俩也是鬼使神差的觉得这应该是由于有重复数据的问题。

之后我开始尝试写了一个可以实现返回位序的代码。

import numpy as np
data = [1, -1, 3, -1, 4]

def my_sort(x):
    arg_x = np.sort(x)
    rank = [np.where(arg_x == i)[0][0] for i in x]
    return np.array(rank)

rank = my_sort(data) + 1
print(rank)
# [3 1 4 1 5] 现结果
# [2 4 1 3 5] 原结果

然后找航宝来帮我验证，发现确实可以实现获得位序的功能，然后航宝提议，去GitHub上问一问，顺便搜一搜，我俩在问题里输入argsort同样也是简单翻了一翻，我俩认为这应该是个应该比较常见的问题，应该一搜就能搜到所以也没怎么往后面翻，发现没有之后，我俩就开始着手准备提问，点开了issue，在写issue中，我们又看了一遍np.argsort(data)官方文档的描述，述其描述如下
np.argsort performs an indirect sort on an array, returning the indices that would sort the array.
我们两个人又重新理解了一遍这个意思，np.argsort 返回一个不是对一个array直接排序结果，返回的是indices(索引们)，而这些indices会对这个数组进行排序。

我们翻译成土话，可以理解的就是你按照np.argsort(data)的返回结果(一个有顺序的包含索引值的列表)，把列表中的索引值替换为data[索引值]，最后你会得到一个有序的数组。

嗯，真适合作为一道面试题，之前的话我可能会脱口而出他返回的是排序之后的索引（其实对不懂的人来说这句话可能并不清晰）
此时我们理解了np.argsort()的功能但是依旧认为他对非包含重复值的数组依然可以返回位序但是只不过如果含重复数值的话可能由于其使用的算法关系失去了这个功能

因此我们关闭了提出issue的选项，因为np.argsort()本身没有问题不是BUG，转而选择了一个给numpy增添新功能的选项，写完正文发送了之后，又给邮箱发了一遍邮件。以下是邮件内容
不敢兴趣可以跳过

2.鄙人给numpy讨论邮箱发送的邮件内容

汉语是我本来的意思，英语是连机翻再改的结果，可能有点对不上但是大致是一个意思

尊敬的作者：
Dear Author:

当我使用np.argsort 函数处理具有非重复数据的数组的时候，他返回的索引值，与其排序之后所处的位置有关联
When I use the np.argsort function on an array without duplicate data, the returned index values correspond to the sorting positions of the respective data.

x = [1, 2, 5, 4]
rank = np.argsort(x)
print(rank)
# [0 1 3 2]

但当数组中包含重复数据时，np.argsort函数有时就无法返回与数据位置相关的信息了。
However, when there are duplicate values, the results from np.argsort sometimes do not correspond to the sorting positions of the respective data .

x = [1, 4, 1, 1, 2, 4, 5]
rank = np.argsort(x)
print(rank)
# [0 2 3 4 1 5 6]

有可能一个人经常使用np.argsrot处理具有非重复数据的数组来获取位置信息，有重复数据的话，可能会产生一些不易察觉的错误，如果数据长度非常大的话发现这个问题可能更具有挑战性。
Assuming a person frequently uses np.argsort to obtain positions by sorting data without duplicates, introducing duplicate values in the data may lead to inconspicuous errors in positions that are difficult to detect. Moreover, as the dataset grows, identifying such issues may become even more challenging.

可能对于有这种需求的用户来说，他们想要得到的结果可以由以下函数实现
For users in this situation, the desired results might be achieved using the following function:

def my_sort(x):
    arg_x = np.sort(x)
    rank = [np.where(arg_x == i)[0][0] for i in x]
    return np.array(rank)

x = [1, 4, 1, 1, 2, 4, 5]
rank_arg = np.argsort(x)
rank_position = my_sort(x)
print("rank_arg",rank_arg)
print("rank_position",rank_position)
# rank_arg [0 2 3 4 1 5 6]
# rank_position [0 4 0 0 3 4 6]

这个方法在处理具有非重复数据的时候与np.argsort函数的返回结果一致（补充：后来证明这是巧合）
This method produces results consistent with np.argsort when applied to arrays without duplicate values.

x = [1, 2, 5, 4]
rank_arg = np.argsort(x)
rank_position = my_sort(x)
print("rank_arg",rank_arg)
print("rank_position",rank_position)
# rank_arg [0 1 3 2]
# rank_position [0 1 3 2]

尽管其实np.argsort函数文档本身描述的内容没有问题，但是这种需求可能是广泛存在的，因此能不能考虑新加一个功能，例如np.position(data)，去提升numpy功能性
Although there is no issue with the documentation of np.argsort itself, the need you’ve highlighted may be widespread. Therefore, it might be worth considering the addition of a function, for example, np.position(data), to enhance the functionality of numpy.

我的设备
My device:

系统
system: win10 64x
python版本
python version: 3.9.11
numpy 版本
numpy version: 1.21.2

真诚的期待您的回复
Sincerely, Looking forward to your response! ❤❤❤❤

3. numpy 官方人员的回复

回复我的是 Robert Kern 职位尚不清楚所属机构是 Enthought(开发numpy 和 scipy的公司) line_profiler 库的开发者，该项目有3.6K个星，该大佬第一次在半个小时内回复了我，由于我是中午发的，所以他在美丽国的半夜十一点给我回复了邮件/(ㄒoㄒ)/~~，美丽国大佬恐怖如斯。

下面的翻译中（括号里的内容不是作者说的话是我的补充）翻译的不好请多见谅

3.1 第一次回复

这并不是argsort函数内容打算做的或者文档里描述的

这里指我说的在处里具有非重复数据中返回位次的功能

他返回的是一索引数组，他是指向(into)x的，如果你按照这个顺序从x中拿数的话你会得到一个有序的数组，如果说把x 排序成sorted_x，对于所有的i in range(len(x))会满足
x[rank[i]] == sorted_x[i],argsort返回的索引，是数据在x中的位置，而不是在sorted_x中的位置。你例子中的出现的关联情况，是在一些小的例子中偶然发生的（我:），但是考虑一个例子[20, 30, 10, 40]

That is not what argsort is intended or documented to do. It returns an array of indices into x such that if you took the values from x in that order, you would get a sorted array. That is, if x were sorted into the array sorted_x, then x[rank[i]] == sorted_x[i] for all i in range(len(x)). The indices in rank are positions in x, not positions in sorted_x. They happen to correspond in this case, but that’s a coincidence that’s somewhat common in these small examples. But consider [20, 30, 10, 40]:
（他在下面的代码中对他提到的例子使用np.argsort()处理，发现虽然没有重复数据但是返回的仍然不正确的位次信息,然后大佬自己写写了一个position()内容和我的不同，但是返回了同样的结果，这里的np.searchsorted()的作用是查找数据在目标数组中的插入位置）

>>> x = np.array([20, 30, 10, 40])
>>> ix = np.argsort(x)
>>> def position(x):
...     sorted_x = np.array(x)
...     sorted_x.sort()
...     return np.searchsorted(sorted_x, x)
...     
>>> ip = position(x)
>>> ix
array([2, 0, 1, 3])
>>> ip
array([1, 2, 0, 3])

但也得注意的是：
But also notice:

>>> np.argsort(np.argsort(x))
array([1, 2, 0, 3])

用两次argsort你看,也能返回这个结果(当时我：啊(二声)，这也行)，这取决于你对重复项的处理想达到什么效果，你是想返回重复值在排序之后的数组中第一次出现的索引，还是想返回特定项被排序到的索引。
This double-argsort is what you seem to be looking for, though it depends on what you want from the handling of duplicates (do you return the first index into the sorted array with the same value as in my position() implementation, or do you return the index that particular item was actually sorted to).

不管怎么样，我们可能不打算把这个添加到我们的功能里，以上的两种目的都可以用现有的基础功能直接组合得到。
Either way, we probably aren’t going to add this as its own function. Both options are straightforward combinations of existing primitives.

3.2 第二次回复

在第二天凌晨2点，美丽国刚吃完午饭，我收到了第二次回复

也可以考虑一下使用 scipy.stats.rankdata()，它提供了许多处理重复值的选项

ties 其实实际意思是并列值，但是感觉还是翻译成重复值感觉更符合语境和之前探讨的内容

也就是其实scripy 中已经实现了这个函数,但是可能并没有太被人们所熟知,以至于大佬第一次回复都没想到可能.

4.返回位序方法总结

以上就得到了四种返回位序的方法

4.1 scipy.stats.rankdata (推荐)

其中功能最强大的那就是scipy.stats 中的rankdata 方法了

import numpy as np
from scipy.stats import rankdata

# 创建一个数组
x = np.array([40, 20, 30, 20, 40])

# 使用 rankdata 对数组中的元素进行排名，分别使用四种不同的方法
ranks_average = rankdata(x, method='average')  # 默认方法，平均排名
# [4.5, 1.5, 3. , 1.5, 4.5]
ranks_min = rankdata(x, method='min')          # 最小排名
# [4, 1, 3, 1, 4]
ranks_max = rankdata(x, method='max')          # 最大排名
# [5, 2, 3, 2, 5]
ranks_dense = rankdata(x, method='dense')      # 密集排名
# [3, 1, 2, 1, 3]
ranks_ordinal = rankdata(x, method='ordinal')  # 序数排名
# [4, 1, 3, 2, 5]

平均排名（average）：如果存在相同的元素，它们被赋予其排名的平均值。
最小排名（min）：并列元素被赋予所有可能排名中的最小值。
最大排名（max）：并列元素被赋予所有可能排名中的最大值。
密集排名（dense）：并列元素被赋予相同的排名，且排名之间没有间隔。
序数排名（ordinal）：每个元素被赋予一个唯一的排名，即使它们的值相同

4.2 double np.argsort()

这是第二种方法,其等效于scipy.stats.rankdata的序数排名模式,代码精简,看起来比较炫酷

import numpy as np
x = np.array([40, 20, 30, 20, 40])
rank = np.argsort(np.argsort(x))+1
print(x)
# [4 1 3 2 5]

4.3 Robert Kern Position

这是第三种,在邮件中Robert Kern回复我的position 函数
等效于scipy.stats.rankdata的最小排名模式,个人认为这个不是非常好的选择,首先他肯定不如scipy.stats.rankdata精简,而且又引入了一个新的知名度可能不是很高的函数np.searchsorted

import numpy as np
x = np.array([40, 20, 30, 20, 40])

def position(x):
    sorted_x = np.array(x)
    # 排序
    sorted_x.sort()
	# 寻找插入位置
    return np.searchsorted(sorted_x, x)

rank = position(x) + 1
print(rank)
# [4 1 3 1 4]

4.4 My Position

最后就是我的了,我写的吧,算法效率必然是最低又占内存运行的又慢,就是代码逻辑可能相对好理解一点(也许)

My Position Min
等效于scipy.stats.rankdata的最小排名模式

import numpy as np
x = np.array([40, 20, 30, 20, 40])
def position_min(x):
    x = np.array(x)
    # 排序
    arg_x = np.sort(x)
	# 查找重复元素在排序数组中第一次出现的位置 
	# np.where() 返回的是元组 np.where()[0] 取元组里包含索引值的列表
	# np.where()[0][0] 第一次出现的索引 np.where()[0][-1]最后一次
    rank = [np.where(arg_x == i)[0][0] for i in x]
    return np.array(rank)

rank = position_min(x) + 1
print(rank)
# [4 1 3 1 4]

My Position Max
等效于scipy.stats.rankdata的最大排名模式

import numpy as np
x = np.array([40, 20, 30, 20, 40])
def position_max(x):
    x = np.array(x)
    # 排序
    arg_x = np.sort(x)
	# 查找重复元素在排序数组中第一次出现的位置 
	# np.where() 返回的是元组 np.where()[0] 取元组里包含索引值的列表
	# np.where()[0][0] 第一次出现的索引 np.where()[0][-1]最后一次
    rank = [np.where(arg_x == i)[0][-1] for i in x]
    return np.array(rank)

rank = position_max(x) + 1
print(rank)
# [5 2 3 2 5]

结束语

我会专门想办法再去测试一个各个算法的运行效率,然后根据运行时间给出一个最终的结论

你可能感兴趣的:(github,numpy)

Git 的详细介绍及用法 xluo1715 工程化 git 代码管理 gitlab 程序员
一、Git的优点分布式版本控制每个开发者都拥有完整的仓库副本，无需依赖中央服务器（如SVN）。支持离线操作（提交、查看历史、创建分支等）。高效的分支管理创建和切换分支速度快（几乎是瞬间完成）。适合多人协作开发，支持多种工作流（如GitFlow、GitHubFlow）。强大的撤销和恢复能力可以回退到任意历史版本，避免代码丢失。提供gitreset、gitrevert、gitstash等撤销工具。数据
Ubuntu系统下交叉编译zlib linux运维
一、参考资料【开源库编译|zlib】zlib库最新版本(zlib-1.3.1)在Ubuntu(Linux)系统下的编译、交叉编译(移植)二、交叉编译zlib1.下载源码zlib的官网地址：https://zlib.net/zlib历史发布版本下载地址：https://zlib.net/fossils/zlib在GitHub的地址：https://github.com/madler/zlib/下载并
CICD系列之harbor john137724 DEV-OPS harbor
镜像仓库专题安装docker&docker-compose安装harbor下载并解压安装文件修改配置文件安装、管理harbor访问harbor重点提示记录镜像仓库的常用操作。安装docker&docker-composedocker&docker-compose安装与配置安装harbor下载并解压安装文件#下载到指定目录并进入该目录wgethttps://github.com/goharbor/h
FastExcel/EasyExcel简介以及源码解析舌尖上的五香 java
简介官网地址GitHub地址基于MIT协议发展历史由EasyExcel发展而来2018/02/07：发布1.0.02019/09/17：发布2.0.02021/10/21：发布3.0.12024/06/18：发布4.0.02024/11/06：进入维护模式2024/12/05：发布FastExcel1.0.0主要特性高性能读写简单易用流式操作读取执行行数技术原理内存优化：基于流式读取技术，不需要一
【RAG 论文】Program-of-Thoughts（PoT）提示：让 LLM 生成 Python 代码来解决复杂的数字计算问题 yubinCloud LLM Research 自然语言处理人工智能语言模型算法
论文：ProgramofThoughtsPrompting:DisentanglingComputationfromReasoningforNumericalReasoningTasks⭐⭐⭐⭐TMLR2023Code：Program-of-Thoughts|GitHub论文速读文章提出了PoTPrompting方法，PoT可以看作是CoT（Chain-of-Thoughts）的改进，该方法通过生
Pycharm使用-错误“PermissionError: [Errno 13] Permission denied”排查 mystonelxj Python使用 pycharm python
文章目录问题说明排查过程问题初始管理员方式使用工具权限设定设置信息总结问题说明近期Pycharm运行python程序，提示出错信息“PermissionError:[Errno13]Permissiondenied”，各种尝试一番，总算是解决了，特此记录下留作备忘。排查过程问题初始相关代码时从github上获取的，在安装了相关的引用package后，在Pycharm中显示代码时正常的，运行相关py
AI 赋能软件开发：从工具到思维的全面升级二川bro 智能AI 人工智能
AI赋能软件开发：从工具到思维的全面升级前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，可以分享一下给大家。点击跳转到网站。https://www.captainbed.cn/ccc一、AI如何改变软件开发1.1开发效率的提升代码生成：AI工具如GitHubCopilot可以自动生成代码片段，减少重复劳动错误检测：AI能够实时识别代码中的潜在错误和漏洞性能优化：AI可以自动优化算法和数
LLM Weekly（2025.02.17-02.23） UnknownBody LLM Daily LLM Weekly 人工智能自然语言处理
本文是LLM系列文章，主要是针对2025.02.17-02.23这一周的LLM相关新闻与文章、GitHub资源分享。网络新闻Grok3Beta——推理代理的时代。Grok发布了Grok3Beta，通过强化学习、扩展计算和多模态理解提供卓越的推理能力。Grok3和Grok3mini在学术基准上取得了高分，其中Grok3在AIME’25上获得了93.3%的分数。Grok3的推理可通过“思考”按钮访问，
4 「小试牛刀」- 实现最基本的 React SSR zz_jesse react vue javascript python js
导读本节标题：「小试牛刀」-实现最基本的ReactSSR本节主旨：完成最简单的ssr,体验组件直出的过程本节配套代码:https://github.com/Bigerfe/koa-react-ssr/tree/better/packages/base-react-ssr正文上一节我们介绍了reactssr的核心原理。这一节我们就来实操一下，实现一个单纯的reactssr功能，这有点像是写一个hel
DeepSeek源码解析（1）白鹭凡 deepseek ai
下载github的DeepSeek-V3-main源码，目录如下文章适合入门小白学习，因为我也是小白，本来作为一名前端开发，因为行业不好混所以跑来学ai的。初步看它的代码并不多，主要是inference目录，convert.py#1.导入标准库importos#os是Python的标准库之一，提供了与操作系统交互的功能，比如文件路径操作、环境变量管理等。importshutil#shutil也是P
DeepSeek Coder 的依赖解析方法具体是如何实现的？百态老人人工智能大数据笔记
DeepSeekCoder的依赖解析方法主要通过以下步骤实现：数据收集与过滤首先，从GitHub等平台收集代码数据，并使用规则过滤掉不符合要求的代码。例如，过滤掉语法错误、可读性差或模块化低的代码，以确保数据的质量和多样性。解析文件依赖关系在这一阶段，系统会分析同一项目中代码文件之间的依赖关系。具体来说，通过一种基于拓扑排序的算法来识别这些依赖关系。这种方法不同于传统的从入度为零的节点开始的排序，
Orbbec 深度相机SDK（Python） -烂笔头- 嵌入式开发 python sdk
1、支持系统1）开发板ARM32和ARM642）window系统2、支持的Orbbec深度摄像头型号1）AstraPlus2）AstraPro3）Astramini4）Deeyea5）Gemini3、代码功能1）数据采集和可视化2）定时唤醒任务3）磁盘空间检测4）数据采集服务监测和中断重续4、Githubhttps://github.com/zhangge2016/Orbbec_Python
大语言模型(LLM)入门学习路线图，从零基础到精通，理论与实践结合的最佳路径！ ai大模型应用开发语言模型学习人工智能机器学习 AI 自然语言处理
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
【基于手势识别的音量控制系统】合肥玉安人工智能工作室 Python OpenCV python mediapipe 手势手势控制音量
基于手势识别的音量控制系统github项目效果这是一个结合了计算机视觉和系统控制的实用项目，通过识别手势来实现音量的无接触控制，同时考虑到了用户隐私，加入了实时人脸遮罩功能。核心功能实现1.手势识别与音量映射系统使用MediaPipe框架进行手部关键点检测，通过计算大拇指和食指之间的距离来控制音量：def_process_landmarks(self,hand_landmarks):#获取手指关键
点云数据处理--splat转3dtiles gaohualan 3d python 数据结构算法
文章目录处理流程简介核心功能实现数据读取与格式转换定义Point类数据读取splat转gltf点云数据分割定义四叉树递归生成3dtiles瓦片生成tileset.json递归生成tileset.json计算box主函数调用渲染下一步工作性能优化渲染效果调优其他源码地址：github处理流程简介基本流程：读取点云数据。制作tile构建四叉树分割点云将点云转换为glTF格式。生成配置文件tileset
ansbile 批量部署 node-exporter BUG弄潮儿 java
下载node-exporterhttps://github.com/prometheus/node_exporter/releases下载ansiblehttps://github.com/ansible/ansible/releases启动node-exporterservice文件node-exporter.service[Unit]Description=node_exporterRequi
使用ansible搭建k8s集群--单节点部署+work节点扩展 chennuan1991 kubernetes
单节点部署：1.基础系统配置准备一台虚机配置内存2G/硬盘30G以上最小化安装Ubuntu16.04server或者CentOS7Minimal配置基础网络、更新源、SSH登录等2.下载文件下载工具脚本easzup，举例使用kubeasz版本2.0.2https://github.com/easzlab/kubeasz/blob/master/docs/setup/quickStart.md如果下
Voice Translation of Audio Files into Different Languages Using Gpt-4o 开发者每周简报 ffmpeg 人工智能
openai-cookbook/examples/voice_solutions/voice_translation_into_different_languages_using_GPT-4o.ipynbatmain·openai/openai-cookbook·GitHub您是否曾经想将播客翻译成您的母语？翻译和配音音频内容可以使其更便于全球观众理解。借助GPT-4o的全新音频输入和音频输出模式
k8s下部署ansible进行node-export二安装 BUG弄潮儿 kubernetes ansible 容器云原生
下载node-exporterhttps://github.com/prometheus/node_exporter/releases下载ansiblehttps://github.com/ansible/ansible/releases启动node-exporterservice文件node-exporter.service[Unit]Description=node_exporterRequi
基于Spring Boot的多级缓存架构实现天才选手Yoke springboot java spring boot 缓存架构
基于SpringBoot的多级缓存架构实现以下是一个基于SpringBoot的多级缓存架构实现示例多级缓存架构实现方案1.依赖配置（pom.xml）org.springframework.bootspring-boot-starter-cachecom.github.ben-manes.caffeinecaffeineorg.springframework.bootspring-boot-star
github中branches和tags的区别 Lntano__y github eclipse git
@github中branches和tags的区别在GitHub中，“branches”（分支）和"tags"（标签）是两个常用的概念，用于管理和组织代码库的版本控制。它们有以下区别：Branches（分支）：分支是代码库的并行版本，允许开发人员在不影响主要代码线的情况下进行独立的开发工作。当创建一个分支时，它会从现有的代码库中拷贝一份副本，开发者可以在该分支上进行修改、添加和删除代码。分支的主要用
EDPose：探讨端到端的实时多人姿态估计烧技湾 AI &Computer Vision HPE 人体姿态估计端到端检测
作者：曾爱玲（港中文博士，现已入职腾讯）单位：IDEA（深圳数字经济研究院）源码：github/ED-Pose该篇论文取得效果如下：这篇文章的优势在于：在复杂的多人场景下能够取得不错的性能提升，虽然在COCO等数据集上的提升不明显。这种端到端的方法，优势在于检测到人体是检测到关键点的一个保证。目录摘要一、介绍二、相关工作2.1.单阶段多人姿态估计2.2检测变压器：三、重新思考单阶段多人姿态估计3.
R语言安装github包出现的错误，object "XXX" is not exported by "namespace:viridisLite" momo酱豆是沃 anaconda各种问题
自己遇上了类似的问题，当时是把所有导致这个问题出现时安装的所有包我都卸载了，再次重装的。弄了很久，我发现都是在安装各种包让我更新我不更新导致的后果R，告诉我一个道理，一定要听话，让你更新就更新，不然我的bug出到让你崩溃。下图借用以为博主的图（https://blog.csdn.net/yw_vine/article/details/79631042）原连接R语言安装github包出现的错误，ob
Git常用命令全面分类总结向贤技术面试 git
Git常用命令全面分类总结以下是Git常用命令的全面分类总结，以及gitreset--hard的详细解析，结合结构化的说明和示例，便于我们理解和记忆：一、Git核心命令分类速查表1.仓库初始化与克隆命令作用示例gitinit初始化本地仓库gitinitgitclone克隆远程仓库gitclonehttps://github.com/user/repo.git2.工作区与暂存区操作命令作用示例git
技术人实测 | 如何用AI工具2分钟突破知网AIGC检测线 LL06210721 人工智能 AIGC
最近在GitHub发现个有意思的本地化算法工具，其核心是通过对抗式语义重组技术重构文本逻辑链。测试时发现：将GPT生成的论文导入后，系统会保留原始参考文献格式，同时用学术同义词替换引擎重写表达结构。实测数据：某985实验室的AI生成稿经处理，知网AIGC率从38%→9.7%（检测截图已脱敏），维普重复率从24%→8.3%。工具最实用的三个细节：保留公式编号和图表位置不变支持LaTeX源码级修改追踪
拉格朗日插值多项式（Lagrange Interpolation）原理 + Python 代码 Illusionna. python
原理部分见：拉格朗日插值—Homev1.2023.11文档https://illusionna.readthedocs.io/zh/latest/projects/Mathematics/Numerical%20Analysis/%E6%8B%89%E6%A0%BC%E6%9C%97%E6%97%A5%E6%8F%92%E5%80%BC/Lagrange.html代码依赖第三方库：1.numpy2
Vision Transformer 分类水果图片集 Python 代码（可训练自己数据集） Illusionna. transformer 深度学习人工智能
代码链接:https://github.com/Illusionna/ComputerVision/tree/main/EfficientTransformerArepositoryforViT.ContributetoIllusionna/TransformerdevelopmentbycreatinganaccountonGitHub.https://github.com/Illusionna
Spark-TTS：基于大模型的文本语音合成工具 CITY_OF_MO_GY 魅力语音语音识别深度学习人工智能
GitHub：https://github.com/SparkAudio/Spark-TTSSpark-TTS是一个先进的文本到语音系统，它利用大型语言模型（LLM）的强大功能进行高度准确和自然的语音合成；旨在高效、灵活、强大地用于研究和生产用途。一、介绍SparkTTS完全基于Qwen2.5构建，无需额外的生成模型，它不依赖于单独的模型来生成声学特征，而是直接从LLM预测的代码中重建音频。这种方
go-etcd 安装与使用指南尤瑾竹Emery
go-etcd安装与使用指南go-etcdDEPRECATED-pleaseusetheofficialclientathttps://github.com/coreos/etcd/tree/master/client项目地址:https://gitcode.com/gh_mirrors/go/go-etcd1.项目目录结构及介绍go-etcd是一个用于与etcd交互的Go语言客户端库。由于您提供
Numpy 自学笔记（一） .Queenie. numpy 小白自学笔记
@numpyNumpy自学笔记（一）更加详细的学习资料请见：https://www.numpy.org.cn/user/一.基础知识NumPy的数组类被调用ndarray。它也被别名所知array。请注意，numpy.array这与标准Python库类不同array.array，后者只处理一维数组并提供较少的功能。ndarray对象更重要的属性是：importnumpyasnpa=np.arang
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To git@git.dianrong.com:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to 'git@git.dianron
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。