质数
质数又称素数。指整数在一个大于1的自然数中,除了1和此整数自身外,没法被其他自然数整除的数。换句话说,只有两个正因数(1和自己)的自然数即为素数。比1大但不是素数的数称为合数。1和0既非素数也非合数。素数在数论中有着很重要的作用。
质数的分布规律是以36N(N+1)为单位,随着N的增大,素数的个数以波浪形式渐渐增多。
孪生质数也有相同的分布规律。
素数,普遍认为的分布规律是没有规律。时而连续出现,时而又相隔很远很远。有远亲、有近邻,地球对面也还有几个好朋友。
素数,真的就没有规律吗?
合数可以用公式来表示,而素数且不能用公式来表示。这就是素数。
不过这里其实就蕴含着秘密。
既然合数能用公式表示,间接的也就说明了,素数必须服从这些公式的限制。而研究合数,其实也是研究素数。
有2个根深蒂固的观念:
1、素数的个数总是按照自然数增加10倍来统计展现的。因为这里一直沿用π(x)与x/lnx的统计方法。
2、100以内有25个素数,1000以内有168个素数。就产生了一种根深蒂固的观念:素数越来越稀疏。
当然这些都没有错误,否则也不会一直陪伴着素数研究到现在,但它禁锢了人们的思想。有一些数据似乎与之相悖。
列举一些四胞胎素数的例子,
四胞胎素数是很少的,在自然数1000亿以内仅仅有1209317组。平均间距为82691。两组之间相距是很远的。但总有一些间距仅仅为30的两对四胞胎素数稀稀拉拉的出现。在1000亿以内共有这样四胞胎素数267对,他们是如何分布的呢?
200亿以内有90个;200-400亿之间有55个;
剩下的如何分布的呢,你不会相信的:
400-600亿之间有41个;
600-800亿之间有41个;
800-1000亿之间有40个;
这样的分布说明了什么?均匀分布?大家肯定不会相信的,我也不信,那似乎就只能是巧合了。大家一定也会认为是这纯属巧合。素数嘛,飘忽不定,怎么分布都有可能,但就是没有规律。至少大家还没有发现其分布规律。
打印质数
打印100以内的质数
count = 0
for i in range(2,101):
for x in range(2,i):
if i%x == 0:
break
else:
print(i)
count += 1
print("\n","Total: ",count,"number")
----
2
3
5
7
11
13
17
19
23
29
31
37
41
43
47
53
59
61
67
71
73
79
83
89
97
Total: 25 number
这种方法的思路,时间复杂度是O(n²),2层循环,虽然会break,但效率还是很低的
优化算法,寻找中点
其实我们发现我们求解质数的时候,根本不需要从2除到N-1,当除数大于商的时候我们就不用计算了。
用数学的话来说我们只需除到平方根就好了
count = 0
for i in range(2,100000):
for x in range(2,int(i**0.5)+1):
if i%x == 0:
break
else:
print(i)
count += 1
print("\n","Total: ",count,"number")
----
2
3
5
7
11
13
·······
99907
99923
99929
99961
99971
99989
99991
Total: 9592 number
继续优化,大于2的偶数都不是质数
所以对于偶数都不用判断是不是素数,修改步长
count = 1
print(2)
for i in range(3,100000,2):
for x in range(2,int(i**0.5)+1):
if i%x == 0:
break
else:
print(i)
count += 1
print("\n","Total: ",count,"number")
----
2
3
5
7
11
13
·······
99907
99923
99929
99961
99971
99989
99991
Total: 9592 number
进行优化,第二层的for循环
第二层for循环判断的是奇数/range(2,奇数的开方)
但是2,4,6,8···
这种数肯定不能被奇数整除,不用考虑,可以不加判断
count = 1
print(2)
for i in range(3,100000,2):
for x in range(3,int(i**0.5)+1,2):
if i%x == 0:
break
else:
print(i)
count += 1
print("\n","Total: ",count,"number")
----
2
3
5
7
11
13
·······
99907
99923
99929
99961
99971
99989
99991
Total: 9592 number
计算以上方法的效率
计算以上的程序运行时间,取1000000以内的质数
方法一
from datetime import datetime
t1 = datetime.now()
count = 0
for i in range(2,1000000):
for x in range(2,i):
if i%x == 0:
break
else:
#print(i)
count += 1
print("\n","Total: ",count,"number")
t2 = datetime.now()
print("Total_Cost:",(t2-t1).total_seconds(),"s")
我喝了一杯咖啡,还没计算完...已经超过五分钟了,不等了
然后减少10倍,测试100000以内的数据...用了40s
方法二
from datetime import datetime
t1 = datetime.now()
count = 0
for i in range(2,1000000):
for x in range(2,int(i**0.5)+1):
if i%x == 0:
break
else:
#print(i)
count += 1
print("\n","Total: ",count,"number")
t2 = datetime.now()
print("Total_Cost:",(t2-t1).total_seconds(),"s")
----
Total: 78498 number
Total_Cost: 6.26467 s
用了6.26467s
,效率大大提升
方法三
from datetime import datetime
t1 = datetime.now()
count = 1
#print(2)
for i in range(3,1000000,2):
for x in range(2,int(i**0.5)+1):
if i%x == 0:
break
else:
# print(i)
count += 1
print("\n","Total: ",count,"number")
t2 = datetime.now()
print("Total_Cost:",(t2-t1).total_seconds(),"s")
----
Total: 78498 number
Total_Cost: 5.80345 s
用了5.80345s
,效率稍微进步
方法四
from datetime import datetime
t1 = datetime.now()
count = 1
#print(2)
for i in range(3,1000000,2):
for x in range(3,int(i**0.5)+1,2):
if i%x == 0:
break
else:
#print(i)
count += 1
print("\n","Total: ",count,"number")
t2 = datetime.now()
print("Total_Cost:",(t2-t1).total_seconds(),"s")
----
Total: 78498 number
Total_Cost: 3.375002 s
用了3.375002s
,效率约提高50%
进阶方法
在上述方法四的基础上,引入列表
先把第二层循环用列表替代
from datetime import datetime
t1 = datetime.now()
count = 1
lst = [2]
for i in range(3,1000000,2):
#for x in range(3,int(i**0.5)+1,2):
for x in lst:
if i%x == 0 and x <= i**0.5:
break
else:
lst.append(i)
count += 1
t2 = datetime.now()
print("Total Number:", count, "Total_Cost:", (t2-t1).total_seconds(),"s")
----
Total Number: 78498 Total_Cost: 234.643142 s
因为每次都要if判断两次结构(a and b),效率会低,修改下方案
修改if and 结构
from datetime import datetime
t1 = datetime.now()
count = 1
lst = [2]
for i in range(3,1000000,2):
flag = False
middle = int(i**0.5)
for x in lst:
if i%x == 0:
break
if x > middle:
flag = True
break
if flag:
lst.append(i)
count += 1
t2 = datetime.now()
print("Total Number:", count, "Total_Cost:", (t2-t1).total_seconds(),"s")
----
Total Number: 78498 Total_Cost: 1.560107 s
可以可以,上面的方法四计算1000000内素数用时是3.37s,而现在,只需要1.56s,效率又提高50%以上
还能优化吗?
有一个数在做无用功,它就是2,任何素数都不能整除2
from datetime import datetime
t1 = datetime.now()
count = 2 #[2]
lst = [3]
for i in range(5,1000000,2):
flag = False
middle = int(i**0.5)
for x in lst:
if i%x == 0:
break
if x > middle:
flag = True
break
if flag:
lst.append(i)
count += 1
t2 = datetime.now()
print("Total Number:", count, "Total_Cost:", (t2-t1).total_seconds(),"s")
----
Total Number: 78498 Total_Cost: 1.513069 s
略微提升,也有效果
还有吗?
在求无限质数的时候,我们不能预测有多少结果
但是对于求1000000内质数,我们现在知道了有多少结果
这样就可以提前开辟内存空间,替代append()
孪生素数
还有别的方法吗?当然有!孪生素数了解下
孪生素数就是指相差2的素数对,例如3和5,5和7,11和13…。孪生素数猜想正式由希尔伯特在1900年国际数学家大会的报告上第8个问题中提出,可以这样描述:存在无穷多个素数p,使得p + 2是素数。素数对(p, p + 2)称为孪生素数。
总结下来就是一句话:当素数大于3时,素数都在 6N-1 和 6N+1 左右分布
素数 | 2 | 3 | 5 | 7 | 11 | 13 | 17 | 19 | 23 | 25 |
---|---|---|---|---|---|---|---|---|---|---|
步长 | 2 | 4 | 2 | 4 | 2 | 4 | 2 | 4 |
由此,在循环中用一个可变步长就可以,C语言有可变步长;
然而Python没有可变步长这一说- -
下面上代码实现
from datetime import datetime
t1 = datetime.now()
count = 3 #2,3,5
lst = [3,5]
step = 4
i = 7
while i < 1000000:
if i%5 != 0:
middle = int(i**0.5)
flag = False
for x in lst:
if i%x == 0:
break
if x > middle:
flag = True
break
if flag:
lst.append(i)
count += 1
i += step
step = 4 if step == 2 else 2
t2 = datetime.now()
print("Total Number:", count, "Total_Cost:", (t2-t1).total_seconds(),"s")
----
Total Number: 78498 Total_Cost: 1.35155 s
1.513069s
—> 1.35155s
还可以哈哈
质数相关的理论
- 哥德巴赫猜想:任何大于5的奇数都是三个素数之和
- 衍生:任何一个大于2的偶数都是两个素数之和
- 伯特兰猜想:对于任意正整数n>1,存在一个素数p,使得n
- 孪生素数猜想:存在无穷多的形如p和p+2的素数对
- n2+1 猜想:存在无穷多个形如n2+1的素数,其中n是正整数
量子计算机,了解一下......密码学、区块链都将被重新定义~