半秒内筛一亿以内的所有素数_筛一亿质数时间-程序员宅基地

【问题描述】：

　　　试编写一个程序，找出2->N之间的所有质数。希望用尽可能快的方法实现。
【问题分析】：
　　　这个问题可以有两种解法：一种是用“筛子法”，另一种是“除余法”。
　　　如果要了解“除余法”，请看另一篇文章连接 http://blog.csdn.net/lingling_1/article/details/44459423 《求质数之除余法(C语言描述)》。
　　　这里我们来讨论一下用“筛法”来解决这个问题。
　　　先来举个简单的例子来介绍一下“筛法”，求2~20的质数，它的做法是先把2~20这些数一字排开：
　　　2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
　　　先取出数组中最小的数，是2，则判断2是质数，把后面2的倍数全部删掉。
　　　2 | 3 5 7 9 11 13 15 17 19
　　　接下来的最小数是3，取出，再删掉3的倍数
　　　2 3 | 5 7 11 13 17 19
　　　一直这样下去，直到结束。剩下的数都是素数。
　　　筛法的原理是：
　　　1.数字2是素数。
　　　2.在数字K前，每找到一个素数，都会删除它的倍数，即以它为因子的整数。如果k未被删除，就表示2->k-1都不是k的因子，那k自然就是素数了。
　　　(1)除余法那篇文章里也介绍了，要找出一个数的因子，其实不需要检查2->k，只要从2->sqrt(k)，就可以了。所有，我们筛法里，其实只要筛到sqrt(n)就已经找出所有的素数了，其中n为要搜索的范围。
　　　(2)另外，我们不难发现，每找到一个素数k，就一次删除2k, 3k, 4k,..., ik，不免还是有些浪费，因为2k已经在找到素数2的时候删除过了，3k已经在找到素数3的时候删除了。因此，当i＜k时，都已经被前面的素数删除过了，只有那些最小的质因子是k的那些数还未被删除过，所有，就可以直接从k*k开始删除。
　　　(3)再有，所有的素数中，除了2以外，其他的都是奇数，那么，当i时奇数的时候，ik就是奇数，此时k*k+ik就是个偶数，偶数已经被2删除了，所有我们就可以以2k为单位删除步长，依次删除k*k, k*k+2k, k*k+4k, ...。
　　　(4)我们都清楚，在前面一小段范围内，素数是比较集中的，比如1->100之间就有25个素数。越到后面就越稀疏。
　　　因为这些素数本身值比较小，所以搜索范围内，大部分数都是它们的倍数，比如搜索1->100，这100个数。光是2的倍数就有50个，3的倍数有33个，5的倍数20个，7的倍数14个。我们只需搜索到7就可以，因此一共做删除操作50+33+20+14=117次，而2和3两个数就占了83次，这未免太浪费时间了。
　　　所以我们考虑，能不能一开始就排除这些小素数的倍数，这里用2和3来做例子。
　　　如果仅仅要排除2的倍数，数组里只保存奇数：1、3、5...，那数字k的坐标就是k/2。
　　　如果我们要同时排除2和3的倍数，因为2和3的最小公倍数是6，把数字按6来分组：6n, 6n+1, 6n+2, 6n+3, 6n+4, 6n+5。其中6n, 6n+2, 6n+4是2的倍数，6n+3是3的倍数。所以数组里将只剩下6n+1和6n+5。n从0开始，数组里的数字就一次是1, 5, 7, 11, 13, 17...。
　　　现在要解决的问题就是如何把数字k和它的坐标i对应起来。比如，给出数字89，它在数组中的下标是多少呢？不难发现，其实上面的序列，每两个为一组，具有相同的基数n，比如1和5，同是n=0那组数，6*0+1和6*0+5；31和35同是n=5那组，6*5+1和6*5+5。所以数字按6分组，每组2个数字，余数为5的数字在后，所以坐标需要加1。
　　　所以89在第89/6=14组，坐标为14*2=28，又因为89%6==5，所以在所求的坐标上加1，即28+1=29，最终得到89的坐标i=29。同样，找到一个素数k后，也可以求出k*k的坐标等，就可以做筛法了。
　　　这里，我们就需要用k做循环变量了，k从5开始，交替与2和4相加，即先是5+2=7，再是7+4=11，然后又是11+2=13...。这里我们可以再设一个变量gab，初始为4，每次做gab = 6 - gab，k += gab。让gab在2和4之间交替变化。另外，2和4都是2的幂，二进制分别为10和100，6的二进制位110，所以可以用k += gab ^= 6来代替。参考代码：
gab = 4;
for (k = 5; k * k <= N; k += gab ^= 6)
{
...
}
　　　但我们一般都采用下标i从0->x的策略，如果用i而不用k，那应该怎么写呢？
　　　由优化策略(1)可知，我们只要从k2开始筛选。n=i/2，我们知道了i对应的数字k是素数后，根据(2)，那如何求得k2的坐标j呢？这里假设i为偶数，即k=6n+1。
　　　k2 = (6n+1)*(6n+1) = 36n2 + 12n + 1，其中36n2+12n = 6(6n2+2n)是6的倍数，所以k2除6余1。
　　　所以k2的坐标j = k2/6*2 = 12n2+4n。
　　　由优化策略(2)可知，我们只要依次删除k2+2l×k, l = 0, 1, 2...。即(6n+1)×(6n+1+2l)。
　　　我们发现，但l=1, 4, 7...时，(6n+1+2l)是3的倍数，不在序列中。所以我们只要依次删除k2, k2+4l, k2+4l+2l...，又是依次替换2和4。
　　　为了简便，我们可以一次就删除k2和k2+4l两项，然后步长增加6l。所以我们需要求len=4l和stp=6l。不过这里要注意一点，k2+4k=(6n+1)*(6n+5)，除以6的余数是5，坐标要加1。
　　　len = k*(k+4)/6*2 - k2/6*2 = (6n+1)*(6n+1+4)/6*2+1 - (6n+1)*(6n+1)/6*2 = (12n2+12n+1) - (12n2+4n) = 8n+1;
　　　stp = k*(k+6)/6*2 - k2/6*2 = 12n+2;
　　　最终，我们得到：
　　　len = 8n+1;
　　　stp = 12n+2;
　　　 j　= 12n2+4n;
　　　同理可以求出k=6n+5时的情况：
　　　len = 4n+3;
　　　stp = 12n+10;
　　　 j　= 12n2+20n+8;
　　　下面的代码在实现上用了位运算，可能有点晦涩。
★注：第5种优化方法还是理论阶段，下面的代码中并未采用这种优化算法，仅供大家参考。
　　　(5)由(2)可知，如果每找到一个素数k，能依次只删除以k为最小素数因子的数，那么每个数字就都只被删除一次，那这个筛法就能达到线性的O(n)效率了。比如数字600 = 2*2*3*5*11，其中2是它的最小素数因子。那这个数就被2删除了。3、5、11虽然都是它的因子，但不做删除它的操作。要实现这种策略，那每找到一个素数k，那从k开始，一次后面未被删除的数字来与k相乘，删除它们的积。比如要筛出2～60之间的素数：
　　　1.先列出所有的数。
　　　2 3 4 5 6 7 8 9 10 11 12 13 14 15 ... 50 51 52 53 54 55 56 57 58 59 60
　　　2.选出序列中的第一个数，即2，判断它是素数，然后从2开始，依次与剩下的未被删除的数相乘，删除它们的积。即2*2=4， 2*3=6，2*4=8...。
　　　2 3 4 5 6 7 8 9 10 11 12 13 14 15 ... 50 51 52 53 54 55 56 57 58 59 60
　　　02 | 03 05 07 09 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
　　　3.去掉2后，再选出序列中第一个数，即3，判断它是素数，然后从3开始，依次与剩下的数相乘，即3*3=9，3*5=15，3*7=21...
　　　02 | 03 05 07 09 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
　　　02 03 | 05 07 11 13 15 17 19 23 25 29 31 35 37 41 43 47 49 53 55 59
　　　4.去掉3后，选出最小的数5，为素数，依次删除5*5=25，5*7=35，5*11=55，...
　　　02 03 | 05 07 11 13 15 17 19 23 25 29 31 35 37 41 43 47 49 53 55 59
　　　02 03 05 | 07 11 13 15 17 19 23 29 31 37 41 43 47 49 53 59
　　　5.去掉5后，选出最小的数7，为素数，删除7*7=49，...
　　　02 03 05 | 07 11 13 15 17 19 23 29 31 37 41 43 47 49 53 59
　　　02 03 05 | 07 11 13 15 17 19 23 29 31 37 41 43 47 53 59
　　　6.去掉7后，第一个数11的平方121大于60，所以结束。剩下的数字全为素数。
　　　02 03 05 07 11 13 15 17 19 23 29 31 37 41 43 47 53 59 |
　　　上面的操作效率很高，但在计算机中模拟的时候却又很大的障碍：
　　　首先，计算机内存是一维的空间，很多时候我们不能随心所欲，要实现上面的算法，要求这个数据结构既能很高效地查找某个特定的值，又能不费太大代价对序列中的元素进行删除。高效地查找，用数组是最合适的了，能在O(1)的时间内对内存进行读写，但要删除序列中一个元素却要O(n)；单链表可以用O(1)的时间做删除操作，当然要查找就只能是O(n)了。所以这个数据结构很难找。
　　　其次，筛法的一个缺点就是空间浪费太大，典型的以空间换时间。如果我们对数组进行压缩，比如初始时就排除了所有偶数，数组0对应数字1，1对应3，...。这样又会因为多了一道计算数字下标的工序而浪费时间。这又是一个矛盾的问题。
　　　也许我们可以试试折中的办法：数据结构综合数组和链表2种，数组用来做映射记录，链表来记录剩下的还未被删除的数据，而且开始也不必急着把链表里的节点释放掉，只要在数组里做个标记就可以了。下次遍历到这个数字时才删除。这样为了删除，可以算只遍历了一次链表，不过频繁地使用free()函数，也许又会减低效率。总之，我们所做的，依然是用空间来换时间，记录更多的信息，方便下次使用，减少再次生成信息所消耗的时间。
【程序清单】：

[cpp] view plain copy print ?

#include <time.h>
#include <stdio.h>
#define N 100000000
#define size (N/6*2 + (N%6 == 5? 2: (N%6>0)))
int p[size / 32 + 1] = {1};
int creat_prime(void)
{
　　　　int i, j;
　　　　int len, stp;
　　　　int c = size + 1;
　　　　for (i = 1; ((i&~1)<<1) * ((i&~1) + (i>>1) + 1) < size; i++)
　　　　{
　　　　　　　　if (p[i >> 5] >> (i & 31) & 1) continue;
　　　　　　　　len = (i & 1)? ((i&~1)<<1) + 3: ((i&~1)<<2) + 1;
　　　　　　　　stp = ((i&~1)<<1) + ((i&~1)<<2) + ((i & 1)? 10: 2);
　　　　　　　　j = ((i&~1)<<1) * (((i&~1)>>1) + (i&~1) + 1) + ((i & 1)? ((i&~1)<<3) + 8 + len: len);
　　　　　　　　for (; j < size; j += stp)
　　　　　　　　{
　　　　　　　　　　　　if (p[j >> 5] >> (j & 31) & 1 ^ 1)
　　　　　　　　　　　　　　　　p[j >> 5] |= 1L << (j & 31), --c;
　　　　　　　　　　　　if (p[(j-len) >> 5] >> ((j-len) & 31) & 1 ^ 1)
　　　　　　　　　　　　　　　　p[(j-len) >> 5] |= 1L << ((j-len) & 31), --c;
　　　　　　　　}
　　　　　　　　if (j - len < size && (p[(j-len) >> 5] >> ((j-len) & 31) & 1 ^ 1))
　　　　　　　　　　　　p[(j-len) >> 5] |= 1L << ((j-len) & 31), --c;
　　　　}
　　　　return c;
}
int main( )
{
　　　　clock_t t = clock();
　　　　printf("%d ", creat_prime());
　　　　printf("Time: %f ", 1.0 * (clock() - t) / CLOCKS_PER_SEC);
}

#include <time.h>
#include <stdio.h>
#define N 100000000
#define size (N/6*2 + (N%6 == 5? 2: (N%6>0)))
int p[size / 32 + 1] = {1};
int creat_prime(void)
{
　　　　int i, j;
　　　　int len, stp;
　　　　int c = size + 1;
　　　　for (i = 1; ((i&~1)<<1) * ((i&~1) + (i>>1) + 1) < size; i++)
　　　　{
　　　　　　　　if (p[i >> 5] >> (i & 31) & 1) continue;
　　　　　　　　len = (i & 1)? ((i&~1)<<1) + 3: ((i&~1)<<2) + 1;
　　　　　　　　stp = ((i&~1)<<1) + ((i&~1)<<2) + ((i & 1)? 10: 2);
　　　　　　　　j = ((i&~1)<<1) * (((i&~1)>>1) + (i&~1) + 1) + ((i & 1)? ((i&~1)<<3) + 8 + len: len);
　　　　　　　　for (; j < size; j += stp)
　　　　　　　　{
　　　　　　　　　　　　if (p[j >> 5] >> (j & 31) & 1 ^ 1)
　　　　　　　　　　　　　　　　p[j >> 5] |= 1L << (j & 31), --c;
　　　　　　　　　　　　if (p[(j-len) >> 5] >> ((j-len) & 31) & 1 ^ 1)
　　　　　　　　　　　　　　　　p[(j-len) >> 5] |= 1L << ((j-len) & 31), --c;
　　　　　　　　}
　　　　　　　　if (j - len < size && (p[(j-len) >> 5] >> ((j-len) & 31) & 1 ^ 1))
　　　　　　　　　　　　p[(j-len) >> 5] |= 1L << ((j-len) & 31), --c;
　　　　}
　　　　return c;
}
int main( )
{
　　　　clock_t t = clock();
　　　　printf("%d ", creat_prime());
　　　　printf("Time: %f ", 1.0 * (clock() - t) / CLOCKS_PER_SEC);
}

【运行结果】：
5761455
Time: 0.300000
运行环境：Linux debian 2.6.26-1-686、GCC (Debian 4.3.2-1.1) 4.3.2
【算法比较】：
　　　现在，我们已经拥有初步改进的“筛法”和“除余法”的函数了，把它们加到自己的函数库里。方便下次调用。
　　　这里，我想说一下个人对这两种算法的使用经验：
　　　就时间效率上讲，筛法绝对比除余法高。比如上面的代码，可以在半秒内筛一亿以内的所有素数。如果用除余法来解决这样的问题，绝对可以考验一个人的耐性。因此，在搜索空间比较大的时候，“筛法”无疑会是首选。
　　　但筛法是以空间换时间，用除余法，我们只要开一个可以容纳结果的数组就可以了，而筛法开的数组要求可以容纳整个搜索范围；另外，我们用“除余法”得到的结果，是一个已经排好序的素数序列，如果要解决的问题需要用到这些连续的素数，而且搜索范围也不大，那显然除余法很适合。而“筛法”得到的结果，是一个布尔型的表格，通过它，你可以很轻松的判断某个数是不是素数，但如果你想知道这个素数的下一个素数是多大，可能要费点劲了。

本文链接：https://blog.csdn.net/lingling_1/article/details/44462185

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

c# 调用c++ lib静态库_c#调用lib-程序员宅基地

文章浏览阅读2w次，点赞7次，收藏51次。四个步骤1.创建C++ Win32项目动态库dll 2.在Win32项目动态库中添加外部依赖项 lib头文件和lib库3.导出C接口4.c#调用c++动态库开始你的表演...①创建一个空白的解决方案，在解决方案中添加 Visual C++ , Win32 项目空白解决方案的创建：添加Visual C++ , Win32 项目这......_c#调用lib

deepin/ubuntu安装苹方字体-程序员宅基地

文章浏览阅读4.6k次。苹方字体是苹果系统上的黑体，挺好看的。注重颜值的网站都会使用，例如知乎：font-family: -apple-system, BlinkMacSystemFont, Helvetica Neue, PingFang SC, Microsoft YaHei, Source Han Sans SC, Noto Sans CJK SC, W..._ubuntu pingfang

html表单常见操作汇总_html表单的处理程序有那些-程序员宅基地

文章浏览阅读159次。表单表单概述表单标签表单域按钮控件demo表单标签表单标签基本语法结构<form action="处理数据程序的url地址“ method=”get|post“ name="表单名称”></form><!--method将表单中的数据传送给服务器处理，get方式直接显示在url地址中，数据可以被缓存，且长度有限制；而post方式数据隐藏传输，_html表单的处理程序有那些

PHP设置谷歌验证器（Google Authenticator）实现操作二步验证_php otp 验证器-程序员宅基地

文章浏览阅读1.2k次。使用说明:开启Google的登陆二步验证（即Google Authenticator服务）后用户登陆时需要输入额外由手机客户端生成的一次性密码。实现Google Authenticator功能需要服务器端和客户端的支持。服务器端负责密钥的生成、验证一次性密码是否正确。客户端记录密钥后生成一次性密码。下载谷歌验证类库文件放到项目合适位置(我这边放在项目Vender下面)https://github.com/PHPGangsta/GoogleAuthenticatorPHP代码示例://引入谷_php otp 验证器

【Python】matplotlib.plot画图横坐标混乱及间隔处理_matplotlib更改横轴间距-程序员宅基地

文章浏览阅读4.3k次，点赞5次，收藏11次。matplotlib.plot画图横坐标混乱及间隔处理_matplotlib更改横轴间距

docker — 容器存储_docker 保存容器-程序员宅基地

文章浏览阅读2.2k次。①Storage driver 处理各镜像层及容器层的处理细节，实现了多层数据的堆叠，为用户提供了多层数据合并后的统一视图②所有 Storage driver 都使用可堆叠图像层和写时复制（CoW）策略③docker info 命令可查看当系统上的 storage driver主要用于测试目的，不建议用于生成环境。_docker 保存容器

随便推点

网络拓扑结构_网络拓扑csdn-程序员宅基地

文章浏览阅读834次，点赞27次，收藏13次。网络拓扑结构是指计算机网络中各组件（如计算机、服务器、打印机、路由器、交换机等设备）及其连接线路在物理布局或逻辑构型上的排列形式。这种布局不仅描述了设备间的实际物理连接方式，也决定了数据在网络中流动的路径和方式。不同的网络拓扑结构影响着网络的性能、可靠性、可扩展性及管理维护的难易程度。_网络拓扑csdn

JS重写Date函数，兼容IOS系统_date.prototype 将所有 ios-程序员宅基地

文章浏览阅读1.8k次，点赞5次，收藏8次。IOS系统Date的坑要创建一个指定时间的new Date对象时，通常的做法是：new Date("2020-09-21 11:11:00")这行代码在 PC 端和安卓端都是正常的，而在 iOS 端则会提示 Invalid Date 无效日期。在IOS年月日中间的横岗许换成斜杠，也就是new Date("2020/09/21 11:11:00")通常为了兼容IOS的这个坑，需要做一些额外的特殊处理，笔者在开发的时候经常会忘了兼容IOS系统。所以就想试着重写Date函数，一劳永逸，避免每次ne_date.prototype 将所有 ios