质数筛与欧拉函数

本文主要是介绍质数筛与欧拉函数，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

第一课时

复习及引入

质数判断

bool isPrime(int x){
    if(x<2) return false;
    for(int i=2;i*i<=x;i++){
        if(x%i==0) return false;
    }
    return true;
}

复杂度分析 $O(\sqrt{n})$

引入问题，输入n($1\leq n\leq10^6$)个数字($0\leq x \leq 10^6$)，判断每个数是不是质数？

利用已有知识，程序框架：

while(n--){//循环n次
    cin>>x;//输入数字
    if(isPrime(x)){//判断x是否是质数
        cout<<"Yes\n";
    }else{
        cout<<"No\n";
    }
}

我们来分析下时间复杂度 $O(n\sqrt{x})$ 。

思考，当前数据范围下是否能在1s时限内求出答案。

回答：$10^6\times 10^3 = 10^9$ 会超时。

进一步，该怎么去更快的处理大范围内的质数？

我们提前设置一个标记数组prime[N] ,提前标记好数字的质数状态，这样就能减少重复判断。

引出质数筛法

核心思想：唯一分解定理

每个大于1的自然数，要么本身就是质数，要么可以写为2个或以上的质数的积，而且这些质因子按大小排列之后，写法仅有一种方式。

埃氏筛

埃拉托斯特尼选筛法，简称埃氏筛。要得到自然数n以内的全部素数，必须把不大于根号n的所有素数的倍数剔除，剩下的就是素数。

来理解下埃氏筛的思想

根据唯一分解定理的前半截“每个大于1的自然数，要么本身就是质数，要么可以写为2个或以上的质数的积”，那么换个角度去理解，合数一定是某个质数的倍数。

\[\begin{split} & 6=2\times 3\\ & 12=2\times 2\times 3\\ & 15=3\times 5 \end{split} \]

那么，当我确定一个数为质数，我自然可以将它所有的范围内的倍数($\ge 2$)找出来，这些倍数一定是合数。

也就是若$p$为质数，那么$j\times p,(j\ge2,j\times p\le n )$ 就是合数。

以30以内的筛选为例

\[\begin{split} & \ \ 2\ :\ 4\ 6\ 8\ 10\ 12\ 14\ 16\ 18\ 20\ 22\ 24\ 26\ 28\ 30\\ & \ \ 3\ :\ 6\ 9\ 12\ 15\ 18\ 21\ 24\ 27\ 30\\ & \ \ 5\ :\ 10\ 15\ 20\ 25\ 30\\ & \ \ 7\ :\ 14\ 21\ 28\\ & 11\ :\ 22\\ & 13\ :\ 26\\ & 17\ :\\ & 19\ :\\ & \ \ \ ... \end{split} \]

配合图片，尝试手动模拟筛选过程。

算法步骤：

设置一个标记数组vis[N],初始化为0。0-是质数 1-不是质数
处理特殊值 0 ，1
从2开始，依次将范围内的质数的倍数标记为1（非质数）

初版:

const int N=1e6+5;
bool vis[N];
void esieve(int n){//标记0~n的数字的质数状态,并统计质数个数
	vis[0]=vis[1]=1;//0，1属于非质数
	for(int i=2;i<=n;i++){//标记剩下的2~n的数字的状态
		if(vis[i]==0){//判断i是不是质数 思考：为什么这样就能判断i是质数？
			for(int j=2*i;j<=n;j+=i){//遍历范围内的i的倍数
				vis[j]=1;//将倍数标记为1（非质数）
			}
		}
	}
}

思考：第6行，为什么这样就能判断i是质数？

解答：状态数组初始化为0，循环的方向是从小到大，过程中质数的在范围内的倍数都会被筛选掉。那么到i如果还是0,意味着质因子中不包含前面的这些质数，一个数在2~i-1这个范围内没有因子，那么他就是质数。

优化1

根据约数的分布性，一个数n如果是合数，其中较小的约数范围一定是在$\sqrt{n}$ 内。那么对于$\sqrt{n}+1$~$n$ 范围内的合数，一定可以被$2$~$\sqrt{n}$ 内的质数筛选掉。

const int N=1e6+5;
bool vis[N];
void esieve(int n){//标记0~n的数字的质数状态,并统计质数个数
    vis[0]=vis[1]=1;
	for(int i=2;i*i<=n;i++){//标记剩下的2~n的数字的状态 优化：到根号n即可停止
		if(vis[i]==0){//判断i是不是质数 
			for(int j=2*i;j<=n;j+=i){//遍历范围内的i的倍数
				vis[j]=1;//将倍数标记为1（非质数）
			}
		}
	}
}

优化2

过程中可发现很多数字被重复筛选了。

接下来就是减少重复筛选，以提高运行速度。

观察重复的数字 :

\[\begin{split} 6& = 2\times 3\\ &=3 \times 2\\ 10&=2\times 5\\ &=5\times 2 \end{split} \]

可发现质数p与比它小的质数相乘得到的乘积，一定在之前被那么更小的质数筛过。那么筛选的时候直接从$p^2$开始筛选，避免重复。

const int N=1e6+5;
bool vis[N];
void esieve(int n){//标记0~n的数字的质数状态,并统计质数个数
    vis[0]=vis[1]=1;
	for(int i=2;i*i<=n;i++){//标记剩下的2~n的数字的状态 优化：到根号n即可停止
		if(vis[i]==0){//判断i是不是质数 
			for(int j=i*i;j<=n;j+=i){//遍历范围内的i的倍数 从i*i开始，减少重复筛选
				vis[j]=1;//将倍数标记为1（非质数）
			}
		}
	}
}

时间复杂度$O(nloglogn)$

复杂度分析链接：https://www.cnblogs.com/dc93/p/3930362.html

习题巩固

题目描述

今天是贝茜的生日，为了庆祝自己的生日，贝茜邀你来玩一个游戏。

贝茜让 N ($1\leq N\leq 10^5$ ) 头奶牛坐成一个圈。除了$ 1 $号与$ N $号奶牛外，$i$ 号奶牛与$ i−1 $号和 $i+1$ 号奶牛相邻。$N $号奶牛与 $1$ 号奶牛相邻。农夫约翰有一个桶，里面装满了很多纸条，每一张纸条上写了一个不一定是独一无二的 $1 $到$10^6$ 的数字。

接着每一头奶牛 $i$ 从桶中取出一张纸条$ A_i$ 。每头奶牛轮流走上一圈，同时拍打所有手上数字能整除在自己纸条上的数字的牛的头，然后做回到原来的位置。牛们希望你帮助他们确定，每一头奶牛走上一圈时能够拍打的牛的数量。

输入格式

第一行包含一个整数n

第二行到n+1行每行包含一个整数$A_i$

输出格式

共n行，每行包含一个整数，代表被拍打的牛的数量

样例输入

5
2
1
2
3
4

样例输出

2
0
2
1
3

分析

根据题意概括一下，就是给出数列a,对于第i项的$a_i$求出数列中有多少个是他的约数。

暴力

遍历其它元素，统计他的约数的个数即可。复杂度$O(n^2)$

for(int i=1;i<=n;i++){
    for(int j=1;j<=n;j++){
        if(i!=j&&a[i]%a[j]==0){
            cnt++;
        }
    }
}

优化

利用埃氏筛的思想，统计数组中的内容，对它的倍数做的贡献即可。

#include <iostream>
#include <cstdio>
using namespace std;
const int N=1e6+5;
int a[N],cnt[N],M=0;//cnt[x]=k x在数列中的约数个数为k
int main(){
	int n;
	cin>>n;
	for(int i=1;i<=n;i++){
		cin>>a[i];
		cnt[a[i]]++;//记录次数
		M=max(M,a[i]);//求值得最大范围
	}
	for(int i=M;i>=1;i--){//从到大小进行遍历
		if(!cnt[i]) continue;//没出现过的直接跳过
		for(int j=2;j*i<=M;j++){//找范围内的i的倍数
			if(cnt[j*i])//如果倍数也是在数列中的值
				cnt[j*i]+=cnt[i];//倍数对应的在数列中的因数个数增加
		}
	}
	for(int i=1;i<=n;i++){
		cout<<cnt[a[i]]-1<<endl;//注意要去掉自己
	}
	return 0;
}

第二课时

欧拉筛

模拟出埃氏筛的筛选过程。

\[\begin{split} & \ \ 2\ :\ 4\ 6\ 8\ 10\ 12\ 14\ 16\ 18\ 20\ 22\ 24\ 26\ 28\ 30\\ & \ \ 3\ :\ 9\ 12\ 15\ 18\ 21\ 24\ 27\ 30\\ & \ \ 5\ :\ 25\ 30\\ & \ \ 7\ :\ \\ & 11\ :\ \\ & 13\ :\ \\ & 17\ :\\ & 19\ :\\ & \ \ \ ... \end{split} \]

即便进行了一定的优化，但是依旧存在数字被重复筛选的问题。它的复杂度依旧不变$O(nloglogn)$ 。

此时，若能让每个数字只被筛选一次，必然能大大地降低时间复杂度，减少运行时间，理论上的时间复杂度为$O(n)$ 。

这种每个数字只被筛一遍的筛法叫做欧拉筛，也被称作线性筛。

那么，关键是，如何实现这一算法？

我们依旧利用唯一分解定理来实现。之前的埃氏筛，利用到了唯一分解定理的前半段，这次我们利用好它的后半截。

每个大于1的自然数，要么本身就是质数，要么可以写为2个或以上的质数的积，而且这些质因子按大小排列之后，写法仅有一种方式。

合数对应的分解因式，只要我们将这小质因子按大小排列好，那么分解式子就是唯一的。

我们要利用他的唯一性来做文章。我们只要能不重复的构造出这样的“唯一的质数序列”，那么必然不会重复筛选了。

此时我们将任意的一个数字都可看做为一个唯一的质数序列，如$12$可看作是序列$2\times 2\times 3$ 。此时我们只要再找个质数，与这样的质数序列组合即可构成新的质数序列。

需要注意的是，如何防止重复？也就是怎么保证构造出来的序列的唯一性？我们新的质数组合进去之后，只要不破坏序列整体的有序性，即可实现不重复。假设，我们每次将质数是加在序列的前头，那么只需要$P_{新质数}\leq 序列的最小质因子$ 即可保证整体有序。

例如通过 $2\times 2\times 3$ 进行新序列的组合的话，只能加质数2，形成新序列$2\times 2\times 2\times 3=24$。如果是序列$15=3\times 5$的话只能和2，3组合，形成新序列$2\times 3\times5=30$和$3\times 3\times5=45$ 。

这样，我们在实现的时候就要在之前的基础上多一个质数表存放质数，好利用这些质数构成质数序列。

模板

时间复杂度$O(n)$

const int N=1e8+5;
bool vis[N];//标记数组
int prime[N/10];//质数表，存放质数
int erla(int n){
	vis[0]=vis[1]=1;//0.1不是质数
	int cnt=0;//统计质数的个数
	for(int i=2;i<=n;i++){
		if(!vis[i]){//判断i是不是质数
			prime[cnt++]=i;//将质数存到质数表中
		}
		//遍历质数表 新序列 prime[j]*i
		for(int j=0;prime[j]*i<=n&&j<cnt;j++){
			vis[prime[j]*i]=1;//标记组成的序列为非质数
			if(i%prime[j]==0) break;//prime[j]是i的最小质因子 ，不能继续组合，避免重复
		}
	}
	return cnt;//返回质数个数
}

思考：14行操作的意义，思考为什么这么做就能不重复地筛选？

回答：质数表中的质数是从小到大的，在遍历质数表时，可看做满足$p_j\le i的最小值因子$ ，遍历到的质数与i构成的序列就不重复。当满足整除条件时，prime[j]就是等于i的最小质因子，再遍历下去，就不满足质数从小到大的关系。

习题巩固

哥德巴赫猜想（升级版）

问题描述

求1~N中素数的个数。

输入格式

一行一个整数N。

输出格式

一行一个数，表示素数的个数。

输入样例

10

输出样例

4

数据范围

对于40%的数据，$1\leq N\leq 10^6$。

对于80%的数据，$1\leq N\leq 10^7$。

对于100%的数据，$1\leq N\leq 10^8$。

分析

注意数据范围，套欧拉筛模板即可。

第三课时

欧拉函数

在数论中，对正整数n欧拉函数是小于或等于n的正整数中与n互质的数的数目。

例如$\phi(1)=1,(1)$,$\phi(8)=4,(1,3,5,7)$。如果i是素数，则$\phi(i)=i-1$。

设p为质数

三个性质：

$\phi(p)=p-1$
$i\ mod\ p = 0,\phi(i\times p)=p\times \phi(i)$
$i\ mod\ p \ne 0,\phi(i\times p)=(p-1)\times \phi(i)$

实现代码

时间复杂度$O(n)$

bool vis[N];//标记数组
int prime[N];//质数表，存放质数
int phi[N];
int erla(int n){
	vis[0]=vis[1]=1;//0.1不是质数
	int cnt=0;//统计质数的个数
	phi[1]=1;//1的欧拉函数值是1
	for(int i=2;i<=n;i++){
		if(!vis[i]){//判断i是不是质数
			prime[cnt++]=i;//将质数存到质数表中
			phi[i]=i-1;//性质1
		}
		//遍历质数表 新序列 prime[j]*i
		for(int j=0;prime[j]*i<=n&&j<cnt;j++){
			vis[prime[j]*i]=1;//标记组成的序列为非质数
			if(i%prime[j]==0){
				phi[i*prime[j]]=prime[j]*phi[i];//性质2
				break;//prime[j]是i的最小质因子 ，不能继续组合，避免重复
			}else{
				phi[i*prime[j]]=(prime[j]-1)*phi[i];//性质3
			}
		}
	}
	return cnt;//返回质数个数
}

这篇关于质数筛与欧拉函数的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

质数筛与欧拉函数

第一课时

复习及引入

埃氏筛

初版:

优化1

优化2

习题巩固

题目描述

输入格式

输出格式

样例输入

样例输出

分析

第二课时

欧拉筛

习题巩固

哥德巴赫猜想（升级版）

问题描述

输入格式

输出格式

输入样例

输出样例

数据范围

分析

第三课时

欧拉函数

前端开发

后端开发

移动端开发

数据库

服务器运维

人工智能

区块链

游戏开发

网站运营

大数据/云计算

软件工程

软件/开发工具使用

资讯