质数判断
bool isPrime(int x){ if(x<2) return false; for(int i=2;i*i<=x;i++){ if(x%i==0) return false; } return true; }
复杂度分析 \(O(\sqrt{n})\)
引入问题,输入n(\(1\leq n\leq10^6\))个数字(\(0\leq x \leq 10^6\)),判断每个数是不是质数?
利用已有知识,程序框架:
while(n--){//循环n次 cin>>x;//输入数字 if(isPrime(x)){//判断x是否是质数 cout<<"Yes\n"; }else{ cout<<"No\n"; } }
我们来分析下时间复杂度 \(O(n\sqrt{x})\) 。
思考,当前数据范围下是否能在1s时限内求出答案。
回答:\(10^6\times 10^3 = 10^9\) 会超时。
进一步,该怎么去更快的处理大范围内的质数?
我们提前设置一个标记数组prime[N]
,提前标记好数字的质数状态,这样就能减少重复判断。
引出质数筛法
核心思想:唯一分解定理
每个大于1的自然数,要么本身就是质数,要么可以写为2个或以上的质数的积,而且这些质因子按大小排列之后,写法仅有一种方式。
埃拉托斯特尼选筛法,简称埃氏筛。要得到自然数n以内的全部素数,必须把不大于根号n的所有素数的倍数剔除,剩下的就是素数。
来理解下埃氏筛的思想
根据唯一分解定理的前半截“每个大于1的自然数,要么本身就是质数,要么可以写为2个或以上的质数的积”,那么换个角度去理解,合数一定是某个质数的倍数。
\[\begin{split} & 6=2\times 3\\ & 12=2\times 2\times 3\\ & 15=3\times 5 \end{split} \]那么,当我确定一个数为质数,我自然可以将它所有的范围内的倍数(\(\ge 2\))找出来,这些倍数一定是合数。
也就是若\(p\)为质数,那么\(j\times p,(j\ge2,j\times p\le n )\) 就是合数。
以30以内的筛选为例
\[\begin{split} & \ \ 2\ :\ 4\ 6\ 8\ 10\ 12\ 14\ 16\ 18\ 20\ 22\ 24\ 26\ 28\ 30\\ & \ \ 3\ :\ 6\ 9\ 12\ 15\ 18\ 21\ 24\ 27\ 30\\ & \ \ 5\ :\ 10\ 15\ 20\ 25\ 30\\ & \ \ 7\ :\ 14\ 21\ 28\\ & 11\ :\ 22\\ & 13\ :\ 26\\ & 17\ :\\ & 19\ :\\ & \ \ \ ... \end{split} \]配合图片,尝试手动模拟筛选过程。
算法步骤:
const int N=1e6+5; bool vis[N]; void esieve(int n){//标记0~n的数字的质数状态,并统计质数个数 vis[0]=vis[1]=1;//0,1属于非质数 for(int i=2;i<=n;i++){//标记剩下的2~n的数字的状态 if(vis[i]==0){//判断i是不是质数 思考:为什么这样就能判断i是质数? for(int j=2*i;j<=n;j+=i){//遍历范围内的i的倍数 vis[j]=1;//将倍数标记为1(非质数) } } } }
思考:第6行,为什么这样就能判断i是质数?
解答:状态数组初始化为0,循环的方向是从小到大,过程中质数的在范围内的倍数都会被筛选掉。那么到i
如果还是0,意味着质因子中不包含前面的这些质数,一个数在2~i-1
这个范围内没有因子,那么他就是质数。
根据约数的分布性,一个数n如果是合数,其中较小的约数范围一定是在\(\sqrt{n}\) 内。那么对于\(\sqrt{n}+1\)~\(n\) 范围内的合数,一定可以被\(2\)~\(\sqrt{n}\) 内的质数筛选掉。
const int N=1e6+5; bool vis[N]; void esieve(int n){//标记0~n的数字的质数状态,并统计质数个数 vis[0]=vis[1]=1; for(int i=2;i*i<=n;i++){//标记剩下的2~n的数字的状态 优化:到根号n即可停止 if(vis[i]==0){//判断i是不是质数 for(int j=2*i;j<=n;j+=i){//遍历范围内的i的倍数 vis[j]=1;//将倍数标记为1(非质数) } } } }
过程中可发现很多数字被重复筛选了。
接下来就是减少重复筛选,以提高运行速度。
观察重复的数字 :
\[\begin{split} 6& = 2\times 3\\ &=3 \times 2\\ 10&=2\times 5\\ &=5\times 2 \end{split} \]可发现质数p
与比它小的质数相乘得到的乘积,一定在之前被那么更小的质数筛过。那么筛选的时候直接从\(p^2\)开始筛选,避免重复。
const int N=1e6+5; bool vis[N]; void esieve(int n){//标记0~n的数字的质数状态,并统计质数个数 vis[0]=vis[1]=1; for(int i=2;i*i<=n;i++){//标记剩下的2~n的数字的状态 优化:到根号n即可停止 if(vis[i]==0){//判断i是不是质数 for(int j=i*i;j<=n;j+=i){//遍历范围内的i的倍数 从i*i开始,减少重复筛选 vis[j]=1;//将倍数标记为1(非质数) } } } }
时间复杂度\(O(nloglogn)\)
复杂度分析链接:https://www.cnblogs.com/dc93/p/3930362.html
今天是贝茜的生日,为了庆祝自己的生日,贝茜邀你来玩一个游戏。
贝茜让 N (\(1\leq N\leq 10^5\) ) 头奶牛坐成一个圈。除了$ 1 \(号与\) N \(号奶牛外,\)i$ 号奶牛与$ i−1 $号和 \(i+1\) 号奶牛相邻。$N $号奶牛与 \(1\) 号奶牛相邻。农夫约翰有一个桶,里面装满了很多纸条,每一张纸条上写了一个不一定是独一无二的 $1 $到\(10^6\) 的数字。
接着每一头奶牛 \(i\) 从桶中取出一张纸条$ A_i$ 。每头奶牛轮流走上一圈,同时拍打所有手上数字能整除在自己纸条上的数字的牛的头,然后做回到原来的位置。牛们希望你帮助他们确定,每一头奶牛走上一圈时能够拍打的牛的数量。
第一行包含一个整数n
第二行到n+1行每行包含一个整数\(A_i\)
共n行,每行包含一个整数,代表被拍打的牛的数量
5
2
1
2
3
4
2
0
2
1
3
根据题意概括一下,就是给出数列a,对于第i项的\(a_i\)求出数列中有多少个是他的约数。
暴力
遍历其它元素,统计他的约数的个数即可。复杂度\(O(n^2)\)
for(int i=1;i<=n;i++){ for(int j=1;j<=n;j++){ if(i!=j&&a[i]%a[j]==0){ cnt++; } } }
优化
利用埃氏筛的思想,统计数组中的内容,对它的倍数做的贡献即可。
#include <iostream> #include <cstdio> using namespace std; const int N=1e6+5; int a[N],cnt[N],M=0;//cnt[x]=k x在数列中的约数个数为k int main(){ int n; cin>>n; for(int i=1;i<=n;i++){ cin>>a[i]; cnt[a[i]]++;//记录次数 M=max(M,a[i]);//求值得最大范围 } for(int i=M;i>=1;i--){//从到大小进行遍历 if(!cnt[i]) continue;//没出现过的直接跳过 for(int j=2;j*i<=M;j++){//找范围内的i的倍数 if(cnt[j*i])//如果倍数也是在数列中的值 cnt[j*i]+=cnt[i];//倍数对应的在数列中的因数个数增加 } } for(int i=1;i<=n;i++){ cout<<cnt[a[i]]-1<<endl;//注意要去掉自己 } return 0; }
模拟出埃氏筛的筛选过程。
\[\begin{split} & \ \ 2\ :\ 4\ 6\ 8\ 10\ 12\ 14\ 16\ 18\ 20\ 22\ 24\ 26\ 28\ 30\\ & \ \ 3\ :\ 9\ 12\ 15\ 18\ 21\ 24\ 27\ 30\\ & \ \ 5\ :\ 25\ 30\\ & \ \ 7\ :\ \\ & 11\ :\ \\ & 13\ :\ \\ & 17\ :\\ & 19\ :\\ & \ \ \ ... \end{split} \]即便进行了一定的优化,但是依旧存在数字被重复筛选的问题。它的复杂度依旧不变\(O(nloglogn)\) 。
此时,若能让每个数字只被筛选一次,必然能大大地降低时间复杂度,减少运行时间,理论上的时间复杂度为\(O(n)\) 。
这种每个数字只被筛一遍的筛法叫做欧拉筛,也被称作线性筛。
那么,关键是,如何实现这一算法?
我们依旧利用唯一分解定理来实现。之前的埃氏筛,利用到了唯一分解定理的前半段,这次我们利用好它的后半截。
每个大于1的自然数,要么本身就是质数,要么可以写为2个或以上的质数的积,而且这些质因子按大小排列之后,写法仅有一种方式。
合数对应的分解因式,只要我们将这小质因子按大小排列好,那么分解式子就是唯一的。
我们要利用他的唯一性来做文章。我们只要能不重复的构造出这样的“唯一的质数序列”,那么必然不会重复筛选了。
此时我们将任意的一个数字都可看做为一个唯一的质数序列,如\(12\)可看作是序列\(2\times 2\times 3\) 。此时我们只要再找个质数,与这样的质数序列组合即可构成新的质数序列。
需要注意的是,如何防止重复?也就是怎么保证构造出来的序列的唯一性?我们新的质数组合进去之后,只要不破坏序列整体的有序性,即可实现不重复。假设,我们每次将质数是加在序列的前头,那么只需要\(P_{新质数}\leq 序列的最小质因子\) 即可保证整体有序。
例如 通过 \(2\times 2\times 3\) 进行新序列的组合的话,只能加质数2,形成新序列\(2\times 2\times 2\times 3=24\)。如果是序列\(15=3\times 5\)的话只能和2,3组合,形成新序列\(2\times 3\times5=30\)和\(3\times 3\times5=45\) 。
这样,我们在实现的时候就要在之前的基础上多一个质数表存放质数,好利用这些质数构成质数序列。
模板
时间复杂度\(O(n)\)
const int N=1e8+5; bool vis[N];//标记数组 int prime[N/10];//质数表,存放质数 int erla(int n){ vis[0]=vis[1]=1;//0.1不是质数 int cnt=0;//统计质数的个数 for(int i=2;i<=n;i++){ if(!vis[i]){//判断i是不是质数 prime[cnt++]=i;//将质数存到质数表中 } //遍历质数表 新序列 prime[j]*i for(int j=0;prime[j]*i<=n&&j<cnt;j++){ vis[prime[j]*i]=1;//标记组成的序列为非质数 if(i%prime[j]==0) break;//prime[j]是i的最小质因子 ,不能继续组合,避免重复 } } return cnt;//返回质数个数 }
思考:14行操作的意义,思考为什么这么做就能不重复地筛选?
回答:质数表中的质数是从小到大的,在遍历质数表时,可看做满足\(p_j\le i的最小值因子\) ,遍历到的质数与i构成的序列就不重复。当满足整除条件时,prime[j]
就是等于i
的最小质因子,再遍历下去,就不满足质数从小到大的关系。
求1~N中素数的个数。
一行一个整数N。
一行一个数,表示素数的个数。
10
4
对于40%的数据,\(1\leq N\leq 10^6\)。
对于80%的数据,\(1\leq N\leq 10^7\)。
对于100%的数据,\(1\leq N\leq 10^8\)。
注意数据范围,套欧拉筛模板即可。
在数论中,对正整数n欧拉函数是小于或等于n的正整数中与n互质的数的数目。
例如\(\phi(1)=1,(1)\),\(\phi(8)=4,(1,3,5,7)\)。如果i是素数,则\(\phi(i)=i-1\)。
设p为质数
三个性质:
实现代码
时间复杂度\(O(n)\)
bool vis[N];//标记数组 int prime[N];//质数表,存放质数 int phi[N]; int erla(int n){ vis[0]=vis[1]=1;//0.1不是质数 int cnt=0;//统计质数的个数 phi[1]=1;//1的欧拉函数值是1 for(int i=2;i<=n;i++){ if(!vis[i]){//判断i是不是质数 prime[cnt++]=i;//将质数存到质数表中 phi[i]=i-1;//性质1 } //遍历质数表 新序列 prime[j]*i for(int j=0;prime[j]*i<=n&&j<cnt;j++){ vis[prime[j]*i]=1;//标记组成的序列为非质数 if(i%prime[j]==0){ phi[i*prime[j]]=prime[j]*phi[i];//性质2 break;//prime[j]是i的最小质因子 ,不能继续组合,避免重复 }else{ phi[i*prime[j]]=(prime[j]-1)*phi[i];//性质3 } } } return cnt;//返回质数个数 }