python中支持操作MySQL的模块很多,其中最常见的当属:pymysql
属于第三方模块:pip install pymysql
1.链接服务端
打印成功表示已经连接上database
2.产生获取命令的游标对象(打开终端输入命令的地方)
3.编写sql语句
4.执行sql语句(返回的结果是sql语句之后受影响的行数)
5.获取结果
通过这种方式来获取数据,如果字段很多并且是相同数据类型,无法知道对应的数据,所以需要更加精确(字典是存储数据最精确的)
而在第二步中,cursor括号内不写参数,结果是元组套元组,不够精确,添加参数之后会将数据处理成字典
完整代码
结果:
[{'cid': 1, 'caption': '三年二班'}, {'cid': 2, 'caption': '三年三班'}, {'cid': 3, 'caption': '一年二班'}, {'cid': 4, 'caption': '二年九班'}]
fetchall():一次性获取所有结果
fetchone():获取结果集中的第一个;一个接着一个
fetchmany():获取结果集中的结果个数
cursor.scroll(1, 'relative'):相对于当前位置往后移动一个单位
cursor.scroll(1, 'absolute'):相对于起始位置往后移动一个单位
编写一个登录功能
第一种情况:写正确的用户名错误的密码也可以登录
第二种情况:用户名和密码都不需要也可以登录
将sql语句在navicat中运行,两种情况利用的是MySQL注释语法及逻辑运算符
第一种情况:
第二种情况:
想办法过滤掉特殊符号,execute方法自带校验SQL注入问题,自动处理特殊符号
sql = 'select * from userinfo where name = %s and password = %s;' cursor.execute(sql,(name,passord))
数据的增删改查四个操作除了查,其他三个没有效果
pymysql针对增、改、删三个操作,设置了二次确认,如果不确认则不会真正影响数据库
affect_rows = cursor.execute(sql) conn_obj.commit() # 二次确认
conn_obj = pymysql.connect( autocommit=True )
批量插入数据(不要忘了二次确认)
alter table 表名 rename 新表名;
alter table 表名 drop 字段名;
通过SQL语句的执行得到的一张虚拟表,保存下来之后就称之为视图
如果需要频繁的使用一张虚拟表,可以考虑制作成视图,降低操作难度
create view 视图名 as sql语句;
会造成表的混乱,毕竟视图不是真正的数据源
视图只能用于数据的查询,不能做增、删、改的操作,可能会影响原始数据
视图里面的数据是直接来源于原始表,而不是拷贝一份
在对表数据进行增、删、改的具体操作下,自动触发的功能
专门针对表数据的操作,定制个性化配套功能
create trigger 触发器名字 before/after insert/update/delete on 表名 for each row begin sql语句 end
一般情况下建议采用下列布局形式:
临时修改SQL语句的结束符:delimiter $$(将MySQL默认的结束符号;改成$$)
临时修改的原因:因为触发器、存储过程等技术的代码中也需要使用分号, 如果不修改,则无法书写出完成的代码
查看当前库下所有的触发器信息:show triggers\G;
删除当前库下指定的触发器信息:drop trigger 触发器名称;
事务可以包含诸多SQL语句并且这些SQL语句要么同时执行成功,要么同时执行失败,这是事务的原子性特点
A:原子性
一个事务是一个不可分割的整体,里面的操作要么都成立要么都不成立
C:一致性
事务必须使数据库从一个一致性状态变到另外一个一致性状态
I:隔离性
并发编程中,多个事务之间是相互隔离的,不会彼此干扰
D:持久性
事务一旦提交,产生的结果应该是永久的,不可逆的
1.创建表及录入数据
create table user( id int primary key auto_increment, name char(32), balance int ); insert into user(name,balance) values ('zhou',1000), ('chen',1000), ('wu',1000);
2.事务操作
开启一个事务的操作 start transaction; 编写SQL语句(同属于一个事务) update user set balance=900 where name='zhou'; update user set balance=1010 where name='chen'; update user set balance=1090 where name='wu'; 事务回滚(返回执行事务操作之前的数据库状态) rollback; # 执行完回滚之后,事务自动结束 事务确认(执行完事务的主动操作之后 确认无误之后 需要执行确认命令) commit; # 执行完确认提交之后,无法回滚,事务自动结束
类似于python中的自定义函数
delimiter $$ create procedure p1() begin select * from user; end $$ delimiter ;
call p1()
delimiter $$ create procedure p1( in m int, # in表示这个参数必须只能是传入不能被返回出去 in n int, out res int # out表示这个参数可以被返回出去,还有一个inout表示即可以传入也可以被返回出去 ) begin select tname from userinfo where id > m and id < n; set res=0; # 用来标志存储过程是否执行 end $$ delimiter ;
查看存储过程具体信息:show create procedure pro1;
查看所有存储过程:show procedure status;
删除存储过程:drop procedure pro1;
mysql内置的函数只能在sql语句中使用
1.移除指定字符
Trim、LTrim、RTrim
2.大小写转换
Lower、Upper
3.获取左右起始指定个数字符
Left、Right
4.返回读音相似值(对英文效果)
Soundex
5.日期格式
date_format;在MySQL中表示时间格式尽量采用2022-11-11形式
CREATE TABLE blog ( id INT PRIMARY KEY auto_increment, NAME CHAR (32), sub_time datetime ); INSERT INTO blog (NAME, sub_time) VALUES ('第1篇','2015-03-01 11:31:21'), ('第2篇','2015-03-11 16:31:21'), ('第3篇','2016-07-01 10:21:31'), ('第4篇','2016-07-22 09:23:21'), ('第5篇','2016-07-23 10:11:11'), ('第6篇','2016-07-25 11:21:31'), ('第7篇','2017-03-01 15:33:21'), ('第8篇','2017-03-01 17:32:21'), ('第9篇','2017-03-01 18:31:21'); select date_format(sub_time,'%Y-%m'),count(id) from blog group by date_format(sub_time,'%Y-%m'); 1.where Date(sub_time) = '2015-03-01' 2.where Year(sub_time)=2016 AND Month(sub_time)=07;
adddate:增加一个日期
addtime:增加一个时间
datediff:计算两个日期差值
if 条件: 子代码 elif 条件: 子代码 else: 子代码
if(条件){ 子代码 } else if(条件){ 子代码 }else{ 子代码 }
if 条件 then 子代码 elseif 条件 then 子代码 else 子代码 end if;
DECLARE num INT ; SET num = 0 ; # 声明一个变量 WHILE num < 10 DO # DO相当于问号 SELECT num ; SET num = num + 1 ; END WHILE ;
索引就是一种数据结构,类似于书的目录。意味着以后再查数据应该先找目录再找数据,而不是用翻页的方式查询数据
索引在MySQL中也叫做“键”,是存储引擎用于快速找到记录的一种数据结构
字段名:id name pwd post_comment addr age
基于id查找数据很快,但是基于addr查找数据就很慢,解决的措施可以是给addr添加索引;索引虽然好用,但是不能无限制的创建
在表中有大量数据的前提下,创建索引速度会很慢
在索引创建完毕后,对表的查询性能会大幅度提升,但是写的性能会降低(因为要把索引销毁重新写)
索引的底层数据结构是b+树,为了更好的基于树查找到相应的数据
只有叶子结点存放真实数据,根和树枝节点存的仅仅是虚拟数据
查询次数由树的层级决定,层级越低次数越少
一个磁盘块儿的大小是一定的,那也就意味着能存的数据量是一定的。如何保证树的层级最低呢?(一个磁盘块儿存放占用空间比较小的数据项)
一张表里面的什么字段字段建立索引能够降低树的层级高度>>> 主键id字段
聚集索引(primary key);辅助索引(unique key,index key)
查询数据的时候不可能都是用id作为筛选条件,也可能会用name,password等字段信息,那么这个时候就无法利用到聚集索引的加速查询效果。就需要给其他字段建立索引,这些索引就叫辅助索引。
叶子结点存放的是辅助索引字段对应的那条记录的主键的值(比如:按照name字段创建索引,那么叶子节点存放的是:{name对应的值:name所在的那条记录的主键值})
数据查找如果一开始使用的是辅助索引,那么还需要使用聚焦索引才可以获取到真实数据
覆盖索引:只在辅助索引的叶子节点中就已经找到了所有我们想要的数据
select name from user where name='shun';
非覆盖索引:虽然查询的时候命中了索引字段name,但是要查的是age字段,所以还需要利用主键才去查找
select age from user where name='shun';
首先需要了解MySQL的数据隔离级别
首先 MySQL 里有四个隔离级别:
在 InnoDB 中,默认为 Repeatable 级别,InnoDB 中使用一种被称为 next-key locking 的策略来避免幻读(phantom)现象的产生。
使用 select @@tx_isolation可以查看 MySQL 默认的事务隔离级别。
不同的事务隔离级别会导致不同的问题:
所谓脏读是指一个事务中访问到了另外一个事务未提交的数据
如果会话 2 更新 age 为 10,但是在 commit 之前,会话 1 希望得到 age,那么会获得的值就是更新前的值
或者如果会话 2 更新了值但是执行了 rollback,而会话 1 拿到的仍是 10
一个事务读取2次,得到的记录条数不一致
由于会话 2 在会话 1 之间插入了一个新的值,所以得到的两次数据就不一样了
一个事务读取同一条记录2次,得到的结果不一致
由于在读取中间变更了数据,所以会话 1 事务查询期间的得到的结果就不一样了
解决方案也就是上文提到的四种隔离级别,他们可以最大程度避免以上三种情况的发生:
1.未授权读取
也称为读未提交(Read Uncommitted):允许脏读取,但不允许更新丢失。如果一个事务已经开始写数据,则另外一个事务则不允许同时进行写操作,但允许其他事务读此行数据。该隔离级别可以通过“排他写锁”实现。
2.授权读取
也称为读提交(Read Committed):允许不可重复读取,但不允许脏读取。这可以通过“瞬间共享读锁”和“排他写锁”实现。读取数据的事务允许其他事务继续访问该行数据,但是未提交的写事务将会禁止其他事务访问该行。
3.可重复读取(Repeatable Read)
可重复读取(Repeatable Read):禁止不可重复读取和脏读取,但是有时可能出现幻读数据。这可以通过“共享读锁”和“排他写锁”实现。读取数据的事务将会禁止写事务(但允许读事务),写事务则禁止任何其他事务。
4.序列化(Serializable)
序列化(Serializable):提供严格的事务隔离。它要求事务序列化执行,事务只能一个接着一个地执行,不能并发执行。仅仅通过“行级锁”是无法实现事务序列化的,必须通过其他机制保证新插入的数据不会被刚执行查询操作的事务访问到。
隔离级别越高,越能保证数据的完整性和一致性,但是对并发性能的影响也越大。对于多数应用程序,可以优先考虑把数据库系统的隔离级别设为Read Committed。它能够避免脏读取,而且具有较好的并发性能。尽管它会导致不可重复读、幻读和第二类丢失更新这些并发问题,在可能出现这类问题的个别场合,可以由应用程序采用悲观锁或乐观锁来控制。