本文主要是介绍20201303 2020-2021-2 《Python程序设计》实验四报告,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
20201303 2020-2021-2 《Python程序设计》实验四报告
课程:《Python程序设计》
班级:2013
姓名:张奕博
学号:20201303
实验教师:王志强
实验日期:2021年6月19日
必修/选修: 公选课
1.实验内容
Python综合应用:爬虫、数据处理、可视化、机器学习、神经网络、游戏、网络安全等。
我这次选择了爬虫进行实验操作,爬取了B站每天热门榜上的视频地址,UP名字,id,还有视频播放量和视频名,保存到一个CSV文件中。
2.实验过程及结果
目标网站:https://www.bilibili.com/v/popular/rank/all
工具:python3.9,火狐浏览器
实验过程:
2.1导入requests库,然后使用requests对目标网站发起访问
2.2导入BeautifulSoup,使用其对网站所需提取的信息进行更好的筛选
2.3爬取所需数据
先用soup将所有数据取出,然后根据所需数据不同的地址名字,爬取不同的数据
2.4将数据导入新建的csv文件中,并完善格式
新建了一个类,将其分类放入其中,并新建了一个vidoes的数组,将数据放入其中,最后依次输出即可
同理设定了一个csv_title函数,可以直接引用输出开头
最后全部代码展示
输出结果展示
3.码云链接
https://gitee.com/zhang-yibo/jin222/blob/master/main.py
4.制作过程中出现的问题
4.1主要的问题就是找的数据的地址范围太大,无法判断.
查找了资料,知道了可以用beautifulsoup减少工作量,使整个爬虫更简洁,效率更高。
4.2出现如下报错
解决途径:询问同学发现是没有utf-8编码,就加上了encoding='utf-8' 报错就没了。
课程感悟
整个python跟下来,感觉讲的是很详细,很有趣,无论是字典,数组,函数的介绍,还是最后的爬虫入门,让我对python有了兴趣,加上之前有一点基础,所以感觉课程难度适中,知识很多,需要练习来巩固。而老师课后发在蓝墨云的视频资料也起到了拓展作用,爬虫,GUI等让我非常感兴趣的,也让我感受到了python的功能强大与方便,希望以后还有更多时间来学习python。
这篇关于20201303 2020-2021-2 《Python程序设计》实验四报告的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!