Python网络爬虫简介
网络爬虫,就是一种自动获取网页内容的程序。也就是通过源码解析来获得想要的内容。下载的内容包括文字,图片,多媒体文件等。
python有多个库可实现网络爬虫,Urllib是python内置的HTTP请求库,urllib的功能就是利用程序去执行各种HTTP请求。如果要模拟浏览器,需要把请求伪装成浏览器。
用途一:批量打包下载小说
用途二:下载各种图片
用途三:批量查询快递单号
用途四:采集数据并分类保存
用途五:下载音乐或视频
用途六:检查网站性能
用途七:监控数据,及时提醒
用途八:开发聊天机器人
用途九:抢车票、机票
用途………
总之,用途很多,还待我们去探索。
———–进入正题
在Windows下安装Python3有两种方式。
(1)一种是通过Anaconda安装,它提供了Python的科学计算环境,里面自带了Python以及常用的库。如果选择用了这个方式,后面的环境配置方式会更加简便。
(2)另一种是直接下载安装包安装,即标准的安装方式。
一、Anaconda安装步骤
1. Anaconda官方下载链接:https://www.anaconda.com/products/individual,选择Windows版本的安装包下载就OK啦!
Windows Python 3.8 64-Bit Graphical Installer (457 MB) 32-Bit Graphical Installer (403 MB)
2. 双击运行软件,点击 I Agree
3. 如果是自己一个人使用就点击Just Me选项,Next
4. 这一步安装的时候有点慢,请耐心等待,之后全部默认安装,Finish完成
5. 测试验证
点击开始菜单打开运行ANACONDA软件,所有的操作基本可在这个软件里完成,里面集成了大量工具,两个字”贴心”!
二、安装包安装
1. 官网下载地址:https://www.python.org/downloads/
windows版点击黄色的Windows它会跳转到python版本下载界面,选择你想下载的版本即可。
Download 大小27MB Windows installer (64-bit)
2. 软件安装,双击运行软件
Add Python 3.9 to PATH这个选框要勾上,不然后期你要手工添加完成变量配置。
点击“Customize installation”按钮,选择Python安装组件,将全部组件都选上。
3. 勾选前面五个框,点击install安装
install for all users 允许所有用户使用Python,如果是个人使用这一框可以不勾。
4. 安装完成并点击Close关闭
5. 比方需手工添加完成变量配置该怎么操作?
选中我的电脑属性——高级系统设置——高级——环境变量,将下面两行路径添加至环境变量中即可。
C:\Program Files\Python39\Scripts\——-pip3命令目录(pip3相当于Linux里面的yum命令)
C:\Program Files\Python39\—————–主程序安装目录
6. 添加别名(随意)
如果不添加就直接使用python命令或pip命令。
(1)打开主程序安装目录C:\Program Files\Python39\
(2)复制python.exe的副本改为python3
7. 测试验证
(1)运行对话框(WIN+R)输入cmd打开命令行窗口
(2)输入python、python3、pip3 -V查看python版本,能显示说明安装成功
请先
!