写这篇文章纯属自娱自乐。

主要是近期在自学如何利用Python解决IT运维的一些问题时,总是不得其门而入,为了增加学习兴趣,就想通过完成一个小小有趣的爬虫程序激励下自己,同时也把这次经历跟各位道友分享下。

Technorati Tags: Python,爬网,×××,数据,夏明亮

首先申明,本人不是专职coding的,所以,代码部分如果不符合专业审美,还请多多包涵;俺就是纯粹以实习那目标为基础的小白一枚;思路为先,抛砖引玉~


步骤一:利用搜索引擎找到你需要的信息的网页资源

1. 打开百度搜索”×××网”

第一个链接就是中彩网的官网;打开网站;在导航栏找到双色球并打开链接。

再找到开奖数据

找到往期回顾。

可以看到这就是我们需要获取的信息。

步骤二:分析网页源代码。

在网页上右击——>查看源代码或者直接按F12键。

借助浏览器我们很方便就可以得到网页的源码及网页中显示的数据对应的原始值。

接下来我们再看这个网页是不是就是简简单单的纯静态页面呢?怎么看呢?

1. 当前页面的网址(www.zhcw.com/ssq/kaijiangshuju/#)

2. 我们再点击下这个页面的下面几个位置

3. 看到其实他们的网址是不变的(www.zhcw.com/ssq/kaijiangshuju/#);这说明了什么?说明这些内容其实是嵌套在网页中网页文件。

那么问题来了?如何能获得嵌套网页的真实网址呢?这里我们还是要借助我们的浏览器工具(开发者工具F12)

先F12;找到Network;再单击页面山的“往期回顾”

得到这些交互数据:

制作微信网页本科自考多少钱小红书笔记推广自己建网站写小说独立站怎么推广引流网推推荐信六安百度公司六安百度推广郑州一建第七项目部成都官网seo厂家好用的企业邮箱建筑网页设计详情中国工商注册网企业年报系统网页加速器哪个好手机怎么自己做软件沈阳招标信息网官网新疆网站备案论客企业邮箱官网西双版纳傣族自治州天气最近湘潭的新闻网站查询域名ip入口公司注册流程步骤图最好的 受欢迎的 免费的福州设计公司排名四库一平台查询入口组织建设方面存在的问题微信公众号二维码上海开发app赣州网红打卡地营销咨询师是做什么的中国建设银行网上银行登录广西建设人力资源网