设为首页 - 加入收藏 武汉站长网 (http://www.027zz.com)- 国内知名站长资讯网站,提供最新最全的站长资讯,创业经验,网站建设等!
热搜: 什么 系统 手机 区块
当前位置: 首页 > 综合聚焦 > 移动互联 > 评测 > 正文

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

发布时间:2019-09-30 06:07 所属栏目:[评测] 来源:猪哥
导读:2019年国庆马上就要到来 猪哥今年想着来点新花样吧 玩肯定是要去玩的 不然怎么给祖国庆生 那去哪里玩人少big还高呢? 咱不是程序员嘛 那就用新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去分析下 看看哪些地方值得去 一、目标 使用Python分析出国庆哪些旅游景点:好玩、便宜、人还少的地方,不然拍照

2019年国庆马上就要到来

猪哥今年想着来点新花样吧

玩肯定是要去玩的

不然怎么给祖国庆生

那去哪里玩人少big还高呢?

咱不是程序员嘛

那就用新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去分析下

看看哪些地方值得去

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

一、目标

使用Python分析出国庆哪些旅游景点:好玩、便宜、人还少的地方,不然拍照都要抢着拍!

二、获取新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去

既然做新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去分析肯定要先搞到新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去,最开始猪哥在一些官方网站查找旅游信息,毕竟官方的新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去可信度高点, 但我一无所获,有点失望!

然后寻找其他替代方案:爬取出行网站的旅游景点售票新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去,这样也可以反映出旅游景点的热度!

猪哥首先想到 去哪儿,这里必须要安利一波去哪儿,同样的酒店同样的房间,去哪儿价格基本都是最低,所以猪哥也用的最多!

选好学习对象,那我就开始吧!

注??:本教程仅用作学习交流,如有侵害任何人权益,请联系猪哥删除!

1.爬取单页新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去

我们可以在哪去儿的门票页(http://piao.qunar.com/ticket/list.htm?keyword=)搜索:**国庆旅游景点**,就可以看到推荐的景点的一些信息,如:名称、地区、热度、销量、价格、等级、地理信息等等,信息应该说是比较全,良心!

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

然后按下F12打开浏览器调试窗口,查找加载新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去的url(翻页就可以看到)

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

竟然直接返回了json新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去,真是太方便了

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

最后使用requests库写一个get请求就可以了

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

这样一页新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去就抓取下来了,是不是很简单?

这里说下去哪儿门票页抓取新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去还是很简单,不需要登录、不需要代理 、甚至不需要header也可以成功,后面批量抓取页没出现限制,相对于淘宝来说简单了许多!

2.提取有效信息

既然新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去拿到了,那就看看新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去结构,然后提取自己想要的属性吧

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

这里猪哥提取了:id、名称、星级、评分、门票价格、销量、地区、坐标、简介这些信息,基本有效信息都保存起来!

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

3.保存到excel

需要的新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去提取出来之后,我们就可以将他们保存起来。这里我们使用pandas库保存excel文件。

没有安装pandas库的同学安装一下

  1. pip?install?xlrd?
  2. pip?install?openpyxl?
  3. pip?install?numpy?
  4. pip?install?pandas?

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

这里单页新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去的处理就完成了,爬取、解析、保存三步走~

4.批量爬取

批量爬取也很简单,先找分页新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去,多点几下页数比较不同参数就能看出来

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

经过一会的分析,我们便可以看出参数 page 就是分页参数了,这样我们在外层写一个for循环,把页数传入就可以实现批量爬取

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

那个36是我在网页上看到了,当然也可以实现自动判断是否爬取完成,只要判断每次返回的条数即可!

看看批量爬取的效果

用Python分析国庆旅游景点,告诉你哪些地方好玩、便宜、人又少

三 、分析新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去

新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去都下载完毕后,就要思考如何去利用分析这些新万博app新万博app_西甲联赛预测 万博app_万博体育app 登陆不进去了,猪哥简单做了几个分析:

  1. 景点门票销量排行分析
  2. 景点门票销售额排行分析
  3. 各省各等级景点数分析
  4. 景点销量热力图分析
  5. 推荐景点分析

我们使用的可视化库仍然是:pyecharts库 ,更多维度分析等待你去思考~

1.景点门票销量排行分析

【免责声明】本站内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

网友评论
推荐文章