0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

python获取历届春晚数据

张敏 ? 来源:yiniuyun ? 作者:yiniuyun ? 2022-02-07 17:52 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

不知道今年的春晚大家看了吗?小编表示没有看,而且是已经很多年没有完整的看过春晚了,关于看春晚的热情都是小时候的事了。如今,距离第一届春晚 1983 年,整整过去了 39年,看过那么多春晚,哪一年、哪些节目、哪些人你还留有深刻印象呢?接下来,通过 Python 数据分析。

在网上找了很久发现没有关于春晚完整的数据,都是不连贯的,节目单表是每一年春晚上表演的节目,包括:节目类型、节目名、演员名这几项数据。这里我们就使用Python 抓取这类表格数据,方法简单,几行代码就能搞定,简单的示例代码如下:

#! -*- encoding:utf-8 -*- import requests import random # 要访问的目标页面 targetUrl = "http://httpbin.org/ip" # 要访问的目标HTTPS页面 # targetUrl = "https://httpbin.org/ip" # 代理服务器(产品官网 www.16yun.cn) proxyHost = "t.16yun.cn" proxyPort = "31111" # 代理验证信息 proxyUser = "username" proxyPass = "password" proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % { "host" : proxyHost, "port" : proxyPort, "user" : proxyUser, "pass" : proxyPass, } # 设置 http和https访问都是用HTTP代理 proxies = { "http" : proxyMeta, "https" : proxyMeta, } # 设置IP切换头 tunnel = random.randint(1,10000) headers = {"Proxy-Tunnel": str(tunnel)} resp = requests.get(targetUrl, proxies=proxies, headers=headers) print resp.status_code print resp.text

抓取下来的数据都比较混乱,需要用 Python 清洗处理一下就可以分析,这些不是重点,重点是在获取数据的过程中,目标网站有封反爬策略比如封ip,所以在访问过程中我加了代理,代码部分主要是关于如何使用动态转发模式代理示例,在学习爬虫中对代理有疑问的可以看下这里https://www.16yun.cn/。在获取数据之后就可以直接进入分析环节,从中我们可以看到谁导演春晚次数最多?谁主持春晚次数最多?谁上春晚次数最多等数据。

?

若有收获,就点个赞吧

审核编辑:鄢孟繁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7264

    浏览量

    92413
  • python
    +关注

    关注

    56

    文章

    4832

    浏览量

    87784
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    产品列表获取API接口详解

    ? 在现代软件开发中,API(应用程序编程接口)是获取产品列表的核心工具,它允许开发者从远程服务器高效地检索数据。本文将逐步介绍如何设计和使用产品列表获取API接口,包括核心概念、实现步骤、代码示例
    的头像 发表于 07-24 14:29 ?182次阅读
    产品列表<b class='flag-5'>获取</b>API接口详解

    如何使用 CYW20829 将获得的传感器数据发送到广播中?

    我计划使用外部传感器将原始数据输出到蓝牙模块的闪存中,然后通过蓝牙发送原始数据,与我个人笔记本电脑的蓝牙配对,并在我的个人电脑中获取这些原始数据。 我计划先用
    发表于 07-02 07:16

    跟老齐学Python:从入门到精通

    础的学习者介绍一门时下比较流行、并且用途比较广泛的编程语言,所以,本书读起来不晦涩,并且在其中穿插了很多貌似与Python 编程无关,但与学习者未来程序员职业生涯有关的内容。 获取完整文档资料可下载附件哦!!!! 如果内容有帮助可以关注、点赞、评论支持一下哦~
    发表于 06-03 16:10

    python入门圣经-高清电子书(建议下载)

    和Pygal 等强大的Python 库和工具介绍,以及列表、字典、if 语句、类、文件与异常、代码测试等内容; 第二部分将理论付诸实践,讲解如何开发三个项目,包括简单的Python 2D 游戏开发如何利用数据
    发表于 04-10 16:53

    树莓派遇上机器狗:科技界的“春晚明星”是怎样炼成的?

    机器人上春晚,这次穿上了东北花棉袄!每年春晚,总有一些节目让人眼前一亮,今年也不例外!UnitreeH1机器人化身“秧BOT”,身着东北花棉袄,扭起了“赛博秧歌”,吓坏了萌翻了全场观众。这已经不是
    的头像 发表于 03-25 09:25 ?520次阅读
    树莓派遇上机器狗:科技界的“<b class='flag-5'>春晚</b>明星”是怎样炼成的?

    爬虫数据获取实战指南:从入门到高效采集

    爬虫数据获取实战指南:从入门到高效采集 ? ? 在数字化浪潮中,数据已成为驱动商业增长的核心引擎。无论是市场趋势洞察、竞品动态追踪,还是用户行为分析,爬虫技术都能助你快速捕获目标信息。然而,如何既
    的头像 发表于 03-24 14:08 ?714次阅读

    TE HDC重载连接器助力蛇年春晚视觉盛宴

    今年的央视春晚看了么?“天地一体的演播空间”、“LED 立方体升降模块”、“如意造型的舞台”、“多维度协同控制”…… 蛇年春晚的科技浓度直线飙升。
    的头像 发表于 02-14 10:20 ?452次阅读

    Python Connector for InterBase连接解决方案

    ,以对存储的数据执行创建、读取、更新和删除操作。该解决方案完全符合 Python DB API 2.0 规范,并作为 Windows、macOS 和 Linux 的 wheel 包分发。 特征 高性能
    的头像 发表于 01-22 14:34 ?517次阅读

    使用Python实现xgboost教程

    使用Python实现XGBoost模型通常涉及以下几个步骤:数据准备、模型训练、模型评估和模型预测。以下是一个详细的教程,指导你如何在Python中使用XGBoost。 1. 安装XGBoost
    的头像 发表于 01-19 11:21 ?1489次阅读

    适用于MySQL和MariaDB的Python连接器:可靠的MySQL数据连接器和数据

    和 MariaDB 数据库服务器以及托管数据库服务,以对存储的数据执行创建、读取、更新和删除操作。该解决方案完全实现了 Python DB API 2.0 规范,并作为 Window
    的头像 发表于 01-17 12:18 ?570次阅读
    适用于MySQL和MariaDB的<b class='flag-5'>Python</b>连接器:可靠的MySQL<b class='flag-5'>数据</b>连接器和<b class='flag-5'>数据</b>库

    适用于Oracle的Python连接器:可访问托管以及非托管的数据

    适用于 Oracle 的 Python 连接器 适用于 Oracle 的 Python 连接器是一种可靠的连接解决方案,用于从 Python 应用程序访问 Oracle 数据库服务器和
    的头像 发表于 01-14 10:30 ?533次阅读

    阿里云成为总台春晚云计算AI合作伙伴

    近日,中央广播电视总台宣布了一项重要合作,正式将阿里云确定为总台春晚云计算AI独家合作伙伴。这一合作标志着总台春晚在技术创新和数字化转型方面迈出了重要一步。 作为总台春晚史上的首次技术合作伙伴引入
    的头像 发表于 12-27 10:32 ?545次阅读

    阿里云携手总台春晚,开创云计算AI合作新篇章

    近日,中央广播电视总台传来了一则令人瞩目的消息。12月26日,总台正式对外宣布,阿里云已成功成为总台春晚云计算AI的独家合作伙伴。这一合作标志着总台春晚在技术创新方面迈出了重要一步,为全球华人观众
    的头像 发表于 12-27 10:13 ?728次阅读

    使用Python进行串口通信的案例

    当然!以下是一个使用Python进行串口通信的简单示例。这个示例展示了如何配置串口、发送数据以及接收数据。我们将使用 pyserial 库,这是一个非常流行的用于串口通信的Python
    的头像 发表于 11-22 09:11 ?1640次阅读

    如何利用python和API查询IP地址?

    (但请注意,对于生产环境或高频查询,最好使用带密钥的服务以获取更好的性能和安全性)。首先,确保安装了requests库:pip install requests然后,您可以使用以下Python代码来
    发表于 08-28 11:55