Python爬取斗鱼弹幕

天涯浪子 提交于 2020-07-27 00:50:08

#主要思路

根据斗鱼后台协议发送数据。

主要步骤有:

(1)发送登录请求,用于完成登录授权;

(2)获取弹幕数据;

(3)保持登录状态;

(4)转码并将数据保存至Excel表中。

爬取的数据有:

用户ID、昵称、等级和弹幕内容。

更多:

将弹幕内容制作成词云。

开发工具

**Python版本:**3.5.4

相关模块:

requests模块、BeautifulSoup4模块、openpyxl模块、jieba模块、wordcloud模块以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

使用演示

在cmd窗口运行Get_DY_Barrage.py文件,根据提示输入房间号所需的弹幕数量即可。

随便找个人多的直播间演示下咯~~~

如下图所示:

image

结果:

image

image

##更多 关注转发文章后关注微信公众号:python工程狮,回复关键词“斗鱼”

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!