safari

python实现抖音多线程下载无水印视频【附源码】

风格不统一 提交于 2020-11-22 14:40:29
昨天发了一个无水印解析,评论说想要多线程下载,还是比较简单的。 py文件同目录下创建url.txt,把链接一行一行复制进去,就能批量下载。 代码中的延时不能去掉,由于是多线程,速度较快,延时很重要。 import re import requests from concurrent import futures import time headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.96 Safari/537.36'} def download(_url): try: time.sleep(0.3) html3 = requests.head(_url,headers = headers) download_url = html3.headers['Location'] video_file = requests.get(download_url,headers = headers) file_name = download_url.split('=')[-1] print(file_name) except: print('Error') with open(file_name +

Python爬取抖音视频

我们两清 提交于 2020-11-22 14:23:02
最近在研究Python爬虫,顺便爬了一下抖音上的视频,找到了哥们喜欢的小姐姐居多,咱们给他爬下来吧. 最终爬取结果 好了废话补多说了,上代码! 1 # https://www.iesdouyin.com/aweme/v1/aweme/favorite/?user_id=86371592618 2 # &count=21&max_cursor=0&aid=1128&_signature=fBZqMxAcIH.WOSqz4s5eTHwWai&dytk=6849c66ff2a629554679fe#e4ad1343a5 3 # 分析url https://www.iesdouyin.com/share/user/86371592618 4 # 最终获取用户喜欢 5 import requests 6 7 url= " https://www.iesdouyin.com/share/user/86371592618 " 8 # 抖音本身反爬虫措施 9 headers= { 10 ' user-agent ' : ' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36 ' 11 } 12 # 获得dytk 13

一篇文章带你了解CSS3按钮知识

蓝咒 提交于 2020-11-22 09:50:48
在实际开发中,按钮的应用是必不可少。使用 CSS 来制作按钮,可以更有新意,更有趣,也可以自定义自己想要的样式。 一、平面样式CSS按钮 平面样式按钮的使用现在非常流行,并且符合无处不在的平面设计趋势。,这些的平面样式按钮效果很好看。 以下代码是按钮处于正常的情况下的状态。 例: .button { background-color: #4CAF50; /* Green */ border: none; color: white; padding: 15px 32px; text-align: center; text-decoration: none; display: inline-block; font-size: 16px; } 1. 按钮颜色 颜色:Green ,Blue, Red, Gray ,Black。 可以使用 background-color 属性来设置按钮颜色。 例 .button1 { background-color: #4CAF50; } /* Green */ .button2 { background-color: #008CBA; } /* Blue */ .button3 { background-color: #f44336; } /* Red */ .button4 { background-color: #FFC0CB; color:

使用Request+正则抓取猫眼电影(常见问题)

巧了我就是萌 提交于 2020-11-22 06:52:07
目前使用Request+正则表达式,爬取猫眼电影top100的例子很多,就不再具体阐述过程! 完整代码github:https://github.com/connordb/Top-100 总结一下,容易出错的问题有: 1.没有加请求头,导致输出没有具体信息! headers={ "User-Agent": "Mozilla / 5.0(Windows NT 6.1) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 67..3396.99 Safari / 537.36" } 2.正则出问题: 这个没有好的办法,只能写一点,然后打印输出,看看是否正确输出,常见的问题:另起一行要有+号;另起一行的时候头尾要有引号; 具体要抓取的内容要用(); pattern=re.compile('<dd>.*?board-index.*?>(\d+)</i>.*?title="(.*?)".*?star">(.*?)</p>.*?setime">(.*?)</p>' +'.*?integer">(.*?)</i>.*?fraction">(.*?)</i>',re.S) 3.写入文件出现问题: 在写入文件的时候,当你输入f.write(content)会报错,报错内容显示只能写入字符串格式,而不是字典格式,此时解决办法是写入 f.write(json

抓取猫眼部分信息

陌路散爱 提交于 2020-11-22 06:31:28
import requests import re import json from multiprocessing import Pool def get_one_page(url): header = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36', } res = requests.get(url,headers=header) if res.status_code == 200: return res.text else: return None def parse_html(html): html.replace('\n','') pattern = ('<i class="board-index.*?">(. ?)</i>. ?<img data-src="(. ?)". ?</a>. ?<a href. ?>(. ?)</a>. ?<p class="star"(. ?)</p>. ?releasetime">(. ?)</p>. ?integer">(. ?)</i>. ?fraction">(.*?)</i>') items = re.findall

【Python3爬虫】网易云音乐歌单下载

╄→尐↘猪︶ㄣ 提交于 2020-11-21 05:44:37
一、目标:   下载网易云音乐热门歌单 二、用到的模块:   requests,multiprocessing,re。 三、步骤:    (1)页面分析:首先打开网易云音乐,选择热门歌单,可以看到以下歌单列表,然后打开开发者工具    因此我们需要请求的url就是https://music.163.com/discover/playlist,然后用requests.get()方法请求页面,对于返回的结果,用正则表达式进行解析,得到歌单名字和歌单id,解析的正则表达式如下: res = requests.get(url, headers=headers) data = re.findall('<a title="(.*?)" href="/playlist\?id=(\d+)" class="msk"></a>', res.text)      (2)得到歌单名字和歌单id后,构造歌单的url,然后模仿步骤(1)可以得到歌曲名字和歌曲id,解析的正则表达式如下: re.findall(r'<a href="/song\?id=(\d+)">(.*?)</a>', res.text)   再得到歌曲id后,构造歌曲的url,然后用requests.get().content方法下载歌曲,歌曲的url构造方法如下: "http://music.163.com/song/media

什么?你还没女朋友?教你如何借助Python俘获女孩子芳心!

风格不统一 提交于 2020-11-21 05:02:21
天气降温,感情却升温了? 上午刚到公司,就收到小Q发来的灵魂拷问: “Q仔!要不然下午请个假!我带你去精神科看看!?”我实在忍不了,脱口而出。 话音未落,前排的运营小花回头看向小Q,莞尔一笑,百媚横生。 这个闷骚小伙子什么时候勾搭上运营一枝花了?我正要追问,小Q看穿了我的意图,故作正经:“咳咳!工作了工作了!” 一大早喂我这么一碗狗粮还让我专心工作?你们以为不说我就没办法找到线索? 伟大的哲学家亚里士少德曾经说过“一段感情的开始,往往是通过朋友圈体现的”。我点开了小花的朋友圈,刷啊刷啊刷,终于在半个月前的一条朋友圈里发现了端倪。 小Q这个闷葫芦,竟然每天下班前发一封天气关心邮件来俘获芳心!脑回路真是奇清! 怪不得今天一上班就和我说Python像是个月老,牵着他们的情愫!因为这些用Python来实现并自动化,可以说是分分钟的事儿。我这个动手狂魔决定来复现一下,顺便搞搞事情。 整个过程只涉及到爬取天气和发送邮件,可以说一气呵成。 在敲代码的过程中,我意识到最难的部分,是想到把两者结合,并编辑土味关怀发送给目标用户了。毕竟都9102年了,虽然天气预报随手可看,但真正有几个人每天会关注呢? 要拿到天气的数据, www.tianqi.com 这个网址比较适合,所有数据都可以直接在源代码中拿到,天气小可爱长这个样子: 爬取只需简单伪装headers,就可以快乐的定位到所有想拿的数据了

python爬虫入门 之 移动端数据的爬取

给你一囗甜甜゛ 提交于 2020-11-21 03:10:19
第七章 移动端数据的爬取 基于某一款抓包工具 : fiddler ,青花瓷 ,miteproxy 7.1 fiddler 基本配置 7.1.1fiddler简介和安装 什么是Fiddler? Fiddler是位于客户端和服务器端的HTTP代理,也是目前最常用的http抓包工具之一 。 它能够记录客户端和服务器之间的所有 HTTP请求,可以针对特定的HTTP请求,分析请求数据、设置断点、调试web应用、修改请求的数据,甚至可以修改服务器返回的数据,功能非常强大,是web调试的利器。 Fiddler安装 Fiddler下载地址: https://www.telerik.com/fiddler 傻瓜式安装,一键到底。Fiddler软件界面如图所示: 7.1.2手机APP抓包设置 Fiddler设置打开Fiddler软件,打开工具的设置。(Fiddler软件菜单栏:Tools->Options)在HTTPS中设置如下: 在Connections中设置如下 这里使用默认8888端口,当然也可以自己更改,但是注意不要与已经使用的端口冲突:Allow remote computers to connect:允许别的机器把请求发送到fiddler上来 安全证书下载 在电脑浏览器中输入地址: http://localhost:8888/ ,点击FiddlerRoot certificate

学习HTML5这一篇就够了

怎甘沉沦 提交于 2020-11-18 01:46:10
目录 第一章 HTML5概述 1.1、什么是HTML 1.2、什么是HTML5 1.3、本文重要说明 1.4、浏览器的版本 1.5、选择开发工具 第二章 HTML5语法 2.1、基本结构 2.2、语法规范 2.3、标签规范 第三章 HTML5标签 3.1、标题标签 3.2、段落标签 3.3、链接标签 3.4、图像标签 3.5、表格标签 3.6、列表标签 3.7、分组标签 3.8、语义标签 3.9、表单标签 3.10、框架标签 3.11、音频标签 3.12、视频标签 3.13、其它标签 3.14、头部标签 第四章 HTML5属性 4.1、属性概述 4.2、通用属性 第五章 HTML5事件 5.1、事件概述 5.2、窗口事件 5.3、表单事件 5.4、键盘事件 5.5、鼠标事件 5.6、媒体事件 5.7、其它事件 配套资料,免费下载 链接:https://pan.baidu.com/s/1xrblnEIJmxVbHSP7CIREcw 提取码:yws0 复制这段内容后打开百度网盘手机App,操作更方便哦 第一章 HTML5概述 1.1、什么是HTML HTML( H yper T ext M arkup L anguage,超文本标记语言)是用来描述网页的一种语言,它不是一种编程语言,而是一种 标记 语言。 1.2、什么是HTML5 HTML5是构建Web内容的一种语言描述方式

css引用字体问题

女生的网名这么多〃 提交于 2020-11-17 14:31:21
在CSS中通过 @font-face 属性来实现网页中嵌入特殊字体。首先获取要使用字体的三种文件格式.EOT、.TTF或.OTF、.SVG,确保能在主流浏览器中都能正常显示该字体。.EOT,适用于Internet Explorer 4.0+ .TTF或.OTF,适用于Firefox 3.5、Safari、Opera.SVG,适用于Chrome、IPhone最常见的是.TTF文件,需要通过这种文件格式转换为其余两种文件格式。在css中进行如下声明: @font-face { font-family: 'fontNameRegular'; src: url('fontName.eot'); src: local('fontName Regular'), local('fontName'), url('fontName.woff') format('woff'), url('fontName.ttf') format('truetype'), url('fontName.svg#fontName') format('svg'); } /*其中fontName替换为你的字体名称*/ 在css中使用这个字体h1{font-family: fontNameRegular} 来源: oschina 链接: https://my.oschina.net/u/2425659/blog/4721061