在常见的几个音乐网站里,酷狗可以说是最好爬取的啦,什么弯都没有,也没加密啥的,所以最适合小白入门爬虫
项目源码
import requests
from selenium import webdriver
from pyquery import PyQuery as pq
#获取歌名
def Access_to_the_song(C):
doc=pq(C)
The_song=doc('.audioName').text()
return The_song
#进入听歌的界面爬取HTML
def Browser_access(URL):
The_browser=webdriver.ChromeOptions()
The_browser.set_headless()
Drier=webdriver.Chrome(options=The_browser)
Drier.get(URL)
Print_source=Drier.page_source
doc = pq(Print_source)
Music_links = doc('.music').items()
for i in Music_links:
Music_downloads = i.attr('src')
with open(Access_to_the_song(Print_source) + '.mp3', 'wb')as p:
p.write(requests.get(Music_downloads).content)
#爬取热门歌曲
def Music_links():
URL = 'http://www.kugou.com/yy/rank/home/1-6666.html?from=rank'
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}
response = requests.get(URL,headers=headers).text
doc = pq(response)
test = doc('.pc_temp_songname').items()
for i in test:
c = i.attr('href')
Browser_access(c)
Music_links()
初学者对Python的概念模糊不清的,Python能做什么,学的时候该按照什么线路去学习,学完往哪方面发展,想深入了解python web网站开发、python爬虫、数据分析、大数据,人工智能等技术可以加我微信!给大家分享一套Python学习资料,帮助大家在成为Python高手的道路上披荆斩棘!
帮忙点个 再看 转发一下 分享出去
然后加微信:XTUOL1988获取
PS:如果觉得本篇文章对您有所帮助,欢迎关注、订阅、顶!
*声明:本文于网络整理,版权归原作者所有,如来源信息有误或侵犯权益,请联系我们删除或授权事宜。
本文分享自微信公众号 - python教程(pythonjc)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
来源:oschina
链接:https://my.oschina.net/u/4581260/blog/4364769