python教程

Python自动下载歌曲宝音乐和歌词脚本

我的站长站 2023-03-20 人阅读

发现一个宝藏级音乐下载网站-歌曲宝,里面的各大歌曲都可以免费下载,但是需要一个一个下载,很麻烦,于是写了一端Python脚本,可以自动下载歌曲宝音乐和歌词。

from selenium import webdriver
import requests
from bs4 import BeautifulSoup
import os
options = webdriver.ChromeOptions()
options.add_argument('--headless')
# 给请求指定一个请求头来模拟chrome浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36',
    'cookie':'__51uvsct__JZKGLNhr7gNTmF1z=1; __51vcke__JZKGLNhr7gNTmF1z=dbcc8135-b908-58b9-ab0f-f09772cc8ef9; __51vuft__JZKGLNhr7gNTmF1z=1673170099915; __vtins__JZKGLNhr7gNTmF1z=%7B%22sid%22%3A%20%2250340dc9-526b-5b41-8642-2fa520c011a5%22%2C%20%22vd%22%3A%2030%2C%20%22stt%22%3A%204104371%2C%20%22dr%22%3A%20616811%2C%20%22expires%22%3A%201673176004282%2C%20%22ct%22%3A%201673174204282%7D'
}
server = 'https://www.gequbao.com'
# 凤凰传奇地址
singer = 'https://www.gequbao.com/s/%E8%B4%B9%E7%8E%89%E6%B8%85'
 
 
# 获取歌曲内容
def get_contents(song,song_title,singer_name):
    # print(song)
    save_url = 'G:/python/songs/{}'.format(singer_name)
    save_lrc_path = 'G:/python/songs/{}/{}.lrc'.format(singer_name,song_title)
    res = requests.get(url=song, headers=headers)
    res.encoding = 'utf-8'
    html = res.text
    soup = BeautifulSoup(html, 'html.parser')
    # 获取歌曲的下载链接
    driver = webdriver.Chrome(options=options)
    driver.get(song)
 
    song_elem = driver.find_element_by_id("btn-download-mp3")
    lrc_elem = driver.find_element_by_id("btn-download-lrc")
    download_url = song_elem.get_attribute('href')
    lrc_url = lrc_elem.get_attribute('href')
    # 读取MP3资源
    req = requests.get(download_url, stream=True)
    # 文件夹不存在,则创建文件夹
    folder = os.path.exists(save_url)
    if not folder:
        os.makedirs(save_url)
 
    # 文件存储地址
    full_title = song_title + '.mp3'
    file_path = os.path.join(save_url, full_title)
    print('开始写入歌曲:', file_path)
    # 打开本地文件夹路径file_path,以二进制流方式写入,保存到本地
    with open(file_path, 'wb') as fd:
        for chunk in req.iter_content():
            fd.write(chunk)
    print(song_title + '成功下载!')
    # 下载歌词
    print('开始写入歌词:', save_lrc_path)
    r = requests.get(lrc_url).content
    with open(save_lrc_path, 'wb') as fd:
        fd.write(r)
        fd.close()
    print(song_title + '歌词成功下载!')
 
 
# 主方法
def main():
    res = requests.get(singer, headers=headers)
    res.encoding = 'utf-8'
    html = res.text
    # 使用自带的html.parser解析
    soup = BeautifulSoup(html, 'html.parser')
    # 获取歌曲的列表
    songs = soup.find('div', class_='card-text').find_all(class_='text-primary')
    singer_name = soup.find('input', id='s-input-line')['value']
    print('查询到歌曲数: %d ' % len(songs))
    for each in songs:
        try:
            song = server + each.get('href')
            song_title = each.get_text().strip()
            get_contents(song,song_title,singer_name)
        except Exception as e:
            print(e)
 
 
if __name__ == '__main__':
    main()

运行之后需要输入要下载的歌手搜索结果页

下载速度有点慢,而且访问太频繁系统会返回443,但是满足需求了。

相关推荐
  • Python脚本
  • 监测腾讯云轻量服务器流量超标关机python脚本

    脚本介绍一款监测腾讯云轻量应用服务器流量包使用情况,并根据配置进行警告和关机的Python脚本。GitHub:https://github.com/XiaoXinYo/Tencent_Cloud_LightHouse_Server_Guardian脚本功能仅用于轻量级服务器1.自动检测流量包剩余,可设置使用比2.自动关...

    python教程 87 2年前
  • Python无需认证QQ扫码登录脚本

    无需认证QQ扫码登录脚本python脚本,盗用JD的QQ登录,也可以改成其他网址。无需自己注册腾讯开发者,无需自己有一套网址去申请应用Get_QQ返回QQ号,也可以获取到QQ头像、好友等其他信息,请勿用于非法行为import requestsimport timefrom PIL import Imagedef...

    python教程 334 3年前
  • 最新python织梦dedecms远程执行脚本

    织梦CMS是使用最多的CMS之 一,但是漏洞也非常多。分享一款python写的织梦远程文件包含漏洞。修复此漏洞方法,请见文章底部。织梦CMS漏洞代码#! /usr/bin/env python#coding=utf-8#Joseph(小续)import requestsimport sysimport redef main():try:url="...

    服务器配置 291 4年前
最新更新