• 网易云10万+音乐竟然能用Python一键下载!


    如果你常听音乐的话,肯定绕不开网易云,作为一款有情怀的音乐 App,我对网易云也是喜爱有加。虽然说现在都已经是 5G 时代了,大家的手机流量都绰绰有余,但在线播放还是不如本地存着音乐文件靠谱,今天我们就用 Python 来一键下载网易云音乐乐库。

    先来看下最终的效果。

    其实下载音乐不难,只需要获取到音乐文件播放的地址就可以通过文件流读取的方式直接下载下来。那么问题就转化为如何获取音乐文件的播放地址了。



    很多人学习python,不知道从何学起。
    很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
    很多已经做案例的人,却不知道如何去学习更加高深的知识。
    那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
    QQ群:609616831


    榜单分析

    我们可以打开网易云排行榜 https://music.163.com/#/discover/toplist?id=19723756,仔细分析我们发现该网页左边一列全是排行榜,每个排行榜都对应这不同的排行榜 ID,具体 ID 是多少,直接调开开发者工具即可清晰的看到。

    由上图我们可以看到榜单是放在一个 class='f-cb' 的 ul 列表里面的,所以只需要获取到该 ul 列表的 li 标签即可。而对于每一个 li 标签来说,其 data-res-id 属性则是榜单 id,而榜单名称则是属于该 li 标签下的 div 中 class='name' 的 p 标签下的 a 标签的内容。因此我们获取到 li 标签的集合之后,遍历该集合依次取出榜单 id 和榜单名称即可。

    于是我们有了下面的函数,获取所有的榜单,该函数返回值是一个字典,key 为 榜单 id,值为榜单名称。

    url = 'https://music.163.com/discover/toplist'
    hd = {
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36'
    }
    
    def get_topic_ids():
        r = requests.get(url, headers=hd)
        html = etree.HTML(r.text)
        nodes = html.xpath("//ul[@class='f-cb']/li")
        logger.info('{}  {}'.format('榜单 ID', '榜单名称'))
        ans = dict()
        for node in nodes:
            id = node.xpath('./@data-res-id')[0]
            name = node.xpath("./div/p[@class='name']/a/text()")[0]
            ans[id] = name
            logger.info('{}  {}'.format(id, name))
        return ans

    歌曲分析

    上面我们获取到了所有的榜单数据,那么针对单个榜单来说,就是要获取其下的所有歌曲了。

    分析页面原属可知,歌曲列表是在一个 table 中的,但是通过 requests.get(url,headers=hd) 方式获取返回的网页文本内容的话,貌似是获取不到 table 元素的。于是我们将其返回值输出后做了仔细分析,发现歌曲是在 class="f-hide" 的 ul 标签中。与获取榜单类似,同样需要先获取所有的 li 标签,然后在逐个获取歌曲 id 和歌曲 name 就可以了。

    def get_topic_songs(topic_id, topic_name):
        params = {
            'id': topic_id
        }
        r = requests.get(url, params=params, headers=hd)
        html = etree.HTML(r.text)
        nodes = html.xpath("//ul[@class='f-hide']/li")
        ans = dict()
        logger.info('{} 榜单 {} 共有歌曲 {} 首 {}'.format('*' * 10, topic_name, len(nodes), '*' * 10))
        for node in nodes:
            id = node.xpath('./a/@href')[0].split('=')[1]
            name = node.xpath('./a/text()')[0]
            ans[id] = name
            logger.info('{}  {}'.format(id, name))
    
        return ans

    同样该函数返回一个字典,key 为歌曲 id,value 为歌曲名称。

    下载歌曲

    我们还需要一个下载歌曲的函数,该函数接收歌曲 id,然后以文件流的形式直接读取到本地。

    def down_song_by_song_id_name(id, name):
        if not os.path.exists(download_dir):
            os.mkdir(download_dir)
        url = 'http://music.163.com/song/media/outer/url?id={}.mp3'
        r = requests.get(url.format(id), headers=hd)
        is_fail = False
        try:
            with open(download_dir + name + '.mp3', 'wb') as f:
                f.write(r.content)
        except:
            is_fail = True
            logger.info("%s 下载出错" % name)
        if (not is_fail):
            logger.info("%s 下载完成" % name)

    最后将所有的操作组合到 main 函数中,作为程序的入口函数。

    def main():
        ids = get_topic_ids()
        while True:
            print('')
            logger.info('输入 Q 退出程序')
            logger.info('输入 A 下载全部榜单歌曲')
            logger.info('输入榜单 Id 下载当前榜单歌曲')
    
            id = input('请输入:')
    
            if str(id) == 'Q':
                break
            elif str(id) == 'A':
                for id in ids:
                    down_song_by_topic_id(id, ids[id])
            else:
                print('')
                ans = get_topic_songs(id, ids[id])
                print('')
                logger.info('输入 Q 退出程序')
                logger.info('输入 A 下载全部歌曲')
                logger.info('输入歌曲 Id 下载当前歌曲')
                id = input('请输入:')
                if str(id) == 'Q':
                    break
                elif id == 'A':
                    down_song_by_topic_id(id, ans[id])
                else:
                    down_song_by_song_id_name(id, ans[id])
    
    if __name__ == "__main__":
        main()

    总结

    今天我们以网易云网页版为数据源来下载音乐文件,其中下载操作是最简单的,比较麻烦的是分析榜单 id 和获取榜单下的歌曲列表,但榜单下的歌曲列表其实远不止 10 条,而我们获取歌曲的函数 get_topic_songs 每次只可以获取 10 条歌曲,这是因为我们没有在 headers 添加 cookie 导致的,因为只有登录之后才会显示所有的歌曲。小伙伴们可以登录自己的账户然后添加 cookie 做下尝试。

    在这里还是要推荐下我自己建的Python学习群:609616831,群里都是学Python的,如果你想学或者正在学习Python ,欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2020最新的Python进阶资料和零基础教学,欢迎进阶中和对Python感兴趣的小伙伴加入!

  • 相关阅读:
    AOP-面向切面编程-1
    记一次付工解决Sqlserver问题的过程
    Mysql ---Sqlserver数据迁移到Mysql(Mysql建表迁移数据)
    Mysql ---部署,创建用户
    【C++】C++未定义行为
    【C++】回看面向对象与C++
    【作业】2017级面向对象程序设计——总结作业
    【笔记】Cocos2dx学习笔记
    【个人】绝地求生—吃豆人
    【团队】汇总博客
  • 原文地址:https://www.cnblogs.com/python-miao/p/14328688.html
Copyright © 2020-2023  润新知