Python爬虫实战：用requests库批量获取B站UP主视频的aid和cid（附完整代码）

张

张建站

2026/6/5 8:52:58

10分钟阅读

Python爬虫实战：用requests库批量获取B站UP主视频的aid和cid（附完整代码）

Python爬虫实战B站UP主视频数据抓取全流程解析最近在分析B站UP主视频数据时我发现很多朋友对如何批量获取视频的aid和cid这两个关键ID感到困惑。作为视频数据分析的基础掌握这两个ID的获取方法能帮助我们进一步挖掘播放量、弹幕等深层信息。本文将手把手带你从零开始用Python的requests库构建一个完整的B站视频数据抓取工具。1. 理解B站视频ID体系在开始编写代码前我们需要先搞清楚几个关键概念aid即Archive ID是B站视频的唯一标识符每个视频对应一个独特的aid。这个ID主要用于标识视频本身在视频URL中可以看到如www.bilibili.com/video/av170001中的170001就是aid。cid即Content ID是视频分P的标识符。一个aid可能对应多个cid如多P视频cid主要用于获取视频的弹幕、播放源等信息。mid这是UP主的唯一标识ID通过这个ID我们可以找到该UP主发布的所有视频。常见误区提醒很多初学者容易混淆aid和cid的关系简单来说aid定位视频cid定位视频的具体分P内容。2. 环境准备与API分析2.1 安装必要库我们需要以下Python库支持我们的爬虫程序pip install requests2.2 B站API接口分析通过浏览器开发者工具分析我们发现B站提供了几个关键APIAPI地址功能描述必需参数https://api.bilibili.com/x/space/acc/info获取UP主基本信息midhttps://api.bilibili.com/x/space/arc/search获取UP主视频列表mid, pn(页码)https://api.bilibili.com/x/player/pagelist获取视频cid列表aid提示B站API可能会不定期更新建议在实际使用前先用浏览器开发者工具验证接口是否可用。3. 核心代码实现3.1 获取UP主基本信息首先我们需要通过UP主的mid获取其基本信息这有助于我们后续的数据验证import requests import json def get_up_info(mid): url fhttps://api.bilibili.com/x/space/acc/info?mid{mid}jsonpjsonp headers { User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 } try: response requests.get(url, headersheaders) data response.json() if data[code] 0: return { name: data[data][name], mid: data[data][mid] } else: print(f获取UP主信息失败: {data[message]}) return None except Exception as e: print(f请求发生异常: {str(e)}) return None3.2 批量获取视频aid接下来是获取UP主所有视频aid的核心函数def get_all_video_aids(mid, max_page5): video_aids [] base_url https://api.bilibili.com/x/space/arc/search for page in range(1, max_page 1): params { mid: mid, pn: page, ps: 50, # 每页数量 jsonp: jsonp } try: response requests.get(base_url, paramsparams) data response.json() if data[code] 0: videos data[data][list][vlist] for video in videos: video_aids.append(video[aid]) else: print(f第{page}页获取失败: {data[message]}) except Exception as e: print(f第{page}页请求异常: {str(e)}) return video_aids3.3 获取视频cid有了aid后我们可以进一步获取每个视频的ciddef get_video_cid(aid): url fhttps://api.bilibili.com/x/player/pagelist?aid{aid}jsonpjsonp try: response requests.get(url) data response.json() if data[code] 0 and data[data]: return data[data][0][cid] # 取第一个分P的cid return None except Exception as e: print(f获取aid{aid}的cid失败: {str(e)}) return None4. 完整流程与异常处理4.1 主程序逻辑将上述函数组合起来形成完整的处理流程def main(): # 替换为目标UP主的mid up_mid 2026561407 # 获取UP主信息 up_info get_up_info(up_mid) if not up_info: print(无法获取UP主信息程序终止) return print(f开始获取UP主 {up_info[name]}(mid:{up_mid}) 的视频数据...) # 获取所有视频aid video_aids get_all_video_aids(up_mid) if not video_aids: print(未获取到任何视频aid) return print(f共获取到 {len(video_aids)} 个视频aid) # 获取每个视频的cid video_data [] for aid in video_aids: cid get_video_cid(aid) if cid: video_data.append({aid: aid, cid: cid}) # 输出结果 print(\n获取结果) for idx, item in enumerate(video_data, 1): print(f{idx}. aid: {item[aid]}, cid: {item[cid]}) if __name__ __main__: main()4.2 常见问题与解决方案在实际使用中你可能会遇到以下问题请求被拒绝确保添加了合适的User-Agent头尝试降低请求频率避免被封禁考虑使用代理IP需合规使用数据解析失败检查API返回的JSON结构是否发生变化验证返回的HTTP状态码是否为200分页处理不完整动态判断是否还有下一页数据而不是固定页数处理返回数据为空的情况性能优化建议对于大量视频的UP主可以考虑使用多线程或异步请求来提高获取速度但要注意控制并发量避免给B站服务器造成过大压力。5. 数据存储与扩展应用5.1 数据存储方案获取到的数据可以保存到多种格式中import csv import json def save_to_csv(data, filename): with open(filename, w, newline, encodingutf-8) as f: writer csv.writer(f) writer.writerow([序号, aid, cid]) for idx, item in enumerate(data, 1): writer.writerow([idx, item[aid], item[cid]]) def save_to_json(data, filename): with open(filename, w, encodingutf-8) as f: json.dump(data, f, ensure_asciiFalse, indent2)5.2 扩展应用方向有了aid和cid后你可以进一步获取视频的详细统计信息播放量、点赞数等下载视频弹幕进行分析构建UP主视频数据趋势图分析视频内容与互动数据的关系实际案例我曾经用这套方法分析过几个教育类UP主的视频数据发现视频时长在15-20分钟、发布时间在晚上8-10点的视频其完播率明显高于其他时段发布的视频。这种数据洞察对于内容创作者优化发布策略很有帮助。6. 法律与道德考量在进行网络爬虫开发时我们必须注意遵守网站的robots.txt协议控制请求频率避免对目标服务器造成负担仅将数据用于个人学习和分析不进行商业用途尊重用户隐私和版权内容注意本文提供的代码仅用于学习交流请勿用于大规模数据抓取或商业用途。实际应用中请遵守相关法律法规和网站的使用条款。

发布文章测试

发布文章测试...

2026/6/5 8:50:55 阅读更多 →

UVa 393 The Doors

题目描述你需要找到穿过一个有障碍墙的房间的最短路径长度。房间边界为 x0x0x0、x10x10x10、y0y0y0 和 y10y10y10。路径的起点和终点始终是 (0,5)(0,5)(0,5) 和 (10,5)(10,5)(10,5)。房间内有 000 到 181818 堵垂直的墙，每堵墙上有两个门洞。图例展示了一个这样的房…...

2026/6/5 8:50:12 阅读更多 →

Android卡顿优化与Choreographer深度解析

卡顿问题的本质卡顿是Android应用运行时帧率低于预期导致的视觉滞留现象。人类视觉对流畅度的感知阈值为60FPS，即每帧渲染时间需控制在16ms以内。若主线程任务超过此阈值，会导致VSync信号到来时未能完成渲染，引发掉帧。卡顿的常见诱因包括： UI线程阻塞：主线程执行耗时…...

2026/6/5 8:48:29 阅读更多 →

Windows防撤回终极指南：如何永久保存微信QQ撤回消息

Windows防撤回终极指南：如何永久保存微信QQ撤回消息【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁（我已经看到了，撤回也没用了） 项目地址: https://gitcode.com/…...

2026/6/5 8:41:58 阅读更多 →

终极视频下载解决方案：VideoDownloadHelper 完全指南

终极视频下载解决方案：VideoDownloadHelper 完全指南【免费下载链接】VideoDownloadHelper Chrome Extension to Help Download Video for Some Video Sites. 项目地址: https://gitcode.com/gh_mirrors/vi/VideoDownloadHelper 还在为无法保存网络上的精彩…...

2026/6/4 10:13:41 阅读更多 →

小微企业合作网络与成长预测解析方案【附代码】

✨ 长期致力于小微企业、合作网络、网络结构、企业成长、成长预测研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）基于提名生成法的合作网络构建与结构…...

2026/6/5 8:42:00 阅读更多 →

终极键盘映射工具：如何免费解决游戏按键冲突问题

终极键盘映射工具：如何免费解决游戏按键冲突问题【免费下载链接】socd Key remapper for epic gamers 项目地址: https://gitcode.com/gh_mirrors/so/socd 你是否曾在激烈的游戏中因为同时按下左右方向键而让角色卡顿不前？是否在关键时刻因为按键…...

2026/6/5 8:41:59 阅读更多 →