feat: B站二维码、Cookie登录实现

This commit is contained in:
Relakkes
2023-12-04 00:02:00 +08:00
parent a90b411e68
commit 94b5030ef0
3 changed files with 72 additions and 11 deletions

View File

@@ -4,8 +4,8 @@
# 仓库描述
**小红书爬虫****抖音爬虫** **快手爬虫**...。
目前能抓取小红书、抖音、快手的视频、图片、评论、点赞、转发等信息。
**小红书爬虫****抖音爬虫** **快手爬虫** **B站爬虫**...。
目前能抓取小红书、抖音、快手、B站的视频、图片、评论、点赞、转发等信息。
原理:利用[playwright](https://playwright.dev/)搭桥保留登录成功后的上下文浏览器环境通过执行JS表达式获取一些加密参数
通过使用此方式免去了复现核心加密JS代码逆向难度大大降低。
@@ -21,11 +21,11 @@
## 功能列表
| 平台 | Cookie 登录 | 二维码登录 | 手机号登录 | 关键词搜索 | 指定视频/帖子 ID 爬取 | 登录状态缓存 | 数据保存 | IP 代理池 | 滑块验证码 |
|:---:|:---------:|:-----:|:-----:|:-----:|:-------------:|:------:|:----:|:------:|:-----:|
| 小红书 | | ✅ | ✅ | | ✅ | | ✅ | ✅ | ✕ |
| 抖音 | | ✅ | ✅ | | ✅ | | ✅ | ✅ | ✅ |
| 快手 | | ✅ | ✕ | | ✅ | | ✅ | ✅ | ✕ |
| B 站 | | | ✕ | | ✕ | | | ✕ | ✕ |
| 微博 | | ✕ | ✕ | | ✕ | | ✕ | ✕ | ✕ |
| 小红书 | | ✅ | ✅ | | ✅ | | ✅ | ✅ | ✕ |
| 抖音 | | ✅ | ✅ | | ✅ | | ✅ | ✅ | ✅ |
| 快手 | | ✅ | ✕ | | ✅ | | ✅ | ✅ | ✕ |
| B 站 | | | ✕ | | ✕ | | | ✕ | ✕ |
| 微博 | | ✕ | ✕ | | ✕ | | ✕ | ✕ | ✕ |
## 使用方法