From 1dc8c1789f01fc98c5eedbec775fb752aed1704e Mon Sep 17 00:00:00 2001 From: gaoxiaobei <99178334+gaoxiaobei@users.noreply.github.com> Date: Thu, 17 Jul 2025 07:51:27 +0800 Subject: [PATCH] docs(config): update Bilibili search mode options - Clarify the three search mode options for Bilibili - Add note about setting MAX_NOTES_PER_DAY in bilibili config --- config/base_config.py | 7 ++++--- media_platform/bilibili/config.py | 13 +++++++++++++ 2 files changed, 17 insertions(+), 3 deletions(-) create mode 100644 media_platform/bilibili/config.py diff --git a/config/base_config.py b/config/base_config.py index e451304..12a7abe 100644 --- a/config/base_config.py +++ b/config/base_config.py @@ -223,9 +223,10 @@ START_DAY = "2024-01-01" END_DAY = "2024-01-01" # Bilibili 搜索模式,仅在 CRAWLER_TYPE="search" 时生效 -# "normal": 不指定时间范围进行搜索,最多返回约1000条结果。 -# "all_in_time_range": 在 START_DAY 和 END_DAY 指定的时间范围内,尽可能多地爬取数据,每日上限受 MAX_NOTES_PER_DAY 影响,但总数可能超过 CRAWLER_MAX_NOTES_COUNT。 -# "daily_limit_in_time_range": 在指定时间范围内,严格遵守 MAX_NOTES_PER_DAY 的每日上限和 CRAWLER_MAX_NOTES_COUNT 的总上限。 +# 1. "normal": 不指定时间范围进行搜索,最多返回约1000条结果。 +# 2. "all_in_time_range": 在 START_DAY 和 END_DAY 指定的时间范围内,尽可能多地爬取数据,每日上限受 MAX_NOTES_PER_DAY 影响,但总数可能超过 CRAWLER_MAX_NOTES_COUNT。 +# 3. "daily_limit_in_time_range": 在指定时间范围内,严格遵守 MAX_NOTES_PER_DAY 的每日上限和 CRAWLER_MAX_NOTES_COUNT 的总上限。 +# 三个选项中,2. 和 3. 需在 media_platform\bilibili\config.py 中设定 MAX_NOTES_PER_DAY BILI_SEARCH_MODE = "normal" #!!! 下面仅支持 bilibili creator搜索 diff --git a/media_platform/bilibili/config.py b/media_platform/bilibili/config.py new file mode 100644 index 0000000..6f080cf --- /dev/null +++ b/media_platform/bilibili/config.py @@ -0,0 +1,13 @@ +# 声明:本代码仅供学习和研究目的使用。使用者应遵守以下原则: +# 1. 不得用于任何商业用途。 +# 2. 使用时应遵守目标平台的使用条款和robots.txt规则。 +# 3. 不得进行大规模爬取或对平台造成运营干扰。 +# 4. 应合理控制请求频率,避免给目标平台带来不必要的负担。 +# 5. 不得用于任何非法或不当的用途。 +# +# 详细许可条款请参阅项目根目录下的LICENSE文件。 +# 使用本代码即表示您同意遵守上述原则和LICENSE中的所有条款。 + + +# 每天爬取视频/帖子的数量控制 +MAX_NOTES_PER_DAY = 1 \ No newline at end of file