mirror of
https://github.com/NanmiCoder/MediaCrawler.git
synced 2026-02-20 14:01:04 +08:00
41 lines
1.4 KiB
Python
41 lines
1.4 KiB
Python
# -*- coding: utf-8 -*-
|
||
# Copyright (c) 2025 relakkes@gmail.com
|
||
#
|
||
# This file is part of MediaCrawler project.
|
||
# Repository: https://github.com/NanmiCoder/MediaCrawler/blob/main/config/weibo_config.py
|
||
# GitHub: https://github.com/NanmiCoder
|
||
# Licensed under NON-COMMERCIAL LEARNING LICENSE 1.1
|
||
#
|
||
|
||
# 声明:本代码仅供学习和研究目的使用。使用者应遵守以下原则:
|
||
# 1. 不得用于任何商业用途。
|
||
# 2. 使用时应遵守目标平台的使用条款和robots.txt规则。
|
||
# 3. 不得进行大规模爬取或对平台造成运营干扰。
|
||
# 4. 应合理控制请求频率,避免给目标平台带来不必要的负担。
|
||
# 5. 不得用于任何非法或不当的用途。
|
||
#
|
||
# 详细许可条款请参阅项目根目录下的LICENSE文件。
|
||
# 使用本代码即表示您同意遵守上述原则和LICENSE中的所有条款。
|
||
|
||
|
||
# 微博平台配置
|
||
|
||
# 搜索类型,具体的枚举值在media_platform/weibo/field.py中
|
||
WEIBO_SEARCH_TYPE = "default"
|
||
|
||
# 指定微博ID列表
|
||
WEIBO_SPECIFIED_ID_LIST = [
|
||
"4982041758140155",
|
||
# ........................
|
||
]
|
||
|
||
# 指定微博用户ID列表
|
||
WEIBO_CREATOR_ID_LIST = [
|
||
"5756404150",
|
||
# ........................
|
||
]
|
||
|
||
# 是否开启微博爬取全文的功能,默认开启
|
||
# 如果开启的话会增加被风控的概率,相当于一个关键词搜索请求会再遍历所有帖子的时候,再请求一次帖子详情
|
||
ENABLE_WEIBO_FULL_TEXT = True
|