萌芽采集Python脚本介绍1.2.0版

温馨提示: 本文最后更新于 2025-09-23 21:45:15 ,部分文章具有时效性, 若有错误或已失效,请在下方留言!

萌芽采集Python脚本介绍

  • 采集发布数据需要苹果cms程序后台安装萌芽采集插件
  • 采集脚本基于Python3开发,支持多线程采集数据,批量发布数据。
  • 支持定时自动采集,无人值守采集更新入库。

系统要求

  • 需要萌芽采集插件 v10.7.5 及以上版本
  • Python 3.12.0(只支持此版本,大于小余此版本都不能运行)
  • Windows 7+/Linux/macOS

自动安装步骤(仅适用于 Linux amd64/arm64 平台)

  1. 运行安装脚本:
curl -fsSL "https://down.mycj.pro/python/install.sh" -O && chmod +x install.sh && ./install.sh
  1. 成功安装后,运行采集脚本,执行脚本命令:
source /opt/miniconda3/bin/activate /opt/miniconda3/3.12.0/conda_env && cd /www/python/mengya_project && python app.py

  1. 运行成功后,请在程序后台的萌芽采集设置参数填写到 config.yaml 配置文件,并运行脚本。官网默认速度太快容易采集失败,下面是中速采集。
    1. 添加定时采集任务;如果使用宝塔面板,
      进入宝塔面板 → 计划任务 → 添加计划任务
      任务类型:Shell脚本
      设置执行周期(建议每小时执行一次)
      脚本内容:
    source /opt/miniconda3/bin/activate /opt/miniconda3/3.12.0/conda_env && cd /www/python/mengya_project && python app.py
    

    windows手动安装步骤

    1. 安装Python 3.12.0,必须安装此版本,根据自己电脑的架构选择对应的安装包;windows查看自己是什么架构的,请用cmd打开命令提示符,输入以下命令;如果结果是”AMD64″,则表示系统是64位AMD架构;如果是”ARM”,则表示系统是ARM架构
    echo %PROCESSOR_ARCHITECTURE%
    
    1. 下载AMD64架构的安装包:
    https://mirrors.huaweicloud.com/python/3.12.0/python-3.12.0-amd64.exe
    
    1. 下载64位ARM架构的安装包:
    https://mirrors.huaweicloud.com/python/3.12.0/python-3.12.0-arm64.exe
    
    1. 安装Python;百度或者谷歌搜索相关Python安装教程,如果你windows已经安装过其他python版本,可以搜索“如何在Windows电脑中安装多个版本的Python”
    2. 检查安装好的python环境,打开cmd命令提示符,如果你创建了Python虚拟环境,请进入虚拟环境后,输入以下命令,查询python版本;如果不是指定的python版本,请检查环境变量是否正确,或者重新安装python环境。
    python --version
    
    1. 下载萌芽采集脚本,并解压到指定目录下:
    https://down.mycj.pro/python/mengya_project.tar.gz
    
    1. 进入项目所在文件夹,安装依赖:
    pip install -r requirements.txt
    
    1. 进入项目所在文件夹,运行采集脚本,执行脚本命令:
    python app.py
    

    配置说明

    1. 进入程序后台,找到萌芽采集设置,打开接口开关,并设置好相关配置
    2. 然后将配置参数,填入 config.yaml 配置文件
    3. 运行脚本程序

    添加插件定时采集任务

    1. 进入程序后台,找到萌芽采集
    2. 找到要采集的资源站,添加定时任务,选择“插件定时任务”
    3. 绑定分类,进入要采集的资源站,右下角,复制分类,将分类规则复制后,保存到站外入库配置中。
    © 版权声明
    THE END
    喜欢就支持一下吧
    点赞15 分享
    评论 抢沙发

    请登录后发表评论

      暂无评论内容