• 蓝天采集器(保存数据到mysql)


    蓝天采集器,将采集的数据直接保存到mysql数据库,需要自己开发一个插件,操作插入程序,在程序中可以处理采集到的数据,然后插入到mysql数据库中跟着步骤走

    1、采集设置

    采集设置,可设置采集次数、自动采集、图片本地化等设置,或者默认也可以

     2、添加采集任务

     3、添加采集任务(图片本地化设置)

      4、添加采集任务(规则采集) 默认即可

    5、添加采集任务(起始页)设置开始采集的链接,即采集的列表页

     

    6、添加采集任务(内容页地址) 获取列表页上的详情页URL地址,这个URL地址需要自己去找规则获取

    7、添加采集任务(获取内容) 获取详情页的内容,需在详情页里找内容规则

    8、添加采集任务(发布)

     9、CMS插件开发

     9、CMS插件开发(保存后会生成一个php文件 路径(skycaiji-master\plugin\release\cms)

     10、CMS插件开发(在这个文件中一定要加数据库配置

    代码

    1. public function cms_db_你自己的插件名称($cmsPath){
    2. //请读取cms的配置文件并将数据库保存为以下数组形式后返回,可参考BaseCms.php中的其它cms_db_方法
    3. $cmsDb=array(
    4. 'db_type' => 'mysql',//数据库类型
    5. 'db_user' => 'root',//用户
    6. 'db_pwd' => '',//密码
    7. 'db_host' => '127.0.0.1',//数据库主机
    8. 'db_port' => 3306,//端口
    9. 'db_name' => '',//数据库名称
    10. 'db_charset' => 'utf8',//数据库编码
    11. 'db_prefix' => '',//表前缀
    12. );
    13. return $cmsDb;
    14. }

     /*导入数据 在这个方法内实现你自己的业务*/
        public function runImport($params){

    }

    搞定后回到步骤  8、添加采集任务(发布) 那些选择CMS发布插件

  • 相关阅读:
    Halcon 3D 切片法检测物料
    【Linux】OS和进程概念
    华为数通方向HCIP-DataCom H12-831题库(单选题:281-300)
    java RMI 协议通过zookeeper的实现
    深入理解Docker
    iperf 测试网络性能
    paddle实现,多维时序数据增强 ,mixup(利用beta分布制作连续随机数)
    沉睡者IT - 说几个2022年网络上比较好赚钱的创业项目
    图纸识别自动生成BOM清单的方法
    地图加载wmts格式底图的配置
  • 原文地址:https://blog.csdn.net/qq_33212312/article/details/126105954