火车头采集分页多页数据

网极科技5个月前代码笔记383

在使用火车头采集器时,遇到有分页多页的情况出现,可进行如下设置进行采集

1 在第二步,采集内容规则中设置“分页获取规则”,即页码标签位置

image.png

2 在标签编辑页面勾选  该标签在分页中匹配  即可

image.png

相关文章

将网页文字保存为Word文档的PHP代码

将网页文字保存为Word文档的PHP代码

以下是将网页文字保存为Word文档的PHP代码示例: <?php // 获取网页内容并保存为Word文件 function saveAsWord($url, $fileName) {...

windows下composer简单使用

windows下composer简单使用

在windows下执行composer,可直接下载composer.phar文件,控制台运行即可此处下载composer.zip然后将该文件composer.phar放置到需要执行composer安装...

fastadmin对接火车头采集器

fastadmin对接火车头采集器

fastadmin默认没有对接火车头采集器,本文介绍下对接方法: 1、创建获取栏目列表api 因为cms扩展应用中api获取栏目列表需要post提交apikey,在火车头中不支持使用,所以重新创建...

通过阿里云实现IPv6升级改造

通过阿里云实现IPv6升级改造

场景示例某些企业现有的IT系统部署在本地IDC机房,IDC机房为纯IPv4网络,企业因业务发展需求,需要面向IPv6客户端提供服务。但是,使企业现有IT系统支持IPv6是一个复杂的系统工程,改造难度大...

用伪静态防止恶意下载网站目录下的压缩包

用伪静态防止恶意下载网站目录下的压缩包

起因很多黑客用恶意工具扫描网站目录下的压缩包文件,进行批量下载,导致带宽占满,有时候该压缩包还有可能是网站备份文件,损失不可估量,所以用伪静态的方法,拦截压缩包的后缀,可以起到比较好的效果 抛砖引玉...

使用xunsearch进行php全文检索

使用xunsearch进行php全文检索

迅搜(xunsearch)是采用 C/C++ 基于 xapian 和 scws 开发的全文搜索引擎解决方案,适用于php全文检索、mysql全文检索和各种站内搜索。支持海量数据高速检索,功能强大、...