网站地图官方微信:
网站首页 天竺镇 仇集镇 西洪乡 百亩乡 黄莲乡 舟曲县

当前位置: 首页 >

火车头***集动态加载Ajax数据(无分页瀑布流网站) - *

  一键部署OpenClaw

为了先填充好数据在上线,在本地搭建了一个网站,并用火车头***集数据填充到里面。

开始很上手,因为找的网站的分类中是有分页的。很快捷的找到页面标识。

但是问题来了,如今很多网站都是***用的Ajax加载数据,根本没有分页的URL。比如:CSDN,IT168等等,都是***用下拉到一定程度,自动加载数据出来。

在没有页码的情况下,直接***集当前首页的20-30篇文章,后面的都无法***集到。

经过在网上查找教程,总算有了方法,但是相对直接加入页码***集,多了一个步骤。

应该如何做?

1. 获取目标站API地址

在目标页面按F12或Ctrl+Shift+C打开审查元素,然后点Network选项卡,通过下滑的操作实时监控Network中出现的链接。

然后点击这个链接,查看规律后将他复制下来。

2.利用火车头***集这个API中的文章链接

这里做一个***设,实际填写的是上面的API地址。

***集内容规则的设置

从上图可以指导链接地址在:linkurl:"" 里,然后进入第二部***集内容

这里选择循环匹配,不然只会***集到一个链接。

数据处理一下编码和斜杠(因为***集的url有很多 \ 的转义,直接将这个剔除)

测试一下页面就可以获取到文章的URL链接。

获取到文章的链接后,如何***集它们?

当***集到这些文章的URL后,我们先要在 第三步:发布内容设置 ,将连接保存在桌面处理。

我将他保存在Excel文件(主要是我导出的TXT不完整),然后在Excel中处理好在复制到TXT中。

这个时候我们就要***集这些文字的链接了。

新建一个***集任务,然后将保存的TXT导入,然后依次进行***集,后面的工序就不说了,和分页***集的步骤是一样的。

本文由2号站长网 五车二原创,原文地址:***s://***.zz2zz***/19852.html 转载请注明出处。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

火车头***集动态加载Ajax数据(无分页瀑布流网站) - *

  • | 为什么总有人要说"再见,docker!",那玩nas的为什么还离不开docker,比如绿联,飞牛? |

    有一部分人区分不清楚 k8s docker podman 的...

    查看详情>>
  • | 按理说机械硬盘和固态硬盘使用得当寿命几乎一样长,但为什么网上传言机械硬盘更容易坏? |

  • | 有没有宝塔平替的服务器管理面板,现在宝塔越来越贵了,也太臃肿了? |

  • | 有基于 C/C++ 的 Web 开发框架吗? |

  • | MacOS的哪个设计让你非常恼火? |

  • | 男的真的会把所有衣服从上到下都扔洗衣机吗? |

  • | 为什么我觉得现在线上大部分都对华为反感,线下华为大卖? |

  • | 自己组一个E5服务器才几百块钱,为什么去阿里云租这么贵? |

  • | 有哪些是你用上了mac才知道的事? |

  • | 国外的女生为什么屁股都大? |

  • | 长期使用的大佬来说说,MacOS 真的比 Windows 稳定吗? |

  • 10年刚从上海回怀化老家,在小姨夫的汽车修理厂短暂帮忙,有一...

    2025-06-26
  • M芯的mac出来后,被果粉日常称为大火炉的Intel芯片的m...

    2025-06-26
  • 我讲一个故事,也不知道为啥就突然觉得和这个话题相关。 我是...

    2025-06-26
  • 是时候祭出大杀器了: 移动用户:使用本机编辑短信“CXXZ#...

    2025-06-26

关注我们

添加微信好友,关注最新动态