如何使用 Puppeteer 下载文件？

使用 Puppeteer 下载文件非常简单。下文的示例说明如何高效地完成此操作，避免不必要的复杂操作。

这里我们将设置下载行为并指定下载路径，从而实现自动文件下载。

      const puppeteer = require('puppeteer');
const path = require('path');

(async () => {
  const downloadPath = path.resolve('./download'); // Define download path
  const browser = await puppeteer.launch({ headless: true });
  const page = await browser.newPage();

  // Set download behavior and path
  await page._client.send('Page.setDownloadBehavior', {
    behavior: 'allow',
    downloadPath: downloadPath 
  });

  await page.goto('https://example.com/download', { waitUntil: 'networkidle2' });

  // Click on the download button
  await page.click('#downloadButton'); // Adjust the selector as needed

  console.log('File download initiated.');
  await browser.close();
})();

说明：

下载路径：使用 path.resolve 设置文件下载的路径。
浏览器启动：启动无头浏览器实例。
设置下载行为：将 Puppeteer 配置为允许下载并指定下载目录。
导航到 URL：前往包含下载链接的网页。
模拟点击：单击下载按钮开始文件下载。

如需更高级的文件处理，可考虑 Bright Data 的抓取浏览器。此浏览器具备自动验证码求解和复杂网站交互处理等增强功能，成为大规模网页抓取项目的理想选择。

开始免费试用

获得全球超20000 位客户的信赖

TRUSTED BY 超20000 CUSTOMERS WORLDWIDE

欢迎来到云抓取

亮数据产品组合易用且高效

高级代理基础架构。100% 符合道德标准的 IP 来源。

自动会话管理
锁定 195 个国家/地区的任意城市
无限并发会话

只需单一 API，即可告别封锁和验证码。

使用内置解锁和代理扩展动态抓取

Scraping Browser

抓取工具作为完全托管的无服务器函数运行。

使用专用的抓取工具 API 按需提取已解析的数据。

从任意公开网站获取最新的有效数据集

轻松便捷的搜索引擎按需抓取

想要立即开始使用？

开始免费试用