如何在 Linux、macOS 或 FreeBSD上使用htmlq从HTML文件中提取内容

文章目录

我们大多数人使用love并使用jq命令。它适用于Linux或类Unix系统,可从JSON文档中提取数据。最近发现了htmlq,和jq一样,是用Rust写的。想象一下能够sed或grep 获取HTML数据。我们可以使用htmlq搜索、切片和过滤HTML数据。让我们看看如何在 Linux 或 Unix 上安装和使用这个快速的工具并处理HTML数据。

htmlq工具

htmlq它类似于jq,但用于HTML。它使用CSS选择器从HTML文件中提取我们需要的部分内容。在CSS 中,选择器用于定位我们想要设置样式的网页上的 HTML元素。例如,我们可以使用此工具轻松提取图像或URL。

在Linux或Unix上安装htmlq

以下是使用apt 命令/apt-get 命令在Ubuntu 或 Debian Linux 上安装 cargo和rustc的方法:

sudo apt install cargo

然后你将运行:

cargo install htmlq

macOS安装cargo

打开终端应用程序,然后运行端口命令如下:

sudo port install cargo

或者您可以在 macOS 上安装 Homebrew 以使用 brew 包管理器,如下所示:

brew install rustup # 安装cargo和rustc
rustc --version

FreeBSD 安装cargo

我将使用 pkg 命令如下安装 rustc:

sudo pkg install rust

查看如何为其他操作系统安装 Rust 。现在我有rustc和cargo命令,然后我输入以下命令来在我们系统上获取htmlq:

cargo install htmlq

文档

GitHub - mgdm/htmlq: Like jq, but for HTML.
Like jq, but for HTML. Contribute to mgdm/htmlq development by creating an account on GitHub.
全部为采集文章,文中的 联系方式 均不是 本人 的!

发表评论