XPath怎么选择第一个、第二个或第n个子节点

煙雲

发布时间：2026-01-14 10:55:39

798人浏览过

来源于php中文网

原创

XPath中索引从1开始，//div/p[1]选第一个p子元素；[last()]选最后一个，[last()-1]选倒数第二个；*匹配任意元素，node()匹配所有节点（含文本），需注意浏览器与lxml解析差异。

xpath怎么选择第一个、第二个或第n个子节点

用 `[n]` 定位第 n 个子节点（注意索引从 1 开始）

XPath 的索引不是从 0 开始，而是从 1 开始。所以 //div/p[1] 选的是第一个 p 子节点，//div/p[2] 是第二个，//div/p[5] 是第五个。

常见错误是套用编程习惯写成 [0] 或 [:3] —— XPath 不支持这些写法，[0] 直接不匹配任何节点。

//ul/li[1]：选 ul 下第一个 li（不管它在 DOM 中是否是第一个子元素，只看同级同名的 li）
//table/tr[position()=3]：等价于 //table/tr[3]，显式调用 position() 函数更利于加条件，比如 //table/tr[position()
如果想选“所有 div 中的第二个子节点（无论类型）”，得用 //div/*[2]，其中 * 表示任意元素节点

`first()` 和 `last()` 是函数，但不在标准 XPath 1.0 中

别被某些文档误导：first()、last() 不是 XPath 1.0 原生函数（主流浏览器、lxml、libxml2 默认都只支持 1.0）。它们只存在于 XPath 2.0+ 或某些方言（如 Selenium 的旧版 Java 绑定曾模拟过，但已弃用）。

真正跨平台安全的写法是：

第一个 → [1]
最后一个 → [last()]（注意括号不能省）
倒数第二个 → [last()-1]
前三个 → [position() 或 [position()

例如：//ol/li[last()-1] 稳定选倒数第二个 li，哪怕列表长度动态变化。

小心「子节点」和「子元素节点」的区别

XPath 中的 [n] 默认匹配的是「同名的子元素节点」，不是所有子节点。文本节点、注释、空格换行都会占用位置，但 //div/p[2] 只会在 p 元素里数，不会把中间的文本节点算进去。

Roboflow

一个为计算机视觉和机器学习提供工具和服务的平台

下载

如果你要严格按 DOM 树顺序取第 n 个子节点（含文本、注释等），必须用 node()：

//div/node()[2]

但多数场景不需要这么细——你通常想选的是元素，不是空白文本。所以更常用的是：

//div/*[2]：第二个子元素（忽略文本/注释）
//div/p[2]：第二个 p 元素（只在 p 中计数）
//div/node()[2][self::p]：第二个子节点，且它必须是 p 元素（较啰嗦，少用）

在 Python lxml 或浏览器 DevTools 中验证时的典型陷阱

用 lxml 或 Chrome 控制台测试时，容易因 HTML 解析差异踩坑：

浏览器会自动补全缺失标签（比如把 1 补成带 tbody 的结构），导致你以为 //table/tr[1] 应该命中，实际要写 //table/tbody/tr[1]
lxml 默认不补全，行为更“原始”，同一段 HTML 在两者中可能返回不同结果
用 text() 提取内容后，开头结尾的空白可能来自换行缩进，建议链式调用 .strip()（Python）或用 normalize-space() 函数：//div/p[1]/normalize-space(text())

最稳妥的方式：先用 //* 或 //*[@id="xxx"] 定位到父容器，再逐级加 [n]，避免跨层级硬写绝对路径。

如何用Python写入XML文件 Python修改XML节点数据

Python怎么高效地拼接大型XML文件

如何将XML扁平化处理 Python实现

Python ElementTree库怎么用 ElementTree解析XML教程

如何将CSV文件转换成XML格式 Python脚本实现

相关标签:

python java html node 浏览器区别 xml解析 Python Java chrome html dom position ul table tbody tr li

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Java如何将Map转换为XML JAXB MapAdapter用法下一篇：暂无

作者最新文章

Win11怎么修改IP地址_Windows11系统IP地址设置步骤

2026-01-14 09:53

个人所得税补税怎么操作网上补缴个人所得税流程详解

2026-01-14 09:56

电脑更换主板CPU后需要重装系统吗硬件升级后的系统问题【解答】

2026-01-14 10:18

Groovy怎么解析和生成XML XmlSlurper和XmlParser

2026-01-14 10:25

感恩节黑色星期五：一个购物节如何与家庭节日捆绑？

2026-01-14 10:29

电脑怎么查看WiFi密码电脑查看已连接无线密码的步骤

2026-01-14 10:31

笔记本电脑配置怎么看？ - 购买前后必做的硬件信息核对步骤

2026-01-14 10:36

汉典网账号登录不了怎么办汉典网忘记密码怎么找回

2026-01-14 10:41

手机百度怎么识图搜图？手机百度App以图搜图使用方法【详解】

2026-01-14 10:45

yy漫画日漫在线入口_yy漫画免费看全集下拉式

2026-01-14 10:52

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

750

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

635

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

706

2023.08.11