随着互联网的普及,网页制作和网站开发已经成为了一个需求量巨大的行业。而在网页制作中,图片和链接是不可或缺的元素,而正则表达式在处理这些元素时大有用处。本文将介绍如何使用 php 正则表达式匹配 html 中的所有图片和链接。
一、匹配图片
在 HTML 中,图片通常使用 标签引入,其格式如下:
@@##@@
为了匹配所有的图片,我们需要匹配所有的 标签,并从中提取出图片路径。我们可以使用以下正则表达式进行匹配:
$pattern = '/@@##@@/i';
该正则表达式的作用是:
立即学习“PHP免费学习笔记(深入)”;
-
:匹配开始标签。 -
src=["']?:匹配src属性。 -
(.*?):使用非贪婪模式匹配图片路径。 -
["'].*?>:匹配src属性值之后的其他属性,以及结束标签。
下面是一个简单的 PHP 代码示例:
$html = '@@##@@@@##@@'; $pattern = '/@@##@@/i'; preg_match_all($pattern, $html, $matches); $images = $matches[1]; print_r($images);
输出结果为:
Array
(
[0] => 1.jpg
[1] => 2.jpg
)可以看到,我们成功匹配出了 HTML 中的所有图片路径。
二、匹配链接
链接也是网页中不可或缺的元素,通常使用 标签实现。其格式如下:
链接文字
我们需要匹配 标签,并从中提取出链接地址和链接文字。可以使用以下正则表达式进行匹配:
$pattern = '/(.*?)/i';
该正则表达式的作用是:
立即学习“PHP免费学习笔记(深入)”;
-
:匹配开始标签。 -
href=["']?:匹配href属性。 -
(.*?):使用非贪婪模式匹配链接地址。 -
["'].*?>:匹配href属性值之后的其他属性。 -
(.*?):使用非贪婪模式匹配链接文字和结束标签。
下面是一个简单的 PHP 代码示例:
$html = '百度谷歌'; $pattern = '/(.*?)/i'; preg_match_all($pattern, $html, $matches); $urls = $matches[1]; $names = $matches[2]; print_r($urls); print_r($names);
输出结果为:
Array
(
[0] => http://www.baidu.com
[1] => http://www.google.com
)
Array
(
[0] => 百度
[1] => 谷歌
)可以看到,我们成功匹配出了 HTML 中的所有链接地址和链接文字。
三、总结
使用 PHP 正则表达式可以方便地匹配 HTML 中的图片和链接,可以大大简化我们在网页制作和网站开发中的工作。当然,在实际开发中我们需要注意正则表达式的优化和错误处理,以确保程序的稳定性和安全性。













