
本文详细阐述如何使用PHP程序化地解析v3版Tor洋葱地址。通过遵循Tor的rend-spec-v3规范,我们将深入探讨洋葱地址的结构,学习如何从Base32编码的字符串中精确提取出服务公钥、校验和以及版本号,并提供具体的PHP实现代码,以帮助开发者理解并应用这些解析技术。
理解v3洋葱地址结构
Tor的v3洋葱地址设计旨在提供更高的安全性和更强的匿名性。其核心结构是一个Base32编码的字符串,该字符串由三个关键组件拼接而成:服务身份公钥(PUBKEY)、校验和(CHECKSUM)和版本号(VERSION)。完整的洋葱地址格式为 base32(PUBKEY | CHECKSUM | VERSION) + ".onion"。
- PUBKEY (公钥): 这是一个32字节的Ed25519主公钥,用于唯一标识隐藏服务。
- CHECKSUM (校验和): 这是一个2字节的校验值,通过对特定常量字符串、公钥和版本号进行哈希计算并截取前两字节得到。其计算公式为 H(".onion checksum" | PUBKEY | VERSION)[:2]。
- VERSION (版本号): 这是一个1字节的版本字段,当前v3洋葱地址的默认值为 \x03(即十进制的3)。
因此,一个Base32解码后的v3洋葱地址字符串总长度为 32 (PUBKEY) + 2 (CHECKSUM) + 1 (VERSION) = 35 字节。
PHP实现:解析v3洋葱地址
要从v3洋葱地址中提取这些组件,我们需要执行以下步骤:
立即学习“PHP免费学习笔记(深入)”;
- 移除 .onion 后缀: 首先,从完整的洋葱地址中移除末尾的 .onion 字符串,以获得纯粹的Base32编码部分。
- Base32解码: 对剩余的字符串进行Base32解码。解码结果将是一个35字节的二进制字符串。
- 提取组件: 根据v3洋葱地址的结构定义,从解码后的二进制字符串中按顺序提取公钥、校验和和版本号。
以下是一个PHP示例代码,演示了如何执行这些操作。为了进行Base32解码,我们将使用一个常见的PHP Base32库(例如 StephenHill\Base32,您需要通过Composer安装它)。
= 8) {
$bitCount -= 8;
$output .= chr(($bitBuffer >> $bitCount) & 0xFF);
}
}
return $output;
}
}
/**
* 解析v3 Tor洋葱地址,提取公钥、校验和与版本号。
*
* @param string $onionAddress 完整的v3洋葱地址,例如 "pg6mmjiyjmcrsslvykfwnntlaru7p5svn6y2ymmju6nubxndf4pscryd.onion"
* @return array|null 包含 'publicKey', 'checksum', 'version' 的关联数组,或解析失败返回 null
*/
function parseV3OnionAddress(string $onionAddress): ?array
{
// 1. 移除 .onion 后缀
if (!str_ends_with($onionAddress, '.onion')) {
echo "错误: 无效的洋葱地址格式,缺少 '.onion' 后缀。\n";
return null;
}
$base32Encoded = str_replace(".onion", "", $onionAddress);
// 2. Base32 解码
// 使用 StephenHill\Base32 库
// $decodedBytes = \StephenHill\Base32::decode($base32Encoded);
// 使用上面提供的简化版Base32类
$decodedBytes = Base32::decode($base32Encoded);
// v3洋葱地址解码后应为35字节
if (strlen($decodedBytes) !== 35) {
echo "错误: Base32解码后的长度不符合v3洋葱地址规范 (期望35字节,实际 " . strlen($decodedBytes) . " 字节)。\n";
return null;
}
// 3. 提取组件
// PUBKEY 是前32字节
$publicKey = substr($decodedBytes, 0, 32);
// CHECKSUM 是接下来的2字节 (即第33和34字节,0-indexed)
$checksum = substr($decodedBytes, 32, 2);
// VERSION 是最后1字节 (即第35字节,0-indexed)
$version = substr($decodedBytes, 34, 1);
return [
'publicKey' => bin2hex($publicKey), // 通常以十六进制表示
'checksum' => bin2hex($checksum), // 通常以十六进制表示
'version' => ord($version) // 版本号通常是整数
];
}
// 示例使用
$onionUrl = "pg6mmjiyjmcrsslvykfwnntlaru7p5svn6y2ymmju6nubxndf4pscryd.onion";
$parsedData = parseV3OnionAddress($onionUrl);
if ($parsedData) {
echo "解析成功!\n";
echo "公钥 (hex): " . $parsedData['publicKey'] . "\n";
echo "校验和 (hex): " . $parsedData['checksum'] . "\n";
echo "版本号: " . $parsedData['version'] . "\n";
// 验证版本号是否为3
if ($parsedData['version'] === 3) {
echo "版本号符合v3规范 (3)。\n";
} else {
echo "警告: 版本号不为3,可能不是标准的v3洋葱地址。\n";
}
}
// 另一个示例
$onionUrl2 = "sp3k262uwy4r2k3ycr5awluarykdpag6a7y33jxop4cs2lu5uz5sseqd.onion";
$parsedData2 = parseV3OnionAddress($onionUrl2);
if ($parsedData2) {
echo "\n--- 第二个地址解析 ---\n";
echo "公钥 (hex): " . $parsedData2['publicKey'] . "\n";
echo "校验和 (hex): " . $parsedData2['checksum'] . "\n";
echo "版本号: " . $parsedData2['version'] . "\n";
}
?>代码解释:
- str_ends_with() 用于检查字符串是否以特定后缀结尾,是PHP 8+ 的函数。如果使用旧版本PHP,可以替换为 substr($onionAddress, -6) === '.onion'。
- str_replace(".onion", "", $onionAddress) 移除了后缀。
- Base32::decode($base32Encoded) 执行Base32解码。这里为了演示,提供了一个简化的 Base32 类,但在实际生产环境中,强烈建议使用经过充分测试和维护的第三方库,例如 StephenHill\Base32。
- substr($decodedBytes, offset, length) 函数用于从二进制字符串中提取指定长度的子字符串。
- substr($decodedBytes, 0, 32) 提取前32字节作为公钥。
- substr($decodedBytes, 32, 2) 提取接下来的2字节作为校验和。
- substr($decodedBytes, 34, 1) 提取最后1字节作为版本号。
- bin2hex() 将二进制字符串转换为十六进制表示,这在显示公钥和校验和时非常有用,因为它们通常以十六进制格式呈现。
- ord() 将单字节字符转换为其ASCII值,对于版本号 \x03,它会返回整数 3。
注意事项与总结
- Base32解码库: 务必使用一个可靠且经过测试的Base32解码库。本文提供的简化版仅用于说明原理,不建议直接用于生产环境。
- 二进制字符串处理: PHP在处理字符串时,需要注意其是否为二进制安全。substr()、strlen() 等函数在处理二进制数据时是安全的。
- 校验和验证: 为了进一步验证洋葱地址的有效性,您可以根据Tor规范重新计算校验和,并与提取出的校验和进行比较。如果两者不匹配,则表明洋葱地址可能被篡改或无效。校验和的计算需要用到哈希函数(如SHA3),以及原始的公钥和版本号。
- 错误处理: 在实际应用中,应增加更完善的错误处理机制,例如捕获Base32解码失败、地址格式不正确等情况。
通过上述步骤和PHP代码示例,您现在应该能够程序化地解析v3版Tor洋葱地址,并从中提取出其核心组成部分。这对于开发与Tor隐藏服务相关的工具或进行数据分析非常有用。











