
本文介绍如何将 json 格式的参数从 input.txt 文件中安全、规范地加载为 python 字典,并用于 requests.get() 请求,替代硬编码参数,提升代码可维护性与灵活性。
在实际开发中,将请求参数(如搜索关键词、国家代码、接口动作等)硬编码在脚本中不仅难以维护,还容易引发安全与配置管理问题。更优实践是将参数外置为结构化配置文件——推荐使用标准 JSON 格式,因其可读性强、语言通用、解析安全且内置支持完善。
✅ 正确的 input.txt 格式(JSON)
请将 input.txt 改写为合法 JSON 格式(注意:JSON 要求双引号、末尾无逗号、键名必须加引号):
{
"term": "ditech process solutions",
"country": "IN",
"action": "get_search_companies"
}⚠️ 注意:原始示例中 term=ditech process solutions,country=IN,action=get_search_companies 是类 URL 查询字符串格式,不是 JSON,无法直接用 json.load() 解析。若坚持使用该格式,需自定义解析逻辑(见下文“备选方案”),但强烈不推荐——易出错、难扩展、无类型校验。
✅ 推荐实现:用 json.load() 安全加载参数
import json
import requests
from bs4 import BeautifulSoup
# 1. 从 JSON 文件加载参数
input_file_path = "input.txt"
with open(input_file_path, "r", encoding="utf-8") as f:
params = json.load(f) # 自动解析为 dict,类型安全
# 2. 构造请求
api_url = "https://lei-registrations.in/wp/wp-admin/admin-ajax.php"
headers = {
"User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:122.0) Gecko/20100101 Firefox/122.0"
}
response = requests.get(api_url, params=params, headers=headers)
response.raise_for_status() # 抛出网络/HTTP错误
data = response.json()
# 3. 解析响应(仅当 success 为 True 时处理)
if data.get("success"):
soup = BeautifulSoup(data["data"], "html.parser")
for r in soup.select(".searchResults_title"):
name = r.select_one(".searchResults_name")
number = r.select_one(".searchResults_number")
if name and number: # 防止 None 引发 AttributeError
print(f"{name.text.strip():<50} {number.text.strip()}")
else:
print("API request failed:", data.get("message", "Unknown error"))? 备选方案:兼容旧格式(不推荐)
若因历史原因必须保留 key=value,key2=value2 的纯文本格式,请使用以下健壮解析函数(自动处理空格、逗号分隔、值内空格等):
def parse_kv_line(line: str) -> dict:
"""解析形如 'term=ditech process solutions,country=IN' 的行"""
params = {}
pairs = [p.strip() for p in line.split(",") if p.strip()]
for pair in pairs:
if "=" in pair:
k, v = pair.split("=", 1) # 只分割第一个 =,支持值含等号
params[k.strip()] = v.strip().strip('"\'') # 去除可能的引号
return params
# 使用方式:
with open("input.txt", "r", encoding="utf-8") as f:
line = f.readline().strip()
params = parse_kv_line(line)✅ 最佳实践总结
- ✅ 始终使用 JSON 格式作为配置文件:语义清晰、工具链成熟、IDE 可校验、天然支持嵌套与数组;
- ✅ 指定 encoding="utf-8":避免中文或特殊字符乱码;
- ✅ 添加 response.raise_for_status():及时捕获 HTTP 错误(如 404、500);
- ✅ 校验 data.get("success") 和 DOM 元素存在性:防止 KeyError 或 AttributeError;
- ❌ 避免 eval() 或 ast.literal_eval() 解析非 JSON 文本——存在安全与可维护性风险。
通过以上改造,你的脚本即可实现配置与逻辑分离,便于多环境部署(如 dev/staging/prod 各用不同 input.txt),也为后续接入配置中心(如 Consul、Etcd)打下基础。
立即学习“Python免费学习笔记(深入)”;










