服装网(专注于服饰、鞋包、配饰等时尚品类的电商平台)的商品详情数据(如尺码表、材质成分、穿搭建议、库存颜色等)在电商选品、比价工具、时尚趋势分析等场景中具有重要价值。由于平台没有公开官方 API,开发者需通过页面解析来获取商品详情(
item_get
)的信息。本文系统地讲解了接口对接逻辑、技术实现、反爬应对及时尚品类特有字段解析,帮助开发者构建稳定的服装类商品数据获取系统。
一、接口基础认知(核心功能与场景)
核心功能
服装网
item_get
接口(非官方命名)通过商品 ID(
item_id
)获取目标商品的全量信息,主要字段聚焦时尚特性:
- 基础信息:商品 ID、标题(含风格 / 季节,如 “2024 秋季复古连衣裙”)、主图 + 细节图 + 穿搭图、品牌、类目(如 “女装 > 连衣裙”)、详情页 URL
- 价格信息:当前价、原价、优惠活动(如 “满 200 减 50”)、会员价、预售规则(如 “付定金立减”)
- 规格信息:尺码表(肩宽、胸围、衣长等)、颜色选项(含颜色图)、可选尺码(如 “S/M/L” 及对应库存)
- 商品特性:材质成分(如 “95% 棉 + 5% 氨纶”)、工艺细节(如 “刺绣”“水洗做旧”)、风格标签(如 “通勤”“甜辣”)、适用季节
- 库存数据:各颜色 - 尺码组合的实时库存、总库存、预售进度(如 “已售 80%”)
- 用户反馈:用户评价(含晒图)、尺码推荐(如 “偏大一码”)、满意度评分
典型应用场景
- 电商选品工具:获取 “秋季风衣” 的材质、价格区间及用户评价,筛选高性价比款式
- 尺码推荐系统:基于商品尺码表和用户评价中的 “尺码建议”,为消费者推荐合适尺码
- 时尚趋势分析:跟踪 “牛仔外套” 的风格标签变化(如 “复古风→oversize”),分析流行趋势
- 比价监控:对比同款连衣裙在不同平台的价格、优惠活动及库存状态
接口特性
- 时尚导向性:数据突出风格、材质、尺码等服饰核心决策因素,包含大量视觉内容(多图展示)
- 非官方性:依赖页面 HTML 解析,无公开 API,动态加载内容多(如颜色切换后的库存、用户晒图)
- 反爬机制:包含 IP 限制(高频请求封锁)、User-Agent 校验、Cookie 验证(部分评价需登录)、请求频率监控
- 规格复杂性:服装商品多含 “颜色 + 尺码” 二维规格,库存需按组合单独获取
二、对接前置准备(环境与 URL 结构)
开发环境
- 开发语言:Python(推荐,适合处理 HTML 解析与反爬)
- 核心库:
- 网络请求:
(同步请求)、requests
(异步批量获取)aiohttp - 页面解析:
(静态 HTML 解析)、BeautifulSoup
(XPath 提取复杂结构,如尺码表)lxml - 反爬工具:
(随机 User-Agent)、fake_useragent
(代理 IP 池)proxy_pool - 数据处理:
(正则提取材质、尺码)、re
(解析动态库存接口)json
- 网络请求:
商品 ID 与 URL 结构
服装网商品详情页 URL 格式通常为:
https://www.fuzhuang.com/item/{item_id}.html
,其中
item_id
为商品唯一标识(多为数字或数字 + 字母组合,如
123456
或
CLOTH202409
)。示例:某品牌连衣裙详情页
https://www.fuzhuang.com/item/123456.html
,商品 ID 为
123456
。
页面结构分析
通过浏览器开发者工具(F12)分析详情页结构,核心数据位置:
- 静态数据:标题、主图、价格等嵌入主页面 HTML(如
<h1 class="goods-title">
);<div class="price-current"> - 动态数据:颜色 - 尺码库存、用户晒图、详细尺码表等通过 AJAX 接口加载(如
);https://www.fuzhuang.com/ajax/sku/stock?item_id={item_id} - 规格数据:颜色选项在
标签,尺码选项在<div class="color-select">
标签,需关联库存接口获取可用状态。<div class="size-select">
三、接口调用流程(基于页面解析)
以 “获取某品牌秋季连衣裙商品详情” 为例,核心流程为 URL 构建 → 主页面解析 → 动态数据补充 → 规格与库存关联 → 数据结构化:
- URL 与请求头构建
- 目标 URL:
(替换https://www.fuzhuang.com/item/{item_id}.html
为实际值);item_id - 请求头:模拟浏览器行为,需包含
、User-Agent
,部分用户评价需携带登录态Referer
:Cookie
运行
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36",
"Referer": "https://www.fuzhuang.com/category/women/dress/",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
"Cookie": "session_id=xxx; user_id=xxx" # 登录后从浏览器获取
}
从主页面 HTML 中提取基础信息,重点关注服饰特有字段:
| 字段 | 解析方式(CSS 选择器 / XPath) | 示例值 |
|---|---|---|
| 商品标题 |
(CSS 选择器)
|
“2024 秋季复古碎花连衣裙 收腰显瘦” |
| 图片列表 |
的
属性(含主图、细节图)
|
|
| 当前价 |
的文本(去除 “?”)
|
“299.00”(元) |
| 原价 |
的文本(去除 “?”)
|
“499.00”(元) |
| 品牌 |
的文本
|
“XX 女装” |
| 材质成分 |
的文本(提取关键信息)
|
“面料:95% 棉 5% 氨纶” |
div.style-tags span
的项目列表
["复古", "通勤", "碎花"]
色彩选项
div.color-select .color-item
的
data-color
属性
["黑色", "米色", "碎花"]
动态数据补充(AJAX 接口)
尺码表、库存、用户晒图等通过动态接口加载,需单独调用:
库存接口示例:
https://www.fuzhuang.com/ajax/sku/stock?item_id={item_id}
;
响应示例(库存数据):
json
{
"data": {
"skus": [
{"color": "黑色", "size": "S", "stock": 120, "sku_id": "123456-S-黑"},
{"color": "黑色", "size": "M", "stock": 85, "sku_id": "123456-M-黑"},
{"color": "米色", "size": "S", "stock": 0, "sku_id": "123456-S-米"} // 无库存
],
"total_stock": 205
}
}
尺码表接口示例:
https://www.fuzhuang.com/ajax/size/table?item_id={item_id}
,返回详细尺寸信息(肩宽、胸围等)。
规格与库存关联
服装商品的 “色彩 + 尺寸” 组合是核心规格,需将静态颜色 / 尺寸选项与动态库存数据关联:
从静态页面提取所有颜色(如
["黑色", "米色"]
)和尺寸(如
["S", "M", "L"]
);
从库存接口筛选
stock > 0
的有效组合,标记可购买状态;
示例:黑色 - S(库存 120)、黑色 - M(库存 85)为可购,米色 - S(库存 0)为不可购。
数据整合与结构化
合并静态、动态数据,形成标准化字典,突出服饰特性:
python
运行
standardized_data = {
"item_id": item_id,
"title": title,
"images": {
"main": main_images, # 主图
"detail": detail_images, # 细节图
"style": style_images # 穿搭图
},
"price": {
"current": current_price,
"original": original_price,
"discount": discount_info, # 优惠信息
"member_price": member_price # 会员价
},
"specs": {
"colors": [
{
"name": color_name,
"image": color_image_url, # 颜色对应的图片
"sizes": [
{
"name": size_name,
"stock": stock_num,
"sku_id": sku_id # 唯一规格ID
} for size_name, stock_num, sku_id in color_sizes
]
} for color_name, color_image_url, color_sizes in color_list
]
},
"size_table": size_table, # 尺码表(肩宽、胸围等)
"material": material, # 材质成分
"style_tags": style_tags, # 风格标签
"user_feedback": {
"rating": rating, # 综合评分
"comments": comments, # 精选评价(含晒图)
"size_suggestions": size_suggestions # 尺码建议(如“偏大一码”)
},
"url": detail_url
}
四、代码实现示例(Python)
以下是
item_get
接口的完整实现,包含主页面解析、动态接口调用、规格库存关联及反爬处理:
import requests
import time
import random
import re
import json
from bs4 import BeautifulSoup
from fake_useragent import UserAgent
from typing import Dict, List
# 封装好API供应商demo url=https://console.open.onebound.cn/console/?i=Lex
class FuzhuangItemApi:
def __init__(self, proxy_pool: List[str] = None, cookie: str = ""):
self.base_url = "https://www.fuzhuang.com/item/{item_id}.html"
self.stock_api = "https://www.fuzhuang.com/ajax/sku/stock" # 库存接口
self.size_table_api = "https://www.fuzhuang.com/ajax/size/table" # 尺码表接口
self.ua = UserAgent()
self.proxy_pool = proxy_pool # 代理池列表
self.cookie = cookie # 登录态Cookie(用于评价等需登录的内容)
def _get_headers(self) -> Dict[str, str]:
"""生成随机请求头"""
headers = {
"User-Agent": self.ua.random,
"Referer": "https://www.fuzhuang.com/category/",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8"
}
if self.cookie:
headers["Cookie"] = self.cookie
return headers
def _get_proxy(self) -> Dict[str, str]:
"""随机获取代理"""
if self.proxy_pool and len(self.proxy_pool) > 0:
proxy = random.choice(self.proxy_pool)
return {"http": proxy, "https": proxy}
return None
def _clean_price(self, price_str: str) -> float:
"""清洗价格字符串(去除?、逗号等)"""
if not price_str:
return 0.0
price_str = re.sub(r"[^\d.]", "", price_str)
return float(price_str) if price_str else 0.0
def _parse_size_table(self, size_data: Dict) -> List[Dict]:
"""解析尺码表数据(如肩宽、胸围)"""
if not size_data.get("data"):
return []
table = size_data["data"].get("table", [])
# 转换为[{ "尺码": "S", "肩宽": "36cm", ... }, ...]
return [dict(zip(table[0], row)) for row in table[1:]] if table else []
def _parse_static_data(self, html: str) -> Dict:
"""解析主页面静态数据"""
soup = BeautifulSoup(html, "lxml")
# 提取颜色选项(含颜色图)
color_list = []
for color_item in soup.select("div.color-select .color-item"):
color_name = color_item.get("data-color") or ""
color_img = color_item.select_one("img")?.get("src") or ""
color_list.append({"name": color_name, "image": color_img})
# 提取尺码选项(名称)
size_names = [size.get("data-size") for size in soup.select("div.size-select .size-item") if size.get("data-size")]
# 提取材质成分(清洗文本)
material = soup.select_one("div.material")?.text.strip() or ""
material = re.sub(r"\s+", " ", material) # 去除多余空格
return {
"title": soup.select_one("h1.goods-title")?.text.strip() or "",
"images": {
"main": [img.get("src") for img in soup.select("div.main-gallery img") if img.get("src")],
"detail": [img.get("src") for img in soup.select("div.detail-images img") if img.get("src")],
"style": [img.get("src") for img in soup.select("div.style-show img") if img.get("src")]
},
"price": {
"current": self._clean_price(soup.select_one("div.price-current")?.text or ""),
"original": self._clean_price(soup.select_one("div.price-original")?.text or ""),
"discount": soup.select_one("div.discount-tag")?.text.strip() or "",
"member_price": self._clean_price(soup.select_one("div.member-price")?.text or "")
},
"brand": soup.select_one("div.brand-name a")?.text.strip() or "",
"material": material,
"style_tags": [tag.text.strip() for tag in soup.select("div.style-tags span")],
"specs": {
"colors": color_list,
"size_names": size_names
},
"user_feedback": {
"rating": float(soup.select_one("div.average-rating")?.text or "0"),
"comment_count": int(re.search(r"\d+", soup.select_one("div.comment-count")?.text or "0").group()) if soup.select_one("div.comment-count") else 0
}
}
def _parse_comments(self, html: str) -> List[Dict]:
"""解析用户评价(含尺码建议)"""
soup = BeautifulSoup(html, "lxml")
comments = []
for item in soup.select("div.comment-item")[:5]: # 取前5条
user_info = item.select_one("div.user-info")?.text.strip() or "匿名用户"
# 提取用户体型(如“165cm/50kg”)
body_type = re.search(r"\d+cm/\d+kg", user_info).group() if re.search(r"\d+cm/\d+kg", user_info) else ""
# 提取购买的规格(颜色+尺码)
buy_spec = item.select_one("div.buy-spec")?.text.strip() or ""
# 提取评价内容
content = item.select_one("div.comment-content")?.text.strip() or ""
# 提取尺码建议(如“偏大一码”)
size_suggest = ""
if "码" in content:
suggest_match = re.search(r"(偏大|偏小|正常).*?码", content)
size_suggest = suggest_match.group() if suggest_match else ""
# 提取晒图
images = [img.get("src") for img in item.select("div.comment-images img") if img.get("src")]
comments.append({
"user": user_info,
"body_type": body_type,
"buy_spec": buy_spec,
"content": content,
"size_suggest": size_suggest,
"images": images
})
return comments
def _fetch_dynamic_data(self, item_id: str, headers: Dict[str, str], proxy: Dict[str, str]) -> Dict:
"""调用动态接口获取库存和尺码表"""
dynamic_data = {
"stock": {"skus": [], "total_stock": 0},
"size_table": []
}
try:
# 1. 获取库存数据
stock_params = {"item_id": item_id}
stock_resp = requests.get(
self.stock_api,
params=stock_params,
headers=headers,
proxies=proxy,
timeout=10
)
stock_data = stock_resp.json()
if stock_data.get("code") == 0 and "data" in stock_data:
dynamic_data["stock"] = stock_data["data"]
# 2. 获取尺码表
size_params = {"item_id": item_id}
size_resp = requests.get(
self.size_table_api,
params=size_params,
headers=headers,
proxies=proxy,
timeout=10
)
size_data = size_resp.json()
dynamic_data["size_table"] = self._parse_size_table(size_data)
except Exception as e:
print(f"动态数据获取失败: {str(e)}")
return dynamic_data
def _merge_specs_and_stock(self, static_specs: Dict, stock_data: Dict) -> List[Dict]:
"""合并颜色、尺码与库存数据"""
colors = static_specs["colors"]
size_names = static_specs["size_names"]
skus = stock_data.get("skus", [])
# 按颜色分组库存
color_stock_map = {}
for sku in skus:
color = sku["color"]
if color not in color_stock_map:
color_stock_map[color] = []
color_stock_map[color].append(sku)
# 合并颜色与对应尺码库存
merged_colors = []
for color in colors:
color_name = color["name"]
color_image = color["image"]
# 获取该颜色的所有尺码库存
color_skus = color_stock_map.get(color_name, [])
# 关联尺码名称(确保顺序与页面一致)
sizes = []
for size_name in size_names:
# 查找该颜色+尺码的库存
sku_match = next((s for s in color_skus if s["size"] == size_name), None)
if sku_match:
sizes.append({
"name": size_name,
"stock": sku_match["stock"],
"sku_id": sku_match["sku_id"],
"available": sku_match["stock"] > 0
})
else:
sizes.append({
"name": size_name,
"stock": 0,
"sku_id": "",
"available": False
})
merged_colors.append({
"name": color_name,
"image": color_image,
"sizes": sizes
})
return merged_colors
def item_get(self, item_id: str, timeout: int = 10) -> Dict:
"""
获取服装网商品详情
:param item_id: 商品ID(如123456、CLOTH202409)
:param timeout: 超时时间
:return: 标准化商品数据
"""
try:
# 1. 主页面请求
url = self.base_url.format(item_id=item_id)
headers = self._get_headers()
proxy = self._get_proxy()
# 随机延迟,避免反爬
time.sleep(random.uniform(1.5, 3))
response = requests.get(
url=url,
headers=headers,
proxies=proxy,
timeout=timeout
)
response.raise_for_status()
main_html = response.text
# 2. 解析主页面数据
static_data = self._parse_static_data(main_html)
if not static_data["title"]:
return {"success": False, "error_msg": "商品不存在或已下架"}
# 3. 解析用户评价
comments = self._parse_comments(main_html)
static_data["user_feedback"]["comments"] = comments
# 提取尺码建议汇总
size_suggestions = [c["size_suggest"] for c in comments if c["size_suggest"]]
static_data["user_feedback"]["size_suggestions"] = size_suggestions
# 4. 获取动态数据(库存、尺码表)
dynamic_data = self._fetch_dynamic_data(item_id, headers, proxy)
# 5. 合并规格与库存
merged_colors = self._merge_specs_and_stock(
static_data["specs"],
dynamic_data["stock"]
)
# 6. 整合结果
result = {
"success": True,
"data": {
"item_id": item_id,** static_data,
"specs": {
"colors": merged_colors,
"total_stock": dynamic_data["stock"].get("total_stock", 0)
},
"size_table": dynamic_data["size_table"],
"url": url,
"update_time": time.strftime("%Y-%m-%d %H:%M:%S")
}
}
return result
except requests.exceptions.HTTPError as e:
if "403" in str(e):
return {"success": False, "error_msg": "触发反爬,建议更换代理或Cookie", "code": 403}
return {"success": False, "error_msg": f"HTTP错误: {str(e)}", "code": response.status_code}
except Exception as e:
return {"success": False, "error_msg": f"获取失败: {str(e)}", "code": -1}
# 封装好API供应商demo url=https://console.open.onebound.cn/console/?i=Lex
# 使用示例
if __name__ == "__main__":
# 代理池(替换为有效代理)
PROXIES = [
"http://123.45.67.89:8888",
"http://98.76.54.32:8080"
]
# 登录态Cookie(从浏览器获取,用于评价等内容)
COOKIE = "session_id=xxx; user_id=xxx"
# 初始化API客户端
api = FuzhuangItemApi(proxy_pool=PROXIES, cookie=COOKIE)
# 获取商品详情(示例item_id)
item_id = "123456" # 替换为实际商品ID
result = api.item_get(item_id)
if result["success"]:
data = result["data"]
print(f"商品标题: {data['title']}")
print(f"价格: 当前¥{data['price']['current']} | 原价¥{data['price']['original']} | 优惠: {data['price']['discount']}")
print(f"品牌: {data['brand']} | 材质: {data['material']} | 风格: {', '.join(data['style_tags'])}")
print(f"用户评分: {data['user_feedback']['rating']}分 | 评价数: {data['user_feedback']['comment_count']}条")
print(f"颜色选项: {', '.join([c['name'] for c in data['specs']['colors']])}")
print(f"可购规格示例({data['specs']['colors'][0]['name']}):")
for size in data['specs']['colors'][0]['sizes'][:3]:
status = "有货" if size['available'] else "无货"
print(f" 尺码{size['name']}: {size['stock']}件({status})")
print(f"核心尺码表:")
if data['size_table']:
for row in data['size_table'][:3]: # 打印前3行
print(f" {row['尺码']}: 肩宽{row.get('肩宽', '')} | 胸围{row.get('胸围', '')} | 衣长{row.get('衣长', '')}")
print(f"用户尺码建议: {', '.join(data['user_feedback']['size_suggestions'][:3])}")
else:
print(f"获取失败: {result['error_msg']}(错误码: {result.get('code')})")
五、关键技术难点与解决方案
尺码表解析与标准化
问题
:服装尺码表格式多样(表格 / 文本),参数命名不一致(如 “衣长” vs “长度”),且包含单位(cm/inch),提取和比对难度大。
解决方案
:
优先调用动态尺码表接口(结构化数据),若接口不可用则解析页面表格,用
pandas
转换为标准字典;
建立核心参数映射表(如 “衣长”“长度” 统一为 “衣长”),去除单位仅保留数值(便于后续对比);
示例代码中
_parse_size_table
函数将表格数据转换为标准化列表,支持直接提取 “肩宽”“胸围” 等关键参数。
颜色 - 尺码库存关联
问题
:服装商品的库存以 “色彩 + 尺寸” 组合为单位(如黑色 - S、米色 - M),需将静态颜色 / 尺寸选项与动态库存数据精准关联,避免匹配错误。
解决方案
:
从静态页面提取颜色名称和尺寸名称,作为基础维度;
从库存接口获取
sku
列表,按颜色分组构建映射表(
color_stock_map
);
遍历静态颜色列表,为每个颜色匹配对应的尺寸库存,标记 “有货 / 无货” 状态(
available
字段);
示例代码中
_merge_specs_and_stock
函数实现完整关联逻辑,确保库存数据与页面选项一一对应。
用户评价中的尺码建议提取
问题
:用户评价中的 “尺码建议”(如 “偏大一码”“165cm 选 M 码”)是服装决策的关键数据,但分散在文本中,需精准提取。
解决方案
:
用正则匹配关键词(如 “偏大”“偏小”“码”),提取结构化建议(如
size_suggest
字段);
关联用户体型信息(如 “165cm/50kg”),为尺码推荐系统提供参考;
对评价内容进行情感分析(正面 / 负面),结合尺码建议形成综合决策数据。
反爬机制对抗
问题
:服装网对商品数据爬取限制严格,高频请求会触发 IP 封锁(403 错误),尤其针对多图商品(图片 URL 易被识别)。
解决方案
:
代理 IP 轮换
:使用高匿代理池,每 2-3 次请求切换 IP,优先选择国内 IP(服装网用户以国内为主);
请求频率控制
:单 IP 每分钟请求≤3 次,两次请求间隔 2-4 秒(模拟用户浏览服装详情的节奏);
图片 URL 处理
:爬取图片时添加随机延迟(1-2 秒),避免因批量下载图片触发反爬;
Cookie 池策略
:维护多个登录态 Cookie,随机携带以降低单一账号风险,尤其在获取用户评价时。
六、最佳实践与合规要点
系统架构设计
采用 “轻量采集 + 图片缓存” 架构,适配服装类商品特性:
采集层
:集成代理池、Cookie 池,控制图片下载频率,避免触发反爬;
解析层
:分离基础信息与动态数据解析逻辑,重点处理尺码表与库存关联;
存储层
:用 Redis 缓存商品基础信息(1 小时过期,价格波动较快),对象存储(如 OSS)缓存图片(长期有效);
监控层
:实时监控请求成功率、库存数据完整度,异常时通过邮件告警。
性能优化策略
异步批量获取
:使用
aiohttp
并发处理多个
item_id
(控制并发数≤3),提升效率;
按需解析
:列表页优先提取
item_id
、价格、主图等核心字段,详细尺码表和评价通过后续
item_get
接口补充;
图片懒加载
:非必要图片(如细节图)可延迟下载,优先保证文字数据获取速度。
合规性与风险控制
频率限制
:单 IP 日请求量≤500 次,避免对服务器造成压力,符合平台 robots 协议;
数据使用边界
:不得将用户评价、晒图用于商业售卖或恶意竞争,需注明数据来源 “服装网”;
图片版权
:服装图片可能涉及品牌版权,使用时需遵守《著作权法》,不得擅自用于商业宣传。
七、总结
服装网
item_get
接口的对接核心在于
色彩 - 尺寸库存的精准关联
、
尺码表的标准化解析
及
用户评价中决策信息的提取。开发者需特别关注:
- 二维规格(颜色 + 尺寸)与库存数据的对应逻辑(确保购买状态准确);
- 尺码表和用户建议的结构化处理(帮助消费者决策);
- 图片抓取的反爬虫策略(防止因多图下载触发封禁)。
通过本文提出的技术方案,可以构建一个稳定的商品详情获取系统,为服装电商、时尚分析等场景提供可靠的数据支持。在实际应用中,需要根据平台最新的页面结构动态调整解析规则,以平衡数据获取的效率和合规性。
item_get

雷达卡


京公网安备 11010802022788号







