云之家团队 · 区域同事 AI 技能评分标准 · 2026 年 4 月版
| 维度 | 分项 | 评分项 | 分值 | 评分标准 | 评分依据 |
|---|---|---|---|---|---|
| A 意 图 层 |
A1 | 单一职责原则 | 8 |
8分 Skill 只做一件明确的事,功能不混杂 6分 基本单一,但有一两项边界模糊 4分 有2-3个关联功能,但勉强可接受 2分 功能混杂,一眼看不出核心干什么 0分 完全看不出单一职责 |
读 SKILL.md,查找核心定位段落,判断是否"一专多能" |
| A2 | 命名质量 | 5 |
5分 全小写+中划线,英文动作词,含义清晰(如 pdf-reader)4分 命名合理但有轻微歧义 3分 中文或混合,大小写不规范,但能理解 1分 命名模糊、拼音或无意义名称 0分 完全没有命名规范 |
目录名、name 字段是否符合规范 | |
| A3 | 触发条件清晰度 | 6 |
6分 同时有「适用场景」和「不适用场景」,描述清晰 4分 只有适用场景,描述基本准确 2分 有触发词但描述模糊 0分 无触发条件,或完全混乱 |
SKILL.md 中是否有明确的触发条件段落 | |
| A4 | 描述质量 | 6 |
6分 description ≤3句话,AI 可直接理解,无术语堆砌 4分 描述基本清晰,但略冗长或有一两句废话 2分 描述模糊,有术语堆砌 0分 无 description 或完全无法理解 |
description 字段长度与可读性 | |
| A 意图层 小计 | 25 | 黄金原则 #1-4:设计意图清晰度 | |||
| B 结 构 层 |
B1 | 声明式优于命令式 | 6 |
6分 描述"能做什么",AI 自己规划执行路径 4分 大部分声明式,偶有小段命令式流程 2分 大段命令式步骤("先做A→再做B→最后C") 0分 全程命令式,看不到能力声明 |
核心流程段落是"能解析PDF/支持X/Y/Z"还是"第1步打开文件" |
| B2 | 原子化程度 | 6 |
6分 功能紧凑,无多余捆绑,可独立使用 4分 基本原子,有1-2处可拆分但勉强保留 2分 功能偏多但有内在关联勉强可接受 0分 大而全的"全能型" skill |
参考 create-skill-zs "坚持单一职责,功能多则拆分"原则 | |
| B3 | 渐进式披露 | 5 |
5分 先核心功能+必填参数,高级选项单独标注 3分 有层次但不够清晰 0分 所有信息平铺,无层次 |
内容结构是否有主次、层次之分 | |
| B4 | 输入输出标准化 | 8 |
8分 有明确输入格式、输出结构(JSON格式),有返回示例 6分 有输入/输出说明,但格式不统一 4分 提到输入/输出但无格式定义 0分 完全无输入/输出规范 |
SKILL.md 中输入/输出格式定义是否完整 | |
| B 结构层 小计 | 25 | 黄金原则 #5-8:架构质量 | |||
| C 执 行 层 |
C1 | 防御性编程 | 5 |
5分 有参数判空、异常捕获、友好报错 3分 部分场景有异常处理 0分 无任何防御性措施 |
SKILL.md 中的「约束与边界」或代码文件中的 try-except |
| C2 | 幂等性 | 5 |
5分 明确说明重复执行不会出错,或有去重机制 3分 隐含幂等但未明确说明 0分 可能产生重复副作用 |
SKILL.md 中是否提及幂等性保障 | |
| C3 | 安全边界 | 5 |
5分 无硬编码凭证、无危险命令、不越权 3分 基本安全但有1处需注意(如相对路径) 0分 有明显安全隐患 |
代码或文档中是否存在安全隐患 | |
| C 执行层 小计 | 15 | 黄金原则 #9-12:代码质量 | |||
| D 交 互 层 |
D1 | 人类可读错误 | 5 |
5分 所有报错均为"人话",无代码堆栈 3分 主要报错友好,偶有技术术语 0分 报错为技术堆栈或完全缺失 |
SKILL.md 中的错误处理说明 |
| D2 | 示例质量 | 6 |
6分 提供 ≥3 个真实调用示例,格式规范 4分 提供 2 个示例 2分 只有 1 个示例或示例模糊 0分 无任何示例 |
参考 create-skill-zs 要求"每个技能至少 2 个真实调用示例" | |
| D3 | 上下文精简 | 4 |
4分 内容紧凑,无冗余段落,token 消耗合理 2分 略冗长但可接受 0分 大量重复、废话、无关内容 |
SKILL.md 总长度与信息密度 | |
| D 交互层 小计 | 15 | 黄金原则 #13-15:使用体验 | |||
| E 岗 位 价 值 |
E1 | 职责匹配度 | 8 |
8分 Skill 完全命中岗位核心职责 6分 高度相关,有1-2处偏差 4分 部分相关,但有明显范围错配 2分 相关性弱 0分 完全不相关 |
根据被评价人岗位(前端/售前/技术支持/后端)判断 |
| E2 | 效率提升 | 6 |
6分 能显著减少重复工作,预计节省 >50% 时间 4分 有明显效率提升,预计节省 20-50% 时间 2分 有一定帮助,但效果有限 0分 现有流程完全可替代,无额外价值 |
Skill 对实际工作的效率改善程度 | |
| E3 | 实用价值 | 6 |
6分 可直接在实际工作中使用,门槛低 4分 需要轻微调整后可使用 2分 有参考价值但实际使用门槛较高 0分 纯理论,无法落地 |
Skill 的落地可行性与使用门槛 | |
| E 岗位价值 小计 | 20 | 岗位实际需求匹配度 | |||