WORKBUDDY SKILL REVIEW

📊 Skill 评分体系

云之家团队 · 区域同事 AI 技能评分标准 · 2026 年 4 月版

📅 2026-04-16 👤 张顺 🏷️ 基础分 80 + 附加分 20

评分总分构成

A 意图层
25
/ 25
设计意图
B 结构层
25
/ 25
架构质量
C 执行层
15
/ 15
代码质量
D 交互层
15
/ 15
使用体验
E 岗位价值
20
/ 20
实际效用
基础总分 80 / 100 + 附加分 20(可突破上限)

基础评分明细(满分 80 分)

A+B+C+D+E
维度 分项 评分项 分值 评分标准 评分依据
A


A1 单一职责原则 8 8分 Skill 只做一件明确的事,功能不混杂
6分 基本单一,但有一两项边界模糊
4分 有2-3个关联功能,但勉强可接受
2分 功能混杂,一眼看不出核心干什么
0分 完全看不出单一职责
读 SKILL.md,查找核心定位段落,判断是否"一专多能"
A2 命名质量 5 5分 全小写+中划线,英文动作词,含义清晰(如 pdf-reader
4分 命名合理但有轻微歧义
3分 中文或混合,大小写不规范,但能理解
1分 命名模糊、拼音或无意义名称
0分 完全没有命名规范
目录名、name 字段是否符合规范
A3 触发条件清晰度 6 6分 同时有「适用场景」和「不适用场景」,描述清晰
4分 只有适用场景,描述基本准确
2分 有触发词但描述模糊
0分 无触发条件,或完全混乱
SKILL.md 中是否有明确的触发条件段落
A4 描述质量 6 6分 description ≤3句话,AI 可直接理解,无术语堆砌
4分 描述基本清晰,但略冗长或有一两句废话
2分 描述模糊,有术语堆砌
0分 无 description 或完全无法理解
description 字段长度与可读性
A 意图层 小计 25 黄金原则 #1-4:设计意图清晰度
B


B1 声明式优于命令式 6 6分 描述"能做什么",AI 自己规划执行路径
4分 大部分声明式,偶有小段命令式流程
2分 大段命令式步骤("先做A→再做B→最后C")
0分 全程命令式,看不到能力声明
核心流程段落是"能解析PDF/支持X/Y/Z"还是"第1步打开文件"
B2 原子化程度 6 6分 功能紧凑,无多余捆绑,可独立使用
4分 基本原子,有1-2处可拆分但勉强保留
2分 功能偏多但有内在关联勉强可接受
0分 大而全的"全能型" skill
参考 create-skill-zs "坚持单一职责,功能多则拆分"原则
B3 渐进式披露 5 5分 先核心功能+必填参数,高级选项单独标注
3分 有层次但不够清晰
0分 所有信息平铺,无层次
内容结构是否有主次、层次之分
B4 输入输出标准化 8 8分 有明确输入格式、输出结构(JSON格式),有返回示例
6分 有输入/输出说明,但格式不统一
4分 提到输入/输出但无格式定义
0分 完全无输入/输出规范
SKILL.md 中输入/输出格式定义是否完整
B 结构层 小计 25 黄金原则 #5-8:架构质量
C


C1 防御性编程 5 5分 有参数判空、异常捕获、友好报错
3分 部分场景有异常处理
0分 无任何防御性措施
SKILL.md 中的「约束与边界」或代码文件中的 try-except
C2 幂等性 5 5分 明确说明重复执行不会出错,或有去重机制
3分 隐含幂等但未明确说明
0分 可能产生重复副作用
SKILL.md 中是否提及幂等性保障
C3 安全边界 5 5分 无硬编码凭证、无危险命令、不越权
3分 基本安全但有1处需注意(如相对路径)
0分 有明显安全隐患
代码或文档中是否存在安全隐患
C 执行层 小计 15 黄金原则 #9-12:代码质量
D


D1 人类可读错误 5 5分 所有报错均为"人话",无代码堆栈
3分 主要报错友好,偶有技术术语
0分 报错为技术堆栈或完全缺失
SKILL.md 中的错误处理说明
D2 示例质量 6 6分 提供 ≥3 个真实调用示例,格式规范
4分 提供 2 个示例
2分 只有 1 个示例或示例模糊
0分 无任何示例
参考 create-skill-zs 要求"每个技能至少 2 个真实调用示例"
D3 上下文精简 4 4分 内容紧凑,无冗余段落,token 消耗合理
2分 略冗长但可接受
0分 大量重复、废话、无关内容
SKILL.md 总长度与信息密度
D 交互层 小计 15 黄金原则 #13-15:使用体验
E



E1 职责匹配度 8 8分 Skill 完全命中岗位核心职责
6分 高度相关,有1-2处偏差
4分 部分相关,但有明显范围错配
2分 相关性弱
0分 完全不相关
根据被评价人岗位(前端/售前/技术支持/后端)判断
E2 效率提升 6 6分 能显著减少重复工作,预计节省 >50% 时间
4分 有明显效率提升,预计节省 20-50% 时间
2分 有一定帮助,但效果有限
0分 现有流程完全可替代,无额外价值
Skill 对实际工作的效率改善程度
E3 实用价值 6 6分 可直接在实际工作中使用,门槛低
4分 需要轻微调整后可使用
2分 有参考价值但实际使用门槛较高
0分 纯理论,无法落地
Skill 的落地可行性与使用门槛
E 岗位价值 小计 20 岗位实际需求匹配度
🔔 保底原则:只要 Skill 能被正常加载并执行核心功能,即使全部维度最低分,E1-E3 各得 2 分保底,基础总分至少 60 分

附加加分项(满分 20 分,可突破 100 上限)

Bonus
B1
🤖 AI 深度使用
+3 分
邮件文案/文稿大量使用 AI 生成(AI 生成正文、AI 代发邮件等),AI 用得越多越加分。核心:鼓励用 AI,而非惩罚用 AI。

字数加分标准(文稿类):
字数 ≥ 500 字数明显偏多,+0.5分
字数 ≥ 1000 字数大量,+1分
字数 ≥ 2000 字数超多,+1.5分(满分)
原则:真人一般不会写大量文案交作业,字数越多越可能是AI深度参与
B2
📎 额外作业文件
+3~5 分
提交了超出要求的额外内容:
+2 测试用例(3个以上不同输入)
+2 使用说明/教程
+2 对比报告
+1 演示截图/动图
+3 实际应用案例
+3 定制化修改版本
+2 多文件打包(有 README)
B3
🔧 AI 二次加工
+1~3 分
对 skill 输出做了二次加工(修改参数/调整内容/融入自己的工作场景),而非直接提交原始输出。加工越深入加分越高。
B4
📁 命名与组织规范
+2 分
文件命名规范(`姓名-skill名-输出内容.md`)、压缩包命名正确(`姓名-skill实践作业.zip`)、目录结构清晰。
B5
⚙️ 高级特性使用
+1~3 分
用了 skill 的进阶参数/自定义配置/工作流集成,而非只跑基础场景。高级特性用得越多加分越高。
B6
🔗 工作流集成
+2~4 分
将 skill 落地到日常工作(如:周报助手已集成到个人助理),附上了实际使用截图或记录。集成越深入加分越高。
B7
💡 主动改进
+2~4 分
对 skill 提出了有价值的改进建议(bug 反馈/功能缺失/体验优化),附上具体方案。改进建议质量越高加分越高。
B8
🏷️ AI 使用标注
+2 分
主动标注了哪些部分是 AI 辅助完成的,体现了对工具边界的认知和对团队的坦诚。
B9
🎯 多 Skill 提交
+2~4 分
+2 提交了 2 个 skill
+3 提交了 3 个 skill
+4 提交了 4 个及以上 skill
说明:多个 skill 说明主动投入精力多,+1 个加 1 分,4 个及以上加满分
B10
⭐ 万能补充加分项
+1~5 分
评分过程中发现的其他优秀 AI 使用成果/实例,超出预设加分项范围的行为,如:
• 要求外的额外产出(演示视频、自制教程等)
• 对作业做了深度二次加工(远超平均水平)
• 有创意地使用了其他 AI 工具辅助完成作业
• 提交了非常有价值的反馈或改进建议
此项由评分者自行判断,+1~5 分,说明加分理由
附加加分上限
20 分
可突破 100 上限
总分最高可达 120

评分等级对照

90-100
🌟 优秀
可作为团队标杆,推荐分享
80-89
✅ 良好
符合标准,稍加打磨更佳
75-79
🔄 合格
基本可用,有明确改进方向
60-74
⚠️ 需改进
存在明显不足,需要返工
< 60
❌ 不合格
Skill 不完整或无法运行
(保底调整至 60 分)

岗位对照 · E1 职责匹配度高价值场景

👨‍💻 前端
方案文档 PPT制作 竞品对比 需求梳理 客户沟通话术
曹治、屈增辉、袁红桥、刘尉鸿、李文龙、陆赛
📋 售前
投标文件 技术方案 报价计算 需求分析 竞品话术 产品演示
王巧、吴开春
🔧 技术支持
故障诊断 问题处理 操作手册 FAQ 知识库 技术方案
王海逸
💻 后端
实施文档 客户调研 需求分析 增购方案 技术可行性评估
朱文静、吴玉婷、武福霞、刘天桦、陈文文