任务6-1 成果评价COMET | 泰州职业技术学院工单式教学指导书（第1版）

# 【工单6-1】COMET化评价设计：八标准量表中文版与本土适配【T→C→P】

# ■ 任务呈现区

情境：您传统的评价标准是"操作正确得10分，步骤完整得5分，安全规范得5分"。但这种评价只能区分"对/错"，无法区分"好/更好/最好"。更重要的是：学生只会操作，不会考虑成本、环境、社会责任——而这些恰恰是COMET模型中"整体化设计能力"的核心。您需要将COMET八标准本土化为可操作的评价量表。

学习目标：

理解COMET八标准的内涵和层级关系
掌握将COMET八标准适配到本土课程的方法
能设计1份适配后的八标准Rubric

核心输出物：

[ ] 1份适配后的COMET八标准Rubric（中文版）

# ■ 任务定位栏

【3D Penetration】本工单的三维属性标注

内容维度：③ 问题特殊型（K1-K8量表的本土化改编与试用验证）

行动维度：资讯→计划→决策→展示→执行→检查→评价（资讯（研读COMET原版Rubric）→计划（规划本土化改编方案）→决策（选择改编策略）→实施（撰写中文版四级Rubric）→检查（同行试用并收集反馈）→评价（反思Rubric信效度））

需求维度：目标水平=L3-L4 | 核心K标准：K1/K2/K3/K4/K5/K6/K7/K8

向上穿透：T层"COMET评价量表本土化"→C层"教学评价设计能力"→P层"职业教育评价能力"→G层"评价素养"

# ■ 教研分组与角色分配

分组建议：3-5人教研小组。根据任务复杂度确定小组规模。 角色分工（建议轮换）：

主持人：负责研讨节奏把控、量表整合与最终共识形成

量表译制员：负责八标准量表翻译、术语本土化与表述优化

本土适配员：负责量表本土适配研究、行业对照与专家评审组织

专家审核员：负责量表质量审核、信效度检验与版本管理

# ■ 知识准备区

1. COMET八标准原文与内涵

编号	英文	中文	核心内涵	Bybee对应
K1	Clearness/Presentation	清晰性/表达	成果表达清晰，他人能理解	功能→过程
K2	Functionality/Operability	功能性/可操作性	技术方案正确，能工作	功能
K3	Sustainability/Utility	使用价值/可持续性	方案可用、可维护、可扩展	过程
K4	Efficiency/Effectiveness	成本效益/效率	经济可行，资源利用合理	过程
K5	Business & Work Process Orientation	工作过程导向	考虑前后工序关联	过程
K6	Social Acceptance	社会责任	考虑安全、健康、伦理	多维
K7	Environmental Compatibility	环境责任	考虑环保、节能、回收	多维
K8	Creativity	创造性	方案独特，有创新元素	多维

2. 八标准的层级激活逻辑

COMET评价遵循层级激活原则：

K1 + K2 必须首先满足（功能能力是基线）
    ↓
K3 + K4 + K5 在K1K2满足后才被评价（过程能力层）
    ↓
K6 + K7 + K8 在前五项满足后才被评价（设计能力层）

含义：如果一个方案连基本功能都不满足（K2不达标），讨论它的创造性（K8）没有意义。

3. 八标准的本土化适配

COMET八标准来源于德国工业语境，直接翻译可能不适用于泰职院的所有专业。本土化适配原则：

标准	德国工业语境	泰职院本土化示例
K2 功能性	机械设备能否运行	程序能否正确执行/作品是否符合规格
K3 使用价值	产品能否长期稳定使用	方案是否能在实训室条件下实施
K4 成本效益	材料成本、工时成本	耗材用量是否合理、时间是否可控
K5 工作过程	前后工序衔接	本任务与课程其他任务的关联
K6 社会责任	工厂安全、员工健康	实训安全、作品对他人的影响
K7 环境责任	工业排放、废料处理	实训废料处理、节能设计
K8 创造性	技术创新、工艺改进	与标准方案不同的优化/替代方案

4. 四级评分制与行为化描述

每个标准设四级：

等级	名称	得分	通用描述
4	精通	4分	超出期望，可作为范例
3	熟练	3分	完全达标，无瑕疵
2	基本掌握	2分	基本达标，有小问题
1	初步	1分	未达标，需返工

# ■ 计划区

【计划要求】 明确"做什么"，将任务目标分解为可操作的子目标，制定行动方案、步骤顺序、资源配置与时间规划。

子目标分解：

子目标	具体内容	预计用时
翻译本土化K1-K8	将COMET八标准的原文翻译并适配为中文语境	20分钟
设计4级评分标准	为每个K标准设计1-2-3-4分的具体行为描述	20分钟
建立跨专业适配框架	设计通用版与专业定制版的切换机制	5分钟

行动方案：

翻译对照：对照COMET原文和中文版，确保翻译准确且符合中国职业教育语境
本土化调整：将"工作过程知识""行动能力"等概念调整为中国教师熟悉的表述
评分设计：为每个K标准设计4级评分——1分（初步/名义）/2分（基本/功能）/3分（熟练/过程）/4分（精通/设计）
适配设计：设计"通用版（所有专业可用）"和"专业定制版（本专业专用）"的切换指南

# ■ 决策区

【决策要求】 评估各方案的可行性，选择最优路径并说明决策理由。决策依据应与T层能力点对应。

关键决策点：确定量表使用方式

方式	特征	优势	风险	适用情境
A. 通用版（直接使用）	不修改，直接应用于所有专业	标准化高，便于横向比较	可能与特定专业情境脱节	跨专业对比研究
B. 专业定制版（本土化调整）	根据专业特点调整描述语和案例	贴合实际，教师接受度高	标准化下降，难以跨专业比较	日常教学评价
C. 混合版（通用框架+专业案例）	保持K标准通用描述，案例用本专业	兼顾标准化与情境化	需要更多设计工作量	校本评价改革

我的选择：□A □B □C 选择理由：________________________________

本土化调整自检：

K标准描述是否符合中国职业教育话语体系？□是 □否
4级评分是否有明确的行为区分？□是 □否
是否提供了专业适配的示例？□是 □否

# ■ 展示区

【展示要求】 向小组展示计划与决策成果（口头汇报/海报/文档/原型），接受同伴提问、教师点评与自我修正。

展示形式：□评价量表 □本土化说明 □口头汇报（3分钟）

展示内容清单：

[ ] COMET八标准中文版量表（至少3个K标准）
[ ] 1个K标准的4级评分详细说明
[ ] 本土化调整对照表（原文→中文版→调整理由）
[ ] 专业适配示例（1个专业的定制版本）

同伴反馈记录：

反馈人	问题/建议	我的回应/修正

# ■ 执行区

【六步法映射说明】 本工单的执行步骤对应完整行动七步法（资讯→计划→决策→展示→执行→检查→评价）。每个Step标题后的【】标注了该步骤对应的六步环节。若某环节在本工单中未独立设Step，则该环节已融入相邻Step中。

Step 1：选择1个核心工单任务 【资讯】

Step 2：为每个K标准撰写行为化描述 【计划】

以K2"功能性"为例：

等级	行为化描述（以"数控对刀"为例）
4分	对刀后加工试切，尺寸误差≤0.01mm，无需二次调整
3分	对刀后加工试切，尺寸误差≤0.02mm，经微调后达标
2分	对刀后加工试切，尺寸误差0.02-0.05mm，需重新对刀
1分	对刀后加工试切，尺寸误差>0.05mm，或无法完成试切

请为您的任务撰写8个标准的四级描述：

K标准	4分（精通）	3分（熟练）	2分（基本）	1分（初步）
K1
K2
K3
K4
K5
K6
K7
K8

Step 3：确定权重 【决策】

不是所有标准都同等重要。根据主导任务类型调整权重：

主导类型	K1	K2	K3	K4	K5	K6	K7	K8
①知识激活型	10%	30%	10%	5%	5%	10%	10%	20%
②技能操练型	10%	40%	10%	5%	10%	10%	10%	5%
③问题解决型	10%	20%	15%	10%	15%	10%	10%	10%
④综合项目型	10%	15%	15%	10%	15%	10%	10%	15%

Step 4：试用并修订 【实施】

将Rubric用于1次实际评价，记录：

哪些等级的描述学生看不懂？→ 简化语言
哪些标准难以区分等级？→ 增加行为化指标
哪些标准权重不合理？→ 调整权重

# ■ 成果提交区

[ ] 1份适配后的COMET八标准Rubric（含四级描述和权重）
[ ] 试用记录（至少1次）

# ■ 评价反思区

【K1-K8产出评价】 本工单使用COMET八标准中的相关维度进行产出评价，评价的是「完成质量」而非「态度同意度」。

K标准	评价维度	1分（初步）	2分（基本）	3分（熟练）	4分（精通）
K1 清晰性	我的产出清晰度	Rubric混乱	能清晰表达	能准确描述	能建立范例库
K2 功能性	我的产出功能性	无法评价	能基本评价	能精确评价	能建立智能评价
K3 使用价值	我的产出效率	只能用一次	能重复使用	能版本管理	能自适应更新
K5 工作过程导向	我的工作过程完整性	不衔接课程	能衔接课程	能衔接专业群	能建立评价地图

个人改进计划：

# ■ 理论注解 ★

【P1 理论溯源】

COMET八标准评价体系的诞生源于德国职业教育对"能力本位评价"的深层反思。1990年代，德国职业教育面临一个根本性问题：传统的知识考试（如笔试）无法评价学生的职业能力。一个学生笔试考了90分，不代表他能在真实工作中解决问题。Rauner团队在Bremen大学开始了长达20年的研究，最终开发了COMET模型。

八项评价标准（K1-K8）的设计遵循两个核心原则。第一个是层级激活逻辑（hierarchical activation logic）：低阶标准（K1清晰性、K2功能性）是高阶标准（K7企业导向、K8创造性）的必要前提。这意味着：评价时先从K1开始，如果K1不满足，就不需要评价K8。这种层级结构来源于Dreyfus模型——新手先掌握清晰性和功能性，专家才具备创造性和社会责任。第二个是累积性原则（cumulative principle）：高水平能力包含低水平能力，但低水平能力不包含高水平能力。例如，一个具有创造性的方案（K8）必然也是清晰的（K1）和功能性的（K2），但一个清晰且功能性的方案不一定具有创造性。

Lahn et al.（2019, p. 132）在COMET模型的国际化研究中发现：COMET模型不包含"名义能力"作为有效职业水平——因为功能性（K2）是职业能力的基线门槛。这意味着：一个学生即使能说出所有术语（名义能力），如果无法让方案在实际中运行（功能性），他的能力仍然处于"风险群体"。

【P2 核心主张】

COMET八标准的核心主张可一句话概括：职业能力不是"对/错"的二元判断，而是"从合格到卓越"的八维梯度——每个维度都是能力的一个侧面，合在一起才构成完整的职业能力画像。用一个比喻：传统评价像黑白照片——只能看出"亮/暗"（对/错），看不出色彩层次。COMET评价像彩色照片——有八个颜色通道（K1-K8），每个通道有自己的亮度等级，合在一起才能还原真实的职业能力"色彩"。

八标准的层级结构：

        K8 创造性（最高层：生成性创新）
        K7 企业/顾客导向
        K6 社会责任/环保意识
        K5 工作过程导向
        ───────────────────（高阶能力分界线）
        K4 效率
        K3 展示性
        K2 功能性（基线门槛）
        K1 清晰性（最底层：基本要求）

【P3 为什么用它】

为什么评价要用八标准，不能用"对/错"？来看一个对比：

教师A的评价：学生提交了一个加工方案。教师看了一遍，打80分。学生问："为什么80分？哪里不好？"教师答："整体还不错，但有些地方可以改进。"学生不知道"哪些地方""怎么改进"。80分只是一个数字，没有诊断价值。

教师B的评价（COMET八标准）：学生提交方案后，教师用K1-K8逐项评价：

K1清晰性（4/5）：方案描述清楚，图纸标注完整。
K2功能性（3/5）：方案能运行，但有一个步骤可能导致误差。
K3展示性（4/5）：格式规范，逻辑清晰。
K4效率（2/5）：工时估算偏长，有优化空间。
K5工作过程导向（1/5）：只关注本工序，未考虑前后工序衔接。
K6社会责任（3/5）：考虑了安全，但未考虑废料处理。
K7企业导向（2/5）：未考虑成本控制。
K8创造性（1/5）：完全采用标准方案，无改进。

学生拿到反馈后，清楚地知道：优势在K1、K3（清晰和展示），短板在K5、K8（工作过程导向和创造性）。下次任务可以有针对性地改进。八标准评价不是打分，而是诊断。

不用八标准的后果：评价变成终结性打分（"你得了80分"），而非形成性反馈（"你的创造性需要提升"）；学生不知道改进方向（"我到底哪里不好？"）；能力发展无法追踪（"上次80分，这次82分，提升了什么？不知道"）；教师无法诊断教学设计（"学生K5普遍得分低，说明我的工单缺乏工作过程导向设计"）。

【P4 边界与批评】

COMET八标准面临的首要批评是评价的主观性。虽然COMET为每个标准设计了详细的等级描述，但评价者在实际评分时仍然会受到个人偏见的影响。例如，对"创造性"（K8）的评价高度依赖评价者的个人标准——有人认为"稍微改进标准方案"就是创造性，有人认为"完全原创"才是创造性。Rauner团队通过评价者培训和双评一致性检验来缓解这一问题，但主观性无法完全消除。

第二个批评是标准的文化适配性。K6"社会责任"和K7"企业导向"隐含了西方市场经济和环保主义的价值观。在中国语境中，"社会责任"可能需要调整为"安全生产""质量意识""职业道德"等更贴近中国职业教育实际的表述；"企业导向"可能需要强调"客户导向"和"工匠精神"。

第三个批评是评价的耗时性。用八标准逐项评价一个方案，需要的时间是传统打分（给一个总分）的5-10倍。对于教学任务繁重的教师，这可能构成实际障碍。应对方法是：选择性评价——对于基础工单，只评价K1-K4（低阶标准）；对于高级工单，评价K1-K8（全部标准）。

【P5 理论对话】

COMET八标准与Bybee四阶段的关系是评价维度与发展阶段：Bybee的四阶段（名义→功能→过程→多维）描述了能力发展的纵向层级，COMET的八标准描述了职业能力评价的横向维度——两者结合，形成了"维度×层级"的完整评价矩阵。COMET八标准与Dreyfus模型的关系是评价标准与发展逻辑的对应：Dreyfus模型解释了"为什么能力发展是渐进的"，COMET八标准提供了"如何评价这种渐进发展"的工具。

COMET八标准与工作过程知识的关系是内容维度与知识论基础：K5"工作过程导向"直接来源于工作过程知识理论——要求学生在解决问题时不仅关注本任务的技术正确性，还要考虑与前后工序的衔接。COMET八标准与KMK框架的关系是评价标准与能力分类：KMK提供了四维度分类（专业/方法/社会/个人），COMET提供了八标准评价——K1-K4主要对应专业能力，K5-K6对应社会能力，K7-K8对应个人能力。

（参见[[COMET职业能力测评模型深度研究报告]]、[[Rauner工作过程知识理论深度研究报告]]、[[Bybee科学素养四阶段模型深度研究报告]]）

← 概览任务6-2 小组协作评价 →

# 【工单6-1】COMET化评价设计：八标准量表中文版与本土适配 【T→C→P】