伯克利CS课程AI使用致成绩下滑,数学能力衰退
速览
加州大学伯克利分校计算机科学课程数据显示,随着生成式AI工具的广泛使用,学生成绩普遍下滑。研究指出,过度依赖AI导致学生基础数学能力显著衰退。这一现象引发了教育界对AI辅助学习边界及学术诚信的深刻反思。
AI 深度解读
背景
2026年春季学期,加州大学伯克利分校(UC Berkeley)计算机科学与电气工程学院(EECS)的几门核心基础课程出现了异常高的不及格率。这一现象不仅打破了该系长期的评分指导方针,也引发了关于人工智能(AI)使用、学生数学基础薄弱以及师资短缺等多重因素的激烈讨论。
根据 Berkeleytime 的报道,CS 10 课程有 35.3% 的学生获得 F 级,CS 61A 课程有 10.6% 的学生获得 F 级。相比之下,在 2024 年和 2025 年春季学期,这两门课程的 F 级比例均未超过 10%。EECS 系的评分指南明确规定,包括 CS 10 和 CS 61A 在内的低年级课程中,获得 D 和 F 的学生比例应控制在 7% 左右,且低年级课程的典型平均 GPA 应在 2.8 至 3.3 之间。然而,2026年春季学期,这两门课的平均成绩仅为 C+(对应 GPA 2.3),远低于历史平均水平。
核心内容
本次评分异常并非单一因素所致,而是由学术不端行为增加、学生数学准备不足以及教学资源紧张共同造成的复杂局面。
1. AI 依赖与学术诚信危机 CS 10(“计算之美与乐”)和 CS 61A(“计算机程序的结构与解释”)的授课教授 Dan Garcia 指出,导致不及格率飙升的“主要驱动力”是大型语言模型(LLM)使用带来的学术不端行为激增。Garcia 提到,部分不及格学生是因为被查获作弊并移交学生行为中心处理。在 2026 年春季学期,CS 10 中约有 30 名学生在家庭作业考试中因作弊被抓。
Garcia 强调,除了被查获的作弊者外,还有大量学生过度依赖 Claude、ChatGPT 和 Google Gemini 等 LLM 来完成作业,导致他们在考试时毫无准备。他批评这种“外包思考”的行为,并指出即使在没有曲线评分(curving)的情况下,由于评分标准是固定的分数阈值,那些依赖 AI 生成答案的学生在无法使用 AI 的考试环境中暴露了其真实能力的缺失。
2. 数学基础薄弱与先修知识缺失 除了 AI 问题,数学准备不足也是关键因素。校园助理教学教授 Gireeja Ranade 在教授 EECS 127(“工程优化模型”)时发现了类似情况。该课程 2026 年春季的 F 级率为 16.8%,远高于 EECS 系对高年级课程设定的 5% 的典型 D/F 比例。
Ranade 指出,学生进入该课程前应具备线性代数、向量微积分和数学证明的基础。然而,她在办公时间(Office Hours)发现许多学生连线性代数都难以掌握。更令人震惊的是,有学生透露他们在伯克利分校修读的线性代数课程对作业和考试实行“开放互联网、开放 AI 政策”,这直接导致了基础技能的退化。
3. 师资短缺与参与度下降 资源限制进一步加剧了教学困境。EECS 系主任 Jelani Nelson 在 X 平台发帖表示,由于 EECS 助教(TA)的小时工资较高,校园不得不减少本科 CS 招生人数和本科 TA 的数量。Ranade 因此被迫取消了 EECS 127 课程中原本由教授和 TA 团队指导的最终项目环节,而这一环节通常是学生获得高分的主要途径。
与此同时,学生的课堂参与度显著下降。Ranade 回忆称,过去的办公时间总是“爆满”,但本学期尽管频繁鼓励学生参加,办公时间却“参与度极低”。Garcia 也经历了类似情况,他惊讶地发现过去坐满人的办公时间变得空无一人,“第一次独自坐在办公室里”。
4. 评分制度的反思与争议 Garcia 强烈反对哈佛等高校实行的“只有部分学生能得 A”的曲线评分制度。他认为,教师应公开每个字母等级的分数阈值,并提供多次机会让学生达到标准,而不是通过曲线隐藏真实表现。他主张“不设上限”地给予学生 A,只要他们达到标准即可。
关键要点
- 不及格率异常飙升:2026 年春季,UC Berkeley CS 10 和 CS 61A 的 F 级比例分别高达 35.3% 和 10.6%,远超 EECS 系规定的 7% 上限及历史平均水平。
- AI 滥用是主因之一:教授 Dan Garcia 认为,LLM(如 Claude、ChatGPT、Gemini)的使用导致学术不端行为激增,许多学生依赖 AI 完成作业,导致考试时无法独立应对。
- 数学基础严重退化:学生缺乏线性代数等先修知识,部分原因是前置课程(如线性代数)允许开放 AI 和互联网,削弱了学生的基本功。
- 师资与资源紧缩:由于助教薪资高昂,学校减少了本科招生和 TA 数量,导致 Ranade 等教授不得不取消重要的实践项目环节。
- 学生参与度低迷:办公时间(Office Hours)出席率大幅下降,教授反映过去“爆满”的办公时间如今“空无一人”。
- 呼吁改革招生与评分:包括 Garcia 和 Ranade 在内的 1,300 多名 UC 教职员工签署请愿书,要求恢复 STEM 专业招生中的 ACT/SAT 标准化考试成绩,以评估学生的数学准备情况。
- 教育理念的重塑:教授们强调在 AI 时代更应教授批判性思维和解决困难问题的能力,Garcia 引用同事的话称“困惑是学习的汗水”,批评学生不愿付出努力。
意义与影响
这一事件不仅是 UC Berkeley 一所高校的教学危机,更是全球高等教育在 AI 时代面临挑战的一个缩影。
首先,它揭示了标准化评估与 AI 能力之间的脱节。当前置课程允许开放 AI 时,学生获得的并非真正的技能,而是“AI 代理能力”。一旦进入禁止 AI 的考试环境,这种虚假的能力迅速崩塌。这迫使教育机构重新审视作业设计和考试形式,如何在允许使用工具的同时评估学生的真实理解力。
其次,数学基础的重要性被重新确认。在计算机科学日益普及的今天,数学逻辑和抽象思维能力依然是核心竞争力的基石。Ranade 和 Garcia 的担忧表明,跳过扎实的数学训练直接上手编程或 AI 应用,会导致学生缺乏解决复杂问题的底层能力。
最后,教育公平与质量标准的平衡成为焦点。Garcia 对曲线评分的批评反映了对“隐性不公”的抵制。如果通过降低标准或曲线来维持高 GPA,可能会掩盖学生能力不足的事实,最终损害毕业生的长期竞争力。Ranade 强调要培养“在未来 40 年生活中做出贡献的公民和领导者”,这意味着教育必须从“通过考试”转向“培养韧性”和“批判性思维”。
对于 UC 系统乃至全美高校而言,恢复 SAT/ACT 在 STEM 招生中的作用可能是一个短期应对措施,但长期来看,如何重构课程体系、调整师资结构以及定义 AI 时代的学术诚信,将是持续面临的重大挑战。
