AI 资讯Hacker News·3 小时前

求职申请竟要求提供SAT成绩

原标题：Job application asked for my SAT scores

速览

有求职者反映，在申请职位时被要求提供SAT（学术能力评估测试）成绩。这一现象引发了公众对招聘标准合理性的讨论，认为此举偏离了岗位实际需求，可能构成就业歧视或无效筛选。

AI 深度解读

Job application asked for my SAT scores：从一份荒诞的求职申请看招聘科学的演变

背景

近期，一位科技从业者在浏览 Y Combinator (YC) 的职位列表时，发现了一家位于其所在地区的初创公司正在招聘一名“GTM”（Go-To-Market，市场进入）角色。作者对其当前的完全远程工作感到满意，但出于对混合办公模式的偏好，他决定申请这一职位。

该公司的产品是一款 ETL（提取、转换、加载）工具，整体看起来不错，职位描述也符合预期。然而，在申请的末尾出现了一段令人费解的要求：

“如果你对此感兴趣，请通过我们的匿名招聘邮箱发送简历。请务必包含你的本科 GPA 和 SAT 成绩（GRE、GMAT 等其他标准化考试成绩可替代 SAT 成绩），即使你距离本科毕业已有数年甚至数十年。我们对这两项指标没有具体的分数线，但请注意，如果不提供这些信息，你的申请将被直接淘汰，不再进入后续考虑。”

这一要求引发了作者的困惑与好奇。自 2023 年以来，他注意到越来越多的科技公司和高增长初创公司正在取消学士学位要求，转而关注候选人的副业项目、个人网站链接或最能体现其自豪感的经历，以此作为判断候选人是否具备“自驱力”和“热情”的指标。

相比之下，要求提供一份可能几十年前、且无法验证的标准化考试成绩，显得极不合时宜。作者不禁质疑：如果这是为了测试当前的认知能力，是否有更好的预测指标？如果不是为了测试认知能力，这是否是一个测试求职者对无意义指令服从性的“陷阱问题”？

核心内容

作者从这一荒诞的招聘要求出发，深入探讨了招聘评估的历史演变、科学依据以及那些被证明无效或极具争议的方法。

1. 招聘评估的起源：从战争到间谍选拔

现代招聘评估的“科学”根基可追溯至军事领域。

第一次世界大战与军队测试：1917 年，面对一战的压力，美军需要快速将 150 万新兵分配到最适合的部队。由于时间紧迫，传统面试无法胜任。Robert Yerkes 及其委员会开发了 Army Alpha（针对识字者）和 Army Beta（针对文盲或非英语母语者）测试。后者主要通过非语言方式绕过沟通障碍，这奠定了团体认知测试的基础。
评估中心与间谍选拔：另一条重要线索源于间谍选拔。人格理论家 Henry Murray 在一个乡村庄园举办为期三天的项目，通过模拟场景和多位评估者来考察候选人。20 世纪 50 年代中期，AT&T 启动了一项纵向研究，证实了这种“评估中心”方法在预测职业成功方面具有一定的有效性。

2. 哪些方法最有效？

尽管没有单一的完美招聘方法，但证据表明，组合使用以下几种方法能最好地预测知识型工作的未来表现：

结构化面试（Structured Interviews）：
- 这是目前预测工作表现最强的指标之一。2022 年 Sackett 等人的研究有力地论证了这一点。
- 关键要素：必须有一致的问题、评分标准以及经过培训的面试官。
- 局限性：即使如此，结果的可信区间仍有 80% 的波动，效果高度依赖于面试官的培训水平和评分标准的严谨性。
工作样本测试与岗位知识测试（Work Sample & Job Knowledge Tests）：
- 这是最直观的方法：让候选人完成代表实际工作内容的任务（如回家作业或试用期）。
- 优势：结合结构化面试，既能通过交谈了解候选人的特质，又能通过结构化的面试过程进行客观比较，最后通过工作练习验证其实际应用能力。在 AI 普及之前，这被视为黄金标准。
认知能力测试（Cognitive Ability Tests）：
- 虽然仍是强有力的预测指标（1998 年时被认为是最佳预测指标），但如今已不是最强的单一指标。
- 适用场景：对于培训需求重或学习要求高的岗位非常有用；但对于那些工作要求与候选人过往经验高度匹配的岗位，其预测力相对较弱。
评估中心（Assessment Centers）：
- 在预测管理潜力方面表现优异，但成本极高且耗时巨大，因此应用范围有限。

3. 哪些方法无效或具有误导性？

非结构化面试（Unstructured Interviews）：
- 这是作者在日常工作中最常遇到的形式，也是他承认自己曾犯过的错误。
- 缺陷：容易受到多种谬误的影响，如印象管理、提问不一致、光环效应以及“像我偏见”（因为对方像我，所以我喜欢他）。
- 数据支持：据称 Google 内部一项针对数万次面试的研究发现，面试官的评分与候选人最终的工作表现之间几乎没有相关性。
迈尔斯-布里格斯性格分类法（Myers-Briggs）与笔迹分析：
- 这些方法被广泛认为缺乏科学依据，预测效果极差。

4. 极端与荒诞的“ outsider ”尝试

历史上不乏试图通过极端手段来洞察候选人能力的案例：

爱迪生的“ trivia 考试”：1921 年，爱迪生对当时大学毕业生的严谨性感到失望，设计了一份包含 163 个问题的 trivia 考试。题目包括诸如“煤油桶是用什么木头做的？”这类他认为能测试常识的问题。
爱迪生的“盐测试”：爱迪生会在面试时给候选人喝汤。如果候选人在品尝前就加盐，他可能会直接淘汰对方。他的理论是，这证明了候选人习惯于基于假设行事，而非基于实际体验。
科技公司的脑筋急转弯：微软和谷歌曾流行使用诸如“为什么井盖是圆的？”这类脑筋急转弯。然而，谷歌前人力资源负责人 Laszlo Bock 后来承认，这些脑筋急转弯是“完全浪费时间”，它们“无法预测任何事物”。

关键要点

SAT 等旧式标准化测试并非认知能力的可靠长期指标：要求提供几十年前的 SAT 成绩存在严重缺陷，因为它反映的是候选人 17 岁时的状态，且受当时不可控的环境因素（如家庭变故、经济压力、备考情况等）影响极大，无法准确预测当前的认知能力或工作表现。
结构化面试优于非结构化面试：有证据表明，经过严格训练、使用统一评分标准的问题的结构化面试，比随意的聊天式面试更能预测工作绩效。
工作样本测试是黄金标准之一：让候选人执行与实际工作高度相似的任务，结合结构化面试，是目前验证候选人能力最直观、有效的方法。
招聘中的“直觉”往往不可靠：非结构化面试容易受到面试官个人偏见（如光环效应、像我偏见）的影响，Google 的内部研究证实了面试官评分与工作表现之间缺乏相关性。
招聘方法正在回归理性：尽管历史上存在爱迪生式的荒诞测试或微软/谷歌早期的脑筋急转弯，但现代招聘科学正逐渐摒弃这些无法预测绩效的方法，转而依赖数据支持的评估体系。
合规性测试的伦理争议：要求提供无法验证且过时的信息（如旧 SAT 成绩）作为强制门槛，可能并非为了筛选能力，而是为了测试服从性。这种做法不仅效率低下，还可能筛选掉那些具有批判性思维或自驱力的优秀人才。

意义与影响

这一事件反映了科技行业招聘文化的一个微妙转折点。过去几十年，随着高等教育普及率的提高和远程工作的兴起，学历和标准化考试成绩的权重正在下降，取而代之的是对实际能力、作品集和自驱力的重视。

然而，部分初创公司或传统思维主导的企业仍固守过时的筛选机制。要求提供几十年前的 SAT 成绩，不仅暴露了招聘流程设计的懒惰（缺乏有效的评估工具），也可能导致人才流失——那些具备真正创新能力和批判性思维的候选人可能会因为反感这种无意义的官僚主义要求而放弃申请。

对于求职者而言，理解哪些评估方法是科学的（如结构化面试、工作样本），哪些是无效的（如非结构化聊天、性格测试），有助于在求职过程中更好地展示自身优势，并识别出那些招聘流程混乱、管理不成熟的公司。

对于雇主而言，这一案例是一个警示：招聘不应是一场关于服从性的测试，而应是一场

查看原文 →mrmarket.lol