大学期中考周即将到来,荷兰的一份报导指出大部分的大学生都已经使用AI来辅助学习、做作业。本文将从一份面向学生的大型语言模型调查出发,介绍全新、正确率更高、AI幻觉出现率更低、更聪明的ChatGPT5如何重塑大学生们的学习体验。
ChatGPT为大学生最广泛使用的大型语言模型,83%已体验新款ChatGPT5受访者以大学生(学士阶段)为大宗,占总人数66.7%,其馀受访者皆为研究所学生。受访者主修科目从文组的财经相关,到理组的资安、机械系都有,其中83%受访者已经使用过ChatGPT5。半数受访者是每天都会使用LLM的重度使用者,另外半数使用者每周会使用数次。
在这份调查中,全部的受访者都使用过ChatGPT。第二常被提起的大型语言模型是Anthropic开发的Claude,有六成受访者也使用Claude,同样也有六成受访者会使用AI搜寻引擎Perplexity。Google的Gemini、X的Grok则是只有两成受访者使用。
在“使用AILLM能提升学习效率”的问题中,33%受访者表示非常同意,半数受访者表示部分同意,17%受访者持保留意见。在“AILLM容易上手与使用”的问题中,66%受访者表示非常同意,33%表示部分同意,几乎所有受访者都对此表达正向意见。在“AI可信度”的问题中,33%受访者部分相信AI产出结果,66%持保留意见。至于AI幻觉(模型生成的错误结果)的部分:
16.7%受访者体感认为AI幻觉出现机率低于20%33.3%受访者体感认为AI幻觉出现机率在21~40%33.3%受访者体感认为AI幻觉出现机率在41~60%16.7%受访者体感认为AI幻觉出现机率在61~80%(2025最新五大主流AI语言模型(LLM)全解析,付费、应用与安全性一次看懂)
用户最在意大型语言模型正确率,ChatGPT5契合学生需求根据调查,使用者对于大型语言模型最在意的是正确率,其次是AI幻觉出现机率,其他分别是聪明、使用者友善、情绪价值。换句话说,先是可信度,再来才是处理能力及其他因素。
OpenAI在8月初推出的ChatGPT5十分契合学生需求,以往模型面对无解问题时常虚构答案,GPT-5则更诚实地承认限制,AI幻觉率从GPT-4o的4.8%降至2.1%。
(OpenAI推出新一代旗舰大语言模型ChatGPT-5!写作、编码、医疗、推理全面升级)
在多项严谨的标准评测中,GPT-5全面领先过去模型,包括:
数学竞赛AIME:94.6%正确率。真实世界编码SWE-Bench:74.9%准确率,远超GPT-4o。GPQA博士级科学问答:88.4%。MMMU(大规模多学科多模态理解与推理):84.2%准确率。HealthBenchHard高难度医疗问答:46.2%,远胜GPT-4o的31.6%。(2025最新5大装乖LLM出炉!Claude、Grok与Gemini最爱假装配合)
过半受访大学生用ChatGPT做报告、翻译文字而大学生使用大型语言模型最常见的用例包含:做报告、翻译、建模、行政庶务、文字润饰、摘要生成、生成程式码等。
做报告改善:更强的检索+知识覆盖范围,跨领域资料的准确率提高,减少“幻觉引用”。
新增:能生成结构化大纲与符合引用格式的草稿,比前一代更懂“学术规范”。
翻译改善:翻译的流畅度与上下文一致性提升,不再像GPT-4容易在长文本出现“前后风格不一致”。
新增:支援更精细的语气控制(例如“正式学术”“简明通俗”),直接调整翻译风格。
建模改善:数学推导与程式码整合更顺畅,能同时输出公式+程式+图表。
新增:能解释建模背后的理论逻辑,而不只是吐出程式码,比GPT-4更适合作为“教练”而非“代工”。
行政庶务改善:更懂格式与上下文,生成公文、email更贴近真实职场用语。
新增:可自动生成可汇入GoogleCalendar/Excel的档案,直接少了一步转换。
文句润饰改善:风格控制更细致(比如“新闻稿”“口头报告稿”),GPT-4时代常需要多次调整。
新增:能检查“逻辑错误”与“重复赘词”,不仅是语法校正。
摘要生成改善:长文摘要更准确,资讯压缩比率提升,避免GPT-4那种“漏重点”。
新增:可以同时给“一行摘要、简短摘要、详细摘要”,自动分层。
生成程式码改善:除错能力更强,能解释为什么错,而不是单纯修正。
新增:生成程式码时会考虑效能与最佳实务(例如安全性检查),而不是单纯能跑。
ChatGPT5接入Google、GitHub整合用户体验除了AI幻觉、错误率外,用户对ChatGPT的反馈还有“精准提示词需要练习”、“整合性不佳”等,而ChatGPT5正式接入了Google系统在内的外部工具,在连接器里能绑定Gmail、Google云端硬盘、GitHub、Canva、Notion等,进一步整合使用体用,提升整体效率。
这篇文章ChatGPT5大学生学习懒人包:正确率更高、幻觉率更低,期中考周救星最早出现于链新闻ABMedia。