GPT-4强势来袭：支持最长50页文本、识图能力强

2023年3月15日上午11:30 • AI文字 • 阅读 2163

美国OpenAI推出新一代大型语言模型「GPT-4」，比前代ChatGPT处理长篇内容的能力提升8倍、回覆内容更精准，也具有图像辨识功能，可以解读图片中文字，并根据文字内容给出完整建议。
就在各大产业为 ChatGPT 为之疯狂的这段日子，OpenAI 前些日子突袭式推出新的大型语言模型「GPT-4」。它不仅能处理比 ChatGPT 多 8 倍的长篇内容、回覆内容更精准、图像辨识功能还可以解读图片中文字，并根据文字内容给出完整建议。

目前美国支付新创Stripe、美国语言学习网站Duolingo、美国国际金融服务公司摩根士丹利，以及冰岛政府已与OpenAI 达成合作开始使用GPT-4，微软新版Bing 浏览器的聊天功能也已导入其功能。

特色一：可记忆的 Token 数翻 4 倍，可连续处理数小时、数天的内容运算

从 OpenAI 官网释出的消息得知，GPT-4 可支援图片输入并转译成文字，即便只是简单的笔记、摘要的文字图片，它也可以做成完整的文字建议。

GPT-4 可以从图片上的讯息转译成文字，即便只有少少的几个摘要和重点。（Photo Credit：OpenAI）
现有的版本中，GPT-4 可记忆的 Token 数约 8,192 个，未来版本将持续更新至 32,768 个（共计可容纳 50 页；约 2.5 万字长篇 A4 的内容），比过往 ChatGPT 多 8 倍以上。

特色二：准确度更高，实力媲美国际生物奥林匹亚第 99 个百分位
OpenAI 指出，受惠于微软云端服务平台 Azure，它们才得以在 2 年内的时间训练出 GPT-4。为了降低内容错误率和精准度，前后共花费 6 个月的时间，顺利将 GPT-4 的不实资讯、不当回覆与敏感字词可能性皆降低 60%。

经OpenAI 实测约30 种不同考试项目，GPT-4 在美国律师资格模拟考(Uniform Bar Exam, UBE) 的成绩是应试者们的前10%；美国大学入学测验(SAT) 满分1600 中更是拿到1300 分的高成绩，等于拥有入学美国加州大学柏克莱分校(University of California, Berkeley) 的资格。

从红框中的 UBE、SAT 在 GPT-4 的实测数据得知，其表现远超出 GPT-3 跟 GPT-3.5。（Photo Credit：OpenAI）
至于大众最在乎的精准度部分，GPT-4 相比前GPT-3.5 正确率高40%，处理非英语系语言的处理能力精准度也有提升，精准度80% 以上的语言，包含中文就有14种。 GPT-4 和 GPT-3.5 两者精准度最大的差异，可能来自于 GPT-4 能使用图片和文字训练，而 GPT-3.5、GPT-3 都只能用文字训练的缘故。

不过 OpenAI 指出 GPT-4 还是有技术上的限制，像是会捏造与事实不相符的资讯，并在错误的情境下坚持自己是对的「幻觉（hallucination）」问题。

GPT-4 能支援的语言，80% 精准度的数量已达 14 种。（Photo Credit：OpenAI）
但具体的技术细节、资料量的使用OpenAI 没有多做说明，训练模型的部分仅仅提到使用人工回馈来进行强化学习（Reinforcement Learning from Human Feedback，简称RLHF），可以把它想像成训练AI 的一种工具。图片输入转文字尚在第一个 Alpha 测试阶段，捞取的资料跟 GPT-3.5 一样皆为 2021（含）以前的数据。