美国OpenAI推出新一代大型语言模型「GPT-4」,比前代ChatGPT处理长篇内容的能力提升8倍、回覆内容更精准,也具有图像辨识功能,可以解读图片中文字,并根据文字内容给出完整建议。
就在各大产业为 ChatGPT 为之疯狂的这段日子,OpenAI 前些日子突袭式推出新的大型语言模型「GPT-4」。它不仅能处理比 ChatGPT 多 8 倍的长篇内容、回覆内容更精准、图像辨识功能还可以解读图片中文字,并根据文字内容给出完整建议。
目前美国支付新创Stripe、美国语言学习网站Duolingo、美国国际金融服务公司摩根士丹利,以及冰岛政府已与OpenAI 达成合作开始使用GPT-4,微软新版Bing 浏览器的聊天功能也已导入其功能。
特色一:可记忆的 Token 数翻 4 倍,可连续处理数小时、数天的内容运算
从 OpenAI 官网释出的消息得知,GPT-4 可支援图片输入并转译成文字,即便只是简单的笔记、摘要的文字图片,它也可以做成完整的文字建议。
GPT-4 可以从图片上的讯息转译成文字,即便只有少少的几个摘要和重点。 (Photo Credit:OpenAI)
现有的版本中,GPT-4 可记忆的 Token 数约 8,192 个,未来版本将持续更新至 32,768 个(共计可容纳 50 页;约 2.5 万字长篇 A4 的内容),比过往 ChatGPT 多 8 倍以上。
特色二:准确度更高,实力媲美国际生物奥林匹亚第 99 个百分位
OpenAI 指出,受惠于微软云端服务平台 Azure,它们才得以在 2 年内的时间训练出 GPT-4。为了降低内容错误率和精准度,前后共花费 6 个月的时间,顺利将 GPT-4 的不实资讯、不当回覆与敏感字词可能性皆降低 60%。
经OpenAI 实测约30 种不同考试项目,GPT-4 在美国律师资格模拟考(Uniform Bar Exam, UBE) 的成绩是应试者们的前10%;美国大学入学测验(SAT) 满分1600 中更是拿到1300 分的高成绩,等于拥有入学美国加州大学柏克莱分校(University of California, Berkeley) 的资格。
从红框中的 UBE、SAT 在 GPT-4 的实测数据得知,其表现远超出 GPT-3 跟 GPT-3.5。 (Photo Credit:OpenAI)
至于大众最在乎的精准度部分,GPT-4 相比前GPT-3.5 正确率高40%,处理非英语系语言的处理能力精准度也有提升,精准度80% 以上的语言,包含中文就有14种。 GPT-4 和 GPT-3.5 两者精准度最大的差异,可能来自于 GPT-4 能使用图片和文字训练,而 GPT-3.5、GPT-3 都只能用文字训练的缘故。
不过 OpenAI 指出 GPT-4 还是有技术上的限制,像是会捏造与事实不相符的资讯,并在错误的情境下坚持自己是对的「幻觉(hallucination)」问题。
GPT-4 能支援的语言,80% 精准度的数量已达 14 种。 (Photo Credit:OpenAI)
但具体的技术细节、资料量的使用OpenAI 没有多做说明,训练模型的部分仅仅提到使用人工回馈来进行强化学习(Reinforcement Learning from Human Feedback,简称RLHF),可以把它想像成训练AI 的一种工具。图片输入转文字尚在第一个 Alpha 测试阶段,捞取的资料跟 GPT-3.5 一样皆为 2021(含)以前的数据。
本文转载自,只做主题效果测试使用,本文观点不代表创意星球立场。