当前位置: 网站首页 > 手机 > 详情

gpt42(gpt46)

2024-04-11 07:44:32 手机 0

北京时间3月15日消息,美国人工智能研究实验室OpenAI周二为其热门聊天机器人ChatGPT发布了最新的GPT-4语言模型。这距离ChatGPT推出仅4个月。

外媒称,与ChatGPT 最初使用的GPT-3.5 模型相比,GPT-4 带来了十大改进,提高了准确性等功能,但仍存在错误和“错觉”等缺点。

gpt42(gpt46)

以下是外媒总结的GPT-4的主要改进和不足:

更精确

人工智能专家、风险投资公司Page One Ventures 合伙人Chris Nicholson 告诉GPT-4,他的母语是英语,不懂西班牙语。他希望GPT-4 为他提供一个教学大纲,教他基础西班牙语。因此,GPT-4 提供了详细且有组织的教学大纲。它甚至提供了广泛的学习和记忆西班牙语单词的技巧,尽管并非所有建议都是正确的。

准确性提高

GPT-4 比GPT-3.5 更准确,并且也提高了准确度。当人工智能研究员兼教授Oren Etzioni 第一次尝试使用GPT-4 时,他问了一个直截了当的问题:“Oren Etzioni 和Eli Etzioni Eli Etzioni 和Eli Etzioni 之间是什么关系?”机器人的回答是正确的,说两人是父子关系。相比之下,GPT-3.5的回答是错误的,说他们两个是兄弟。不过,GPT-4也有bug,它说奥伦曾是奥伦人工智能研究所的首席执行官,但奥伦实际上已经辞去了这个职位。

更详细描述图像

能够详细描述图像GPT-4 能够以惊人的细节描述图像和文本。 OpenAI 总裁兼联合创始人Greg Brockman 演示了该系统如何细致地描述哈勃太空望远镜的图像。它还可以回答有关图像的问题。给定一张冰箱内部的照片,它可以建议您可以使用手头上的东西制作几顿饭菜。

擅长标准化考试

OpenAI 表示,新系统可以在美国41 个州和地区的统一律师考试(UBE)中取得前10% 左右的成绩。根据该公司的测试,在高中生参加的大学生物、微积分、宏观经济学、心理学、统计学和历史科目的SAT 和大学先修课程考试中,它还能获得1,300 分(满分5 分),满分1,600 分。

不擅长讨论未来

虽然新机器人似乎能够推理已经发生的事情,但当被要求对未来做出假设时,它就不太好了。它似乎是在其他人所说的基础上建立的,而不是创造新的猜测。

仍会产生幻觉

新机器人仍然会弥补。这个被称为人工智能“错觉”的问题困扰着所有领先的聊天机器人。由于系统不知道什么是真什么是假,因此它们可能会生成完全错误的文本。当被问及描述最新癌症研究的网站地址时,它有时会生成一个不存在的互联网地址。