(资料图片)

在 ChatGPT 引爆科技领域之后,人们一直在讨论 AI「下一步」的发展会是什么,很多学者都提到了多模态,我们并没有等太久。今天凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。

GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。GPT-4 是一个大型多模态模型,能接受图像和文本输入,再输出正确的文本回复。实验表明,GPT-4 在各种专业测试和学术基准上的表现与人类水平相当。例如,它通过了模拟律师考试,且分数在应试者的前 10% 左右;相比之下,GPT-3.5 的得分在倒数 10% 左右。

OpenAI 表示,研究团队一直在对 GPT-4 进行迭代,使其从训练开始就更加安全和一致,所做的努力包括预训练数据的选择和过滤、评估和专家参与、模型安全改进以及监测和执行。

GPT-4 有着与以前的模型类似的风险,如产生有害的建议、错误的代码或不准确的信息。同时,GPT-4 的额外能力导致了新的风险面。为了了解这些风险的程度,团队聘请了 50 多位来自人工智能对齐风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家,对该模型在高风险领域的行为进行对抗性测试。这些领域需要专业知识来评估,来自这些专家的反馈和数据为缓解措施和模型的改进提供了依据。

GPT-4官方发布相较以往版本主要三大突破,本质上都是更接近“真人”的通用智能:[太阳]第一,像人一样更具备创造协作输出能力GPT-4具备更有创造性的写作能力,包括编歌曲、写剧本、学习用户写作风格等[太阳]第二,像人一样具备视觉输入处理分析能力可以图文等多模态同时综合分析,给出答案[太阳]第三,像人一样具备超长文本的处理分析能力可以处理超过25000字长文本[太阳]我们认为能够将GPT-4三大新的能力突破集中于一身的应用主要在两个领域:1、【视频会议AI助理】同时需要视频图文多模态分析+超长文本理解+创造性总结输出能力3月14日路透社报道谷歌将在谷歌会议中增加生成式人工智能功能。此前微软全线整合 ChatGPT视频会议工具 Teams 已上线能自动生成会议记录并预测下一步任务。相关标的【真视通】【会畅通讯】等2、【机器人为代表的AIoT终端】视觉听觉等多模态感知理解+长文本对话理解+创造性输出相关标的【中科创达】【科大讯飞】【海康威视】【大华股份】等[太阳]《三体》3中维德给程心展示用曲率引擎把一根发丝吹动了,程心当时还很木然(就像很多人目前看GPT-4),但维德却非常兴奋,曲率引擎能够驱动发丝,实际上已经说明能够驱动光速飞船只是时间问题了:[太阳]美国BAR律师执照统考,GPT3.5后10%水平分位,GPT4可以达到前10%水平分位。[太阳]生物奥林匹克竞赛GPT3.5能达到后31%水平分位,GPT-4可以达到前1%水平分位

$三六零(SH601360)$ $铜牛信息(SZ300895)$ $新华网(SH603888)$ #数字经济#

推荐内容