GPT-4o让科幻电影《Her》走向现实?对新技术不应该产生过分乐观的预测和期望|热财经

美东时间5月13日,Open AI正式发布了其最新的人工智能模型GPT-4o,这一新品在业界引起了广泛关注。
图片
GPT-4o属于多模态大模型,支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出,该模型通过深度学习技术,能够生成更加自然、流畅的语言,并在多种语言处理任务中表现出色。OpenAI表示,GPT-4o的推出将进一步推动自然语言处理领域的发展,并在多个行业中发挥重要作用。
据OpenAI技术负责人穆拉迪(Mira Murati)介绍,GPT-4o中的o代表omni(全能),上述负责人表示,新模型允许ChatGPT处理50种不同的语言,速度和质量都有所提高,它还将通过OpenAI的API提供支持,这样开发者今天就可以开始使用新模型构建应用程序了。“GPT-4o的速度是GPT-4 Turbo的两倍,成本只有一半。”
上述负责人还表示,新型号GPT-4o“速度快得多”,在文本、视频和音频方面都有改进,公司最终计划让用户与ChatGPT进行视频聊天。“这是我们第一次在易用性方面迈出巨大的一步。”
记者留意到,发布会上OpenAI展示了使用GPT-4o进行语音对话的演示。演示者提问结束后,GPT-4o几乎可以即时回应,并通过文本转语音功能进行朗读,让对话感觉更加自然逼真。
此外,在人机交互的聊天过程中,GPT-4o的语音功能不仅能“感知”对话者的情绪与状态,还可以相应的回应。同时,即便是对话过程中被打断,也能立刻跟进。数据显示,在音频输入层面,GPT-4o相应速度达到了人类级别,最短232毫秒,平均320毫秒。
有业界人士形容,这是科幻电影《Her》走向了现实世界。
不过,在惊叹于GPT-4o强大表现的同时,不应该对新技术产生过分乐观的预测和期望。此前Open AI公司产品Sora发布时,文生视频一下子火爆整个朋友圈,但事后人们发现,Open AI展示的Sora视频,全部都有人工特效参与。
更早以前,英伟达创始人兼首席执行官黄仁勋的“厨房视频”,有报道称整个“元宇宙”视频中的“黄仁勋”都是算法生成的“假人”,而真实情况是,该视频有15秒确是英伟达用机器生成的,以展示其3D仿真模拟平台,但其他内容都是人工制作的。
GPT-4o的发布无疑是一个令人兴奋的消息,但在面对它的时候,也仍然应该保持审慎和理性的态度。
事实上,任何技术的发展都需要时间和实践的检验。GPT-4o虽然在语言生成和理解方面取得了重要突破,但在具体应用中仍可能面临挑战。例如,在处理复杂语境、理解隐含意义以及跨文化沟通等方面,AI模型仍有待提升。
此外,AI技术的快速发展也引发了伦理和法律方面的讨论。如何在保护个人隐私和数据安全的前提下合理利用AI技术,是当前社会面临的重要问题。OpenAI在发布GPT-4o时也强调了这一点,表示将致力于遵守相关法律法规,确保技术的合规使用。
技术的真正价值在于如何为人类解决实际问题,而不仅仅是追求技术上的新奇和先进。因此,我们期待GPT-4o能够在教育、医疗、客户服务等领域发挥积极作用,同时也希望OpenAI和其他科技企业能够持续推动AI技术的健康发展。
文|记者 沈钊