OpenAI官宣开放多模态ChatGPT 人工智能领域竞争风云再起

社会新闻华商网-华商报 2023-09-27 07:05:52

　　OpenAI官宣开放多模态ChatGPT，能看、能听，还会说，引发热议。此前不少头部公司已经发布相关大模型产品，而OpenAI官宣开放多模态ChatGPT，让人工智能领域的竞争再起风云。

　　开放多模态ChatGPT

　　但更先进的AI也有新风险

　　北京时间周一晚间，人工智能领域的知名创业公司OpenAI发布题为《ChatGPT现在能看、能听、能说》的公告，宣布将在未来两周时间里向付费用户推送这项功能。

　　按照OpenAI的说法，用户可以拍一张冰箱的照片，然后让ChatGPT来推荐菜谱；在旅行时拍摄一张地标的照片，让Chat-GPT来讲述这处景点的有趣之处。当然，也能拍一张数学题的照片，让ChatGPT来解答。

　　在官方给出的例子中，给ChatGPT一张自行车的照片，问它如何把座椅调低。然后Chat-GPT表示看车的型号，有的车有快拆杆，有的是用螺栓固定，然后给出了详细的步骤。

　　值得关注的是，ChatGPT会说话啦！OpenAI也将语音识别、转录和音频生成功能打包，推出了AI语音聊天的功能，这项功能只适用于iOS和安卓客户端。用户可以用这项功能为家里的小孩讲睡前故事。或者家里吃着饭，突然为某个问题吵起架来，这个时候就可以把ChatGPT拍在桌面上解决争论……

　　OpenAI表示，新的语音技术能够仅通过几秒钟的真实语音创造出逼真的合成声音。这种功能打开了创造力的大门，也带来了新的风险，例如不法分子可能伪造公众人物进行欺诈。所以OpenAI的决策是通过“语音聊天”这样的特定用例来推出这项功能。

　　群雄逐鹿，市场竞争愈发激烈

　　大模型引发了全球不少企业参与和布局。一份报告显示，从已经发布的大模型分布来看，美国在大模型数量上居全球之首。而我国的竞争亦愈发激烈。

　　今年7月，华为云在开发者大会2023上发布盘古大模型3.0。华为常务董事、华为云CEO张平安表示，盘古大模型3.0是完全面向行业的大模型，包括“5+N+X”三层架构。盘古大模型不会作诗，只做事，将围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向，持续打造核心竞争力，为行业客户、伙伴及开发者提供更好的服务。

　　阿里云推出AI绘画新品“通义万相”。基于阿里研发的组合式生成模型Composer，通义万相提出了基于扩散模型的“组合式生成”框架，通过对配色、布局、风格等图像设计元素进行拆解和组合，提供了高度可控性和极大自由度的图像生成效果。

　　腾讯云宣布升级MaaS平台，将行业大模型能力应用到金融风控、同传翻译、数智人客服等新场景中。其中，金融风控大模型相比传统风控有10倍的效率提升。

　　8月31日凌晨，百度文心一言宣布，将率先向全社会全面开放。用户可以在应用商店下载“文心一言App”或登录“文心一言官网”体验。

　　9月4日晚间，科大讯飞宣布讯飞星火大模型面向全民开放，将实现通用模型对标ChatGPT3.5。

　　财经评论人士杨德龙分析，随着大模型等技术全面赋能，不少领域已经有成果。人工智能是互联网发展的最新阶段，也是改变工作生活方式的重要方向，我们要积极关注，但只有少数的公司才具有核心竞争力。

　　IPG中国首席经济学家柏文喜表示，目前国内相关企业在人工智能、大模型等领域出现了激烈的竞争，而且不少是面向用户免费开放的。一些运营商也在大模型新赛道上加速奔跑，推动大模型和AI产业的发展。这一领域的竞争会愈发激烈。华商报记者黄涛

来源：华商网-华商报

编辑：王蜀周秦

相关热词搜索：

上一篇：亚运高光时刻｜五连冠！国乒女团3:0战胜日本

表达看法