欢迎来到财经新闻网

美图发布AI视觉大模型“神仙打架”成兵家必争之地

编辑:佚名      来源:财经新闻网      人工智能   计算机视觉

2023-06-23 16:59:37 

财经新闻网消息:cWl财经新闻网

K图 601360_0]cWl财经新闻网

K图 01357_0]cWl财经新闻网

随着AI大模型开发应用热潮不断兴起,记者注意到赛道上的选手开始将关注点从大语言模型转向大视觉模型。 近期,Adobe、Meta、360、美图等多家国内外顶级互联网公司相继发布大规模模型结果,为本已异常火爆的AI市场再添一把火。cWl财经新闻网

cWl财经新闻网

人工智能在视频领域的应用越来越受到关注。” 中国通信工业协会两化融合委员会副主任委员吴高斌告诉《华夏时报》记者,这些大规模AI模型的发布给企业带来了新的竞争。 动机。 企业之间的竞争会促进技术创新和进步,也会带来更好的产品和服务。 竞争也会促进企业之间的合作和资源共享,从而更好地满足市场需求。cWl财经新闻网

国内外视觉大型模型《神仙打架》cWl财经新闻网

在大规模语言模型、多模态大规模模型层出不穷之后,“视觉大规模模型”成为兵家必争之地。 日前,美图发布了AI视觉模型,同时发布了AI视觉创作工具WHEE、AI数字人生成工具、美图AI助手等7款产品。cWl财经新闻网

cWl财经新闻网

据介绍,它具有很强的视觉表现力和创造力,可以从绘画、设计、影视、摄影、游戏、3D、动画等视觉创作场景逆向技术演进。 与市面上其他大型机型不同的是,它尤其擅长生成亚洲人像摄影、国风时尚、商业设计等方向。cWl财经新闻网

美图创始人、董事长兼CEO吴欣鸿在接受华夏时报记者采访时表示:“美图大模的核心优势是懂美学。 C端用户基数足够大。 获客成本较低。 美图目前拥有2.43亿月活跃用户和719万全球VIP会员,可以在短时间内验证产品的成功。 与其他厂商不同,美图的大机型注重美观(画面画质设计等),未来如果要竞争,我们就会在美观上“滚”。”cWl财经新闻网

无独有偶,360日前也正式发布了“360智慧大脑-视觉大模型”。 360创始人周鸿祎表示,大语言模型是构建大视觉模型的基础,多模态能力增强的核心是大语言模型的认知、推理、决策能力。 同时,大视觉模型也是“360智慧大脑”的重要能力组成部分,未来可以理解图片、视频和声音。cWl财经新闻网

cWl财经新闻网

海外企业也开始布局视觉模型。 日前,社交媒体巨头 Meta 宣布将向研究人员开放名为 I-JEPA 的“人形”人工智能模型的部分组件,该模型可以比现有模型更准确地分析和完成未完成的图像,同时而不仅仅是制作像其他生成式人工智能模型一样,基于附近像素进行推断。cWl财经新闻网

Meta首席人工智能科学家杨立坤曾公开指出,目前的GPT自回归模型缺乏规划和推理的能力,未来的GPT系统可能会被抛弃,并给出了他认为正确的答案——世界模型。 据称,I-JEPA 是第一个基于其视觉关键组件的人工智能模型,能够比现有模型更准确地分析和完成未完成的图像。cWl财经新闻网

此外,Meta还发布了语音生成AI模型“”,该模型支持从文本生成语音,能够根据仅两秒长的样本匹配音频风格,并将文本样本转换为另一种语言,在给定的单个、并可以用说话者的原声朗读翻译后的文本内容,目前支持英语、法语、德语、西班牙语、波兰语和葡萄牙语六种语言。cWl财经新闻网

cWl财经新闻网

早在今年4月,Adobe就将旗下Adobe功能(类产品)集成到Pro、After、Remix等音视频产品矩阵中,为用户提供一键内容生成、编辑、调色、和音乐更换。cWl财经新闻网

从“语言大模型”到“视觉大模型”cWl财经新闻网

《中国人工智能大型模型图谱研究报告》显示,从全球发布的大型模型数量和分布来看,中国和美国大幅领先,占全球80%以上全部的。 与此同时,欧洲、俄罗斯、以色列等越来越多的研发团队也在投入大型车型的研发。 但值得注意的是,我国在计算机视觉等领域的大型模型还很少。cWl财经新闻网

cWl财经新闻网

究其原因,北京致远研究院客座首席科学家严水成告诉《华夏时报》记者:“视觉模型发展略显滞后的主要原因是大型视觉模型消耗的算力多得多。比文字,所以我们也期待芯片能够更快的发展,甚至有可能把其他非GPU的芯片集成在一起,你现在看到的模型一般都是千卡级别的,但是有些人可能会用万卡级别的明年制作。”cWl财经新闻网

北京致远人工智能研究院院长黄铁军表示,视觉领域是大模型领域下一波浪潮的焦点。 他指出,大视觉模型和大语言模型背后的思维方法和基本路线是相同的,只不过输入数据变成了图像和视频,训练出来的模型具有一定的通用视觉语言能力。 一是前提AIGC(人工智能自动生成内容)可以生成图像和艺术品。 “还有一个更基础的能力,那就是看到这个世界之后,首先要能够辨别这个世界(一切)。”cWl财经新闻网

对于大规模视觉模型的发展,许多组织也表达了乐观的态度。 中金公司研究部发布的研究报告显示,计算机视觉未来有望实现更高的自动化程度、高精度和低功耗,进一步丰富元宇宙的内容生态,降低进入门槛。 计算机视觉的进步带动了3D重建和动作捕捉技术的快速成熟,并逐渐积累了各自领域的技术进步。 未来,计算机视觉有望迎来更高的自动化程度、更高的精度、更低的功耗。 它将逐步在移动端实现更好的视觉效果,大量应用于下游行业,逐步走向连接物理世界和数字世界。 具有长远的世界眼光。cWl财经新闻网

中信证券研究还表示,在设计领域,大模型引领数字化设计走向智能化设计,相关工业设计软件结合GPT等技术,可应用于设计规划、布局优化、插件助手、和素描。 在人工智能升级的大趋势下,新一轮生产力革命正在迎来。cWl财经新闻网

免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.comcWl财经新闻网

发表我的评论 共有条评论
    名字:
全部评论
'); })(); /* 360自动推送代码 */