欢迎来到财经新闻网

新知大模型的开、闭源之战,开始得比想象中早上一些

编辑:佚名      来源:财经新闻网      开源   模型   操作   算法   联网

2023-07-27 16:59:22 

财经新闻网消息:Fwn财经新闻网

图片来源@视觉中国Fwn财经新闻网

文字| 科技新闻Fwn财经新闻网

模型开源与闭源之战比预想的更早开始。Fwn财经新闻网

7 月 18 日,母公司 Meta 表示将发布其开源大型模型 Llama 的商业版本,为初创公司和其他企业提供强大的免费选择,以取代谷歌销售的昂贵专有模型。 它还宣布Llama将由微软通过其Azure云服务分发,并将在该操作系统上运行,称微软为“我们的首选合作伙伴”。Fwn财经新闻网

一时间,不少分析师认为Llama将改变AIGC的产业结构。 Meta副总裁、人工智能部负责人杨立坤也来到平台,“Llama 2将改变大语言模型市场的格局。” 难道真的没有悬念了吗?Fwn财经新闻网

开源(Open),即开源代码,最早起源于20世纪50年代和20世纪60年代的美国。 在开发互联网技术和电信网络协议的早期,研究人员需要一个开放和协作的环境。 而1968年先驱阿帕网()的建立成为了开源代码可行性论证的标志。 1985年,自由软件运动的领袖理查德·斯托曼( )看到专利软件的商业化逐渐取代了实验室里自由、自由流通的软件,发表了著名的GNU宣言,最终开启了开源运动导致了免费Linux操作系统的诞生。Fwn财经新闻网

自爆炸以来,对开源的呼声从未停止过。 但就在发布之后,我选择了闭源开发。 这或许并不完全是出于避免竞争的考虑。 即使有一天它完全开放,其他同行也不能简单复制它的成功路径。Fwn财经新闻网

因为“瞬间”之所以能够被触发,是因为强大的生成能力给人带来了不一样的场景体验。 但这依赖于长期算力、算法和数据的积累。 事实上,在这场全球大规模的模范军备竞赛中,关于开源开发与闭源深耕的争论将会无休无止地持续下去。Fwn财经新闻网

开源还是闭源Fwn财经新闻网

历史的车轮总是会反复碾过。 在互联网发展史上,一直上演着开源与闭源之战。Fwn财经新闻网

除了上面理查德·斯托曼( )的GNU宣言打响了反对闭源的第一枪之外,随后的PC时代关于开源与闭源的争论一直没有停止。Fwn财经新闻网

在PC刚刚兴起时,微软内部研发团队通过闭源的方式开发操作系统,并开发配套应用软件等,并在生态建设方面与互联网结盟,成功抢占了PC市场。 当时Linux是一个自愿的“非政府组织”,由世界各地的开发者共同打造,通过开源与微软形成一定的竞争。Fwn财经新闻网

移动互联网时代,谷歌与苹果的iOS开源闭源之争也走了不同的道路。 基于互联网的开放性,诞生了大量的定制化手机操作系统,比如小米、OPPO等国产的MIUI,甚至汽车端的比亚迪车载系统也是以此为基础开发的。 当然,从商业成功的角度来看,微软和苹果的地位在一定时期内会更加稳固。Fwn财经新闻网

在SaaS发展史上,软件的开源也是如上。 中国科学院院士、CCF开源发展委员会主任王怀民教授认为,在一个确定发展方向的时代,闭源企业的推动作用明显,竞争力也极强。 “但当一个不确定的互联网时代到来时,开源吸引了全世界的开发者参与其中的可能性,以至于后来的服务器操作系统、云操作系统、移动操作系统、物联网操作系统都是基于在开源 Linux 上。基础。”Fwn财经新闻网

国外与Llama存在争议,国内大型模型厂商也各有所长。Fwn财经新闻网

比如阿里云、智普、清华心电、百川智能等,都选择了开源。 阿里云宣布1+4开源战略,推出大模型方向的开源新力量GPT。 阿里巴巴达摩院高级算法工程师李晨亮曾对外界表示,“开源生态肯定有利于大模型的繁荣”。 相反,华为的盘古大模型选择闭源,也是出于其数据隐私和商业利益的考虑。 考虑。Fwn财经新闻网

最好的价格获胜?Fwn财经新闻网

开源闭源区别_开源闭源的英文_Fwn财经新闻网

大模型开源后,将吸引更多人才参与,加速技术进步。 但要想实现突破,还需要从底层理解模型框架和算法的基本原理。 众所周知,人工智能的三要素是:计算能力、算法和数据。 开源只是处于算法阶段,然后还需要大量的算力支持和数据训练,背后的成本是相当高的。Fwn财经新闻网

举个例子:业内人士表示,训练和运行大型模型会消耗大量的计算资源和数据。 仅2022年,总成本就将达到5.4亿美元。 与之形成鲜明对比的是,它产生的收入只有2800万美元。Fwn财经新闻网

据业内人士透露,某上市公司的人工智能部门打算使用GPT-3.5来开发功能,但由于成本和定制开发,以及无法同时支持大量用户请求的原因,他们选择了参数数量较少的Llama和国内公司的开源大型模型,在后期的训练和部署上也会花费更少。Fwn财经新闻网

该软件开发平台首席执行官 Amjad Masad 表示:“对开源模型的任何增量改进都会蚕食闭源模型的市场份额,因为你可以以更低的成本和更少的依赖性运行它们。”Fwn财经新闻网

开源也将让其他新进入者更快地适应AI行业。 比如谷歌泄露的文件中提到:几乎任何人都可以根据自己的想法微调模型,一天之内的训练周期将成为常态。 按照这个速度,微调的累积效应将很快帮助小模型克服其尺寸劣势。Fwn财经新闻网

更多的人进来使用它,就会产生更多的数据。 这些互联网原生内容的标准化培训比公司单独收集和标记数据要简单得多。Fwn财经新闻网

_开源闭源的英文_开源闭源区别Fwn财经新闻网

分享 Llama 的 Meta 表示,收集到的数据代表了根据经验采样的人类偏好,人类注释者选择他们更喜欢的两个模型输出中的哪一个。 然后,人类给出的反馈被用来训练奖励模型,该模型不断学习人类注释者的偏好模式,然后根据它们自动执行偏好决策。Fwn财经新闻网

开源的好处是显而易见的,闭源的逻辑也很扎实。Fwn财经新闻网

元创资本的研究表明,与开源相比,闭源模式相对成熟,数据质量更有保障。 同时省去了部署的麻烦,成本也比较低,只需要代币费用。Fwn财经新闻网

当然,最重要的是,对于厂商来说,闭源也有商业上的考虑。 据权威杂志《Fast》预测,2023年营收将达到2亿美元,其中包括提供API数据接口服务、聊天机器人订阅服务费等。Fwn财经新闻网

比赛刚刚开始Fwn财经新闻网

上个月,猎豹移动CEO傅盛与投资人朱啸虎之间的口水战引发热议。 核心冲突在于业界对于大模型价值的思考,以及大模型能否解决问题。Fwn财经新闻网

开源闭源区别_开源闭源的英文_Fwn财经新闻网

如今,以他们为代表的大公司、强大的计算能力、强大的算法共同筑起了一道普通创业者和开发者难以突破的墙,以至于当市场上出现其他类似的开源应用时,人们认为他们是大模型。 行业垄断将被打破。Fwn财经新闻网

事实上,自推出引发全球跟进以来,英伟达股价迎来飙升,主要得益于厂商对算力芯片的强劲需求。 也就是说,即使开源后大家都有了大模型,但算力、算法、数据训练的工作还是需要有人去做。 而开源只是相当于开放了设计图纸。 你可以在图纸上进行调整,但这并不意味着你可以完全建造一座建筑。Fwn财经新闻网

例如,一些大型模型产品刚推出时,语义理解往往不准确,输出结果很可笑。 其背后的原因是高质量数据的筛选和训练太少,导致数据的准确性直接影响人工智能的输出。Fwn财经新闻网

但训练数据并不是暂时的,它涉及到数据采集、清洗、标注的另一个产业链。 过去很长一段时间,这个环节是由专门的数据处理公司来完成的,也就是说需要长期的人力投入。Fwn财经新闻网

业内一些数据优化工程师也表达了类似的观点,大模型本身的泛化能力仍然受到数据的限制。 如果说某个职业或者职位要被取代,最简单的判断标准就是是否有足够多、质量非常好的数据。 同理,想要通过开源打破垄断模式,就需要对数据进行足够的优化,对基础设施进行足够的投入。Fwn财经新闻网

大模型开源与闭源之争不会以一款或几款产品的出现而结束,而是需要顶尖人才的参与、技术迭代、资金支持。 想要打破垄断,还需要考虑时间因素和优质数据的筛选。Fwn财经新闻网

开还是关从来都不是最根本的问题。 产品体验与市场需求的匹配是决定性因素。Fwn财经新闻网

免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.comFwn财经新闻网

发表我的评论 共有条评论
    名字:
全部评论
'); })(); /* 360自动推送代码 */