怎么找同城快餐啊_本地同城附近200元_700元三小时不限次数品茶_全国各地可约可空降

您现在的位置是:首页 > 置顶轮播图822*450 >

开源大模型:AI时代的“新战场”

2025-07-08 16:01:24作者:路沙来源:中国信息化周报

摘要  在大模型开源的竞技场上,各方参与者激烈角逐,展现出技术实力与创新能力。开源大模型凭借其低成本、高灵活性、数据安全等优势,为企业 ...

  在大模型开源的“竞技场”上,各方参与者激烈角逐,展现出技术实力与创新能力。开源大模型凭借其低成本、高灵活性、数据安全等优势,为企业和开发者提供了强大的技术基础,推动了人工智能技术的快速普及和应用落地。同时,开源生态的繁荣也促进了技术交流与合作,激发了更多创新应用的产生。

  生态建设是主要目的

  2025年上半年的最后一天,华为和百度同时宣布开源其大模型,正式进入开源行列?;桶俣鹊?ldquo;姗姗来迟”再一次引发了业界对于大模型开源的讨论。因为华为和百度此前曾明确表示“不会开源”,到如今主动开放部分核心能力,这一转变背后的原因值得深思。

  不过,开源作为一种技术共享模式,在大模型领域已深入人心,像LlaMA、DeepSeek、通义千问等行业主流大模型在2023年就宣布了开源,时至今日,早已构建了自己的开源体系。

  北京智源人工智能研究院副院长林咏华表示,当前,AI技术的迅猛发展尤其值得关注。一方面,AI智能体的崛起将深刻改变人类的工作方式,未来智能体可能承担更多人类的工作任务。这引发了关于数字身份和数字化内容如何融入全球数字体系的思考。另一方面,从全球合作的角度看,开源已成为推动全球AI发展的核心力量。不同区域如北美、欧洲、亚太地区应如何加强开源合作,也是科技领域的重要议题。


北京智源人工智能研究院副院长林咏华
 

  浪潮数字企业人工智能产品研发部副总经理丁一凡表示,全球大模型开源正呈现蓬勃发展之势,各大科技公司和初创团队纷纷开放。开源正逐渐成为行业主流,大模型开源被视为大势所趋。

浪潮数字企业人工智能产品研发部副总经理丁一凡
 

  事实上,开源大模型凭借其技术灵活性、低开发成本、丰富的生态支持以及行业适配能力,能够更好地满足企业的定制化需求。企业可以根据自身业务场景和技术能力,对开源大模型进行深度定制和优化,从而实现更高效、更安全、更具成本效益的AI应用开发。

  魔搭社区发起人周靖人表示,开源开放是大模型生态蓬勃发展的核心力量,通过开源开放,一方面,能够让更多的开发者参与进来,降低模型的使用门槛,使得模型不再是只有少数几家公司或者部分技术人员所能触达的,从而更好地推动模型技术的创新。另一方面,随着大量开发者的融入,并作出贡献,也让企业不再担心会被某一项技术、某一个技术体系或者某一家公司强行绑定,消除了他们对新技术应用的担心,从而更积极地将新技术应用在自己的行业中,推动产业的智能化变革。

魔搭社区发起人周靖人
 

  华为公司相关负责人表示,此次开源部分盘古模型,是华为践行昇腾生态战略的又一关键举措,致力于推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造,从而形成一个从模型到硬件再到场景的技术闭环。而百度则希望通过开源模型和平台,推动AI技术在更多行业的应用。

  在开源生态的建设过程中,头部企业更聚焦基础模型的研发创新,并通过开源建立技术标准,而中小企业则基于开源代码开发更多细分应用。在此基础上,开源大模型的开源特性使得企业可以随时获取最新的技术进展,并将其应用到自身模型中。同时,企业也可以根据自身业务反馈,对模型进行持续优化和迭代,从而形成一种创新—应用—反馈—再创新的生态闭环。

  不过,在丁一凡看来,开源大模型的普及不仅将在推动行业标准和规范方面发挥积极作用,同时也要求我们妥善应对由此带来的技术安全和知识产权(IP)挑战。一方面,越来越多的模型开放出来,迫使行业逐步建立起统一的评价指标、文档规范和兼容格式。例如,现在主流开源模型发布时通常会附带“模型卡”(ModelCard),说明训练数据来源、算法细节等信息,但这些说明的详尽程度和标准尚不一致。随着开源生态的发展,业内已意识到需要改进此类规范,以提升透明度和可信度。未来,开源社区有望共同制定模型发布的标准流程,例如要求公开基础训练数据类别、评测基准测试结果、风险提示等,从而让不同模型更可比、更透明。这将有助于监管部门和用户对模型进行审查和信任。另一方面,技术框架层面的标准化也会加速:开放模型普及促进行业采用统一的模型格式(如ONNX、Torch模型格式等)和接口协议,方便模型在不同平台部署和调用。

  “面对随之而来的技术安全和知识产权挑战,开源生态需要在法律和伦理层面建立规范:一是数据集的合规性审查,应尽量使用公共领域或授权许可的数据进行训练,或在模型卡中明确声明数据来源和用途,以减少侵权风险;二是采用更开放的版权解决方案,比如探索“数据版权共享”机制,让被用于训练的创作者得到应有的补偿;三是行业协会和立法机构应尽快制定AI模型训练和生成的版权规则,平衡技术进步与版权人利益。”丁一凡如此说道。

  跨硬件架构的平台建设将成为开源AI的主流

  在林咏华看来,大模型开源,并不仅仅是模型的开源,还包括数据和计算的开源,即OpenModel、OpenData、OpenCompute。

  在开源模型方面,应主要关注三个问题:一是高质量的、能覆盖不同需求的开源模型。林咏华表示,目前,在HuggingFace社区中已有超过180万个开源模型。尽管质量参差不齐,但已形成积极活跃的开源态势。

  二是开源模型的可信度。在开源过程中,只是单独开源模型,还是连带开源模型的评测方式、训练和推理代码、训练数据等,后者意味着模型是足以信任且可复制的。目前,Linux基金会推出了模型开放性框架(MOF)可衡量模型开源等级,智源研究院开源的Aquila-VL-2B模型是首个达到MOF“最开源”ClassI等级的模型。

  三是模型的打造过程期待开放给更多的科研机构和研究人员,让他们有机会深入参与模型创新。例如,HuggingFace的BigScience项目曾在2022年组织全球研究人员打造BLOOM(BigScienceLargeOpen-scienceOpen-accessMultilingualLanguageModel)模型,智源研究院在2025年也发起了OpenSeek项目,吸引了国内外超过200位研究者共同参与。

  在开放数据方面,全球合作建设开放数据集是重要趋势。高质量、有代表性的语料库,促进全球大模型团队的多语言模型训练。智源研究院联合国内数十个机构打造的中文互联网语料库CCI已发布至第四个版本,数据总量达35TB,为全球多语言模型训练提供了高质量中文数据。

  在开放计算方面,算力和计算是制约全球人工智能落地和普惠的关键因素。林咏华解释说,目前,行业内十分关心能否获得足够的算力以及高性价比的计算,让不同国家的不同团队使用,但问题是,如今所打造的大模型主要基于单一生态。在这种情况下,是否可以通过有开放计算合作,让全球发布的开源大模型,既可以运行在智算中心的不同硬件架构上,也能运行在便宜的个人计算电脑,甚至是边缘设备上,让更多的人能够接触不同的AI能力,并利用AI技术开发出更多应用。对此,在过去几年,智源研究院联合开源社区一直在打造面向多元AI硬件的软件栈FlagOS?;贔lagOS,可以帮助用户在不同硬件上完成开源模型的移植和发布。

  “这就是开源的力量。正因为有这些开源模型,社区可以用智源FlagOS的能力实现跨芯片、跨架构的迁移,完成之后把不同架构、不同芯片的模型和代码版本通过FlagRelease发布到魔搭、HuggingFace这些开源平台上。用户只需下载对应型号的支持文件即可很方便的在各种硬件上使用开源模型,这将成为未来开源AI的主流。”林咏华说。

  从使用者转变为重要贡献者

  周靖人表示,截至目前,中国企业及中国模型在全球开源社区技术的发展中,扮演了至关重要的角色。据了解,在HuggingFace社区2024年全球模型下载量中通义千问Qwen占比超30%,稳居第一。斯坦福大学人工智能研究所发布《2025年人工智能指数报告》显示,阿里通义千问系列(Qwen2、Qwen2.5等6款模型)及DeepSeek-V3入选“2024年AI领域重要发布”榜单。自2023年起,阿里已开源200余款模型,其衍生模型数量突破10万,超越美国Llama系列成为全球第一开源大模型。

蚂蚁集团开源团队发布的“2025 大模型开源开发生态全景图”
 

  这些数据充分表明,中国大模型不仅在技术上取得了突破,更在国际开源生态中发挥了重要作用。同时也可以看出,中国大模型在国际开源社区从最初的使用者逐渐转变为重要的贡献者。

  不仅如此,中国大模型在国际开源社区中的贡献不仅体现在数量上,更体现在开源的深度和广度上。例如,在HuggingFace社区中,Llama4要求用户登录HuggingFace账号并填写包含个人身份、公司信息、税务标识等详细资料的申请表。一位开发者吐槽:“为什么下载PyTorch权重或一些随机二进制文件需要提供我的法定姓名、出生日期、完整的组织名称、所有公司标识符?”

  与Llama不同的是,中国模型如DeepSeek和通义千问无需复杂申请流程即可直接使用。不仅如此,中国开源模型通常采用Apache2.0或MIT协议,开发者可以自由进行二次开发和商用,且基于这些模型开发的专利归开发者本人所有。一位海外初创公司开发者提到:“中国模型非常有利的许可模式让我们能够直接使用,无须烦琐的法律审查。”

  林咏华表示,过去,在全球十大模型中鲜见中国模型的身影,但如今,DeepSeek、通义千问等中国模型已受到广泛关注,中国模型在国际上已处于前列。相比来看,中国模型质量很高,如DeepSeek-R1的能力几乎与当时的GPT-4o相当。同时,中国模型也在持续拓展开源的宽度,如通义千问自2023年开源以来,从单一模态到多模态,不断开源模型版本。智源研究院近日发布的多模态生成模型OmniGen2也受到外媒高度评价,下载量迅速攀升。“未来,中国企业势必将在国际开源生态中发挥更大作用。不过,除了要做好开源工作外,还应积极参与全球对话,分享中国的声音,减少不必要的误解和噪声。”林咏华如是说。

  丁一凡表示,展望未来,中国企业可以在国际开源生态中扮演更积极的角色:一是持续输出高质量开源模型,特别是在中文及多语言、垂直行业方面形成特色,让全球开发者受益的同时建立中国品牌;二是推动开源项目的国际协作,比如参与制定开源模型标准、贡献开源工具链,使“中国方案”融入全球标准;三是充分利用政策支持,在算力、数据方面加大投入开源,从底层架构上夯实优势(如建设开源算力平台供社区使用)。

  开闭源将长期共存 并走向融合

  在大模型领域,开源与闭源的争论一直存在。过去,许多科技巨头倾向于闭源模式,以保护其技术优势和商业利益。然而,随着大模型在性能和应用效果上的不断突破,开源模式的优势逐渐显现。

  开源大模型的出现促进了开源生态的繁荣,吸引了大量的开发者、企业和科研机构参与其中。开源社区的活跃度不断提高,开发者们可以共享资源、交流经验、共同解决问题,推动开源技术的持续发展和优化。

  虽然开源大模型取得了显著进展,但开源和闭源并不是绝对的对立关系。闭源大模型在某些方面可能具有独特的优势,如特定领域的专业性能、商业化的技术支持等。未来,开源和闭源大模型将会长期共存,各自发挥其优势,满足不同用户的需求。

  对此,林咏华表示,在开源越来越普及之后,闭源模式并不会就此消失,二者将长期共存,并逐渐走向融合。因为模型只是整个AI系统的一部分,要为客户提供高质量的服务,不能只依靠模型本身,还需要很多配套服务和工程化的工作。“我认为这已经成为了行业的一种共识。例如Meta,以前只做Llama的开源,但现在它也推出了自己的闭源版本;百度之前一直闭源,如今在开源生态建设的大潮流下,也发布了自己的开源战略。”林咏华解释道。

  对此,丁一凡表示,大模型领域的开源和闭源之争仍将长期存在,且将以新的形式延续。目前,闭源路线在商业化落地上已有所收获,一些厂商凭借封闭模型拿下了可观订单,但同时开源阵营发展迅猛,二者交锋日趋激烈??梢栽ぜ春捅赵戳街址妒浇て诠泊妫阂徊糠制笠导绦≡癖赵匆员3趾诵乃惴ɑ芎头裰柿?,另一部分则坚定走开源以汇聚社区力量、加速迭代。正如业内分析所指出,闭源模式通过技术封闭建立壁垒,而开源模式则通过开放代码、数据和算法降低门槛、吸引全球开发者参与,这种格局短期内一方难以完全取代另一方。
 


(本文不涉密)
责任编辑:王艳

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们