国产大模型:创新为道 落地为王
未来大模型产品的发展趋势可能是通用大模型与垂直领域细分模型的结合。这不仅需要具备坚实的技术基础,也需要大模型产品具有坚实的基于场景的应用。未来,从实践中来,到实践中去的“实用级”大模型将成为趋势。
◎实习记者 罗云鹏
快速准确地提炼各方观点并输出会议纪要、辅助医生进行医疗影像诊断、在自动驾驶中进行路线决策……当前,大模型技术正惠及各行各业。
过去一周,国内有关大模型的话题热度持续攀升。9月7日,腾讯混元大模型正式对外亮相,至此国内已有超过130个大模型。一个个大模型的背后,都离不开自主创新。
上半场:开展研发“马拉松”
Token,大语言模型中最小的文本单位。腾讯混元大模型的这个文本单位已跃升至超2万亿。
“腾讯混元大模型从零开始训练,掌握了从模型算法、机器学习框架,到人工智能基础设施的全链路自研技术。”腾讯集团副总裁蒋杰说,“从2021年开始,腾讯不断加大对技术研发的投入,这是不断积累的过程。”
大模型的研发无疑是一场“马拉松”。复旦大学中国研究院副研究员刘典认为,人工智能的发展不是一蹴而就的,要继续加强投入,坚持自主研发、自立自强,做好在人工智能领域“打持久战”的准备。
一项来自腾讯内部的数据显示,从2021年开始,该集团先后推出了多个千亿和万亿参数的大模型,并在实际应用中不断优化大模型底层算法开发,提升工程能力。从2018年起,腾讯累计投入研发经费超过2300亿元,在全球获得专利授权3.3万件,申请专利总数超过6.6万件。
不仅是互联网头部企业,我国的“国家队”也在大模型研发上不断发力。
从2019年开始,中国科学院自动化研究所就多模态大模型领域开始攻关,通过对海量数据弱关联图文音数据的跨模态自监督学习,于2021年9月正式发布了千亿参数多模态大模型“紫东太初”。“从算法到硬件、算力,‘紫东太初’都是‘中国造’。”中国科学院自动化研究所紫东太初大模型研究中心常务副主任王金桥此前在接受媒体采访时说,“在国产软硬件的支撑下,我们的大模型一样能跑得很好、很快。”
2023年6月,科技部新一代人工智能发展研究中心发布《中国人工智能大模型地图研究报告》。该报告显示,从全球已发布的大模型数量来看,中国和美国大幅领先,超过全球总数的80%。
中国信息协会常务理事、国研新经济研究院创始院长朱克力认为,当前国家对民营经济高度重视,作为我国数字科技公司多年来重视科技创新的阶段成果,大模型构成了我国加快实现高水平科技自立自强的重要力量。
百度创始人、董事长兼首席执行官李彦宏在参加2023世界互联网大会时也表示,更创新、更领先的国产大模型,可以为解决全球医疗卫生、气候变化、经济增长等重大挑战提出“中国方案”。
下半场:聚焦服务千行百业
记者梳理发现,时下,在大模型应用领域,阿里达摩院的“通义千问”、商汤科技的“商量”、中国科学院的“紫东太初”、抖音的“云雀”等均已在不同行业和领域落地应用。
“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点带来了全新思路。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,大模型需要基于产业场景,与企业数据融合才能释放出最大价值。
在9月5日举行的2023百度云智大会上,李彦宏曾公开表示,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义。
上海财经大学校长刘元春认为,中国作为世界第二大经济体,拥有超大规模市场和数字资源优势,并且已经在数字技术和应用上取得了巨大成就,为中国的大模型提供了更深入、更丰富的落地场景以及能够“持续训练、终身学习”的环境。
据腾讯数据,目前腾讯已和1.1万家生态伙伴展开紧密合作,推出覆盖100多个产业场景的行业解决方案,共同服务千行百业。而据百度数据,已有500多家生态伙伴通过百度智能云千帆大模型平台使用各类大模型服务,千帆大模型平台月活企业数超过1万家。
“大模型的价值在于应用。”清华大学人工智能研究院视觉智能研究中心主任邓志东教授认为,大模型只有在多样化的实际应用场景中赋能智能经济与智能社会的发展,才能找到产业价值,同时也才能成就其自身。
值得一提的是,今年6月,腾讯云推出了模型即服务(MaaS)解决方案,提供涵盖模型预训练、模型精调、智能应用开发等一站式的行业大模型服务,可根据客户需求高效率、低成本地定制大模型及智能应用。
“未来大模型产品的发展趋势可能是通用大模型与垂直领域细分模型的结合。”中国人民大学数字经济研究中心主任李三希认为,这不仅需要具备坚实的技术基础,如大规模、高质量、多样化的语料库,创新的大模型算法,自研的机器学习框架和强大的算力基础设施等,也需要大模型产品具有坚实的基于场景的应用。未来,从实践中来,到实践中去的“实用级”大模型将成为趋势。
[相关新闻]
在场景中发现应用需求
科技日报讯 (记者华凌)大模型未来将如何为产业赋能?9月15日记者获悉,由中国人民大学国家发展与战略研究院、中国人民大学经济学院、中诚信国际信用评级有限责任公司联合主办的CMF宏观经济热点问题研讨会(第73期)于近日举行,多位知名学者、专家围绕大模型未来的发展方向、人工智能发展对经济的意义等问题展开讨论。
复旦大学人工智能创新与产业研究院院长,阿里巴巴原副总裁漆远指出,大模型不仅具有更强的泛化能力,而且能更好地推动产业发展,提升用户交互水平。因此,大模型未来的发展方向可能是在场景中找到真正需要的产品,将产品与算法和工程化真正结合起来。
未来,人工智能在金融、医疗、教育、游戏设计等行业应用落地的可能性将非常大。从产业发展趋势上看,大模型产业当前正处于商业模式探索阶段。实际上,它是一个生态系统,需要产业、高校、服务平台等层面的深度融合。
北京大学计算机学院教授、人工智能研究院副院长黄铁军指出,大模型具有规模大、通用性强的特点。同时,当大模型网络参数达到百亿级时,它就会成为一个复杂的系统,并像其他的物理系统一样产生涌现现象,具备融会贯通的能力。预计在未来3年内,视觉、听觉、行动等通用智能的技术路线将会出现,并且影响会更大;预计在未来10年内,智力革命成果会广泛普及,一个全新的生态体系将构建出来;预计在未来30年内,人工智能将发展为时空环境驱动的具身智能,它能够进行实时感知、实时决策、实时行动。(科技日报)
版权声明:凡注明“来源:中国西藏网”或“中国西藏网文”的所有作品,版权归高原(北京)文化传播有限公司。任何媒体转载、摘编、引用,须注明来源中国西藏网和署著作者名,否则将追究相关法律责任。