一桩事先公开的“AI攻坚战”,思必驰DFM-2大模型冲上“高地”

来源:爱集微 #思必驰# #AI# #大模型#
4.7w

粤语声动、数字人来。7月12日,“东风生万物”思必驰DFM-2大模型及创新技术应用成果发布会上,思必驰联合创始人、首席科学家俞凯即兴发布指令、大模型快速响应,一位以标准粤语朗诵诗歌的“数字人”俞凯出现在与会嘉宾面前,一首“一夜东风拂面柔,烟笼雨纱盖榭楼。劝君莫道春光浅,万类乘风竞自由”的七言诗博得满堂彩。

“东风生万物”思必驰发布会现场

2022年年末,科技圈迎来“新贵”,ChatGPT及其代表的大模型迅速风靡,多家科技巨头应声而起,发布或披露了各自的“大模型计划”,一桩事先公开的“AI攻坚战”正式打响!

人工智能在深度产业应用中的首要矛盾是?通用大模型与垂直领域大模型路线如何厘清?DFM-2大模型如何赋能千行百业?就此,集微网对话思必驰科技股份有限公司(以下简称“思必驰”)技术总监樊帅博士,展开一场大模型“奇妙之旅”。

把酒祝东风,DFM-2大模型“入局”

思必驰自研的对话式语言大模型DFM-2(Dialogue Foundation Model),中文直译为“通用对话基础模型”,中文取首字母谐音“东风”,既借战略军事力量代号致敬我国核心科技自强自立自主的探索精神,又寓意我国AI行业东风已来的大好前景,凸显用大模型之东风助力千行百业实现“沟通万物、打理万事“的愿景。

“大模型时代”为有恒心者敞开大门,而思必驰恰恰是手握“入场券”的那个。

思必驰DFM大模型

早在2017年,思必驰就布局了对话式语言模型关键技术;2021年,研发团队发布UniDU(DFM-0),即统一生成式对话理解框架;2022年,团队研发统一生成式通用对话基础模型DFM-1(十亿级),并进行小规模产品应用;2023年,研发团队通过规模化升级和行业化定制形成百亿量级的行业语言计算大模型DFM-2。

“从算法或者模型架构上看,DFM-2与上一代大模型一脉相承。但客观地说,DFM-1受限于十亿级规模,还没有完全迈入大模型门槛,”樊帅博士补充道,DFM-2则不同,它已具备了“大模型时代”语言计算要求的“情景理解、指令学习、思维链推理”三大能力。至此,我们判断它是通用的语言计算大模型。

当前,在一些公开数据集的国际测试中,同等规模的百亿级大模型中,DFM-2性能处于全国领先方阵。DFM-2定位于“行业语言计算大模型”,结合综合全链路对话式AI技术,在纵向垂域里更具备产业应用的技术落地能力。

樊帅博士表示,DFM-2发布后,思必驰下一代千亿级大模型DFM-3也已“控弦待发”,预计2024年面世,“由于是千亿级大模型,对应的训练数据将增大,我们从内测到落地,甚至未来一年积累的数据都会加入大模型训练;另外,随着大模型应用的推广,我们擅长的垂域会不断增加,广度增强。”

这当然带来一个无法回避的追问:越来越大的模型,真的就会越来越好吗?在容纳更多数据的同时,又存在哪些困扰?樊帅博士说道:“并非无限地追求大,而要做取舍和均衡。大模型参数规模变大以后,在线推理等方面将极大消耗GPU算力,需要我们进一步加强大模型工程落地的技术研发,包括大模型小型化、推理技术优化等。”

大模型+语言计算,三大特点“更有趣”

思必驰DFM-2大模型具备通用语言计算大模型的所有AGI特性,包括文案创作、代码生成、逻辑推理、常识问答、多轮聊天等,同时针对通用模型事实不准、私域知识无法包含、专用领域理解性能不足等问题,进行一系列技术改造,形成DFM-2行业大模型,具有“场景专业化、模型专用化、体验专精化”三大特点。

场景专业化方面。结合DFM-2大模型技术,思必驰全链路智能对话定制平台(即DUI平台,Dialogue User Interface)完成全新升级,可为各领域客户提供更智慧的解决方案、更专业的场景服务能力。

譬如智能汽车领域,思必驰汽车语音助手天琴系统全面升级至6.0,支持多模态、多意图、多音区、全场景多轮连续对话;医疗健康领域,新增专业领域人设、智能问诊、高情感度语音合成,能够让线上问诊更具备共情能力;政务服务领域,产品方案新增基于政务文档阅读理解的多轮问答、智能助理能力,支持政策咨询、业务办理、公文生成、业务流转等功能......

体验专精化方面。12日举办的“东风生万物”发布会上,思必驰将DUI平台与DFM-2大模型相结合,推出DUI2.0平台,完成全链路对话系统升级。当前,DUI2.0平台对人机交互“5大核心能力”进行提升,进而带来更流畅、更自然、更智能,媲美真人的专精化人机交互体验:

即基于深度认知的通用语义理解、外部信源增强的精准推理决策、基于文档理解的可信主动知识问答、面对复杂任务的自动规划与执行、面向用户个性化的多人设交互。

俞凯数字人

为展示效果,俞凯在发布会现场演示了基于其个人形象合成的数字人,及其语音数据训练的粤语/英语合成音,个性化对话生成与语音合成模型无缝结合,构建可自由交互个性化数字形象。

一切变得有趣起来。

“百模”大战一触即发,思必驰垂域思考

“大模型时代”,普罗大众切身体验了一把AI秀后,在“一本正经胡说八道”与“即将被取代”之间百感交集;而B端企业视野里,“怎样用好大模型”成为最热切的追问。

5月发布的《中国人工智能大模型地图研究报告》指出,目前我国大模型产业化应用大致出现两种并行的发展路径,打造跨行业通用化人工智能能力平台;针对垂直领域的专业类大模型,正在发挥其领域纵深优势不断深化落地。与此同时,随着ChatGPT吹皱了人工智能“一池春水”,我国至少发布了79个规模在十亿级参数以上的基础大模型,“百模”大战一触即发。

思必驰联合创始人、首席科学家俞凯

怎么打、怎么赢?这是一个问题。大模型路径讨论过程中,“通用大模型”和“垂直大模型”走向分水岭——就目前而言,通用语言大模型在行业应用中往往面临私域知识难包含、不准确,判别式任务精度及时效性不强,数据安全和计算可信问题,及成本高、速度慢等问题,很难有通用的语言大模型把这些问题都解决掉。

思必驰判断,当前人工智能产业应用的主要矛盾依旧为技术厂商的通用型技术与B端企业高度灵活的个性化需求之间的矛盾。而当思必驰决心立足通用大模型、面向垂域发力时,我国众多产业对高质量发展的需求,无形之中为大模型落地提供了场景支撑,同时也成为大模型的最佳“练兵场”。

樊帅博士介绍:“为什么DFM-2要面向垂域?面向全域的通用大模型可以解决60-70%的问题,它的容错率可以很高。但落地在具体的行业(企业)中,它即使做到80%,甚至90%可能也无法达到用户的体验要求,甚至可能带来严重损失。”

上文提到,思必驰大模型具备的三个特点中包含了“模型专用化”——即DFM-2是具备通用智能的行业大模型,同时支持面向产业的专有模型定制和私有化部署(大模型迁移定制算法技术行业领先),可在大模型算力和训练平台方面与客户展开合作,打造具有自身特色、高可用的专用化模型,能够支撑面向具体行业的业务模型快速训练、效果评估、快速上线和持续优化。

具体地讲,思必驰可为客户提供数据工程、基底模型、训练平台、提示词工程等一系列大模型所需的技术工程资源,并结合客户高端智算算力、专有场景数据,实现垂直领域的大模型大规模可定制能力。樊帅博士指出,虽然DFM-2具备大模型的通用能力,但现阶段不会刻意加强。他强调:“至少目前不是着重发力的方向。我们的大模型将针对ToB行业,数据分配上更加倾向垂域数据;同时结合行业业务特征,加入所需的工具(插件),进而满足垂域定制可用、可信的需求。”

显然,以DFM-2为代表的行业语言计算大模型在具备“通用智能和知识”“解决行业挑战的能力”“大模型与全链路综合对话技术能力的联动”等基本能力后,面向B端客户更加游刃有余!

新技术“策源地”,语言计算“国家队”未来展望

7月10日,国家网信办等7部门联合发布《生成式人工智能服务管理暂行办法》,提出“鼓励生成式人工智能技术在各行业、各领域的创新应用......探索优化应用场景,构建应用生态体系”。《暂行办法》的发布,为人工智能在各行业的应用打开了一扇窗口。

而作为国家新一代开放创新平台“语言计算”领域的承建单位,思必驰是对话式语言计算研发创新的持续探索者和引领者,从统计对话系统时代到深度学习,再到大模型时代,不断推动源头技术创新。

思必驰董事长、CEO高始兴

正如思必驰董事长、CEO高始兴所言,思必驰敢于成为原创新技术“策源地”,具备原始创新和应用创新的双轮驱动能力,围绕“云+芯”战略,以对话式AI为核心,将DFM-2大模型技术与综合全链路技术进行结合,不断提升AI软硬件产品的标准化能力和DUI平台的规模化定制能力,快速满足智能汽车、智能家居、消费电子,及金融、轨交、政务等数字政企行业场景客户的复杂个性化需求,打造行业语言大模型,赋能产业升级!

“东风生万物”发布会上,思必驰携众多重磅级合作伙伴共同出席,并与梅赛德斯-奔驰、上汽通用五菱、长城汽车、合众新能源、博泰车联网、联通智网、佳都科技、海信、老板电器、海尔、长虹美菱等举行签约仪式。

对于未来发展,语言计算“国家队”的思必驰认为,行业AI应用范式未来将从一个通用模型变成一簇专业化模型,大模型会分化,如按照领域、功能区分,结合具体行业具体场景,出现垂直行业的应用模型。樊帅博士补充:“在通用大模型的基础上进行分化,训练行业大模型(相对小),形成一个以通用大模型为大脑中枢、智能调度行业模型的架构。”

7月12日下午,思必驰DFM-2大模型的发布,为业界带来了精彩展示与长久回响。而在下好科技创新“先手棋”的愿景下,思必驰将充分发挥平台技术和语言大模型优势,努力成长为壮大创新集群的支撑力量,时时走在前列、刻刻争当表率。

责编: 赵碧莹
来源:爱集微 #思必驰# #AI# #大模型#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...