科大讯飞发布首个支持长文本、长图文、长语音的大模型--新质生产力网

4月26日，讯飞星火V3.5春季上新，科大讯飞董事长刘庆峰发布讯飞星火大模型一系列新功能：

　　支持长文本、长图文、长语音的大模型正式上新，首发星火图文识别大模型，快速识别和学习多类型海量知识，行业场景下的回答更专业、更精准。

　　星火合同助手首次上线，审核规避合同风险、提炼总结关键要素、一键起草合同文件。星火智能评标助手升级，投标文件解析更高效，让评标更便捷、更高效、更准确。

　　“多情感超拟人合成”和“一句话声音复刻”首发，实现更生动、更具个性化的表达，带来更有温度的人工智能体验。

　　星火智能体平台全新发布，解决大模型企业落地最后一公里，为员工打造专属助理，为企业解放生产力。

　　此外，讯飞AI学习机、星火智慧黑板、星火科研助手也进行了升级。

　　刘庆峰介绍：“星火APP在安卓上的下载量已经达到9600多万次，在国内工具类通用大模型APP中排名第一。”在1月30日讯飞星火V3.5发布后，新增了55万实名认证的开发者，其中一半以上是来自企业。

　　400多年前，英国哲学家弗兰西斯·培根说：“知识就是力量，但更重要的是运用知识的技能。”400多年后的今天，讯飞星火正在成为每个人获取知识、学习知识的“超级助手”，成为解放生产力、释放想象力的“超级杠杆”。

　　春季上新，次第花开，刘庆峰最后透露：今年6月27日，讯飞星火V4.0将正式发布。

　　以下为科大讯飞董事长刘庆峰发布实录：

　　讯飞星火APP安卓下载量超9600万次

　　国内工具类通用大模型APP排名第一

　　大家好!在这个春意盎然、万物勃发的季节，我们讯飞星火春季上新了。

　　自从今年1月30日星火V3.5发布以来，作为首个全国产算力训练的完全自主知识产权的大模型，讯飞星火受到了各行业伙伴和广大开发者的广泛欢迎。

　　特别是在一些关键行业和重大战略领域，星火大模型“云、边、端”的整体解决方案正在赋能汽车、家电、运营商等越来越多的行业。

　　在过去三个月不到的时间里，我们已经新增了55万实名认证的开发者，这其中一半以上来自企业。

　　从星火APP的应用上也再次看到，使用的最高峰不是周末，而是工作日，使用的最高峰时间是在工作日上午9:30和下午3:30，也就是说，绝大部分用户是用讯飞星火来解决和工作相关的问题的。

　　截止到今天，星火APP在安卓上的下载量已经达到9600多万次，在国内所有工具类通用大模型APP中，我们是排名第一的。

　　我们一直在践行用大模型、用通用人工智能解放生产力、释放想象力的目标。

　　一段时间以来，我们的开发者和用户都高度关注知识的获取和学习的问题。这个过程中，我们不仅要解决长文本的问题，能够把各种信息来源的海量文本快速学习，能够进行问答，特别重要的还有在各种企业和专业行业应用的准确率的问题，尤其是在金融、汽车、政务等等非常关键的领域，我们希望它的回答要足够准确。

　　垂直领域的知识问答

　　星火总体水平超GPT-4 Turbo

　　目前星火大模型通用长文本能力，包括长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等，总体已经达到GPT-4 Turbo 今年4月最新长文本版本的97%的水平，而在多个垂直领域的知识问答任务上，星火大模型长文本总体水平已经超过GPT-4 Turbo。

　　另外，还有一个非常重要的问题，当我们的文本越来越长，到了几十万字甚至上千万字的时候，效率是一个非常关键的问题，因为，长文本在后台消耗的运算资源非常大。

　　这一次，我们不仅把大模型在多个领域做到业界最优，还进行了非常重要的“剪枝”和“蒸馏”，从而推出了业界最高性能的13B，也就是130亿的模型来处理长文本。在效果损失仅3%以内的情况下，使得我们在文档上传解析、知识问答的首响时间以及文字生成上都获得极大的效率提升，在保障长文本效果的情况下，无论是10K、64K、128K token，还是更长的文本，星火大模型的上述性能都是业界最优的。

　　下面，我们把《星火相传》这本书送到讯飞星火大模型中，看看它是如何快速学习理解和回答关键问题的。这本书向我们呈现了一个实验室的研究成果，怎么经过多年探索和研究，最终在市场上试点，并变成海量用户使用的产品这样一个过程，它对于我们现在的源头技术创新、产学研合作都具有非常重要的启发意义。

　　下面，让我们再次有请大家的老朋友、科大讯飞研究院院长刘聪博士来给大家演示。

　　首发讯飞星火图文识别大模型

　　覆盖31个场景、18种版面要素

　　另外，在知识的获取和学习过程中，我们还看到，往往广大用户能够拿到的资料，并不是在网上现成的海量的长文本，而是随手可见的报刊书籍上的内容，能不能用手机一拍就成为用户的后台知识来源?能不能把参加各种学术研讨会上拍到的PPT、上课时老师黑板上的板书以及各种同学笔记，大家分享过来，都能成为后台知识获取和学习的内容?

　　经过多年积累，科大讯飞屡次在国际图文识别、公式识别大赛中获得第一名。在这基础上，这次，我们首次推出讯飞星火图文识别大模型。图文识别大模型可以处理非常复杂的版面分析，可以结合篇章的语义和文字的理解能力进一步提升，而且可以覆盖更多专用领域的特殊的专业符号。

　　比如说，我们的图文识别现在已经覆盖了31个最常见的典型场景，像教育类的书刊、学术论文、专利、报纸、海报、产品白皮书、甚至PPT和菜单等都已经进行了覆盖，从而使得它的理解能力和易用性大幅提升。

　　而且，对于上述场景中最常见的18种版面要素可以进行非常快速的识别和处理。例如页眉、页脚、标题、栏目、段落、表格、插图等要素，甚至还包括比较难、但很实用的公式、印章、二维码、手写材料等。

　　可以看到，我们的图文识别大模型，无论是在国际公开的权威英文测试集，还是在科研、金融以及企业产品技术文档等等的识别效果都是业界最领先的。

扫一扫打开手机网站

微信扫一扫关注我们

科大讯飞发布首个支持长文本、长图文、长语音的大模型

作者: 力龙1

评论列表()

联系我们

微信扫一扫关注我们

给这篇文章的作者打赏

作者: 力龙1

为您推荐

评论列表()

联系我们

微信扫一扫关注我们