4月26日,讯飞星火V3.5春季上新,科大讯飞董事长刘庆峰发布讯飞星火大模型一系列新功能:
支持长文本、长图文、长语音的大模型正式上新,首发星火图文识别大模型,快速识别和学习多类型海量知识,行业场景下的回答更专业、更精准。
星火合同助手首次上线,审核规避合同风险、提炼总结关键要素、一键起草合同文件。星火智能评标助手升级,投标文件解析更高效,让评标更便捷、更高效、更准确。
“多情感超拟人合成”和“一句话声音复刻”首发,实现更生动、更具个性化的表达,带来更有温度的人工智能体验。
星火智能体平台全新发布,解决大模型企业落地最后一公里,为员工打造专属助理,为企业解放生产力。
此外,讯飞AI学习机、星火智慧黑板、星火科研助手也进行了升级。
刘庆峰介绍:“星火APP在安卓上的下载量已经达到9600多万次,在国内工具类通用大模型APP中排名第一。”在1月30日讯飞星火V3.5发布后,新增了55万实名认证的开发者,其中一半以上是来自企业。
400多年前,英国哲学家弗兰西斯·培根说:“知识就是力量,但更重要的是运用知识的技能。”400多年后的今天,讯飞星火正在成为每个人获取知识、学习知识的“超级助手”,成为解放生产力、释放想象力的“超级杠杆”。
春季上新,次第花开,刘庆峰最后透露:今年6月27日,讯飞星火V4.0将正式发布 。
以下为科大讯飞董事长刘庆峰发布实录:
讯飞星火APP安卓下载量超9600万次
国内工具类通用大模型APP排名第一
大家好!在这个春意盎然、万物勃发的季节,我们讯飞星火春季上新了。
自从今年1月30日星火V3.5发布以来,作为首个全国产算力训练的完全自主知识产权的大模型,讯飞星火受到了各行业伙伴和广大开发者的广泛欢迎。
特别是在一些关键行业和重大战略领域,星火大模型“云、边、端”的整体解决方案正在赋能汽车、家电、运营商等越来越多的行业。
在过去三个月不到的时间里,我们已经新增了55万实名认证的开发者,这其中一半以上来自企业。
从星火APP的应用上也再次看到,使用的最高峰不是周末,而是工作日,使用的最高峰时间是在工作日上午9:30和下午3:30,也就是说,绝大部分用户是用讯飞星火来解决和工作相关的问题的。
截止到今天,星火APP在安卓上的下载量已经达到9600多万次,在国内所有工具类通用大模型APP中,我们是排名第一的。
我们一直在践行用大模型、用通用人工智能解放生产力、释放想象力的目标。
一段时间以来,我们的开发者和用户都高度关注知识的获取和学习的问题。这个过程中,我们不仅要解决长文本的问题,能够把各种信息来源的海量文本快速学习,能够进行问答,特别重要的还有在各种企业和专业行业应用的准确率的问题,尤其是在金融、汽车、政务等等非常关键的领域,我们希望它的回答要足够准确。
垂直领域的知识问答
星火总体水平超GPT-4 Turbo
目前星火大模型通用长文本能力,包括长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等,总体已经达到GPT-4 Turbo 今年4月最新长文本版本的97%的水平,而在多个垂直领域的知识问答任务上,星火大模型长文本总体水平已经超过GPT-4 Turbo。
另外,还有一个非常重要的问题,当我们的文本越来越长,到了几十万字甚至上千万字的时候,效率是一个非常关键的问题,因为,长文本在后台消耗的运算资源非常大。
这一次,我们不仅把大模型在多个领域做到业界最优,还进行了非常重要的“剪枝”和“蒸馏”,从而推出了业界最高性能的13B,也就是130亿的模型来处理长文本。在效果损失仅3%以内的情况下,使得我们在文档上传解析、知识问答的首响时间以及文字生成上都获得极大的效率提升,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本,星火大模型的上述性能都是业界最优的。
下面,我们把《星火相传》这本书送到讯飞星火大模型中,看看它是如何快速学习理解和回答关键问题的。这本书向我们呈现了一个实验室的研究成果,怎么经过多年探索和研究,最终在市场上试点,并变成海量用户使用的产品这样一个过程,它对于我们现在的源头技术创新、产学研合作都具有非常重要的启发意义。
下面,让我们再次有请大家的老朋友、科大讯飞研究院院长刘聪博士来给大家演示。
首发讯飞星火图文识别大模型
覆盖31个场景、18种版面要素
另外,在知识的获取和学习过程中,我们还看到,往往广大用户能够拿到的资料,并不是在网上现成的海量的长文本,而是随手可见的报刊书籍上的内容,能不能用手机一拍就成为用户的后台知识来源?能不能把参加各种学术研讨会上拍到的PPT、上课时老师黑板上的板书以及各种同学笔记,大家分享过来,都能成为后台知识获取和学习的内容?
经过多年积累,科大讯飞屡次在国际图文识别、公式识别大赛中获得第一名。在这基础上,这次,我们首次推出讯飞星火图文识别大模型。图文识别大模型可以处理非常复杂的版面分析,可以结合篇章的语义和文字的理解能力进一步提升,而且可以覆盖更多专用领域的特殊的专业符号。
比如说,我们的图文识别现在已经覆盖了31个最常见的典型场景,像教育类的书刊、学术论文、专利、报纸、海报、产品白皮书、甚至PPT和菜单等都已经进行了覆盖,从而使得它的理解能力和易用性大幅提升。
而且,对于上述场景中最常见的18种版面要素可以进行非常快速的识别和处理。例如页眉、页脚、标题、栏目、段落、表格、插图等要素,甚至还包括比较难、但很实用的公式、印章、二维码、手写材料等。
可以看到,我们的图文识别大模型,无论是在国际公开的权威英文测试集,还是在科研、金融以及企业产品技术文档等等的识别效果都是业界最领先的。
评论列表()