020-8888888
网站首页 关于谈球吧 产品中心 新闻动态 成功案例 荣誉资质 联系我们
咨询热线
020-8888888
地址:思明区体育路2号体育局大楼99楼
邮箱:

新闻动态

当前位置: 首页 > 新闻动态

咖啡汤力 商汤科技发布全栈大模型产品矩阵,加速生成式 AI 产业落地

发布时间:2024-06-16 20:12:29 点击量:

商汤科技遵循人工智能发展最基本的规律——Scaling Law,不断寻求最合适的数据配置,建立数据质量评估体系,在推动自身大规模模型研发的同时,也为行业合作伙伴提供大规模模型训练、微调、部署等各类生成式人工智能能力与服务。

商汤科技董事长兼首席执行官徐立表示:“在规模法则的引领下,商汤科技将持续探索大模型能力KRE三层架构(知识-推理-执行),不断突破大模型能力的边界。”

“SenseNova 5.0 每天更新”

性能超越 GPT-4 Turbo:

掌握文理科的能力有很大的提高。

添加了多模式交互

自去年4月首次发布以来,商汤科技“SenseNova”大模型体系已正式开启5个大版本迭代。基于超过10TB token训练、覆盖海量合成数据,全新“SenseNova 5.0”(以下简称:SenseNova 5.0)采用混合专家架构,推理时上下文窗口有效可达约200K。

咖啡汤的做法_咖啡汤力_咖啡金汤力

本次更新主要增强知识、数学、推理和编码能力,全面对标GPT-4 Turbo,并在主流客观评测中达到或超过GPT-4 Turbo。

咖啡金汤力_咖啡汤力_咖啡汤的做法

文科能力方面,“日日新5.0”的创意写作能力、推理能力、概括能力均有大幅提升,注入同样的中文知识后,能够获得更好的理解、概括和答疑,为教育、内容产业等垂直应用场景提供有力助力。

咖啡汤力_咖啡金汤力_咖啡汤的做法

咖啡金汤力_咖啡汤的做法_咖啡汤力

日日新5.0和GPT-4回答了一个有趣的推理问题:“妈妈给圆圆泡了一杯咖啡,圆圆喝了半杯之后,就加满了水,然后又喝了半杯,又加满了水,最后全部喝完。圆圆喝的咖啡多还是水多?”日日新5.0回答正确。

科学能力方面,“RiRiXin 5.0”的数学能力、编码能力、推理能力均达到业界领先水平,为金融、数据分析等场景的落地提供了坚实基础。

本次“日更新5.0”的另一项核心指标是多模态能力。商汤多模态大模型的图像和文本感知能力已达到全球领先水平,在多模态大模型权威综合基准测试MMBench中位居综合得分第一,并在MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU等多个知名多模态榜单中取得领先成绩。

咖啡汤的做法_咖啡金汤力_咖啡汤力

“SenseNova 5.0”在应用产品层面也实现了更加出色的多模态能力,支持高清长图分析理解和图文交互生成,还可实现复杂跨文档知识抽取和总结问答呈现,具备丰富的多模态交互能力。

咖啡金汤力_咖啡汤力_咖啡汤的做法

率先完成“云-边”全栈布局:

端侧模型业界领先。

BianChe推出企业级应用一体机

商汤科技预见到未来中心化算力需求向端侧拓展,以及企业级AI需求在边缘侧的趋势,首次领先业界推出“云、端、边”全栈大模型产品矩阵,包括应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。

今年是大模型在边缘的应用元年,为了满足移动终端用户对于大模型技术的应用需求,商汤科技推出全新边缘大模型,在同尺度下实现最优性能,跨尺度全面领先。

咖啡汤力_咖啡汤的做法_咖啡金汤力

商汤科技还推出了端云协同解决方案,通过智能判断,充分发挥端云各自的优势,当需要在线搜索或者处理复杂场景时,数据会转移到云端处理,部分场景端侧处理比例超过80%,从而大幅降低推理成本。

咖啡金汤力_咖啡汤的做法_咖啡汤力

商汤科技日新增终端侧大语言模型推理速度业界最快,在中端平台实现平均生成速度18.3词/秒,旗舰平台实现平均生成速度78.3词/秒。

扩散模型在终端侧也能实现业界最快的推理速度,在主流平台上,终端侧LDM-AI图片扩容技术推理速度小于1.5秒,比友商云APP快10倍,支持1200万像素及以上高清图片输出,支持终端等比例扩容、自由扩容、旋转扩容等快速图片编辑功能。

咖啡汤的做法_咖啡汤力_咖啡金汤力

即日起,商汤端到端业务SDK正式发布,欢迎大家集成体验。

针对金融、编码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤科技正式推出企业级大模型一体机,可同时支持企业级千亿级模型加速和知识检索硬件加速,实现本地化部署、即用即用,降低企业应用大模型的门槛。与业界同类产品相比,推理成本节省80%,检索大幅加速,CPU工作量减少50%。

咖啡汤力_咖啡汤的做法_咖啡金汤力

携手生态伙伴,创新AI2.0时代的产品应用。

创造品质新生产力

发布会上,商汤科技还邀请了金山办公、海通证券、小米、阅文集团、华为等生态合作伙伴的嘉宾,就大模型技术在办公、金融、出行等不同领域的应用及前景进行探讨交流。

自2023年起,商汤科技就与金山办公达成深度合作,基于“天天更新”大模型出色的代码生成和工具调用能力,助力WPS 365构建更高效释放场景能力的全新优质办公生产力平台,为企业打造专属的“企业大脑”。金山办公CEO张庆元表示:“在办公应用场景中,商汤科技大模型的表现非常突出,可以帮助我们的用户解决办公中的复杂问题,提高效率。”

咖啡汤的做法_咖啡金汤力_咖啡汤力

在金融领域,海通证券与商汤科技联合发布面向金融行业的多模态全栈大模型,双方在智能客服、合规风控、代码助手、办公助手等领域推进业务落地,并联合研究智能投顾、舆情监测等前沿行业场景,开放证券行业大模型落地的全栈能力。海通证券副总经理、首席信息官毛宇星表示:“通过与商汤科技的合作,我们利用大模型技术实现了海通证券的数字化转型,未来将结合全栈AI能力,进行业务流程和交互改造、数字化业务体系重构。”

咖啡金汤力_咖啡汤力_咖啡汤的做法

咖啡汤力_咖啡金汤力_咖啡汤的做法

在个人出行场景中,近期在市场上备受热捧的小米SU7智能座舱,就采用了商汤大模型技术。基于商汤端云大模型解决方案,小米小爱同学为车主提供了智能交互体验。小米集团小爱同学总经理王刚在与商汤科技联合创始人、首席科学家王小刚对话时表示:“商汤云边端全栈结合,能够很好地赋能和适配小米IoT生态。我们希望与商汤一起,为用户打造更加智能的产品体验。”

咖啡金汤力_咖啡汤力_咖啡汤的做法

左为小米集团小爱同学总经理王刚,右为商汤科技联合创始人兼首席科学家王小刚

此外,商汤科技今天还发布了基于Ascend Native的行业大模型,共同打造金融、医疗、政务、代码等大模型行业生态。

在自身应用方面,商汤科技“SenseNova 5.0”在喵花、如影、格物、琼语、大衣、小浣熊家族等产品上都有重要更新。

《文森特影片》正在路上。

商汤科技正坚定迈向AGI时代

技术交流日的最后,商汤科技董事长兼首席执行官徐立还展示了三段完全由大模型生成的视频,并强调了文胜视频平台对人物、动作、场景的可控性。

咖啡汤的做法_咖啡汤力_咖啡金汤力

咖啡汤力_咖啡汤的做法_咖啡金汤力

商汤科技的文胜视频平台也取得技术突破,未来只需输入一段文字或一段完整描述即可生成一段视频,并可预先设定人物的服饰、发型、场景等,保持视频内容的连贯性和一致性。

商汤科技打造的智能计算中心能够持续赋能大模型的训练,目前全新大模型体系已在自然语言处理、视频生成、深度学习优化等方面实现创新。

一方面,大模型发展已进入实施阶段,如何与行业、应用场景结合是关键环节;另一方面,“规模化规律”的路径也逐渐清晰,“出水面”随时可能出现,前瞻探索最先进的大模型技术也是当务之急。

秉承成立之初“坚守原创,让AI引领人类进步”的目标与愿景,商汤科技大模型技术与产品已在医疗、教育、法律、工业等多个行业落地实践。正如大模型被命名为“天天新”,商汤科技一直坚定地朝着通用人工智能的目标迈进,突破数据与算力的限制,引领大模型的创新与落地。

Copyright © 2002-2024 谈球吧 版权所有 非商用版本  网站备案号:冀ICP备57886787号    网站地图