7月5日,2024世界人工智能大会期间,百度智能云大模型助力新质生产力发展论坛在在上海世博展览馆举办。会上,百度智能云宣布文心大模型4.0 Turbo面向企业客户全面开放;文心旗舰款模型ERNIE 4.0和ERNIE 3.5宣布大幅降价;百度智能云千帆大模型平台针对模型效果、推理性价比以及AI原生应用开发提效发布十余项能力升级。
ERNIE 4.0 Turbo面向企业客户开放,文心旗舰模型大幅降价
大模型日均调用量突破5亿次、二季度环比增长150%;累计服务15万家企业用户、累计帮助用户精调了2.1万个大模型;帮助用户开发出了55万个AI原生应用。这是百度智能云千帆平台交出的2024“年中报”,这些数据说明,大模型已经真正进入到了指数级增长的阶段。
百度副总裁谢广军表示,在模型方面,文心系列最新旗舰版大模型——ERNIE 4.0 Turbo面向企业客户全面开放,输入输出价格分别低至0.03元/千Tokens、0.06元/千Tokens。
此外,ERNIE 4.0、ERNIE 3.5两款旗舰模型大幅降价;ERNIE Speed、ERNIE Lite两款主力模型持续免费,进一步帮助客户降低大模型使用门槛和试错成本,加速业务创新。
千帆ModelBuilder发布全新特性,模型效果更好、推理性价比更高
在大模型工具链方面,ModelBuilder业界首发DPO、KTO两类偏好对齐训练方法,帮助用户在无需构建强化学习或奖励函数的条件下,直接利用人类对模型生成文本片段的偏好排序来进行模型优化,大幅提升模型精调效率。
在模型推理方面,ModelBuilder新增支持wint8、ptq等模型量化压缩算法,在不损失模型性能的前提下,通过将模型参数、权重等数值转换为更轻量级的表示方式,从而大幅减少模型推理运算量与延迟,极大提升模型在实际应用场景中的性价比。
千帆AppBuilder新增支持私有化部署,全面升级企业级RAG
千帆AppBuilder作为企业级AI原生应用开发平台,支持开发者使用预置组件轻松定制自己的业务流程。目前,包含大模型能力组件,AI能力组件,第三方API以及基础云组件等AppBuilder官方组件已更新至60+个。开发者还可以集成、扩建自己特色的组件,灵活选用符合业务特点的不同规格大模型,轻松构建场景化的AI原生应用。
全新升级的企业级检索增强生成,针对企业海量知识检索、自定义策略、企业级安全保障三大业界通用难题进行了全面升级:
新增云存储服务支持,实现资源的弹性扩缩容,打破传统RAG普遍使用公共资源池并限制资源上传数量的瓶颈,极大提升检索服务的可扩展性;
针对传统RAG在知识预处理环节遇到的系统无法理解文档内容,仅根据内容长度进行简单切片,影响最终知识检索准确性等问题,AppBuilder此次全面开放了包括各类文档解析、切片策略、多种检索与召回策略在内的各种RAG调配功能和策略选项,以产品化方式开放百度企业服务经验,业界唯一;
基于全栈云技术研发投入,持续提升服务安全性与稳定性,保障客户知识检索业务的生产级使用。
此外,千帆AppBuilder针对传统RAG难以触及公网内容、资源,检索结果时效性不足等问题,全新推出“RAG with 百度搜索”功能,将百度搜索在时效性、客观性方面的优势,与RAG在私域知识响应、语言灵活性方面的优势进行能力互补,快速高质量响应用户需求,同时,实现文本、图像、视频等多模态内容的流畅交互体验。
会上,百度智能云还宣布千帆AppBuilder全面支持私有化部署,满足企业数据域内管理、业务高度定制化以及自主可控等要求。在部署方式上,百度智能云同时支持AppBuilder与大模型全部私有化,和AppBuilder私有化结合调用公有云上大模型的混合云部署方式,满足不同客户的业务需求。
百度智能云千帆行业场景解决方案正式发布,加速大模型行业落地
为了进一步降低行业客户落地大模型门槛,百度智能云此次推出千帆行业场景解决方案。基于百度智能云在各行业场景中的最佳实践,打造了场景模型、模型精调样板间、Prompt模板、应用样板间等参考“样例”,方便有相似业务诉求的客户直接使用或一键复制即可完成大模型应用开发。
还没有评论,快来发表第一个评论!