AI大模型“百花齐放”之际,被看作是大模型的重要底座的向量数据库也得到了前所未有的关注。BAT正在全力加码押注。
11月15日,腾讯云宣布全面升级向量数据库多项核心性能,最高将支持千亿级向量规模和500万QPS峰值能力。就在同一天,国内首个向量数据库标准也对外发布,这意味着向量数据库及大模型相关产业正走向大规模应用。
BAT集体加注AI大模型底座技术
所谓向量数据库,是一种将数据作为数学向量存储在高维空间中并对其进行索引的格式。这种方法被称为“向量化”,可以更有效地搜索相似性并更好地处理复杂的数据类型,并带动数据存储和检索的范式转变。
随着大模型兴起,向量数据库的优势得以充分发挥,并被行业其视为AIGC成功的基石。除了腾讯外,阿里、百度、谷歌等头部科技公司都在对这一技术进行布局。目前,百度Milvus、阿里云BlinkDB都具有高维向量数据的存储和检索功能,还可支持云端和边缘设备部署。谷歌旗下向量数据库Annoy已被广泛应用于诸如图像、文本和推荐等领域。
“在Serverless与AI的驱动下,数据平台应该像搭积木一样便捷好用。”阿里云数据库产品事业部负责人李飞飞透露,阿里云瑶池数据库全面提升了向量检索能力。百度智能云大模型技术负责人李莅此前在接受采访时也表示,向量数据库已是大模型的刚需产品,能让AI反馈的答案更加实时。
要推动向量数据库能力升级,主要是对其智能化升级以及企业级的场景化应用作调优。
在腾讯云数据库副总经理罗云看来,在AGI时代,需要更智能化的数据调度范式,向量数据库就是数据平台的中枢。他以腾讯云向量数据库为例谈到,在集成Embedding功能后,用户无需关注向量生成过程,就可实现用自然语言和数据对话。针对企业的端到端解决方案,可通过向量化模型、帮助企业建立数据库索引,缩短数据接入AI的时间。
目前,通用大模型的关注度正被垂类大模型逐渐夺去,向量数据库的价值与众多企业默默耕耘的行业大模型契合。为了更好理解行业语义,执行专业性更强任务,行业大模型会进一步对垂直细分场景数据进行针对性的训练和调优,这才是向量数据库发挥价值真正找到用武之地。随着智能化数据平台需求增多,将吸引越来越多向量数据库加入竞逐。
还没有评论,快来发表第一个评论!