火山引擎发布豆包·视觉理解模型，1块钱能处理284张图片

火山引擎发布豆包·视觉理解模型，1块钱能处理284张图片

00:00

01:07

12月18日，2024冬季火山引擎Force原动力大会在上海举行。火山引擎总裁谭待公布了豆包大模型家族的全系列升级，同时还发布了豆包·视觉理解模型。据谭待介绍，豆包·视觉理解模型具有更强内容识别能力，包括识别图像知识、动作情绪、位置状态和文字信息等；更强的选择和推理能力，包括对图表、数学、逻辑和代码的识别；更细腻的视觉描述能力，包括细节描述、指令遵循、多种文本创作等。

谭待还宣布，火山引擎要让视觉理解模型进入“厘时代”。1块钱能在豆包·视觉理解模型处理284张图片，比行业平均价降低85%，同样的钱在GPT-4o只能生成52张图片。

谭待还公布了豆包大模型的最新使用数据，豆包大模型发布以来日均tokens使用量增长超33倍，日均tokens使用量超过4万亿。

以上内容来自专辑

《全球工程前沿2024》发布，工程前沿探索向极端条件迈进
7202:14
火山引擎发布豆包·视觉理解模型，1块钱能处理284张图片
8601:07
2024新京报年度阅读推荐入围书单｜儿童新知生活
8311:44
京郊一村民迁坟毁了286平方米林地，法院督促补植复绿
19104:33
东西部对抗成四队锦标赛，杜兰特不满NBA全明星新赛制
12401:34
中国过境免签进一步优化，旅游企业计划将调整产品供给
7804:03
湖北黄石21批次食品抽检不合格，涉及餐饮食品、饮料、糕点等
13701:47
乌镇景区推出多项暖冬季主题活动，萧邦之心专题音乐会即将举办
6601:15
《破·地狱》：香港票房纪录的新瓶与旧酒
9711:07
在境外主动投案北京粮食集团原副总经理姜鹏举被遣返回国
7201:00

主播信息

新京报

好新闻，无止境。

56.21万

加关注

还没有评论，快来发表第一个评论！

相关推荐

豆乐儿歌我是小小理发师物理快板模型理发师的觉醒你是我恰到其处的理想型图像处理新起点理想发布会理不理包子为理解发声名人故事引发的道理光电图像处理