Daily-AI | 9.2 | 开源大模型新王!阿里Qwen2.5来了,性能跨量级超Llama3.1

Daily-AI | 9.2 | 开源大模型新王!阿里Qwen2.5来了,性能跨量级超Llama3.1

00:00
10:01

0:00 “终结者”雏形将登场,英伟达预测未来 2-3 年机器人领域迎来“GPT-3 时刻”

1:24 人工智能笔记工具Fathom融资1700万美元

2:42 阿尔特曼称 o1 仅仅是“推理模型的 GPT-2”,黄仁勋表示“给你加速 50 倍”

3:38 新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式

4:46 全球开源大模型新王!阿里Qwen2.5来了,性能跨量级超Llama3.1

6:13 LinkedIn 在更新服务条款前抓取用户数据进行训练

7:26 Fal.ai,承载媒体生成 AI 模型,获得 a16z 等公司的 2300 万美元融资

8:40 研究称生成式 AI 耗水量巨大:使用 GPT-4 生成 100 字文本需消耗 3 瓶水

文字版

#英伟达高级科学家Jim Fan近日预测,机器人领域将在未来2-3年内迎来类似GPT-3的突破性时刻。Fan曾在斯坦福大学师从人工智能专家李飞飞,目前领导英伟达的AI研究,致力于开发人形机器人基础模型“Project Groot”。

Fan认为,机器人基础模型研究将取得重大进展,但要进入日常生活还需时日。他强调,人形机器人的优势在于能适应为人类设计的环境,理论上可执行人类所有任务。英伟达正结合互联网数据、模拟数据和真实机器人数据来开发AI,并研发“Eureka”等技术,利用语言模型自动生成机器人训练奖励函数。

此外,Fan的团队还在探索虚拟环境中的AI代理,如视频游戏,并致力于开发能同时控制虚拟和实体代理的统一模型。他指出,机器人普及还需解决成本、安全和法规等问题。

#AI会议记录工具Fathom宣布完成了1700万美元的A轮融资,由Telescope Partners领投,其中200万美元来自用户通过众筹平台Wefunder的投资。自2020年成立以来,Fathom的营收增长了90倍,使用量增长了20倍。公司提供丰富的免费计划,并已与8500多家公司合作使用HubSpot集成。Fathom的CEO和联合创始人Richard White表示,公司自始至终围绕AI技术构建,专注于构建可靠的基础设施和易于使用的产品。Fathom使用自己的模型或至少是针对开放模型的微调版本,拥有专门团队进行模型实验和开发。公司已添加了自动创建行动项和后续邮件草稿等功能,以及“询问Fathom”聊天机器人等面向团队的功能。White表示,Fathom的愿景是成为公司领导层的中央情报源,而不仅仅是支持单一会议平台。新资金将帮助Fathom开发更多集成功能,使用AI代理执行更多任务,并直接与CRM系统等接口。

#OpenAI CEO萨姆·阿尔特曼和英伟达创始人黄仁勋近日出席T-Mobile活动,分享了对AI发展的看法。阿尔特曼提到,新推出的o1模型仅为“推理模型的GPT-2”,并预测未来几个月将有重大改进。他将AI发展划分为五个级别,目前已达到L2推理者阶段,L3智能体即将到来。

黄仁勋则表示,英伟达最新的Blackwell架构GPU能够将o1模型的响应时间从几分钟缩短至几秒,推理性能提升50倍。他预计未来每个人都将拥有终身陪伴的AI助手,类似于《星球大战》中的R2-D2机器人,并指出AI正在设计下一代AI,其进展速度达到了摩尔定律的平方。

#OpenAI可能于9月24日进一步推广ChatGPT的高级语音模式。科技媒体testingcatalog发现,OpenAI更新了高级语音模式FAQ页面,代码中出现了"hasSeenAdvancedVoice/2024-09-24"的字符串,暗示将邀请部分移动用户体验该功能。

此外,macOS版ChatGPT应用也有新进展,语音模式界面中ChatGPT的图标被替换为随语音播放而动的天空动画。语音页面新增了快速访问语音选择功能的按钮,目前仍只有四种语音可选,界面设计似乎为未来支持更多语音做准备。

有网友发现FAQ页面提到,OpenAI已向少数Alpha高级语音用户启用语音聊天访问记忆的权限。今年7月,OpenAI首次向部分ChatGPT Plus用户开放了高级语音模式,用户可以体验到GPT4o的超现实音频响应。

#阿里云在云栖大会上推出了全球最强的开源大模型Qwen2.5-72B,其性能超过了Meta公司的Llama3.1-405B。Qwen2.5系列开源了超过100个模型,包括语言、视觉语言、编程和数学模型等。旗舰模型Qwen2.5-72B在多项权威测试中表现优异,支持128K上下文长度和29种语言。其视觉模型Qwen2-VL-72B能够理解超过20分钟的长视频,视觉理解能力超过GPT4。数学模型Qwen2.5-Math在相关任务中也优于GPT4和Claude 3.5等专有模型。

阿里云CTO周靖人宣布,截至2024年9月中旬,通义千问开源模型的累计下载量突破4000万,衍生大模型超过5万个,通过阿里云服务的客户已超过30万。2024年第二季度,阿里云AI相关产品收入实现三位数增长。

阿里云坚持自研大模型和开源开放策略,推动通义千问进入全球AI竞争的核心圈,随着开源模型性能的不断提升,行业正迎来新的分水岭时刻。

#领英被指在未更新其隐私政策的情况下,使用用户数据训练人工智能模型。美国用户可以在设置中选择退出数据抓取,但欧盟、欧洲经济区和瑞士的用户则没有这一选项,这可能是由于这些地区严格的数据隐私规则。领英表示,它正在训练自己的AI模型,包括写作建议和帖子推荐的模型,并可能由其母公司微软等其他供应商训练。领英声称使用隐私增强技术来限制用于AI训练的数据中的个人信息。用户可以通过领英的“数据隐私”设置来选择退出数据抓取。非营利组织Open Rights Group呼吁英国信息专员办公室调查领英及其他默认使用用户数据训练AI的社交网络。爱尔兰数据保护委员会表示,领英已通知其将发布全球隐私政策的澄清,包括一个退出设置,但欧盟/欧洲经济区成员的数据不会被用于训练或微调这些模型。

#Fal.ai,一个面向开发者的AI生成音视频和图像的平台,宣布完成了2300万美元的融资,其中包括由Kindred Ventures领投的1400万美元A轮融资和由Andreessen Horowitz领投的900万美元种子轮融资。该平台由Burkay Gur和Gorkem Yurtseven于2021年共同创立,提供私有计算管理和开源模型API,支持生成图像、音频和视频。Fal.ai是首批支持Black Forest Labs的Flux模型的平台之一,该模型为X公司的聊天机器人Grok提供图像生成功能。尽管面临版权和内容审核的挑战,Fal.ai已吸引了包括Perplexity、零售和电子商务企业客户以及Photoroom、Freepik和PlayHT等在内的付费用户。公司目前年收入接近1000万美元,A轮融资后估值达到8000万美元。Fal.ai计划将大部分融资用于升级其推理优化产品,并建立专注于模型优化的研究团队。

#最新研究显示,生成式人工智能的耗水量惊人。加州大学河滨分校的研究发现,使用GPT4生成100字文本需消耗约1.4升水,相当于3瓶矿泉水。这些水主要用于冷却运行AI模型的服务器,耗水量因地区而异,得州最低,华盛顿州最高。

此外,AI还消耗大量电力。如果十分之一的美国上班族每周使用一次GPT4,年耗电量将相当于华盛顿特区20天的用电量。科技巨头Meta在训练大型语言模型LLaMA-3时,耗水量高达2200万升,相当于164名美国人一年的用水量。

对此,OpenAI、Meta、谷歌和微软等公司表示将致力于减少环境需求,但未给出具体方案。微软称正在开发完全不耗水的冷却方法,但细节尚不明确。随着AI技术的快速发展和广泛应用,其环境影响正引起越来越多的关注。



以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!