Daily-AI | 9.2 | 开源大模型新王！阿里Qwen2.5来了，性能跨量级超Llama3.1

00:00

10:01

0:00 “终结者”雏形将登场，英伟达预测未来 2-3 年机器人领域迎来“GPT-3 时刻”

1:24 人工智能笔记工具Fathom融资1700万美元

2:42 阿尔特曼称 o1 仅仅是“推理模型的 GPT-2”，黄仁勋表示“给你加速 50 倍”

3:38 新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式

4:46 全球开源大模型新王！阿里Qwen2.5来了，性能跨量级超Llama3.1

6:13 LinkedIn 在更新服务条款前抓取用户数据进行训练

7:26 Fal.ai，承载媒体生成 AI 模型，获得 a16z 等公司的 2300 万美元融资

8:40 研究称生成式 AI 耗水量巨大：使用 GPT-4 生成 100 字文本需消耗 3 瓶水

文字版

#英伟达高级科学家Jim Fan近日预测，机器人领域将在未来2-3年内迎来类似GPT-3的突破性时刻。Fan曾在斯坦福大学师从人工智能专家李飞飞，目前领导英伟达的AI研究，致力于开发人形机器人基础模型“Project Groot”。

Fan认为，机器人基础模型研究将取得重大进展，但要进入日常生活还需时日。他强调，人形机器人的优势在于能适应为人类设计的环境，理论上可执行人类所有任务。英伟达正结合互联网数据、模拟数据和真实机器人数据来开发AI，并研发“Eureka”等技术，利用语言模型自动生成机器人训练奖励函数。

此外，Fan的团队还在探索虚拟环境中的AI代理，如视频游戏，并致力于开发能同时控制虚拟和实体代理的统一模型。他指出，机器人普及还需解决成本、安全和法规等问题。

#AI会议记录工具Fathom宣布完成了1700万美元的A轮融资，由Telescope Partners领投，其中200万美元来自用户通过众筹平台Wefunder的投资。自2020年成立以来，Fathom的营收增长了90倍，使用量增长了20倍。公司提供丰富的免费计划，并已与8500多家公司合作使用HubSpot集成。Fathom的CEO和联合创始人Richard White表示，公司自始至终围绕AI技术构建，专注于构建可靠的基础设施和易于使用的产品。Fathom使用自己的模型或至少是针对开放模型的微调版本，拥有专门团队进行模型实验和开发。公司已添加了自动创建行动项和后续邮件草稿等功能，以及“询问Fathom”聊天机器人等面向团队的功能。White表示，Fathom的愿景是成为公司领导层的中央情报源，而不仅仅是支持单一会议平台。新资金将帮助Fathom开发更多集成功能，使用AI代理执行更多任务，并直接与CRM系统等接口。

#OpenAI CEO萨姆·阿尔特曼和英伟达创始人黄仁勋近日出席T-Mobile活动，分享了对AI发展的看法。阿尔特曼提到，新推出的o1模型仅为“推理模型的GPT-2”，并预测未来几个月将有重大改进。他将AI发展划分为五个级别，目前已达到L2推理者阶段，L3智能体即将到来。

黄仁勋则表示，英伟达最新的Blackwell架构GPU能够将o1模型的响应时间从几分钟缩短至几秒，推理性能提升50倍。他预计未来每个人都将拥有终身陪伴的AI助手，类似于《星球大战》中的R2-D2机器人，并指出AI正在设计下一代AI，其进展速度达到了摩尔定律的平方。

#OpenAI可能于9月24日进一步推广ChatGPT的高级语音模式。科技媒体testingcatalog发现，OpenAI更新了高级语音模式FAQ页面，代码中出现了"hasSeenAdvancedVoice/2024-09-24"的字符串，暗示将邀请部分移动用户体验该功能。

此外，macOS版ChatGPT应用也有新进展，语音模式界面中ChatGPT的图标被替换为随语音播放而动的天空动画。语音页面新增了快速访问语音选择功能的按钮，目前仍只有四种语音可选，界面设计似乎为未来支持更多语音做准备。

有网友发现FAQ页面提到，OpenAI已向少数Alpha高级语音用户启用语音聊天访问记忆的权限。今年7月，OpenAI首次向部分ChatGPT Plus用户开放了高级语音模式，用户可以体验到GPT4o的超现实音频响应。

#阿里云在云栖大会上推出了全球最强的开源大模型Qwen2.5-72B，其性能超过了Meta公司的Llama3.1-405B。Qwen2.5系列开源了超过100个模型，包括语言、视觉语言、编程和数学模型等。旗舰模型Qwen2.5-72B在多项权威测试中表现优异，支持128K上下文长度和29种语言。其视觉模型Qwen2-VL-72B能够理解超过20分钟的长视频，视觉理解能力超过GPT4。数学模型Qwen2.5-Math在相关任务中也优于GPT4和Claude 3.5等专有模型。

阿里云CTO周靖人宣布，截至2024年9月中旬，通义千问开源模型的累计下载量突破4000万，衍生大模型超过5万个，通过阿里云服务的客户已超过30万。2024年第二季度，阿里云AI相关产品收入实现三位数增长。

阿里云坚持自研大模型和开源开放策略，推动通义千问进入全球AI竞争的核心圈，随着开源模型性能的不断提升，行业正迎来新的分水岭时刻。

#领英被指在未更新其隐私政策的情况下，使用用户数据训练人工智能模型。美国用户可以在设置中选择退出数据抓取，但欧盟、欧洲经济区和瑞士的用户则没有这一选项，这可能是由于这些地区严格的数据隐私规则。领英表示，它正在训练自己的AI模型，包括写作建议和帖子推荐的模型，并可能由其母公司微软等其他供应商训练。领英声称使用隐私增强技术来限制用于AI训练的数据中的个人信息。用户可以通过领英的“数据隐私”设置来选择退出数据抓取。非营利组织Open Rights Group呼吁英国信息专员办公室调查领英及其他默认使用用户数据训练AI的社交网络。爱尔兰数据保护委员会表示，领英已通知其将发布全球隐私政策的澄清，包括一个退出设置，但欧盟/欧洲经济区成员的数据不会被用于训练或微调这些模型。

#Fal.ai，一个面向开发者的AI生成音视频和图像的平台，宣布完成了2300万美元的融资，其中包括由Kindred Ventures领投的1400万美元A轮融资和由Andreessen Horowitz领投的900万美元种子轮融资。该平台由Burkay Gur和Gorkem Yurtseven于2021年共同创立，提供私有计算管理和开源模型API，支持生成图像、音频和视频。Fal.ai是首批支持Black Forest Labs的Flux模型的平台之一，该模型为X公司的聊天机器人Grok提供图像生成功能。尽管面临版权和内容审核的挑战，Fal.ai已吸引了包括Perplexity、零售和电子商务企业客户以及Photoroom、Freepik和PlayHT等在内的付费用户。公司目前年收入接近1000万美元，A轮融资后估值达到8000万美元。Fal.ai计划将大部分融资用于升级其推理优化产品，并建立专注于模型优化的研究团队。

#最新研究显示，生成式人工智能的耗水量惊人。加州大学河滨分校的研究发现，使用GPT4生成100字文本需消耗约1.4升水，相当于3瓶矿泉水。这些水主要用于冷却运行AI模型的服务器，耗水量因地区而异，得州最低，华盛顿州最高。

此外，AI还消耗大量电力。如果十分之一的美国上班族每周使用一次GPT4，年耗电量将相当于华盛顿特区20天的用电量。科技巨头Meta在训练大型语言模型LLaMA-3时，耗水量高达2200万升，相当于164名美国人一年的用水量。

对此，OpenAI、Meta、谷歌和微软等公司表示将致力于减少环境需求，但未给出具体方案。微软称正在开发完全不耗水的冷却方法，但细节尚不明确。随着AI技术的快速发展和广泛应用，其环境影响正引起越来越多的关注。

以上内容来自专辑

主播信息

LexiByte

加关注

还没有评论，快来发表第一个评论！

Daily-AI | 9.2 | 开源大模型新王！阿里Qwen2.5来了，性能跨量级超Llama3.1

AI早知到|每日AI新闻

LexiByte

将开源贯彻到底阿里云发布开源模型Qwen2

阿里通义Qwen2成斯坦福大模型榜单最强开源模型

通义千问开源Qwen2.5 开源模型累计下载量突破4000万

阿里CEO吴泳铭：阿里巴巴即将开源720亿参数大模型

阿里云放大招！AI界最强开源大模型来了（讲解版）|E1205

Daily-AI | 9.2 | 开源大模型新王！阿里Qwen2.5来了，性能跨量级超Llama3.1

AI早知到|每日AI新闻

LexiByte

将开源贯彻到底 阿里云发布开源模型Qwen2

阿里通义Qwen2成斯坦福大模型榜单最强开源模型

通义千问开源Qwen2.5 开源模型累计下载量突破4000万

阿里CEO吴泳铭：阿里巴巴即将开源720亿参数大模型

阿里云放大招！AI界最强开源大模型来了（讲解版）|E1205

将开源贯彻到底阿里云发布开源模型Qwen2