0:00 微软开源爆火1.58bit大模型推理框架!千亿参数模型量化后单CPU可跑,速度每秒5-7个token
1:31 开源文生图 AI 重磅选手上新:Stable Diffusion 3.5 最强全家桶登场、消费级硬件上“开箱即用”
2:22 消息称微软亚洲研究院前首席研究经理谭旭加入月之暗面,研发类 GPT-4o 端到端语音模型
3:36 消息称 OPPO 将收购大模型创业公司波形智能,纳入后者 CEO 姜昱辰
4:30 商汤 CEO 徐立内部信曝光,确定“三位一体”新 AI 战略
5:49 印度的Neysa获3000万美元融资,与全球AI超级巨头竞争
7:31 Claude重磅升级,可以像人一样控制电脑了!
8:43 xAI,埃隆·马斯克的AI初创公司,推出API
9:47 微软和 OpenAI 将向媒体提供 1000 万美元资助,推动其使用 AI 工具
11:06 超万名文艺界人士联署警告 AI 公司:对生计造成不公正的重大威胁
文字版
#微软开源了一个名为 **bitnet.cpp** 的1bit大模型推理框架,旨在将千亿参数模型量化后在单个CPU上运行,推理速度可达到每秒5-7个token。该框架基于论文《The Era of 1-bit LLMs》,通过将传统的16位浮点数参数转换为三进制表示({-1, 0, 1}),显著减少了存储空间和计算资源的需求。
在性能方面,bitnet.cpp在ARM CPU上可实现1.37至5.07倍的加速,能耗降低55.4%至70.0%;在x86 CPU上,加速效果介于2.37至6.17倍之间,能耗减少71.9%至82.2%。这一技术有望使千亿参数模型在单CPU上运行,接近人类的阅读速度。
该项目开源不到一周,GitHub上已获得7.9k个星标。需要注意的是,1bit LLM目前仍需从头训练模型,而不能直接量化现有模型。
#Stability AI公司推出了**Stable Diffusion 3.5**系列模型,包含三个版本:**Large**、**Large Turbo**和**Medium**。
- **Large版本**:拥有80亿参数,适用于高分辨率专业应用。
- **Large Turbo**:精简版,可在4步内快速生成高质量图像。
- **Medium版本**:将于10月29日发布,拥有25亿参数,旨在在消费级硬件上“开箱即用”。
Stability AI采用了宽松的社区许可政策,这些模型可供非商业用途免费使用,年收入低于100万美元的企业也可使用,超过此门槛的企业需获得单独许可。此外,Stability AI表示将继续改进此次发布的模型。
#微软亚洲研究院前首席研究经理谭旭已于8月加入大模型创业公司**月之暗面**,负责研发端到端语音模型。他在语音、音频和视频内容生成方面经验丰富,论文引用量超过一万次。谭旭的加入旨在帮助月之暗面打造类似于OpenAI的**GPT4o**的语音体验,GPT4o是一种多模态大模型,具有更低的延时和可随时打断的特性。
月之暗面的多模态研究始于去年10月,目前团队约有10人在研发视频模型。与传统的语音方案相比,端到端语音模型省去了“语音转文字再转语音”的中间过程,从而压缩机器响应时间,提高交互的自然度。
此外,月之暗面正在升级其Kimi AI助手,最近推出的Kimi探索版搜索量比普通版增强了10倍,可精读500个页面。公司还开放了平台上下文缓存存储服务,并将费用降低了50%。
#手机厂商OPPO正计划收购大模型创业公司波形智能,波形智能CEO姜昱辰将加入OPPO团队。尽管公司将被收购,但其产品仍将正常运营。
波形智能专注于中文创作,旗下有自研大模型"Weaver"和写作辅助工具"蛙蛙写作2.0",主要服务于专业小说作者和自媒体运营者,提升内容创作效率。姜昱辰是波形智能的创始人兼CEO,背景包括浙江大学和苏黎世联邦理工大学的学历。他表示,Weaver大模型经过50B tokens的高质量中文内容预训练,能够生成更具人性化的写作内容。
波形智能目前的盈利模式主要依赖订阅会员和单次服务计费。
#商汤科技迎来了十周年庆。公司董事长兼CEO徐立近日发布内部信,首次披露了公司最新确立的"大装置-大模型-应用"三位一体战略。他指出,传统AI 1.0和生成式大模型AI 2.0的主要区别在于成本结构的变化:在AI 1.0时代,研发人员投入是主要成本,而在AI 2.0时代,算力资源投入成为主要成本。
徐立强调,商汤的核心战略是实现算力大装置、大模型和应用之间的无缝集成,以应用驱动模型,以模型带动算力优化。公司致力于成为"最懂算力的大模型服务商"和"最懂大模型的算力服务商"。在传统AI领域,商汤将集中资源,利用视觉感知和多模态模型的核心能力,同时服务国内外市场。
为了配合新战略,商汤将构建更加集中和高效的组织架构,推动资源的集约化投入,加快组织和管理的年轻化进程。徐立呼吁员工重拾创业初心,共同探索"科技原创和产业价值闭环"的道路。
#随着印度AI市场需求的增长,由资深技术企业家Sharad Sanghi领导的印度初创公司Neysa,通过提供AI解决方案给本地和跨国企业,抓住了这一增长机遇。Neysa提供基于客户需求的AI和机器学习基础设施及平台服务,并设有专门的机器学习运营和基础设施咨询团队,帮助客户优化其基础设施规模和定制模型。Neysa最初作为基础设施服务提供商,于7月推出了旗舰平台Velocis,提供按需计算基础设施访问。公司计划在年底前推出开发者平台和推理即服务,并正在开发用于更好管理基础设施和安全AI工作负载的“可观测性”功能。Neysa的差异化在于其模型的“灵活性”,提供公有云和私有集群服务,所有平台均基于开源平台构建,避免客户锁定。Neysa已获得3000万美元A轮融资,由现有投资者NTTVC、Z47和Nexus Venture Partners共同领投,将用于增强基础设施、加强研发和扩大市场推广。公司目前拥有约12个付费客户,并运营约六个大型概念验证项目,70%的客户选择私有集群,其余30%使用公有云。Neysa计划在下一轮融资后进入全球市场,目前已开始相关谈判,预计在未来6至9个月内完成,且融资额将是目前的数倍。
#Claude大模型推出了新功能“Computer Use”,使AI能够像人类一样操控电脑。用户只需下达指令,Claude便可自主完成填表、网页搜索、编程等复杂任务,无需人工干预。例如,Claude可以在CRM系统中搜索数据并填入表格,或根据用户需求规划旅行路线并添加到日历。在编程方面,Claude能够自动生成代码、解决环境问题并运行程序。
此外,Anthropic公司升级了Claude 3.5 Sonnet模型,并推出了更快的Claude 3.5 Haiku版本。新版Sonnet在编程能力上显著提升,SWE-bench得分从33.4%提高到49.0%,超越了包括OpenAI在内的多个公开模型。而Haiku版本则在保持高速的同时,在多项基准测试中超越了上一代强模型Claude 3 Opus。
Claude 3.5 Sonnet已对所有用户开放,Haiku版本将于本月底通过多个云平台提供服务。
#Elon Musk的xAI公司推出了Grok AI模型的API,名为“grok-beta”,目前功能相对基础。该API定价为每百万输入令牌5美元,支持将Grok模型与外部工具连接。尽管文档提及了Grok 2和Grok mini,但具体“grok-beta”对应哪个版本尚不明确。用户在使用过程中遇到了支付问题。Grok模型已在X平台上得到广泛应用,包括生成图片、新闻摘要等,但准确性有待提高。xAI正努力追赶OpenAI和Anthropic等竞争对手,今年5月完成了60亿美元的融资。Musk认为X平台的数据将为xAI提供优势,但特斯拉股东对此表示不满,认为Musk将资源从特斯拉转移到了xAI。此外,xAI的孟菲斯数据中心因未授权涡轮机被指责加剧雾霾,公司计划明年升级,但需获得批准。
#微软与OpenAI联合推出了一项价值1000万美元的资助计划,旨在鼓励媒体机构在新闻编辑室中应用人工智能工具。该计划包括250万美元的现金和250万美元的软件与企业信用额度。首批受益的媒体包括《Newsday》和《星论坛报》等五家机构,它们将获得为期两年的研究员支持,专注于开发和实施基于微软Azure和OpenAI技术的AI工具。
此举发生在两家公司面临多起版权诉讼的背景下,包括来自《纽约时报》的法律挑战。尽管如此,微软和OpenAI仍在积极推进与媒体的合作。
OpenAI的首席知识产权官Tom Rubin表示,AI技术有望在新闻研究、调查和分发等方面为记者提供支持。计划探索的AI应用包括内容转录、摘要生成,以及为档案创建对话式搜索工具等。此项合作也得到了Lenfest媒体研究所的支持,旨在促进地方媒体的发展。未来,还将有三家媒体机构获得类似资助,以推动AI在新闻行业的应用。
#超过一万名文艺界人士联合签署声明,警告人工智能公司未经许可使用他们的作品是对艺术家生计的"不公正的重大威胁"。签署者包括瑞典ABBA乐队成员、美国演员朱丽安·摩尔、英国摇滚乐队"电台司令"主唱等知名艺术家,以及诺贝尔文学奖得主石黑一雄。多个创意产业组织和公司也参与联署,如美国音乐家联合会和环球音乐集团等。
声明发起人、英国作曲家埃德·纽顿-雷克斯指出,AI公司在人力和计算资源上投入巨资,却希望免费获取训练数据,这忽视了创作者的价值和心血。目前,多位知名作家正在起诉ChatGPT开发商OpenAI侵犯版权,艺术家们也对图像生成技术公司提起诉讼,大型唱片公司如索尼音乐则起诉了AI音乐创作公司。
还没有评论,快来发表第一个评论!