Daily-AI | 9.04 | MiniMax不藏了,大秀视频/语音/文本全模态模型家族

Daily-AI | 9.04 | MiniMax不藏了,大秀视频/语音/文本全模态模型家族

00:00
11:37

0:00 IDC 首次发布移动端 AI 大模型应用报告:百度文心一言发展较全面、抖音豆包用户活跃度表现出色

1:08 SparkLabs关闭5千万美元基金以支持人工智能创业公司

3:02 Clearview AI因荷兰监管机构考虑追究高管个人责任而遭遇迄今为止最大的GDPR罚款

3:58 英伟达 GeForce RTX 显卡包装标志变更,添加 AI 相关字样

4:59 国内最大线上运动平台,如何靠AI起飞?

6:33 OpenAI ChatGPT 被曝将新增 8 种新语音:更自然表达狗叫等动物声音

7:20 谷歌 DeepMind 展示 GenRM 技术:微调 LLMs 作为奖励模型,提升生成式 AI 推理能力

8:43 OpenAI首颗芯片曝光:台积电1.6nm,为Sora定制

9:46 MiniMax不藏了,大秀视频/语音/文本全模态模型家族,“每天与世界交互30亿次”


文字版

#在移动端AI大模型应用领域的最新评估中,IDC发布了其首份针对市场竞争力的分析报告,其中三款产品因其独特的优势而获得了高度评价。百度的文心一言以其市场影响力、用户粘性和场景创新能力脱颖而出,显示出其在上半年发展的全面性。而抖音旗下的聊天机器人豆包,以其在市场影响力、用户活跃度和用户粘性方面的卓越表现受到好评。昆仑万维的天工则因功能丰富度与搜索引擎的紧密结合,获得了市场的广泛赞誉。此次评估还涵盖了其他几款应用,它们在知识探索、个性化生活顾问、逻辑能力、语音交互和决策方向等各自领域展现了优势。

#早期风险投资公司SparkLabs宣布关闭了一个新的5000万美元基金——AIM AI Fund,该基金将投资于其在沙特阿拉伯的AIM-X加速器中的AI初创企业,以及其他全球AI初创企业。这一举措突显了近年来围绕人工智能的更大趋势,尤其是生成性AI的兴起,导致该领域的初创企业激增,投资者也在寻找下一个OpenAI。AIM-X是SparkLabs今年早些时候在沙特启动的一个专注于AI的创业加速器,作为其AI任务的一部分,这是一个为期五年的国家倡议,旨在加强AI技术。截至2024年3月,全球AI独角兽数量超过210家,估值超过10亿美元。尽管AI是一个全球现象,但美国在2013年至2022年间创立的AI初创企业数量最多,达到4633家。SparkLabs的新基金中约35%将用于支持加速器参与者,其余65%将用于在沙特以外地区进行A轮和B轮投资。SparkLabs的联合创始人兼合伙人Bernard Moon表示,加速器将寻求在沙特或中东和北非地区的投资中获得少数股权,大约10%-20%。大部分资金将投资于美国等地的最佳AI初创企业。加速器参与者的平均投资额为20万美元,但在特殊情况下可高达50万美元。A轮和B轮投资将在100万美元至500万美元之间。SparkLabs计划从该基金中投资50至70家公司。

#美国面部识别初创公司Clearview AI因违反欧盟《通用数据保护条例》(GDPR),在荷兰被处以3050万欧元的罚款,这是该公司在欧洲面临的最大隐私罚款。荷兰数据保护机构(Autoriteit Persoonsgegevens, AP)确认,Clearview AI的数据库中包含荷兰公民的图像,而这些图像是在未经同意的情况下从互联网上抓取的。此外,AP还警告称,如果Clearview AI继续不遵守规定,将面临额外的510万欧元罚款。Clearview AI辩称其在荷兰和欧盟没有业务,不受GDPR管辖,且荷兰监管机构无法执行罚款。荷兰监管机构表示,正在探索追究公司管理层个人责任的可能性,以确保公司停止违法行为。

#英伟达近期对其GeForce RTX系列显卡的官方标志进行了更新,新增了“Powering Advanced AI”(为先进 AI 提供动力)的字样,这一变更不仅体现了英伟达在AI加速领域的领军地位,也意在向消费者更明确地展示其产品在AI技术支持方面的实力。新的标志将被应用于显卡、台式整机以及笔记本电脑的零售包装上,让消费者在购买这些产品时能够一目了然地看到英伟达对AI技术的重视和投入。此外,英伟达最近公布的财务报告显示,其第二财季营收达到了300亿美元,同比增长122%,超出市场预期,预计第三财季营收将达到325亿美元,反映出公司业绩的强劲增长和市场对其产品的高度认可。

#在近日的一篇报道中,国内最大的线上运动平台Keep展现了其如何借助AI技术实现飞跃式的发展。随着大模型技术的应用日趋广泛,其在运动领域的落地也表现出色。特别是在最近的巴黎奥运会上,AI的应用不仅帮助运动员获得了更加精准的训练与身体状况评估,还为比赛的公平性提供了有力的保障。在此基础上,科技公司与运动品牌纷纷推出了以AI为核心的智能运动装备,例如三星和谷歌推出的智能指环和手表,进一步将AI技术应用于运动和健身场景之中。

Keep作为国内领先的线上运动平台,其2024年上半年的营收达到10.37亿元,显示出其业务的强劲增长。Keep通过线上内容和智能硬件的结合,构建了覆盖线上到线下、软件到硬件的全景运动服务图,其中智能化产品与内容成为其重要的增长引擎。营收的稳定增长得益于“运动+科技”的双引擎驱动,其中线上内容的精准定位和智能硬件的技术创新,共同推动了Keep商业价值的持续增长。

随着AI技术在运动健身领域的深入应用,Keep不仅在用户体验上实现了质的飞跃,而且在商业模式上也展现出了强大的竞争力。

#OpenAI ChatGPT即将迎来一次重大更新,据科技媒体testingcatalog通过逆向工程ChatGPT应用发现,未来这款人工智能聊天机器人将新增8种新语音,每种语音都带有独特的代号。这些新增的语音不仅能够更自然地表达动物叫声等非语言声音,还能在朗读加粗或斜体文字时传达或强调特定的情绪,从而让ChatGPT的声音更加自然和富有表现力。不过,值得注意的是,这些新增的语音仍然属于TTS(文本到语音)范畴,并可能与目前处于alpha阶段的高级语音模式无关。

#谷歌的人工智能研究部门DeepMind,最近推出了一个名为GenRM的技术。这一技术的目的是通过微调大型语言模型(LLMs),作为奖励模型来提升这些模型的推理能力。在目前AI领域,提高LLMs性能的常见做法是使用一种被称作Best-of-N的方式,即生成多个候选解决方案后,通过一个验证器来评估并挑选出最佳方案。然而,这种方法通常无法充分利用LLMs的文本生成潜力。为了解决这一问题,DeepMind提出利用下一个token预测目标来训练验证器,这使得验证器在执行验证的同时也能生成解决方案。GenRM的出现,相比传统的验证方法,显示了多项优势:它能无缝集成指令调整、支持思维链推理,且能通过多数投票在额外的推理时间内进行更深入的计算。在算法和小学数学推理任务的测试中,GenRM验证器的性能显著优于传统的判别式验证器和LLM-as-a-Judge验证器,其在解决问题上的成功率提高了16%至64%。

#OpenAI首颗自研AI芯片的详细情况终于曝光。这颗芯片采用台积电最先进的1.6纳米(A16)制程技术,特别为Sora视频应用定制。这一消息一出,立即引发了业界的广泛热议。早在年初,有报道称OpenAI计划与台积电合作建设晶圆厂来推进其自研芯片项目,尽管后续详细进展未见报道,但OpenAI对于自研AI芯片的长期需求显而易见,已加入预订台积电A16产能的行列。A16制程技术,作为台积电目前最先进的节点,预计将大幅提升运算速度并降低功耗,为OpenAI及其合作伙伴苹果的未来产品提供强大的硬件支持。此外,有网友猜测,基于OpenAI与苹果的良好合作关系,Sora很可能最终被集成进苹果的产品中。

#MiniMax终于揭开神秘面纱,公开展示了其全模态模型家族,标志着它在视频、语音、文本等全方位的AI技术上取得了重大突破。这家国内创业公司在自成立以来的近1000天内,始终保持低调,但其技术进展和产品实力却在不断积累。此次大公开,MiniMax不仅展示了其模型家族的强大能力,还公开了惊人的数据:每天30亿次的交互量,包括3万亿文本tokens、2000万张图片及7万小时的生成语音。

MiniMax此次发布的模型覆盖了视频、音乐、语音和万亿多模态四大类,其中视频模型和语音模型更是成为焦点。视频模型abab-video-1在生成视频内容上展现了高质量的画面和连贯性,语音模型abab-speech-1则能够在短时间内生成接近真人的多语种语音,这两项技术的突破意味着MiniMax在处理更复杂任务和提升计算效率上取得了显著进展。

此外,MiniMax的技术创新也得到了体现。它通过降低模型错误率、实现无限长输入输出和多模态处理,提升了用户体验。特别是在MoE(混合专家模型)和Linear Attention技术的应用上,MiniMax实现了模型性能和效率的大幅提升,这些技术成果为MiniMax的产品每天产生30亿次交互和积累超过6000万用户提供了强大支持。




以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!