通过输入文字让猩猩戴上太阳镜,让正在走路的美女一键换装,又或是让马斯克穿上宇航服在太空遨游,这样的文字转视频玩法你见过吗?
11月29日,美国AI初创公司PikaLabs发布了第一个文字生成视频产品Pika1.0,只需要输入几个关键词就可生成相关形象视频,且画质完全能够与大制作电影相媲美,网友评价其“未来能让动画师失业”。而这么一个现象级的AI产品问世只花了4个人不到1年的时间。
PikaLabs于今年4月成立,目前已完成A轮融资,融资额达5500万美元,估值超2亿美元,其使用用户超过50万,每周生成近百万视频内容。
01
海外AI的中国班底
尽管这家公司是在海外创办,但目前公司已知的4位创始人中,有2位都来自中国,她们是郭文景和陈思禹,两人都毕业于杭州第二中学,又都曾是斯坦福大学AI Lab项目的博士生。
今年4月,她们一起从斯坦福退学成立了这家初创公司,不到7个月的时间,Pika就结束了测试。很难想象这样炙手可热的AI视频公司背后仅有4人,且用了不到1年的时间就将Pika推入聚光灯下。
作为PikaLabs创立的核心人物,郭文景是杭州第二中学第一个被哈佛大学录取的学生,也是浙江省第一个被哈佛本科提前录取的学生。在大二期间,她曾入职Meta AI Research,又先后在微软、谷歌等公司实习过。在哈佛大学取得数学本科和计算机硕士学位后,郭文景前往斯坦福大学读博。这样的履历,不可不谓之优秀。
另一位创始人陈思禹则是信息学和物理双料国家集训队成员,后被保送到北大。
02
功能炸裂的文生视频工具俘获硅谷大咖
Pika初代版本功能十分炸裂,不仅能够根据简单文字生成卡通、3D动画、动漫和电影,更改视频的宽高比,更重要的是还能对画面中的元素进行实时修改和编辑,这也是Pika目前最突出的功能。这些能力不仅颠覆了传统视频制作,且综合效果不输好莱坞大片。
于是,各式各样的种草文如雨后春笋般冒出,在线教你如何使用这款全新的AI视频生成软件:“有想法就能拍电影”“有手就会的视频大师,用AI搞钱更轻松了!”“电影神器Pika来了,赶紧收藏!”“零基础教你成视频达人”……
根据Pika官方的说法,“影片作为娱乐的重要形式,高品质影片制作仍然相当困难,我们致力于让每个人使用Pika制作精彩影片。”而它确实也做到了让受众免费且无限次数的使用。
Pika以其优越的性能被众多动画设计师评为“目前最好用的文字转视频AI工具。”并戏称,“如果你生成的效果不理想,那一定是你操作的问题。”唯一美中不足的是Pika生成的视频只有3秒钟。
刚刚上线不到一周的Pika不仅得到许多动画设计师的认可,更是俘获了一众硅谷大咖的芳心,纷纷为其投资。OpenAI创始人之一的安德烈·卡帕西评价其“影响令人难以置信,每个人都有机会成为多模态梦想的导演,就像《盗梦空间》中的建筑师一样。” Github CEO 纳特·弗里德曼表示,自己对Pika团队使用单块GPU就制作出的初期模型,印象非常深刻。
03
Pika棋高一招还是Gen-2更胜一筹
其实早在Pika之前,文生视频工具就已崭露头角。Runway是一家专注于提供各种AI影像编辑工具的公司,也是《瞬息全宇宙》幕后技术公司,一直被认为是AI生成视频领域的翘楚,此前还获谷歌投资,以加速AI在影视创作中的应用。
其在今年中旬推出的Gen-2被认为是当时AI视频领域最前沿的模型,能够通过文字、图片等方式生成4s左右的视频,通过付费还可以延长视频时间。然而,Pika的横空出世无疑成为了Gen-2的最强竞品,它的免费策略无疑是吸引用户的一大筹码,为不愿在Gen-2氪金的玩家提供了一个好去处。
尽管大多数人处在种草的状态,一些使用者还是认为Pika并不像此前宣传视频中所展现的那样惊艳。一位长期关注AIGC领域的动画艺术家小陈告诉记者,Pika和Gen-2相比,“目前的版本还是很差,视频效果不尽如人意,甚至不如用midjourney一帧一帧拼出来的效果好。”另一位AIGC创作爱好者胡平则认为,“两者都是初级产品,使用效果也都很一般,未来的发展还有待观察。”
都是文字转视频工具,Pika比之Gen-2到底如何?其实从目前的使用情况来看,两者的功能相差无几,都包含了文字转视频、图片转视频、图文转视频三种模式。虽然Pika仍提供免费服务,但限制了视频输出的分辨率,而Gen-2则提供更多高级功能,还在最近的更新中克服了不连贯、闪烁变形以及低清晰度等缺陷。
在众多的使用者中,有人认为Pika的效果更为出色,更富有动感,也更为流畅;有人则更喜欢Gen-2的稳定性和细节处理。说到底,还是萝卜青菜各有所爱。
其实不管是Runway,还是Pikalabs,抑或是其他不太“显眼”的AI视频生成工具,它们在摩拳擦掌的竞争中必定会加速AI视频生成技术迭代升级,为创作者提供更多元的平台。胡平表示,他对于这类文字转视频工具的未来还是十分期待的,“以后每个人都是导演,还可能会出现一种新的阅读方式和商业模式,介于电影和阅读之间。文字作者可以更准确地描绘自己想表达的画面。”
还没有评论,快来发表第一个评论!