2024年2月15日,美国人工智能研究公司OpenAI发布了备受瞩目的人工智能文生视频大模型Sora。据官方介绍,Sora允许用户创建长达一分钟的真实视频,所有这些视频内容都基于他们编写的提示词。
换句话说,只要编写好的文案,Sora就可以自动生成一个最长可达60秒的真实视频。这无疑颠覆了现阶段时长不超过4s的普遍“时长”。
随即,#Sora概念股大涨#、#第一拨靠Sora赚钱的人已经出现了#等话题便相继登上热搜,震荡全球。
一夜刷屏,Sora为啥这么火?
在OpenAI官网发布的信息中,OpenAI并不止于将Sora定位为一个文生视频的大模型,OpenAI将Sora定位为模拟世界的视频生成模型。
通过训练Sora,OpenAI正在教授人工智能理解和模拟运行中的物理世界,目标是训练模型帮助人类解决需要现实世界交互的问题。
根据OpenAI的介绍性博客文章,Sora能够创建具有多个角色、特定运动类型以及主题和背景的准确细节的复杂场景。该模型可以理解物体在物理世界中如何存在,以及准确地解释道具并生成引人注目的角色来表达充满活力的情感。
Sora作为一个新应用,仍然存在很多问题。比如在物体交互的时候,依然存在一些交互错误,有一个老奶奶吹蜡烛的视频中,老奶奶已经做出了吹蜡烛的这个动作,但蜡烛却没有熄灭。
OpenAI对于Sora的定位也值得我们关注,他们将Sora视为构建AGI和世界模型的一个重要里程碑。这意味着Sora只是OpenAI在AI领域宏伟蓝图中的一个步骤而已。这项AI技术在未来依然值得期待。
Sora这类AIGC工具的能力基于大数据训练,和此前的Chat GPT一样,具有网络效应,这种效应使得其迭代进化的速度异常迅速,且这种速度无法用摩尔定律来准确衡量。
但与Chat GPT不同的是,Sora生成的AI内容对普通人来说更为直观,更容易在大量用户与从业者之中获取反馈。由于短视频是当前世界的主流娱乐方式和信息媒体,其广泛的信息来源和传播渠道为Sora的自我学习和提升提供了有力支持。
虽然早期Sora也出现过对物理的错误理解,如「果汁从杯底洒出」,但这也能表明Sora正在不断地自主探索物理世界,这种通过纠错与学习的升级方式,更符合未来人们对“智能”的理解。
所以Sora对于创作的内容理解将不断升级,综合水平已经大大超越了此前热门的Runway和Pika,随着大数据的不断累积,Sora的发展前景目前看不到尽头。
Sora推出不久,360创始人周鸿祎对Sora给予了极高的评价,他在社交平台发文:Sora的诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年。
目前,OpenAI的估值已飙升至800亿美元以上。CB Insights的数据显示,OpenAI目前是世界上最有价值的科技初创企业之一,仅次于字节跳动和SpaceX。
在全球视野纷纷投向Sora之际,OpenAI 表示,它仍处于 red-teaming 阶段,现在还未对公众开放使用。
曾经,拍摄一张照片需要购入昂贵的相机,学习调整各种参数,而冲洗照片则涉及复杂的化学试剂和多个步骤。然而,随着数码相机和智能手机的出现,每个普通人都能随时随地拍摄和观看照片。这使得传统的摄影师的专业性逐渐只能通过构图、采光、个人风格等抽象因素来展现。
如今,Sora也将带来这样的改变。随着其大模型的完善和自我学习能力的增强,Sora能让一个完全没有影视制作和艺术设计经验的普通人直接生成一段符合他描述的视频,而这段视频所带来的效果和科幻大片高成本制作的特效不相上下。
这意味着,未来的网文作者在写作文章的同时,也可能独自完成一部小说改编的玄幻短片。而对于特效制作和虚拟场景搭建的专业人士来说,如果高成本制作的画面最终与草根作者的作品相差无几,这无疑会给他们带来不小的压力。
Sora,将颠覆跨境电商行业
过去一年的时间,人工智能领域的一次次创新给跨境电商行业带来了无限的想象和机会。
2023年,聊天机器人程序ChatGPT在短时间内火爆全网,大量跨境卖家将之用于实际运营当中,包括撰写邮件、优化Listing、售后服务等,AI工具逐渐成为一个新的稳定的生产力。
而Sora的问世意味着文本、图片、视频领域,都有超牛AI工具诞生,我们正进入AI技术更普及、强大的时代。
不同于PS、AE这种真的需要学习如何操作的软件,ChatGPT、Sora是降低了使用门槛的,反而让更多人拥有了使用工具的机会。所以对于跨境电商行业来说,Sora也必将带来许多翻天覆地的变化。
从目前来看,跨境电商行业也处处需要视频的助力,电商平台产品详情页需要视频去辅助展示产品及其功能,社交平台也需要各类视频进行品牌宣传、营销。
Sora脱颖而出是因为它克服了“物理难题”,相较于同类产品10秒的创作上限,Sora生成视频长达60秒,其生成内容的精细画面已经达到与现实世界难以区分的程度。此外,Sora生成内容的主体与背景环境的一致性更是令人震撼。
Sora的出现无疑是AI发展的一个巨大成功。它在人类现有知识基础和世界模型的基础之上,叠加了相关的自我学习技术,这无疑是AI发展的正确道路之一。AI企业将很容易利用这种模式打造各行业的超级工具。
但最关键的地方还是在于Sora对于世界模型的掌握。通过学习,Sora能了解现实世界的运行常识与物理规律。而以往的扩散模型只能实现文本与3D模型的普通转换,无法直接嵌入在一个虚拟的物理世界中。
简单来说,以往用文生视频给人的感觉更像是“会动的图片”,其中视频背景与主体之间缺乏动态交互,无法跨越“真实”的门槛。
视频创作者应当深入思考的是,在Sora等工具推动AIGC发展的背景下,短视频作为主流的信息获取渠道,其中必将充斥大量由AI生成的内容,而整活、风景、叙事等视频分类更是生成内容的“重灾区”。
并且随着AIGC技术的不断进步,用户已难以辨别内容是否由AI创作,这使得用户和创作者去区分内容真实性的重要性降低。
但不论Sora有多么“理解”世界,也无论其生成的视频内容有多么逼真,它们始终是数字模拟的产物,无法替代真实拍摄所展现的现实。因此,为了在未来避免被生成视频内容的洪流所淹没,短视频创作者如果专注于真实拍摄,并通过深入的情感展现来触动观众,将会取得更好的效果。
据亚马逊数据显示,69%的顾客更愿意通过视频了解新产品或服务,相比文字和图片,视频具有更强的说服力和表现力。
就在近期,亚马逊还宣布上线了“视频帖子”新功能,可见会制作视频、能制作精细视频,对跨境行业来说也十分重要。
Sora技术登场:或迎来新机遇
未来,有了Sora这样的工具,无需搜集素材、辛苦剪辑,仅需指令输入,卖家就能获得想要的视频内容。
卖家运营各个社交媒体账号,将变得更为便利,人力成本也将降低。甚至,想不出创意的时候,还可以让AI工具想想办法。
根据介绍,Sora可以根据现有的静动态图像生成视频,也就是卖家只需提供产品图或初始视频,然后指挥AI生成各类产品使用场景即可。
有卖家表示,Sora出现并应用后,“降本增效”将在跨境圈实现,而且是生产成本骤降,生产效率却能数倍提升。
卖家必须具备深厚的专业知识、准确的理解能力和出色的表达技巧,才能充分利用Sora这类工具生成精准反映产品特性和卖点的宣传视频。尽管Sora展现出无比诱人的应用前景,但OpenAI也承认当前模型在模拟复杂的物理现象方面仍存在不足。
例如,在某一演示案例中,Sora未能准确模拟塑料椅子作为刚性物体在挖掘过程中的物理互动。这意味着,Sora距离正式成熟上线并广泛应用还需要一定时间,大数跨境将持续关注这一动态,为跨境电商卖家及时传递相关信息。面对层出不穷的AI工具,它们既为卖家出海拓展业务提供了强大动力,同时也带来了诸如AI换脸诈骗等相关风险。
此外,人们对被技术替代的恐慌情绪也在蔓延。然而,在技术革新的洪流中,最佳应对之道便是主动适应变化,成为这些先进工具的主宰者,而非被其牵制。只有这样,我们才能在新时代的竞争中立于不败之地。
扫一扫在手机上查看当前页面