当前位置：智能制造网资讯中心专家观点

周鸿祎谈Sora模型：中美AI差距可能还在加大

2024-02-19 14:01:28来源：TechWeb.com.cn 关键词：大模型 AIGC阅读量：24997

导读：很多人说 Sora的效果吊打 Pika和Runway。这很正常，和创业者团队比OpenAl 这种有核心技术的公司实力还是非常强劲的。

　　2月17日消息，近日，OpenAI 发布了 Sora 模型，该模型可根据用户输入的文本提示词描述，生成一段60秒钟的视频内容。从OpenAI公开的演示视频来看效果非常超现实。

　　昨日，360董事长周鸿祎在微博发文，谈到OpenAI的文字转视频模型Sora。他认为：Sora意味着 AGI实现将从 10年缩短到1年。

　　周鸿祎表示，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆，但它不一定那么快击败 TikTok，更可能成为 TikTok的创作工具。

　　同时，周鸿祎还谈到中美AI差距，他认为：OpenAl手里应该还藏着一些秘密武器，无论是 GPT-5，还是机器自我学习自动产生内容，包括 AIGC。他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。

　　以下为周鸿祎发文全文：

　　Sora意味着 AGI实现将从10年缩短到1年

　　年前我在风马牛演讲上分享了大模型十大趋势预测，没想到年还没过完，就验证了好几个从 Gemini、英伟达的 Chat With RTX到 OpenA!发布 Sora，大家都觉得很炸裂。朋友问我怎么看 Sora，我谈几个观点，总体来说就是我认为AGI很快会实现，就这几年的事儿了:

　　第一，科技竞争最终比拼的是让人才密度和深厚积累。很多人说 Sora的效果吊打 Pika和Runway。这很正常，和创业者团队比OpenAl 这种有核心技术的公司实力还是非常强劲的。有人认为有了 AI以后创业公司只需要做个体户就行，实际今天再次证明这种想法是非常可笑的。

　　第二，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。今天很多人谈到 Sora 对影视工业的打击，我倒不觉得是这样，因为机器能生产一个好视频，但视频的主题、脚本和分镜头策划、台词的配合，都需要人的创意至少需要人给提示词。一个视频或者电影是由无数个 60 秒组成的。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆，但它不一定那么快击败 TikTok，更可能成为 TikTok的创作工具。

　　第三，我一直说国内大模型发展水平表面看已经接近 GPT-3.5 了，但实际上跟 4.0 比还有一年半的差距。而且我相信 OpenAl手里应该还藏着一些秘密武器，无论是 GPT-5，还是机器自我学习自动产生内容，包括 AIGC。奥特曼是个营销大师，知道怎样掌握节奏，他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。

　　第四，大语言模型最牛的是，它不是填空机，而是能完整地理解这个世界的知识。这次很多人从技术上、从产品体验上分析Sora，强调它能输出 60 秒视频，保持多镜头的一致性，模拟自然世界和物理规律，实际这些都比较表象，最重要的是 Sora 的技术思路完全不一样。因为这之前我们做视频做图用的都是 Diffusion，你可以把视频看成是多个真实图片的组合，它并没有真正掌握这个世界的知识。现在所有的文生图、文生视频都是在 2D 平面上对图形元素进行操作，并没有适用物理定律。但 Sora 产生的视频里，它能像人一样理解坦克是有巨大冲击力的，坦克能撞毁汽车，而不会出现汽车撞毁坦克这样的情况。所以我理解这次 OpenAl 利用它的大语言模型优势，把LLM 和 Diffusion 结合起来训练，让 Sora 实现了对现实世界的理解和对世界的模拟两层能力，这样产生的视频才是真实的，才能跳出 2D 的范围模拟真实的物理世界。这都是大模型的功劳。这也代表未来的方向。有强劲的大模型做底子，基于对人类语言的理解，对人类知识和世界模型的了解，再叠加很多其他的技术，就可以创造各个领域的超级工具，比如生物医学蛋白质和基因研究，包括物理、化学、数学的学科研究上，大模型都会发挥作用。这次 Sora对物理世界的模拟，至少将会对机器人具身智能和自动驾驶带来巨大的影响。原来的自动驾驶技术过度强调感知层面，而没有工作在认知层面。其实人在驾驶汽车的时候，很多判断是基于对这个世界的理解。比如对方的速度怎么样，能否发生碰撞，碰撞严重性如何，如果没有对世界的理解就很难做出一个真正的无人驾驶。

　　所以这次 Sora 只是小试牛刀，它展现的不仅仅是一个视频制作的能力，它展现的是大模型对真实世界有了理解和模拟之后，会带来新的成果和突破。

　　第五，Open Al训练这个模型应该会阅读大量视频。大模型加上 Diffusion 技术需要对这个世界进行进一步了解，学习样本就会以视频和摄像头捕捉到的画面为主。一旦人工智能接上摄像头，把所有的电影都看一遍，把YouTube 上和 TikTok 的视频都看一遍，对世界的理解将远远超过文字学习，一幅图胜过千言万语，而视频传递的信息量又远远超过一幅图，这就离AGI真的就不远了，不是10年20年的问题，可能一两年很快就可以实现。

上一篇：比亚迪王传福发表最新预测：今年新能源汽车单月渗透率将超50%

下一篇：吉利淦家阅：新一代CTB技术将普及到主流产品上

我要评论

昵称

匿名

文明上网，理性发言。（您还可以输入200个字符)

表情

所有评论仅代表网友意见，与本站立场无关。

1台管好5000㎡巡检区域！海康威视发布大模型球机系列产品
海康威视大模型枪球一体机单台即可满足5000多平方米区域的管理需求。F1.0大光圈结合AI-ISP技术，实现全景臻全彩成像，夜间画质表现更出色，更适合变电站等光照条件弱的场景。
巡检大模型
2025-04-24 10:32:27
何小鹏：大模型驱动下，未来驾驶或可数月不碰方向盘
小鹏汽车还荣获2024年中国新造车企业出口的第一名，并且在欧洲市场，成功做到了四万欧元以上的中高端新能源汽车的第一名。
何小鹏大模型新能源汽车
2025-03-25 10:55:56
误报率降低90%以上！海康威视发布视觉大模型周界摄像机
现在，基于大模型周界摄像机强大的硬件性能，能以更小像素实现目标检出，检出距离大幅提升，相较于传统周界相机5-20米的纵深检测，大模型周界产品可实现至少5-65米的精准检测。
大模型周界摄像机
2025-03-14 10:26:36
更准！海康威视发布大模型交通卡口抓拍系列产品
为提升交通卡口抓拍检测精准度，海康威视基于海康观澜大模型技术体系将大模型能力直接部署至交通卡口抓拍系列产品上，相比传统检测算法，安全带、打电话、玩手机等行为误检率降低75%以上（根据项目实测数据）。
大模型交通卡口
2025-03-14 10:16:58
数转智改，安全先行！“以模制模”护航企业数智升级
周鸿祎认为，DeepSeek-R1的诞生标志着我国AI技术加速从“追赶者”迈向“领跑者”，其开源、透明等特质，尤其适合在政府与企业开展私有化部署，不过随之而来的安全问题也值得关注。
以模制模数转智改大模型
2025-03-06 17:03:21
全国政协委员周鸿祎：建议对大模型“幻觉”给予适度包容，让中国AI大胆前行
周鸿祎认为，以DeepSeek为代表的大模型取得了“国运级科技成果”，不仅促进了大模型技术自主创新，也带动了上下游产业协同发展，让大模型加速走进百行千业，成为推动中国科技进步、经济增长和国家强盛的关键力量。
周鸿祎大模型DeepSeek
2025-03-05 09:47:20

版权与免责声明：

凡本站注明“来源：智能制造网”的所有作品，均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品，未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：智能制造网”。违反上述声明者，本站将追究其相关法律责任。

本站转载并注明自其它来源（非智能制造网）的作品，目的在于传递更多信息，并不代表本站赞同其观点或和对其真实性负责，不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时，必须保留本站注明的作品第一来源，并自负版权等法律责任。如擅自篡改为“稿件来源：智能制造网”，本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多，如涉及作品内容、版权等问题，请与本站联系并提供相关证明材料：联系电话：0571-89719789；邮箱：1271141964@qq.com。