World Models: как AI учится понимать физический мир
От языковых моделей к физическому интеллекту: глубокий разбор технологии, ключевых игроков и инвестиционных возможностей следующего десятилетия
Что такое World Models — простым языком
Представьте, что вы бросаете мяч. За доли секунды до того как он коснётся земли, ваш мозг уже “знает” — где он приземлится, как подпрыгнет, в какую сторону покатится. Вы не вычисляете это сознательно. Внутри вашей головы работает модель мира: интуитивное понимание физики, геометрии, причинно-следственных связей. Это то, что позволяет вам ловить предметы, обходить препятствия, водить машину — не задумываясь о каждом движении.
World Models — это попытка наделить искусственный интеллект точно таким же способностью. Вместо того чтобы просто генерировать текст (как ChatGPT) или классифицировать изображения, эти системы строят внутренние представления о физической реальности: они учатся предсказывать, что произойдёт, если робот возьмёт чашку, если автономный автомобиль повернёт налево, если ветер сдвинет облако. Это фундаментально другой подход к AI — от предсказания символов к предсказанию динамики реального мира.
Концепция не нова. Ещё в 2018 году исследователи из Google DeepMind показали, что нейросеть может учиться в “своём воображении” — сначала строить модель среды, затем тренироваться в ней, а потом переносить навыки на реального робота. Но настоящий взрыв произошёл в 2022-2024 годах, когда Ян Лекун опубликовал свою позиционную статью “A Path Towards Autonomous Machine Intelligence”, а NVIDIA, OpenAI и десятки стартапов запустили гонку за созданием фундаментальных моделей физического мира.
Для инвестора важно понимать: World Models — это не просто ещё одна архитектура нейросети. Это базовый слой, на котором будут построены роботы, автономные системы, промышленная автоматизация и, возможно, первый настоящий общий искусственный интеллект (AGI). Если LLM стали “мозгом” для текста, World Models претендуют на роль “мозга” для физической реальности.
World Models учатся абстрактным представлениям реальности — игнорируют непредсказуемые детали и фокусируются на предсказуемых аспектах физики, геометрии и причинно-следственных связей.
Yann LeCun, “A Path Towards Autonomous Machine Intelligence”, 2022Почему LLM недостаточно: позиция Яна Лекуна
ChatGPT написал стихотворение за секунду. Но попробуйте попросить его описать, как скатится шарик по наклонной плоскости с препятствием посередине — и получите убедительно звучащий, но физически неверный ответ. Языковые модели предсказывают токены, а не физику. Они оперируют статистическими паттернами текста, а не пониманием реального мира.
The idea that you’re going to extend the capabilities of LLMs to the point that they’re going to have human-level intelligence is complete nonsense.
Yann LeCun, интервью WIRED, март 2026Лекун — лауреат премии Тьюринга 2018 года, бывший Chief AI Scientist Meta — не голословен. Он не просто критикует LLM: он предлагает альтернативу. В марте 2026 года Лекун основал AMI Labs и привлёк рекордный seed-раунд $1.03 млрд при оценке $3.5 млрд, чтобы строить World Models на архитектуре JEPA. Это крупнейший seed-раунд в истории европейского технологического сектора.
❌ LLM (Large Language Models)
- Предсказывает токены (слова, символы)
- Обучается на тексте
- Оперирует статистическими паттернами языка
- Не понимает физику, геометрию, причинность
- Может “галлюцинировать” физически невозможные сценарии
- Примеры: GPT-4, Claude, Gemini
✅ World Models
- Предсказывает состояния мира
- Обучается на видео, сенсорах, физике
- Строит внутренние модели динамики реальности
- Понимает гравитацию, массу, столкновения
- Может “воображать” последствия действий
- Примеры: JEPA, Cosmos, Genie
Разница принципиальна. LLM — это интеллект языковой. World Models — это интеллект физический. Первый пишет эссе, второй водит машину, собирает детали на заводе, готовит ужин. Для экономики в $100 триллионов физический интеллект критически важнее — и в этом логика инвесторов, вложивших €6.5 млрд в World Models только в 2025 году.
Ключевые технологии: JEPA, Video Diffusion, VLA
За World Models стоят три технологических столпа. Понимание их различий — ключ к оценке компаний и ставок на будущее.
JEPA — Joint Embedding Predictive Architecture
Архитектура Яна Лекуна: вместо предсказания пикселей модель предсказывает представления (embeddings) в латентном пространстве. Игнорирует шум (текстура травы), фокусируется на абстракциях (траектория движения). Эволюция: I-JEPA (2023) → V-JEPA (2024) → V-JEPA 2 (2025): 1.2B параметров, 1M+ часов видео, zero-shot планирование роботов. Лидеры: AMI Labs, Meta AI. Подробнее →
Video Diffusion — видео-диффузия
Модели, обученные на массивах видео, генерируют физически реалистичные сцены: гравитация, жидкости, ткани, камерную физику. Работают в сжатом латентном пространстве. Ключевое применение — генерация синтетических тренировочных данных для роботов. Лидеры: OpenAI Sora (pivot к робототехнике в 2026), NVIDIA Cosmos (open-weight, CES 2025), Google DeepMind Genie. Код на GitHub →
VLA — Vision-Language-Action
End-to-end модели: вход = изображение + текстовая инструкция, выход = команды для робота. Архитектура “System 1 + System 2”: 7B VLM для понимания сцены + 80M-parameter transformer для контроля 200Hz. Пионеры: Physical Intelligence π0, Figure Helix, NVIDIA GR00T N1, Google DeepMind RT-2/Gemini Robotics. Подробнее →
Latent Space Prediction
Вместо манипуляции пикселями модели работают в скрытом (латентном) пространстве — сжатых представлениях, где каждый вектор кодирует абстрактные концепции: положение объекта, скорость, материал. EMA target-encoder обеспечивает стабильное обучение. Это позволяет предсказывать на много шагов вперёд без накопления ошибок. Технический разбор →
Embodied Intelligence
Парадигма: интеллект возникает из физического взаимодействия со средой, не только из текста. Perception (зрение + сенсоры) → Reasoning (физика + причинность) → Action (моторный контроль). Обучение: реальные данные (teleoperation) + синтетические (симуляция).
Spatial Intelligence (3D)
Концепция Fei-Fei Li (Stanford, создатель ImageNet): World Models для генерации и манипуляции 3D-сценами. Продукт Marble (ноябрь 2024) генерирует виртуальные 3D-миры из текста/изображений. Применение: storytelling, creativity, robotics, scientific discovery. Подробнее →
Ключевые игроки и раунды финансирования
Рынок World Models и Physical AI формируют десятки компаний, но пять из них привлекают основное внимание инвесторов и определяют вектор развития технологии.
World Labs — создательница ImageNet
Основана Fei-Fei Li — профессором Stanford, создателем ImageNet, человеком, который запустил революцию глубокого обучения. Концепция “Spatial Intelligence”: Large World Models для 3D-миров. Продукт Marble генерирует виртуальные миры из текста и изображений.
| Параметр | Данные |
|---|---|
| Основатель | Fei-Fei Li (Stanford, ImageNet) |
| Seed | $230M (апрель-август 2024), оценка $1B |
| Series A | $1B (февраль 2026), оценка ~$5B |
| Инвесторы | a16z, NEA, Nvidia NVentures, AMD, Fidelity, Autodesk, Geoffrey Hinton, Ashton Kutcher |
| Продукт | Marble: генерация 3D виртуальных миров из текста/изображений |
AMI Labs — бывший главный учёный Meta
Основана Яном Лекуном после его ухода из Meta. Концепция: World Models на базе JEPA для manufacturing, biomedical, robotics. Офисы в Париже, Нью-Йорке, Монреале и Сингапуре — глобальная команда с самого старта.
| Параметр | Данные |
|---|---|
| Основатель | Yann LeCun (Turing Award 2018, ex-Meta) |
| CEO | Alexandre LeBrun |
| Seed | $1.03B при оценке $3.5B pre-money (март 2026) — крупнейший seed в Европе |
| Инвесторы | Bezos Expeditions, Nvidia, Temasek, Samsung, Toyota Ventures, Jeff Bezos, Mark Cuban, Eric Schmidt, Tim Berners-Lee, Cathay Innovation |
Physical Intelligence (π) — “Один мозг для любого робота”
Основана тремя звёздами академической робототехники: Sergey Levine (Berkeley), Chelsea Finn (Stanford), Karol Hausman (ex-Google). Модель π0 (pi-zero) — первая VLA-модель для универсального управления роботами. Самый быстрорастущий стартап в секторе.
| Раунд | Сумма | Оценка | Дата / Инвесторы |
|---|---|---|---|
| Seed | $70M | — | Март 2024 |
| Series A | $400M | $2.4B | Ноябрь 2024, lead: Jeff Bezos, Thrive Capital, Lux Capital |
| Series B | $600M | $5.6B | Ноябрь 2025, lead: CapitalG (Alphabet) |
| Series C | $1B | $11B | 2026 (в процессе) |
Figure AI — Человекоподобные роботы
Основатель Brett Adcock (Vettery, Archer Aviation) — серийный предприниматель с трек-рекордом создания компаний-миллиардеров. Figure строит вертикально интегрированных гуманоидных роботов Figure 01/02/03 и VLA-модель Helix. Series C при оценке $39 млрд — абсолютный рекорд сектора.
| Раунд | Сумма | Оценка | Дата |
|---|---|---|---|
| Series A | $70M | — | Май 2023 |
| Series B | $675M | $2.6B | Февраль 2024 |
| Series C | $1B+ | $39B | Сентябрь 2025 |
| Всего | ~$1.9B | Инвесторы: Parkway VC, Nvidia, Microsoft, OpenAI, Jeff Bezos, Intel Capital, Brookfield | ||
Skild AI — “Omni-bodied brain”
Основано Deepak Pathak и Abhinav Gupta из CMU/Meta. Концепция — единый foundation model для любых роботов: от промышленных манипуляторов до гуманоидов. SoftBank ведёт Series C.
| Раунд | Сумма | Оценка | Дата / Лид |
|---|---|---|---|
| Seed | $14.5M | — | 2023 |
| Series A | $300M | $1.5B | Июль 2024, Lightspeed, Coatue, SoftBank, Bezos Expeditions |
| Series B | $135M | $4.5B | Июнь 2025 |
| Series C | $1.4B | $14-15B | Январь 2026, lead: SoftBank |
Сводная таблица: пять ключевых игроков
| Компания | Основатель | Технология | Оценка | Ключевой инвестор |
|---|---|---|---|---|
| World Labs | Fei-Fei Li | Spatial Intelligence (3D) | $5B | Nvidia, a16z |
| AMI Labs | Yann LeCun | JEPA / World Models | $3.5B | Bezos Expeditions |
| Physical Intelligence | Levine, Finn, Hausman | VLA (π0) | $11B | Jeff Bezos, CapitalG |
| Figure AI | Brett Adcock | Humanoid + Helix VLA | $39B | Parkway VC, Nvidia |
| Skild AI | Pathak, Gupta (CMU) | Omni-bodied brain | $14-15B | SoftBank, Bezos Expeditions |
Инвестиционная картина: цифры рынка
2025 год стал переломным для Physical AI. Инвестиции в робототехнику превысили пик 2021 года, а раунды World Models выросли в 5 раз за год. Данные собраны из открытых источников: PitchBook, Crunchbase, Sacra, Kaiso Research.
Макро-цифры рынка
Крупнейшие раунды 2024-2026
Детализация крупнейших раундов
| Компания | Раунд | Сумма | Оценка | Дата |
|---|---|---|---|---|
| Project Prometheus | Seed | $6.2B | — | Ноябрь 2025 |
| Figure AI | Series C | $1B+ | $39B | Сентябрь 2025 |
| Skild AI | Series C | $1.4B | $14-15B | Январь 2026 |
| World Labs | Series A | $1B | $5B | Февраль 2026 |
| AMI Labs | Seed | $1.03B | $3.5B | Март 2026 |
| Physical Intelligence | Series B | $600M | $5.6B | Ноябрь 2025 |
| Apptronik | Series A-X | $520M | $5.3B | Февраль 2026 |
Почему это интересно инвестору
TAM: размер рынка
Оценки Total Addressable Market сильно варьируются в зависимости от определения Physical AI, но даже консервативные прогнозы показывают рынок в сотни миллиардов долларов.
| Сегмент | 2025 | Прогноз | CAGR | Источник |
|---|---|---|---|---|
| Physical AI (общий) | $81.4B | $1,145B (2035) | 33.5% | Kaiso Research |
| Physical AI (альт.) | $5.23B | $49.7B (2033) | 32.5% | SNS Insider |
| Робототехника (общая) | $50B | $111B (2030) | 14% | ABI Research |
| Humanoid robots | — | $38B (2035) | 137.7% | ABI Research |
| Robotics software | — | $24.5B (2030) | — | ABI Research |
Катализаторы 2025-2026: что движет рынком
Девять ключевых событий, которые определили динамику сектора и создали инвестиционный моментум:
- 1 NVIDIA Cosmos + GR00T (CES 2025): открытые world foundation models. Jensen Huang: “Physical AI has reached its ChatGPT moment”. Источник →
- 2 Meta V-JEPA 2 (2025): 1.2B параметров, zero-shot планирование роботов без task-specific обучения. Блог Meta →
- 3 Figure AI Helix (февраль 2025): первый commercial-ready VLA для humanoid. Подробнее →
- 4 Tesla Optimus Gen 3 (январь 2026): запуск массового производства гуманоидов.
- 5 AMI Labs $1B seed (март 2026): Ян Лекун, крупнейший seed в Европе. WIRED →
- 6 Project Prometheus (ноябрь 2025): $6.2B от Jeff Bezos. Built In →
- 7 OpenAI pivot (март 2026): Sora закрыт для consumers, перенаправлен на world simulation для robotics. TechJack →
- 8 NVIDIA GR00T N1 (март 2025): первый open foundation model для humanoid. NVIDIA Developer →
- 9 Physical Intelligence Series C (2026): $1B при оценке $11B — лидер VLA-моделей.
NVIDIA — “кирки и лопаты”
Как и в золотой лихорадке самые надёжные инвестиции — это не в золотодобытчиков, а в продавцов лопат. NVIDIA играет роль универсального поставщика инфраструктуры для всей экосистемы World Models: открытые модели (Cosmos), платформа для роботов (GR00T, Isaac Sim), чипы (Jetson, DRIVE). Jensen Huang на CES 2025 объявил: “Physical AI has reached its ChatGPT moment”. Компания инвестировала в World Labs, AMI Labs, Figure AI, Skild AI, Apptronik и Physical Intelligence — покрывая весь сектор ставками на всех игроков.
Связь с Project Prometheus и Jeff Bezos
Ни один инвестор не ставит на World Models так масштабно, как Jeff Bezos. Его инвестиционная стратегия охватывает весь стек технологий — от фундаментальных моделей до гуманоидных роботов и промышленной автоматизации.
Project Prometheus — стелс-стартап Bezos
В ноябре 2025 года Jeff Bezos совместно с Vik Bajaj (ex-Google) основал Project Prometheus — стелс-компанию с seed-раундом $6.2 млрд, один из крупнейших в истории венчурных инвестиций. Компания строит world models для симуляции физических сред в manufacturing: aerospace, чипы, автомобили, фармацевтика.
Project Prometheus = “AI for the physical economy”
Технология строит 3D-представления физических сред: реконструкция обтекания крыла самолёта, предсказание поломок компонентов, автоматизация производственных процессов. Приобретён General Agents (VLA-модель от ex-DeepMind). Советники: Ashish Vaswani, Jakob Uskoreit — авторы статьи “Attention Is All You Need”.
Полная картина инвестиций Bezos в World Models
AI is real, and it is going to change every industry.
Jeff Bezos, октябрь 2025Почему именно Bezos? У него есть всё для доминирования в этом секторе: опыт масштабной автоматизации через Amazon (1M+ роботов на складах), аэрокосмическая инфраструктура Blue Origin как клиент для Project Prometheus, и безграничный капитал для долгосрочных ставок. Elon Musk уже назвал Bezos “copycat” из-за сходства Project Prometheus с xAI/Optimus — но это скорее подтверждение стратегической правильности направления.
Разбор рисков
Любой инвестиционный тезис должен быть сбалансирован. Вот что может пойти не так в World Models и Physical AI.
- Pre-revenue статус Многие компании (Physical Intelligence, AMI Labs, Project Prometheus) не имеют значимой выручки. Инвесторы покупают технологию и команду, не бизнес-модель. Оценки основаны на потенциале, не на fundamentals.
- Длительная коммерциализация Сам Ян Лекун оценивает сроки до продуктовых результатов в годы, не кварталы. World Models — это фундаментальная наука, не SaaS с быстрым time-to-market. Требуется терпение и долгий горизонт инвестирования.
- Hardware costs Гуманоидные роботы стоят $30K-$150K. Хотя цены снижаются на 40% в год, массовое внедрение требует дешёвых и надёжных аппаратных платформ. Без дешёвого “тела” “мозг” World Models останется в лаборатории.
- Sim-to-real gap 95% точности в симуляции превращается в 60% в реальности. Модели, обученные на синтетических данных, часто терпят неудачу при контакте с реальным миром. Это один из ключевых технических барьеров.
- Дефицит данных Недостаток качественных 3D-данных и дорогостоящая teleoperation замедляют обучение. В отличие от текста (весь интернет) или изображений (ImageNet), данных физического взаимодействия катастрофически мало.
- AI bubble concerns Оценки растут быстрее фундаменталов. Figure AI оценена в $39B без реальной выручки. AMI Labs — $3.5B pre-money на seed. Если прогресс технологии замедлится, коррекция может быть болезненной.
- Конкуренция гигантов NVIDIA, Google DeepMind, OpenAI, Meta — у каждого есть ресурсы и мотивация доминировать. Стартапы рискуют стать acquisition targets или просто раздавлены масштабом Big Tech.
Эти риски реальны, но они не уникальны для World Models. Точно такие же аргументы звучали в 2012 году против deep learning, в 2017-м — против transformers, в 2022-м — против LLM. Каждый раз технология превосходила скептицизм.
5 ключевых выводов
- World Models — следующий фронтир AI после LLM. Переход от языкового интеллекта к физическому пониманию мира открывает рынок в триллион долларов. CAGR 33.5% по данным Kaiso Research. Это не тренд — это парадигмальный сдвиг.
- Рынок растёт экспоненциально. Инвестиции в World Models выросли с €1.3B до €6.5B за год (5x). Робототехника привлекла $13.8B в 2025 — рекорд, превзошедший пик 2021 года. Моментум ускоряется.
- Jeff Bezos — центральная фигура экосистемы. Через Bezos Expeditions, Project Prometheus ($6.2B) и персональные инвестиции он охватил весь стек: World Models (AMI Labs, Project Prometheus), robot foundation models (Physical Intelligence, Skild AI), humanoid robots (Figure AI).
- NVIDIA — “picks and shovels” для всего сектора. Открытая инфраструктура (Cosmos, GR00T, Isaac Sim) позволяет компании извлекать выгоду независимо от того, какой стартап победит. Плюс: Nvidia NVentures инвестирует в ключевых игроков.
- Ключевые технологические ставки: JEPA, VLA, Video Diffusion. JEPA (Meta/AMI Labs) — предсказание в латентном пространстве. VLA (Physical Intelligence/Figure/NVIDIA) — end-to-end control роботов. Video Diffusion (NVIDIA Cosmos/World Labs) — генерация синтетических данных. Выигрывает тот, кто правильно распределит ставки между подходами.
World Models представляют собой фундаментальный парадигмальный сдвиг в AI — от предсказания токенов (LLM) к предсказанию динамики физического мира. Это “базовый слой” для Physical AI, который определит победителей в робототехнике, автономном вождении, manufacturing и AR/VR на следующее десятилетие.
Аналитическая команда Project Prometheus, январь 2026📚 Источники и ссылки
- Yann LeCun — “A Path Towards Autonomous Machine Intelligence” (2022)
- Meta AI — V-JEPA 2 World Model (2025)
- NVIDIA Cosmos Official
- NVIDIA Cosmos Major Release (CES 2025)
- NVIDIA GR00T N1 Announcement
- Forbes — World Labs $230M (2024)
- Silicon Republic — World Labs $1B (2026)
- Fortune — World Labs at $5B
- WIRED — AMI Labs $1B Seed (2026)
- Futurum Group — AMI Labs Analysis
- PitchBook — Physical Intelligence $400M
- The LEC — Physical Intelligence at $11B
- Sacra — Figure AI at $39B
- The Robot Report — Figure AI Series C
- Crunchbase — Skild AI Funding
- Crunchbase — Apptronik Funding
- Built In — Project Prometheus Explained
- Kaiso Research — Physical AI Market Report
- Wikipedia — Genie World Model
- Wikipedia — Vision-Language-Action Model
- TechJack — OpenAI Sora Pivot to Robotics
- LearnOpenCV — V-JEPA 2 for Robotics
- Gonzo ML — V-JEPA 2 Technical Deep Dive

