World Models: как AI учится понимать физический мир

В избранное
В избранном
Образовательный гид для инвесторов

World Models: как AI учится понимать физический мир

От языковых моделей к физическому интеллекту: глубокий разбор технологии, ключевых игроков и инвестиционных возможностей следующего десятилетия

📅 Январь 2026 ⏱ 25 минут чтения
Часть серии Изучаем идею Project Prometheus ⟵ Вернуться к основной статье
🔗
Основная статья серии
Project Prometheus — $6.2B стартап Джеффа Безоса, который строит world models для промышленности
Читать ⟶
🧠

Что такое World Models — простым языком

Представьте, что вы бросаете мяч. За доли секунды до того как он коснётся земли, ваш мозг уже “знает” — где он приземлится, как подпрыгнет, в какую сторону покатится. Вы не вычисляете это сознательно. Внутри вашей головы работает модель мира: интуитивное понимание физики, геометрии, причинно-следственных связей. Это то, что позволяет вам ловить предметы, обходить препятствия, водить машину — не задумываясь о каждом движении.

World Models — это попытка наделить искусственный интеллект точно таким же способностью. Вместо того чтобы просто генерировать текст (как ChatGPT) или классифицировать изображения, эти системы строят внутренние представления о физической реальности: они учатся предсказывать, что произойдёт, если робот возьмёт чашку, если автономный автомобиль повернёт налево, если ветер сдвинет облако. Это фундаментально другой подход к AI — от предсказания символов к предсказанию динамики реального мира.

Концепция не нова. Ещё в 2018 году исследователи из Google DeepMind показали, что нейросеть может учиться в “своём воображении” — сначала строить модель среды, затем тренироваться в ней, а потом переносить навыки на реального робота. Но настоящий взрыв произошёл в 2022-2024 годах, когда Ян Лекун опубликовал свою позиционную статью “A Path Towards Autonomous Machine Intelligence”, а NVIDIA, OpenAI и десятки стартапов запустили гонку за созданием фундаментальных моделей физического мира.

Для инвестора важно понимать: World Models — это не просто ещё одна архитектура нейросети. Это базовый слой, на котором будут построены роботы, автономные системы, промышленная автоматизация и, возможно, первый настоящий общий искусственный интеллект (AGI). Если LLM стали “мозгом” для текста, World Models претендуют на роль “мозга” для физической реальности.

World Models учатся абстрактным представлениям реальности — игнорируют непредсказуемые детали и фокусируются на предсказуемых аспектах физики, геометрии и причинно-следственных связей.

Yann LeCun, “A Path Towards Autonomous Machine Intelligence”, 2022

Почему LLM недостаточно: позиция Яна Лекуна

ChatGPT написал стихотворение за секунду. Но попробуйте попросить его описать, как скатится шарик по наклонной плоскости с препятствием посередине — и получите убедительно звучащий, но физически неверный ответ. Языковые модели предсказывают токены, а не физику. Они оперируют статистическими паттернами текста, а не пониманием реального мира.

The idea that you’re going to extend the capabilities of LLMs to the point that they’re going to have human-level intelligence is complete nonsense.

Yann LeCun, интервью WIRED, март 2026

Лекун — лауреат премии Тьюринга 2018 года, бывший Chief AI Scientist Meta — не голословен. Он не просто критикует LLM: он предлагает альтернативу. В марте 2026 года Лекун основал AMI Labs и привлёк рекордный seed-раунд $1.03 млрд при оценке $3.5 млрд, чтобы строить World Models на архитектуре JEPA. Это крупнейший seed-раунд в истории европейского технологического сектора.

❌ LLM (Large Language Models)

  • Предсказывает токены (слова, символы)
  • Обучается на тексте
  • Оперирует статистическими паттернами языка
  • Не понимает физику, геометрию, причинность
  • Может “галлюцинировать” физически невозможные сценарии
  • Примеры: GPT-4, Claude, Gemini

✅ World Models

  • Предсказывает состояния мира
  • Обучается на видео, сенсорах, физике
  • Строит внутренние модели динамики реальности
  • Понимает гравитацию, массу, столкновения
  • Может “воображать” последствия действий
  • Примеры: JEPA, Cosmos, Genie

Разница принципиальна. LLM — это интеллект языковой. World Models — это интеллект физический. Первый пишет эссе, второй водит машину, собирает детали на заводе, готовит ужин. Для экономики в $100 триллионов физический интеллект критически важнее — и в этом логика инвесторов, вложивших €6.5 млрд в World Models только в 2025 году.

🔧

Ключевые технологии: JEPA, Video Diffusion, VLA

За World Models стоят три технологических столпа. Понимание их различий — ключ к оценке компаний и ставок на будущее.

🔗

JEPA — Joint Embedding Predictive Architecture

Архитектура Яна Лекуна: вместо предсказания пикселей модель предсказывает представления (embeddings) в латентном пространстве. Игнорирует шум (текстура травы), фокусируется на абстракциях (траектория движения). Эволюция: I-JEPA (2023) → V-JEPA (2024) → V-JEPA 2 (2025): 1.2B параметров, 1M+ часов видео, zero-shot планирование роботов. Лидеры: AMI Labs, Meta AI. Подробнее →

🎬

Video Diffusion — видео-диффузия

Модели, обученные на массивах видео, генерируют физически реалистичные сцены: гравитация, жидкости, ткани, камерную физику. Работают в сжатом латентном пространстве. Ключевое применение — генерация синтетических тренировочных данных для роботов. Лидеры: OpenAI Sora (pivot к робототехнике в 2026), NVIDIA Cosmos (open-weight, CES 2025), Google DeepMind Genie. Код на GitHub →

🤖

VLA — Vision-Language-Action

End-to-end модели: вход = изображение + текстовая инструкция, выход = команды для робота. Архитектура “System 1 + System 2”: 7B VLM для понимания сцены + 80M-parameter transformer для контроля 200Hz. Пионеры: Physical Intelligence π0, Figure Helix, NVIDIA GR00T N1, Google DeepMind RT-2/Gemini Robotics. Подробнее →

🌐

Latent Space Prediction

Вместо манипуляции пикселями модели работают в скрытом (латентном) пространстве — сжатых представлениях, где каждый вектор кодирует абстрактные концепции: положение объекта, скорость, материал. EMA target-encoder обеспечивает стабильное обучение. Это позволяет предсказывать на много шагов вперёд без накопления ошибок. Технический разбор →

🧩

Embodied Intelligence

Парадигма: интеллект возникает из физического взаимодействия со средой, не только из текста. Perception (зрение + сенсоры) → Reasoning (физика + причинность) → Action (моторный контроль). Обучение: реальные данные (teleoperation) + синтетические (симуляция).

📐

Spatial Intelligence (3D)

Концепция Fei-Fei Li (Stanford, создатель ImageNet): World Models для генерации и манипуляции 3D-сценами. Продукт Marble (ноябрь 2024) генерирует виртуальные 3D-миры из текста/изображений. Применение: storytelling, creativity, robotics, scientific discovery. Подробнее →

🏢

Ключевые игроки и раунды финансирования

Рынок World Models и Physical AI формируют десятки компаний, но пять из них привлекают основное внимание инвесторов и определяют вектор развития технологии.

World Labs — создательница ImageNet

Основана Fei-Fei Li — профессором Stanford, создателем ImageNet, человеком, который запустил революцию глубокого обучения. Концепция “Spatial Intelligence”: Large World Models для 3D-миров. Продукт Marble генерирует виртуальные миры из текста и изображений.

ПараметрДанные
ОсновательFei-Fei Li (Stanford, ImageNet)
Seed$230M (апрель-август 2024), оценка $1B
Series A$1B (февраль 2026), оценка ~$5B
Инвесторыa16z, NEA, Nvidia NVentures, AMD, Fidelity, Autodesk, Geoffrey Hinton, Ashton Kutcher
ПродуктMarble: генерация 3D виртуальных миров из текста/изображений

AMI Labs — бывший главный учёный Meta

Основана Яном Лекуном после его ухода из Meta. Концепция: World Models на базе JEPA для manufacturing, biomedical, robotics. Офисы в Париже, Нью-Йорке, Монреале и Сингапуре — глобальная команда с самого старта.

ПараметрДанные
ОсновательYann LeCun (Turing Award 2018, ex-Meta)
CEOAlexandre LeBrun
Seed$1.03B при оценке $3.5B pre-money (март 2026) — крупнейший seed в Европе
ИнвесторыBezos Expeditions, Nvidia, Temasek, Samsung, Toyota Ventures, Jeff Bezos, Mark Cuban, Eric Schmidt, Tim Berners-Lee, Cathay Innovation

Physical Intelligence (π) — “Один мозг для любого робота”

Основана тремя звёздами академической робототехники: Sergey Levine (Berkeley), Chelsea Finn (Stanford), Karol Hausman (ex-Google). Модель π0 (pi-zero) — первая VLA-модель для универсального управления роботами. Самый быстрорастущий стартап в секторе.

РаундСуммаОценкаДата / Инвесторы
Seed$70MМарт 2024
Series A$400M$2.4BНоябрь 2024, lead: Jeff Bezos, Thrive Capital, Lux Capital
Series B$600M$5.6BНоябрь 2025, lead: CapitalG (Alphabet)
Series C$1B$11B2026 (в процессе)

Figure AI — Человекоподобные роботы

Основатель Brett Adcock (Vettery, Archer Aviation) — серийный предприниматель с трек-рекордом создания компаний-миллиардеров. Figure строит вертикально интегрированных гуманоидных роботов Figure 01/02/03 и VLA-модель Helix. Series C при оценке $39 млрд — абсолютный рекорд сектора.

РаундСуммаОценкаДата
Series A$70MМай 2023
Series B$675M$2.6BФевраль 2024
Series C$1B+$39BСентябрь 2025
Всего~$1.9B | Инвесторы: Parkway VC, Nvidia, Microsoft, OpenAI, Jeff Bezos, Intel Capital, Brookfield

Skild AI — “Omni-bodied brain”

Основано Deepak Pathak и Abhinav Gupta из CMU/Meta. Концепция — единый foundation model для любых роботов: от промышленных манипуляторов до гуманоидов. SoftBank ведёт Series C.

РаундСуммаОценкаДата / Лид
Seed$14.5M2023
Series A$300M$1.5BИюль 2024, Lightspeed, Coatue, SoftBank, Bezos Expeditions
Series B$135M$4.5BИюнь 2025
Series C$1.4B$14-15BЯнварь 2026, lead: SoftBank

Сводная таблица: пять ключевых игроков

КомпанияОсновательТехнологияОценкаКлючевой инвестор
World LabsFei-Fei LiSpatial Intelligence (3D)$5BNvidia, a16z
AMI LabsYann LeCunJEPA / World Models$3.5BBezos Expeditions
Physical IntelligenceLevine, Finn, HausmanVLA (π0)$11BJeff Bezos, CapitalG
Figure AIBrett AdcockHumanoid + Helix VLA$39BParkway VC, Nvidia
Skild AIPathak, Gupta (CMU)Omni-bodied brain$14-15BSoftBank, Bezos Expeditions
📈

Инвестиционная картина: цифры рынка

2025 год стал переломным для Physical AI. Инвестиции в робототехнику превысили пик 2021 года, а раунды World Models выросли в 5 раз за год. Данные собраны из открытых источников: PitchBook, Crunchbase, Sacra, Kaiso Research.

Макро-цифры рынка

$13.8B Инвестиции в робототехнику, 2025 ↑ рекорд (превзошли пик 2021: $13.1B)
$27.6B Все инвестиции в robotics, 2025 ↑ удвоение с $13.7B в 2024
€6.5B Инвестиции в World Models, 2025 ↑ 5x рост с €1.3B в 2024
$50B+ Кумулятивные инвестиции к 2030 Прогноз Goldman Sachs

Крупнейшие раунды 2024-2026

Топ-7 раундов по сумме привлечения ($ млрд)
Figure AI
$39B
оценка
Skild AI
$14-15B
оценка
Phys. Int.
$11B
оценка
World Labs
$5B
оценка
Apptronik
$5.3B
оценка
AMI Labs
$3.5B
оценка
Prometheus
$6.2B
seed

Детализация крупнейших раундов

КомпанияРаундСуммаОценкаДата
Project PrometheusSeed$6.2BНоябрь 2025
Figure AISeries C$1B+$39BСентябрь 2025
Skild AISeries C$1.4B$14-15BЯнварь 2026
World LabsSeries A$1B$5BФевраль 2026
AMI LabsSeed$1.03B$3.5BМарт 2026
Physical IntelligenceSeries B$600M$5.6BНоябрь 2025
ApptronikSeries A-X$520M$5.3BФевраль 2026
🎯

Почему это интересно инвестору

TAM: размер рынка

Оценки Total Addressable Market сильно варьируются в зависимости от определения Physical AI, но даже консервативные прогнозы показывают рынок в сотни миллиардов долларов.

Сегмент2025ПрогнозCAGRИсточник
Physical AI (общий)$81.4B$1,145B (2035)33.5%Kaiso Research
Physical AI (альт.)$5.23B$49.7B (2033)32.5%SNS Insider
Робототехника (общая)$50B$111B (2030)14%ABI Research
Humanoid robots$38B (2035)137.7%ABI Research
Robotics software$24.5B (2030)ABI Research

Катализаторы 2025-2026: что движет рынком

Девять ключевых событий, которые определили динамику сектора и создали инвестиционный моментум:

  1. 1 NVIDIA Cosmos + GR00T (CES 2025): открытые world foundation models. Jensen Huang: “Physical AI has reached its ChatGPT moment”. Источник →
  2. 2 Meta V-JEPA 2 (2025): 1.2B параметров, zero-shot планирование роботов без task-specific обучения. Блог Meta →
  3. 3 Figure AI Helix (февраль 2025): первый commercial-ready VLA для humanoid. Подробнее →
  4. 4 Tesla Optimus Gen 3 (январь 2026): запуск массового производства гуманоидов.
  5. 5 AMI Labs $1B seed (март 2026): Ян Лекун, крупнейший seed в Европе. WIRED →
  6. 6 Project Prometheus (ноябрь 2025): $6.2B от Jeff Bezos. Built In →
  7. 7 OpenAI pivot (март 2026): Sora закрыт для consumers, перенаправлен на world simulation для robotics. TechJack →
  8. 8 NVIDIA GR00T N1 (март 2025): первый open foundation model для humanoid. NVIDIA Developer →
  9. 9 Physical Intelligence Series C (2026): $1B при оценке $11B — лидер VLA-моделей.

NVIDIA — “кирки и лопаты”

Как и в золотой лихорадке самые надёжные инвестиции — это не в золотодобытчиков, а в продавцов лопат. NVIDIA играет роль универсального поставщика инфраструктуры для всей экосистемы World Models: открытые модели (Cosmos), платформа для роботов (GR00T, Isaac Sim), чипы (Jetson, DRIVE). Jensen Huang на CES 2025 объявил: “Physical AI has reached its ChatGPT moment”. Компания инвестировала в World Labs, AMI Labs, Figure AI, Skild AI, Apptronik и Physical Intelligence — покрывая весь сектор ставками на всех игроков.

🚀

Связь с Project Prometheus и Jeff Bezos

Ни один инвестор не ставит на World Models так масштабно, как Jeff Bezos. Его инвестиционная стратегия охватывает весь стек технологий — от фундаментальных моделей до гуманоидных роботов и промышленной автоматизации.

Project Prometheus — стелс-стартап Bezos

В ноябре 2025 года Jeff Bezos совместно с Vik Bajaj (ex-Google) основал Project Prometheus — стелс-компанию с seed-раундом $6.2 млрд, один из крупнейших в истории венчурных инвестиций. Компания строит world models для симуляции физических сред в manufacturing: aerospace, чипы, автомобили, фармацевтика.

Project Prometheus = “AI for the physical economy”

Технология строит 3D-представления физических сред: реконструкция обтекания крыла самолёта, предсказание поломок компонентов, автоматизация производственных процессов. Приобретён General Agents (VLA-модель от ex-DeepMind). Советники: Ashish Vaswani, Jakob Uskoreit — авторы статьи “Attention Is All You Need”.

$6.2B seed ~120 сотрудников SF + London + Zürich +$10B в процессе

Полная картина инвестиций Bezos в World Models

Project Prometheus
Основатель + co-CEO
$6.2B+ seed
Physical Intelligence
Lead investor (Series A, B)
$2.4B → $5.6B → $11B
Figure AI
Investor (Series B, C)
$2.6B → $39B
Skild AI
Investor (Series A)
$1.5B → $14-15B
AMI Labs
Co-lead seed
$3.5B pre-money
Field AI
Ранний инвестор
“Physics-first” FM

AI is real, and it is going to change every industry.

Jeff Bezos, октябрь 2025

Почему именно Bezos? У него есть всё для доминирования в этом секторе: опыт масштабной автоматизации через Amazon (1M+ роботов на складах), аэрокосмическая инфраструктура Blue Origin как клиент для Project Prometheus, и безграничный капитал для долгосрочных ставок. Elon Musk уже назвал Bezos “copycat” из-за сходства Project Prometheus с xAI/Optimus — но это скорее подтверждение стратегической правильности направления.

⚠️

Разбор рисков

Любой инвестиционный тезис должен быть сбалансирован. Вот что может пойти не так в World Models и Physical AI.

  • 💸
    Pre-revenue статус Многие компании (Physical Intelligence, AMI Labs, Project Prometheus) не имеют значимой выручки. Инвесторы покупают технологию и команду, не бизнес-модель. Оценки основаны на потенциале, не на fundamentals.
  • Длительная коммерциализация Сам Ян Лекун оценивает сроки до продуктовых результатов в годы, не кварталы. World Models — это фундаментальная наука, не SaaS с быстрым time-to-market. Требуется терпение и долгий горизонт инвестирования.
  • 🔧
    Hardware costs Гуманоидные роботы стоят $30K-$150K. Хотя цены снижаются на 40% в год, массовое внедрение требует дешёвых и надёжных аппаратных платформ. Без дешёвого “тела” “мозг” World Models останется в лаборатории.
  • 🔄
    Sim-to-real gap 95% точности в симуляции превращается в 60% в реальности. Модели, обученные на синтетических данных, часто терпят неудачу при контакте с реальным миром. Это один из ключевых технических барьеров.
  • 📊
    Дефицит данных Недостаток качественных 3D-данных и дорогостоящая teleoperation замедляют обучение. В отличие от текста (весь интернет) или изображений (ImageNet), данных физического взаимодействия катастрофически мало.
  • 🫧
    AI bubble concerns Оценки растут быстрее фундаменталов. Figure AI оценена в $39B без реальной выручки. AMI Labs — $3.5B pre-money на seed. Если прогресс технологии замедлится, коррекция может быть болезненной.
  • ⚔️
    Конкуренция гигантов NVIDIA, Google DeepMind, OpenAI, Meta — у каждого есть ресурсы и мотивация доминировать. Стартапы рискуют стать acquisition targets или просто раздавлены масштабом Big Tech.

Эти риски реальны, но они не уникальны для World Models. Точно такие же аргументы звучали в 2012 году против deep learning, в 2017-м — против transformers, в 2022-м — против LLM. Каждый раз технология превосходила скептицизм.

🔑

5 ключевых выводов

  1. World Models — следующий фронтир AI после LLM. Переход от языкового интеллекта к физическому пониманию мира открывает рынок в триллион долларов. CAGR 33.5% по данным Kaiso Research. Это не тренд — это парадигмальный сдвиг.
  2. Рынок растёт экспоненциально. Инвестиции в World Models выросли с €1.3B до €6.5B за год (5x). Робототехника привлекла $13.8B в 2025 — рекорд, превзошедший пик 2021 года. Моментум ускоряется.
  3. Jeff Bezos — центральная фигура экосистемы. Через Bezos Expeditions, Project Prometheus ($6.2B) и персональные инвестиции он охватил весь стек: World Models (AMI Labs, Project Prometheus), robot foundation models (Physical Intelligence, Skild AI), humanoid robots (Figure AI).
  4. NVIDIA — “picks and shovels” для всего сектора. Открытая инфраструктура (Cosmos, GR00T, Isaac Sim) позволяет компании извлекать выгоду независимо от того, какой стартап победит. Плюс: Nvidia NVentures инвестирует в ключевых игроков.
  5. Ключевые технологические ставки: JEPA, VLA, Video Diffusion. JEPA (Meta/AMI Labs) — предсказание в латентном пространстве. VLA (Physical Intelligence/Figure/NVIDIA) — end-to-end control роботов. Video Diffusion (NVIDIA Cosmos/World Labs) — генерация синтетических данных. Выигрывает тот, кто правильно распределит ставки между подходами.

World Models представляют собой фундаментальный парадигмальный сдвиг в AI — от предсказания токенов (LLM) к предсказанию динамики физического мира. Это “базовый слой” для Physical AI, который определит победителей в робототехнике, автономном вождении, manufacturing и AR/VR на следующее десятилетие.

Аналитическая команда Project Prometheus, январь 2026

© 2026 Project Prometheus. Образовательный материал для членов инвестиционного клуба.

Все данные основаны на открытых источниках. Не является инвестиционной рекомендацией.

Обсудить в клубе
Посмотрите все проекты из индустрий

проекты из индустрий

интересное

аналитика