Архитектура LTAP: как Lakebase переосмысляет хранение данных Postgres

Reynold Xin из Databricks описывает архитектуру Lakebase, облачного Postgres, где традиционный монолитный дизайн БД разбирается на независимые сервисы. Проблема монолитных БД (MySQL, Postgres, Oracle) в том, что WAL (журнал предварительной записи) и файлы данных лежат на одной машине, что создаёт каскад проблем: риск потери данных при отказе диска, необходимость физического клонирования для масштабирования и отказоустойчивости, конкуренция между транзакциями и аналитическими запросами за ресурсы.
Lakebase решает это, вынеся WAL в распределённый сервис SafeKeeper (дублирование через Paxos вместо локального диска) и файлы данных в PageServer, который кэширует данные и сбрасывает их в облачное хранилище (озеро). Вычислительный слой становится стателесс, может запускаться, останавливаться, масштабироваться свободно. При этом произвол чтения сохраняется благодаря многоуровневому кэшированию (буфер памяти → локальный диск → PageServer).
Ключевое преимущество, LTAP (Live Transactional Analytics Platform): аналитика и транзакции работают над одной копией данных в реальном времени, без задержек и лишних затрат на CDC или зеркалирование. Дополнительные возможности: хранилище практически бесконечно (облако), вычисления масштабируются мгновенно и падают до нуля в простое, гарантирована долговечность (коммит после репликации в SafeKeeper), восстановление и ветвление БД происходит за метаоперацию (сек вместо часов), как в коде.
Ключевые факты
- Монолитная архитектура БД (WAL + данные на одной машине) ведёт к потере данных, неэффективному масштабированию и конкуренции рабочих нагрузок
- Lakebase выносит WAL в SafeKeeper (репликация Paxos) и данные в PageServer (кэш облачного хранилища), оставляя вычисления стателесс
- LTAP позволяет OLTP и аналитике работать на одной копии данных в реальном времени без CDC или зеркалирования
- Преимущества: бесконечное облачное хранилище, масштабируемость вычислений (0, infinity), мгновенное ветвление/клонирование/восстановление БД, гарантирована долговечность
- Настоящий Postgres, совместим по проводному протоколу, SQL, драйверы, расширения; разработан на Berkeley, как и исходный Postgres
Почему это важно
Текущие OLTP-БД (Postgres, MySQL, Oracle) проектировались десятилетия назад и наследуют монолитную архитектуру, которая плохо масштабируется в облаке. Разделение вычислений и хранилища, ключ к использованию преимуществ облачной инфраструктуры (дешёвое, надёжное хранилище, эластичные вычисления). LTAP особенно важна для компаний, которые одновременно обслуживают транзакции (веб-приложения) и запускают тяжёлую аналитику (отчёты, ML).
Кому это важно
Разработчикам и архитекторам, работающим с Postgres в облаке; компаниям с гибридными рабочими нагрузками (OLTP + аналитика); командам, которые хотят масштабировать без физического клонирования и синхронной репликации; пользователям, нуждающимся в мгновенном ветвлении БД для экспериментов и миграций.
Как это применить
Lakebase доступна в Databricks и Neon. Если вы используете Postgres, переход прозрачен благодаря совместимости проводного протокола: драйверы и приложения работают без изменений. Архитектура позволяет: запускать масштабируемые аналитические запросы без риска замедлить продакшн, ветвить рабочую БД за секунды для тестирования, платить только за использованные ресурсы (масштабируемые вычисления, облачное хранилище). Для высоконагруженных систем это означает упрощение инфраструктуры (меньше реплик, меньше резервных копий-копий).
Можно ли доверять
Авторство за Reynold Xin, соучредителем Databricks (создатель Apache Spark, автор исследований в UC Berkeley). Архитектура опирается на классические работы (ARIES-модель из 69-страничной академической статьи), исследованиями Neon в области cloud-native БД, и практическими разработками на Databricks. Код и продукт уже в продакшене у обеих компаний (Databricks, Neon). Но это новый продукт, требует времени на проверку на масштабе и сценариях сообщества.
Риски и подводные камни
LTAP в стадии активного развития, возможны изменения в API и поведении. Высокая зависимость от облачных сервисов (SafeKeeper, PageServer), если они упадут, недоступны транзакции и чтения. Сетевые задержки между компонентами могут быть выше, чем в локальной системе (хотя многоуровневое кэширование должно снизить влияние). Затраты на облачное хранилище могут быть непредсказуемы при неправильном управлении. Для миграции с классического Postgres требуется понимание новой архитектуры и тестирование критических сценариев.
«Если вы заново спроектируете OLTP-БД сегодня, вы начнёте с компонентов современного облака: дешёвого и надёжного облачного хранилища объектов в паре с эластичными вычислениями.»
— Reynold Xin, Databricks