Заметки о данных, ИИ, ИТ
и безопасности
Без маркетингового тумана. Так, как я думаю о задачах в реальной работе с собственниками и руководителями.
Аналитика в реальном времени: когда батч на самом деле достаточно
Почему большинство компаний переплачивает за стриминговую аналитику там, где батчевая обработка справилась бы дешевле и надёжнее.
Data mesh или центральное хранилище: как выбирать без идеологических споров
Практическая рамка для выбора между централизованным хранилищем данных и децентрализованным подходом data mesh - без евангелизма в обе стороны.
Контракты данных: дисциплина, которая отделяет порядок от хаоса
Что такое data contracts, почему они важны для любой команды, которая передаёт данные между системами, и как начать без сложной инфраструктуры.
Data mesh - это организационный паттерн, а не технологический выбор
Data mesh обсуждают, как будто это инструмент для покупки или платформа для развёртывания. Это не так. Понимание того, чем он является на самом деле, меняет оценку того, подходит ли он вашей ситуации.
Что нужно понять про эмбеддинги до запуска векторного поиска
Почему выбор модели эмбеддингов - это не технический вопрос на потом, а архитектурное решение с долгосрочными последствиями.
Векторные базы данных: что изменилось и зачем это нужно бизнесу
Почему векторные БД стали обсуждаемой темой вместе с волной LLM и что это реально означает для компаний, которые работают с внутренними документами.
Операционные данные и аналитика: зачем их разделять
Многие компании пытаются строить аналитику поверх операционных баз данных. Объясняю, почему это создаёт проблемы и как думать об архитектурном разделении.
Контракты на данные: как команды договариваются о качестве
Когда данными пользуются несколько команд, неизбежно возникают конфликты ожиданий. Контракты на данные - практический инструмент, который делает эти ожидания явными.
ChatGPT в переговорной: вопросы, которые теперь задают собственники
Волна интереса к ChatGPT приносит в переговорные комнаты конкретные вопросы об ИИ. Разбираю, что за ними стоит и с чего на самом деле начинать.
Аналитическая база данных против операционной: когда их нужно разделять
Почему одна база данных не может хорошо обслуживать и транзакции, и аналитику - и как понять, что настало время разделить их.
Видимость цепочки поставок: почему слой данных важнее дашборда
Как IoT-датчики и потоки данных в реальном времени меняют возможности компаний по контролю над цепочками поставок - и где большинство проектов буксует.
Kafka и потоковая передача событий: что нужно понимать руководителю
Понятное объяснение того, почему компании переходят на событийные потоки данных, что делает Kafka и когда сложность оправдана.