Блог - ksim.pro - страница 6

Данные 9 марта 2017

Каталог данных: дисциплина знать, что у вас есть

Почему управление метаданными - это не технический проект, а операционная необходимость для компаний, которые работают с данными серьёзно.

Читать

Данные 24 января 2017

Data lake без управления превращается в болото

Почему проекты по созданию корпоративного озера данных часто заканчиваются хранилищем файлов, из которого никто не знает, как достать нужное.

Читать

Данные 28 ноября 2016

Real-time данные и right-time данные: в чём разница и почему она важна

Не каждая задача требует данных в реальном времени. Ошибка в этом выборе стоит денег и усложняет архитектуру без пользы.

Читать

Данные 31 октября 2016

Кто владеет пайплайном данных, когда ответ - никто

В большинстве компаний пайплайны данных построены тем, кто нуждался в данных, не принадлежат никому и используются всеми. Это системная хрупкость, а не техническая проблема.

Читать

Данные 28 сентября 2016

Чему учат падения Pokemon Go: геоданные в масштабе

Pokemon Go - не бизнес-приложение, но инфраструктурная история лета 2016 года - настоящий урок о том, что в действительности стоит работа с геоданными в масштабе.

Читать

Данные 12 сентября 2016

PostgreSQL JSONB: когда не нужна отдельная NoSQL-база

Прежде чем добавлять MongoDB или другое документное хранилище в стек, стоит проверить, что уже умеет JSONB в PostgreSQL - и где он объективно заканчивается.

Читать

Данные 7 сентября 2016

Kafka как шина данных: что это значит для компании

Apache Kafka перестаёт быть только инструментом больших технологических компаний. Вот как объяснить её роль без технического жаргона.

Читать

Данные 21 июля 2016

Журнал событий как источник правды: зачем это нужно бизнесу

Event sourcing - не просто архитектурный паттерн. Это способ сохранить историю изменений и дать аналитике честный фундамент.

Читать

Данные 24 мая 2016

Сбор данных в полевых операциях: от бумаги к структурированному потоку

Компании с выездными командами теряют данные на этапе сбора. Разбираю, как перейти от бумажных форм и Excel к управляемому процессу.

Читать

Данные 19 апреля 2016

Потоковая обработка событий: когда бизнесу стоит на это смотреть

Apache Kafka и потоковая архитектура - не только для интернет-гигантов. Разбираю, какие бизнес-задачи оправдывают этот подход и где он избыточен.

Читать

Данные 23 февраля 2016

Почему структурирование данных должно предшествовать любой ML-модели

Прежде чем разговор доходит до выбора алгоритма, нужно разобраться с тем, из чего модель будет учиться. Разбираю этот шаг подробно.

Читать

Данные 10 ноября 2015

Потоковая обработка данных: когда операционные решения не терпят отложенного пакета

Когда бизнесу нужна потоковая обработка вместо пакетной, и что нужно решить до внедрения Kafka или аналогов.

Читать

Заметки о данных, ИИ, ИТ и безопасности

Каталог данных: дисциплина знать, что у вас есть

Data lake без управления превращается в болото

Real-time данные и right-time данные: в чём разница и почему она важна

Кто владеет пайплайном данных, когда ответ - никто

Чему учат падения Pokemon Go: геоданные в масштабе

PostgreSQL JSONB: когда не нужна отдельная NoSQL-база

Kafka как шина данных: что это значит для компании

Журнал событий как источник правды: зачем это нужно бизнесу

Сбор данных в полевых операциях: от бумаги к структурированному потоку

Потоковая обработка событий: когда бизнесу стоит на это смотреть

Почему структурирование данных должно предшествовать любой ML-модели

Потоковая обработка данных: когда операционные решения не терпят отложенного пакета

Заметки о данных, ИИ, ИТ
и безопасности