Заметки о данных, ИИ, ИТ
и безопасности
Без маркетингового тумана. Так, как я думаю о задачах в реальной работе с собственниками и руководителями.
Версионирование API - это управление контрактами, а не техническая формальность
Почему у каждого API должна быть политика версионирования и что происходит с интеграциями, когда её нет.
ETL-пайплайн - это производственная линия, и мониторить её надо соответственно
Почему отказ ETL-процессов - это операционный инцидент, а не техническая неполадка, и как выстраивать наблюдаемость за потоками данных.
Почему ИИ-проекты не доживают до результата: пять повторяющихся паттернов
Анализ типичных причин, по которым ИИ-инициативы останавливаются или не приносят обещанного эффекта - и что с этим делать.
ML в производстве требует процессов ещё до появления MLOps
Почему компании, которые серьёзно занимаются машинным обучением, неизбежно приходят к необходимости версионировать не только код, но и данные, модели и эксперименты.
Почему оценки IT-проектов почти всегда ошибочны - и что с этим делать
Разрыв между оценочными и фактическими сроками IT-проектов - известная и устойчивая проблема. Разбор структурных причин, по которым это продолжается, и практик, которые её уменьшают.
Утечка данных: что делать в первые 72 часа
Практический разбор того, как компании реагируют на инциденты с персональными данными - и почему большинство делает это неправильно.
API-first для внутренних систем: зачем это важно до того, как их стало много
Строить внутренние инструменты и системы с подходом API-first - это не лишняя работа. Это дисциплина, которая предотвращает интеграционный хаос, который большинство компаний потом годами распутывают.
Облачная зависимость от вендора: как принимать осознанное решение
Когда vendor lock-in в облаке - это разумный компромисс, а когда - риск, который стоит оценить заранее.
RPA: что это на самом деле решает и где упирается в стену
Роботизация бизнес-процессов полезна в определённом наборе обстоятельств и ненадёжна за их пределами. Честный разбор того, чего ожидать, прежде чем браться за RPA-проект.
Почему подготовка признаков всё ещё важна в эпоху глубокого обучения
Глубокое обучение автоматизирует извлечение признаков - но не отменяет необходимость думать о том, какие данные вы подаёте на вход модели.
ML-модели деградируют молча - и большинство компаний этого не замечает
Модель, которая была точной при запуске, постепенно перестаёт быть точной по мере того, как меняется мир. Почему мониторинг деградации модели не является опциональным, и как настроить его до того, как это превратится в инцидент.
BERT и новая планка для прикладного NLP
Что модель BERT меняет в практическом применении обработки текстов и почему это важно для компаний, которые работают с неструктурированными данными.