Posts Tagged Статистика

Градиентный бустинг (AdaBoost)

Градиентный бустинг нужен для задач классификации и регрессии, похож на случайный лес. Это сложная тема, в том числе и из-за сложной интерпретации метода, то есть возможность понятным языком объяснить…

Hyper Casual эргономика

Основа UX: люди хотят отдыхать и не напрягать мозг. А еще они хотят хороший продукт, хорошее качество обслуживания, дешевые цены. Но на самом деле все это не важно, если…

Математика в геймификации

Хорошая игра, как и любой хороший продукт, характеризуется грамотным балансом. Технически, это всем известное CPI < LTV. Но когда мы занимаемся прелиминарной балансировкой, то никуда не уйти от retention…

PCA: Снижение размерности данных

Снижение размерности это почти всегда плюс. Модель быстрее учится, меньше переобучения, малозначимые признаки не попадают в модель и не портят качество, сплошная экономия. А если модель очень большая (200+),…

ANOVA и Bootstrap: проверяем UX в Python

Когда специалист научился проводить A/B-тесты, он больше не расценивает это лишь как правильный ответ на собеседовании или страшилку для разработчиков. А просто строит scatterplot, violinplot или boxplot с осознанием,…

Получение данных из внешних источников

Функции R умеют читать данные не только с локального компьютера, но и из сети. Допустим, вам упала задача собрать все доступные контакты менеджеров по продажам определенного товара в вашем…

Python в анализе тестов

Принимать решения без данных это как играть в русскую рулетку: повезет – не повезет. Поэтому данные нужно копить с первого дня жизни бизнеса. Данные это сырье для бизнеса, и…

Работа с таблицами в R: Data.table и OLAP

Таблицы это один из основных способов работы со структурированными данными. В языке R для работы с таблицами существует множество библиотек. Data.table одна из самых быстрых R библиотек для работы…

Проверка результатов A/B теста

A/B-тесты это основной способ решения споров об интерфейсах в команде. Но часто эти споры решаются неверно, потому что ключевая ошибка при анализе результатов A/B теста это сравнение двух средних,…