Мобильный оператор Tele2 расширил существующий кластер хранения и обработки больших данных (Big Data) за счёт решения RT.DataLake. Общая ёмкость нового внедрённого кластера Hadoop RT.DataLake составила 2,4 петабайта. Об этом сообщили в пресс-службе компании.
Это решение позволило на 40 процентов нарастить полезную ёмкость платформы Big Data и увеличить производительность для расчётов задач машинного обучения. Благодаря расширению компания сократила зависимость от иностранного программного обеспечения, получила возможность увеличивать вычислительные мощности и масштабировать текущее решение без ограничений.
Tele2 использует кластер Hadoop для хранения и аналитики данных с 2018 года. За это время в него интегрировали более ста источников данных, а ежедневный объём интегрируемых данных достиг 100 терабайт. Платформой Big Data ежедневно пользуются десятки бизнес- и технических команд, при этом основным внутренним клиентом является команда аналитики и монетизации данных.
Нагрузка на кластер непрерывно росла, а свободное место уменьшалось. Сложные процессы интеграции данных затрудняли работу команды специалистов по данным. В связи с этим компания решила разделить архитектуру платформы Big Data на сегмент обработки данных и сегмент Data Science. Для расширения платформы Tele2 выбрала продукт RT.DataLake «Ростелекома» на базе технологии Hadoop.
— Сборка RT.DataLake является одним из самых современных коммерческих дистрибутивом Hadoop в мире — она состоит из самых свежих стабильных версий фреймворков и компонент. Это позволяет решить потребности инженеров данных и Data Scientists Tele2, которые крайне требовательно относятся к регулярному обновлению версий компонент в кластере, — объяснили выбор в пресс-службе оператора.