МегаФон / Статьи / Хабр

Профиль Статьи 124Новости 13Вакансии 2Подписчики 34K

Extremesarova 7 часов назад

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 3: Специализированное машинное обучение

Средний

22 мин

679

Блог компании МегаФонBig Data*Машинное обучение*Учебный процесс в ITКарьера в IT-индустрии

Роадмэп

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В предыдущей статье я поделился материалами для подготовки к этапу по классическому машинному обучению.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по специализированному машинному обучению.

Extremesarova 18 мар в 13:03

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 2: Классическое машинное обучение

Средний

13 мин

7.2K

Блог компании МегаФонBig Data*Машинное обучение*Учебный процесс в ITКарьера в IT-индустрии

Роадмэп

В предыдущей статье я поделился материалами для подготовки к одному из самых волнительных (для многих) этапов - Live Coding.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по классическому машинному обучению.

Extremesarova 21 фев в 16:33

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 1: Live Coding

Средний

14 мин

15K

Блог компании МегаФонPython*SQL*Алгоритмы*Big Data*

Роадмэп

В данной статье разберемся что такое live coding интервью и как к нему готовиться.

Материал в первую очередь будет полезен Data Scientist'ам и ML инженерам, при этом некоторые разделы, например, Алгоритмы и структуры данных подойдут всем IT специалистам, которым предстоит пройти секцию live coding.

DariaSatco 16 ноя 2023 в 13:45

Персонализация тарифного плана для новых абонентов: как оцифровать привлекательность

Средний

10 мин

2.4K

Блог компании МегаФонBig Data*Машинное обучение*Искусственный интеллект

Кейс

В этой статье расскажем про подход к решению задачи о персонализации тарифных планов для абонентов новой базы в рамках CVM-проекта. Поговорим о том, как с помощью ML определить оптимальные параметры тарифа для абонентов с короткой историей, и как посчитать привлекательность полученного тарифа.

totsamymatveev 31 окт 2023 в 12:24

Когда одной ARIMA мало. Прогнозирование временных рядов нейросетями

Средний

12 мин

Блог компании МегаФонPython*Big Data*Машинное обучение*Искусственный интеллект

Туториал

Привет, Хабр! Меня зовут Никита, я работаю в Мегафоне аналитиком больших данных. В этой статье я хочу поговорить про временные ряды, а если конкретнее, про использование нейросетей для их прогнозирования.

В статье мы не только разберем две актуальные архитектуры для прогнозирования, но и применим их на реальных данных. В дополнение к статье вас ждет код, с помощью которого вы легко сможете запустить сетки и применить их для решения своих задач!

sle_mary 29 сен 2023 в 17:51

Hadoop в любой непонятной ситуации. Как выжить кластеру в большой ML команде

Средний

9 мин

3.3K

Блог компании МегаФонPython*Big Data*Машинное обучение*Hadoop*

Туториал

Привет, Habr !

Я работаю инженером по машинному обучению в Мегафоне. Занимаюсь аналитикой данных и являюсь частью команды разработки MLOps платформы. Задача нашей команды состоит в том, чтобы выстраивать и оптимизировать процессы разработки и продуктивизации моделей машинного обучения, предоставлять функционал для основных этапов (сбор данных, MQ/DQ, продуктивизация).

Сегодня поговорим о том, какие сложности могут возникать при работе с кластером Hadoop и какие есть методы для их решения.

Видеозапись по мотивам статьи можно посмотреть здесь.

Эта статья будет интересна аналитикам и инженерам, которые работают с BigData и регулярно сталкиваются с необходимостью продуктивизировать модели на Hadoop.

edgar-dev20 25 авг 2023 в 16:17

Анализ эффективности кэширования на бэкенде ЛК МегаФон

Сложный

8 мин

2.6K

Блог компании МегаФонВысокая производительность*Анализ и проектирование систем*Серверная оптимизация*Распределённые системы*

Туториал

По мере расширения функциональности сервиса и роста его аудитории мы неизбежно сталкиваемся с узкими местами в производительности. Прежде чем масштабировать ресурсы для эксплуатации, следует понять, насколько эффективно эксплуатируется текущая конфигурация.

Одним из таких узких мест может стать ваше распределенное хранилище для кэша. Все мы привыкли к тому, что оно нас спасает от тяжелых запросов в БД или обращенийк внешним системам с большой задержкой. Но рано или поздно может возникнуть ситуация, когда конфигурация этого хранилища будет на грани своей оптимальной производительности и в случае высоких нагрузок (аварий, спровоцированных наплывом пользователей или рекламными кампаниями) хранилище может подвести нас.

Как определить, что утилизация ресурсов кэширования происходит оптимально? Что если довольно большая часть нагрузки не приносит реальной пользы, и от нее с легкостью можно избавиться, тем самым разгрузив хранилище? В рамках этой статьи мы оценим эффективность кэширования бэкeнда ЛК МегаФон и расскажем о результатах проведенных мероприятий для оптимизации.

Valen-rus 15 сен 2022 в 16:40

Голос в мобильных сетях. От чего зависит качество?

6 мин

10K

Блог компании МегаФонРазработка систем связи*Стандарты связи*Сотовая связь

Привет, Habr!

На связи МегаФон и в данной статье мы подробно расскажем всё про передачу голоса в мобильных сетях.

Что определяет качество речи?
Какие речевые кодеки используются в мобильных сетях и их отличия?
Как оператор измеряет и контролирует качество речи в мобильных сетях?
Какие речевые технологии появятся в сетях 5G?

MegaFon 19 мая 2022 в 18:10

Мобильная связь на колесах

6 мин

12K

Блог компании МегаФонРазработка систем связи*Стандарты связи*Сотовая связь

Туториал

Хабр, привет)

Сегодня расскажем про мобильную альтернативу базовой станции, ее типы и почему не всегда возможно ее построить. Инженер МегаФона написал «просто о не просто телекоме», поэтому статья будет интересна тем, кто интересуется работой сотовой сети и качеством связи смартфона.

+19

Radioplan 26 апр 2022 в 08:40

Сотовая сеть. Как спланируешь, так абонент дозвонится или нет

7 мин

Блог компании МегаФонСтандарты связи*Сотовая связь

Туториал

Хабр, привет. Я, Сергей, отвечаю за стратегическое планирование инфраструктуры в МегаФоне. Продолжаю серию статей о «непросто телекоме», где сотрудники инфраструктуры рассказывают о связи и своей работе. Статья зайдет тем, кому нравится разбираться в технологиях работы телекома (уровень новичок) и понимать почему связь хорошо или плохо работает. В этой статье расскажу про свою работу в планировании сети. Развею мифы, что работа инженера, - «чинит железки и связь, устанавливает антенны, лазит по крышам и т.д.». В жизни все интереснее.

Читать

+10

sharapova_k 12 апр 2022 в 07:00

Игры, в которые играют люди, или Как повысить посещаемость приложения мобильного оператора

6 мин

3.6K

Блог компании МегаФонРазработка игр*Монетизация мобильных приложений*Монетизация игр*Дизайн игр*

Хабр, привет!

Мы — Паша и Катя, лидируем направление геймификации программы вовлечения в МегаФоне. Расскажем про создание мобильных игр в личном кабинете МегаФона, поделимся интересной статистикой и инсайтами. Ответим на вопрос, почему незатейливая геймификация в личном кабинете — успешный проект. Сами не ожидали такого :)

-10

IvanWiz 28 мар 2022 в 11:46

Причина и следствие

13 мин

5.5K

Блог компании МегаФонData Mining*Big Data*Статистика в IT

Из песочницы

Мы привыкли, что Machine Learning предоставляет нам большое количество предиктивных методов, которые с каждым годом предсказывают события лучше и лучше. Деревья, леса, бустинги, нейронные сети, обучение с подкреплением и другие алгоритмы машинного обучения позволяют предвидеть будущее все более отчетливо. Казалось бы, что нужно еще? Просто улучшать методы и тогда мы рано или поздно будем жить в будущем так же спокойно, как и в настоящем. Однако не все так просто.

Когда мы рассматриваем бизнес задачи, мы часто сталкиваемся с двумя моментами. Во-первых, мы хотим понять что к чему относится и что с чем связано. Нам важна интерпретация. Чем сложнее модели мы используем, тем более нелинейные они. Тем больше они похожи на черную коробку, в которой очень сложно выявить связи, понятные человеческому разуму. Все же мы привыкли мыслить довольно линейно или близко к тому. Во-вторых, мы хотим понять - если мы подергаем вот эту "ручку", изменится ли результат в будущем и насколько? То есть, мы хотим увидеть причинно-следственную связь между нашим целевым событием и некоторым фактором. Как сказал Рубин - без манипуляции нет причинно следственной связи. Мы часто ошибочно принимаем обыкновенную корреляцию за эту связь. В этой серии статей мы сконцентрируемся на причинах и следствиях.

Но что не так с привычными нам методами ML? Мы строим модель, а значит, предсказывая значение целевого события мы можем менять значение одного из факторов - одной из фич и тогда мы получим соответствующее изменение таргета. Вот нам и предсказание. Все не так просто. По конструкции, большинство ML методов отлично выявляют корреляцию между признаком и таргетом, но ничего не говорят о том, произошло ли изменение целевого события именно из-за изменения значения фичи. То есть, ничего не говорят нам о том - что здесь было причиной, а что следствием.

danilkinkin 18 янв 2022 в 06:00

Почему важно тестить на устройствах, которыми пользуются ваши пользователи, а также немного об Emoji

7 мин

5.4K

Блог компании МегаФонВеб-разработка*Типографика*Программирование*

Туториал

Почему важно тестить на устройствах, которыми пользуются ваши пользователи, а также немного об Emoji

Привет Хабр! Друзья зовут меня Данил, я web-разработчик в МегаФоне и работаю над системой обработки обращений наших пользователей. А их у нас огромное количество, и я каждый раз удивляюсь богатому русскому языку.

Под катом хочу рассказать о том, как мы внедряли emoji-клавиатуру в нашу систему DARM. С какими проблемами столкнулись и чего нам это стоило. Прочитавшим до конца плюс в карму и оберег от ошибок.

edgar-dev20 23 дек 2021 в 09:00

Как мы логшипим в Elasticsearch и что думаем о Filebeat

11 мин

18K

Блог компании МегаФонАнализ и проектирование систем*Администрирование баз данных*DevOps*

Туториал

Привет, я - Эдгар, backend-разработчик личного кабинета МегаФон, поделюсь решением проблемы log shipping-процесса в централизованное хранилище Elasticsearch, которое мы нашли вместе с командой.

art-glazunov 8 ноя 2021 в 09:31

«От категорий к векторам», или нестандартное кодирование категориальных данных. Часть 2

7 мин

2.7K

Блог компании МегаФонData Mining*Big Data*Машинное обучение*

Туториал

Привет, Хабр! С вами снова Артём, Team Lead Data Scientist из МегаФона. Надеюсь, вам понравилась первая статья серии о нестандартных методах кодирования категориальных данных, где я поделился своим опытом и показал, как с кодированием справляется тематическое моделирование. Во второй части вы узнаете о более сложных подходах. Инсайты могут быть полезны специалистам в Data Science для решения широкого класса задач: от классификации до построения рекомендательных систем.

В путь

Fattakh 5 окт 2021 в 10:20

4 дня из жизни unix-инженера, хроника разработки скрипта

13 мин

5.6K

Блог компании МегаФонНастройка Linux*Системное администрирование*Программирование*Серверное администрирование*

Статья будет полезна unix-инженерам и владельцам информационных систем, которые сталкиваются в своей работе с нехваткой технических данных о серверной нагрузке за длительный период времени.

Я - unix-инженер и расскажу, как мы разрабатывали скрипт по логированию потребления ресурсов сервера процессами, пошагово, в виде фотографии своего рабочего дня. А точнее, четырёх дней: пройдёмся по этапам, начиная с выявления проблемы и заканчивая развертыванием в проде. Параллельно покажу взаимодействие команды на каждом этапе наглядно. Вас ждет скрипт в конце лонгрида).

Итак в путь >>

fregatmf 28 сен 2021 в 11:46

Упала связь, обрыв на линии и при чем тут собака

3 мин

9.8K

Блог компании МегаФонIT-инфраструктура*Беспроводные технологии*Стандарты связи*Сотовая связь

Инсайты телекома. Легкий и позитивный контент для тех, кому интересно погрузиться в будни инженеров МегаФона и узнать, как работает связь. Почему LTE становится EDGE, когда очень нужно.

Спойлер: любишь истории со счастливым концом - дочитай до конца :)

Читать

+25

Mozalevsky 25 авг 2021 в 10:00

Почему Chapterы не летают

7 мин

3.9K

Блог компании МегаФонAgile*

Привет, мы - Agile коучи МегаФона и эта статья посвящена разбору тех трудностей, с которыми мы столкнулись, развивая самоорганизующиеся сообщества в нашей и не только компании. Надеемся, что наш опыт и выводы, которые мы сделали, будут полезны как тем, кто только вступает в ряды Scrum мастеров и коучей, так и более опытным коллегам.

-2

art-glazunov 25 июл 2021 в 21:23

«От категорий к векторам» или нестандартное кодирование категориальных данных. Часть 1

7 мин

4.8K

Блог компании МегаФонData Mining*Big Data*Машинное обучение*Data Engineering*

Туториал

Привет, Хабр! С вами Артём, аналитик больших данных МегаФона. На работе занимаюсь рекомендательными системами и интересуюсь NLP. Эти две вещи и привели меня к рассматриваемой тут теме, так что садитесь поудобнее, и поехали. Кстати, к статье прилагается код, ищите ссылки внутри.

В путь

Блог компании МегаФон 10 марта 2021

Глубокая экспертиза: коллекция полезных узконаправленных исследований в хабрастатьях

Современные технологии — сфера многообразная. Многие темы в ней бесконечно далеки друг от друга. Невозможно быть экспертом сразу во всех из них, но можно — в какой-то одной. Именно статьи таких экспертов — подробные, сложные, узконаправленные; словом, лучшие — мы собрали для хабравчан в этой коллекции. Выбранные материалы отвечают на все вопросы по своей теме. Показывают, как лучше всего изложить свои знания, если вы профи. И подсказывают, из каких ещё источников читателю получить знания.

Посмотреть коллекцию

+31

2 3 ...

6 7