Шаги построения рекомендательной системы в обучении персонала

Широкое распространение в последние годы получили программы, которые пытаются предсказать, какие объекты будут интересны пользователю, имея определенную информацию о его профиле. До 2006 года такие алгоритмы не пользовались популярностью. Но все изменилось осенью 2006 года, когда компания Netflix предложила разработчикам 1 000 000$ за лучший алгоритм предсказания. Конкурс продлился 3 года.

Расскажем сегодня о своем опыте построения рекомендательной системы в обучении персонала.

Сегодня в мире цифровых технологий большинство разработок используют в своей основе рекомендательные системы.

Почему?

Рекомендательные системы это современный пример успешного IT-инструмента для понимания интересов и предпочтений другого человека. В данном случае не важно знакомы вы или нет, работаете в одной компании или находитесь в разных уголках Земли. Любая рекомендательная система учится понимать человека на основании имеющейся о нем исходной информации у машины. Чем больше такой инфо, тем больше шансов, что проект будет интересен и не потеряет интерес своей аудитории.

Изначально рекомендательные системы использовались преимущественно для привлечения внешнего клиента и роста прибыли компаний. Сегодня их начали активно применять и для внутреннего клиента. Например, рекомендации обучающих курсов для развития персонала внутри компании.

Существует три основных класса рекомендательных систем

1. Content-based filtering (фильтрация контента).

В данной системе берется каждый сотрудник и машина анализирует его историю обучения, а также пул не пройденных им курсов. В число рекомендаций при этом попадут не пройденные курсы, которые похожи по содержанию на изученные ранее.

2. Collaborative filtering (коллаборативная фильтрация).

В данной системе искомому сотруднику предлагаются курсы к изучению, которые заинтересовали похожих на него коллег.

3. Гибридные системы, комбинирующие предыдущие подходы.

Оптимальный вариант сочетать оба типа фильтрации. Однако в реальности ввиду ограниченности исходных данных быстрее и легче внедрить рекомендательную систему, основанную на коллаборативной фильтрации.

Почему?

Модель работает в режиме офлайн. Система ориентирована на долгосрочный периметр изменений в предпочтениях Users. Как правило, такие изменения имеют под собой более весомые причины, чем сиюминутные предпочтения Users.

Отсутствуют оценки учебных курсов. В классическом варианте источником информации об учебном курсе для его включения в периметр рекомендаций служит средняя оценка (для ее формирования каждый сотрудник по окончании обучения выставляет курсу оценку в границах заданной шкалы). Чем выше средняя оценка, тем выше шанс, что курс будет рекомендован. Однако оценки есть не всегда

Достаточное количество features (кроме оценок) для поиска похожих Users.

Критериями поиска похожих Users внутри компании могут выступать:

должность / грейд (значение определено диапазоном);

вертикаль / направление работы сотрудника;

схожесть истории обучения;

квалификация (например, Data Analist, Data Engineer, Data Scientist);

возраст (вся численность сотрудников разделена на группы с заданным интервалом);

стаж (вся численность сотрудников разделена на группы с заданным интервалом).

Количество похожих Users и количество рекомендованных курсов также следует ограничить.

В нашей компании был опыт разработки MVP рекомендательной системы обучающих курсов, для включения в План развития сотрудников. Рекомендации формировались на основы матрицы корреляции Пирсона. Критериями поиска похожих Users выступали:

должность (-1, +2);

направление работы поиск был настроен по штатной принадлежности сотрудников к идентичному подразделению в разных филиалах России;

схожесть истории обучения похожими были установлены курсы по идентичности наименования;

квалификация в рамках нашей компании выделены только сотрудники категории Data Scientist;

возраст все сотрудники компании разделены на группы в интервале 5 лет (весь возрастной диапазон находится в промежутке от 20 лет и до 65);

стаж - все сотрудники компании разделены на группы в интервале 5 лет.

Количество похожих Users 3 человека.

Количество рекомендованных курсов 6 курсов (по 2 от каждого похожего User).

Язык построения алгоритма рекомендательной системы Python.

На первом этапе код отрабатывает исходные данные (DataSet), например, штатная численность компании в разрезе ФИО, история обучения каждого сотрудника и обязательно информация для отработки критериев поиска похожих Users.

На втором этапе код формирует матрицу корреляции и для каждого User машина подбирает 3 наиболее похожих Users по параметрам из списка выше.

# Проходим по строкам DataSetfor row in df:    corrMatr = df.corrwith(df[row])  # Функция корреляции матрицы    corrMatr = pd.DataFrame(corrMatr)    tempMatr = corrMatr  # Временная матрица    tempMatr = tempMatr.drop([row], axis=0)    li = list()    li2 = list()    print(row)    k = 0    while k < 6:        if len(tempMatr) == 0:  # Если количество строк tempMatr равно 0, выходим из цикла while            break        name = tempMatr.idxmax().item()  # Значение по индексу первого появления максимума в строке        dp = df3[df3['Tab'] == name].set_index('Tab')  # Получаем те строки из таблицы Обучение,            # в которых значение столбца Tab равно name        if name not in li2 and ((df[name]['pos'] <= df[row]['pos'] + 2 and df[name]['pos'] >= df[row]['pos'])):            # Если сотрудник еще не рассмотрен и подходит по должности            li2.append(name)            col_dp = dp.columns.tolist()  # Список столбцов рассматриваемого DataFrame            random.shuffle(col_dp)  # Перемешиваем строки            for yy in col_dp:  # Проходим по ним                if pd.DataFrame(df3[df3['Tab'] == name][yy]).reset_index()[yy][0] == 1 and \                    pd.DataFrame(df3[df3['Tab'] == row][yy]).reset_index()[yy][0] == 0 and \                        yy not in li and yy in df777['Курсы'].tolist():                    # Если курс еще не был включен в список предложенных                    recList.append([row, name, yy,                                    pd.DataFrame(df4[df4['Tab'] == row]['TB']).reset_index()['TB'][0], \                                    pd.DataFrame(df4[df4['Tab'] == name]['TB']).reset_index()['TB'][0], \                                    pd.DataFrame(df4[df4['Tab'] == row]['FIO']).reset_index()['FIO'][0], \                                    pd.DataFrame(df4[df4['Tab'] == name]['FIO']).reset_index()['FIO'][0]])                    k += 1                    li.append(yy)                    # Удаляем рассмотренного сотрудника из tempMatr                    tempMatr = tempMatr.drop([tempMatr.idxmax().item()], axis=0)                    break  # Выходим из цикла for        else:  # Удаляем рассмотренного сотрудника из tempMatr            tempMatr = tempMatr.drop([tempMatr.idxmax().item()], axis=0)# Заполняем результирующий DataFrame и выгружаем его в Excelrecomendations = recomendations.append(recList, ignore_index=True)recomendations.to_excel('итог.xlsx')

Схематично работу алгоритма при поиске учебного курса для включения в перечень рекомендаций можно увидеть на рисунке ниже.

На третьем этапе важно организовать доведение рекомендаций в удобном для сотрудника формате. К возможным и доступным формам корпоративного информирования можно отнести:

персональные рекомендации в личном кабинете сотрудника (например, на корпоративном портале или образовательной корпоративной платформе);

персональная рассылка писем по корпоративной почте.

Наша команда разработчиков остановились на использовании корпоративной почты.

Данный алгоритм рекомендаций был внедрен в пилотном режиме (на протяжении одного квартала). Созданный MVP достиг поставленного руководством целевого значения конверсии в 25%, что позволяет признать его успешным и готовым к внедрению в пром.

Datascience это не только fit-predict

Представим, что вы начали работать в компании, которая производит однообразные операции с бесконечными таблицами. Например, в крупном ретейлере или у ведущего оператора связи. Ежедневно перед вами ставят задачу вы

Наверное, все разработчики слышали, что нужно писать чистый код. Но не менее важно писать и использовать безопасный код.

Python-разработчики обычно устанавливают модули и сторонние пакеты, чтобы не изобретать велосипеды, а использовать готовые и проверенные решения. Но проблема в том, что они не в

Привет, Хабр!

Cо времен нашего последнего поста в JetBrains Academy изменилось довольно много: мы выпустили важные обновления платформы, опубликовали множество новых проектов и тем, а также ввели годовую подписку! Кроме того, мы проанализировали наши проекты и составили рейтинг лучших из них по мнению наших пользователей. Ниже мы расскажем обо всем этом подробнее.

Настройка программного обеспечения

Без промедления начнём. Нам нужно установить следующее ПО:

Windows 10
Anaconda 3 (Python 3.8)
Visual Studio 2019 (

Этой весной Питерская Вышка и JetBrains впервые провели проектную смену для старшеклассников Школу по практическому программированию и анализу данных. В течение пяти дней 50 участников со всей страны работали над групповыми проектами по машинному обучению, NLP, мобильной и web-разработке.

Первое место заняла команда Deep Q-Mario ребята создали не

Мы рады сообщить, что стал доступен июньский релиз расширения Jupyter для Visual Studio Code. Если вы работаете с Python, мы рекомендуем загрузить расширение Python из Marketplace или установить его прямо из галереи расширений в Visual Studio Code. Если у вас уже установлено расширение Python, вы также можете получить последнее

Логотип статьи определяет три, как временные, так и географические, точки на моём жизненном пути, через которые лежал мой путь в страну под названием Программирование. В городе Чебоксары, на родине легендарного комдива Гражданской войны В.И.Чапаева, прошло моё детство (1954-1968 г.г.), там я закончил 8

Всем привет. С вами я, stalker320, и сегодня я хотел бы рассказать про написание служебных скриптов, запускающихся в редакторе. Всем желающим прочесть - добро пожаловать под кат

EditorScript - это такой скрипт, который можно запустить по нажатию комбинации Ctrl+Shift+X прямо из движка. Он может исполнять различные служебные функции. К примеру создать необходимую структуру каталогов в проекте.

Привет, меня зовут Александр, я старший разработчик ПО в Центре разработкиOrionInnovation. Хочу признаться, я люблю рассказывать про C++ и не только на различных митапах и конференциях.Ивотядобрался доХабра. НаCppConfRussiaPiter2020 я рассказывал про концепты и послевыступлен

Работая в компании IT-аутсорса в качестве руководителя 3 линии поддержки, задумался, как автоматизировать подключение сотрудников по RDP, через VPN к серверам десятков клиентов.

Таблички с адресами, паролями и прочими настройками серверов, конечно, хорошо, но поиск клиента и вбивание адресов с аккаунтами занимает довольно существенное время.
Держать все подключения к VPN в Windows не самая лучшая идея, да и при переустан

В 26-м выпуске NP-полного подкаста я рассказывал, что начал переводить один из своих сервисов из Redis Sentinel на Redis Cluster. На этой неделе я захотел потестировать данный код, и, конечно же, выбрал Testcontainers для этого. К сожалению, Redis Cluster в тестовых контейнерах не з

Мне на удивление часто приходится говорить о том, почему мне всё ещё нравится язык C, и о том, почему я плохо отношусь к C++. Поэтому я решил, что мне стоит об этом написать, а не снова и снова повторять одно и то же.

Как это обычно бывает у C-программистов, язык C не был ни моим первым яз

Традиционные подходы к автоматизации HR насчитывают не один десяток лет, и обязательно требуют существенного вовлечения со стороны ИТ-службы (по крайней мере в крупных компаниях). Это приводит к необходимости искать общий язык, учиться формулировать задачи и идти итеративным путем, - imho редко когда ИТ-решения для управления персоналом сразу "взлетают". Пару лет назад все стали говорить о low code решениях как новом эффективном ср

Как построить успешную IT-компанию, которая:

Делает топовые проекты по производительности и безопасности?
Работает на федеральном уровне и зарубежных рынках?
Имеет одну из лучших систем организации труда?
Подготовила сотню специалистов, которые вышли на IT-рынок?

Это все вещи, которые удались мне и моему партнёру. Конечно, простого ответа на з

Продолжаем знакомить вас с интересными компаниями на Хабр Карьере. Сегодня в выпуске компания SiFOX, которая разрабатывает и запускает ИТ-продукты для телеоператоров на рынках РФ, Африки и Южной Америки. О том, как всё устроено в Сайфокс нам рассказали Сергей Ма

Общаться в профессиональной среде, ходить на конференции и митапы, просто посидеть вечерком в приятном баре с профессионалом высокого уровня и обсудить какие-то классные идеи: всё это может помочь в работе. Среди этих ресурсов одно из первых мест занимают книги.

Под катом я расскажу вам о литературе, которая оказала на меня влияние как на управленца и разработчика. И, как мне кажется, может быть полезна любому, кто хочет выр

Два года назад никто и подумать не мог, что белые воротнички будут работать из дома. И что удаленная работа может быть такой же продуктивной, как офисная. В 2020-м миф о том, что в офис нужно ходить каждый день, был разрушен. Поэтому пора снять оставшиеся табу. Эксперты начи

Я недавно латала дыры в понимании разницы между Quality Assuarance и Quality Control. Статей на эту тему много, я накидала свой вариант, хотелось по существу. Делюсь с вами. Enjoy, если актуально!

Кто такой QС Engineer

Контроль качества (QC) - часть международного стандарта управления качеством ISO 9000. Суть контроля качества сводится к поиску дефектов и ошибок после создания продукта.

Таким

Расскажем сегодня о своем опыте пос

Представьте человека, который изучает алгоритмы. Чтобы понять как они работают, приходится изучать их код и представлять, как компьютер будет его выполнять. Это странно почему мы должны учиться думать как компьютер, вместо того, чтобы заставить его помогать на

Сразу с позитивного и очевидного

Сами по себе экзамены и сертификаты не несут в себе ничего отрицательного, негативные моменты будут рассмотрены ниже, начнем с позитивных и очевидных:

Сертификация подтверждает ваши технические знания (повышает "видимость" вашего CV для нового проекта/заказчика)
Позволяет двигаться в профессии, например от среднего уровня в "Professional" уровень

Ответ Так сложилось исторически люди не любят, потому что он ничего не объясняет.

Технари говорят: дайте мне табличку и схему, я хочу знать, как работает система и как устроен английский, тогда я смогу его выучить.

Лингвисты отвечают: для начала изучим систему с

Мы продолжаем цикл обучающих вебинаров Tech Diving и приглашаем на них всех, кто интересуется указанными в заголовке поста темами. В прошлый раз гостей с Хабра было особенно много: пользуясь случаем, благодарим вас за участие. И напоминаем, что технические сессии Dell Technologies это открытые вебинары, которые проводят наши самые опытные сотрудники. В прямом эфире они подробно раскрывают заявленные темы и отвечают на любые вопросы

Привет, Хабр! Меня зовут Анна Агабекян, я ментор и автор курсов по направлениям "

До какого-то момента самый быстрый способ профессионального роста это выделяться компетенцией. То есть быть крутым специалистом, который в одно лицо может всё. Это очень комфортная и приятная позиция, потому что вы отвечаете только за себя, не несёте огромных расходов каждый месяц и не делаете н

Я основал компанию Gumroad в 2011 году. В 2015 году у нас было рекордное количество людей - 23 штатных сотрудника с полной занятостью. В 2016 году, после неудачной попытки поиска финансирования, я вернулся в точку, с которой начинал. В компании снова был всего один сотрудник - я сам.

В настоящее время, когда меня спрашивают, сколько человек работает в G

Расскажем сегодня о своем опыте пос

Привет, меня зовут Сергей и я отвечаю за техническую поддержку компании itsoft, так что, в этой статье речь пойдет именно про поддержку.

Поддержка это лицо компании для текущих клиентов. Однако, так ли часто мы сталкиваемся с хорошей поддержкой? Ответ, к сожалению, очевиден.

В данной статье я расскажу о нашем опыте и поделюсь рецептами, которые помогли стать поддержке нашего дата-центра лучше.

Что всех бесит в

В очередной раз мы увидели дикий пример, когда компания судится со своими бывшими сотрудниками. На удивление много людей в комментариях защищали работодателя, так у меня родился Вася. Наш Василий ушел от своего работодателя к конкурентам. Василий руководил проектом по созданию ARM процессора на прошлом месте и продолжил это делать у конкурентов. По факту Василий не является незаменимым, но он неплох, примерно, к

Привет, Хабр!

Сегодня поговорим не о технологиях, о токсичных коллегах. Считаем, что будет полезно прочитать всем. Зачастую люди, попавшие под влияние токсичного человека, даже не сразу понимают, что не так. Это происходит от того, что токсичные люди ловкие манипулято

За что я плачу тебе деньги? обычный вопрос работодателя работнику, причем саркастический, как правило.

За что я тут корячусь на тебя? столь же обычный вопрос работника к работодателю.
Разобраться, за что же действительно работодатель платит деньги наемному работнику, поможет моя собственная теория, закодированная в десять букв ПЗП ПЗС ПЗПИ

	Русский
	English

Шаги построения рекомендательной системы в обучении персонала

Сейчас читают

Python

Автоматизация машинного обучения

Перевод Ищем уязвимости в Python-коде с помощью open source инструмента Bandit

JetBrains Academy платформенные обновления, любимые проекты пользователей и годовая подписка

Управляем звуком ПК от активности пользователя с помощью Python

Настройка программного обеспечения

Обучение с подкреплением в Super Mario Bros. Сравнение алгоритмов DQN и Dueling DQN

Jupyter в Visual Studio Code июньский релиз

Программирование

Пятьдесят лет на стезе программирования. Часть I. Начало пути. Отчий дом и Казанское суворовское военное училище

Принцип работы EditorScript

Производительность компилятора при работе с концептами в C20

Powershell настоящий язык программирования. Скрипт оптимизации рутины в техподдержке

Как подружить Redis Cluster c Testcontainers?

Перевод Почему я всё ещё люблю C, но при этом терпеть не могу C?

Управление персоналом

Нужна ли HR low code автоматизация?

Как ролевые игры помогли мне стать техническим директором

Где работать в ИТ в 2021 SiFOX

Книги, которые повлияли на меня как на разработчика и управленца

Почему в будущем мы будем работать по 5 часов в день, 4 дня в неделю

Кто такой QA Engineer, QC Engineer и Software Engineer in Test

Кто такой QС Engineer

Рекомендательная система