Татарстан

4 мифа о работе ИТ-специалиста в госсекторе

17.08.2020 14:17:22 |

Автор: admin

Вокруг работы в госсекторе существует много мифов: зарплаты 20 тысяч рублей, неадекватное руководство, семь кругов ада для согласования, а про agile никто не слышал. Откуда взялись эти мифы, и что из них правда, а что нет, рассказывает Константин Черников, HR-директор Центра цифровой трансформации ИТ-компании внутри Министерства цифрового развития Татарстана.

Сначала немного экспозиции и закрепления очевидных вещей: как ни крути, но айтишников мало, а вакансий для них много. Поэтому они могут выбирать сферу, работодателя и условия, а не соглашаться с первым попавшимся вариантом и трудиться за МРОТ. Когда базовые потребности вроде нормальной зарплаты закрыты, айтишник выбирает работу, исходя из интересных задач, конкретных видимых результатов и пользы, которую он может принести.

В ИТ, как и везде, существуют свои тренды и мода. Сначала все ринулись в крипту. Потом финтех. Далее бигдата, VR и прочие модные штуки. Но госсектор обычно никто не воспринимает как реальный вариант. Хотя именно там сейчас самые интересные задачи, новейшие технологии и стабильный бюджет, но сам госсектор окутан дымкой из мифов. Ниже те сомнения и возражения, которые мы слышим от кандидатов, и наше мнение о них.

В госухе бесполезная работа
Есть миф, что в госсекторе придется делать работу ради работы. Даже если глобально польза от кода есть, из-за растянутых процессов и долгого запуска все кажется нудным и бесполезным.

Эта проблема есть в любой сфере, и в каждой из них есть подобные задачи. Да и сотрудники разные: кому-то нравится сидеть за компом, чтобы никто не трогал, а кому-то нужно общаться с людьми и выяснять их потребности. Кому-то нравятся быстрые задачи и быстрые победы, кому-то взять legacy и неспешно переписать часть кода, который был разработан другой командой. А есть джуны, которые вообще на все готовы.

Важно понимать, что почти любой результат в государственном проекте будет виден. Ну, по крайней мере, у нас так: мы стараемся, чтобы бабушки могли проще получать медицинскую помощь, семьи субсидии на ребенка. Каждый сможет увидеть, а часто и воспользоваться тем продуктом, который он сам разработал

Например, сейчас мы разрабатываем технологию для оплаты ЖКУ и других госуслуг с помощью чат-бота.

Отсутствие гибких подходов
Часто говорят, что в государстве кровавый enterprise, установленные сроки и вообще умри, но сделай все по регламенту. Конечно, это ужасно на фоне идеальных ИТ-компаний, где можно использовать один подход, понять, что он нерелевантен, и попробовать другой. А потом и третий, и десятый и так, пока не кончатся деньги

Но суть в том, что сейчас государственные структуры отдают на откуп специально нанятым экспертам выстраивание внутренних процессов.

Хотя внутренние процессы выстраивают сами айтишники, есть большая проблема, которую как раз и решает Центр цифровых технологий это нагромождение законных и подзаконных актов, которые не дают вести нормальную разработку ИТ-продуктов.

Вот реальная ситуация: мы хотим, чтобы субсидия приходила через мобильное приложение сразу на счет жителя Татарстана. Но есть условный закон 1993 года, который гласит, что эта субсидия должна быть выдана рублями в кассе по предъявлению бумажки с тремя синими печатями. И все оцифровывать нельзя. Тут нужен бизнес-аналитик со стороны государства, который выстраивает процесс и инициирует изменение законодательного акта.

Чтобы иницировать только те проекты, которые приносят пользу населению, ЦЦТ разработал критерии проектной деятельности. Любая инициатива оценивается с точки зрения охвата и социальной значимости. Критерии легли в основу распоряжения кабинета министров РТ по проектной деятельности, которое позволяет подходить ко всем инициативам министерств как к нормальным IT-проектам.

Теперь любая инициатива проходит предпроектное обследование, и получается сформулированная задача, которую можно оцифровывать и реализовывать.

Есть еще одно сито технологическое: продукты должны уметь обмениваться данными, быть масштабируемыми и, при необходимости кроссбраузерными и кроссплатформенными. До принятия распоряжения о проектной деятельности системы вообще никак не общались и дублировали друг друга, поэтому сейчас одна из задач ЦЦТ создать единый цифровой ландшафт, на котором можно без проблем поднять любой проект без шаманства.

Устаревший стек технологий
Да, он действительно есть. Но есть структуры, готовые его менять. Но суть даже не в этом: сейчас большая часть государственных услуг предоставляется на бумаге, поэтому устаревшего кода просто нет. Вообще никакого кода нет. Поэтому специалисты могут использовать самые новые технологии и языки программирования, чтобы это сделать.

Тому же порталу госуслуг в Татарстане уже 10 лет, и некоторые называют его устаревшим. Но мы следуем правилу: пока работает не трогай. Конечно, написано все не на коболе, но развитие идет: совершенствуются и бизнес-процессы, и технологическая база.

Неадекватное руководство
На собеседованиях я иногда слышу такие истории: В этой фирме было неадекватное руководство, начальник забегал в офис каждые полчаса и проверял, работаю ли я, кидался матом и чем потяжелее. Но опять же эта проблема встречается повсеместно.

Мы понимаем, что от директора зависит многое. Как говорят, приходят в компанию, а уходят от руководителя. Вот наше видение того, каким должно быть начальство, от которого не уйдут.

Умеет доверять

Все зависит от готовности руководителя доверить изменения человеку-нечиновнику. Чтобы сделать что-то новое, нужно признать свою некомпетентность и взять специалиста, который в этом разбирается.

Отсутствие микроменеджмента

Руководитель не должен вмешиваться в каждый этап и говорить, что сотрудник делает что-то не так и проверять код каждые полчаса. Сотрудники сами справляются со своими задачами.

Пришел с рынка

Сейчас есть тренд на набор айтишников в госорганы, а не делать государственные IT-компании. Администратора не ставят сверху, а нанимают айтишника с рынка.

Не любит бюрократию

Если руководитель заинтересован в том, чтобы преодолеть все бюрократические трудности, то он будет руководствоваться аджайл-манифестом: главное продукт, а не документ.

Идеальный руководитель сам должен быть погружен в ИТ: не быть уверенным пользователем ПК, а знать R, работать с большими данными и быть в курсе последних изменений в сфере ИТ.

И что теперь, бежать в госуху?
А почему бы и нет. Мы не футурологи, а обычная ИТ-компания в госсекторе, но, вероятно, госсектор сейчас становится самой привлекательной сферой для ИТ и повторяет тот путь, который раньше проделали банки и финтех в целом. Смотрите сами:

Государственный персонал рано или поздно будет переходить на аутсорс. Нет единой компетенции государственное управление это набор компетенций, которые постоянно меняются. Поэтому нет смысла выращивать каких-то специальных ИТ-специалистов для работы в государственном секторе государство будет привлекать вендоров и создавать инхаус-команды из специалистов с рынка.

Государство становится сервисом. Существует четыре стадии цифрового развития государственных услуг:

Бумажная. Приносишь бумажку и получаешь бумажку;
Частично оцифрованная. Приносишь бумажку, получаешь документ на email;
(мы где-то здесь)
Цифровая. Все онлайн;
Предиктивная. Без вмешательства человека ребенок родился, и он уже записан в детский сад, а мама получает выплату.

Вот как раз третью и четвертую стадию мы и стараемся приблизить, а для этого всегда нужны классные сотрудники. Сотрудники, которые не верят в мифы :)

Подробнее..

Категории: Управление проектами , Управление персоналом , Карьера в it-индустрии , Стереотипы , Татарстан , Блог компании команда цифровой трансформации татарстана , Hr-бренд , Управление сотрудниками

Наш опыт работы с DeepPavlov голосовой помощник за 20 дней и приём 5000 звонков на горячей линии

21.07.2020 16:21:44 |

Автор: admin

Когда объявили режим самоизоляции, на горячую линию по коронавирусу в Татарстане поступало множество вопросов от жителей. Чтобы разгрузить операторов коллцентра, мы в Центре Цифровой Трансформации республики вместе с уполномоченным по ИИ в Татарстане разработали голосового помощника, который отвечал на несложные вопросы.

Для приема звонков мы использовали платформу Voximplant, а для распознавания вопросов и ответов DeepPavlov. Голосового помощника получилось запустить за две с половиной недели, и он помог обработать 5000 звонков. У нас получилось выкатить продукт, который помогал жителям Татарстана получать достоверную информацию от властей, да и просто выходить на улицу. Ниже расскажем, как мы это делали.

Какая задача стояла

Мы изначально задумывали сделать голосовой помощник, который бы помогал людям получать госуслуги и отвечать на часто задаваемые вопросы. Но когда началась вся канитель с коронавирусом, мы поняли, что Лилия поможет разгрузить коллцентр: например, консультировать на горячей линии, помогать получать цифровые пропуска и пособия по безработице. Все то, что человек может узнать на сайте госуслуг, можно узнать и у Лилии, а еще с ней можно просто поболтать.

Немного предыстории. 1 апреля в Татарстане ввели систему СМС-пропусков: чтобы выйти на улицу, нужно было отправить СМС на короткий номер с паспортными данными и указанием номера цели. Сначала целей было пять: доставка несовершеннолетних в образовательные организации, участие в похоронах, выезд на дачу, доставка лекарств и продуктов и изменение места проживания. Цели постепенно добавлялись и на последнем этапе их стало уже 12.

Через неделю после запуска мы прикрутили к Лилии возможность получения цифрового пропуска. Татарстан стал первым регионом, в котором можно было получить цифровой пропуск посредством голоса. Лилия умела определять цель, исходя из контекста. Например, человек говорит, что он хочет подстричься, и Лилия определяет соответствующий номер цели Поход в парикмахерскую.

Кроме оформления цифровых пропусков, Лилия должна была отвечать на вопросы татарстанцев. Мы задумывали голосового помощника, который бы отвечал на распространенные вопросы, вроде Что нужно сделать чтобы получить пропуск и Помогает ли имбирь от коронавируса.

Для решения этой задачи мы могли бы сделать и обычный IVR. Но IVR долго, и если делать нормально, то нужно закладывать сложную архитектуру. В общем, времени на это не было. Мы подумали, что сделать голосового помощника (который умеет переводить речь в текст, обрабатывать его, классифицировать интенты и выдавать голосовой ответ) проще. Хе-хе.

Как это выглядит со стороны пользователя

Тут все просто.

Человек звонит на горячую линию, ему предлагают выбрать между разговором с оператором и Лилией. На любом этапе можно переключиться на живого оператора.
Лилия предлагает озвучить свой вопрос и человек его задает.
Лилия отвечает и спрашивает, смогла ли она ответить на вопрос. Если ответ нерелевантный или Лилия не знает ответа на этот вопрос, то она просит его повторить или сформулировать по-другому.

Как обрабатываются звонки

Для приема звонков и реализации сценариев использовали платформу Voximplant: написали скрипт и подключали сигнал автоответчика. Лилия приветствовала человека и спрашивала, чего он хочет.

Звонящий задает вопрос по телефону. Затем Лилия начинала слушать. У VoxImplant мы использовали модуль ASR для перевода речи в текст, он под капотом вызывает модель Yandex.SpeechKit. Таким образом, аудиопоток переводится в текст, который потом проходит токенизацию и стемминг. Мы попробовали также извлекать признаки: NER, POS и Chunk для базовых методов ML, но все это занимало очень много времени.

Например, изначально, из вопроса Скажите, пожалуйста, как защититься от коронавируса мы стеммим защит и коронавирус и преобразуем их в векторное представление. Векторное представление сущностей попадает в классификатор по вопросам коронавируса (а позже и госуслуг). Теперь всем этим занимается DeepPavlov.

Дальше возможно несколько вариантов в зависимости от уровня уверенности (confidence):

Если сеть классифицировала вопрос с достаточным confidence (исходя из исследования пороги подбирались индивидуально, поклассово), то Лилия даст ответ на вопрос.
Если у сети малый confidence ответа, мы предполагаем, что это вопрос который мы не охватили в рамках нашего датасета (но вопрос при этом всё ещё относится к домену коронавируса) или человеку просто захотелось поговорить на другую тему. Например, спросил Кто такой Илон Маск.

Для таких вопросов мы использовали обученную на дампе Википедии модель BERT для задачи knowledge base question answering.

В конце Лилия обязательно верифицирует корректность распознавания интента и качество ответа, спросив: Ответила ли я на ваш вопрос?. Если пользователь ответит да, то Лилия будет ждать следующего вопроса. Если нет, то мы попросим переформулировать вопрос и пройдем весь цикл заново. Бывает так, что это не получается. Тогда в бой вступают живые операторы.

Сейчас Лилия говорит приятным голоском синтезатора речи от Яндекса мы немного поменяли тональность и увеличили скорость. Иногда Лилия путает ударения, но это можно исправить с помощью разметки. Конечно, хотелось бы добавить татарский, но пока это сложно.

Суммарно проект занял две с половиной недели с учетом датасетов: возникла идея, обсудили проект с министром и, как говорят у нас, алга. Неделя ушла на прикидку и исследование, еще дней 10 заняла разработка, затем мы дорабатывали и прикручивали дополнительные функции. Основными лошадками были Nvidia RTX2070. Для BERT'ов требовалось около 12-16 ГБ видеопамяти.

От LSVM и catboost до DeepPavlov

В процессе разработки мы использовали разные модели классификаторов. Сначала мы попробовали такие модели машинного обучения, как random forest, LSVM, catboost, logreg. Вообще точность моделей машинного обучения была не очень высокой. Почему так? Потому что многие вопросы пользователей очень похожи друг на друга: вопрос у меня ребенок заболел коронавирусом что делать достаточно похож на вопрос можно ли гулять с ребенком во время коронавируса, хотя это разные категории и требуются разные ответы.

Мы могли бы заняться извлечением сущностей, увеличением выборки, исследования. Но мы торопились. Поэтому мы решили использовать в работе библиотеку DeepPavlov от МФТИ, давшую точность 78% с логистической регрессией и BERT 84%.

Точность ответов зависит от разметки датасетов. У нас был список из 200 вопросов, которые люди задают на горячей линии, но они были неправильно разделены. Например, люди спрашивали, что делать, если у них заболел кто-то из родственников, и был вопрос, какие симптомы у коронавируса. Модели ML путались.

Результаты и планы на будущее

Лилия проработала 2 недели и обработала 5000 звонков. За это время Лилия существенно облегчила работу операторам горячей линии им не приходилось отвечать на банальные и повторяющиеся вопросы. Благодаря Лилии пользователи получали пропуска, ответы на вопросы и просто разговаривали. Конечно, были пользователи, которые ругались на нее и просили перевести на оператора.

Режим самоизоляции отменили, цифровые пропуска больше не действуют, но Лилия все еще в строю. Она продолжает отвечать на вопросы про коронавирус, но сейчас в нее добавили возможность отвечать на вопросы, связанные с госуслугами.

Мы министерство, и у нас, по факту, две задачи: чтобы другие ведомства нормально пользовались технологиями и чтобы жители Татарстана могли легко и просто коммуницировать с государством. Со второй задачей прекрасно справляется портал госуслуг наш, местный, а не федеральный. Но этот портал сайт и приложение, до которых некоторым добраться все-таки тяжело. А если жители не идут на портал, то портал пойдет к жителю, то есть мы движемся в сторону того, чтобы упростить взаимодействие с порталом людей, которые не особо пользуются интернетом.

Сейчас минцифра Татарстана работает над тем, чтобы люди могли получить госуслуги голосом и с помощью чата. Мы хотим сделать универсального помощника, которому можно позвонить/написать и получить ответы на все важные вопросы.

Пока что Лилия может подсказать, до скольки работает ЗАГС, а в будущем мы планируем, что она сможет принимать показания счетчиков (но это только тогда, когда мы решим вопрос с безопасностью передачи этих данных). В общем, мы превращаем Лилию в отдельный продукт.

Если вам было бы интересно поучить Лилию, велком в нашу команду.