Русский

	Русский
	English

Авторизация

Ip-адрес

Восстановление пароля

Регистрация

Статистика

Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на рынке их уже достаточно. Ответ на этот вопрос звучит очень просто: мы понимали, как улучшить текущие решения как минимум по пяти параметрам.

Количество (агрегировать больше всех в мире);
Реальная удаленка (а не позиции в стиле "remote until COVID-19");
Актуальность (часто на схожих сайтах можно найти большое количество неактуальных вакансий);
Хороший поиск (по нашему мнению поиск на текущих сайтах с удаленными вакансиями находится на уровне 2005 года);
Фильтр по гражданству.

О последнем параметре я и хочу сегодня рассказать.

Прежде, чем вы начнете читать. Сегодня мы запустились с Bergamot на ProductHunt. И, если у вас вдруг возникло желание поддержать наш продукт, будет круто. Ищите нас тут.

Проблема

Иногда компании устанавливают ограничения для граждан некоторых стран (например, компания готова нанимать только ребят с гражданством США / или конкретным типом визы ЕС). Как правило, на страницах с описанием вакансий нет отдельного поля где выводились бы подобные ограничения. И поиска/фильтра, соответственно, тоже нет. Поэтому соискателю приходится внимательно читать текст каждой вакансии, чтобы понять, есть ли вообще смысл откликаться на эту позицию.

Мы знали, как решить эту проблему, а именно показывать пользователю только те вакансии, на которые он реально может претендовать, учитывая его гражданство.

Анализ

Сначала мы думали решить эту задачу простыми алгоритмическими методами. Базовая идея заключалась в следующем:

Шаг 1

Ищем определенные ключевые слова в тексте, например: only, remote in, authorized to work in и так далее.

Шаг 2

Ищем рядом с ключевыми словами локацию. Как правило, это слово, которое начинается с заглавной буквы. Если такое слово-локация находится, то оно и является ограничением.

Окей, если в вакансии написано USA only, то такая логика работает идеально. Но если капнуть глубже, становится понятно, что ограничения могут быть обозначены самыми разными, например:

This role is remote and you can be based anywhere across the UK
Living in Europe is a must
This opportunity is only open to candidates within Canada at this time
Location: Argentina (any part of the country its great for us!)
и еще сотни других описаний.

Очевидно, алгоритмами задачу не решить и мы попробовали использовать силу ML-a.

Задача

На всякий случай ещё раз сформулирую задачу. На входе текст с описанием вакансии, в котором, как правило, содержится описание компании, стек технологий, требования, условия, бенефиты и так далее. На выходе у нас должны быть параметры:

restriction: 0 (no) / 1 (yes)

если restriction = 1, то тогда необходимо выделять еще и страну, по которой есть ограничение

Решение

Структура решения

Итак: на входе у нас текст, в котором обычно содержится куча всего. Задача была несколько сложнее, чем просто написать обычный классификатор. Сначала нужно было найти, что именно классифицировать.

Так как мы пытаемся решить проблему с локациями, для начала нам нужно найти их в тексте. Потом выделить все предложения, в которых содержались локации и уже для них написать классификатор.

Нахождение локаций

Сначала мы также хотели решить задачу в лоб: найти где-нибудь список всех стран и городов и просто искать их вхождение в тексте. Но опять же, задача оказалась не такой очевидной.

Во-первых, ограничения касались не только стран и столиц мира, а также небольших городов и штатов. Например Can work full time in Eugene, OR / Hammond, IN. А сделать список локаций всех уровней уже сложнее.

Во-вторых, написания локаций в вакансиях часто отличались от стандартного (например 100% Remote in LATAM).

Поэтому для выделения локаций мы приняли решение использовать NER. Пробовали разные готовые варианты:

В итоге выбор пал на spaCy, потому что из готовых и бесплатных вариантов spaCy EntityRecognizer показал наилучший результат.

Итого: нам удалось выделить в тексте локации.

Разделение на предложения

Для разделения на предложения, где есть локации, мы тоже использовали spaCy.

На выходе мы получили список предложений из текста, где содержатся локации. Вот примеры таких предложений:

The position is remote so the only thing is they have to be in the US and be able to work Eastern or Central time.
This job is located out of our Chicago office, but remote, US-based applicants are still encouraged to apply.
This is a remote role, but we're looking for candidates based in Montreal, Canada.

Классификатор

Эти предложения и должна была разметить модель. Важно у нас не было возможности сделать датасет с десятками тысяч таких предложений (на это нужно очень много времени), поэтому при подборе модели нам надо было учесть эти ограничения.

Решили попробовать несколько моделей, среди которых как более простые CNN и LSTM, так и более современные transformers. Последние предсказуемо оказались лучше, обучение которых сводилось по сути к fine-tunning это нам точно подходило, ведь датасет, как я уже сказал выше, был невелик.

Среди transformers наилучший результат показала архитектура RoBERTa (roberta-base) с показателем точности 94% для нашего датасета.

Нормализация локаций

На основе классификатора и NER-a для каждой вакансии мы получили вот такие дополнительные поля:

restriction: 1 (yes); location: London

Restriction отдавал классификатор. А вот Location выдавал NER. Из-за того что в поле Location могли быть разные написания городов и стран, мы еще сделали дополнительную нормализацию через Google API. Остановились на том, чтобы сделать ограничения по странам.

То есть на выходе получалось:

restriction: 1 (yes); location: United Kingdom

Итог

В итоге мы теперь умеем это делать и кандидаты могут фильтровать неподходящие для них вакансии. Mission accomplished (вроде бы! вы можете сами потестить Bergamot и написать, что думаете).

Источник: habr.com

К списку статей

admin

Опубликовано: 26.05.2021 18:20:11

Сейчас читают

Комментариев (0)

Имя

Электронная почта

Поисковые технологии

Наша анонимность утрачена?

IT-технологии развиваются с каждым годом. Многие корпорации полным ходом развивают технологические подходы в области сбора и обработки полученной информации. Одним из таких подходов является использование баз данных цифровых отпечатков пользователей сети Интернет.

Отпеч
Перевод Как работает поиск изображений в Dropbox

Если вам нужно найти фотографию, сделанную на пикнике несколько лет назад, вряд ли вы помните имя, которое камера автоматически присвоила файлу в момент съёмки, например, 2017-07-04 12.37.54.jpg.Вы просматриваете всё подряд фотографии, их эскизы, пытаетесь определить
Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на ры
Перевод У каждого приложения должна быть палитра команд

В старых и новых приложениях незаметно начинает появляться инструмент, упрощающий взаимодействие и ускоряющий выполнение действий. Это мощное поле поиска, которое я называю power bar; иногда оно имеет название command palette.

Power bar, похожая на поиск Spotlight в macOS, встраивается в приложение и обычно вызывается сочетанием горячих клавиш CMD+K (или CMD+SHIFT+P). После её вызова пользователь вводит в неё
А контент они за меня тоже выберут? Как умная система рекомендаций студентам советы по учёбе даёт

Весной 2021 проходит шестой запуск проектно-образовательных интенсивов Университета 20.35: студенты из 40+ вузов объединились в команды вокруг собственных идей или бизнес-задач от компаний
Recovery mode Гарантии в SEO миф! Или кто что обещает, и кто что реально может выполнить

Выведение сайта в топ поисковой выдачи это тот результат, ради которого чаще всего заказывают SEO-услуги. Но обеспечить его могут не все. Есть компании, которые лишь создают видимость продвижения. Низкую эффективность объясняют жесткой конкуренцией, хотя при заключении договора гарантированно обещали место в топе. Чтобы избежать напрасных трат денег, давайте разбираться, является ли возможным гарантирование результата SEO-продвижен

Машинное обучение

Стоит ли смотреть в сторону Data science?

Очень много людей с самым разным бэкграундом, и не всегда даже техническим, в последнее время пытаются перейти в data science. И такой ажиотажный интерес - проблема для всех, кто рассматривает переквалификацию в эту сферу. Потому что рынок труда может оказаться наводнён соискателям без опыта.

С точки зрения потенциального работодателя: вы скорее возьмёте выпускника технического вуза, или человека за 40, без профильного опыта
Перевод Учимся понимать таблицы на меньшем объеме данных

Задача распознавания семантического следования (textual entailment), или импликации (natural language inference), в текстах на естественном языке состоит в определении того, может ли часть текста (посылка, антецедент) подразумеваться или противоречить (или не противоречить) другому фрагменту текст
Распознавание эмоций в записях телефонных разговоров

Технология распознавания эмоций в речи может может найти применение в огромном количестве задач. В частности, это позволит автоматизировать процесс мониторинга качества обслуживания клиентов call-центров.

Определение эмоций человека по его речи уже относительно насыщенн
БСД, или как легко объяснить финансистам их же задачи в терминах машинного обучения

Мне давно нравятся Байесовские сети доверия
Перевод Оптимизация платежей в Dropbox при помощи машинного обучения

Представьте ситуацию: вам нужно воспользоваться оплаченным (как вы думаете) сервисом и вдруг оказывается, что он отключен за неуплату. Такая неприятность портит впечатление от бренда, снижая поток прибыли, а внезапно отключенный клиент может не вернуться к сервису. К старту ку
Log-Sum-Exp Trick как свойства функций делают работу классификаторов реальной

В этой статье мы рассмотрим, что такое классификатор, поговорим о мультиклассовой классификации с помощью нейронных сетей. Затем, ознакомившись с контекстом перейдем к основному топику поста к Log-Sum-Exp Trick. Напишем формулы и разберемся, как этот трюк помогает избежать переполнения чисел с плавающей то

Развитие стартапа

Пароль для стартапа

Недавно администрация США объявила о возобновлении программы Internationa
Перевод Перевод Курса по стартапам и бизнесу от Стэнфордского Университета. Лекция 2. Команда и реализация стартапа

Почему Курс по стартапам и бизнесу от Стэнфордского Университета, является одним из самых лучших в мире для стартаперов? Дело в том, что лекторами данного курса являются лучшие из лучших стартап-предприниматели, такие как: Сем Альтман президент самого известного венчурного фонда Y Combinator, Дастин Мо
IOS интервью в Vivid

Возможно, вы знаете про Vivid, где-то слышали или же видите впервые. Мы делаем один из самых быстрорастущих и многообещающих финансовых сервисов в Европе. Чтобы не быть голословным, вот некоторые из наших показателей:
Перевод Как Replit отжимает мой open-source проект

Я думаю, вам следует закрыть проект и прекратить работать над ним. Я привлеку наших адвокатов в понедельник, если к тому времени вы не выполнитте условия. [...] Мы были крошечной компанией, когда вы стажировались у нас [...] К счастью, сейчас мы намного больше, и, что очень важно, у нас есть много денег, чтобы заплатить за лучших юристов, если мы будем вынуждены пойти по этому пути.
из переписки с C
Перевод Brex будущее бизнес-банкинга и управления денежными средствами

Когда Энрике Дубуграс и Педро Франчески присоединились к группе YC W17 с идеей VR-стартапа, они быстро столкнулись с проблемой. Они подали заявку на получение кредитной карты для бизнеса, предназначенной для финансирования программного обеспечения и других расходов, но им было отказано. Бизнес-
Из столицы в провинцию. Как мы открывали первый бар. Часть 1

Посленеудачного опыта с попыткой открыть сеть крафтовых кафе-мороженыхв Минске, мы искали более стабильную бизнес-модель и решили открывать бар.
Что этот материал делает на Хабре?

Проведя тысячи часов в офисной рутине невольно задумываешься, можно ли применить свои опыт и знания для создания бизнеса в реальном секторе.

Чего стоят тысячи часов офи

Карьера в it-индустрии

Пятьдесят лет на стезе программирования. Часть I. Начало пути. Отчий дом и Казанское суворовское военное училище

Логотип статьи определяет три, как временные, так и географические, точки на моём жизненном пути, через которые лежал мой путь в страну под названием Программирование. В городе Чебоксары, на родине легендарного комдива Гражданской войны В.И.Чапаева, прошло моё детство (1954-1968 г.г.), там я закончил 8
Стоит ли смотреть в сторону Data science?

Очень много людей с самым разным бэкграундом, и не всегда даже техническим, в последнее время пытаются перейти в data science. И такой ажиотажный интерес - проблема для всех, кто рассматривает переквалификацию в эту сферу. Потому что рынок труда может оказаться наводнён соискателям без опыта.

С точки зрения потенциального работодателя: вы скорее возьмёте выпускника технического вуза, или человека за 40, без профильного опыта
Работа в Dell Technologies мнение девушки. Гендерное равенство, декреты и построение карьеры после рождения детей

Обычно в этом блоге мы пишем про серверы, компьютеры или IT-решения, но сегодня будет статья совсем другого плана: это эксперимент. Нам показалось, что было бы неплохо время от времени делиться с вами историями наших сотрудников через призму их личного опыта работы в Dell Technologies. Весьма вероятно, что многим будет интересно почитать о том, как именно у нас всё устроено. Так что очень надеемся на обратную связь в комментариях и
Как ролевые игры помогли мне стать техническим директором
Как построить успешную IT-компанию, которая:
- Делает топовые проекты по производительности и безопасности?
- Работает на федеральном уровне и зарубежных рынках?
- Имеет одну из лучших систем организации труда?
- Подготовила сотню специалистов, которые вышли на IT-рынок?
Это все вещи, которые удались мне и моему партнёру. Конечно, простого ответа на з
Где работать в ИТ в 2021 SiFOX

Продолжаем знакомить вас с интересными компаниями на Хабр Карьере. Сегодня в выпуске компания SiFOX, которая разрабатывает и запускает ИТ-продукты для телеоператоров на рынках РФ, Африки и Южной Америки. О том, как всё устроено в Сайфокс нам рассказали Сергей Ма
Почему в будущем мы будем работать по 5 часов в день, 4 дня в неделю

Два года назад никто и подумать не мог, что белые воротнички будут работать из дома. И что удаленная работа может быть такой же продуктивной, как офисная. В 2020-м миф о том, что в офис нужно ходить каждый день, был разрушен. Поэтому пора снять оставшиеся табу. Эксперты начи

Поисковая оптимизация

Перевод Самый популярный HTML-редактор в выдаче Google это афера с поисковой оптимизацией

Это история о том, как я случайно обнаружил масштабную аферу с поисковой оптимизацией.

Резюме

Некоторые высокорейтинговые онлайн-инструменты для редактирования или очистки HTML, похоже, тайно вставляют ссылки в свои выходные данные, чтобы протолкнуть себя и связанные с ними сайты в рейтинге поисковых систем. Эта афера очень успешна и, похоже, до сих пор оставалась незамеченной.

Инструмен
Как настроить Facebook Conversion API с помощью GTM Server Side

Отслеживание событий на стороне сервера и Conversion API были доступны на Facebook в течение нескольких лет. Но, начиная с 2021 года, FB стал активнее это продвигать. Если у вас есть свой менеджер в Facebook, помогающий с вашей учетной записью, он, скорее всего, позвонит вам и порекомендует настроить
Как стать инхаус SEO-специалистом?

Популярный SEO-специалист и маркетолог Кевин Индиг (Kevin Indig) в своем блоге поделился собственным опытом и описал плюсы и минусы по работе SEOшника в агентстве и инхаус команде. Мы перевели и адаптировали данный материал для блога
Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на ры
KeyClusterer 2.3 Многопоточность, интеграция с Key Collector

Всем привет! В новой версии KeyClusterer нами была проведена работа над оптимизацией импорта данных, добавлена многопоточность с возможностью сбора данных в поисковой системе Google, добавлено отображение ТОП сайтов по видимости. Ниже детали о новой версии.
Отказ от ссылок в 2021году

Темаотказа от ссылоквсегда была предметом горячих споров, а эксперты по SEO расходились во мнениях относительно того, следует ли отклонять плохие ссылки и как это может повлиять нарейтинг сайтав Google.Хотя масштабы спорны, алгоритмы ранжирования все же влияют накачество ссылок, поэтому плохая ссылка может очень сильно повредить поисковый рейтинг.Со всеми изменениями и проблемами, приобретенными к 2021году, мы считаем целесообразны

Машинное+обучение

Борьба с несбалансированностью классов с помощью модуля NEARMISS

В этой статье я расскажу об одном из методов для устранения дисбаланса предсказываемых классов. Важно уточнить, что многие методы, которые строят вероятностные модели, прекрасно работают и без устранения несбалансированности. Однако, когда мы переходим к построению невероятно
Обучаем качественные модели без DensePose разметки

Возможно ли обучить качественную модель, которая предсказывает 3D координаты поверхности тела животного по фотографии, без соответствующей DensePose разметки?

Исследователи из Facebook Artificial Intelligence Research затронули этот вопрос на конференции по машинному зрению CVPR 2020.
Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на ры
CatBoost и ML-конкурсы

Анализ данных и базоваямодель

Вступление

Эта статья основана на данных конкурса, который компания Driven Data опубликовала для решения проблем с источниками воды в Танзании.

Информация для конкурса была получена Министерством водных ресурсов Танзании с исполь
Перевод Запускаем модель машинного обучения на iPhone

Чего уж только на Хабре не было, и DOOM на осциллографе, тесте на беременности и калькуляторе запускали, даже сервер Minecraftна зеркалке Canon 200D поднимали. Сегодня же, специально к старту нового потока курса по
Перевод Применение машинного обучения к кинетике ядерных реакторов

Рис. 1. Реактор TRIGA на полной мощности.
На Хабре часто выкладывают туториалы по разным областям знаний. Сегодня, к старту нового потока курса по

Machine learning

Перевод Оптимизация платежей в Dropbox при помощи машинного обучения

Представьте ситуацию: вам нужно воспользоваться оплаченным (как вы думаете) сервисом и вдруг оказывается, что он отключен за неуплату. Такая неприятность портит впечатление от бренда, снижая поток прибыли, а внезапно отключенный клиент может не вернуться к сервису. К старту ку
Log-Sum-Exp Trick как свойства функций делают работу классификаторов реальной

В этой статье мы рассмотрим, что такое классификатор, поговорим о мультиклассовой классификации с помощью нейронных сетей. Затем, ознакомившись с контекстом перейдем к основному топику поста к Log-Sum-Exp Trick. Напишем формулы и разберемся, как этот трюк помогает избежать переполнения чисел с плавающей то
Геопространственное моделирование с применением методов машинного обучения

Всем привет! Меня зовут Константин Измайлов, я руководитель направления Data Science в Delivery Club. Мы работаем над многочисленными интересными и сложными задачами: от формирования классических аналитических отчетов до построения рекомендательных моделей в ленте приложения.

Сегодня я расскажу пр
Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на ры
Разработка Computer Vision в онкологии почему всегда нужно еще больше сил, времени и денег

Привет!

Я Жека Никитин, Head of AI в компании Celsus. Больше трех лет мы занимаемся разработкой системы для выявления патологий на медицинских снимках.

Несмотря на то, что медицинским ИИ давно уже никого не удивишь, актуальной и структурированной информации о п
KotlinDL 0.2 Functional API, зоопарк моделей c ResNet и MobileNet, DSL для обработки изображений

Представляем вам версию 0.2 библиотеки глубокого обучения KotlinDL.

KotlinDL 0.2 теперь доступен на Maven Central (до этого он лежал на bintray, но закатилось солнышко земли опенсорсной). Появилось столько всего нового: нов

Удалённая работа

USB over IP удалённое администрирование

Большую часть своей жизни я жил и работал в Москве. Занимался тем, что менял здоровье на деньги. Правда, на очень хорошие, поэтому под занавес пятого десятка купил квартиру в тихом приморском городке, далеко от столичной суеты и ежедневной нервотрёпки.

Особой необходимости в работе у меня не было. Дети уже стали самостоятельными настолько, что запросто могут содержать нас с женой. Да и скопить удалось прилично. Однако, были
История о том, как я иду к должности JS разработчика через обучение на курсах в Skillbox

Как пришел я к тому чтобы вообще начать учить JS

В 2019 году, 1 сентября, в дождливый осенний день, я решил навсегда завязать с прошлым. Последние 5 лет работы менеджером не приносили удовольствия и не несли перспектив. Увольняюсь с должности менеджера вино-торговой компании, подумал я. И погружаюсь в программирование!

Три месяца до декабря я упорно изучал HTML + CSS и верил, что легко попаду в разработчики, стоит м
Вспомнить все или как мы вернулись изудаленки в 2021 году

На самом деле2020-йгодбыл не так уж плох: мы заключилинесколькокрупных контрактов,выпустиликрупнейшееобновление платформыJmix, открыли новыеофисывдвух городахиорганизовали новогодний корпоратив на 500 человек вформате популярного вечернего ТВ-шоу.Вот только удаленкасильно нарушила командные связи. И тогдавозвращение в офис превратилось в операцию Вспомнить всес агентами Вакцинация, Пиццаи Буги-Вуги. Рассказываем, что происходило у
Вспомнить все или как мы вернулись изудаленки в 2021 году

На самом деле2020-йгодбыл не так уж плох: мы заключилинесколькокрупных контрактов,выпустиликрупнейшееобновление платформыJmix, открыли новыеофисывдвух городахиорганизовали новогодний корпоратив на 500 человек вформате популярного вечернего ТВ-шоу.Вот только удаленкасильно нарушила командные связи. И тогдавозвращение в офис превратилось в операцию Вспомнить всес агентами Вакцинация, Пиццаи Буги-Вуги. Рассказываем, что происходило у
Почему в будущем мы будем работать по 5 часов в день, 4 дня в неделю

Два года назад никто и подумать не мог, что белые воротнички будут работать из дома. И что удаленная работа может быть такой же продуктивной, как офисная. В 2020-м миф о том, что в офис нужно ходить каждый день, был разрушен. Поэтому пора снять оставшиеся табу. Эксперты начи
Где трава зеленее стоит ли релоцироваться за границу

Длительное время работая в IT рекрутменте, не могла не заметить довольно яркую тенденцию - желание многих соискателей релоцироваться за границу. Я задалась вопросом, почему же такое происходит, и решила провести небольшое исследование.

Почему я хочу уехать?

Я начала спрашивать у своих кандидатов почему они приняли такое решение. По результатам опроса оказалось, что большинство хотят попробовать пожить в другой стран

Поиск работы

Как художнику найти работу мечты в геймдеве. А также советы по оформлению портфолио

Геймдев для художников во многом работа мечты здесь в одном месте пересекается любовь к рисованию, желание работать в IT и увлечение играми. Но сложность в том, что даже академическое художественное образование не дает гарантий на попадание в индустрию. При этом не часто вст
Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на ры
Портфолио разработчика по Джошу Комо структура, наполнение, смысл

В прошлом году Джош Комо, автор туториалов и учебных материалов для разработчиков, на своем аккаунте в Твиттере вызвался посмотреть и покритиковать сайты-портфолио всех желающих. В ходе мероприятия он заметил интересную вещь: обратная связь получалась не очень разнообразной, недоработки при оформлении порт
Перевод Как разработчику договариваться о зарплате при поиске работы за границей

Всё чаще компании нанимают разработчиков из-за рубежа, так как рынок найма во всём мире сильно перегрет. Для разработчиков это означает более широкий рынок работодателей и больше привлекательных вакансий.

В этой статье собраны советы о том, что следует учитывать при согласовании ЗП с зарубежной к
Перевод Вы не просите дать вам работу, вы продаёте услугу

^{Изображение:
businessinsider.com}

Собеседования на работу это отстой. Приходишь, решаешь несколько задачек, пока в голове не возникнет туман, а потом от компании ни слуху, ни духу.

А теперь взглянем на них с другой стороны баррикад.

Публикуешь в
Рецепты как преодолеть ступор при собеседовании на Senior Developer?

Всем привет! На днях я завершила процесс поиска новой работы на позицию Senior Developer. Я прошла множество разноплановых интервью и, разумеется, несколько раз столкнулась с главным, на мой взгляд, врагом сеньор-программиста на собеседованиях: ступором.

Стресс, желание показать себя в лучшем виде, давление высоких ожиданий и требований - этот коктейль иногда вскипает. Внезапно, может даже после самого простого вопроса (отве

Поиск работы за рубежом

Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на ры
Amazon, Microsoft, Facebook, Tesla, Lyft история поиска работы мечты или вредные советы для карьерного развития

Всем привет!

Я давно хотел поделиться советами и своим опытом к прохождению интервью и развития карьеры. Пока думал про заголовок, вспомнилась книга из детства - "Вредные советы". Но в Отличие от Григория Остера, мои советы могут вам пригодится.

У меня за плечам
Ресурсы для поиска удаленной работы для нетехнарей

Возможно у вас тоже есть друзья-нетехнари, которые терзают вас вопросами "где искать постоянную удаленную работу?" и "как попасть в айти?". У меня на этот случай есть заготовленный списочек ресурсов с вакансиями, который уже сэкономил мне много часов на таких вопросах. Хочу поделиться им с вами и попробую его обновлять, если Хабр позволяет обновлять публикации.

Тем, у кого уровень английского "London is the capital of Great

Парсинг

Гугл финанс перестал транслировать данные российских акций что делать?

С 5 июня 2021 года сайт гугла, и самое главное гугл таблицы - перестали отдавать данные с Московской биржи.

При попытке получить котировки с префиксом MCX, например для Сбербанка, формулой из гугл таблиц =GOOGLEFINANCE("MCX:SBER") теперь всегда возвращается результат #N/A.

А при поиске любой российской бумаги
Перевод CSS, JavaScript и блокировка парсинга веб-страниц

Недавно мне попался материал, посвящённый проблеме загрузки CSS-файлов, которая замедляет обработку материалов страниц. Я читал ту статью, стремясь научиться чему-то новому, но мне показалось, что то, о чём там говорилось, не вполне соответствует истине. Поэтому я провёл собственное исследование этой темы и поэкспериментировал с загрузкой CSS и JavaScript.
Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на ры
Сравнение ассортимента блюд трёх ресторанов Санкт-Петербурга

Мне никогда раньше не приходилось иметь дело с парсингом данных из интернета. Обычно все данные для работы (аналитик данных) приходят из выгрузок компании с использованием простого внутреннего интерфейса, либо формируются sql-запросами к таблицам напрямую из хранилища, если нужно что-то более сложное, чем посмотреть выручку за предыдущий месяц.

Поэтому мне захотелось освоить какой-нибудь несложный инструмент парсинга html-ст
Аналитика алкогольной продукции сети магазинов Лента

Сегодня вашему вниманию представлена аналитика (исследование) алкогольной продукции сети магазинов Лента (далее - Лента), находящаяся в каталоге на официальном сайте компании.

Планирование, подготовка, выборка

Почему выбор пал на алкогольную продукцию и на эту
Винный гид России. Аналитика

Эта статья, как ни странно, про российское вино.

Она абсолютно пятничная и по смыслу, и по духу. Почему же я публикую её сегодня? Потому что завтра в это время я буду пить вино, а значит мне будет не до статей. Так что держите пятничную статью в четверг. Надеюсь, она будет интересна любителям вина. Особенно российского.

Месяц назад Роскачество презентовало очередной выпуск ежегодника "

Ner

Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на ры
Как мы ИИ учили новости понимать

Все мы хотим быть в курсе происходящего поэтому часть своего времени тратим на чтение новостей, и сейчас все чаще новости приходят не из новостных сайтов или газет, а из каки-то телеграм-каналов. В итоге, через какое-то время, оказывается, что ты подписан на десяток(а может и

Нормализация

Как упростить доработки и поддержку хранилища данных?

1. Адаптированная методология Anchor modeling

Архитектура ядра хранилища данных должна соответствовать описанной ниже адаптированной (не оригинальной) методологии Anchor modeling (но не Data Va
Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на ры
Iresine, нормализация данных на клиенте
Нормализация. От нее мы или страдаем или пишем собственное решение с множеством проверок на существование сущности в общем хранилище. Попробуем разобраться и решить эту проблему!

Описание проблемы

Представим себе такую последовательность:
1. Клиен
Опрос. Денормализация или нет?

Недавно мы с коллегой по профессии обсуждали в Интернете (точнее в ЛС на Хабре) архитектуру некоторой системы, и у нас возник спор по одному вопросу.

Имеется склад, где хранятся разные материалы, имеются документы прихода и расхода материалов, в документах есть записи с информацией "материал, количество", связь один-ко-многим. В базе данных есть таблица с информацией о текущем наличии материалов на скла

Последние комментарии

Имя: Макс

24.08.2022 | 11:28

Я разраб в IT компании, работаю на арбитражную команду. Мы работаем с приламы и сайтами, при работе замечаются постоянные баны и лаги. Пацаны посоветовали сервис по анализу исходного кода,https://app Подробнее..
Имя: 9055410337

20.08.2022 | 17:41

поможем пишите в телеграм Подробнее..
Имя: sabbat

17.08.2022 | 20:42

Охренеть.. это просто шикарная статья, феноменально круто. Большое спасибо за разбор! Надеюсь как-нибудь с тобой связаться для обсуждений чего-либо) Подробнее..
Имя: Мария

09.08.2022 | 14:44

Добрый день. Если обладаете такой информацией, то подскажите, пожалуйста, где можно найти много-много материала по Yggdrasil и его уязвимостях для написания диплома? Благодарю. Подробнее..

Контакты
Обнаружили ошибку