Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Big data

Стоит ли смотреть в сторону Data science?

Очень много людей с самым разным бэкграундом, и не всегда даже техническим, в последнее время пытаются перейти в data science. И такой ажиотажный интерес - проблема для всех, кто рассматривает переквалификацию в эту сферу. Потому что рынок труда может оказаться наводнён соискателям без опыта.

С точки зрения потенциального работодателя: вы скорее возьмёте выпускника технического вуза, или человека за 40, без профильного опыта
Как мы весь интернет сканировали

Всем привет! Меня зовут Александр и я пишу код для 2ip.ru. За добрую половину сервисов можно пинать меня, готов отбиваться. Cегодня я хочу немного рассказать про переделку одного нашего старого сервиса. Это конечно не "big data", но всё равно довольно большие объемы информации, поэтому думаю будет интересно.

Речь пойдет про
RamblerMeetupampUsermodel

Мы долго шли к этому и вот наконец! Наш внутренний RamblerMeetup&Usermodel выходит в свет! Уже 30 июня эксперты поделятся своими кейсами в области ML и Big Data.

Митап пройдет в онлайн-формате, начало в 19:00. Обязательна предварительная
Что нам стоит загрузить JSON в Data Platform

Всем привет!

В недавней статье мы рассказали, как мы шли к построению нашей Data Platform. Сегодня хотелось бы глубже погрузиться в желудок нашей платформы и попутно рассказать вам о том, как мы решали одну из задач, которая возникла в связи с ростом разнообразия интегрируемых источников данных.

То есть, если возвращаться к финальной картинке из упомянутой выше статьи (специально дублирую ее, чтобы уважаемым чи
Запросить 100 серверов нельзя оптимизировать код. Ставим запятую

Можно выделить ряд алгоритмов, которые являются базовыми и лежат в основе практически каждой строчки программ, написанных на языках высокого уровня. Хорошо иметь под руками классический многотомный труд Дональда Кнута "The Art of Computer Programming", там детально разобраны многие ба
Перевод Линейная алгебра для исследователей данных

Иллюстрация: UCI

Наша [Ирвинга Капланского и Пола Халмоша] общая философия в отношении линейной алгебры такова: мы думаем в безбазисных терминах, пишем в безбазисных терминах, но когда доходит до серьезно

Accessibility

Перевод Доступность на iOS началась с 36 секунд

8 июня 2009 года Фил Шиллер выступил на WWDC. Всего 36 секунд он неловко говорил о VoiceOver, Zoom, White on Black (с iOS 6 называется Invert Colors) и Mono Audio. Это были первые реальные специальные функции на платформе iPhone OS, как её тогда называли. Однако, они не произвели большого впечатления 36 секунд закончились, а потом не было никако
HTML и CSS ошибки, ухудшающие UX

В прошлом году я собрал несколько случаев, когда HTML и CSS ошибки негативно влияют на доступность интерфейсов. В этой статье я хочу продолжить и описать еще несколько случаев.

Не мучайте пользователей свойствами justify-content и align-items

Когда мы решаем задачи по позиционированию элементов, нам нравится использовать свойства justify-content и
Цифровая доступность пять ключевых проблем в интерфейсах. Совместный вебинар Яндекс.Практикума и Валерии Курмак

13 мая Яндекс.Практикум вместе с Валерией Курмак проводит открытый вебинар Цифровая доступность: пять ключевых проблем в интерфейсах. Вебинар будет полезен дизайнерам и разработчикам интерфейсов, которые хотят научиться проектировать доступно.
Перевод HTMHell адовая разметка

Приветствую. Представляю вашему вниманию перевод заметок с сайтаHTMHell - коллекции плохих примеров HTML-кода, взятых из реальных проектов.

Каждая заметка включает сам фрагмент плохого кода, который дополняется объяснениями, в чём именно ошибки и почему так лучше не делать. А в заключение предлагается
Как не сдаться, начать карьеру в IT и продолжать лечение даже после 15 лет болезни (история инвалида)

Привет! Это снова Станислав М***, реабилитированный инвалид. Рассказываю про свой опыт выздоровления.

Поможет тем, кто инвалид. Также рекомендую рассказывать эту историю тогда, если хотите кого-то вдохновить. Если инвалид сумел преодолеть трудности, то и подавно сможет
Фриланс, любовь и инвалидность. Как жить хорошо, когда жить сложно в принципе

Цель этой статьи поделиться своим опытом жизни в сложной ситуации и донести мысль, что любую ситуацию можно улучшить.

Но для начала представлюсь.

Обо мне

Привет! Меня зовут Станислав, мне 32 года, я из Хабаровска. В 2006 году я попал в ДТП, из-за чего

Машинное обучение

Стоит ли смотреть в сторону Data science?

Очень много людей с самым разным бэкграундом, и не всегда даже техническим, в последнее время пытаются перейти в data science. И такой ажиотажный интерес - проблема для всех, кто рассматривает переквалификацию в эту сферу. Потому что рынок труда может оказаться наводнён соискателям без опыта.

С точки зрения потенциального работодателя: вы скорее возьмёте выпускника технического вуза, или человека за 40, без профильного опыта
Перевод Учимся понимать таблицы на меньшем объеме данных

Задача распознавания семантического следования (textual entailment), или импликации (natural language inference), в текстах на естественном языке состоит в определении того, может ли часть текста (посылка, антецедент) подразумеваться или противоречить (или не противоречить) другому фрагменту текст
Распознавание эмоций в записях телефонных разговоров

Технология распознавания эмоций в речи может может найти применение в огромном количестве задач. В частности, это позволит автоматизировать процесс мониторинга качества обслуживания клиентов call-центров.

Определение эмоций человека по его речи уже относительно насыщенн
БСД, или как легко объяснить финансистам их же задачи в терминах машинного обучения

Мне давно нравятся Байесовские сети доверия
Перевод Оптимизация платежей в Dropbox при помощи машинного обучения

Представьте ситуацию: вам нужно воспользоваться оплаченным (как вы думаете) сервисом и вдруг оказывается, что он отключен за неуплату. Такая неприятность портит впечатление от бренда, снижая поток прибыли, а внезапно отключенный клиент может не вернуться к сервису. К старту ку
Log-Sum-Exp Trick как свойства функций делают работу классификаторов реальной

В этой статье мы рассмотрим, что такое классификатор, поговорим о мультиклассовой классификации с помощью нейронных сетей. Затем, ознакомившись с контекстом перейдем к основному топику поста к Log-Sum-Exp Trick. Напишем формулы и разберемся, как этот трюк помогает избежать переполнения чисел с плавающей то

Искусственный интеллект

Перевод Наглядно о том, почему трансформеры работают настолько хорошо

Трансформеры за последние несколько лет штурмом захватили мир NLP, а сегодня они с успехом применяются в выходящих за рамки NLP приложениях. Они обладают такими возможностями благодаря модулю внимания, который схватывает отношения между всеми словами последовательностей. Но са
Дайджест интересных материалов для мобильного разработчика 398 (14 20 июня)

В этой подборке исследуем StoreKit 2, распознаем лица и позы на Android, улучшаем производительность React-приложений, учим сквирклморфизм и многое другое!

Этот дайджест доступен в виде еженедельной
Перевод Оптимизация платежей в Dropbox при помощи машинного обучения

Представьте ситуацию: вам нужно воспользоваться оплаченным (как вы думаете) сервисом и вдруг оказывается, что он отключен за неуплату. Такая неприятность портит впечатление от бренда, снижая поток прибыли, а внезапно отключенный клиент может не вернуться к сервису. К старту ку
Перевод ИИ все еще не умеет модерировать хейт-спич

Но ученые научились определять, где система дает сбой.
MS TECH | GETTY, UNSPLASH
В далекое прошлое ушли уютные форумы, где люди-модераторы заставляли участников следовать правилам и
О том как мы научили машину определять пол человека по его почерку

Для начала хотелось бы упомянуть, что это далеко не первое исследование подобного рода. Начиная с 1960-х готов по настоящее время было разработанно множество программных комплексов и методик, позволяющие решать задачи идентификационного (кем именно была выполнена рукопись, представленная на исследование) и диагностического характера (дифференциации рукописей на мужское и женское, вычисление предполагаемого возраста исполнителя руко
Перевод ТОП-10 трендов в сфере данных и аналитики 2021. Версия Gartner

Оракул технологического мира Gartner регулярно и охотно делится с обществом своими наблюдениями относительно текущих трендов. Эксперты компании составили подборку из 10 трендов в сфере данных и аналитики, которые стоит учитывать ИТ-лидерам в 2021 году от искусственного интеллекта до малых д

Этика

Перевод Этический антидизайн как разработать продукт, не вызывающий привыкания

Почему бы не сделать перерыв?

На столе, напротив открытого окна (смотрите картинку) лежит Wii Remote. Это контроллер для игровой консоли Wii компании Nintendo. Люди, которые выросли c Wii, вспомнят как в игре Wii Sports периодически всплывало окно с сообщение
Главная причина дискриминации в ML

Из предыдущего поста вы узнали, что в ML существует дискриминация. Отлично! Таким образом вы уже разбираетесь в Этике машинного обучения лучше, чем многие инженеры МL. Благодаря примерам (из медицины, анализа твиттов, распознавания лиц) вы наверняка уже сделали вывод, что существуют разные виды предвзятости.

Алгоритмы машинного обучения строят стерео
Coq не порок

В интересное время мы живем, товарищи! В любой публичной деятельности теперь требуется проявлять изрядную креативность, чтобы обойти все ловушки, лишь бы не задеть случайно кого-нибудь неосторожным словом. То же слово "товарищ" за свою долгую жизнь претерпело несколько смысловых изменений. Изначально товарищи "торгующие одним товаром". Затем, уже шире, "занимающихся одним делом". Далее, в СССР, когда дело осталось одно на всех пост
Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Человеческий мозг, как мы все знаем, полон предрассудков. Возникает вопрос: если машинное обучение "живет" за счет того, что очень близко имитирует этот наш мозг, то почему его алгоритмы не могут быть такими же необъективными и проявлять такую же несправедливость? К сожалению, они частенько это и делают.

Давайте расскажем вам как именно.
Вы бы доверили свою задачу ИИ? 7 вопросов, которые помогут определиться

Эта статья - авторства Эми Бойд. Подробнее о ней вы можете узнать здесь.

На одном из докоронавирусных мероприятий
Recovery mode Этические ценности как элемент проектирования продуктов

Скоро мы будем наблюдать появляние вакансий в сфере этики технологий, курсов по основнам этического создания продуктов. И тому есть объяснение. Человек будущего должен уметь анализировать, какими этическими рамками руководствоваться до момента, когда они выйдут из под его контроля и он станет объектом посягательства незапрограмированных на этику устройств.

Эта статья попытка разобраться, что скрывается за этик

Машинное+обучение

Борьба с несбалансированностью классов с помощью модуля NEARMISS

В этой статье я расскажу об одном из методов для устранения дисбаланса предсказываемых классов. Важно уточнить, что многие методы, которые строят вероятностные модели, прекрасно работают и без устранения несбалансированности. Однако, когда мы переходим к построению невероятно
Обучаем качественные модели без DensePose разметки

Возможно ли обучить качественную модель, которая предсказывает 3D координаты поверхности тела животного по фотографии, без соответствующей DensePose разметки?

Исследователи из Facebook Artificial Intelligence Research затронули этот вопрос на конференции по машинному зрению CVPR 2020.
Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на ры
CatBoost и ML-конкурсы

Анализ данных и базоваямодель

Вступление

Эта статья основана на данных конкурса, который компания Driven Data опубликовала для решения проблем с источниками воды в Танзании.

Информация для конкурса была получена Министерством водных ресурсов Танзании с исполь
Перевод Запускаем модель машинного обучения на iPhone

Чего уж только на Хабре не было, и DOOM на осциллографе, тесте на беременности и калькуляторе запускали, даже сервер Minecraftна зеркалке Canon 200D поднимали. Сегодня же, специально к старту нового потока курса по
Перевод Применение машинного обучения к кинетике ядерных реакторов

Рис. 1. Реактор TRIGA на полной мощности.
На Хабре часто выкладывают туториалы по разным областям знаний. Сегодня, к старту нового потока курса по

Дискриминация

Главная причина дискриминации в ML

Из предыдущего поста вы узнали, что в ML существует дискриминация. Отлично! Таким образом вы уже разбираетесь в Этике машинного обучения лучше, чем многие инженеры МL. Благодаря примерам (из медицины, анализа твиттов, распознавания лиц) вы наверняка уже сделали вывод, что существуют разные виды предвзятости.

Алгоритмы машинного обучения строят стерео
Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Человеческий мозг, как мы все знаем, полон предрассудков. Возникает вопрос: если машинное обучение "живет" за счет того, что очень близко имитирует этот наш мозг, то почему его алгоритмы не могут быть такими же необъективными и проявлять такую же несправедливость? К сожалению, они частенько это и делают.

Давайте расскажем вам как именно.
Эйджизм в IT-среде есть ли потолок в профессии разработчика?

ВITможно начать зарабатывать первые деньги будучи школьником, достаточно интересоваться технологиями иполучать практический опыт. Многие студенты технических вузов уже напервых курсах устраиваются наофициальную работу, начинают профессиональную карьеру идаже получают приглашения наработу зарубеж. Однако внекоторых компаниях рассматривают специалистов только состажем от57 лет. Согласно исследованию
Перевод Кастовая дискриминация в Кремниевой долине

Индийцы из неприкасаемых каст, работающие в американских технокомпаниях, рассказывают журналу VICE о том, как пытаются скрывать свои реальные личности, чтобы избежать кастовой дискриминации, которую считали делом прошлым.

Ии

Перевод Наглядно о том, почему трансформеры работают настолько хорошо

Трансформеры за последние несколько лет штурмом захватили мир NLP, а сегодня они с успехом применяются в выходящих за рамки NLP приложениях. Они обладают такими возможностями благодаря модулю внимания, который схватывает отношения между всеми словами последовательностей. Но са
Перевод ИИ все еще не умеет модерировать хейт-спич

Но ученые научились определять, где система дает сбой.
MS TECH | GETTY, UNSPLASH
В далекое прошлое ушли уютные форумы, где люди-модераторы заставляли участников следовать правилам и
Перевод Прямо как в Матрице нейросеть обучили изменять ракурс любых видео

В фильмах или роликах с YouTube мы наблюдаем происходящее из одной точки, нам не доступны перемещение по сцене или смещение угла зрения. Но, кажется, ситуация меняется. Так, исследователи из Политехнического
Перевод Дождались IBM научит ИИ писать код и создает CodeNet
500 миллионов строк кода на более чем 55 различных языках программирования.

Процент представлений по языку (слева) и по статусу (справа).
- Датасет содержит 13 916 868 представлений, разделенных на 4053 задачи, у пяти из которых нет представлений.
OpenAI SkyNet от Илона Маска. Разбор
Три закона робототехники Айзека Азимова:
1. Робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинён вред.
2. Робот должен повиноваться всем приказам, которые даёт человек, кроме тех случаев, когда эти приказы противоречат Первому Закону.
3. Робот должен заботиться о своей безопасности в той мере, в которой это не противоречит Первому или Второму За
Перевод Что такое machine learning?

Данный пост содержит выдержки из одноименной статьи Дэниела Фагеллы, руководителя отдела исследований в компании Emerj от 26.02.2020. Дэниел явл

Bias

Главная причина дискриминации в ML

Из предыдущего поста вы узнали, что в ML существует дискриминация. Отлично! Таким образом вы уже разбираетесь в Этике машинного обучения лучше, чем многие инженеры МL. Благодаря примерам (из медицины, анализа твиттов, распознавания лиц) вы наверняка уже сделали вывод, что существуют разные виды предвзятости.

Алгоритмы машинного обучения строят стерео
Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Человеческий мозг, как мы все знаем, полон предрассудков. Возникает вопрос: если машинное обучение "живет" за счет того, что очень близко имитирует этот наш мозг, то почему его алгоритмы не могут быть такими же необъективными и проявлять такую же несправедливость? К сожалению, они частенько это и делают.

Давайте расскажем вам как именно.

Ethics

Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Человеческий мозг, как мы все знаем, полон предрассудков. Возникает вопрос: если машинное обучение "живет" за счет того, что очень близко имитирует этот наш мозг, то почему его алгоритмы не могут быть такими же необъективными и проявлять такую же несправедливость? К сожалению, они частенько это и делают.

Давайте расскажем вам как именно.

Fairness

Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Человеческий мозг, как мы все знаем, полон предрассудков. Возникает вопрос: если машинное обучение "живет" за счет того, что очень близко имитирует этот наш мозг, то почему его алгоритмы не могут быть такими же необъективными и проявлять такую же несправедливость? К сожалению, они частенько это и делают.

Давайте расскажем вам как именно.
Заметки Датасатаниста что делать, если перед вами оказалась NP-полная задача

Наверное, каждый сталкивался с тем, что приходилось столкнуться с какой-то сложной задачей, решение к которой не удавалось подобрать не то что сразу а даже после долгих упорных часов работы или дней. Об одном из классов таких задач NP-полных, мы сегодня и поговорим.
Заметки Дата Сатаниста честность модели

Один из ключевых фундаментальных принципов обработки данных, согласно GDPR, это право человека на объяснение принятого решения и честность этого

	Русский
	English

Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Так какая предвзятость (bias) есть в алгоритмах машинного обучения?

Почему эти признаки необъективности существуют?

Откуда мы знаем о существовании этой предвзятости?

Какие возможные способы решения этой проблемы существуют?

Сейчас читают

Big data

Стоит ли смотреть в сторону Data science?

Как мы весь интернет сканировали

RamblerMeetupampUsermodel

Что нам стоит загрузить JSON в Data Platform

Запросить 100 серверов нельзя оптимизировать код. Ставим запятую

Перевод Линейная алгебра для исследователей данных

Accessibility

Перевод Доступность на iOS началась с 36 секунд

HTML и CSS ошибки, ухудшающие UX

Не мучайте пользователей свойствами justify-content и align-items

Цифровая доступность пять ключевых проблем в интерфейсах. Совместный вебинар Яндекс.Практикума и Валерии Курмак

Перевод HTMHell адовая разметка

Как не сдаться, начать карьеру в IT и продолжать лечение даже после 15 лет болезни (история инвалида)

Фриланс, любовь и инвалидность. Как жить хорошо, когда жить сложно в принципе

Обо мне

Машинное обучение

Стоит ли смотреть в сторону Data science?

Перевод Учимся понимать таблицы на меньшем объеме данных

Распознавание эмоций в записях телефонных разговоров

БСД, или как легко объяснить финансистам их же задачи в терминах машинного обучения

Перевод Оптимизация платежей в Dropbox при помощи машинного обучения

Log-Sum-Exp Trick как свойства функций делают работу классификаторов реальной

Искусственный интеллект

Перевод Наглядно о том, почему трансформеры работают настолько хорошо

Дайджест интересных материалов для мобильного разработчика 398 (14 20 июня)

Перевод Оптимизация платежей в Dropbox при помощи машинного обучения

Перевод ИИ все еще не умеет модерировать хейт-спич

О том как мы научили машину определять пол человека по его почерку

Перевод ТОП-10 трендов в сфере данных и аналитики 2021. Версия Gartner

Этика

Перевод Этический антидизайн как разработать продукт, не вызывающий привыкания

Почему бы не сделать перерыв?

Главная причина дискриминации в ML

Coq не порок

Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Вы бы доверили свою задачу ИИ? 7 вопросов, которые помогут определиться

Recovery mode Этические ценности как элемент проектирования продуктов

Машинное+обучение

Борьба с несбалансированностью классов с помощью модуля NEARMISS

Обучаем качественные модели без DensePose разметки

Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

CatBoost и ML-конкурсы

Вступление

Перевод Запускаем модель машинного обучения на iPhone

Перевод Применение машинного обучения к кинетике ядерных реакторов

Дискриминация

Главная причина дискриминации в ML

Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Эйджизм в IT-среде есть ли потолок в профессии разработчика?

Перевод Кастовая дискриминация в Кремниевой долине

Ии

Перевод Наглядно о том, почему трансформеры работают настолько хорошо

Перевод ИИ все еще не умеет модерировать хейт-спич

Перевод Прямо как в Матрице нейросеть обучили изменять ракурс любых видео

Перевод Дождались IBM научит ИИ писать код и создает CodeNet

OpenAI SkyNet от Илона Маска. Разбор

Перевод Что такое machine learning?

Bias

Главная причина дискриминации в ML

Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Ethics

Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Fairness

Дискриминация в алгоритмах ML существует и нет, это не либеральные сказки

Заметки Датасатаниста что делать, если перед вами оказалась NP-полная задача

Заметки Дата Сатаниста честность модели

Категории

Последние комментарии