Русский
Русский
English
Статистика
Реклама

Creative commons

Кино под защитой. Как мы готовились к аудиту по безопасности медиаконтента

20.10.2020 12:19:01 | Автор: admin
Наверняка каждый читатель Хабра хотя бы раз в жизни мечтал прикоснуться к миру кино, стать его частью. В этом посте я расскажу о том, как консультантам из отдела информационной безопасности удалось сделать это.

Из текста вы узнаете:

  • зачем досматривать до конца титры в конце фильма;
  • сколько аудиторских опросников нужно заполнить, чтобы быть уверенным, что кино под защитой;
  • почему аудит безопасности медиаконтента лучше не проходить в мешковатом худи.

Источник

В сфере консалтинга информационной безопасности типовые работы давно определены. Это защита персональных данных и коммерческой тайны, аттестация государственных информационных систем, защита информации в финансовых организациях, обеспечение безопасности критической информационной инфраструктуры, формирование стратегии развития ИБ и т. д. Тем интереснее было получить задачу нетривиальную для отечественного рынка информационной безопасности.

Первоначально, запрос, поступивший в ЛАНИТ-Интеграцию от одной российской компании, содержал минимум информации и звучал следующим образом: Добрый день! Подскажите пожалуйста, можете ли вы нам помочь: необходимо пройти аудит на соответствие нашей организации требованиям безопасности информации MPAA.

Появилась необходимость всестороннего изучения данного вопроса. В первую очередь нужно было понять, что такое MPAA.


Этот логотип знаком терпеливым и упорным зрителям, то есть тем, кто досматривает до конца не только фильмы, но и титры. Источник

Первая же ссылка в поисковой системе Google Яндекс выдала нам такой ответ: Американская ассоциация кинокомпаний(MPAA,англ.Motion Picture Association of America, первоначально Motion Picture Producers and Distributors of America(MPPDA) американскаянекоммерческая организация, основанная в 1922 году и объединяющая крупнейших кинопроизводителей, призванная отстаивать их бизнес-интересы.

Важность данной ассоциации сложно переоценить, особенно учитывая состав участников. Членами Американской киноассоциации являются семь крупнейших голливудских студий: The Walt Disney Company, Sony Pictures, Paramount Pictures, 20th Century Fox, Universal Studios, Warner Bros, Netflix.

Из этого можно сделать простой вывод, кто является генеральным заказчиком у нашего клиента.


Такой поворот событий вызвал наш неподдельный интерес к тому, какие требования могут выдвигать ключевые игроки мировой киноиндустрии. По мере изучения этого вопроса оказалось, что круг действующих лиц в проекте становится заметно больше.


Кроме Американской ассоциации кинокомпаний, требования формируются профильной Международной ассоциацией защиты контента, а сама проверка реализации требований осуществляется сетью доверенных партнеров (Trusted Partner Network TPN), созданной совместно двумя ассоциациями. Возникает логичный вопрос, почему для обеспечения безопасности медиаконтента были задействованы такие силы.

Кого и чего боятся киностудии


Безусловно, всем нам известны различные файлообменные p2p-сети, на которых, например, можно скачивать или просматривать фильмы в обход требований правообладателей. Но как они там появляются? Зачастую, на таких ресурсах первыми публикуются пиратские видеозаписи из кинотеатров, откуда стартует коммерческая окупаемость фильма. Но еще большую опасность для производителей медиа-контента представляет утечка материала до официального проката. При таком развитии событий компании получают серьезный финансовый и репутационный ущерб, так как непритязательная аудитория в своем большинстве предпочитает не платить за продукт, а получать его бесплатно, пусть даже и в более низком качестве.

Выявив основные причины формирования стандарта MPAA, получаем:


Не каждый день офисным работникам удастся приобщиться к сфере кино, да еще и в рамках выполнения своей работы.

Итак, каков же полный список заинтересованных в обеспечении безопасности медиаконтента компаний? Немного изучив рынок, получаем следующее.


Определились. Теперь к работе. Что из себя представляет стандарт, который так необходим нашим заказчикам? Изучив структуру, стало понятно, что стандарт MPAA структурирован достаточно привычно, все необходимые к реализации меры разбиты на три группы: менеджмент информационной безопасности, меры по физической безопасности и технические меры.

Обзор стандарта

Детально разобрав стандарт, для наибольшего удобства мы создали чек-лист реализации мер безопасности. Так как стандарт англоязычный, и, к сожалению, не все могут свободно читать и переводить довольно-таки непросто написанную техническую литературу, мы его заодно перевели для наших коллег и для заказчика. Посмотреть, что у нас вышло, можно здесь таблички такого размера, мягко говоря, не очень удобно вставлять как иллюстрации в пост (берегите глаза).

Как мы работаем:

  • Делай раз. Обследуем с чем же придется работать.
  • Делай два. Проектируем систему ИБ и разрабатываем физические и организационные мероприятия.
  • Делай три. Закупай, внедряй, тренируй.
  • Делай четыре. Проходи аудит и помогай держать все в актуальном состоянии.

Заказчик прислал нам опросник от аудиторов, который состоял из 36 доменов и более чем 500 вопросов, которые дали бы аудиторам ясность о текущем статусе выполнения требований стандарта. Стало понятно, что подход у аудиторов довольно серьезный. Но в то же время есть, от чего отталкиваться.

Заполняя опросные листы, нам стало понятно, что фактически компания заботилась об информационной безопасности в объеме, недостаточном для выполнения требований стандарта. В первую очередь, необходимо было определить сам контент, который так необходимо обезопасить, а это самое интересное. Проведя информационное обследование с заказчиком, мы выяснили, что медиа-контентом для компании являются результаты отрисовки (по факту кадры из фильма), 3D-модели, а также во время дубляжа появляются скрипты переводов, фразы, реплики, из которых можно составить целый сюжет.

Приступаем к работе


Обследуем бизнес-процессы, получаем схему и описание бизнес-процессов. Обследуем информационные системы, сервисы и инфраструктуру, получаем инфраструктурную схему. Обследуем реализованные меры, получаем понимание степени реализации требований. По результатам формируем рекомендации. Рекомендации есть, поехали их исполнять.

Далее готовим технический проект. Собираем спецификацию и описание системы информационной безопасности в удобной форме. Идем по перечню требований/рекомендаций, напротив каждого требования пишем пояснения.

  1. Организационные меры реализуются не только утверждением в компании политики/приказа/регламента, но и выполнением сотрудниками всех процедур, описанных в этих самых политиках, приказах и регламентах.
  2. Технические меры реализуются как наложенными средствами защиты информации, так и встроенными механизмами безопасности. К счастью, нет требований к сертификации средств защиты ФСТЭК. Понятное дело, что все процессы, связанные с реализацией технических мер, должны быть также описаны в организационно-распорядительной документации.
  3. Физические меры безопасности реализуются как технически (контроль доступа, видеонаблюдение, пожарная безопасность и т. д.), так и организационно (регламент проноса/выноса накопителей, регламент посещения рабочего места, регламент проверки физических систем безопасности и т. д.).

Расскажем о самых необычных требованиях стандарта. В ходе реализации мер защиты стандарта пришлось столкнуться с некоторыми забавными, а иногда и чуть завышенными требованиями, например:

  • предотвратить использование джейлбрейка, рутинга и прочего на рабочих мобильных устройствах (вряд ли кто об этом задумывался ранее в компаниях, работающих с медиаконтентом);
  • использовать псевдонимы (AKA) для клиентов в процессе обработки медиаконтента (очевидно для того, чтобы сотрудники не могли точно знать, что это за заказчик);
  • помечать каждого посетителя идентификационным значком или наклейкой, которая всегда должна быть видна (знаем всех посетителей меньше переживаем за наш контент);
  • приносить еду только в прозрачных контейнерах и пакетах (для того, чтобы не допустить нелегитимный пронос/вынос устройств для сбора информации);
  • реализовать политику дресс-кода таким образом, чтобы исключить мешковатые штаны и толстовки с капюшоном (также для того, чтобы не допустить пронос/вынос конфиденциальной информации).

Срок действия документации


Многие заказчики, к сожалению, считают, что разрабатываемая документация действует только при прохождении аудита, а дальше будь что будет. Самым простым (выгодным, if you know what i mean) решением было взять всё в свои руки и помочь клиенту держать все в актуальном состоянии.


Аудит был похож на экспертизы, которые мы привыкли видеть в России (чаще всего это ISO 27001), но, на всякий случай, по порядку.

Сначала оформляется заявка в TPN на аудит. Далее присылаются опросники, о которых мы говорили ранее. После того, как их заполнили и отправили (само собой предварительно реализовав все требования), TPN определяет аудитора (нам достался Алекс из Лондона). Первое, что он сделал, это запросил перечень разработанной документации на английском (однако стандарт не требует разработку документов на английском языке). Как оказалось, план был такой: специалист по составу и названиям поймет, насколько это соответствует лучшим практикам, а уже при очной ставке расспросит, что в них написано. Так как проверка документов была основана, по сути, на нашем красноречии, Алекс сделал большой упор на техническую сторону вопроса: были проверены все настройки сетевого оборудования, продемонстрирован ход работы каждого бизнес-процесса, проверен харденинг выборочных машин из каждого сегмента сети, была даже проверена история браузеров на ПК, у которых нет доступа в интернет. Также много внимания было уделено вопросу видеонаблюдения, пропускного режима и пр.

На обеде аудитор расслабился и рассказал, что аудитор не основная его профессия, он руководит такой же компанией, работающей с медиа-контентом. Аудит это хобби и некоторый дополнительный доход (конечно же Алекс прошел все требуемые экзамены для получения данного статуса).

В отличие от того же ISO 27001, где наличие сертификата позволяет декларировать соответствие требованиям стандарта (ни в коем случае не полную защищенность), в MPAA/TPN результаты аудита фиксируются на портале TPN, и на нем же будет указано, каким именно образом реализовано то или иное требование, чтобы будущий контрагент мог лично определиться, достаточен ли набор мер для работы с ними или стоит призадуматься.

В целом, это была привычная работа подготовки к аудиту. Но мы получили массу удовольствия, разбираясь в такой, как оказалось, интересной индустрии производство и распространение медиаконтента. Теперь мы уверены, что у заказчика всё под контролем и никто (кроме человека в худи и с непрозрачным контейнером) не сможет увидеть киноновинку раньше времени.

Буду рад ответить на вопросы в комментариях.

Подробнее..

Картирование цифровых прав, часть I. Право на публикацию цифровых произведений

28.08.2020 12:23:00 | Автор: admin
TL;DR: Эксперты делятся видением проблем в России, связанными с цифровым правом на использование, создание и публикацию цифровых произведений.

Этой статьей Теплица социальных технологий и РосКомСвобода открывают серию публикаций о картировании технологических вызовов и возможных решений в преддверии хакатона по цифровому гражданству и цифровым правам demhack.ru, который пройдет 12-13 сентября 2020 г. В преддверие хакатона, организаторы провели пять круглых столов по изучению проблемного поля цифровых прав для того, чтобы поделиться сконцентрированным знанием с участниками будущими участниками хакатона о наблюдаемых проблемах и возможных технологических решениях.

В этом обзоре пойдет речь о праве на использование, создание и публикацию цифровых произведений. Текст ниже, разумеется, не исчерпывает проблемного поля, но дает представление о тех проблемах, которые пришли в головы экспертам в первую очередь.

В цифровой среде все, что мы произносим для неопределенного круга лиц становится цифровым произведением. Мы живем в культуре того, что американский юрист и медиафилософ Лоуренс Лессиг называет культурой ремикса, производя мемы, цитаты, используя изображения, постоянно творя во множестве виртуальных пространств.

Аналоговый мир стремительно оцифровывается, и произведения, созданные в нем обрастают дополнительными свойствами, характерными для цифровых, а не физических объектов (например, возможности моментального и полного копирования в неограниченных масштабах). В цифровом контексте творят не только люди, но и алгоритмы.

Сюжеты, которые мы рассмотрели:

  1. Дигитализация оффлайна и авторское право;
  2. Вопросы Creative Commons и Общественное достояние (Public Domain);
  3. Угрозы open-инициативам (open data, open access и т.д.);
  4. Продукты искусственного интеллекта и авторское право;
  5. Поведенческий излишек собственность пользователей или собственность платформы?
  6. Защита авторских прав VS свободное использование произведений;


Сюжет 1. Дигитализация оффлайна и авторское право



Самая простая DIY-модель сканнера книг. Источник: Daniel Reetz // Instructables.

В этом сюжете эксперты отметили ряд вопросов, которые не решаются технологически: устаревшее законодательство об авторском праве (по мнению экспертов), копирайтные тролли, музейное право и связанные с ним ограничения, проблема свободы панорамы (люди создают цифровые произведения, но их нельзя использовать (фото памятников, фото могил и тд, получить права скульпторов, права архитекторов) о ней часто говорят википедисты, блоггеры, юристы), однако вызвавшей самую большую дискуссию вызвала проблема орфанных / сиротских произведений произведения, авторов которых не удалось найти.

Например, для репрессированных авторов 70 лет освобождения авторского права считается со срока их реабилитации, а дата реабилитации есть только в архиве ФСБ. Та же проблема с фотографиями из семейного архива. Родственники не являются правообладателями, правообладатель фотограф в фотоателье. Если фотограф неизвестен, то 70 лет с даты обнародования. Но родственники, при этом, формально не могут обнародовать фотографии. Очистить эти права нельзя. А волю автора узнать уже невозможно автор мертв. В этом же русле находятся произведения, которые опубликованы, но они коммерчески не используются очень длительное время. Коммерческое использование предполагает составление договора. Резюмируя, можно говорить о том, что для произведений, которые проходят аналогово-цифровой переход существует острая проблема очистки прав.

Проблема поиска правообладателя (проблема очистки прав) сложно найти того, кто обладает правом на произведение.

Решения для хакатона:

  1. Создание базы сиротских произведений;
  2. Сервис поиска правообладателя;


Сюжет 2. Вопросы Creative Commons и Общественного достояния



Логотип Creative Commons, выполненный в стиле изразцов зулляйдж. Источник: Creative Commons (CC-BY-SA)

Проблема общественного, но не освобожденного достояния формулируется экспертами следующим образом: существует большое количество произведений, которые уже перешли в public domain (общественное достояние), однако существуют в Сети в неоптимальных форматах где-то с уродским водяным знаком, где-то в непотребно плохом разрешении. Многие так и лежат на фотостоках, хотя легально пользоваться ими могут все.

Решение для хакатона: сделать бота, который бы спарсил произведения, находящиеся в общественном достоянии и закачал бы их, например, на Викисклад. Или, например, с помощью ИИ убирал бы водяной знак.

Проблема отсутствия произведений общественного достояния в хорошем качестве. В России нет портала, на котором были бы выложены произведения общественного достояния, находящиеся в public domain. За рубежом есть сайты, которые курируют и публикуют хорошо обработанные произведения общественного достояния например, Wolne Lektury (Бесплатное чтение, Польша). Но в России самый простой способ найти Достоевского это на Флибусте.

Решение для хакатона: создать портал и процесс для публикации и курирования произведений общественного достояния.

Проблема популяризации Creative Commons формулируется следующим образом несмотря на то, что ГК РФ содержит статью 1286.1 об открытых лицензиях и лицензии эти используются, в том числе на гос.сайтах, авторы и юристы не знают про открытые лицензии и Creative Commons.

Существует недоверие к лицензиям типа Creative Commons даже не смотря на их устойчивый юридический статус в РФ. Этими лицензиями могли бы воспользоваться многие сайты, но из-за неграмотности этого не делают.

Решения для хакатона:

  • Сервис, в котором люди могли бы генерить шаблонные письма Переведите ваш сайт на Creative Commons с объяснением сути вопросов и отправлять в соответствующие ведомства, библиотеки и т.д.
  • Один из экспертов формулирует вопрос так: Creative Commons слишком сложные для понимания. Многим авторам важно просто, чтобы их читали. И поэтому они думают, что знак копирайта это абсолютная ценность, моральные права не понимая того, что авторство и свобода распространения содержания это не взаимоисключающие понятия. Вполне возможно, что и коммерческие права им вообще не нужны. Решение: популяризировать знак авторства, не предполагающий защиту коммерческих прав например, а в кружочке (такой символ уже есть в юникоде инициатива предлагалась Ассоциацией интернет-издателей). Чтобы автор понял, что распространение в его руках.


Проблема с поиском авторства для русскоязычного контента нет поисковиков по изображениям, музыке и иным произведениям с лицензиями Public Domain или Creative Commons.

Решение для хакатона: поисковик или лучший способ индексации или идентификации произведение с таким режимом авторства.

Проблема с архивированием сайтов. Сайты периодически умирают. Проекты, например, Ивана Бегтина стараются архивировать российский государственный веб. Wayback Machine старается архивировать весь веб, но русскоязычного контента там не так много.

Решения для хакатона:

  • Бот, который бы автоматически отправлял бы сайт в веб-архив.
  • Нет ПО, которое бы позволяло удобно и прозрачно генерировать .WARC (web archive) файлы эксперты считают, что существующие методы очень сложны для простого пользователя. На хакатоне можно было бы создать инструменты, которые бы упрощали бы этот процесс.
  • Всероссийская инициатива по веб-архивированию.


Проблема плохого CC. Люди могут ошибочно или злонамеренно указывать лицензию CC, но при этом не обладать правами на это.

Решение для хакатона: сервис проверки лицензии Creative Commons Проверь свою лицензию: проверить, например, с помощью обратного поиска по изображениям на наличие чего-то закопирайченного.

Сюжет 3. Угрозы open-инициативам (open data, open access и т.д.)



И вот эту таблицу они не могли выложить в машиночитаемом формате? У них, что там у всех лапки? WTF? вольная интерпретация очередной стоковой фотографии. Фото: jeshoots.com // Unsplash (CC-BY-SA)

В рамках данного сюжета эксперты отметили то, что часто в конфликте между правообладателями и т.н. пиратами часто забывают про третью сторону движение за свободный и открытый легальный доступ. Помимо этого, эксперты отметили проблему, смежную с правом на доступ к информации в том, что многие сайты, находящиеся в тяжбах с правообладателями по вопросам копирайта, бывают просто заблокированы.

Однако, даже в рамках исключительно легального подхода к свободным данным, существует т.н. проблема пейволлов, т.е. когда академические статьи присутствуют и в платном, и в бесплатном доступе, но находятся (в том числе, по ссылками DOI) в первую очередь порталы, которые предлагают платный доступ. За рубежом, подобную проблему решает браузерный плагин Kopernio, однако, как отмечают эксперты, там нет ничего под русский контент.

Решение для хакатона: создать русскоязычный аналог Kopernio или подключить к Kopernio русскоязычный контент (например, из Киберленинки).

Сюжет 4. Продукты искусственного интеллекта и авторское право



Скриншот сайта музыкальной ИИ-системы Av3ry

Формально, авторское право возникает на основе творческого труда человека. Существует правовая неопределенность с тем, что производит нечеловек (камеры внешнего наблюдения, рентгены и т.д.)? Сейчас искусственный интеллект создаёт неплохие произведения, однако нет правовой определенности, кого считать автором: копирайт находится у программиста алгоритма или в общественном достоянии?

Этот вопрос находится пока в серой зоне. Нет громких дел, вопрос пока в технической и юридической плоскости. Шоубизнес уже видит в ИИ угрозу, т.к. есть прецеденты, когда искусственный интеллект сначала генерирует мелодии, а потом массово отправляет их в общественное достояние, что потенциально может привести к падению доходов музыкантов.

Решения для хакатона: алгоритмы, освобождающие мелодии, картины, узоры и т.д. т.е. которые генерируются ИИ и сразу передаются в общественное достояние.

Сюжет 5. Поведенческий излишек собственность пользователей или собственность платформы




Принцип работы Solid. Источник: Private Internet Access Blog (CC-BY-SA)

Поведенческий излишек (behavioral surplus) термин, введенный Шошаной Зубофф, обозначающий деривативы поведенческих данных пользователей, используемые для продажи таргетированной рекламы и аналогичных услуг.

По Сюжету 5, эксперты сошлись на мнении, что вопрос поведенческого излишка находится пока на очень ранних стадиях проработки и носит юридический и политический (баланс интереса компаний и общества) характер.

В этом сюжете следует отметить решения, связанные с аппаратным управлением собственными данными и вопросом прав принятия решений (decision rights) в области персональных данных. Т.е. основной вопрос знает ли пользователь о том, какие данные собираются, как они обрабатываются, кому продаются, и на каком этапе пользователь может отозвать или принять любое другое решение, касающееся своих данных или деривативов, произведенных на их основе.

Решения для хакатона: В контексте хакатона интересными направлениями являются эксперименты со следующими технологиями:

  • работа с проектом Solid Тима Бернерса-Ли;
  • технология (и в довесок к ней управленческая рамка) DoNotTrack, которую предлагается принять владельцам сайтов и создателям браузеров, чтобы уважать права принятия решений пользователей в отношении сбора их данных;
  • отдельные плагины для браузеров, которые контейнеризируют данные, собираемые для различных маркетинговых экосистем. Mozilla Firefox уже имеет подобный контейнер для данных, собираемых экосистемой Facebooka. Возможно стоит сделать подобные контейнеры для других маркетинговых систем: Alphabet, MRG, Yandex.


Сюжет 6. Защита авторских прав VS свободное использование произведений



Коллаж. Фото: Mika @mikafinland // Unsplash (CC-BY-SA)

В российской системе права нет fair use, свободное использование регулируется статьей ГК 1274. В этом смысле, считают участники круглого стола, россияне свободнее, чем граждане юрисдикций, где fair use однозначно определено с помощью четырех критериев: 1) назначение работы, цитирующей материал, 2) суть цитируемого материала, 3) объем цитаты, 4) влияние использования цитаты на рынок.

Решения для хакатона: возможно, следует с самого начала каким-то, возможно аппаратным, способом разделять назначение создаваемых произведений на коммерческие и некоммерческие.

Теплица социальных технологий и РосКомСвобода благодарят Владимира Харитонова, исполнительного директора Ассоциации интернет-издателей, а также всех экспертов, принявших участие в круглом столе. Зарегистрироваться на хакатон цифрового гражданства и цифровых прав demhack.ru можно до 10-го сентября 2020 г.
Подробнее..

Перевод На благо нашего общего будущего. Creative Commons возглавила Кэтрин Стилер, бывший евродепутат и CEO OKF

10.09.2020 18:21:56 | Автор: admin
Бывший евродепутат, ректор Сент-Эндрюсского университета и глава Open Knowledge Foundation Кэтрин Стилер заняла должность CEO в организации Creative Commons. Как MEP она занималась вопросами цифровой политики, цифрового рынка, защитой данных пользователей и реформой авторских прав.


Для меня большая честь присоединиться к CC в канун 20-летия организации.

На протяжении почти двух десятилетий CC работала, чтобы сделать мир более открытым и сбалансированным.

Когда CC начинала свою деятельность в 2001 году, я тогда только недавно была избрана членом Европарламента. Это было время, когда вопросы авторского права и доступа к информации начинали привлекать внимание общественности.

На протяжении 20 лет работы депутатом я непосредственно представляла более 5 миллионов человек в Шотландии и добивалась изменений для более, чем 500 миллионов жителей ЕС, занимаясь решением вопросов цифровой политики, таких как реформа авторского права, защита неприкосновенности частной жизни граждан, защита их данных, а также обеспечение доступа широкой публики к цифровым инструментам.

Сегодня мы оказались в совершенно ином мире. И когда я пытаюсь представить будущее, я чувствую, что работа CC никогда не была так важна.

У нас есть возможность играть ведущую роль в глобальной борьбе за устранение препятствий на пути распространения знаний и творчества.

Особенно это важно из-за возникших перед нами проблем, ведь пандемия коронавируса по-прежнему приводит к человеческим и экономическим потерям по всему земному шару.

Усиливается неравенство, и несправедливость становится ещё более очевидной.

Трагическое убийство Джорджа Флойда вызвало глобальное движение Black Lives Matter, а в ряде стран прошли продемократические акции протеста, в том числе недавно протесты состоялись в Беларуси.

СС выражает солидарность с теми, кто попал в беду, кто протестует против несправедливости, с теми, кто по всему миру борется за законность, представительство своих интересов и равноправие.

Испытания и кризисы, свидетелями которых мы стали в этом необычном году, вызывают законные вопросы о власти и привилегиях.

Кто имеет доступ к знаниям в нашем неравноправном обществе?

Мы понимаем, что слишком часто доступ к знаниям находится в руках узкого круга лиц, а не большинства, и зачастую его лишены женщины, люди с другим цветом кожи, сообщества LGBTQI и люди из стран Глобального Юга.

Наша задача подвергнуть сомнению такое положение вещей, такую власть и привилегированное положение. Решение этой проблемы в открытии доступа к знаниям и их распространении.

Во время коронавирусного кризиса мы увидели ряд позитивных изменений.

Был открыт доступ к ранее платным публикациям, а результаты исследований распространялись по всему миру. Гонка по разработке вакцины против COVID-19 демонстрирует, почему быстрый и неограниченный доступ к научным исследованиям и образовательным материалам так важен.

Досадно, что для этого потребовалась глобальная пандемия, но я надеюсь, что теперь этот урок усвоен.

Однако, мы стали свидетелями не только шагов вперёд, но и шагов назад.

Некоторые страны ввели ограничения права на информацию, и не все восстановили это право.

И по-прежнему многие знания остаются недоступными людям: во многих странах двери музеев и библиотек по-прежнему закрыты, а цифровой доступ всё ещё невозможен для большого числа людей.

Разрушать препятствия нелегко.

В качестве примера можно привести National Emergency Library, созданную Архивом Интернета, которая во время пандемии бесплатно предоставила пользователям свыше 1,3 млн. электронных книг.

Консорциум из четырёх издателей обратился в суд, и библиотека была вынуждена закрыться. Это свидетельствует о сохраняющихся препятствиях.

Но есть и надежда.

Я давно убеждена в необходимости обеспечить цифровой доступ, чтобы способствовать наступлению новой эры развития, роста и эффективности для всех членов общества.

Меня радует возможность добиться реальных перемен.

Работа СС уже доказала свою важность во время этой губительной пандемии. Инициатива Open COVID Pledge упростила университетам, компаниям и другим обладателям прав интеллектуальной собственности работу по разработке лекарств, тестовых наборов, вакцин и других научных открытий.

И мы работали ради того, чтобы образовательные ресурсы, финансируемые государством, были доступны по открытой лицензии, чтобы дать общественности доступ к достоверной, практической информации.

Предстоит сделать намного больше.

Наш мир стоит перед неопределённым будущим, и жизненно важно, чтобы организациями и правительствами была принята политика открытого доступа.

Технологические достижения сблизили многих людей, но в то же время слишком многих отодвинули на второй план.

Наша миссия построить общее будущее для всех, и мне не терпится приступить к этой работе.

Кэтрин Стилер (Catherine Stihler),
исполнительный директор Creative Commons Corporation.

Creative Commons License
Этот текст распространяется на условиях лицензии Creative Commons Attribution 4.0 International.
Вы можете копировать, редактировать и использовать в коммерческих целях этот текст при обязательном указании авторства.


Photo by DAVID ILIFF. License: CC BY-SA 3.0
https://commons.wikimedia.org/wiki/File:Catherine_Stihler_MEP,_Strasbourg_-_Diliff.jpg?uselang=ru
Подробнее..

Как защищать авторские права, чтобы не чувствовать себя беспомощным идиотом

30.09.2020 00:19:15 | Автор: admin


Я не совсем беспомощная и могу защитить себя, если соседи сожгли мне дом или работодатель нарушает трудовое законодательство. У меня отличный юрист, который не слил ни одной проблемы, за которую брался. Но когда доходит до авторских прав, я впадаю в кому. Не считала, сколько раз я встречала в сети свои тексты, сколько планов публикаций и образовательных программ я подарила нерешительным работодателям, а однажды моя фотография в стиле Half-Life 2 на билборде целый месяц рекламировала магазин одежды.

Но думать о том, чтобы устроить разборку чей совочек, так тошно, что я даже не пыталась никогда что-то с этим сделать. А послушав друзей, быстро поняла, что про срочно в суд! болтают те, у кого не было никакого реального опыта. Кому действительно случалось судиться, вспоминают это как травматичный и крайне разорительный эксперимент, говорить о нем не любят и повторять не хотят.

Но тут мне попалась история, как Максим Ильяхов без шума, пыли и обмороков взял и отстоял права на книгу Пиши, сокращай у инфобизнесмена с Бали Даниила Галта. Не сам отстоял, конечно, с юристами, но смог, выжил и получил с грабителя 300 тысяч за упущенную выгоду и вред деловой репутации.

Сумма, на мой взгляд, очень маленькая. В Штатах бы взыскали полную стоимость скачанных книг плюс двойной тариф за саму попытку.


Тут победа несет скорее педагогическую функцию: отдав деньги, пират задумается (наверно), нужны ли ему такие риски, друзей отговорит, а там, шаг-другой, и станет немодно продавать чужое. Помечтать-то можно?

Ну ладно, в ситуации с книгой и теоретически упущенной миллионной прибылью все более-менее понятно, там и издательство может вступиться, и ущерб очевиден. А много ли упущенной выгоды с картинки или статьи в интернете? Даже если и получится доказать свою правоту, компенсация наверняка не покроет даже расходы на юристов. Меня захватили вопросы, как отстаивать свои права на тексты, иллюстрации и рассылки простым смертным, отстаивать ли вообще и как не чувствовать себя при этом беспомощным идиотом.

Внезапно оказалось, что я знаю юриста Алексея Башука, который вел всю историю. Однажды я увидела в чате сообщение, что притяжательное местоимение ейный в Курске имеет функцию времени. Восхитилась. А через пару месяцев делала тренинг про притяжательные местоимения и спросила автора, можно ли использовать скрин. Оказалось, что за это время фраза в чате превратилась в статью про Курск, то есть стала полноценным объектом авторского права. Этим автором сообщения и статьи был Альберт Эн Алексей.

Я поняла, что это знак, и я просто обязана выяснить, как защищать свои права, не чувствуя себя идиотом. Поэтому я пришла к Алексею с вопросами, он на них ответил, а я решила не держать это знание в себе. Сразу оговорюсь, речь не о том, чтобы воспитать в себе сутягу и сразу бежать со всеми судиться.

Алексей, вот ситуация: человек видит на случайном сайте свой текст или иллюстрацию. Обычно он вздохнет, пожалуется друзьям, те с умным видом посоветуют обратиться в суд, на том все и закончится. Я понимаю пиратов почему бы и не использовать чужое, если никто не против. А что делать? Вот прям по шагам, для самых беспомощных.

Первое, что логично сделать, просто написать претензию. Посмотреть, кто отвечает за публикацию: если это сайт, то обычно есть форма обратной связи, если это в соцсетях то владельцу страницы. Можно написать в техподдержку самой соцсети: формы для жалоб по авторским правам почти везде предусмотрены.

Ты, не советуясь с юристами, которые здесь особо не нужны, просто берешь и пишешь обычное письмо на электронную почту или в личку: Здравствуйте, у вас на странице такой-то опубликовано мое произведение, ранее я его публиковала там-то, права на него принадлежат мне в соответствии с пунктом 4 статьи 1259 Гражданского кодекса.

По гражданскому кодексу возникновение авторских прав не требует регистрации и других формальностей.


Отправляешь письмо и смотришь на реакцию нарушителя. В большинстве случаев нарушитель просто все удаляет. Если не удалил, то встает вопрос: стоит идти судиться или нет? Картина следующая: если права нарушила компания, например, опубликовала твою фотографию или статью у себя на сайте, то судиться точно имеет смысл. Тут есть ответчик, его можно найти, у него, скорее всего, есть деньги на счетах.

В этом случае имеет смысл идти к профильному юристу, сделать у нотариуса протокол осмотра сайта, чтобы зафиксировать нарушение. Это нужно на случай, если нарушитель решит тихо удалить публикацию и сказать, что так и было.

Компенсацию по авторским правам взыскивают это обычная судебная рутина, любой желающий может эти суды нагуглить и убедиться.

В зависимости от того, сколько объектов было, изменяли их или нет, компенсации разные. За фотографию это обычно 20, 30 или 50 тысяч за каждую.


Второй вариант когда публикацию разместило неизвестное частное лицо. Здесь только один сценарий: обратиться в Мосгорсуд с иском о защите авторских прав, а к нему приложить ходатайство об обеспечении иска путем блокировки доступа к сайту через Роскомнадзор. Мосгорсуд блокирует доступ к домену, а дальше будет рассматривать твой иск о защите авторских прав.

Понятно, что эти иски ничем не заканчиваются, и всё это делают только ради того, чтобы заблокировать доступ к сайту, но это вполне рабочий инструмент.


Чем еще плохо, когда нарушитель-физик: никогда не знаешь, кто там, по ту сторону. Там может быть школьник. Или дедушка, которого хватит инфаркт, когда он увидит досудебную претензию. Все сложно. Поэтому обычно судятся только в тех случаях, когда нарушитель компания или предприниматель. Российские, понятное дело. Тогда есть реальный шанс что-то взыскать.

Еще ситуация: автор создает статью или иллюстрацию для клиента, клиент вносит замечания, потом говорит: нет, что-то как-то не то, спасибо, но нет. А через неделю публикует статью. Что делать? Автор, конечно, не публиковал заказную статью у себя в блоге и не визировал черновик у нотариуса.

В этой ситуации вы едва ли что-то докажете, поэтому железное правило: всегда заключать договор авторского заказа. У автора будет техзадание, по которому он пишет статью или рисует картинку. Всю переписку стоит вести в электронной почте: обменялись сканами, оговорили, что сканы имеют юридическую силу. О том, что писать в договорах, чтобы они имели юридическую силу, я недавно писал в своем ТГ-канале.

Подписали договор а дальше всеми черновиками и эскизами обмениваетесь по почте. Если клиент использовал статью, не заплатив, то он нарушил исключительное право, он обычный нарушитель, и тогда мы возвращаемся к предыдущему пункту и получаем компенсацию. В спорных ситуациях предъявляем переписку как доказательство передачи данных.

Здесь даже есть небольшой перекос законодательства в сторону интересов автора: если в договоре не указать, что исключительное право на произведение переходит заказчику, то он получит только лицензию, то есть право использовать статью, и ничего больше. Если клиент не глядя скачал и подписал шаблонный договор из интернета, где не предусмотрена передача исключительного права, автор может это произведение продать еще миллион раз.

Третья ситуация, злободневная: рассылка. Человек пишет рассылку или публикует советы в ТГ-канале, а подписчик в простоте своей перерабатывает каждый выпуск в статью, а потом собирает их все в учебный курс и продает. Приходилось защищать правообладателей в такой ситуации, что посоветуешь?

У меня таких случаев в практике не было, и судов я тоже не видел. То есть если такие споры и были, они все решались на уровне досудебного разрешения конфликта. В спорах об авторских правах есть особенность: очень мало судов, потому что в 90% случаев стороны договариваются в досудебном порядке.

Поэтому из общих принципов права ответ такой: все зависит от того, насколько человек переработал исходное произведение.

Вдохновиться идеей и написать свою статью не запрещено, на этом весь мир стоит. А если он тупо зарерайтил чужую статью, то есть последовательность мысли осталась той же, местами предложения совпадают и примеры те же самые, то он нарушитель, а у вас есть авторские права.


В истории с книгой у меня сложилось впечатление, что встревать в драку стоит, только если соблюдено много условий: зарегистрирован товарный знак, скачано копий на несколько миллионов, а у пирата есть деньги. Означает ли это, что отдельные тексты и картинки можно красть безнаказанно, а пиратам-нищебродам ничего не грозит, все равно ущерб не докажешь и денег не выбьешь?

Регистрация товарного знака на книгу необязательное условие для защиты произведения. В нашем случае регистрация товарного знака помогла нам отметить грубость нарушения и увеличить расчет ущерба. Без него мы насчитали бы ущерб тысяч на 300, а так насчитали на 700.

С пиратами-физлицами действительно нет смысла идти в суд: во-первых, их сложно найти, во-вторых, у них может просто не оказаться денег, чтобы заплатить. Поэтому в суде воюют с компаниями и предпринимателями, а одиноких пиратов просят удалить чужую собственность и они соглашаются. Да, в интернете распространено мнение, дескать, авторское право не работает, и на торрентах все есть. Но на самом деле оно там есть до тех пор, пока правообладатель не попросил удалить.

Вот живой пример: недавно я убирал из интернета пиратские копии Пиши, сокращай. Книга не выходила в электронном виде, поэтому ее сначала плохо отсканировали, потом криво отформатировали и затем много где выложили. Вот статистика: из 42 сайтов 39 книгу сразу удалили.

Если не удаляют просим заблокировать сайт через Роскомнадзор. Бегать за ними и требовать денег действительно глупо. Другое дело, если пират это корпорация или предприниматель тут разворачиваем полномасштабную досудебную претензию, суды и так далее.

В случае с книгой работа нотариуса обошлась в 50 тысяч, еще в 50 юридическое сопровождение. Если бы пошли в суд, во сколько встал бы весь процесс?

Обычно адвокаты рассчитывают стоимость суда так. Сто тысяч это первая инстанция: предварительное судебное заседание, возможно, второе предварительное судебное заседание, основное судебное заседание и еще одно. Одна инстанция это минимум три-четыре суда, меньше почти не бывает. В каждый из них надо сходить, подготовить документы, часто съездить в другой город. Но обычно нет проблемы взыскать эти расходы с проигравшей стороны, если не все, то хотя бы часть.

Как тебе такой план, назовем его метод Робинзона Крузо: довести один процесс до конца, даже без шанса выйти в плюс, а потом обугленную тушку пирата демонстрировать в назидание остальным?

(Смеется.) Ну да, так это обычно и работает. В целом именно этим мы сейчас и занимаемся: рассказали эту историю в соцсетях, чтобы другим неповадно было.

Что делать, если все суды прошли, всё доказали, а ответчик сидит на своем Бали и все игнорит?

Важное правило: не стоит ввязываться в судебные процессы, где не знаешь, как достать ответчика. Почему мы пошли воевать в случае с Галтом: у него в России гражданство, прописка и ИП. Если есть прописка, значит, есть имущество, счета в банках, с которых он платит налоги, с этим можно работать. Если собираешься судиться против иностранной компании или, еще хуже, иностранного гражданина, где вообще непонятно, что на той стороне происходит, туда лучше не лезть.

Много басен ходит про то, что ответчик, проиграв суд, сразу объявит себя банкротом и легко уйдет от ответственности.На самом деле это маловероятно. Из-за штрафа в 300 тысяч ни компания, ни даже физик банкротиться скорее всего не будут, потому что нормальное банкротство физлица, где арбитражный управляющий чем-то занимается, а не просто подает шаблонные бумажки, само по себе стоит тысяч 200400, и плюс накладывает на банкрота море ограничений. Там все совсем не так просто, как это рекламируют те, кто первый день занимаются банкротством физлиц.

И важный момент: да, может быть ситуация, в которой вам не получится отстоять права. Допустим, из десяти нарушителей семь уберут ваше произведение со своего сайта по первому требованию, еще двое заплатят компенсацию после суда или досудебного соглашения, а с одним вы ничего не сможете сделать. Если вы пишете или рисуете и получаете за это какие угодно деньги вы предприниматель, это не трагедия, а просто обычные риски, их тоже надо учитывать.

Вопрос жизни и смерти на что и как регистрировать права? Что патентовать, что заверять другими способами, а что оставить так?

Патентуют изобретения и товарные знаки, об этом у меня есть серия статей, я их собрал все вместе на своем сайте bashuk.ru. Если пишешь тексты или рисуешь иллюстрации, то патентовать там нечего, но можно заверить дату на произведении, чтобы при необходимости доказать авторство. Задепонировать программу можно в Роспатенте. Любые объекты авторского права можно заверить в системе Всемирной организации интеллектуальной собственности WIPO PROOF. Также это можно сделать у нотариуса, в РАО или даже отправляя самому себе письма, про это у меня есть подробная статья и отдельная о том, как защитить код.

Заверять произведение у нотариуса дорого, а Почтой России странно, хотя теоретически возможно. Пару месяцев назад Всемирная организация интеллектуальной собственности (ВОИС) организация ООН и международный администратор в сфере интеллектуальной собственности запустила онлайн-сервис WIPO PROOF. С его помощью можно задепонировать объект авторского права: то есть зафиксировать, что на эту дату у тебя есть это произведение. Депонирование стоит порядка 1,5 тысяч рублей, система простая, и все в онлайне. Ничто не мешает раз в месяц собирать все, что сделал, и депонировать в WIPO. Про это у меня тоже есть подробный разбор.

Когда надо идти за помощью к специалистам по праву, а когда человек в состоянии справиться сам?

К юристу имеет смысл идти в том случае, если ты серьезно хочешь идти до конца, судиться, взыскивать компенсацию. А вот написать нарушителям: Здравствуйте, это мое произведение, вполне может сам автор, для этого не надо знать и приводить миллион законов. Если с той стороны люди адекватные, они и так все уберут. А если нет тогда к юристу.

Часто покушаются на твои авторские права? Все защищаешь? Какая самая поразительная история была?

Постоянно покушаются, иногда рерайтят, иногда просто весь сайт перерисовывают. Как бы смешно это ни звучало, юристы по интеллектуальной собственности зачастую нарушают чужие права. Была прекрасная история, когда я зашел на сайт к женщине, которая занимается регистрацией товарных знаков, и увидел видео, где она проговаривает текст моего ролика. Своего там было только ее имя вместо моего. Первый раз видел, как кто-то снялся в моей роли.

Я решил, что это слишком весело, чтобы не обращать на это внимания. Поэтому позвонил по телефону, по которому она предлагала обращаться. И сказал: Мой ролик пересняли, вы поможете мне защитить мои права? Конечно! сказала она. Надо бороться! Присылайте материалы, посчитаем бюджет и сроки!


Когда я отправил ей оба ролика, она сама перезвонила, очень ругала безответственных подрядчиков, которые во всем виноваты (это было ожидаемо), извинялась и обещала все удалить. Удалила она ролик только с сайта, а в своем ютуб-канале оставила. Я не стал ее уговаривать. Написал в админку Ютуба, и ее заблочили.


Теперь у юриста по защите авторских прав на канале висит объявление, что ее заблокировали за нарушение авторских прав.

У нас катастрофически не модно защищать свои права. Это очень хорошо видно по осторожным формулировкам Максима Ильяхова и по тому, как он в итоге даже полученную компенсацию отдал на образование: провел конкурс Вызов Главреда, а деньги направил на призовой фонд этого конкурса. Я уверена, человека, который напишет статью Как я отсудил у пиратов миллион и купил машину, хейтеры разорвут и пойдут жалеть пиратов. Так вот, слишком философский вопрос: как сделать, чтобы стало модно защищать свой труд?

Ответ потянет на книгу. Откуда вообще это мнение, что защищать свои права стыдно? Во-первых, многие люди считают, что если у человека украли рубль, то у него теперь на рубль меньше, а если скопировали иллюстрацию, то от него нигде не убыло: ведь его иллюстрация при нем. Во-вторых, позицию свободного копирования поддерживают в основном люди, которые ничего не создают: не пишут музыку, не рисуют, не снимают фильмы. Да, они где-то работают, но активным творчеством не занимаются. Если бы такой человек создал что-то ценное, то, наверное, первым пошел бы выяснять, как взыскать компенсацию за нарушение. В-третьих, у нас вообще принято романтизировать нелегальное.

И менять это, очевидно, должны создатели интеллектуальной собственности, само собой ничего не изменится. Я интересуюсь европейским и американским правом интеллектуальной собственности, там все по-другому. Недавно читал английскую статью, где автор пишет: Представьте, что вы сделали изобретение, подали предварительную патентную заявку, потом рассказали друзьям, те предложили улучшения, а заявку уже изменить нельзя. И меня поразила не предварительная патентная заявка, которой в России, кстати, нет.

Поразило то, что он считает само собой разумеющимся, что он сначала подает патентную заявку, а потом рассказывает друзьям.


У нас же вообще не так! У нас человек что-то изобретет он обычно сначала рассказывает об этом всем, потом пишет статью, публикуется в сборнике, получает грант, защищает диссертацию, а вот потом, года через три, наконец вспоминает про патенты. А там патентовать уже поздно: если информация была опубликована, то ничего нового в ней уже нет, даже если ее опубликовал сам автор. То есть у нас уровень правозознания в этой сфере немного другой, он пониже. Может быть, это связано с тем, что в России авторские права сфера относительно молодая. В Советском Союзе авторские права как бы защищали, но в Европе и США авторское право развивалось совсем другими темпами.

Как это можно изменить? Важно рассказывать о случаях, когда права защитили. Сейчас очень мало информации о том, как все это работает: судебной практики почти нет, у юристов есть задачи важнее, чем писать по ночам статьи, как они отстояли авторские права. С чего бы это было модным, если об этом никто не говорит? Постепенно, лет через 2030, мы наверное придем к той модели, которая есть в Европе, когда у каждого есть базовые знания, что такое интеллектуальная собственность. Пока все вообще не так, но я надеюсь, получится это изменить.




Надеюсь, вам было полезно. На моем глобусе точно стало светлее. Задача, которая меня в этой истории будоражит: снять спазм, тот ступор, когда тебя вроде ограбили, а что делать неясно. В итоге человек застывает и ничего не делает. Этот ступор то, на чем кормятся пираты.

P.S. Права на этот текст принадлежат мне, мое авторское право на него возникло в момент публикации. Иллюстрация тоже принадлежит мне, это право возникло в момент, когда я оплатила работу художника. Знания, что делать, если на вашу интеллектуальную собственность претендуют, теперь принадлежат вам, и вы можете их свободно распространять, пересказывая собственными словами или цитатами со ссылкой на автора и источник.

Светлана Болгова приняла вызов Главреда и теперь исследует вопрос, как защищать авторские права.
Подробнее..

Перевод Встречайте Creative Commons Legal Database

14.12.2020 02:16:30 | Автор: admin

На днях состоялся запуск Creative Commons Legal Database одного из долгожданных проектов от Creative Commons, нацеленного на сбор и систематизацию информации, связанной с лицензиями Creative Commons (судебные дела и юридические статьи). Проект выглядит многообещающим (конечно, там есть судебная классика по опенсорсу Jacobsen v Katzer, правда, в очень сжатом виде), но пока не впечатляет своим объемом надеюсь, в скором времени там появится информация и по России, например. А пока предлагаю узнать про эту базу данных и сам проект в целом из статьи ниже.




Юридическая база данных Creative Commons Legal Database это подборка судебных прецедентов и юридической науки, которая поможет нашим пользователям узнать больше о правовых вопросах, связанных с лицензиями Creative Commons и юридическими инструментами. Эта информация была предоставлена многими преданными членами Creative Commons Global Network и юридической командой Creative Commons. Она опубликована на общедоступном бета-сайте, и мы работали над выпуском новой версии, чтобы, наконец, закончить проект как официальный продукт Creative Commons.


Что мы хотели улучшить на бета-сайте? Во-первых, мы хотели интегрировать словарь, систему дизайна Creative Commons, и таким образом, унифицировать внешний вид с другими сайтами и приложениями Creative Commons, проходящими тот же процесс. Во-вторых, администрирование информации юристами Creative Commons (рецензирование и публикация) было громоздким процессом, поэтому мы хотели переосмыслить его, обеспечив дружественный интерфейс администрирования.


Исследуйте новый сайт


Теперь вы можете получить доступ к обновленному сайту Creative Commons Legal Database и наслаждаться удобством работы с ним. Просмотрите ресурсы, которые призваны помочь вам понять применимость и прецеденты, установленные судами по всему миру в отношении лицензий Creative Commons, включая юридические исследования, обсуждающие лицензии Creative Commons и инструменты общественного достояния.


image


Домашняя страница Creative Commons Legal Database


image


Cписки судебных дел из Creative Commons Legal Database


В списках вы можете найти определенный контент по ключевым словам или фильтровать по темам, нажимая на теги. Смотрите подробную информацию, нажав на название дела или название статьи.


Вы также можете внести соответствующую информацию в базу данных на сайте проекта, который юридическая команда Creative Commons развернет в ближайшем будущем. Как только будет доступно, вы сможете отправить судебное решение или статью со ссылкой и другой основной информацией. Многие поля необязательны, но чем больше их вы заполните, тем лучше.


В случае сомнений проверьте раздел "Часто задаваемые вопросы" или свяжитесь с нашими юристами.


Кроме того, как упоминалось ранее, мы переосмыслили весь сайт, чтобы облегчить сотрудникам управление информацией. Хотя это не все могут видеть, мы надеемся, что автоматизация задач и более простой интерфейс помогут ускорить процесс предоставления дополнительной информации для общественности.


Что дальше?


Всегда есть место для улучшения. Для этого проекта есть ряд аспектов, где мы все еще можем улучшить технологический уровень:


  • Улучшить поиск в настоящее время функция поиска довольно ограничена по условиям, которые могут быть запрошены, а это значит, что если пользователи совершат ошибку (например, перепутают местами две буквы) то они, вероятно, не найдут того, что хотели. Кроме того, поиск можно улучшить, показав рекомендации, когда ничего не найдено.
  • Сделать таблицы сортируемыми по столбцам дайте пользователю больше возможностей для изучения и сканирования ресурсов. Было бы неплохо иметь функции, обеспечивающие большую интерактивность с данными.

Если вас интересует процесс, который потребовался для переосмысления сайта, есть ряд сообщений в блоге Open Source blog, которые освещают это.


Как я могу внести свою лепту?


Правовая база данных Creative Commons это проект с открытым исходным кодом, поэтому вклад сообщества приветствуется. Вы можете найти код в репозитории на Гитхабе и сообщить об ошибках или предложить новые функции. Пожалуйста, прочтите руководство по отправке контрибьютов перед их отправкой. У нас также есть канал в Slack для обсуждения специфики проекта, вы можете присоединиться к #cc-dev-legal-database, если желаете, мы будем ждать ваших ценных комментариев. И напоследок, пожалуйста, следите за анонсом от юридической команды Creative Commons, который будет включать в себя призыв делать контрибьюты.

Подробнее..

Популяризация исторического контента в Википедии круглый стол в Казани

20.02.2021 12:17:51 | Автор: admin
19 февраля 2021 года Институт истории Академии наук Республики Татарстан (Институт Марджани) провёл круглый стол по теме Популяризация исторического контента в Википедии. Учёные историки обозначили круг проблем, которые возникают у них при работе с Википедией.

Дискуссия обратилась к двум ключевым вопросам: 1) как избегать этнических конфликтов, 2) как сделать научную литературу доступной для самого широкого использования.

Радик Римович Салихов (директор Института истории АНРТ) с радостью подчеркнул, что растёт интерес людей к родным языкам и местной истории, и этот интерес обращается к историческим ресурсам интернета. Поэтому перед татарскими учёными встаёт новый вопрос о самом широком распространении достоверных научных знаний. Если не решить этого вопроса, тогда в статьях Википедии о населённых пунктах и личностях будут появляться ошибочные или предвзятые известия.

Марат Мингалиевич Гибатдинов (заместитель директора по научной работе ИИ АНРТ) сказал, что Институт стремится пополнять Википедию новыми статьями и исправлять уже созданные статьи, потому что Институт располагает очень большим запасом знаний, который не может довести до широкой публики только своими силами. Собственный сайт Института истории не решает этой задачи, не позволяет транслировать исторические знания туда, где они действительно нужны читателям.

Он уточнил, что речь идёт не только о справочных статьях Википедии. Вместе с ними Институт может обратить своё внимание на фотобанк Викисклад, на библиотеку Викитеку, на новостной сайт Викиновости. Это даёт ещё больше инструментов для популяризации знаний, для пропаганды серьёзного интереса к исторической науке.

Айдар Ильсурович Ногманов (заведующий отделом историко-культурного наследия народов Республики Татарстан ИИ АНРТ) рассказал про конфликты между соседними народами, которые наследуют единую, географически смежную историю, однако по-разному воспринимают прежние события, по-разному освещают национальные особенности местной истории. Башкирская литература освещает историю Татарстана не так, как татарская литература, ставит свои акценты и обозначает свой круг интересов, откуда может возникать конфликт. Вопрос становится всё более важным, потому что всё больше статей Википедии посвящены местным вопросам, а значит, растёт и число конфликтных точек.

Бахтияр Искандерович Измайлов (заведующий отделом междисциплинарных исследований ИИ АНРТ) признал, что давно работает с Википедией, потому что она стала очень популярным справочником, её в первую очередь транслируют поисковые сайты, из неё публика хочет получить объективную информацию о фактах.

Он заметил, что Википедия содержит не только сухие справки. Она поневоле окрашена идейными красками, потому что идёт по следам учёных исследователей, которые не вполне согласны между собой. Как в науке есть конфликты между школами так и в Википедии есть конфликты между статьями, в которых выражены разные точки зрения. Статьи в Википедиях на русском, башкирском и татарском языках представляют разные точки зрения на одну тему на событие, персону или территорию.

Историки привыкли работать в формате редакционных коллегий, когда автор присылает статью, редакторы обсуждают её и задают вопросы. Но в Википедии принят иной метод: разные люди быстро вносят свои дополнения или поправки. Для академических учёных этот метод нов и необычен.

Измайлов отметил, что исторические статьи Википедии недостаточно связаны с исторической литературой через цитаты и ссылки. По его мнению, главная причина в том, что исторические труды недоступны в электронном виде. По его словам, Институт истории АНРТ публикует свои труды на сайте, однако ещё не задавался вопросом их свободного распространения, свободного лицензирования. Пришло время решать этот вопрос.

Сайрус Русланович Хамидуллин (отдел историко-культурного наследия народов Республики Татарстан ИИ АНРТ) рассказал, что Институт истории готовит статьи по истории населённых пунктов Татарстана, опираясь на энциклопедию, изданную десять лет назад. Здесь стали возникать этнические конфликты, потому что башкирская литература и татарская литература дают разные, противоречивые выводы по истории сёл и деревень. У башкир и татар есть авторитетная и достоверная научная литература по таким вопросам однако она даёт различные оценки, указывает разные названия народов. Сегодня это приводит к явным и заметным противоречиям.

Дмитрий Евгеньевич Мартынов (Казанский федеральный университет) объяснил, что сам метод создания Википедии отличается от методов создания классической энциклопедии. Классическую энциклопедию писали интеллектуальные специалисты с большим запасом знаний. А вот Википедию пишут неспециалисты, которые сильно зависят от доступности научных источников. Работая над статьями Википедии, авторы не имеют лёгкого доступа к серьёзной литературе. Более того, даже научная библиография недостаточна, нет удобного доступа к научным библиографическим базам и обзорам, трудно даже найти достоверную литературу.

Подводя итог, Фархад Наилевич Фаткуллин (переводчик Управления государственного протокола президента Республики Татарстан) сказал, что Википедия позволяет развивать сотрудничество между людьми, позволяет договариваться друг с другом, позволяет учиться совместной работе.

Чем всё это интересно и полезно для нас?


  • Работа академического института будет примером для многих других.
  • Есть надежда, что Институт истории выработает образцовые документы и договора, чтобы издательства могли выпускать свою литературу в свободный оборот по свободной лицензии.
  • Как правило, академические институты располагают огромным запасом научного, популярного и визуального контента. Можно полагать, что этот контент выйдет на рынок по свободным лицензиям. Сама оцифровка и презентация такого контента ведёт к созданию новых технологий для управления знаниями.
  • Институт истории АНРТ стремится решить социальную и политическую проблему, задавая новый тренд. Этот тренд противоречит сложившейся традиции, сложившемуся научному методу и, главное, сложившейся научной экономике. Здесь возможны неожиданные открытия и перемены.



Текст: PereslavlFoto, CC-BY-SA 3.0.
Подробнее..

Перевод Краудмэтчинг через Snowdrift.coop. Научный подход к краудфандингу (Часть 1)

23.08.2020 12:14:59 | Автор: admin
Привет, хабравчане Хабр! Давно не виделись!)) Давно у меня не было постов.
Сегодня 22 августа праздник и годовщина сами знаете чего. Самое время поговорить о свободе, FOSS и свободных интернет-проектах. Представляю вашему вниманию перевод описания нового краудфандингового проекта Snowdrift.coop, который планируется запустить до конца 2020 года.
Если кратко, я бы описал проект как Patreon + Kickstarter. Snowdrift.coop задуман для финансирования неконкурентных общественных благ, то есть для СПО-проектов (на первом этапе), а также разных благотворительных и общественных проектов (следующим этапом). Я недавно узнал об этом проекте и уже подписался на пожертвования. Вы тоже можете.




Открытый Интернет, построенный на основе широкого участия людей, воодушевляет и объединяет активных граждан по всему миру. Благодаря онлайн-сотрудничеству мы создали потрясающие проекты, такие как Википедия и операционная система GNU/Linux. Поскольку эти цифровые продукты являются неконкурентными общественными благами, каждый может иметь к ним доступ, пользоваться и распространять их свободно.

К сожалению, мы сталкиваемся с большими препятствиями. Искусственные ограничения препятствуют инновациям и творчеству. Повсеместная реклама заполняет наше культурное пространство и отвлекает наше внимание. Широкомасштабная слежка за людьми угрожает нашим гражданским свободам. Организованные монополистические силы устанавливают свой контроль с помощью юридических монополий (законы об авторском праве и патентах), технического контроля (часто называемого Digital Restrictions Management или DRM), скрытности (например, распространение компьютерных программ с закрытым исходным кодом) и огороженных садов (недемократических платформ, которые запирают и захватывают творческие ценности, создаваемые пользователями этих платформ).

Но если мы отвергаем проприетарные ограничения и рекламу, как людям вообще будут платить за создание чего-то нового?

Прежде всего, люди получают удовольствие от участия в значимых проектах, независимо от денег. Удивительное количество проектов разрабатывается сегодня людьми, которые работают в свободное от работы время и свободно распространяют результаты по всему миру. Мы называем эти работы разными терминами: Free/Libre Software, Open Source, Свободная культура, Открытое знание С этого момента мы будем использовать инклюзивную комбинацию Free/Libre/Open или FLO.

Конечно, работа, выполняемая только неоплачиваемыми добровольцами, часто не соответствует качеству хорошо финансируемых целенаправленных бизнесов. Если бы мы могли обеспечить устойчивую жизнь проектным командам FLO, мы могли бы иметь высококачественные ресурсы без анти-функций вроде неприятной рекламы, слежки или искусственных ограничений.

Да тут всю систему надо менять! Нам необходимы системные изменения



Люди продолжают использовать и поддерживать проприетарные ресурсы, потому что для них такие продукты являются или кажутся привлекательными. Социальное давление усиливает этот цикл. Пока друзья и коллеги используют и рекомендуют проприетарные ресурсы, большинство из нас присоединяюся к ним.

Сам по себе индивидуальный выбор не решает системных проблем. Это мало что меняет для одного человека в отдельности. Никому из нас не нужны анти-функции и ограничения; но пока проекты FLO не будут конкурировать по качеству и маркетингу, их внедрение будет ограничено. Чтобы добиться успеха, проекты FLO сейчас нуждаются в большей поддержке. Но предоставление наших ограниченных ресурсов проприетарному бизнесу оставляет меньше для FLO-проектов.

В этих условиях люди, которые надеются зарабатывать на жизнь, занимаясь созиданием, занимаясь творчеством, продолжают накладывать проприетарные ограничения на результат своего труда. Люди, которые хотят иметь лучшие ресурсы, продолжают использовать и поддерживать эти проприетарные проекты. Этот цикл усиливает нашу коллективную зависимость от несвободных ресурсов и наносит ущерб благу всего общества.

Хотя это возможно, быть вегетарианцем в сообществе мясоедов это социально неудобно и сложно. Точно так же и в отношении того, что мы могли бы назвать FLOitarians только крошечное меньшинство из нас из принципа отвергнет проприетарные вещи. Немногие из нас когда-либо находили время, чтобы полностью изучить сложные этические и медицинские проблемы потребления мяса или проблемы частной жизни и свободы, связанные с проприетарными продуктами. Большинство людей идут по пути наименьшего сопротивления.

Выбор между проприетарным и FLO



Что бы вы выбрали?

  1. Платить (своим вниманием, которое тратится на рекламу, или долларами) за доступ к высококачественным проприетарным ресурсам тогда у вас также будет полный доступ к свободно доступным FLO-ресурсам, и вы все равно сможете перечислить небольшое пожертвование, когда у вас появится такая возможность.
  2. Отказаться от проприетарных вещей, чтобы лучшим образом поддержать более достойные FLO ресурсы тогда вы поплывёте против течения и сохраните свои свободы, но вы откажитесь от любых выгод, предоставляемых проприетарными ресурсами, исключите себя из сообществ, связанных с проприетарными продуктами, и одни только ваши действия всё равно мало что изменят к лучшему.


Многие люди выбирают третий вариант: действовать в обход проприетарных ограничений, чтобы получить доступ без оплаты (блокировать рекламу, игнорировать законы об авторском праве и взламывать DRM). Но даже если это позволяет отказаться от прямого финансирования проприетарной продукции, это все равно усиливает общее доминирование проприетарного рынка.

Нам нужен новый общественный договор: если проекты решат быть FLO, сообщество будет продолжать их финансировать; и аналогичным образом, если сообщество финансирует какой-либо проект, то это должно быть FLO.

Большинство работающих над проектами команд не стремятся к тому, чтобы проприетарный контроль был самоцелью, они просто хотят иметь стабильный доход. Если мы объединимся для сотрудничества, у нас могут быть все лучшие имеющиеся сегодня ресурсы и даже больше все FLO, без рекламы, вмешательств в личную жизнь или любых других анти-функций.

Представляем Snowdrift.coop



Наша система мэтчинга и сбора пожертвований позволяет любому человеку поддерживать FLO-проекты с минимальным риском и максимальной пользой.

Краудмэтчинг сочетает в себе взаимные гарантии и стабильную поддержку от постоянных доноров.



В отличие от традиционного фандрайзинга, когда сбор средств происходит по принципу один жертвует другому, мы используем обещание жертвовать по принципу многие люди жертвуют многим, которое мы назвали краудмэтчинг. Таким образом, возникает сетевой эффект, в результате которого мы все усиливаем друг друга. И, в отличие от разовых кампаний по сбору средств, которые помогают запускать проекты, проект Snowdrift.coop предполагает ежемесячные платежи, чтобы обеспечить стабильную поддержку текущей работы.



Патронат сообщества доноров позволяет лучше продвигать общественные интересы



До эпохи современного рыночного капитализма творческие люди получали поддержку со стороны состоятельных меценатов. С помощью Snowdrift.coop глобальное сообщество становится таким меценатом. Вместо того, чтобы компании предлагали нам варианты, а мы их всего лишь выбирали в качестве потребителей, мы поддержим другую систему. Мы будем активно работать с проектами, которые в наибольшей степени служат интересам общества.

Наш подход минимизирует затраты и риски как для проектов, так и для жертвователей, делая систему реалистичной и практичной. Каждое новое обещание жертвовать представляет собой приглашение другим людям к участию в проекте. Если мы будем финансировать только некоторые проекты или предоставлять только частичное финансирование, это все равно будет целесообразным. С другой стороны, если мы добьемся успеха в большем масштабе, мы воодушевим людей на смену парадигмы в сторону более демократичной экономики и более свободного мира.

Как это работает



  1. Зарегистрируйте аккаунт пользователя
  2. Добавьте платежные реквизиты
  3. Заявите о своей поддержке ваших любимых проектов


В базовом обещании жертвователя сказано:

***Каждый месяц я буду жертвовать по десятой части цента за каждого другого жертвователя, который тоже начнёт жертвовать. ***

  • Нет никакого риска для участников; если жертвовать будут немногие, то это ничего не будет вам стоить.
  • Когда Вы присоединяетесь, ваше обещание жертвовать означает, что существующие доноры будут жертвовать больше, чтобы соответствовать вам!
  • Вы контролируете свой бюджет. Если жертвуемая сумма поднимается до уровня, превышающего ваш бюджет, она будет автоматически снижена. Чтобы сохранить обещание жертвовать, вы можете увеличить свой бюджет на пожертвования или отказаться от поддержки других проектов.


Вы также можете внести творческий вклад в экосистему. Существует множество способов помочь. Кроме того, как покровитель самого проекта Snowdrift.coop, вы можете стать членом кооператива и иметь больше влияния в управлении всей системой.

Организация проектов в соответствии с самыми высокими стандартами



Мы требуем, чтобы все проекты пользовались лицензиями Free/Libre/Open, были прозрачными и соблюдали принципы честности (подробнее см. раздел Сообщество). Поскольку средства поступают из текущих ежемесячных платежей, проекты несут ответственность перед сообществом. Жертвователи могут корректировать свои взносы в зависимости от того, как они относятся к результатам работы каждого проекта.

Почему используется название Snowdrift?



Наше название происходит от дилеммы в теории игр под названием Дилемма сугроба. Представьте себе огромный сугроб, перекрывающий дорогу; кто его расчистит? У нас у всех есть другие дела. Например, при финансировании FLO, никто не хочет брать на себя эту ношу в одиночку. В дилемме FLO, препятствиями к устранению являются проприетарные ограничения и проблемы с финансированием, и мы можем решить эти дилеммы вместе, взяв на себя обязательство о совместном финансировании. Таким образом наше название: Snowdrift.coop. Чтобы узнать больше о теории игр, прочтите нашу страницу, подробно объясняющую дилемму сугроба.

Как насчет других вариантов финансирования?



Все существующие механизмы финансирования проектов FLO имеют различные проблемы (более детальные обзоры см. в разделе Исследование рынка), но мы можем работать параллельно с ними в любом случае. Мы просто требуем, чтобы проекты раскрывали все свои источники финансирования для обеспечения прозрачности.

Какие проекты могут участвовать?



Мы можем курировать набор проектов, участвующих в нашем начальном тестировании и запуске, но после этого мы будем рады участию всех проектов, отвечающих нашим требованиям (которые включают лицензирование Free/Libre/Open и некоторые другие детали), в том числе в области искусства, музыки, журналистики, учебников, исследований, технологий при условии, что основная работа проекта заключается в производстве общественных благ, которыми все могут свободно распоряжаться.

Авторы оригинала: Iko, wolftune, Aaron Wolf. CC-BY-SA 4.0.
Перевод текста доступен по лицензии Creative Commons Attribution-ShareAlike 4.0.

Обратите внимание, это копилефт-лицензия. Я автор более 100 статей на Хабре, но никогда не участвовал в Программе Поощрения Авторов (ППА) и не получал денег от Хабра. Как раз из-за таких случаев я не могу принять участие в этой программе, иначе бы я передал авторские права на перевод, а Хабр выпустил бы его по другой лицензии от своего имени. Тем самым я бы подставил юридическое лицо Хабра под нарушение авторских прав. Поэтому если мои посты были вам когда-либо полезны, вы можете напрямую отправить мне пожертвование (подарок) через сервис Liberapay (0% комиссии) или Яндекс.Деньги. С меня много статей в будущем!

P.S.: Статья чуть дорабатывается. Прошу отнестись с пониманием. Разучился писать статьи. Как и где именно разучился можете сообщить через хабрапочту.
Подробнее..

Из песочницы Внедрение RoI Pooling в TensorFlow Keras

08.07.2020 12:13:32 | Автор: admin

Привет, Хабр! Представляю вашему вниманию перевод статьи "Implementing RoI Pooling in TensorFlow + Keras" автора Jaime Sevilla.


В данный момент я прохожу курс машинного обучения. В учебном блоке "Компьютерное зрение" возникла необходимость в изучении RoI Pooling слоёв. Приведённая ниже статья мне показалась интересной, в связи с чем я решил поделиться переводом с сообществом.


В этом посте мы объясним основную концепцию и общее использование RoI pooling (Region of Interest область интересов) и предоставим реализацию с использованием слоев Keras среды TensorFlow.


Целевая аудитория этого поста люди, знакомые с базовой теорией (сверточных) нейронных сетей (CNN) и способные создавать и запускать простые модели с использованием Keras.


Если вы здесь только для кода, обратитесь сюда и не забудьте поставить лайк и поделиться статьей!


Понимание RoI Pooling


RoI Pooling был предложен Россом Гиршиком в статье Fast R-CNN как часть его пайплайна распознавания объектов.


В общем случае использования для RoI Pooling у нас есть подобный изображению объект и несколько областей интереса (RoI regions of interest), указанных через ограничивающие рамки. Мы хотим создать эмбеддинги (embedding (вложения) сопоставления произвольной сущности (кусочка картинки) некоторому вектору) из каждого RoI.


Например, в настройке R-CNN у нас есть изображение и механизм выделения регионов-кандидатов, который создает ограничивающие рамки для потенциально интересных частей изображения. Теперь мы хотим создать эмбеддинг для каждого предложенного кусочка изображения.


выделение регионов-кандидатов на изображении


Простое обрезание каждой предложенной области не сработает, потому что мы хотим наложить полученные эмбеддинги друг на друга, и предлагаемые области не обязательно имеют одинаковую форму!


Поэтому нам нужно придумать способ трансформации каждого предложенного кусочка изображения таким образом, чтобы он приводил к созданию эмбеддинга заранее определенной размерности. Как мы можем сделать это?


В задачах компьютерного зрения стандартным способом уменьшения формы изображений является использование какой-либо операции объединения (pooling).


Наиболее распространенным является вариант max pooling, где мы делим входное изображение на (обычно не перекрывающиеся) области одинаковой формы и формируем выход, беря максимальное значение, найденное в каждой области.


Операция maxpool делит каждую область на пулы одинакового размера


Операция maxpool делит каждую область на пулы одинакового размера

Это напрямую не решает проблему, которая у нас есть кусочки изображения различного размера будут разделяться блоками фиксированной размерности: эмбеддинги будут переменной размерности.


Но этот подход наталкивает на идею. Что если мы разделим каждую интересующую RoI на одно и то же количество областей различной формы и возьмем максимум каждой из них?


Операция ROI Pooling делит сеткой одинакового размера все части изображения, подвергаемые операции pooling.


Операция ROI Pooling делит сеткой одинакового размера все части изображения, подвергаемые операции pooling.

И это именно то, что делает слой ROI Pooling.


Области применения RoI Pooling.


RoI Pooling довольно общий инструмент. Как правило, он выходит на свет в сочетании с механизмами выделения кандидатов RoI, устраняя разрыв между выделением кандидатов и их эмбеддингами. Мы увидим два конкретных примера, иллюстрирующих его потенциал.
Во-первых, в контексте распознавания объектов (для которого RoI Pooling был разработан), он позволяет нам разделить пайплайн задач на две части (выделение кандидатов и классификация регионов), сохраняя при этом сквозную (end-to-end) однопроходную (single-pass) дифференцируемую архитектуру.


Fast R-CNN, демонстрирующая RoI Pooling, Росс Гиршик


Fast R-CNN, демонстрирующая RoI Pooling, Росс Гиршик

Таким образом, в модели R-CNN у нас сначала есть компонент в модели, который выделяет на изображении фиксированное количество областей интереса (RoI). RoI Pooling позволяет нам запускать классификатор CNN для всех предложенных областей. В качестве ответа алгоритм выбирает регион с максимальной вероятностью целевого класса.
Во-вторых, вместе с выделением регионов-кадидатов, RoI Pooling также может быть использован для реализации визуального внимания (visual attention).


Attentional Network для визуальной детекции обьектов , демонстрирующая ROI Pooling, авторы Hara и др..


Attentional Network для визуальной детекции обьектов, демонстрирующая ROI Pooling, авторы Hara и др..

В качестве примера в Attentional Network для визуальной детекции обьектов мы видим, как Hara другие соавторы реализовали механизм attention, используя итеративные выделения кандидатов ROI и ROI Pooling. Сначала алгоритм генерирует первого кандидата (t = 1), которого ROI Pooling адаптирует к полносвязным слоям (Fully Connected). Результат используется в качестве входных данных для компонента Glimpse (представление) (t = 2) для генерации нового кандидата, который так же подвергается эмбеддингу с помощью ROI Pooling. Процесс повторяется Т раз.


Реализация.


Прежде чем мы углубимся в реализацию, остановимся на минуту, чтобы подумать о типе сигнатуры слоя ROI.


Он принимает два тензора:


  • Пакет (batch) изображений. Чтобы иметь возможность обрабатывать их вместе, все изображения должны иметь одинаковые размеры. Результирующая форма тензора будет (batch_size, img_width, img_height, n_channels), где batch_size- размер пакета изображений, img_width ширина изображений, img_height высота изображений, n_channels количество каналов в изображении.
  • Пакет (batch) кандидатов ROI. Если мы хотим объединить их в тензор, количество областей-кандидатов должно быть фиксированным для каждого изображения. Поскольку каждый ограничивающий прямоугольник должен быть указан с 4 координатами, форма этого тензора будет (batch_size, n_rois, 4), где batch_size размер пакета кандидатов ROI, n_rois количество кандидатов ROI.

На выходе должен быть:


  • Список эмбеддингов для каждого изображения с кодификацией областей, определеннных каждой ROI. Соответствующая форма должна быть (batch_size, n_rois, pooled_width, pooled_height, n_channels). batch_size- размер пакета изображений, n_rois количество кандидатов ROI, pooled_width ширина обьединных изображений, pooled_height высота обьединенных изображений, n_channels количество каналов в изображении.

Код в Keras


Keras позволяет нам легко реализовывать пользовательские слои посредством наследования базового класса Layer.


В документации tf.keras рекомендуется реализовать методы init, build и call для нашего самодельного слоя. Однако, поскольку целью функции build является добавление весов слоя, а наш слой не имеет весов, нам не нужно переопределять этот метод. Мы также реализуем удобный метод compute_output_shape.


Мы будем писать код для каждой части отдельно, а в конце статьи объединим все куски.


def __init__(self, pooled_height, pooled_width, **kwargs):    self.pooled_height = pooled_height    self.pooled_width = pooled_width    super(ROIPoolingLayer, self).__init__(**kwargs)

Конструктор класса довольно прост для понимания. Нам нужно указать целевую высоту и ширину эмбеддингов, которые мы создаём. В последней строке конструктора мы вызываем родительский конструктор для инициализации остальных атрибутов класса.


def compute_output_shape(self, input_shape):    """ Returns the shape of the ROI Layer output    """    feature_map_shape, rois_shape = input_shape    assert feature_map_shape[0] == rois_shape[0]    batch_size = feature_map_shape[0]    n_rois = rois_shape[1]    n_channels = feature_map_shape[3]    return (batch_size, n_rois, self.pooled_height,             self.pooled_width, n_channels)

compute_output_shape это просто полезная служебная функция, которая скажет нам, каким будет выход слоя для определенного ввода.


Далее мы должны реализовать вызов (call). Функция вызова это место, где живет логика слоя. Эта функция должна принимать в качестве входных данных два тензора, которые содержат входные данные для слоя ROI Pooling, и выводить тензор с эмбеддингами.


Прежде чем реализовать это, нам нужно реализовать более простую функцию, которая будет брать одно изображение и одну ROI и возвращать соответствующий эмбеддинг.


Давайте сделаем это шаг за шагом.


@staticmethoddef _pool_roi(feature_map, roi, pooled_height, pooled_width):  """ Applies ROI Pooling to a single image and a single ROI  """# Compute the region of interest          feature_map_height = int(feature_map.shape[0])  feature_map_width  = int(feature_map.shape[1])  h_start = tf.cast(feature_map_height * roi[0], 'int32')  w_start = tf.cast(feature_map_width  * roi[1], 'int32')  h_end   = tf.cast(feature_map_height * roi[2], 'int32')  w_end   = tf.cast(feature_map_width  * roi[3], 'int32')  region = feature_map[h_start:h_end, w_start:w_end, :]...

Первые шесть строк функции вычисляют, где интересующая область начинается и заканчивается в изображении.


Мы выбрали в качестве соглашения, что координаты каждой ROI должны быть указаны в относительных величинах, как числа между 0 и 1. Конкретно, каждая ROI определяется 4-мерным тензором, содержащим четыре относительные координаты (x_min, y_min, x_max, y_max ).
Мы могли бы решить идентифицировать координаты каждой ROI в абсолютных значениях, но это, как правило, хуже: общей практикой считается варинт с пропусканимем входного изображения через некоторые свертки, которые изменяют размеры изображения, прежде чем подавать его в слой ROI Pooling, что заставит нас отслеживать, как изменяются размеры изображения, чтобы правильно масштабировать ограничивающие рамки ROI.


Седьмая строка просто обрезает изображение до интересующей области с помощью удобного синтаксиса тензорных срезов, который предоставляет нам TensorFlow.


...# Divide the region into non overlapping areasregion_height = h_end - h_startregion_width  = w_end - w_starth_step = tf.cast(region_height / pooled_height, 'int32')w_step = tf.cast(region_width  / pooled_width , 'int32')areas = [[(           i*h_step,            j*w_step,            (i+1)*h_step if i+1 < pooled_height else region_height,            (j+1)*w_step if j+1 < pooled_width else region_width          )           for j in range(pooled_width)]          for i in range(pooled_height)]...

В следующих четырех строках мы вычисляем размеры каждой области в ROI, которые будут объединены.


После этого мы создаем 2D массив тензоров, где каждый компонент является кортежем, указывающим координаты начала и конца каждой из областей, в которых мы собираемся взять максимум.


Код, который генерирует сетку координат сектора, кажется слишком сложным, но обратите внимание, что если мы просто разделим ROI на области с размерами (region_height // pooled_height, region_width // pooled_width), то будут некоторые пиксели ROI, которые не попадают ни в один из секторов.


В результате получается 2D список ограничивающих рамок, и мы переходим к следующей части.


...# Take the maximum of each area and stack the resultdef pool_area(x):   return tf.math.reduce_max(region[x[0]:x[2],x[1]:x[3],:], axis=[0,1])pooled_features = tf.stack([[pool_area(x) for x in row] for row in areas])return pooled_features

Эти строки выше делают всю магию. Мы определяем вспомогательную функцию pool_area, которая принимает в качестве входных данных ограничивающую рамку, указанную кортежами, подобными тем, которые мы только что создали, и выводит максимум каждого канала в области.
Мы отображаем pool_area на каждую область, которую мы объявили, используя list comprehension .


К этому моменту мы возвращаем тензор формы (pooled_height, pooled_width, n_channels), содержащий результат пуллинга одной RoI одного изображения.


Следующий шаг объединение множества RoI на одном изображении. Это легко реализовать с использованием вспомогательной функции и tf.map_fn для получения тензора размерами (n_rois, pooled_height, pooled_width, n_channels).


@staticmethoddef _pool_rois(feature_map, rois, pooled_height, pooled_width):  """ Applies ROI pooling for a single image and varios ROIs  """  def curried_pool_roi(roi):     return ROIPoolingLayer._pool_roi(feature_map, roi,                                      pooled_height, pooled_width)  pooled_areas = tf.map_fn(curried_pool_roi, rois, dtype=tf.float32)  return pooled_areas

Наконец, нам нужно реализовать итерацию на уровне батча. Если мы передадим в tf.map_fn последовательность тензоров (например, наш ввод x), то под капотом этой функции позаботились о том, чтобы нам зипанули батч.


def call(self, x):  """ Maps the input tensor of the ROI layer to its output  """  def curried_pool_rois(x):     return ROIPoolingLayer._pool_rois(x[0], x[1],                                       self.pooled_height,                                       self.pooled_width)  pooled_areas = tf.map_fn(curried_pool_rois, x, dtype=tf.float32)  return pooled_areas

Обратите внимание, что мы должны указывать параметр dtype для tf.map_fn каждый раз, когда ожидаемый вывод не соответствует типу данных его ввода. Как правило, рекомендуется указывать его как можно чаще, чтобы четко указать, как типы изменяются в нашем графе вычислений Tensorflow.


Давайте сложим все вместе:


import tensorflow as tffrom tensorflow.keras.layers import Layerclass ROIPoolingLayer(Layer):    """ Implements Region Of Interest Max Pooling         for channel-first images and relative bounding box coordinates        # Constructor parameters            pooled_height, pooled_width (int) --               specify height and width of layer outputs        Shape of inputs            [(batch_size, pooled_height, pooled_width, n_channels),             (batch_size, num_rois, 4)]        Shape of output            (batch_size, num_rois, pooled_height, pooled_width, n_channels)    """    def __init__(self, pooled_height, pooled_width, **kwargs):        self.pooled_height = pooled_height        self.pooled_width = pooled_width        super(ROIPoolingLayer, self).__init__(**kwargs)    def compute_output_shape(self, input_shape):        """ Returns the shape of the ROI Layer output        """        feature_map_shape, rois_shape = input_shape        assert feature_map_shape[0] == rois_shape[0]        batch_size = feature_map_shape[0]        n_rois = rois_shape[1]        n_channels = feature_map_shape[3]        return (batch_size, n_rois, self.pooled_height,                 self.pooled_width, n_channels)    def call(self, x):        """ Maps the input tensor of the ROI layer to its output            # Parameters                x[0] -- Convolutional feature map tensor,                        shape (batch_size, pooled_height, pooled_width, n_channels)                x[1] -- Tensor of region of interests from candidate bounding boxes,                        shape (batch_size, num_rois, 4)                        Each region of interest is defined by four relative                         coordinates (x_min, y_min, x_max, y_max) between 0 and 1            # Output                pooled_areas -- Tensor with the pooled region of interest, shape                    (batch_size, num_rois, pooled_height, pooled_width, n_channels)        """        def curried_pool_rois(x):           return ROIPoolingLayer._pool_rois(x[0], x[1],                                             self.pooled_height,                                             self.pooled_width)        pooled_areas = tf.map_fn(curried_pool_rois, x, dtype=tf.float32)        return pooled_areas    @staticmethod    def _pool_rois(feature_map, rois, pooled_height, pooled_width):        """ Applies ROI pooling for a single image and varios ROIs        """        def curried_pool_roi(roi):           return ROIPoolingLayer._pool_roi(feature_map, roi,                                            pooled_height, pooled_width)        pooled_areas = tf.map_fn(curried_pool_roi, rois, dtype=tf.float32)        return pooled_areas    @staticmethod    def _pool_roi(feature_map, roi, pooled_height, pooled_width):        """ Applies ROI pooling to a single image and a single region of interest        """        # Compute the region of interest                feature_map_height = int(feature_map.shape[0])        feature_map_width  = int(feature_map.shape[1])        h_start = tf.cast(feature_map_height * roi[0], 'int32')        w_start = tf.cast(feature_map_width  * roi[1], 'int32')        h_end   = tf.cast(feature_map_height * roi[2], 'int32')        w_end   = tf.cast(feature_map_width  * roi[3], 'int32')        region = feature_map[h_start:h_end, w_start:w_end, :]        # Divide the region into non overlapping areas        region_height = h_end - h_start        region_width  = w_end - w_start        h_step = tf.cast( region_height / pooled_height, 'int32')        w_step = tf.cast( region_width  / pooled_width , 'int32')        areas = [[(                    i*h_step,                     j*w_step,                     (i+1)*h_step if i+1 < pooled_height else region_height,                     (j+1)*w_step if j+1 < pooled_width else region_width                   )                    for j in range(pooled_width)]                   for i in range(pooled_height)]        # take the maximum of each area and stack the result        def pool_area(x):           return tf.math.reduce_max(region[x[0]:x[2], x[1]:x[3], :], axis=[0,1])        pooled_features = tf.stack([[pool_area(x) for x in row] for row in areas])        return pooled_features

Давайте проверим нашу реализацию! Мы собираемся предположить, что 1-канальное изображение размером 100x200, и мы извлечем 2 RoI, используя патчи для пуллинга размером 7x3. Изображения могут иметь регионы, классифицированные максимум в 4 метках. Пример карты призноков все 1, но одно значение 50 помещено в точку (высота-1, ширина-3).


import numpy as np# Define parametersbatch_size = 1img_height = 200img_width = 100n_channels = 1n_rois = 2pooled_height = 3pooled_width = 7# Create feature map inputfeature_maps_shape = (batch_size, img_height, img_width, n_channels)feature_maps_tf = tf.placeholder(tf.float32, shape=feature_maps_shape)feature_maps_np = np.ones(feature_maps_tf.shape, dtype='float32')feature_maps_np[0, img_height-1, img_width-3, 0] = 50print(f"feature_maps_np.shape = {feature_maps_np.shape}")# Create batch sizeroiss_tf = tf.placeholder(tf.float32, shape=(batch_size, n_rois, 4))roiss_np = np.asarray([[[0.5,0.2,0.7,0.4], [0.0,0.0,1.0,1.0]]], dtype='float32')print(f"roiss_np.shape = {roiss_np.shape}")# Create layerroi_layer = ROIPoolingLayer(pooled_height, pooled_width)pooled_features = roi_layer([feature_maps_tf, roiss_tf])print(f"output shape of layer call = {pooled_features.shape}")# Run tensorflow sessionwith tf.Session() as session:    result = session.run(pooled_features,                          feed_dict={feature_maps_tf:feature_maps_np,                                      roiss_tf:roiss_np})print(f"result.shape = {result.shape}")print(f"first  roi embedding=\n{result[0,0,:,:,0]}")print(f"second roi embedding=\n{result[0,1,:,:,0]}")

Вышеуказанные строки определяют тестовый вход для слоя, строят соответствующие тензоры и запускают сеанс TensorFlow, в ходе которого мы можем проверить работу алгоритма.


Запуск скрипта приведет к следующему выводу:


feature_maps_np.shape = (1, 200, 100, 1)roiss_np.shape = (1, 2, 4)output shape of layer call = (1, 2, 3, 7, 1)result.shape = (1, 2, 3, 7, 1)first  roi embedding=[[1. 1. 1. 1. 1. 1. 1.] [1. 1. 1. 1. 1. 1. 1.] [1. 1. 1. 1. 1. 1. 1.]]second roi embedding=[[ 1.  1.  1.  1.  1.  1.  1.] [ 1.  1.  1.  1.  1.  1.  1.] [ 1.  1.  1.  1.  1.  1. 50.]]

Мы можем проверить, что размер тензорна соответствуют нашим ожидаемым результатам. Полученные эмбеддинги все 1, кроме той области, где мы ввели значение 50.


Кажется, это работает!


Вывод


И это все на сегодня, ребята!


Сегодня мы узнали, что делает ROI Pooling слой и как мы можем использовать его для реализации внимания (attention). Кроме того, мы узнали, как расширить Keras для реализации пользовательских слоёв без весов, и дали реализацию вышеупомянутого ROI Pooling слоя.


Я надеюсь, что это было полезно для вас, не забудьте поделиться статьей и оставить комментарий, если это было!


Спасибо Ari Brill, Tjark Miener и Bryan Kim за отзывы о статье.


Ссылки


Подробнее..
Категории: Перевод , Python , Ods , Tensorflow , Creative commons , Roi , Keras

Категории

Последние комментарии

  • Имя: Макс
    24.08.2022 | 11:28
    Я разраб в IT компании, работаю на арбитражную команду. Мы работаем с приламы и сайтами, при работе замечаются постоянные баны и лаги. Пацаны посоветовали сервис по анализу исходного кода,https://app Подробнее..
  • Имя: 9055410337
    20.08.2022 | 17:41
    поможем пишите в телеграм Подробнее..
  • Имя: sabbat
    17.08.2022 | 20:42
    Охренеть.. это просто шикарная статья, феноменально круто. Большое спасибо за разбор! Надеюсь как-нибудь с тобой связаться для обсуждений чего-либо) Подробнее..
  • Имя: Мария
    09.08.2022 | 14:44
    Добрый день. Если обладаете такой информацией, то подскажите, пожалуйста, где можно найти много-много материала по Yggdrasil и его уязвимостях для написания диплома? Благодарю. Подробнее..
© 2006-2024, personeltest.ru