Русский
Русский
English
Статистика
Реклама

Книги

Как войти в игровой бизнес и не сойти с ума обзор путеводителя по геймдев-индустрии

04.02.2021 16:05:13 | Автор: admin
image

Литературы и разных материалов по разработке игр сейчас хватает. Геймдизайн и левел-дизайн, игровая аналитика и психология геймеров, нарратив и история популярных проектов рассказывают много, содержательно и интересно, по крайней мере для тех, кто только вкатывается в индустрию геймдева. Которая стремительно растет: миллиардные сделки у всех на слуху и рисуют перед начинающими разработчиками будоражащие перспективы.

И вот тут проблема. Да, игровая индустрия давно уже стала большим конвейерным бизнесом, со своими собственными законами, процессами, практиками, терминами, этикетом и т.д., общими для участников рынка. Но, тем не менее, этот сверхважный аспект часто остается за кадром, как своеобразный эзотерический опыт, недоступный новичкам и людям со стороны. Как следствие часть разработчиков выходят на рынок вслепую, без ориентиров, наступают на разного рода грабли и тратят ресурсы на изобретение велосипедов. И это одна из причин, почему далеко не всем, пусть даже и с многообещающим продуктом, удается выжить в этом бизнесе.
Как раз этот информационный лаг и закрывает книга Игра как бизнес. От мечты до релиза (2020)Алексея Савченко.

Игра как бизнес


Книга ёмко аккумулирует индустриальные практики и личный опыт автора (ныне менеджера Epic Games) сразу по нескольким направлениям геймдева, включая:

  • непосредственно само производство игр: планирование и организация рабочей среды и пайплайна, стадии, прототипы и вертикальные срезы, использование сторонних движков и т.д.,
  • организационно-правовой аспект, в том числе регистрацию компании и товарных знаков, заключение договоров и коммуникацию с издателями и инвесторами,
  • поиск партнеров и маркетинг проекта.

По сути, перед нами абстрагированный вертолетный взгляд на индустрию с позиции погруженного и наблюдательного инсайдера. Не ищите в книге разборы (не)успешных кейсов, исторические экскурсы, прогнозы на будущее, живые иллюстрации и диалог с читателем ничего такого там нет, разве что несколько точечных примеров для понятности. Зато есть очень доходчиво и последовательно изложенное описание механизмов игры как бизнеса, которое даст любому новичку комплексное представление о том, что его ожидает в индустрии. Однозначно, системно и по существу.

Это главное и безусловное достоинство, киллер-фича книги, которым она выгодно выделяется среди массы геймдев-литературы. Но здесь же, в определенном смысле, может скрываться и главная уязвимость. И дело не столько в том, что рыночные реалии и стандарты продакшна, которые педантично описывает Алексей Савченко, завтра могут кардинально измениться и все инструкции по применению станут представлять лишь историческую ценность. Нет, как раз изменчивость это норма для динамично развивающейся индустрии. Основная же уязвимость книги, на наш взгляд, в чрезмерной дотошности регламентации. Иногда кажется, что автор пытается кодифицировать абсолютно всё, до чего у него доходят руки: стандарты общения, переписки, посещения выставок, деловых обедов и тусовок. Да, в качестве советов бывалого эта информация действительно очень ценна. Но эпизодически она преподносится так же железобетонно, как и производственные стандарты, однозначно, без вариантов, не оставляя места для креатива и как объективная данность даже там, где ждёшь субъективное мнение. И возможно, что в контексте книги читатель, вместо поиска собственного подхода, примет даже такие мелочные советы за догму.

В остальном же книга отличный профессиональный путеводитель по игровой индустрии, честно рассказывающий обо всех значимых этапах, через которые проходят игры и студии-разработчики.

Нулевой этап


Производство игры начинается с определения ее концептуальных характеристик. Ключевые вопросы, которыми должен задаться разработчик:

  • Мультиплеер или нет? Одиночные игры это спринт, а многопользовательские марафон, который потребует кардинально другого подхода к организации работы.
  • Бесплатная игра или нет? Если да, то нужно проектировать продукт как сложную сервисную систему с внутренними микротранзакциями и мотивацией их осуществлять.
  • Для каких платформ будет игра? У каждой платформы своё железо, свое управление и интерфейс, своя аудитория и свои ожидания.
  • Насколько высокое качество контента планируется и какие самые сильные и слабые стороны игры? Поскольку быть лучшим во всём нелегко, необходимо сформулировать наиболее сильные стороны команды (к примеру, игровой процесс, сюжет или арт-дирекшн) и сосредоточить концепцию будущей игры именно на них.


Чем раньше, тем лучше будет определить тип бизнес-деятельности, которую вы планируете вести. Всего их четыре:

  1. Хобби-разработка работа небольшим коллективом над небольшими играми и скорее для собственного удовольствия, для неширокой аудитории фанатов, без отслеживания рыночных трендов.
  2. Индустриально-ориентированная разработка, напротив, следует за трендами индустрии и нацелена на создание массового продукта, востребованного и актуального для широкой аудитории. Вы работаете на рынке как полноценный стартап, изучаете партнеров, ниши, целевые аудитории, используете собственные или привлеченные инвестиции.
    Один из подтипов такой компании это те, кто работает через издателя и, соответственно, фокусируется на производстве игры, оставляя вопросы маркетинга, локализации и дистрибьюции издателю. Второй самостоятельное издательство, при котором вы делаете всё сами, но зато и прибыль ни с кем не делите.
  3. Бизнес-ориентированная продуктовая разработка. Здесь акцент, в первую очередь, не на конкретной игре, а на построении компании и предприятия и повышении его стоимости для акционеров, включая продажу инвест-фонду или выход на IPO. Бизнес-модель ориентирована либо на игры-сервисы, либо на строительство собственных IP (интеллектуальной собственности), либо на занятие конкретной рыночной ниши с лучшим там типом продукта. Именно в эту сторону движется современный рынок, и огромные перспективы этого направления подразумевают соответствующие вложения и риски.
  4. Сервисно-ориентированная разработка полного цикла. Те компании, которые не выпускают собственные игры, а работают под заказ, выполняя задания больших студий и издательств.

Говоря о планировании бизнеса, автор дает конкретные практические рекомендации по регистрации компании, торговых марок, организации хозяйственной деятельности, лицензированию инструментов разработки и множеству других рутинных вопросов, которые, на первый взгляд, кажутся далекими от геймдева. И предупреждает:

Ваша деятельность так или иначе станет разнообразной и улетит в мультизадачность, особенно на первых этапах формирования процессов. Будут дни, когда захочется спокойно погонять билд игры и понастраивать геймплей. Или сидеть себе и рисовать. Но придется заняться налогами, бюджетом, решением вопроса с подрядчиком и провести три-четыре непростых звонка. Некоторые могут на это переключиться, некоторые совсем не могут.

Помимо сформулированной бизнес-стратегии, главные результаты этапа концепт-документ вашего проекта (включающий его краткое описание и рыночное позиционирование, его основные фишки и столпы, сюжет, ключевые механики, описание игрового сеанса, особенности визуального и звукового сопровождения, а также модель монетизации), а также дизайн-документ и прототип вертикального среза.

От прототипа к релизу


Вертикальный срез это важнейший элемент разработки и продвижения проекта. По ним подразумевается 5-10% игры, которые будут содержать 70-80% общего функционала (небольшая часть игры в максимальном качестве) и, таким образом, дадут издателям, инвесторам, партнерам впечатление небольшого законченного фрагмента уже готовой игры. Обгоняя время, вы демонстрируете, что как команда в принципе способны достигнуть запланированного качества. Кроме того, вертикальный срез задаст для самой студии-разработчика стандарт работы, упорядочит производственное взаимодействие внутри команды и технологическую цепочку (пайплайн) и, в конечном итоге, станет фундаментом дальнейшей разработки.

Центральная тема процесс производства игры и его стадии. От вопросов организации рабочей среды (помещение, софтверная среда, инструменты проект-менеджменты и внутрикомандной коммуникации) идём к построению рабочих процессов, где главным принципом является декомпозиция. Разработка игровых проектов устроена таким образом, что любая постановка задач идет сверху вниз по в общем-то простой причине: игра зачастую придумывается как нечто более-менее целое в голове автора концепции, потом ложится на бумагу, а дальше уже разбирается сначала на крупные блочные компоненты, и впоследствии на более мелкие задачи. В сфере проектной методологии автор придерживается гибридного подхода: высокоитеративный Agile для работы внутри отделов и стадий, а линейный Waterfall для сдачи этапов работы издателю в срок и в запланированном объеме.

Само производство можно представить как декомпозицию высокоуровневых игровых фичей функциональных единиц, составляющих игру и влияющих на формируемый игровой опыт. Сформулированная в виде креативного брифа (общее описание) и дизайн-брифа (состав требуемых конкретных единичных механик), фича декомпозируется в техническом брифе до конкретных компонентов, ассетов, зависимостей, так что в итоге получается законченный перечень задач для разработки.

После тестирования готовые фичи и игровые сущности интегрируются в целостную систему, на движке игры собирается игровой цикл, скомпилированный под конкретную платформу и вот у вас на руках готовый билд играбельная версия продукта, которую можно запустить и потестить.

Обрастая мясом новых фичей, продукт проходит последовательный путь от прототипа и вертикального среза к альфа-версии (практически готовый продукт с погрешностями), бете (полностью укомплектованный продукт с некритическими ошибками) и релизу-кандидату (продукт, готовый к тиражированию и сертификации). Каждая из стадий в книге детально разбирается.

Отдельная глава посвящена выбору движка игры. Движок напрямую влияет на все производственные процессы, определяет не только пайплайн и состав команды, но и является инструментом для продвижения вендоры могут помочь вам как с доступом на различные выставки, мероприятия и пресс-конференции, так и с выходом на крупных издателей и партнеров. А кому-то повезёт стать и участником грантовых программ.

Использование движка существенно повлияет на весь процесс разработки, стратегию студии и компании, но он позволит вам не делать одновременно две жутко сложные задачи разрабатывать игру и разрабатывать движок. Многие почему-то недооценивают сложность такого хода событий, особенно для молодой и небольшой команды с ограниченным количеством ресурсов. Также учтите, что использование технологии помимо всего прочего повлияет и на ваши коммуникации с потенциальными партнерами, в частности, с точки зрения их оценки технических рисков. Боюсь, что собственный движок и, скажем, многочисленные платформы продукта не звучат для инвесторов и издателей как что-то надежное.

Поиск партнеров


Здесь два основных маршрута:

  • поиск издателя для вашей игры через игровые выставки и т.д. Поездки, встречи, демонстрации, презентации, получение и проработка контактов;
  • поиск венчурного инвестора. Собираете пакет материалов, предоставляете их потенциальным инвесторам, проходите интервью и due diligence и, тьфу-тьфу, выходите на сделку. Этот вариант скорее не про отдельно взятую игру, а про команду и проект (студию) в целом.

Алексей перечисляет и подробно анализирует способы поиска и налаживания связей в индустрии от (в основном бесполезных) обращений через формы обратной связи на сайтах и страницы в социальных сетях до более эффективных: контакт в Linkedin, базы контактов в закрытых сообществах, участие в конкурсах и инициативах и работа с индустриальными знакомыми. Кроме того наём биздева (бизнес-девелопмент директора), который станет вашим лицом в индустрии, и использование услуг профессиональных агентов. И конечно, посещение выставок читатель получает детальный чек-лист того, что нужно взять, к чему быть готовым и как с наибольшей пользой использовать эти мероприятия

При этом, какими бы заманчивыми ни казались предложенные издателем варианты, лучше убедиться в согласии с ними команды проекта.
Если вы решите, что это не обязательно, в следующую стадию работы вы войдете с демотивированными разработчиками, которые, чувствуя себя обманутыми, и работают намного хуже. Никогда не стоит забывать, что разработка игр это все-таки не завод, а продуктовые истории особенно чувствительны к фактору вовлеченности разработчиков и веры в игру, которую они делают.

Финальный пункт поисков партнеров договор.

В стандартном договоре должна быть зафиксирована информация о сроке действия обязательств, о распределении выручки между сторонами (revenue share), о предполагаемых платформах, копирайтах, обязательствах по локализации, апдейтам, о границах креативного контроля и т.д., а также определены гарантии по продажам (маркетинговым инвестициям, установкам) со стороны издателя.

Увы, многие разработчики недооценивают важность этого документа: кто-то полагается на собственную интерпретацию, по-своему понимая узкие термины, а кто-то просто не глядя (ну, или прочитав 2-3 пункта) подписывает и в итоге запросто теряет права на свою интеллектуальную собственность или получает невыгодные условия. Идеальный вариант обратиться к профессиональным юристам, специализирующимся на международном договорном праве.

Заключительная часть книги сжатая пошаговая схема разработки проекта от А до Я, в суммируются все этапы, от одностраничного питча будущей игры и бизнес-модели до релизного билда и выбора дальнейшего пути развития студии и проекта.

Резюме


В целом, Игра как бизнес удачный пример путеводителя-руководства для тех, кто хочет понять, как работает игровая индустрия и что стоит за отчетами об успехах. Причем не только для новичков: даже состоявшимся студиям вертолетный взгляд поможет понять их место на карте индустрии, с проблемными зонами и точками роста.
Игровая индустрия любит настойчивых, трудолюбивых и не чурающихся черновой работы и итераций. Не получаться будет больше, чем получаться. И стоит заранее планировать долгосрочно, развивать в себе философское отношение к проблемам и принять тот факт, что, возможно, придется принять участие в двадцати играх, пока не получится сделать очень успешную двадцать первую.


Подробнее..

Загрузить и сохранить алгоритм быстрого и эффективного чтения

08.02.2021 14:10:06 | Автор: admin

Моя методика сохранения времени, внимания и социального статуса при помощи парочки хитрых манипуляций с текстом и мозгом.

Я очень много читаю. Примерно пять-шесть часов каждый день уходит на сайты, книги, ленты соцсетей, а также различную мелочь вроде этикеток от молочного пудинга. Если переписки и желание узнать количество килокалорий в стаканчике Растишки часто происходят хаотично и не поддается контролю, то чтение книг и больших статей это большое поле для оптимизации.

Первый момент, который очень нехило помогает мне не потерять что-то действительно ценное в этом хаосе группировка задач по важному чтению на единый промежуток времени. Многие познали этот дзен с ростом популярности Покета и прочих откладывателей на потом.

Интерфейс ПокетаИнтерфейс Покета

Если вы не в теме, то суть очень проста: вы собираете интересные материалы в закладки, а потом читаете их в более удобное время. Классная практика, дико рекомендую.

Особенно она хороша, если откладывать статьи не на вечер, а на конец недели. Условно говоря: с понедельника по пятницу вы собираете запас, а в субботу проходитесь по списку и смотрите, что действительно стоит изучить, а где вас привлек только громкий заголовок. Такой подход позволяет отделить хочу от надо и более рационально подойти к чтению.

Теперь давайте поговорим непосредственно о чтении.

Чтение на спидах

Вы наверняка согласитесь, что если вам в руки попалась захватывающая книга, то никаких проблем с тем, чтобы прочитать ее и запомнить нет никаких проблем. Всё происходит само собой. Но думаю, что никто не станет спорить, что это скорее исключение, чем закон вселенной.

В большинстве случаев чтение это монотонный и вгоняющий в сон процесс. Особенно, когда это происходит во время самообразовательных вечеров, после восьмичасового трудового дня. В такие моменты где-то на подсознании возникает мольба о том, чтобы поскорее изобрели технологию вливания информации напрямую в мозг. И знаете, что-то такое я и хочу предложить вам прямо сейчас.

Именно для описанных выше моментов я использую связку из Bookmate (если речь идет о книгах), Pocket (если это лонгриды) и расширенияReedyдля Google Chrome, которое работает по технологии Spritz (Шприц).

Шприц это скорочтение для ленивых и уставших. Приложение делит текст на отдельные слова и быстро прокручивает перед глазами читателя.

После небольшой тренировки мозг учится склеивать слова в цельное повествование даже на скорости в 500-1000 слов в минуту, что в 5-10 раз выше скорости чтения простого обывателя.

Когда я познакомился со Spritz, то понял, что мне нужно приложение, отвечающее трем критериям:

  • Возможность читать книги в формате epub/fb2. Опционально: статьи в сети, тексты без форматирования или PDF.

  • Возможность управлять временем чтения, дабы уложить один сеанс в помодор, т.е 30 минут.

  • Возможность делать закладки.

  • Совместимость с Букмейтом, который уже много лет является моей основной платформой для чтения книг.

Я перебрал целую кучу вариантов: отдельные приложения-читалки для MacOS\iOS, дополнения для iBooks и аддоны для Хрома. Первые два были совсем мимо, так как были страшными, кривыми и очень ограниченными. По крайней мере на ПК от Apple ситуация именно такая.

Среди расширений для браузера все было намного интереснее, выбор инструментов очень высок, но какие-то уже давно не поддерживаются, а какие-то напрочь отказывались распознавать складный текст в читалке от Букмейта.

Протестировав больше 10 вариантов я нашел Риди, расширение ориентированное на чтение статей, которое имеет очень приятный внешний вид, отличную кастомизацию, умеет выхватывать из веб-странички именно текст и даже позволяет вставлять свой текст.

Эта связка позволяет реализовать 3 инструмента :

1. Подсчет примерного времени, которое я потрачу на прочтение и осмысление текста. В качестве примера, первая глава из Думай медленно, решай быстро занимает 10 минут чтения при скорости 400 слов в минуту. Теперь я знаю, что у меня есть 10 минут на чтение, остальные 20 (работаю по "Помодоро", напомню) я могу потратить на непосредственную работу с текстом.

2. Первичное прочтение, без отвлечений. Благодаря Spritz я могу полностью сконцентрироваться на чтении. Это ознакомление, попытка уловить суть текста.

3. Непосредственно работа с текстом. После первичного прогона через Шприц я могу вернутся в интерфейс Букмейта и еще раз пройтись по тексту, уже зная его содержание и места, которые меня заинтересовали.

Как только глава прочитана через Reedy, то наступает фаза осмысления состоящая из трех частей: цитаты, фиксация полезных мыслей, план внедрения.

Создание цитат

В первую очередь я выделяю те части текста, которые меня зацепили, которые в будущем могут пригодится во время живого обсуждения или оформления статьи. Кроме этого, пробегаясь по тексту и выхватывая отдельные его куски я еще лучше понимаю, что именно хочу зафиксировать у себя в голове.

Фиксация полезных мыслей

Следующий процесс, который я применяю в отношении прочитанного это создание конспекта. Выглядеть это может по разному:

  • Превращение цитат в тезисы;

  • Конвертация в визуальные образы;

  • Написание развернутого текста.

В идеале, нужно совместить все три варианта: придумать тезис, нарисовать к нему иллюстрацию и написать развернутый комментарий, а потом запихнуть в Цеттелькастен (ROAM, Obsidian) На деле внимания и мотивации хватает только на гибрид первого и третьего варианта.

Главный момент, который заложен в это действо: пропустить контент через себя и на выходе получить что-то уникальное и тем самым сформировать несколько дополнительных нейронных связей. И так как шипики пока слабы, дополнительно зафиксировать это на внешних носителях: бумаге или в базе даных на ПК.

Мой воркфлоу на этом этапе:

  • Взять цитату. Главная ограниченность человеческого разума состоит в том, что он почти не в состоянии вернуться в прошлое, занять прежнюю позицию, зная о будущих переменах. Чуть только вы построили новую картину мира или его части, старая стирается вы уже не вспомните, как и во что верили раньше.

  • Превратить в тезис. Мозг чертовски плохо дружит с прошлым.

  • Нарисовать визуальный образ(опционально).

  • Написать развернутый комментарий. Если прошлый опыт в нашей голове был заменен более актуальным, то это почти равносильно его потере.

  • Занести это в базу знаний.Раньше для этого я использовал Notion или theBrain, но в этом году открыл для себяObsidianи активно переезжаю именно. него.

Задача фиксации это осмысление и сохранение новых знаний у себя в голове и в том месте, где вы легко сможете получить к ним доступ. Это увеличивает качество запоминания и позволяет в будущем намного лучше интегрировать новый опыт в любую сферу.

План внедрения

Финальным этапом, который призван превратить знания в опыт является интеграция или же говоря простым языком практика. Для этого у меня есть три инструмента, которые разнятся, в зависимости от типа новых знаний:

  • Передача опыта. Подходит для тех зачатков опыта, которые пока что непонятно как применить в свой жизни\работе. Т.е очень круто узнать про число Данбара и социальные круги, но какой от этого профит здесь и сейчас? Если его не видно, то дабы не забыть, очень неплохо написать заметку для Фейсбука в формате а вы знали?. Или написать полноценный лонгрид на Хабр. Или же поделиться находкой в разговоре с близкими\коллегами. Да, многие делают это на полном автомате, дабы заполнить провисания в общении, но по мне очень хорошая практика использовать такой подход к любой важной информации на постоянной основе. Сюда же входит участие в тематических чатах, форумах и группах с активным обсуждением.

  • Отработка навыка. Если я узнал (из проверенного и авторитетного источника) про то, что для поднятия настроения с утра желательно обливаться холодной водой, то минуя какие-либо обсуждения я просто ставлю задачу в To-Do'шнике Облиться холодной водой из ведра, завтра в 8:00 и закольцовываю ее на 4 недели. В конце этого периода изучаю, какие результаты мне это дало. Для этого на смартфонах есть замечательное приложениеDaylio, оно позволяет очень легко фиксировать то, как день ото дня менялись привычки, настроение, продуктивность и еще много всего. Доступно как на iOS, так и на Android.

  • Поиск твердых знаний. Очень большой пласт знаний дает только часть ответов на вопросы и единственный способ это исправить копать глубже. Если мы говорим о прочтении только одной главы книги, то чаще всего ответы находятся в остальной части книги. Это большое преимущество именно книжного формата, но в отдельных случаях приходится читать дополнительную литературу или любым другим способом расширять информационное поле.

Вы можете подумать, что в этом блоке советы на уровне капитана Очевидность, но нужно видеть картину целиком, как план внедрения интегрирован в ту систему чтения, которую я описал. Причем интеграция это не три отдельных инструмента, а тоже зацикленная мини-система. В идеале, любые знания должны превращаться в опыт, протекая все три стадии:

Поиск твердых знаний Отработка навыка Передача знаний.

Такая триада позволяет получить максимальную отдачу от чтения и от любой другой познавательной деятельности.

Где найти мотивацию и силы

Отдельно хочу упомянуть один важнейший момент, который обозначен в заголовке выше. Конечно же это ноотропы и витаминки. Всё таки это мой основной профиль.

Например, вот такой стек собрал один из моих подписчиков. Практически идеальная подборка для обучения. Хоть сейчас бери и пропивай курс:

  • Гуарана стимуляция и подкачка энергией;

  • Л-теанин расслабление и усиление нервишек;

  • DMAE, Лецитин и Гуперзин источник ацетилхолина (кирпичики для выстраивания новы нейронов);

  • Омега-3 подпитка мозга жирными кислотами;

  • ГАБА расслаблятор, позволяющий снять лишний напряг;

  • Парочка витаминок и минералов общего профиля.

Можете брать список выше почти без изменений, он очень хорошо собран и похож Clear Focus, которым я уже прожужжал уши своим подписчикам в телеге. Это достойная упоминания информация, так как комплекс очень хорош и подборка выше может стать хорошей альтернативой за меньшие деньги.

Как-то сложно не находишь?

У большинство из вас уже давно назрел вопрос, а самые горячие написали гневный комментарий в духе: Столько действий для прочтения одной главы книги или статьи? Бред! Где взять на это время и зачем такие заморочки?. И тут каждый должен ответить на вопрос: лучше читать меньше и качественней, чем много, но с минимальным выхлопом?

Конечно не стоит вдаваться в крайности и пытаться найти полезную информацию и навыки на внедрение в каждом печатном листе, тут очень много зависит от вашей текущей задачи и индивидуальных особенностей.

Я описал то, как эта система работает у меня. К ней я шел много лет. Она не идеальна, в каких-то моментах слишком заморочена, а в каких-то наоборот недостаточно скрупулезна. И с этим ничего не поделать, так как это сплав личности и тех инструментов, которые есть в наличии.

Возможно у вас есть более удобная система чтения? Буду очень внимательно изучать комментарии на этот счет!

Больше интересного и полезного про биохимию мозга, обучение и то, как настраивать себя на продуктивные будни можно найти на моёмтелеграм-канале. Буду рад увидеть вас среди своих читателей.

Подробнее..

Что почитать (НаучПоп Научная Фантастика)

16.02.2021 10:21:44 | Автор: admin

Как это появилось?

Некоторые время назад сильно увлёкся потреблением информации с научно-популярным уклоном. Но как не заблудиться в миллионах книг? Ресурс то ограничен. А значит придётся выбирать.

Как сузить поле выбора? Я решил взять рейтинги и подборки. Стал копать в этом направлении. С насмотренностью начало приходить понимание, что в рейтингах где хоть кого-то выкидывают, в основном одни и те же. И вот те, кто наблюдаются в приличных местах, связаны несколькими маркерами.

Какие маркеры мне на данный момент кажутся ярко перспективными:
- Топы книг в Дигитеке (ребята кстати сделали проект по бесплатной раздаче топового научпопа в электронном виде)
- Попадание на книгу вот этого деревца фонда Династия от Дмитрия Зимина. Ну и конечно попадание в шорт листы премии Просветитель.
- Попадание на обложку книги вот этих обезьянки и человека, причиляющее его к библиотеке фонда Эволюция.

Библиотека

Раздел 1. Законы науки и мышление
(Математика, Рациональность, Научный метод, Когнитивные искажения, Нейрофизиология, Ошибки мышления, Доказательная медицина)

Защита от темных искусств Александр Панчин
Рациональность: От ИИ до зомби Элиезер Юдковский
Вы конечно шутите мистер Фейнман Ричард Фейнман
Объясняя религию Паскаль Буайе
Думай медленно решай быстро Каннеман
Мир полный демонов Карл Саган
Гедель, Эшер, Бах: эта бесконечная гирлянда Дуглас Хофштадтер
Как не ошибаться. Сила математического мышления Джордан Элленберг
Недоверчивые умы: чем нас привлекают теории заговоров Роб Бразертон
Как работает разум Стивен Пинкер
Неприродная природа науки Льюис Уолперт
Предистория разума Стивен Митен
Фактологичность Ханс Рослинг
Сигнал и шум Нейт Сильвер
0,05 доказательная медицина Пётр Талантов
Пациент разумный Алексей Водовозов
Укрощение бесконечности. История математики от первых чисел до теории хаоса Иэн Стюарт
Математика для гуманитариев Алексей Савватеев
Математика космоса Иэн Стюарт

Раздел 2. Законы природы
(Физика, Теория относительности, Квантовая механика, Астрофизика, Астрономия, Изобретения и открытия)

Космос Карл Саган
Краткая история времени Стивен Хокинг
Краткие ответы на Большие вопросы Стивен Хокинг
В поисках кота Шредингера. Квантовая физика и реальность Джон Гриббин
Элегантная Вселенная. Суперструны, скрытые размерности и поиски окончательной теории Брайан Грин
Суперобъекты Сергей Попов
Темная сторона вселенной Владимир Сурдин
Теория всего Стивен Хокинг
Мир в ореховой скорлупке Стивен Хокинг
Астрономия. Популярные лекции Владимир Сурдин
Голубая точка. Космическое будущее человечества Карл Саган
Ткань космоса. Пространство, время и текстура реальности Брайан Грин
Всё из ничего: Как возникла Вселенная Краусс, Лоуренс Максвелл
Фейнмановские лекции по физике Сэндс; Фейнман; Лейтон

Раздел 3. Законы жизни
(Абиогенез, Теория эволюции, Химия жизни (Клетки, ДНК), Антропогенез)

Эгоистичный ген Ричард Докинз
Происхождение жизни: От туманности до клетки Михаил Никитин
Эволюция человека Марков
Достающее звено Станислав Дробышевский
Сумма биотехнологии Панчин Александр
Лестница жизни Ник Лейн
Вопрос жизни Ник Лейн
От атомов к древу Ястребов
Расширенный фенотип Ричард Докинз
Слепой часовщик Ричард Докинз
Самая главная молекула. От структуры ДНК до биомедицины 21 века Максим Франк-Каменецкий
Она смеется, как мать: могущество и причуды наследственности Карл Циммер
Хлопок одной ладонью Николай Кукушкин

Раздел 4. Художественный научпоп / Научная фантастика

Гарри Поттер и методы рационального мышления Элиезер Юдковский
Апофения Александр Панчин
Понедельник начинается в субботу Стругацкие
Я - робот Айзек Азимов
Гарвардский Некромант Александр Панчин
Драконы Эдема Карл Саган
Праща Давида Марк Стиглер
Звёздные дневники Ийона Тихого Станислав Лем
Конец Вечности Айзек Азимов
Анафем Нил Стивенсон
Политика и английский язык Оруэлл
Пасынки Вселенной Роберт Хайнлайн
Марсианин Клиффорд Саймак
Гиперион Дэн Симмонс
За миллиард лет до конца света Стругацкие
Квантовый Вор Ханну Райаниеми
Ложная слепота Питер Уотс
Мошка в зенице господней Нивен и Пурнель
Принц Хаоса Роджер Желязны

Запрос

Большая часть книг из списка не прочитана. Часть книг, которые были в списке, улетели из него после прочтения. В связи с чем, вопрос к Вам. Читали ли Вы что-то из списка? Можете ли сказать про какую то из книг что-то конкретно плохое? Может что-то в списке смотрится не в тему? И конечно главный вопрос. Какой книги там точно не хватает?

Из научной фантастики интересует больше всего Твёрдая.


Псс. А ещё у меня естьканал в телеграмме. Данную библиотеку планирую регулярно "допиливать" у себя втелеграмме. А Ваши рекомендации вынесу в UPD данной статьи.

UPD

Место для ваших рекомендаций.

Раздел 1. Законы науки и мышление
(Математика, Рациональность, Научный метод, Когнитивные искажения, Нейрофизиология, Ошибки мышления, Доказательная медицина)

Здесь грустно и одиноко путник.

Раздел 2. Законы природы
(Физика, Теория относительности, Квантовая механика, Астрофизика, Астрономия, Изобретения и открытия)

Здесь грустно и одиноко путник.

Раздел 3. Законы жизни
(Абиогенез, Теория эволюции, Химия жизни (Клетки, ДНК), Антропогенез)

Здесь грустно и одиноко путник.

Раздел 4. Художественный научпоп / Научная фантастика

Здесь грустно и одиноко путник.

Подробнее..

Разбор спорных научных вопросов прививки и аутизм, гомеопатия, ГМО и мужчины умнее женщин? ч.1

15.04.2021 10:21:55 | Автор: admin

Привет Хабр! Меня зовут Михаил и я решил написать большой пост для саморазвивающихся людей про одну интересную книгу Аси Казанцевой, в которой разбирается ряд спорных научных вопросов, таких как "Вредно ли ГМО" или же "Пора ли запретить опыты над животными?". Я упрощу написанное еще сильнее и расскажу про эти темы кратко, но емко и передав основной смысл, а еще максимально понятным языком. В название поста это не входит, но по сути этот пост - полноценный разбор крутой и интересной книжки, которую можно почитать и самостоятельно. Свою общую работу я поделю на три части, а конкретно в первой мы поговорим про гомеопатию и ее проблемах, про связь прививок и аутизма, про вредность ГМО и правда ли что мужчины умнее женщин? Помимо этого, мы разберемся еще и в понятии генов, ДНК, клеток, поговорим про множество исследований, разберемся в коэффициенте корреляции и вообще пост будет реально длинным, но очень информативным и простым для понимания.

Микро-оффтоп: книга крутая и стоит прочтения. Но если у тебя вдруг нет времени на нее или на этот огромный (реально большой) пост, то ты можешь послушать мой получасовойподкастна эту тему, в котором я касаюсь всех тем, указанных выше. Его можно найти вApple Music,Yandex Music,VK,Google Podcastsили вСберЗвук. А вообще ссылкитут. Спасибо!

Ну и самое важное - книги нужно читать! То что я пишу тут - не замена оригинала. Воспринимайте этот пост как попытку заинтересовать вас этой книгой, вся информация будет из нее, с небольшими дополнениями, а еще больше можно будет найти в первоисточнике.

Итак, первая глава называется"У гомеопатии нет побочных эффектов". Для начала разберемся в самом понятии гомеопатии. Гомеопатия - это один из видов альтернативной медицины, заключающийся в выдаче пациенту специального лекарства с действующим веществом. Однако фишка в том, что концентрация действующего вещества в таких лекарствах невероятно маленькая. Еще одно положение гомеопатии, которое мы правда пока опустим - это то, что лечить больного тошнотой человека нужно якобы тем же веществом, которое вызвало бы у здорового человека тошнотой. Якобы яд вышибается ядом. Опираясь на эти два положения (про мизерную концентрацию и действующее вещество), разберемся: как получают гомеопатический препарат.

Давайте разберем на примере: есть известное лекарство "оцилококцинум", где на задней стороне написана сбивающая с толку фраза: "exctractium 200K". Что это значит? А это и есть подсказка по способу получения данного препарата. Для его получения берут действующее вещество и начинают разводить его в воде. Если было бы написано 1К, это значило бы, что на каждую 1 молекулу действующего вещества должно приходиться 100 молекул воды. Если будет написано 2К - то это значит что на каждую молекулу действующего вещества уже должно приходиться 100 в квадрате молекул воды - то есть 10 000. И так далее, миллион, сто миллионов и теперь представьте, сколько будет действующего вещества если мы продолжим этот ряд и напишем 100 в 200 степени.

И выходит, что употребляя препарат, вероятность найти там хотя бы одну молекулу действующего вещества - просто нулевая. А еще мы знаем, что хоть атомы и молекулы очень и очень малы, но все-таки они имеют определенный размер и вес. А это значит, что в условном 1 грамме вещества будет содержаться строго определенное количество молекул. И разводя вещество снова и снова, мы просто делаем ничтожной вероятность нахождения действующего вещества в 1 дозе препарата. А самое забавное то, что производитель честно указал это на коробке, и честно вам в этом признался, мол да, скорее всего в нашем препарате ничего и нет.

Еще интересно не только это мизерное, или вообще нулевое количество действующего вещества, а то, что именно является действующим веществом. С полным перечнем можно ознакомиться тут, там нужно правда зарегистрироваться на сайте, чтобы получить доступ к документу, но вотссылка. Там официальный перечень разрешенных веществ для гомеопатии в Приложении 4 к приказу Миндздравмедпрома 335 о гомеопатии в России, пару вещей из которого я и приведу: бледная поганка, рвотная сыроежка, паук-птицеед, секрет кожных желез жабы, белена, креозот, нафталин, нефть и стрихнин, ртуть и соединения мышьяка.

Если всего этого мало про гомеопатию, то есть большое количество исследований, где сравниваются испытания где испытуемые получали гомеопатические препараты, обычные препараты и просто плацебо. Выводы исследований? Эффект обычных препаратов заметен, в то время как эффект гомеопатических средств и плацебо - одинаков.

Однако парадокс, значит ли все это то, что гомеопатия все-таки не работает? Как ни странно - нет. Все дело в том, что прием веществ, которые мы считаем лекарственными, может через мозг повлиять на биохимические процессы в организме и выходит, что тем, кто считает что гомеопатия помогает, она действительно им помогает. Был проведен эксперимент, когда людям с острой зубной болью давали один из трех препаратов: снижающий боль, повышающий боль или плацебо - то есть пустышку. И были люди, которым плацебо действительно помогало и уменьшало боль. Все дело в том, что мозг реагировал на принятое лекарство и сам начинал вырабатывать опиоиды, снижая тем самым боль.

В России врачи-гомеопаты не относятся к группе врачей-специалистов, а по закону принадлежат к категории "Высококвалифицированные целители и практики альтернативной и народной медицины". Это значит, что такой человек все-таки должен обладать дипломом медицинского института и в случае реальных проблем со здоровьем поступать как полагается: отправить пациента в обычную больницу. Однако бывает конечно и обратное, когда такие люди могут стоять на своем, усиливая веру у пациента в такие препараты, из-за чего тот может навлечь неприятности на себя или на кого-то еще. Поэтому гомеопатия гомеопатией, но про серьезное лечение нельзя забывать ни в коем случае и не отказываться от него. Сама же индустрия гомеопатических препаратов приносит огромные деньги, из-за чего с ней ничего и не делают, раз людям нравится - почему бы не удовлетворять их потребности за их же деньги.

Следующая глава называется"Прививки вызывают аутизм". Начну с того, что в 1998 году в известном медицинском журнале The Lancet вышла нашумевшая статья Эндрю Уэйкфилда о связи между вакцинацией и аутизмом. Уэйкфилд в своей статье описал медицинские истории двенадцати детей, с характерными для аутизма нарушениями, а родители девяти из них утверждали, что симптомы появились не сразу. По их словам, дети были вполне нормальными, пока им не сделали комбинированную прививку от кори, краснухи и свинки. И Эндрю Уэйкфилд сделал вывод: после укола коктейля из вирусов все это поражает нервную систему и вызывает у ребенка аутизм. И тут началась настоящая буря, о которой чуть позже. Вся история хорошо описана на форбсетут.

А вот спустя несколько лет журналист Брайан Дир обратил внимание на небольшую деталь в статье Уэйкфилда: там было указано, что признаки аутизма появились у одного из пациентов через неделю после прививки, в то время как по словам родителей это было за два месяца до нее. И даже если допустить, что исследование не было сознательной фальсификацией, то целый ряд различных факторов указывал на то, что работа была проведена небрежно, а данные в ней притянуты за уши.

Еще из интересного: то что сам Эндрю Уэйкфилд пытался получить из этого сразу двойную выгоду: во-первых, поскольку сам он раскритиковал комплексные вакцины и что вот именно они ведут к такому негативному эффекту, но он не имел ничего против отдельных вакцин, одну из которых он как раз и запатентовал. Во-вторых: он запатентовал еще и экспресс-тест на выявление в организме вируса кори, которые должны были стать крайне востребованными после публикации, так как в случае положительного результата для детей с аутизмом, родители просто могли пойти подавать в суд на производителя вакцин. В результате всего этого, редакция журнала The Lancet приняла решение отозватьстатью Уэйкфилда, теперь если вы перейдете на нее интернете, а ссылочку я на нее обязательно оставлю, то вы увидите на каждой странице большую красную надпись RETRACTED, то есть отозвана.

Я уже сказал, что после выхода статьи началась настоящая буря. Что же случилось? А дело в том, что, например в Великобритании в 1997 году, то есть за год до публикации были привиты от кори, краснухи и паротита 91,5 процент двухлетних детей, но уже в следующие года этот показатель на фоне статьи начал стремительно падать и достиг 79,9 процентов. И только после 2004 года и расследований Брайана Дира этот уровень начал постепенно восстанавливаться и вернулся к прежнему только лишь в 2012 году. Неплохой такой эффект на 14 лет, да? Соответственно снижение уровня вакцинации привело к повышению уровня заболеваемости корью в стране, да и в наше время он остался высоким, потому что за годы страха перед вакциной появилось вполне достаточно подросших непривитых детей, чтобы вирус кори мог спокойно передаваться от человека к человеку.

Виноват ли во всем этот лично Эндрю Уэйкфилд? Вопрос хороший, но ведь есть например и редакция журнала, которая несмотря ни на что допустила публикацию этого материала, что привело к его широкой огласке. Поэтому каждый может сделать выводы из этой истории самостоятельно.

Как вообще был обнаружен принцип вакцинации? Считается, что некий Луи Пастер, который заражал цыплят куриной холерой, чтобы найти способ лечения для них. Но однажды он по ошибке ввел птицам уже мертвые бактерии, с которыми цыплята быстро поправились, однако в дальнейшем заразить их холерой Луи Пастер уже не мог. Так и появился принцип вакцинации: контакт с ослабленным возбудителем предохраняет от последующего тяжелого заболевания. Ася Казанцева рассказывает про несколько вирусов и как работает вакцина от них, в каком то случае это мертвые бактерии, в другом случае - живые, в третьем - их комбинация. И да, бактерии это конечно не вирусы, но суть именно такая: что ваша иммунная система должна познакомиться с вирусом заранее, для выработки иммунитета.

Есть ли у вакцинации побочные эффекты? И как бы да, но сопоставлять их с пользой от снижения риска болезни довольно глупо, тем более что риск побочных эффектов минимален. И даже если человек принципиально против прививок для себя по причине боязни риска побочных осложнений и вообще считает что всех защищает коллективный иммунитет, и зачем ему тогда ставить прививку? Вроде логично, но зачем тогда ему убеждать окружающих в том что прививки ставить не надо, если тем самым он снижает коллективный иммунитет и повышает риск заражения в обществе?

В наше время, даже если у человека нет прививочной истории и он не знает делал ли хоть одну прививку, можно нехитрыми манипуляциями привиться от множества потенциальных болезней, витающих вокруг нас. Самой Асе Казанцевой (в Москве) удовольствие вакцинации от 6 болезней обошлось в 4500 рублей, без каких либо осложнений, но зато теперь она сама чувствует себя гораздо спокойнее и увереннее чем раньше и знает что если что, то они ей будут уже не страшны. Что ж, вполне закономерный вывод с ее стороны.

Следующая глава называется"ГМО содержат гены!"и изначально хотел рассказать следом про опыты над животными, а это правда интересно и мне есть что вам рассказать, но я все же решил еще немного рассказать про гены и ГМО, раз уж тема в чем-то смежная с предыдущей, а про животных расскажу вам уже в другой раз.

И хочу начать сопросаЛевада-Центра января 2018 года, в котором оценивалась научная грамотность взрослого населения. Среди вопросов по типу "Электрон меньше, чем атом" или "Континенты на которых мы живем движутся уже миллионы лет" был и такой вопрос: "Обычные растения - картофель, помидоры и другие - не содержат генов, а генетически модифицированные растения содержат". И внимание (!), 42 % респондентов ответили что да, это верное суждение, в то время как всего 30 % поняли подвох и указали его как ложное. И по сути это означает что большинство населения России вообще не понимает как работает генетика на даже на самом минимальном уровне. Давайте же устраним это и хоть чуть чуть разберемся что такое гены, ДНК и прочее.

Итак, что стоит знать? Очень упрощенно: у живых организмов есть клетки. Будь то кот, дерево, человек или амеба, у них у всех есть клетки - это самая элементарная единица строения жизнедеятельности всех живых организмов. У каждой клетки есть ядро, в котором и содержатся почти все гены. Как это представить? Я думаю если сказать вам "гены", то вы представляете себе спиральную структуру (которую я и прикрепил картинкой выше), которая на самом деле является молекулой ДНК, то есть да - так выглядит молекула ДНК. Так вот, гены - это участки этой молекулы. Сама эта спиральная молекула расположена в ядре клетки, правда в очень сжатом и упакованном виде (представьте что мы ее собрали в клубок), поэтому, хоть она и очень длинная, но спокойно помещается в маленьком ядре.

То есть закрепим: есть клетка, внутри ядра которой есть молекулы ДНК, содержащие гены. Сама молекула ДНК состоит из сахара, фосфата и четырех нуклеотидов и в зависимости от того, в каком порядке и сколько этих нуклеотидов в участке, такая информация и содержится в гене. По сути это то, что определяет - кем будет существо: человеком, деревом или кукурузой. Пока что этого нам будет достаточно, а все это я к тому, что гены содержатся в любом живом организме: и в картошке, и помидоре в том числе, а не только в генетически-модифицированных. Кстати еще пара видео на ютубе, в которых понятно объясняют про гены и клетки:тымс,дымс.

В чем вообще суть продуктов ГМО? В том, что мы по факту можем улучшать живые организмы, которыми питаемся. Благодаря экспериментам второй половины 20 века, стало ясно, что можно переносить любые произвольно выбранные гены из одного организма в другой, тем самым меняя свойства последних. И теперь казалось бы, добавляй только полезный набор генов в какую-нибудь кукурузу и засеивай ею все поля и отлично! Однако тут есть другая проблема: относительно медленный темп появления новых улучшенных культур связан во-первых со сложностью их разработки. Но куда еще более неприятна другая проблема, связанная с неблагоприятным страхом общественности перед ГМО.

Дело еще в том что работа в этой области началась почти сразу с научных конференций, в которой говорилось о том, что все работы над бактериями требуется проводить крайне осторожно. Вы когда нибудь слышали о том, что производители газированных напитков начинали работу в производстве с конференций о вреде сахара? И вот если бы исследователи договорились об этом принципе тайно, то может быть осторожное и негативное отношение к ГМО и не сформировалось бы.

Помните Незнайку на Луне? Там была малышка Соломка, которая сажала арбузы, затем пробовала сок всех арбузов и сажала семечки только самого сладкого и так много много раз, в результате чего сок всех арбузов был очень сладкий. И кстати такой подход действительно возможен, но из-за возможных мутаций арбуза это может занимать очень долгое время и теперь так уже никто не делает. Генетическая же модификация - уже следующая и более совершенная ступень. Тут ученые меняют не много неизвестных генов, а только один конкретный и более того, они знают что именно они делают и зачем. То есть сделать арбуз сладким можно напрямую, а не через бесконечный выбор среди кучи мутаций исходного арбуза. Картинка из книги:

Как это работает? Мы уже немного разобрались с генами и знаем, что все живые существа на Земле используют один и тот же генетический код. И получается, что в каждой ДНК написаны комбинации нуклеотидов, которые уже читаются как клеткой человека, так и клеткой кукурузы или кота. И тем самым мы можем переносить инструкции из одного организма в другой, без поправки на межвидовые барьеры, они же все равно будут считаны клетками. Таким образом ученые берут наиболее удачные ДНК и их гены и наделяют их способностями другие организмы.

Что касается научных работ, касающихся вреда ГМО, то они все не являются серьезными исследованиями и хоть сколько-то уважаемыми в научном сообществе. Почему это так, можно почитать у Аси, там она рассказывает про несколько таких сомнительных исследований. А вот что касается исследований безопасности ГМО: с середины 20 века их было проведено большое количество и собрано много статистических данных, показывающих что это абсолютно безвредно. И тем не менее, мы склонны верить не ученым, научному сообществу и людям разбирающимся в деле и приводящим хорошие, а главное качественные и не сомнительные аргументы, а популярное и ничем необоснованное мнение.

Последняя на сегодня глава "Мужчины умнее женщин!". Жил такой товарищ, Джозеф Овертон, а известен он стал своей моделью, получившей название Окно Овертона. Окно Овертона - это диапазон приемлемости политических идей. Государство может регулировать каждую сферу жизни на 100% или не вмешиваться в нее вообще. Но на практике политики будут поддерживать только те решения, которые не оттолкнут от них избирателей. И по этому принципу окна Овертона, условная партия Единая Россия не может полностью регулировать или оставить, например, сферу образования, потому что это будет находится за пределами общественно приемлемого, иначе позиции этой партии существенно пошатнутся. И причем тут это окно и тема о которой мы сейчас говорим, а это кстати то что мужчины якобы умнее женщин, а притом, что по мнению Аси Казанцевой это окно Овертона сейчас находится примерно в той позиции, которую никуда двигать то и не нужно. На самом то деле современное общество итак настроено уже достаточно феминистично и порой это явно выходит за рамки здравого смысла: травля за то что кто-то известный надел рубашку с изображениями девиц в купальниках или за слова о том, что сложно работать в одной лаборатории с женщиной, в контексте того, что это просто добавляет порой ненужных эмоций.

Но все это занимательно тем, что об этом пишет Ася Казанцева, а она все-таки девушка и сама она говорит о том, что она не сталкивалась с гендерной дискриминацией и что ее в больших городах России не существует. Что касается маленьких городов России, то это вопрос конечно спорный и возможно там бы ей и пришлось бы столкнуться с искусственно наставленными карьерными или еще какими то барьерами, только потому, что она девушка.

Однако тем не менее, даже обозначив все это и что сексизм в больших городах вроде не такое уж и частое явление, даже у меня есть несколько знакомых, которые на полном серьезе считают что есть огромные биологические различия у мужчин и женщин и в том числе из-за этого они якобы не столь способны к интеллектуальной деятельности. Давайте правда взглянем на эту тему серьезно, чтобы в случае, если у вас возникнет какой-то спор на эту тему, вы могли аргументированно доказать свою точку зрения в споре. Итак, у женщин меньше мозг, правда ли это? Да, этотак: мозг взрослого мужчины в среднем на 10 процентов больше и тяжелее, чем у женщины. Все, подводим итог что мужчины умнее?

Однако спешить с выводами тут рано. Во-первых: не весь мозг нужен для того, чтобы им думать, так как большая его часть нужна для обработки информации, поступающей от внешней среды и тела. И в таком случае, учитывая массу тела и относительный, относительно ее размер мозга выходит что как раз таки у женщин мозг относительно больше! Все, женщины умнее мужчин? Однако дело в том, что какие лично у вас есть основания утверждать, что различия в размере мозга связаны с интеллектуальными способностями? Все мы знаем, что размер не главное, а мозг того же Эйнштейна весил 1230 грамм, при среднем весе мозга у человека около 1300 грамм.

Хорошо, есть например метаанализ, то есть анализ информации 37 исследований, где выяснили, что коэффициент корреляции насчет размера мозга и уровня интеллекта 0,33, что как бы вроде и показывает какую то связь между этим. Однако дело в том, что такая корреляция ничего не говорит о причинно-следственной связи, ведь мы не знаем, может это у людей большой мозг и они умные или же наоборот: люди умные и от этого у них большой мозг. Или же вообще они ели огурцы и это привело к росту мозга и интеллекта.

И кстати давайте разберемся, что такое вообще коэффициент корреляции, наверняка далеко не все это знают. Суть в том, что это коэффициент, показывающий взаимосвязь между какими то понятиями или данными, однако гарантий в том, что это всегда так никаких нет. Например мы знаем, что чем выше уровень благосостояния человека, тем больше его продолжительность жизни. Однако можно ли с уверенностью сказать, что определенный олигарх проживет дольше определенного нищего? Конечно же нет. Это будет верно только при взятии огромной выборки людей. Коэффициент корреляции находится в промежутке от -1 до 1 и это отражает силу взаимосвязи величин. Если она равна единице - то это сильная корреляция - величины связаны. Если 0 - то величины никак не связаны, а если отрицательно - то у этих понятий обратная зависимость. Думаю теперь немного стало понятнее.

Естьсайт, показывающий самые странные корреляции, например есть корреляция 0,95 между импортом нефти Соединенными Штатами из Норвегии и погибшими водителями при столкновении с поездами. А как вам корреляция 0,66 между утонувшими людьми в бассейне и фильмами с Николасом Кейджем? И правда забавно.

Есть еще несколько отличий в устройстве мозга мужчин и женщин, однако все они тоже не дают четкой закономерности: что вот у мужчин вот эта часть мозга больше и он умнее. На самом деле все это не идет ни в какое сравнение с колоссальными индивидуальными различиями. Все эти мозговые различия не так важны как гены, условия окружающей среды в детстве и настоящем времени, интенсивности интеллектуальной деятельности и прочих факторов. Все ведь действительно зависит от конкретного человека, я знаю огромное количество людей которые умнее меня как среди мужчин, так и среди женщин, а сам лишь стремлюсь поспеть за ними, что то читая и узнавая новое.

Вот такой получился пост, напомню что это лишь первая из трех частей, а еще две напишу через какое-то время и там мы поговорим уже о других спорных вопросах. Кстати здесь примерно 80 процентов инфы из подкаста, поэтому если стало интересно и хочется больше, то можно послушать его или же прочитать саму книжку. Надеюсь что это было интересно и если ты дочитал/дочитала до конца - респект тебе, мне очень приятно это. Ссылку на книгу не буду кидать, можно погуглить самостоятельно. Увидимся через какое-то время!

Подробнее..

Подборка 150 ресурсов для управления и работы ИТ-команды

22.05.2021 16:14:00 | Автор: admin

Привет! На связи компанияKODE. Мы занимаемся разработкой мобильных приложений, голосовых интерфейсов, IoT и других цифровых решений для государства и крупного бизнеса в России и Европе с 2013 года.

Руководители наших отделов собрали полноценную библиотеку IT-компании: сайты, блоги, книги, онлайн-курсы, подкасты, Telegram- и YouTube-каналы. Подборка будет полезна менеджерам, аналитикам, разработчикам, дизайнерам и QA.

Направления:

Сохраняйте, чтобы не потерять!Используйте и совершенствуйтесь.


Проджект-менеджмент

Сайты:

Книги:

Курсы:

YouTube-каналы:

Telegram-каналы:

  • Psilonsk канал Сергея Колганова об управлении проектами и продуктами.

  • Селиховкин о проектном управлении в другом формате.

Аналитика

Книги:

Курсы:

Telegram-каналы:

UX/UI-дизайн

Сайты:

Книги:

Курсы:

Фильмы:

YouTube-каналы:

Android-разработка

Сайты:

Книги:

Курс:

Подкасты:

  • Fragmented подкаст о том, как стать лучшим разработчиком ПО.

  • Сушите вёсла о разработке, аналитике, тестировании и других аспектах создания приложений.

  • CoRecursive истории, скрывающиеся за кодом, от экспертов в мире разработки.

  • Signals And Threads интервью о тонкостях разработки с инженерами из глобальной торговой компании Jane Street.

  • Software Engineering Radio еженедельные беседы о ПО.

  • Microsoft Research Podcast о передовых технологиях Microsoft Research.

Telegram-каналы:

Twitter:

iOS-разработка

Сайты:

Книги:

Курсы:

Подкаст:

  • Подлодка еженедельное аудиошоу о разработке.

YouTube- и Telegram-каналы:

  • YouTube-каналПола Хадсонапо SwiftUI.

  • Telegram-каналdeprecated чат для новичков, где разбирают сложные для них вопросы.

Backend-разработка

Книги:

YouTube-каналы:

Telegram-каналы:

Frontend-разработка

Ресурсы и сайты:

Блоги:

  • Дэн Абрамов личный блог разработчика, одного из авторов Redux.

  • Katz Got Your Tongue статьи Иегуды Каца, соавтора Ember.js и ответственного за разработку плагинов в jQuery.

Книги:

Подкасты:

  • FrontoWeek важные события фронтенда за неделю.

  • Веб-стандарты ещё один новостной канал.

  • UnderJS обсуждения JS на Frontend и Backend, React Native, Linux.

  • Фронтенд Юность вся правда о фронтенд-разработке.

  • Frontend Weekend интервью с известными людьми из веб-разработки.

  • Пятиминутка React подкаст о React и смежных технологиях в мире JavaScript и фронтенда.

  • kamyshev.talk об архитектуре, коде и гибких навыках.

YouTube-каналы:

Telegram-каналы:

QA

Сайты:

  • ПорталSoftware Testing сотни тематических статей, подборок книг по тестированию и обзор новостей отрасли.

  • БлогQCoder концентрат полезных знаний.

Курсы:

Telegram-каналы:

YouTube-каналы:

  • Любительский канал Алексея Баренцева полезные видео для начинающих тестировщиков.

  • QAGuild об автоматизации тестирования и ИТ.

  • Heisenbug доклады с международной технической QA-конференции.

  • Канал ИТ-компанииiTechArt, где еженедельно публикуются записи выступлений разработчиков и тестировщиков.

DevOps

Книги:

Telegram-каналы:


Не забудьте поделиться с коллегами и теми, кому может быть интересна эта подборка!

Подробнее..

Подборка 150 ресурсов для управления и работы IT-команды

22.05.2021 18:12:52 | Автор: admin

Привет! На связи компанияKODE. Мы занимаемся разработкой мобильных приложений, голосовых интерфейсов, IoT и других цифровых решений для государства и крупного бизнеса в России и Европе с 2013 года.

Руководители наших отделов собрали полноценную библиотеку IT-компании: сайты, блоги, книги, онлайн-курсы, подкасты, Telegram- и YouTube-каналы. Подборка будет полезна менеджерам, аналитикам, разработчикам, дизайнерам и QA.

Направления:

Сохраняйте, чтобы не потерять!Используйте и совершенствуйтесь.


Проджект-менеджмент

Сайты:

Книги:

Курсы:

YouTube-каналы:

Telegram-каналы:

  • Psilonsk канал Сергея Колганова об управлении проектами и продуктами.

  • Селиховкин о проектном управлении в другом формате.

Аналитика

Книги:

Курсы:

Telegram-каналы:

UX/UI-дизайн

Сайты:

Книги:

Курсы:

Фильмы:

YouTube-каналы:

Android-разработка

Сайты:

Книги:

Курс:

Подкасты:

  • Fragmented подкаст о том, как стать лучшим разработчиком ПО.

  • Сушите вёсла о разработке, аналитике, тестировании и других аспектах создания приложений.

  • CoRecursive истории, скрывающиеся за кодом, от экспертов в мире разработки.

  • Signals And Threads интервью о тонкостях разработки с инженерами из глобальной торговой компании Jane Street.

  • Software Engineering Radio еженедельные беседы о ПО.

  • Microsoft Research Podcast о передовых технологиях Microsoft Research.

Telegram-каналы:

Twitter:

iOS-разработка

Сайты:

Книги:

Курсы:

Подкаст:

  • Подлодка еженедельное аудиошоу о разработке.

YouTube- и Telegram-каналы:

  • YouTube-каналПола Хадсонапо SwiftUI.

  • Telegram-каналdeprecated чат для новичков, где разбирают сложные для них вопросы.

Backend-разработка

Книги:

YouTube-каналы:

Telegram-каналы:

Frontend-разработка

Ресурсы и сайты:

Блоги:

  • Дэн Абрамов личный блог разработчика, одного из авторов Redux.

  • Katz Got Your Tongue статьи Иегуды Каца, соавтора Ember.js и ответственного за разработку плагинов в jQuery.

Книги:

Подкасты:

  • FrontoWeek важные события фронтенда за неделю.

  • Веб-стандарты ещё один новостной канал.

  • UnderJS обсуждения JS на Frontend и Backend, React Native, Linux.

  • Фронтенд Юность вся правда о фронтенд-разработке.

  • Frontend Weekend интервью с известными людьми из веб-разработки.

  • Пятиминутка React подкаст о React и смежных технологиях в мире JavaScript и фронтенда.

  • kamyshev.talk об архитектуре, коде и гибких навыках.

YouTube-каналы:

Telegram-каналы:

QA

Сайты:

  • ПорталSoftware Testing сотни тематических статей, подборок книг по тестированию и обзор новостей отрасли.

  • БлогQCoder концентрат полезных знаний.

Курсы:

Telegram-каналы:

YouTube-каналы:

  • Любительский канал Алексея Баренцева полезные видео для начинающих тестировщиков.

  • QAGuild об автоматизации тестирования и ИТ.

  • Heisenbug доклады с международной технической QA-конференции.

  • Канал ИТ-компанииiTechArt, где еженедельно публикуются записи выступлений разработчиков и тестировщиков.

DevOps

Книги:

Telegram-каналы:


Не забудьте поделиться с коллегами и теми, кому может быть интересна эта подборка!

Подробнее..

Google Books Ngram Viewer как инструмент для ретроспективных исследований

08.02.2021 00:09:10 | Автор: admin
Активность использования термина "transistor" c 1800 года и до наших днейАктивность использования термина "transistor" c 1800 года и до наших дней

Для принятия правильных решений в различных жизненных ситуациях очень полезно иметь адекватную модель мира. В частности, бывает полезна возможность сопоставить популярность различных предметов и оценить динамику этой популярности. Например, вы издатель, и вам предлагают перевести и издать книгу по языку программирования Fortran. Его ведь всё ещё используют, издаётся англоязычная литература, а у нас давно ничего не выходило. Или, скажем, по языку Julia. Книжек по актуальной версии языка на русском ещё нет. Можно взять какую-нибудь самую популярную английскую, перевести, издать и сорвать куш. В подобных ситуациях полезно иметь возможность подглядеть, какова популярность этих языков относительно других и какова динамика этой популярности. Пример с языками программирования приведён просто для наглядности, подобные задачи возникают и при анализе популярности различных программ, технологий, научных концепций.


Пример с языками программирования удобен ещё и потому, что для них имеются различные официальные рейтинги. Этих рейтингов много, они используют разные способы оценки популярности и естественно дают различающиеся результаты. Эти результаты к тому же подвержены достаточно сильному случайному дрейфу. Если посмотреть результаты разных рейтингов на какую-то конкретную дату, то создаётся впечатление, что мы ничего толком не знаем, и мир непостижим. Но ситуация немного меняется, если рассмотреть всё в динамике. В динамике становится видно, где дрейф, а где проглядывают какие-то реальные закономерности.

Одним из способов составления рейтингов популярности является анализ частоты поисковых запросов. Такой способ при всей его кажущейся наивности, при разумном использовании позволяет получать довольно устойчивые оценки. На этом, например, построен рейтинг языков программирования PYPL. Рейтинг строится на основе анализа запросов для поиска мануалов по тем или иным языкам. Но никакой общепит не сравнится с авторской кухней. Иногда хочется чего-то особенного, чего в существующих рейтингах может не быть. Например, рейтинг PYPL не включает в себя Fortran. Да, этот язык явно не лидер, хотя из других рейтингов известно, что он стабильно входит в верхние 50 строчек по популярности. Не проблема. Аналогичную картинку можно получить самостоятельно, не прибегая к помощи сторонних агентств, используя инструмент Google Trends. Вот, например, если посмотреть в динамике, можно увидеть хвост популярности Fortran (синий) и для масштаба относительно стабильный, хотя и немного снижающийся спрос на Matlab (красный). У Matlab, кстати, отчётливо видны сезонные пики два раза в год. По всей видимости перед зимней и весенней сессиями:

Глядя на такие картинки, невольно обращаешь внимание на левую границу, глубже которой невозможно копнуть, а именно на 2004 год. Поскольку анализируются запросы в Google, заглянуть в более древние периоды истории с помощью этого инструмента не получится. А ведь так любопытно взглянуть на период, когда Fortran был ещё на пике популярности. Но увы, наша машина времени туда попасть не может. Она была запущена на полную мощность только в 2004 году и все более ранние периоды для неё закрыты.

Из-за отсутствия информации по каким-либо другим инструментам ретроспективного поиска, я всегда думал, что возможность заглянуть в более ранние периоды отсутствует. Но, как оказалось, такая возможность имеется, причём инструмент предлагает всё та же компания Google. Называется он Google Books Ngram Viewer. Это инструмент статистического анализа информации, содержащейся в массиве книг из Google Books. В некотором смысле это гениальное решение, ведь печатные книги существуют уже несколько столетий, и имея их полные оцифрованные тексты, вполне можно использовать их как источник статистической информации о прошлых исторических периодах. Теперь хотя бы понятно, зачем Google создал и поддерживает проект Google Books. Общая цель здесь та же, что и поиска, и у сервисов: владение информацией. Но, к счастью, с нами готовы поделиться какой-то её частью.

Что предлагается:

Предлагается поисковая строка, куда нужно вводить запрос. Вводим запрос получаем график популярности данного слова в книгах. Начиная с 1800 (!!) года и до нашего времени. Поисковые запросы можно вводить через запятую тогда мы получим несколько линий на графике, соответствующих данным понятиям, и сможем оценить их динамику. Вот, например, тот же Fortran:

По умолчанию поиск чувствителен к регистру, то есть Fortran (написание названия для современных версий языка) и FORTRAN (написания названия для старых версий) это будут два разных слова. Можно выключить чувствительность к регистру, либо использовать арифметические выражения над введёнными поисковыми запросами, то есть написать FORTRAN+Fortran:

Инструмент статистический, не абсолютно точный, про это не стоит забывать. Например, для того же Фортрана мы увидим какие-то микровсплески ещё до публикации первой версии языка:

Также, как и упоминание о транзисторах ещё до их официального появления:

Любопытно было бы иметь возможность увидеть эти аномальные публикации, они могут представлять интерес. Но пока что такой возможности не предусмотрено.

Если не придираться к деталям, а смотреть какие-то общие тенденции, то в целом всё выглядит довольно реалистично. Например, можно увидеть, как упоминание Fortran в литературе сменяется на MATLAB:

Поскольку поиск по умолчанию выдаёт все вхождения заданного слова, забота о корректном учёте синонимов лежит на пользователе. В некоторых случаях провести такое разделение невозможно. Так, например, поиск просто по слову chip очевидно выдаёт слишком много случаев, когда слово употреблялось в других значениях, а поиск по слову microchip, хотя и явно точнее, не учитывает всех вариаций наименования предмета и не может использоваться для корректного количественного сопоставления с другими сущностями:

Например, если мы решим таким образом сопоставить популярность в литературе таких слов как Fortran+FORTRAN, MATLAB и Julia, то для первых двух это явно будет название языка программирования, а в последнем случае в первую очередь что-то совсем другое, включая различные имена собственные:

В этой смеси выделить именно язык программирования Julia проблематично. Введя дополнительное слово, мы сильно урежем допустимые вариации его использования, а не вводя получим неразделимую смесь. На данном этапе это неустранимое ограничение данного сервиса. В будущем конечно хотелось бы иметь возможность поиска понятий с учётом их смысла, примерно как в Google Trends. Искренне надеюсь, что прямо сейчас ведётся работа в этом направлении, просто результат ещё недостаточно хорош для показа.

Но всё-таки, даже с учётом различающейся вариативности контекстов сравниваемых слов, какую-то картину всё же можно получить. Например, сравнивая выдачу по таким понятиям, как electric, software и experiment мы увидим чёткую картину по использованию понятия software, которое не применялось до середины XX века, немного размытую картину по понятию electric поскольку оно могло использоваться в различных смыслах и контекстах, вплоть до художественной литературы, и примерно одинаковый уровень для experiment. Видимо, эксперименты производили и обсуждали на страницах книг с 1800 года и до наших дней с примерно одинаковой частотой. В последние десятилетия даже чуть реже, чем раньше:

Гораздо более чёткую картину даёт использование уникальных слов-маркеров, для которых известно, в связи с чем и в какое время их могли употреблять, а в какое ещё не могли. Таким образом, кстати, можно ещё и проверить адекватность выдачи. Вот пример для Stalingrad, Sputnik и perestroyka:

Ну что же, все пики вроде бы на своих местах. Интереса к перестройке в мировой литературе было явно меньше, чем к первым запускам спутников Земли. Похоже на правду.

Если взять какие-то более размытые понятия, например, genetic и neural, то даже несмотря на какой-то шум от возможного использования этих слов в других смыслах, виден явный подъём с середины XX века:

Интересно также оценить отражение вклада отдельных личностей в совокупность мировых печатных материалов. Но получится это далеко не со всеми деятелями, а только с имеющими какие-то необычные фамилии и не имеющими других известных однофамильцев. Вот, например, вклад Циолковского (одного из основоположников космонавтики и выдающегося философа-космиста) и Вистелиуса (основоположника математической геологии). Циолковский явно имеет большую известность и цитируемость в западной литературе:

Но даже если взять какую-то уникальную персоналию, то выдача будет зашумлена всем, что потом назвали в её честь. Вот пример по ключевому слову Lomonosov:

Явно в начале здесь вклад самого Михаила Васильевича (наверное, какие-то ссылки на его работы), потом названного в честь него университета, а потом ещё города и суперкомпьютера.

Для кириллических понятий можно осуществлять поиск по массиву русскоязычной литературы, но поскольку в Google Books пока что не очень большой её охват, а также есть риск, что распознавание текста выполнено не настолько качественно, как и для англоязычной, данную возможность пока скорее стоит рассматривать как демо-версию будущих возможностей сервиса.

По настройкам:

Можно сужать период охвата, можно менять набор текстов, по которым ведётся поиск, включать-выключать чувствительность регистра, менять степень сглаживания графиков. Есть некоторые выражения для поисковой строки, позволяющие реализовать некоторые специальные приёмы при поиске, наподобие арифметических действий над запросами. Есть и другие, они описаны на специальной странице.

Можно задавать только часть слова или искать по корням, учитывая его различные формы, можно указывать, какой частью речи должно являться искомое слово, осуществлять логические операции, чтобы отфильтровывать что-то лишнее. В принципе, возможности сервиса достаточны даже для каких-то лингвистических исследований, например, для анализа изменений норм языка.

Какие на данный момент есть проблемы:

1) Не учитывается контекст запроса. С одной стороны это хорошо, заставляет исследователя самого строить модель возможного использования слова. Поиск идёт более осознанно. С другой стороны, некоторые сущности без контекста разделить просто нельзя, то есть сейчас некоторые операции анализа просто нельзя выполнить, так как поиск по слову выдаёт неразделимую смесь нескольких понятий.

2) Нельзя перейти к конкретным текстам. И просто ради любопытства, и для проверки качества распознавания и поиска было бы интересно увидеть аномальные встречи заданного слова, когда его по идее ещё не должно было возникнуть. Возвращаясь к тому же Фортрану увидеть его упоминания до выхода первой версии.

3) Есть риск смещённости оценок из-за возможной неоднородности охвата оцифрованной литературы. Например, если имеется неоднородность по охвату различных областей знания, языков, исторических периодов. Было бы интересно увидеть какое-то процентное соотношение базы поиска к общей информации, хранимой в данный момент всеми библиотеками.

4) В принципе невозможно искать неразделимые термины и персоналии. Например, если будем искать по фамилии Толстой, то очевидно встретим след как от Льва Толстого, так и от Алексея Толстого, а также других выдающихся носителей этой фамилии. И начиная с какой-то даты их уже невозможно будет разделить. Для идеальной поисковой системы будущего, поисковая машина должна не просто учитывать контекст, а понимать запрос.

Какие промежуточные выводы можно сделать:

1) Объекты с уникальными и неизменными именами гораздо проще найти и оценить. Создавая новый язык программирования, программу или какое-то другое произведение давайте ему уникальное имя и старайтесь потом не менять.

2) Носители уникальных фамилий находятся в более выигрышном положении в плане обнаружения их заслуг (и в проигрышном в плане маскировки среди однофамильцев). Если у вас неоднозначно записываемая фамилия, то чем раньше вы определитесь с её эталонным написанием, тем проще будет потом найти ваши работы.

3) Практика наименования одного объекта в честь другого в долгосрочной перспективе может приводить к сложности оценки вклада как первого, так и второго. По крайней мере, при использовании поисковых машин, не умеющих понимать контекст вопроса

На этом всё. Надеюсь, данная заметка была полезна. Инструмент работает, и при осознанном использовании позволяет лучше понимать мир и его динамику. При не очень осознанном использовании может просто использоваться как игрушка. Но игрушка всё-таки развивающая. Почему бы и нет.


В ходе работы пришла пара интересных мыслей:

1) Наверное, примерно так и должна быть устроена мировая библиотека будущего. Фактически, это уже её прототип.

2) Сервис позволяет оценивать вклад отдельных понятий в общую совокупность всех записанных человеческих текстов, то есть фактически когда-либо высказанных мыслей представителей нашей цивилизации. Но как назвать эту совокупность?

Подробнее..

Технические иллюстрации прошлого

22.05.2021 12:06:36 | Автор: admin

Привет, Хабр! Качественными фотографиями высокого разрешения уже никого не удивишь. Мы привыкли видеть их в интернете и печатных изданиях. Например, вот гора Монблан, на которой можно разглядеть чуть ли не каждую снежинку. Особенно интересны научные иллюстрации, которые делаются микроскопами и телескопами с высокой степенью детализации. А как это делали пару столетий назад, когда и фотография была недостаточно развита, и создавать иллюстрации было несколько труднее?

А тогда в ходу были гравюры. Только к середине 19-го века появились первые фотографии астрономических объектов, которые стали использовать ивнаучных целях. Но традиция рисунка снатуры долгое время конкурировала сфотографированием, поскольку позволяла выделять существенные черты объекта, показать его более наглядно, чем это могла сделать фотография.

Предлагаю посмотреть на замечательные научные иллюстрации, которые использовались в научных книгах 19-го века.

Метеоритный дождь

Автор Этьен Трувело (tienne Lopold Trouvelot), книга The Trouvelot astronomical drawings manual, год публикации 1882Автор Этьен Трувело (tienne Lopold Trouvelot), книга The Trouvelot astronomical drawings manual, год публикации 1882

Этьен Трувело опубликовал несколько десятков работ по астрономии и создал около семи тысяч рисунков различных астрономических явлений. При зарисовке с телескопа он использовал приём с сеткой в поле зрения окуляра, и по ней рисунок наносился на разлинованную бумагу в этом один из секретов фотографической точности зарисовок Трувело.

В 1882 году он выпустил атлас для широкой публики The Trouvelot Astronomical Drawings, котором было 15 изображений, иллюстрировавших основные классы небесных объектов и явлений. Атлас раскупался неимоверно быстро, хотя стоил 125 долларов. За эти деньги можно было купить билет первого класса на Титаник.

Для создания иллюстрации метеоритного дождя использовалась технология хромолитографии. На пластине запечатлён метеоритный поток Леониды, который наблюдался между после полуночи и до 5 часов утра в ночь с 13 на 14 ноября 1868 года. Тогда можно было увидеть до 1000 небесных объектов в час. Иллюстрация сопровождалась следующим описанием:

В 1866, 1867 и 1868 годах в ночь на 13 ноября наблюдались необычные метеоритные явления. В последний упомянутый день, у меня была возможность наблюдать замечательный поток падающих звезд, все характерные точки которого я попытался изобразить на пластине XII. Мои наблюдения начались вскоре после полуночи и продолжались без перерыва до восхода солнца. За этот промежуток времени в той части неба, которая была видна из северного окна моего дома, наблюдалось более трех тысяч метеоров. Максимальная интенсивность наблюдалась между четырьмя и пятью часами, когда они появлялись со средней скоростью 15 в минуту. В целом падающие звезды были довольно большими, многие из них превосходили Юпитер по яркости и видимому размеру, а некоторые даже превосходили Венеру и были настолько яркими, что непрозрачные объекты отбрасывали сильную тень во время своего полета. Многие оставили после себя светящийся шлейф, который оставался видимым более или менее долго после того, как ядро исчезало.

Сатурн

Автор Этьен Трувело, книгаThe Trouvelot astronomical drawings manual, год публикации 1882Автор Этьен Трувело, книгаThe Trouvelot astronomical drawings manual, год публикации 1882

Трувело был убеждён, что камера не может заменить человеческий глаз, который при определенной тренировке способен запечатлеть самые тонкие детали структуры небесных тел. Поэтому отказывался от астрофотографии, сохраняя верность своему способу изображения научных данных.

В книге The Trouvelot astronomical drawings manual он опубликовал пластину, на которой литографическим способом показал планету Сатурн с её кольцевой системой под небольшим углом. Так планету видели астрономы 30 ноября 1874 года в 17-30. Иллюстрация сопровождалась следующим описанием:

Сатурн, видимый невооруженным глазом, сияет в ночи, как звезда первой величины, чья тусклая мягкая белизна, однако, далека от сияния Венеры или Юпитера, хотя иногда он приближается по яркости к Марсу. Сатурн почти никогда не демонстрирует явления сцинтилляции или мерцания особенность, которая делает его легко различимым среди звезд и небесных планет.

Великая комета 1881 года

Автор Этьен Трувело, книга The Trouvelot astronomical drawings: atlas, год публикации 1881-1882Автор Этьен Трувело, книга The Trouvelot astronomical drawings: atlas, год публикации 1881-1882

Большая комета 1881 года это комета C/1881 K1, или комета Теббутта. Ближе всего к Земле на расстояние 40 млн км она подошла 20 июня 1881 года. Она движется по вытянутой эллиптической орбите, сильно наклонённой к плоскости орбиты Земли, и её период обращения оценили в 2600 лет. Объект облака Оорта.

В своём атласе Трувело изобразил комету во время движения по ночному небу возле обсерватории. Иллюстрация сопровождалась следующим описанием:

2 июля 1881 г., в 9 часов, ядро кометы 1881, II., появилось резко очерченным, ярким и значительно уплощенным в поперечном направлении. Но через полчаса оно значительно увеличилось и стало настолько рассеянным, что его едва можно было отличить от комы, с которой оно постепенно смешивалось. Возможно, стоит упомянуть, что в то время, когда было сделано это последнее наблюдение, было видно северное сияние. Комета 1881, III, претерпела другие очень важные изменения своего ядра, комы и хвоста. 25 июня ядро, которое было ярким и четко очерченным, было украшено четырьмя яркими расходящимися коническими крыльями света.

Море Влажности

Автор Этьен Трувело, книга The Trouvelot astronomical drawings manual, год публикации 1882Автор Этьен Трувело, книга The Trouvelot astronomical drawings manual, год публикации 1882

Табличка с видом на знаменитое море Влажности (Mare Humorum), лунную базальтовую равнину, образованную древними вулканическими извержениями. Исследователи считают море Влажности довольно интересным образованием с точки зрения науки, поскольку оно позволяет понять процессы формирования других лунных морей под воздействием тектоники бассейнов и эволюцию масконов областей лунной коры с гравитационными аномалиями. Автор описывает это следующим образом:

Mare Humorum, или, как его называют, море Влажности, является одной из малых серых лунных равнин. Её диаметр, почти одинаковый во всех направлениях, составляет около 270 миль, а общая площадь этой равнины составляет около 50 000 квадратных миль. Это одна из самых отчетливых равнин Луны, и её легко увидеть невооруженным глазом на левой стороне диска. Дно равнины, как и других лунных равнин, пересечено несколькими системами протяженных невысоких холмов и хребтов, на поверхности разбросаны небольшие кратеры.

Для сравнения современная фотография Mare Humorum.

Пароход La Champagne

Автор Victor Rose, книга Les merveilles de la science, приложение 1, год публикации 1887Автор Victor Rose, книга Les merveilles de la science, приложение 1, год публикации 1887

La Champagne был построен в 1886 году для французской судоходной компании Compagnie Gnrale Transatlantique. Он и однотипный корабль, Bretagne были первыми комфортабельными французскими лайнерами. Обслуживал североатлантические линии, перевозя 390 пассажиров первого класса, 65 второго и 620 третьего. Был оснащён тремя двигателями, которые приводили в движение одновинтовой гребной винт диаметром 7 м. Он мог развивать скорость 17,5 узлов (32 км/ч) и выполнять трансатлантический переход между Гавром и Нью-Йорком за семь с половиной дней. Во время стоянки на якоре 28 мая 1915 г. корабль был выброшен на берег , где и разрушился.

Гравюра на дереве показывает поперечный срез машинного отделения парохода.Можно увидеть, как двигатель поднимается до уровня главной палубы, а все уровни заполнены механиками, горничными и пассажирами в каютах и на палубе. Некоторые элементы пронумерованы, а ниже приведено их описание.

a. Малый цилиндр. b. Большой цилиндр. c. Приводной вал. d. Изгиб ведущего вала. e. Шатун. f. Шток поршня. g. Конденсатор.i. Устройство для управления переключением передач вперёд и назад.

Паровой двигатель Corliss Beam

Автор Norman, книга Appletons' cyclopaedia of applied mechanics, том 1, год публикации 1880Автор Norman, книга Appletons' cyclopaedia of applied mechanics, том 1, год публикации 1880

Автор сопровождает сделанную путём гравировки по дереву иллюстрацию следующей записью:

Изобретение двигателя Corliss олицетворяет новую эпоху в конструировании паровых двигателей, а история его появления имеет поразительную аналогию с насосным двигателем, изобретенным Ваттом. Как и Ватт, мистер Корлисс был удовлетворен тем, что заменил старые формы двигателей своим более совершенным устройством и получил в качестве оплаты стоимость части сэкономленного угля. Как и Ватт, он вскоре обнаружил, что владельцы заводов не желают давать ему правдивые отчеты о полученной экономии. Теперь, когда срок действия патента истек, двигатель Corliss и его модификации приняты в качестве стандартной конструкции двигателестроителями в этой стране, и он вытеснил за границу почти все другие концепции.

Как двигатель выглядит сейчас.

Тростниковый орган Peloubet & Pelton

Книга Appletons' cyclopaedia of applied mechanics, том 2, год публикации 1880 Книга Appletons' cyclopaedia of applied mechanics, том 2, год публикации 1880

На созданной благодаря деревянной гравюре иллюстрации можно увидеть тростниковый орган, изготовленный компанией Peloubet, Pelton, & Co. Очень дорогое и редкое устройство из Нью-Йорка. Кстати, в 2019 году такой же орган отреставрировали.

Кузница компании Derosne and Cail, Гренель

Автор Edmond Morin, книга Les grandes usines, том 2, год публикации 1869Автор Edmond Morin, книга Les grandes usines, том 2, год публикации 1869

Компания Derosne & Cail действовала на протяжении большей части девятнадцатого века под разными названиями и с разными владельцами. Её основная деятельность заключалась в строительстве сахарных заводов, железнодорожных локомотивов и металлических мостов. После пожара на заводе Chaillot в 1865 году кузница Grenelle осталась единственной действующей в Париже. Компания Cail упоминается в книге Жюля Верна Двадцать тысяч лье под водой как производитель деталей для подводной лодки Наутилус.

Вид на кузницу компании Derosne & Cail: рабочие нагревают и стучат молотком по металлическим деталям или работают с отбойными молотками в большом и шумном цехе. Изображение создано с помощью технологии гравировки на дереве.

Механизм для бурения в туннеле Мон-Сени

Автор неизвестен, книга Les nouvelles conqutes de la science, том 2, год публикации 1867Автор неизвестен, книга Les nouvelles conqutes de la science, том 2, год публикации 1867

Бригада рабочих работает на бурильном станке для проходки железнодорожного туннеля Фрежюс (также известного как туннель Мон-Сени) протяженностью 12,2 километров. Бурение началось в августе 1857 года, и движение по нему открылось в сентябре 1871 года.

На деревянной гравюре, с которой сделана иллюстрация, демонстрируется работающая на сжатом воздухе машина, которая была разработана для бурения скальных пород. Бригаде потребовалось шесть часов, чтобы пробурить от 90 до 100 скважин шириной 4 см и глубиной 80 см. Часть скважин заполнялись взрывчаткой, а затем одновременно подрывались. В результате получалось расширить отверстие в среднем до 70 см в глубину, 99 см в ширину и 40 см в высоту.

Водяной насос на Сене

Автор P. Broux, книга Les merveilles de l'industrie, том 3, год публикации 1873 Автор P. Broux, книга Les merveilles de l'industrie, том 3, год публикации 1873

Иллюстрация показывает интерьер водяного насоса вШайо, ныне являющейся частью Парижа. Он располагался недалеко от площадиАльмаи забирал воду из Сены, которая затем подавалась в цистерны холмаШайо. Первоначально насос приводился в действие двумя двигателямиНьюкомена, названными Константин и Августин в честь инженеров проекта Жака-Константина и Огюста-ШарляПерье. Насос эксплуатировался с 1781 по 1900 год. Исходник деревянная гравюра.

Машина для получения бумаги

Автор P. Broux, книга Les merveilles de l'industrie, том 2, год публикации 1873 Автор P. Broux, книга Les merveilles de l'industrie, том 2, год публикации 1873

В 1680 году голландцы изобрели машину для получения волокнистой массы, из которой можно было сделать бумагу. Устройство заменило штамповые мельницы для подготовки целлюлозы, потому чтомогло производить за один день тот же объём целлюлозы, что и штамповочная фабрика за восемь дней. На бумажных фабриках механизм, изображённый на иллюстрации, использовался для перемалывания ветоши в воде до тех пор, пока она не превращалась в целлюлозу, которая позже в процессе коагуляции превращалась в листы бумаги. Устройство, изображённое на деревянной гравюре, также известно как Hollander.

Остеография

Автор J. Bisbee, книга Systematized anatomy, or Human organography, год публикации 1837Автор J. Bisbee, книга Systematized anatomy, or Human organography, год публикации 1837

На созданной с помощью литографии пластине изобразили человеческий скелет и подробные изображения позвонков, позвоночника, таза, грудной клетки, ступней, рук и т. д. Детализированное и очень качественное изображение позволяло лучше учить молодых врачей того времени.

Выставка электрооборудования

Автор неизвестен, книга Издание Нового универсального иллюстрированного энциклопедического словаря, год публикации 1885 Автор неизвестен, книга Издание Нового универсального иллюстрированного энциклопедического словаря, год публикации 1885

Деревянная гравюра позволила сохранить до наших дней вид на помещение, в котором проходила часть Международной выставки электрических устройств. Выставка состоялась в Париже в 1881 году в снесенном теперь Palais de l'Industrie. Одновременно в Париже проходил Международный конгресс электриков.

В Международной электрической выставке приняли участие Великобритания, США, Германия, Италия, Нидерланды и Франция. На выставке была продемонстрирована первая динамо-машина Зеноба Грамма. Томас Эдисон представил запатентованную им лампу с угольной нитью. В одном из залов играл стереофонический театрофон. Вернер фон Сименс представил первый электрический трамвай, Александр Белл первый коммерческий телефон. Марсель Депре продемонстрировал электрическую распределительную сеть, Густав Труве экспериментальный электромобиль.

Гидроцикл

Автор Joseph Burn Smeeton, книга Les recreations scientifiques, год публикации1884 Автор Joseph Burn Smeeton, книга Les recreations scientifiques, год публикации1884

На изображении, полученном с деревянной гравюры, изображён мужчина на гидроцикле, который едет по озеру. Он машет фуражкой рулевому и экипажу гребной лодки, тренирующемуся на некотором расстоянии. Этот гидроцикл описывается автором следующим образом:

Имеются две полые жестяные поплавки цилиндрической формы, сужающиеся на концах. Эти поплавки соединены платформой из очень легкого дерева, на которой поднимается сиденье рабочего, а под ней находится механизм для приведения в движение велосипеда. Движущая сила очень проста и соответствует силе, используемой для приведения в движение велосипеда по суше ногами гонщика, причем колесо водного велосипеда снабжено лопастями. Рулевой механизм, которым легко управлять с помощью шнура, дает велосипедисту полный контроль над машиной, а рулевое управление осуществляется с помощью ручки, аналогичной той, которую велосипедист использует для поворота машины, на которой он едет.

Больше примеров можно увидеть на сайте старых книжных иллюстраций.

Подробнее..

Что будут сдавать российские дети в 2021 году? Анализируем продажи учебников по ЕГЭ на маркетплейсах

24.05.2021 14:14:07 | Автор: admin

Что-то выпускники этого года сдавать точно будут, но им явно придется проще своих предшественников из 2019 года. Минпросвещение уже заявило, что ы 2021 года будет отменен досрочный ЕГЭ, а обязательный нужно будет сдавать только тем, кто планирует поступать в вузы, причем только один - русский язык. В некоторых профильных университетах придется показать свои математические знания. Во всем виноват COVID-2019. Вообще же, сегодня, активно идут разговоры о том, что единый государственный экзамен пора отменять, поскольку он превратил образование в гонку за баллами, а не процесс передачи знаний.

Но пока до этого дойдет пройдут десятки лет, а ученикам сообщат об изменениях, наверняка, накануне. Как и в этом году. Никто до последнего не знал как сложится ситуация со сдачей экзаменов, поэтому все готовились ко всему. Поэтому и специализированная литература по подготовке к ЕГЭ в книжных магазина оставалась в почете. Но мы - сообщество продавцов маркетпейсов и нам важно знать как дела с торговлей подобной литературой идут на интернет-площадках. Возможно, это настолько же сезонный и популярный товар как цветы на 8 марта. Торгуешь пару месяцев и живешь счастливо - от звонка до звонка.

С помощью сервиса аналитики маркетплейсов мы решили собрать статистику продаж подготовительной литературы, а заодно разобраться кого на Руси все-таки больше - гуманитариев или ествественников. К какому экзамену покупатели готовятся чаще и на каких науках можно заработать больше? Давайте смотреть на графики вместе.

Дышим знаниями

Для начала смотрим на иллюстрацию "Как начать новую жизнь с Нового года?". С помощью сервиса аналитики SellerFox cобираем статистику по объему продаж за весь 2021 год. Анализируемая категория "Книги-Учебная литература". На графике отчетливо видно, что в январе спрос на подобные товары был заметно выше. В целом, в начале года выше были все показатели, в том числе и средняя цена продажи учебной литературы. Начиная с марта продажи книг и учебников пошли на спад, а поздней весной вновь подросли, но так и не догнали январские показатели. Пиковый объем продаж в начале года составил 6 707 заказов, в апреле - 6 299 заказов, а в мае - только 4 166.

Динамика объема, выручки и средней стоимости товаров категории "Учебная литература" маркетплейса Ozon, период с 1.01 - 24.05.2021 года, данные сервиса внешней аналитики маркетплейсов SellerFoxДинамика объема, выручки и средней стоимости товаров категории "Учебная литература" маркетплейса Ozon, период с 1.01 - 24.05.2021 года, данные сервиса внешней аналитики маркетплейсов SellerFox

Смотрим на объемы продажи и выручки в самой топовом месяце для категории - январе 2021 года. Стастистика как нельзя лучше показывает, что жизнь с чистого листа и подготовку ко всему новому покупатели начинают именно в январе - в топах практически все пособия связаны с подготовкой к ЕГЭ. На первом месте по объемы продаж - учебник для подготовки к экзамену по русскому языку. У товара 4 174 заказов и 1665684 итоговой выручки. На втором месте - пособие для подготовки к типовому ЕГЭ по математике: у позиции 3 108 заказов и 1271928 рублей выручки. Очевидно, в январе школьники и родители еще не знали, что экзамен отменят, а их траты окажутся лишними. Надеемся, хотя бы для развития такие покупки оказались полезными.

Данные по объему продаж и выручке товаров категории "Учебные пособия" маркетплейса Ozon, период с 01.01 - 31.01.2021, данные сервиса внешней аналитики маркетплейсов SellerFoxДанные по объему продаж и выручке товаров категории "Учебные пособия" маркетплейса Ozon, период с 01.01 - 31.01.2021, данные сервиса внешней аналитики маркетплейсов SellerFox

В целом ТОП предметов для сдачи в 2021 году, который можно построить на основе заказов покупателей Ozon выглядит так:

  1. ЕГЭ по русскому языку, типовой вариант;

  2. ЕГЭ по математике, типовой вариант;

  3. ЕГЭ по обществознанию, типовой вариант;

  4. ОГЭ по русскому языку, типовой вариант;

  5. ЕГЭ по математике, профильный уровень;

  6. ЕГЭ по биологии, типовой вариант;

  7. ЕГЭ по физике, типовой вариант;

  8. ЕГЭ по английскому языку, типовой вариант;

  9. ЕГЭ по истории, типовой вариант;

  10. ЕГЭ по химии, типовой вариант.

Будущих гуманитариев в стране, очевидно, больше. Но судить об это только на основе продаж пособий по русскому языку нельзя (это обязательный для всех экзамен). А вот среди других предметов к которым готовятся покупателей Ozon, любовь к точным наукам прослеживается гораздо реже.

Посмотрим на показатели продаж и за последние 30 дней - месяц, когда активную подготовку начинают все, кто не успел или не захотел сделать это раньше. Как мы уже видели, спрос в конце отчетного периода снова вырос. Но на какие пособия?

Данные по объему продаж и выручке товаров категории "Учебные пособия" маркетплейса Ozon, период с 24.04 - 24.05.2021, данные сервиса внешней аналитики маркетплейсов SellerFoxДанные по объему продаж и выручке товаров категории "Учебные пособия" маркетплейса Ozon, период с 24.04 - 24.05.2021, данные сервиса внешней аналитики маркетплейсов SellerFox

За последние 30 дней, лидерство в топе продаж заняли вовсе не пособия по ЕГЭ, а учебники для дошкольников. Книги для детей и до этого встречались в статистической выдаче - в январе в лидеры по объему продаж выбивался "Букварь". Теперь отчетливо прослеживается другая закономерность - детей активно готовят к поступлению в школу. В первую очередь, родители тренируют навыки письма - без него обучение в 1 классе пройдет далеко не сладко. У лидера продаж 595 заказов за месяц и 127452 рублей выручки. С январскими желаниями покупателей Ozon сдать ЕГЭ, такие показатели, конечно не сравняться. Но весной даже ни просели. В лидерах снова пособие по русскому языку с 445 заказами и выручкой в размере 203807 рублей. На втором месте - профильная математика. У пособия по этому предмету 414 заказов и 156 304 рубля выручки. Готовиться к типовой математике, судя по продажам, практически перестали.

Дико интересно

На Wildberries ситуация с учебными пособиями отличается незначительно отличается. В единицах проданных учебников, здесь примерно такие же показатели как и на Ozon, хотя Wb слегка уступает. В самые пиковые дни января и мая количество проданных товар в категории едва превысило 6 тысяч штук. При этом в начале года, здесь тоже прослеживается небывалый спрос на пособия по подготовке к экзаменам, правда, речь чаще идет об ОГЭ.

Динамика объема, выручки и средней стоимости товаров категории "Учебная литература" маркетплейса Wildberries, период с 1.01 - 31.01.2021 года, данные сервиса внешней аналитики маркетплейсов SellerFoxДинамика объема, выручки и средней стоимости товаров категории "Учебная литература" маркетплейса Wildberries, период с 1.01 - 31.01.2021 года, данные сервиса внешней аналитики маркетплейсов SellerFoxДинамика объема, выручки и средней стоимости товаров категории "Учебная литература" маркетплейса Wildberries, период с 1.01 - 31.01.2021 года, данные сервиса внешней аналитики маркетплейсов SellerFoxДинамика объема, выручки и средней стоимости товаров категории "Учебная литература" маркетплейса Wildberries, период с 1.01 - 31.01.2021 года, данные сервиса внешней аналитики маркетплейсов SellerFox

У лидера продаж января - пособия по подготовке к ОГЭ по русскому языку - 3 041 заказ и 1222843 рублей выручки в кармане. На втором месте снова пособие для сдающих ЕГЭ по русскому: книга была заказана 2 090 раз и принесла продавцу 1120638 рублей выручки.

Данные по объему продаж и выручке товаров категории "Учебная литература" маркетплейса Wildberries, период с 1.01 - 31.01.2021, данные сервиса внешней аналитики SellerFoxДанные по объему продаж и выручке товаров категории "Учебная литература" маркетплейса Wildberries, период с 1.01 - 31.01.2021, данные сервиса внешней аналитики SellerFox

А вот топ предметов для сдачи в 2021 году, по версии покупателей Wildberries выглядит так:

  1. ОГЭ по математике, типовой вариант;

  2. ЕГЭ по русскому языку, типовой вариант;

  3. ОГЭ по русскому языку, типовой вариант;

  4. ОГЭ по русскому языку, типовой вариант;

  5. ЕГЭ по обществознанию, типовой вариант;

  6. ЕГЭ по математике, профильный уровень;

  7. ЕГЭ по биологии, типовой вариант;

  8. ЕГЭ по истории, типовой вариант;

  9. ЕГЭ по физике, типовой вариант.

Здесь снова власть берут гуманитарии, но, обратите внимание, на Wildberries пособия для подготовки к ОГЭ продаются гораздо чаще.

Весной покупатели Wb про ЕГЭ практически забыли, а лидерами по объему продаж стали пособиями для младших школьников. То есть не для тех, кто только готовится к своему первому звонку, а для учеников начальной школы. Ситуация выглядит так, словно родители активно начали подтягивать детей по тем предметам в которых они отстают. Посмотри на статистическую выдачу - здесь весь свет и цвет подготовительной литературы для "почемучек" и уголовный кодекс. В целом же, если посмотреть на объем продаж станет ясно, что к маю они рухнули почти в 7 раз.

Данные по объему продаж и выручке товаров категории "Учебная литература" маркетплейса Wildberries, период с 24.04 - 25.05.2021, данные сервиса внешней аналитики маркетплейсов SellerFoxДанные по объему продаж и выручке товаров категории "Учебная литература" маркетплейса Wildberries, период с 24.04 - 25.05.2021, данные сервиса внешней аналитики маркетплейсов SellerFox

У лидера категории за последние 30 дней в кармане оказалось всего 817 заказов и 162067 выручки. Это книга с таблицей умножения. На втором месте пособие по великому и могучему - прописи, которым удалось получить внимание 809 покупателей и выручку в размере 64082 рублей.

Тревожный звонок

Очевидно, что продажи учебной литературы по подготовке к экзаменам имеют сезонный спрос и особо ярко проявляют себя в начале нового года. Но это в 2021 году. Что произойдет в следующем пока не ясно, потому что изменение правил сдачи ЕГЭ может перевернуть книжные полки и потребности покупателей в новой литературе.

Да, пока что большую часть учебных пособий реализуют маркетплейсы - это особенно видно по статистике продаж, собранной на Ozon. Но если вам как продавцам, действительно, интересна эта ниша, то посмотрите на аналитику иначе. Проанализируйте какие предметы интересуют покупателей чаще и с какими проблемами в обучении сталкиваются родители первоклашек? Возможно, это станет для вас почвой для создания нового образовательного продукта или поиска товаров, заточенных на укрепления конкретных навыков - письма или чтения.

На любые аналитические данные можно смотреть с разных сторон. Подумайте как применить эти цифры к вашему опыту.

Подробнее..

Сам себе Гутенберг. Делаем параллельные книги

16.05.2021 22:09:51 | Автор: admin

Lingtrain parallel books


Если вам нравится изучать языки (или вы их преподаете), то вы наверняка сталкивались с таким способом освоения языка как параллельное чтение. Он помогает погрузиться в контекст, увеличивает лексикон и позволяет получить удовольствие от обучения. Читать тексты в оригинале параллельно с русскоязычными, на мой взгляд, стоит, когда уже освоены азы грамматики и фонетики, так что учебники и преподавателей никто не отменял. Но когда дело все же доходит до чтения, то хочется подобрать что-то по своему вкусу, либо что-то уже знакомое или любимое, а это часто невозможно, потому что такого варианта параллельной книги никто не выпускал. А если вы учите не английский язык, а условный японский или венгерский, то трудно найти вообще хоть какой-то интересный материал с параллельным переводом.


Сегодня мы сделаем решительный шаг в сторону исправления этой ситуации.


Из чего делаем


На входе у нас будут два текстовых файла с оригинальным текстом и его переводом. Для примера возьмем книгу "Убить пересмешника" Харпер Ли на русском и английском языках.


Начало документов выглядит так (отрывки приведены в таком виде, в котором они были найдены в сети):


TO KILL A MOCKINGBIRDby Harper LeeDEDICATIONfor Mr. Lee and Alicein consideration of Love & AffectionLawyers, I suppose, were children once.Charles LambPART ONE1When he was nearly thirteen, my brother Jem got his arm badlybroken at the elbow. When it healed, and Jems fears of never beingable to play football were assuaged, he was seldom self-conscious abouthis injury. His left arm was somewhat shorter than his right; when hestood or walked, the back of his hand was at right angles to his body,his thumb parallel to his thigh. He couldnt have cared less, so long ashe could pass and punt.



Харпер ЛиУбить пересмешникаЮристы, наверно, тоже когда-то были детьми.Чарлз ЛэмЧАСТЬ ПЕРВАЯ1Незадолго до того, как моему брату Джиму исполнилось тринадцать, у него была сломана рука. Когда рука зажила и Джим перестал бояться, что не сможет играть в футбол, он ее почти не стеснялся. Левая рука стала немного короче правой; когда Джим стоял или ходил, ладонь была повернута к боку ребром. Но ему это было все равно - лишь бы не мешало бегать и гонять мяч.

Как делаем


Задача объемная, поэтому разобьем ее на три части:


  1. Подготовка текстов
  2. Выравнивание двух текстов по предложениям
  3. Создание книги

Начнем с выравнивания двух текстов, так как эта часть является центральной и крайние пункты опираются на нее.


Получение параллельного корпуса


Строго говоря, нам нужно получить параллельный корпус из двух текстов. Задача не так проста как кажется по ряду причин:


  • Переводчики часто переводят текст не как одно предложение к одному. Особенно ярко это заметно при переводе на иероглифические тексты (китайский, японский и т.д.), где сложные предложения как правило будут разбиты на несколько простых. В переводах на другие языки это также встречается довольно часто.
  • Некоторые предложения или абзацы могут попросту отсутствовать, а иногда переводчик добавляет что-нибудь от себя.
  • При очистке текстов от лишней информации, которая не участвует в выравнивании (автор, название, номера глав и подзаголовки), понадобится сохранить ее местоположение в тексте, чтобы конечная книга получилась полной и красивой.

Для выравнивания воспользуемся библиотекой lingtrain-aligner, над которой я работаю около года и которая родилась из кучи скриптов на python, часть из которых еще ждет своего часа. Проект открытый, буду рад вашим идеям и предложениям. Все ссылки вы найдете в конце статьи.


Под капотом библиотека использует модели машинного обучения, которые переводят предложения в векторное пространство. Это позволяет посчитать между векторами расстояние и проинтерпретировать его как близость предложений по смыслу. Эти модели многоязычные, одна из них поддерживает чуть более 50-ти языков, вторая более ста. Причем сюда не входят родственные языки, для которых такой подход тоже будет иметь смысл за счет того, что они частично пересекаются по лексикону. Ссылки на статьи и списки языков, опять же, найдете ниже.


При подаче в программу текстов, произойдет следующее:


  • Текст сливается в одну строку.
  • Строка подчищается в зависимости от языка текста.
  • Строка разбивается по предложениям при помощи библиотеки razdel или регулярок.
  • Из каждой строки достается метаинформация, на основе специальных меток.

Метки нам понадобятся для того, чтобы при составлении книги из корпуса восстановить деление по частям и главам.
Давайте подготовим тексты для подачи в программу.


Подготовка текстов


Язык разметки


В качестве разметки был придуман простой язык, который совместим с последующим разбиением текста на предложения. Сейчас поддерживаются несколько типов меток, которые ставятся в конце строки. В конце каждой метки должна стоять точка.


Метка Значение Установка
%%%%%title. Название произведения Вручную
%%%%%author. Автор Вручную
%%%%%h1. %%%%%h2. %%%%%h3. %%%%%h4. %%%%%h5. Заголовки Вручную
%%%%%divider. Разделитель Вручную
%%%%%. Новый абзац Автоматически

Метки абзацев


Метки абзацев будут проставлены автоматически по следующему правилу: если строка кончается на символ [.,:,!?] и перенос строки, то считаем такую строку концом абзаца.


Правила подготовки текста


  1. Удалить заведомо лишние строки (информацию об издателе, посвящение, номера страниц, примечания).
  2. Проставить метки для автора и названия.
  3. Проставить метки для заголовков (H1 самый большой, H5 самый маленький). Если заголовки не нужны, то просто удалите их.
  4. Убедиться, что в тексте нет строк, которые кончаются точкой и при этом не являются концом абзаца (иначе целый абзац разобьется в этом месте на два).

Расставьте метки руками в соответствии с правилами, пустые строки в данном случае роли не играют. Должны получиться документы, похожие на такие:


TO KILL A MOCKINGBIRD%%%%%title.by Harper Lee%%%%%author.%%%%%divider.PART ONE%%%%%h1.1%%%%%h2.When he was nearly thirteen, my brother Jem got his arm badlybroken at the elbow. When it healed, and Jems fears of never beingable to play football were assuaged, he was seldom self-conscious abouthis injury. His left arm was somewhat shorter than his right; when hestood or walked, the back of his hand was at right angles to his body,his thumb parallel to his thigh. He couldnt have cared less, so long ashe could pass and punt....



Харпер Ли%%%%%author.Убить пересмешника%%%%%title.%%%%%divider.ЧАСТЬ ПЕРВАЯ%%%%%h1.1%%%%%h2.Незадолго до того, как моему брату Джиму исполнилось тринадцать,у него была сломана рука. Когда рука зажила и Джим перестал бояться,что не сможет играть в футбол, он ее почти не стеснялся. Левая рука сталанемного короче правой; когда Джим стоял или ходил, ладонь была повернута кбоку ребром. Но ему это было все равно - лишь бы не мешало бегать игонять мяч....

Здесь и дальше все "главные" заголовки ("ЧАСТЬ ПЕРВАЯ", "ЧАСТЬ ВТОРАЯ" и т.д.) помечены меткой h1, номера глав помечены метками h2. Перед выравниваем все метки будут удалены из текста и будут использованы при создании книги.


Выравнивание


Colab блокнот


Чтобы выровнять свои тексты используйте вот этот Colab блокнот. Это интерактивный блокнот на питоне, в который вы можете вносить изменения и запускать в браузере. В нем есть инструкции и некоторые комментарии к процессу. В конце можно будет скачать получившуюся книгу как html страничку.


Скрипты


Здесь же давайте напишем небольшой скрипт, обсудим сложности и ограничения нашего подхода.
Установим библиотеку следующей командой:


pip install lingtrain-aligner

Импортируем необходимые компоненты:


from lingtrain_aligner import preprocessor, splitter, aligner, resolver, reader, vis_helper

Определим пути до входных файлов и прочитаем все строки в переменные:


text1_input = "harper_lee_ru.txt"text2_input = "harper_lee_en.txt"with open(text1_input, "r", encoding="utf8") as input1:  text1 = input1.readlines()with open(text2_input, "r", encoding="utf8") as input2:  text2 = input2.readlines()

Определим также путь до SQLite базы данных (это хранилище со всей необходимой для выравнивания информацией) и параметрами языка lang_from и lang_to. Эти параметры очень важны, так как они влияют на правила разбиения строк на предложения:


db_path = "db/book.db"lang_from = "ru"lang_to = "en"models = ["sentence_transformer_multilingual", "sentence_transformer_multilingual_labse"]model_name = models[0]

Получить список всех доступных языков можно следующей командой:


splitter.get_supported_languages()

Если нужного языка в списке пока нет, но он поддерживаются моделями, то используйте код xx, тогда к тексту будут применены стандартные правила фильтрации и разбиения на предложения. Модель sentence_transformer_multilingual работает быстрее и поддерживает 50+ языков, sentence_transformer_multilingual_labse поддерживает 100+ языков.


Добавим к текстам метки абзацев:


text1_prepared = preprocessor.mark_paragraphs(text1)text2_prepared = preprocessor.mark_paragraphs(text2)

Разобьем документы на строки:


splitted_from = splitter.split_by_sentences_wrapper(text1_prepared , lang_from, leave_marks=True)splitted_to = splitter.split_by_sentences_wrapper(text2_prepared , lang_to, leave_marks=True)

Создадим нашу базу данных и наполним ее данными, взятыми из нашей разметки. В базе хранятся строки с координатами абзацев и глав, метаданные, маппинг выровненных строк на их изначальный состав и местоположение. Такая структура позволяет писать для этого хранилища UI, в котором можно проводить различные манипуляции с корпусом. Это отдельный проект, о нем в следующий раз.


aligner.fill_db(db_path, splitted_from, splitted_to)

Теперь можно выровнять документы. Процесс выравнивания идет кусками с размером batch_size, вокруг каждого куска берется дополнительное количество строк размера window, чтобы гарантированно захватить необходимые строки. Модель берет заданное количество строк первого текста и подбирает в соответствующем фрагменте второго текста лучшие соответствия, используя векторные представления. На этом основывается первоначальное выравнивание. Для того, чтобы выровнять первые четыреста строк, выполним следующую команду.


batch_ids = [0,1,2,3]aligner.align_db(db_path, \                model_name, \                batch_size=100, \                window=30, \                batch_ids=batch_ids, \                save_pic=False,                embed_batch_size=50, \                normalize_embeddings=True, \                show_progress_bar=True                )

Результат выравнивания


Теперь можно посмотреть на результат первичного выравнивания! Это возможно благодаря тому, что в базе мы храним изначальные номера строк для выровненного корпуса. Воспользуемся модулем vis_helper. Так как строк у нас 400, то нарисуем все на одной картинке, задав параметр batch_size=400. Если указать, например, batch_size=50, то получим 4 картинки по-меньше.


vis_helper.visualize_alignment_by_db(db_path, output_path="alignment_vis.png", \                                    lang_name_from=lang_from, \                                    lang_name_to=lang_to, \                                    batch_size=400, \                                    size=(800,800), \                                    plt_show=True)

Первичное выравнивание


Посмотрим на картинку. Выравнивание предсказуемо идет от начала к концу, но есть конфликты. Основных причин две:


  • У модели было слишком много удачных вариантов.
    • Так случается, если строка короткая. Например, в тексте идет диалог, фразы в нем односложные, используются одни и те же имена.
  • У модели было слишком мало вариантов и правильного среди них нет.
    • У текстов разные тенденции к разделению на предложения. Один постепенно "убегает из окна" и мы не ищем правильные варианты там, где надо. Окно можно увеличить, но не слишком сильно, потому что у модели становится больше вариантов для ошибок. Нужен компромисс.

Хорошим решением мне видится регрессия на координаты строк при выравнивании батча и сдвиг окна на конец потока при выравнивании следующего. Минусом тут будет потеря возможности распараллеливания обсчета батчей, так как они станут зависимы друг от друга.


Сейчас окно сдвигается на основе отношения длин текстов. Батчи не зависимы, но есть другая проблема, если один из текстов это только часть книги, а второй текст полный, то окно быстро убежит от правильного потока выравнивания.


Меня зовут Уинстон Вульф. Я решаю проблемы.


Давайте теперь разбираться с шероховатостями. Глядя на картинку, мы видим, что есть непрерывные цепочки, есть разрывы и есть выбросы. Например, для предложений 10,11,12 модель подобрала предложения 15,16,17 из второго текста. Эта цепочка хорошая. Все, что находится между цепочками назовем конфликтом. При таком определении конфликта можно измерить его размер и подобрать стратегию разрешения. Логика по решению проблем находится в модуле resolver.


Для начала давайте посмотрим на все найденные конфликты:


conflicts_to_solve, rest = resolver.get_all_conflicts(db_path, min_chain_length=2, max_conflicts_len=6)

conflicts to solve: 46total conflicts: 47

При этом в переменную conflicts_to_solve попадут конфликты, которые соответствуют заданным параметрам поиска, а в переменную rest остальные.


Выведем на экран статистику:


resolver.get_statistics(conflicts_to_solve)resolver.get_statistics(rest)

('2:3', 11)('3:2', 10)('3:3', 8)('2:1', 5)('4:3', 3)('3:5', 2)('6:4', 2)('5:4', 1)('5:3', 1)('2:4', 1)('5:6', 1)('4:5', 1)('8:7', 1)

Видим, что чаще всего попадаются конфликты размера 2:3 и 3:2, это означает, что одно из предложений было переведено как два, либо два предложения были слиты в одно.


Посмотреть на конфликт можно следующей командой:


resolver.show_conflict(db_path, conflicts_to_solve[10])

124 Дом Рэдли стоял в том месте, где улица к югу от нас описывает крутую дугу.125 Если идти в ту сторону, кажется, вотвот упрешься в их крыльцо.126 Но тут тротуар поворачивает и огибает их участок.122 The Radley Place jutted into a sharp curve beyond our house.123 Walking south, one faced its porch; the sidewalk turned and ran beside the lot.

Видим, что строки 125 и 126 нужно бы сложить в одну, тогда правильное сопоставление выглядело бы как [124]-[122] и [125,126]-[123]. Как же научить этому программу? Так как она уже умеет выбирать лучший из предоставленных вариантов, то давайте ей их и предоставим. Конфликты у нас не очень большие, поэтому мы будем брать все возможные варианты разрешения конфликта, считать для них коэффициент похожести, суммировать и брать лучший. В данном случае это будет два варианта:


  1. [124,125]-[122] // [126]-[123]
  2. [124]-[122] // [125,126]-[123]

Что до стратегии выравнивания, то на данный момент лучше всего себя проявила такая, сначала ищем конфликты при минимальной длинне хорошей цепочки 2 (при таком параметре конфликтов найдется больше всего) и максимальной длинной конфликта не больше 6. Разрешаем все найденные конфликты, при этом большие конфликты становятся меньше так мы их частично разрешили. Затем увеличиваем оба параметра, ищем и снова разрешаем, добивая остатки.


Выглядит это так:


steps = 3batch_id = -1 #выровнять все доступные батчиfor i in range(steps):    conflicts, rest = resolver.get_all_conflicts(db_path, min_chain_length=2+i, max_conflicts_len=6*(i+1), batch_id=batch_id)    resolver.resolve_all_conflicts(db_path, conflicts, model_name, show_logs=False)    vis_helper.visualize_alignment_by_db(db_path, output_path="img_test1.png", batch_size=400, size=(800,800), plt_show=True)    if len(rest) == 0:        break

Результат после первого шага:


Разрешение конфликтов. Шаг 1


И после второго:


Разрешение конфликтов. Шаг 2


На выходе мы имеем файл book.db. Теперь мы можем перейти к созданию книги.


Конфликты на концах интервала


Отметим, что алгоритм находит конфликты только между цепочками, поэтому разрывы могут остаться на концах интервала. Для разрешения таких конфликтов есть методы:


resolver.fix_start(db_path, model_name, max_conflicts_len=20)

и


resolver.fix_end(db_path, model_name, max_conflicts_len=20)

Книги и стили


За создание книжки отвечает модуль reader.


from lingtrain_aligner import reader

Сначала прочитаем из базы тексты, разбитые по абзацам, и данные о главах:


paragraphs_from, paragraphs_to, meta = reader.get_paragraphs(db_path, direction="from")

Параметр direction ["from", "to"] показывает на основе какого текста делить выравнивание на абзацы. Это дает нам возможность лучше подредактировать только один текст (например, русский) и на его основе сформировать книгу.


Теперь передадим данные в метод create_book():


reader.create_book(paragraphs_from, paragraphs_to, meta, output_path = f"lingtrain.html")

Получим вот такую книгу:



Это обыкновенная html страничка со встроенными стилями. В стили я добавил модификаторы, поэтому ее можно распечатать или сохранить как pdf, при этом шрифт с полями станут меньше.


Стилизация


У нас в загашнике осталась информация о соответствии пар предложений. Давайте ее задействуем, дополнительная подсветка поможет при подготовке материалов для обучения. Чтобы это сделать зададим параметр template.


reader.create_book(paragraphs_from, paragraphs_to, meta, output_path = f"lingtrain.html", template="pastel_fill")


reader.create_book(paragraphs_from, paragraphs_to, meta, output_path = f"lingtrain.html", template="pastel_start")


Шаблонов стилей пока немного, предлагайте свои кастомные стили, добавим их в библиотеку.


Кастомные стили


Зададим параметр template="custom" и передадим объект styles. Этот объект представляет из себя массив CSS стилей, которые будут применены к предложениям каждого абзаца циклически.


Например, подсветим каждое втрое предложение в абзаце желтым цветом начиная со второго:


my_style = [    '{}',    '{"background": "#fafad2"}',    ]reader.create_book(paragraphs_from, paragraphs_to, meta, output_path = f"lingtrain.html", template="custom", styles=my_style)


Задавать можно любые применимые к span'ам стили:


my_style = [    '{"background": "linear-gradient(90deg, #FDEB71 0px, #fff 150px)", "border-radius": "15px"}',    '{"background": "linear-gradient(90deg, #ABDCFF 0px, #fff 150px)", "border-radius": "15px"}',    '{"background": "linear-gradient(90deg, #FEB692 0px, #fff 150px)", "border-radius": "15px"}',    '{"background": "linear-gradient(90deg, #CE9FFC 0px, #fff 150px)", "border-radius": "15px"}',    '{"background": "linear-gradient(90deg, #81FBB8 0px, #fff 150px)", "border-radius": "15px"}'    ]reader.create_book(paragraphs_from, paragraphs_to, meta, output_path = f"lingtrain.html", template="custom", styles=my_style)


Заключение


В голове есть еще много идей по доработкам и дополнительным фишкам. Например, можно сделать мультиязычные книги, можно доставать из текста ключевые предложения и искать по ним картинки (или генерировать нейросетями), можно делать пословное выравнивание и много чего еще. Пока же хочется поделиться промежуточным результатом с сообществом и выслушать ваше мнение.


Поддержать проект можно на Patreon'e.


Ссылки


[1] Код lingtrain-aligner на github.


[2] Выровнять тексты в Google Colab.


[3] Sentence Transformers модели.


[4] Making Monolingual Sentence Embeddings Multilingual using Knowledge Distillation


[5] Language Agnostic BERT Sentence Encoder.

Подробнее..

Сам себе Гутенберг. Часть 2. Делаем многоязычные параллельные книги

02.06.2021 20:09:34 | Автор: admin

Lingtrain parallel books article cover


В прошлый раз мы с вами научились делать параллельные книги и сделали русско-английский вариант отрывка романа Харпер Ли "Убить пересмешника". Сегодня мы сделаем следующий шаг и создадим полноценную многоязычную книгу на восьми языках.


Напомню, что целью этого проекта является создание инструмента, который поможет людям, изучающим и преподающим иностранные языки, создавать учебные материалы и параллельные книги для улучшения навыков чтения. Глобальная проблема состоит в том, что трудно найти интересный для изучения материал с параллельным переводом, тогда как найти книгу в оригинале и ее русскую редакцию по отдельности гораздо проще.


Сначала сделаем семь книг


Проделаем все на примере романа Булгакова "Мастер и Маргарита", потому что он очень популярен в мире и был переведен на множество языков. Я нашел его версии на английском и немецком (германские языки); белорусском, чешском и украинском (славянские языки); а также на венгерском и китайском языках. Все семь текстов мы выровняем с русским оригиналом, получим семь книг. Затем выровняем их между собой и получим возможность выбирать любые комбинации языков для своей книги в любом порядке. Полные версии книг можно будет скачать в формате pdf в конце статьи.


Начнем с пары венгерский-русский.


hungarian


Шаг 1. Подготовка текстов


Кратко напомню основные правила подготовки текстов (подробнее смотрите в первой статье, ссылку найдете ниже).


Правила


  1. Удалить заведомо лишние строки (информацию об издателе, посвящение, номера страниц, примечания).
  2. Проставить метки для автора и названия.
  3. Проставить метки для заголовков (H1 самый большой, H5 самый маленький), количество заголовков в текстах должно быть одинаковым.
  4. Убедиться, что в тексте нет строк, которые кончаются точкой и при этом не являются концом абзаца (иначе целый абзац разобьется в этом месте на два).

Четвертое правило можно соблюсти для одного текста, так как при создании книги можно будет выбрать на основе какого из них брать информацию о разбиении на абзацы. В нашем случае возьмем русский, потому что мы будем выравнивать все остальные тексты к нему. К тому же для найденного мной оригинального текста это правило уже соблюдено.


Метки


Язык разметки представляет из себя набор меток, которые ставятся в конце предложения:


Метка Значение Установка
%%%%%title. Название произведения Вручную
%%%%%author. Автор Вручную
%%%%%h1. %%%%%h2. %%%%%h3. %%%%%h4. %%%%%h5. Заголовки Вручную
%%%%%divider. Разделитель Вручную
%%%%%. Новый абзац Автоматически

Благодаря меткам мы извлечем из сырого текста данные о названии произведения, его авторе, названии и местонахождении глав. Это понадобится нам при создании книги.


Текст


В результате должны получиться тексты, похожие на следующие:


Мастер и Маргарита%%%%%title.М.А. Булгаков%%%%%author.ЧАСТЬ ПЕРВАЯ%%%%%h1.Глава 1%%%%%h2.Никогда не разговаривайте с неизвестными%%%%%h2.Однажды весною, в час небывало жаркого заката, в Москве, на Патриарших прудах, появились два гражданина. Первый из них, одетый в летнюю серенькую пару, был маленького роста, упитан, лыс, свою приличную шляпу пирожком нес в руке, а на хорошо выбритом лице его помещались сверхъестественных размеров очки в черной роговой оправе. Второй  плечистый, рыжеватый, вихрастый молодой человек в заломленной на затылок клетчатой кепке  был в ковбойке, жеваных белых брюках и в черных тапочках.   ...



MIHAIL BULGAKOV%%%%%author.A MESTER S MARGARITA%%%%%title.ELS KNYV%%%%%h1.ELS FEJEZET%%%%%h2.Ne lljunk szba ismeretlenekkel%%%%%h2.Egy meleg tavaszi estn, az alkonyat rjban, a Patriarsije Prudin kt frfijelent meg. Az egyik negyvenves forma, kvrks, alacsony, kopasz feketeemberke, szrke nyri ltnyt viselt, elegns kalapjt kezben tartotta, gondosanborotvlt arct istentelen nagy mret, fekete csontkeretes ppaszem kestette.Trsa jval fiatalabb s vllasabb volt nla, borzas hajn tarkjig htratolt kockssapka; ltzke kocks sportingbl, gyrtt fehr nadrgbl, fekete szandlblllt....

Количество меток одного типа должно быть одинаковым среди всех текстов. Иначе где-то будет номер и название главы, а где-то нет. После того как мы приготовили тексты, переходим к выравниванию.


Шаг 2. Выравнивание


Как и в прошлый раз, выравнивать будем библиотекой lingtrain-aligner. Код открыт, так что приглашаю в репозиторий.


Попробовать в Colab


Чтобы попробовать выровнять свои тексты без написания кода используйте вот этот Colab блокнот, который мы использовали в прошлый раз. В нем есть инструкции и некоторые комментарии к процессу. В конце можно будет скачать получившуюся двуязычную параллельную книгу как html страничку.


Попробовать локально


pip install lingtrain-aligner

Сначала немного служебного кода:


# Импортируем необходимые модулиfrom lingtrain_aligner import preprocessor, splitter, aligner, resolver, reader, vis_helper# Подготовленные тексты для выравниванияtext1_input = "master_hu.txt"text2_input = "master_ru.txt"with open(text1_input, "r", encoding="utf8") as input1:text1 = input1.readlines()with open(text2_input, "r", encoding="utf8") as input2:text2 = input2.readlines()# Путь до самого главного файла, в котором будет содержаться вся информация о выравниванииdb_path = "master_hu.db"# Определим языки (важно для разбиения на предложения)lang_from = "hu"lang_to = "ru"# Выберем модельmodels = ["sentence_transformer_multilingual", "sentence_transformer_multilingual_labse"]model_name = models[0]# Добавим метки абзацевtext1_prepared = preprocessor.mark_paragraphs(lines1_prepared)text2_prepared = preprocessor.mark_paragraphs(lines2_prepared)# Разобьем тексты на строкиsplitted_from = splitter.split_by_sentences_wrapper(lines1_prepared, lang_from, leave_marks=True)splitted_to = splitter.split_by_sentences_wrapper(lines2_prepared, lang_to, leave_marks=True)

Итого у нас получилось 9460 предложений на венгерском и 8996 предложений на русском. Их-то мы и хотим сопоставить друг другу таким образом, чтобы ничего не потерялось.


Создадим файл для выравнивания. Это SQLite база данных, которую мы заполним входными данными, для дальнейшей обработки.


aligner.fill_db(db_path, lang_from, lang_to, splitted_from, splitted_to)

Чтобы выровнять первую тысячу строк, выполним следующую команду:


batch_ids = range(10)aligner.align_db(db_path,                 model_name,                 batch_size=100,                 window=60,                 batch_ids=batch_ids,                 save_pic=False,                embed_batch_size=25,                 normalize_embeddings=True,                 show_progress_bar=True                )

Произойдет следующее мы запустим процесс выравнивания (детали смотрите в предыдущей статье), для 10 отрезков (batch_ids их номера) по 100 предложений (параметр batch_size). Параметр window задает "перехлест" между этими кусками, чтобы наверняка захватить целевые предложения. В данном случае этот параметр довольно большой, потому что на протяжении всей книги наша "ось выравнивания" может довольно значительно отклоняться.


В качестве спойлера скажу, что для большинства языков в данном случае такие настройки подойдут для всей книги. Для некоторых же текстов отклонения будут слишком сильными и нужно будет либо делать окно очень большим (это приведет к большему количеству ошибок и отрицательно скажется на качестве), либо двигаться медленнее и использовать параметр shift (о нем ниже).


Визуализация


Теперь у нас есть возможность посмотреть на результат первичного выравнивания при помощи модуля vis_helper:


vis_helper.visualize_alignment_by_db(db_path,            output_path="alignment_vis.png",            batch_size=100,            size=(800,800),            lang_name_from=lang_from,            lang_name_to=lang_to,            batch_ids=batch_ids,            plt_show=True)

Lingtrain parallel books


В параметр batch_ids мы передали те же номера батчей, что и при выравнивании. Если не передавать ничего, то получим картинки для всех данных.


Мы видим, что модель справилась довольно неплохо. Главное здесь, чтобы "ось выравнивания" не вышла за пределы окна, иначе модель не получит на вход отрезок со всеми правильными вариантами.


Теперь необходимо поставить на место выбросы.


Разрешение конфликтов


Механим разрешения конфликтов заключен в модуле resolver. Подробнее о нем, опять же, смотрите в предыдущей статье. Скажу лишь, что он находит промежутки между удачными отрезками выравнивания, и пытается подобрать для этих промежутков подходящий вариант разрешения. Соответственно, параметрами мы можем задавать минимальную длину хорошей цепочки и максимальную длину для конфликта. На практике, хорошо работает такой подход трижды проходим по всему выравниванию с постепенным увеличением максимальной длины конфликта:


steps = 3batch_id = -1 #пройти по всем батчамfor i in range(steps):    # Найти конфликты    conflicts, rest = resolver.get_all_conflicts(db_path, min_chain_length=2+i, max_conflicts_len=6*(i+1), batch_id=batch_id)    # Показать какие конфликты найдены    resolver.get_statistics(conflicts)    resolver.get_statistics(rest)    # Разрешить конфликты    resolver.resolve_all_conflicts(db_path, conflicts, model_name, show_logs=False)    if len(rest) == 0:        break

В конце могут остаться единичные конфликты. Если такие есть, то добиваем их:


# Найти конфликтыconflicts, rest = resolver.get_all_conflicts(db_path, min_chain_length=2, max_conflicts_len=20, batch_id=-1)# Показать какие конфликты найденыresolver.get_statistics(conflicts)resolver.get_statistics(rest)# Разрешить конфликтыresolver.resolve_all_conflicts(db_path, conflicts, model_name, show_logs=False)# Визуализировать выравниваниеvis_helper.visualize_alignment_by_db(db_path,            output_path="alignment_vis.png",            batch_size=100,            size=(800,800),            lang_name_from=lang_from,            lang_name_to=lang_to,            batch_ids=batch_ids,            plt_show=False)

Lingtrain parallel books


Цикл


Мы выровняли часть книги. Для продолжения выполним те же дейсвтия, но с другими батчами. Возьмем следующие 4000 строк. Мы выравнивали 10 кусков по 100 предложений, поэтому выполним следующую команду:


batch_ids = range(10, 50)aligner.align_db(db_path, \                model_name, \                batch_size=100, \                window=60, \                batch_ids=batch_ids, \                save_pic=False,                embed_batch_size=25, \                normalize_embeddings=True, \                show_progress_bar=True                )

После выравнивания этого куска (это займет чуть больше времени, на моем компьютере это около пяти минут) переходим к разрешению конфликтов, как было описано выше. Затем дальше, задавая новый диапазон строк. Так как предложений на венгерском у нас 9460, а разбитие идет по первому из заданных текстов, то батчей по 100 предложений у нас будет 95 штук.


Если задать диапазон


batch_ids = range(50, 100)

то мы выровняем остаток (вторую половину) книги. После разрешения всех конфликтов у нас останется файл master_hu, содержащий в себе венгерско-русскую версию "Мастера и Маргариты".


Шаг 3. Создание двуязычной книги


Теперь, если мы воспользуемся модулем reader, то сможем сгенерировать русско-венгерскую редакцию книги:


from lingtrain_aligner import reader# Читаем из абзацы и метаданныеparagraphs_from, paragraphs_to, meta = reader.get_paragraphs(db_path, direction="from")# Создаем html с нашей книгойreader.create_book(paragraphs_from, paragraphs_to, meta, output_path = "lingtrain.html")

Параллельная книга на венгерском


Это обыкновенная html страничка со встроенными стилями. Для визуализации связей между предложениями можно задавать стили. Например, такой:


reader.create_book(paragraphs_from, paragraphs_to, meta, output_path = f"lingtrain.html", template="pastel_fill")

Параллельная книга на венгерском


Можно задавать свои стили, они будут применены к предложениям каждого абзаца циклически:


# Любые применимые к span'ам стилиmy_style = [    '{"background": "linear-gradient(90deg, #FDEB71 0px, #fff 150px)", "border-radius": "15px"}',    '{"background": "linear-gradient(90deg, #ABDCFF 0px, #fff 150px)", "border-radius": "15px"}',    '{"background": "linear-gradient(90deg, #FEB692 0px, #fff 150px)", "border-radius": "15px"}',    '{"background": "linear-gradient(90deg, #CE9FFC 0px, #fff 150px)", "border-radius": "15px"}',    '{"background": "linear-gradient(90deg, #81FBB8 0px, #fff 150px)", "border-radius": "15px"}'    ]reader.create_book(paragraphs_from, paragraphs_to, meta, output_path = f"lingtrain.html", template="custom", styles=my_style)

Параллельная книга на венгерском


Выравниваем остальные книги


Таким образом, повторяя третий шаг для остальных текстов, мы получим помимо файла master_hu.db остальные шесть. Отмечу некоторые трудности, с которыми я столкнулся (и, вероятно, столкнетесь вы, когда будете выравнивать свою книгу).


Большая разница в количестве предложений


В английской редакции большое количество предложений в диалогах было переведено как отдельные части, тогда как в оригинале это была прямая речь.


1.  Фу ты черт!  воскликнул редактор,  ты знаешь, Иван, у меня сейчас едва удар от жары не сделался!2. - Даже что-то вроде галлюцинации было,  он попытался усмехнуться, но в глазах его еще прыгала тревога, и руки дрожали.



1. 'Pah, the devil!' exclaimed the editor.2. 'You know, Ivan, I nearly had heat stroke just now!3. There was even something like a hallucination...'4. He attempted to smile, but alarm still jumped in his eyes and his hands trembled.

В итоге имеем 9707 предложений на английском против 8996 на русском. Это довольно большое различие, поэтому после первичного выравнивания с параметром window=100 получаем более 1000 конфликтов.


english1

К счастью, после разрешения конфликтов эти кусочки все равно склеятся обратно.


english2

Такая же ситуация с китайским языком, там в целом есть тенденция перевода более короткими предложениями чем в оригинале.


Выход за пределы окна


Упомяну польский текст, который тоже был найден, но не подошел по следующей причине. В польском тексте (8190 предложений) у нас слишком часто отсутствуют целые куски текста. Поток выравнивания получается местами обрывистым и окна в 100 уже не хватает, мы постоянно выходим за его пределы:


batch_ids = range(10,12)aligner.align_db(db_path, \                model_name, \                batch_size=200, \                window=100, \                batch_ids=batch_ids, \                save_pic=False,                embed_batch_size=25, \                normalize_embeddings=True, \                show_progress_bar=True                )

english1

english1

Дальнейшее расширение окна увеличит процент ошибок, поэтому мы перейдем в ручной режим и задействуем параметр shift. Этот параметр позволяет сдвигать поток второго текста при расчете батча:


batch_ids = range(10,12)aligner.align_db(db_path, \                model_name, \                batch_size=200, \                window=100, \                batch_ids=batch_ids, \                save_pic=False,                embed_batch_size=25, \                normalize_embeddings=True, \                show_progress_bar=True,                shift=-100 #сдвигаем русский текст                )

polish

polish

Плюсом такого подхода является то, что мы можем уменьшить окно, улучшив первоначальное качество. Минусом является большее количество итераций.


После разрешения конфликтов эти же куски выглядят так:


polish

polish

Отсутствие частей текста


Ручной режим не поможет нам восстановить разрывы, если в каком-то тексте нет соответствующего куска:


polish

polish

Разрешение таких конфликтов приведет к тому, что какому-то предложению станет соответствовать большой отрывок текста на другом языке. Если таких ситуаций одна-две на весь текст (так было с английским и белорусским текстами), то, в принципе, ничего страшного. В случае польского же отсутствовало более 20 отрывков, поэтому я решил его не добавлять.


Второй уровень выравнивания


К этому моменту мы получили семь файлов с выравниваниями master_*.
Их особенностью является то, что все они выровнены относительно одного языка (русского). Казалось бы, давайте просто возьмем абзацы и сходу получим необходимые локализации.


Делаем так и спустя несколько страниц получаем вот это:


second level

Дело в том, что в некоторых текстах (на рисунке это немецкий) одно предложение могло соответствовать двум русским. Если при этом русские предложения считались разными абзацами, то эти абзацы будут слиты в один. Поэтому в обычной двуязычной книжке все будет хорошо, но относительно друг друга структура абзацев у выравниваний будет отличаться. На помощь приходят метаданные, которые хранятся в базе (наши *.db файлы).


Метаданные


В метаданных хранится информация о том, какое предложение какому абзацу соответствует. Можно получить структуру абзацев для каждого текста в виде массива чисел, показывающих номер последнего предложения в абзаце.
Эти массивы можно слить в один по принципу объединения более мелких интервалов:


par_struct_1 = [2, 5, 6, 8, 10, 12, ...]par_struct_2 = [2, 6, 8, 10, 11, 12, ...]res = [2, 6, 8, 10, 12, ...]

Сгенерируем книгу на основе новой разбивки, получим следующий результат:


second level

Стало выглядеть лучше, теперь абзацы формируются относительно русского языка на единой основе.


Индекс


Абзацы починили, но обратим внимание на подсветку предложений и увидим, что во многих местах она разъехалась:


index

Причина этого в том, что разные тексты имеют разные тенденции по делению на предложения. Чтобы синхронизировать еще и их, придется немного повозиться со следующей сущностью, с индексом.


На архитектурном этапе я придумал хранить структуру выравнивания как индекс. После выравнивания он выглядит он так:


[    --первый батч    [        --первая пара предложений корпуса        [1, "[1,2]", 1, "[1]"],        --вторая и т.д.        [2, "[3]", 2, "[2]"],        [3, "[4,5]", 3, "[3]"],        [4, "[6]", 4, "[4,5,6]"],        ...    ],    --второй батч    [        [1, "[100]", 1, "[105]"],        ...    ],    ...]

В этом примере в первом элементе мы склеили два оригинальных предложения "левого" текста и сопоставили ему первое предложение "правого". Числа в кавычках ссылки на оригинальные предложения, вне кавычек ссылки на фактические данные, которые можно редактировать.


Такая структура дает много возможностей:


  • сохраняется информация о слиянии оригинальных строк
  • можно добавлять новые элементы в любое место без перезаписи идентификаторов фактических строк
  • можно удалять элементы из параллельного корпуса, удалив только из индекса
  • можно редактировать данные, не меняя оригинальные строки
  • можно пересчитывать отдельные батчи, не затрагивая остальные

Главное для нас здесь то, что из индекса мы можем вытащить структуру элемента корпуса относительно русского языка. Сопоставляя абзацы друг другу, мы опять будем сливать по минимальному принципу. В результате получим разбивку такого типа:


[[1], [2], [3]] -> [[1, 2, 3], [4], [5]] -> [[1], [2], [3]][[4]] -> [[6]] -> [[4]][[5]] -> [[7]] -> [[5, 6]]...

Здесь каждая строка это абзац на трех языках, каждый подмассив а абзаце это номера строк из целевого текста. Таким образом мы поделили каждый набор абзацев на одинаковое число соответствующих друг другу частей.


После исправлений


Посмотрим, как станет выглядеть подсветка теперь:


book

Так как мы объединяем структуру по минимальному принципу (в данном примере в китайском было меньше всего предложений на абзац), то подсветка стала ровнее, но беднее. Если убрать китайский, то она станет выглядеть так:


book

Шаг 4. Создание многоязычной книги


В большинстве случаев будет достаточно создания двуязычной параллельной книги и методов get_paragraphs() и create_book(). Но если вы дочитали до этого момента, то самое время попробовать сделать многоязычную книгу.


Логика по выравниванию абзацев для многоязычных книг содержится в методе get_paragraphs_polybook(), в который мы передадим все наши файлы. Так как при выравнивании система опирается на номера исходных строк, то в файлах не должно остаться конфликтов, иначе абзацы не будут сгенерированы. Проверить на отсутствие конфликтов можно таким кодом (как их разрешать вы уже знаете):


from lingtrain_aligner import resolverconflicts_to_solve, rest = resolver.get_all_conflicts(db_path, min_chain_length=2, max_conflicts_len=20, batch_id=-1)#перед генерацией не должно остаться никаких конфликтовresolver.get_statistics(conflicts_to_solve)resolver.get_statistics(rest)

Далее получим набор подготовленных текстов на всех нужных языках:


from lingtrain_aligner import readerdb_path1 = "db/master_de.db"db_path2 = "db/master_uk.db"db_path3 = "db/master_be.db"db_path4 = "db/master_zh.db"db_path5 = "db/master_cz.db"db_path6 = "db/master_en.db"db_path7 = "db/master_hu.db"paragraphs, metas = reader.get_paragraphs_polybook(                        db_paths=[db_path1, db_path2, db_path3, db_path4, db_path5, db_path6, db_path7])

Теперь самое интересное, мы можем выбрать нужные нам языки и создать нашу книжку. Можно, например, взять английский и немецкий, многие учат эти языки в паре.


reader.create_polybook(                lang_ordered=["en", "de", "ru"],                paragraphs = paragraphs,                delimeters = delimeters,                metas = metas,                output_path = "lingtrain_master.tml",                template="none")

book

Параметр lang_ordered задает набор и порядок языков.

Можно сделать белорусско-китайскую версию:


reader.create_polybook(                lang_ordered=["be", "zh"],                paragraphs = paragraphs,                delimeters = delimeters,                metas = metas,                output_path = "lingtrain_master.html",                template="none")

book

Можно, конечно, и всё взять:


reader.create_polybook(                lang_ordered = ["ru", "en", "de", "be", "uk", "cz", "hu", "zh"],                paragraphs = paragraphs,                delimeters = delimeters,                metas = metas,                output_path = "lingtrain_master_total.html",                template="none")

book

Лучше оставлять те выравнивания (*.db файлы), языки которых, вам нужны. Это позволит сохранить как можно больше информации об абзацах. Со стилями все как раньше, можете задавать template (сейчас есть "pastel_fill", "pastel_start"), можете придумывать свои, примеры есть выше и в блокноте на Colab. Если задать template="none", получится чистая книга.

Планы и поддержка


  • Дальше планируется поддержать fb2 формат для читалок и добавить подстрочный перевод. Также хочу расширить возможности разметки, добавить вставку картинок. Затем оформить это в виде веб-приложения, чтобы люди могли создавать книги без написания кода.


  • Скидывать тексты для тестирования и выравнивания, делиться предложениями и багами можно в канале http://t.me/lingtrain_books.


  • Подержать проект финансово можно переводом. Деньги пойдут на хостинг веб-приложения и ускорят его разработку.



Ссылки


Все упомянутые в статье ссылки:


[1] Первая часть статьи


[2] Код lingtrain-aligner на github


[3] Google Colab блокнот с выравниванием


[4] Кот Бегемот с обложки был найден здесь


[5] PDF. Семь параллельных книг "Мастер и Маргарита"


[6] Телеграм-группа


[7] Сбор средств на проект

Подробнее..

Как поддерживать максимальную эффективность без выгорания. Краткий конспект

16.05.2021 14:08:59 | Автор: admin

К данной книге я пришёл от джедайских техник и она является вторым источником, в котором я обнаружил понятие резервуара ментальных сил, который может быть исчерпан.

Оригинал состоит из 272 страниц, в которых приведены множества исследований, объяснений, историй и примеров того, что нужно делать, как это делать и почему.
Представляю вам всё самое важное, что, несомненно, должно помочь вам эффективно справляться с задачами.

Кое-что может быть для вас уже знакомым или даже банальным, а кое-что контринтуитивным.
Однако помните: знать и делать - кардинально разные понятия.

И если вы постепенно интегрируете хотя бы некоторые аспекты нижеизложенного в свою жизнь, то увидите положительные изменения.

Алгоритм максимальной эффективности

  1. Определить цель и конкретные задачи.

  2. Полное, совершенное погружение в работу с глубокой, устойчивой сфокусированностью и осознанностью. Чем больше осознанность, тем лучше.

  3. Период отдыха и восстановления, когда нужно вообще не думать о работе.

  4. Инсайт - появление моментов прозрения, новых идей и умственного прогресса.

Нагрузка + отдых = рост. Вот и вся формула успеха. При чём универсальная.Да, вот так всё просто.

Постановка целей

  • Определите свои ключевые ценности.

  • Персонализируйте свои ключевые ценности.

  • Ранжируйте свои ключевые ценности.

  • Запишите своё заявление о цели.

  • Используйте визуальные подсказки - повесьте цели на видное место.

  • Обдумывайте вашу цель перед сном. Можно на бумаге во всех деталях расписать свою жизнь, когда цель будет достигнута.

  • Подумайте о том, насколько ваша жизнь соответствует вашей цели, и что нужно сделать, чтобы стать к ней ближе.

  • Великие идеи рождаются в глубине души.

Используйте силу целеполагания

  • Ищите смысл в трансцендентности, то есть в том, что превосходит вас самих.

  • Понимание цели способствует упорству в её достижении.

  • Помните, что ваше эго, или я, или центральный управляющий, служит защитным механизмом, который удерживает вас от достижения истинных пределов. Когда вы сталкиваетесь с серьезными проблемами, ваше эго биологически запрограммировано остановить вас и велеть вам повернуть в другом направлении.

  • Сконцентрировавшись на трансцендентной цели, на задаче сделать что-то за пределами личных интересов (например, помощь другим), вы можете преодолеть свое эго и пробиться через практически любые ограничения и сделать гораздо больше, чем полагали возможным.

  • В данном контексте меньше думать о себе это лучший способ развить себя.

Лучше всего мы учимся, когда нам приходится реально стараться

  • Поэтому следует искать задачи, едва поддающиеся решению. Это те, которые находятся слегка за пределами имеющихся навыков и возможностей. Данная зона, как бы "за чертой" - и есть зона наилучшего обучения.

  • Сомнения и неуверенность по отношению к задаче - это даже полезно, ведь они выступают в качестве свидетельства возможности роста.

  • Если вы чувствуете, что всё под контролем, можно сделать следующее задание немного сложнее.

  • Если вы тревожитесь или так возбуждены, что не можете сосредоточиться, немного убавьте пыл.

Культивируйте мышление роста

  • От отношения зависит всё. Оно способно изменять даже гормональную реакцию нашего тела и личностные характеристики.

  • Чувство напряжение и стресса само по себе нейтрально. Именно наше отношение придаёт ему эмоциональный окрас и существенно сказывается на его влиянии на нас. К сожалению, мы привыкли воспринимать его болезненно.

  • Приучайте себя рассматривать стресс как продуктивное явление и даже приветствовать его. Вы будете работать лучше, и также укрепите здоровье.

  • В ситуациях, вызывающих напряжение, сотвори из стресса приятный мандраж. Просто сделай глубокий вдох и искренне скажи себе "Я в восторге". Используй нервное возбуждение и обостренное восприятие во благо.

  • Ощути предвкушение победы. Как ни странно, оно дарует больше мотивации, чем сама победа.

Глубоко фокусируйтесь и добивайтесь осознанного идеального исполнения, даже если это не всегда приятно

  • Осознанность заключается в том, чтобы полностью присутствовать в настоящем, до конца осознавая себя и происходящее вокруг. Осознанность также позволяет решить, как реагировать на стресс.

  • Уберите все, что вас отвлекает, например смартфоны. Помните: с глаз долой из сердца вон.

  • Делайте только одну вещь за раз. Наука доказала: многозадачность неэффективна.

  • Качество важнее количества.

Разбивайте работу на блоки

  • Разделите работу на спринты продолжительностью 50 минут и передышки по 10 минут. Мозг устаёт точно так же, как и мышца.

  • Во время отдыха мозг не перестаёт быть активным, просто включается другая система, за которую ответственно подсознание. Именно тогда активизируется магия творческих открытий и идей.

  • Когда утыкаетесь в тупик во время работы, значит самое время сделать перерыв.

  • Во время перерывов занимайтесь делами, которые почти не требуют или вообще не требуют концентрации:

    выйдите на короткую прогулку;
    посидите на природе;
    медитируйте;
    общайтесь с людьми;
    погладьте кота или партнёра;
    послушайте музыку;
    примите душ;
    помойте посуду.

  • Даже если никаких явных идей во время перерыва в голову не пришло, подсознание все равно заработало. Когда вы вернетесь к тому, чем занимались, вы, скорее всего, сможете преодолеть затруднение.

  • В случае действительно выматывающих задач подумайте о том, чтобы сделать паузу до утра.

  • Чем сложнее задача, тем дольше должен быть перерыв.

Отдыхайте правильно!

  • Медитация "дыхания". Сосредоточьтесь только на дыхании. Если задумываетесь о чем-то, отмечайте свои мысли, но отпускайте их. Снова сконцентрируйтесь на дыхании.

  • Регулярность важнее продолжительности. Лучше всего медитировать ежедневно, даже если это означает, что сессии будут короткими.

Используйте повышенную осознанность в повседневной жизни

  • Медитация помогает увеличить осознанность, с помощью которой можно направлять энергию стресса в правильном направлении.

  • Не боритесь с усталостью! Вместо этого используйте моменты, когда чувствуете утомление, для восстановления и выработки креативных идей, над которыми сможете поработать в следующий цикл высокой энергии и концентрации.

  • Выходные существуют не просто так. Вместо того, чтобы продолжить работу в свой выходной, гораздо эффективнее будет отдохнуть, чтобы с новыми силами ворваться в новую рабочую неделю.

  • Чем больше стресс, тем дольше вы должны отдыхать.

  • Отключитесь как физически, так и умственно, и занимайтесь делами, которые находите расслабляющими и восстанавливающими.

  • Усердный отдых порой может потребовать большего мужества, чем усердная работа.

  • Если ты откатился к старым привычкам, значит мозг устал и не может толком проявлять повышенный самоконтроль. Самоконтроль - тоже проявление ментальных сил.

  • Принятие решений тоже расходует мыслетопливо. Исключение ненужных решений и автоматизация простых действий способно повысить продуктивность.

Сон в приоритете

  • Сон продуктивное занятие.

  • 7-9 часов каждую ночь.

  • Убедитесь, что в течение дня находитесь под естественным, не электрическим светом. Это поможет вам поддерживать здоровый циркадный ритм.

  • Вместо того, чтобы перед сном смотреть в комп, телефон или телек, лучше почитай книгу, запиши что-нибудь или прогуляйся.

  • Когда чувствуете дремоту, не боритесь с ней. Что бы вы ни делали, это может подождать до утра.

  • Спальня должна быть как можно более темной. Если возможно, заведите светонепроницаемые жалюзи.

  • Дневной сон от 10 до 30 минут для восстановления энергии, концентрации и креативности очень полезен. Однако ни в коем случае не дольше, а то случится обратный эффект.

Подготовка к производительности

  • Создайте свой ритуал разогрева для важной деятельности.

  • Определите, какого именно состояния вы хотите добиться (острый ум, максимальная внимательность, быстрая сообразительность).

  • Разработайте последовательность действий, которая приведет ваше тело и разум в это состояние (зарядка, аффирмации, сытный завтрак, кофе, душ).

  • Будьте последовательны: используйте один и тот же ритуал каждый раз, когда занимаетесь деятельностью, с которой он связан.

Выбирайте свое окружение

  • Окружение имеет огромное влияние на нас.

  • Следует окружить себя предметами, которые побуждают желательные действия, а приводящие к нежелательным - убрать.

  • Делайте все возможное, чтобы стать частью среды, основанная на поддержке, дружбе, позитивной энергии, мотивации и вере в светлое будущее.

  • Помните, что, сохраняя положительный настрой и демонстрируя мотивацию, вы помогаете не только себе, но также всем окружающим.

  • Не поддавайтесь негативным эмоциям и пессимизму.

Помните, что цепь сильна настолько, насколько сильно ее самое слабое звено.

Помогайте другим, чтобы избегать выгорания

  • Найдите возможность в контексте вашей деятельности помогать другим. Речь может идти о более интенсивной работе, такой как тренировки или преподавание, или о менее сложной работе, например, о публикации профессиональных советов на онлайн-форумах.

  • Основные критерии: помощь другим должна быть тесно связана с вашей работой, помогать нужно, не рассчитывая получить что-то взамен.

  • Помощь другим отлично помогает предотвращать и исцелять выгорание.

Подробнее..

Как понять, что пришел переломный момент в бизнесе или карьере

23.04.2021 00:07:18 | Автор: admin

В начале карьеры у меня не было проблем c формированием плана развития. Я выбирал релевантные моим целям сертификации, анализировал список тем и вопросов, на основе которых составлял себе план. После получения бизнес образования EMBA, старый проверенный метод перестал работать.На смену пришел длинный список рекомендованной литературы.

Со временем я понял, что недостаточно бездумно "проглатывать" очередную книгу. В идеале - применять полученные знания. Еще лучше - резюмировать, полученный опыт. Так появились статьи на хабре по мотивам книг "Смерть от совещаний" и "Проект Феникс".

Что же делать с теми книгами, которые еще не успел применить? Появилась идея "закреплять" прочитанное в виде саммари основных идей книги. Я решил начать делиться такими саммари с вами. Буду рад, обратной связи и надеюсь, они будут вам полезны.

В этом посте я предлагаю вашему вниманию книгу Энди Гроува, CEO Intel, "Выживают только параноики".

Основная мысль книги: в бизнесе или в карьере рано или поздно наступает "переломный" момент. Если после его наступления не сможете измениться, то скорее всего это будет конец вашей компании и/или карьеры.

Энди Гроув описывает кризис в Intel, когда японские конкуренты "отжимали" у компании рынок. Трагичность ситуации в том, что руководители компании не замечают изменений первыми. Точнее сказать, они узнают о таких изменениях последними. Руководители не видят предвестников изменений. Их замечают люди на "передовой", но не всегда могут "достучаться" до руководителей.

Мои примеры: Японские производители техники и автомобилей "щемили" компании из штатов, Netflix "отжал" рынок у Blockbuster, Viber потеснил Skype, и вместе с другими мессенджерами они убили рынок международных звонков.

Если быть настороже и следить за триггерами изменений, то можно вовремя перестроиться и использовать грядущие изменения себе во благо. Для этого Гроув предлагает использовать технику шести сил и принцип десятикратного усиления.

Важно анализировать шесть сил или направлений:

  • Покупатели - те, для кого ваш продукт или услуга представляет ценность. Даже больше - они готовы за это платить;

  • Поставщики - те, без которых вы не можете производить свой продукт или услугу. Так, поставщиками онлайн кинотеатров будут правообладатели и интернет провайдеры;

  • Внутриотраслевая конкуренция - ваши прямые конкуренты. Они предоставляют аналогичный товар или услугу;

  • Новые конкуренты - тут рассматриваются потенциальные конкуренты, которые могут выйти на рынок. Так, благодаря современным технологиям фрилансер из любой страны может с минимальными затратами составить конкуренцию местным специалистам;

  • Товары-заменители - товары или услуги, которые помогают решить одну и ту же проблему потребителя, но по разному. Общественный транспорт является товаром заменителем для служб такси, а шаурма заменяет бизнес ланч в ресторане;

  • Сопряженные компании - те, кто помогают продавать товар. Их бизнес связан с вашим. Для продавца процессоров - производитель компьютеров.

Данный подход очень похож на 5 сил Портера, только в слегка расширенном виде и с фокусом на принцип десятикратного усиления. Попробуйте представить, что будет, если любой из факторов усилится на порядок:

  • У поставщиков появится другой, более выгодный рынок сбыта, и они пересмотрят цены для вас или не смогут обеспечить требуемый вами уровень сервиса;

  • Конкуренты станут и дешевле и лучше одновременно;

  • Покупатели потеряют интерес к вашему товару, потому что появится более интересный им товар-заменитель.

Мало осознать, что грядут изменения, нужно принять решение измениться. Тяжело что-то менять, пока текущая модель все еще приносит вам прибыль. С другой стороны, когда вас "уволит" клиент - будет уже поздно. Велик шанс потерять все, и тогда придется начинать все с нуля. В идеале, нужно меняться еще до того, как настанет "переломный" момент. Тогда старая бизнес модель будет топливом для новой. Чтобы принять непростое решение, попробуйте представить, что вы увольняетесь, а на ваше место приходит новый руководитель. Что бы он сделал?

Гроув описывает "переломный" момент как точка на графике роста вашей компании, в которой вторая производная меняет знак. Иначе говоря, момент, в который организация перестает расти и начинает деградировать.

Как можно понять, что скоро произойдет переломный момент?

Автор предлагает не ждать и налаживать информационные каналы, которые помогут выявить "триггеры" :

  • наладить поставку информации с "передовой" без искажений;

  • иметь в поле зрения компании-конкуренты;

  • отслеживать технологические изменения;

  • следить за изменениями поведения клиентов;

  • плотнее общаться с сопряженными компаниями.

В качестве заключения Энди Гроув предлагает сравнить себя и свою карьеру с компанией. Тут есть над чем задуматься.

Для себя я выбрал следующие информационные каналы:

  • прошу обратную связь у ребят, с которыми работаю;

  • составил к прочтению список автобиографий успешных руководителей;

  • подписался на рассылки открытых вакансий моего профиля, чтобы отслеживать востребованные технологии и бизнес-домены;

  • вступил в сообщество руководителей для обмена опытом.

Какие информационные каналы используете вы?

Подробнее..

Курсы и книги для изучения data science c нуля

05.02.2021 20:16:55 | Автор: admin

В статье привожу курсы и книги, которые мне кажутся наиболее оптимальными для изучения машинного обучения/data science c нуля. Стараюсь привести список, который будет наиболее кратким и одновременно даст все знания, необходимые для начала работы на практике, без серьезных пробелов в знаниях.

Disclaimer

Понять исходя из чего составлены данные рекомендации можно прочитав предыдущие статьи, в которых описаны мой путь и принципы самообучения, а также общие соображения о том, как выстраивать этапы обучения:

Предыдущие статьи

Рекомендации данной статьи будут устаревать, и наверняка, и сейчас существуют отличные курсы и книги, которые могли бы в него входить. Но это, как минимум, одни из лучших материалов по своим темам. Для подготовки данного списка были отброшены десятки курсов и книг, которые тоже нацелены на обучение с нуля, но хуже излагают фундаментельные концепции.

Рекомендации покрывают не все потенциально необходимые технические навыки. Чтобы составить представление обо всём, что скорее всего будет необходимо освоить - см. Изучение data science c нуля: этапы и вехи

Не привожу материалов о нейронных сетях потому что, в большинстве случаев, считаю неэффективным начинать изучение с них, или изучать их на ранних этапах самообучения.

Необходимые базовые навыки

Знание основ программирования: Python и SQL

Невозможно заниматься машинным обучением или data science не владея программированием в Python или R (Начинать лучше с Python). Также, подавляющее большинство вакансий в "классическом" машинном обучении (решение бизнес-задач, и работа с изначально числовыми/статистическими данными) потребует знание SQL. Базовые рекомендации по их изучению есть в статье Самообучение в Data science, с нуля до Senior за два года.

Математика

Также невозможно стать хорошим специалистом без достаточного уровня математики. Но, мне кажется, эффективнее изучать математику постепенно, предварительно знакомясь с теми целями в которых она применяется.

Тем не менее, есть определенный минимально-необходимый базовый уровень: понимание производных (школьная программа алгебры), понимание градиентного спуска (градиент, обычно, объясняют в начальных курсах математического анализа в университете, и объяснение есть также в курсах о машинном обучении), знания основ дискретной математики, теории вероятностей и статистики.

Основы теории вероятностей неплохо объяснены в специализации: Математика для анализа данных. Необходимый минимум теории вероятностей дан в последнем курсе специализации, который не требует знаний из 2 и 3 курсов. Курсы 2 и 3 дают знания, полезные для понимания градиентного спуска и для изучения нейронных сетей и некоторых других методов машинного обучения. По указанным темам мне очень нравится англоязычная специализация Math for machine learning, от London Imperial College.

Если у вас проблемы с пониманием производных и пределов (школьная программа, самые продвинутые её темы), то, если понимаете английский: крайне рекомендую все курсы от Robert Ghrist. Более интуитивное и наглядное объяснение математики я вообще не встречал. На русском поищите курсы на coursera.org, также неплохие бесплатные курсы по математике есть на stepik.org

Начальный уровень

Книги и статьи, рекомендуемый минимум

Datasmart (на русском) - отличный набор примеров применения популярных методов машинного обучения. Книга хороша тем, что даёт общее представление о сфере data science. По рекомендации друга, я начал изучение сферы машинного дата сайенс именно с этой книги, и считаю это лучшим вариантом для знакомства с областью и возможностями применения данных знаний. Для получения необходимого практического опыта, после знакомства с python, pandas, scikit-learn - полезно примеры из этой книги проделать с помощью этих инструментов (кроме примеров на базе линейного программирования, т.к. оно требует других инструментов и намного реже бывает необходимо).

Статьи на Хабре из курса от сообщества Open Data Science (ODS):

Данные статьи и курс дают отличные базовые знания и навыки для изучения основ машинного обучения. Также в статьях дан хороший список дополнительных материалов. По данным статьям существуют также лекции (лекции я не смотрел, т.к. статьи, субъективно, намного эффективнее). Для меня данные материалы стали отличным дополнение к он-лайн курсу Воронцова (ниже). Освоив курс и данные статьи долгое время мне хватало только отработки навыков применения данных методов, не изучая ничего сверх них.

В этих статьях тему 8 можно смело пропустить, по теме 2 больше смотрите на seaborn и имейте в виде что синтаксис команд данных библиотек уже устарел (полезно научиться пользоваться официальной документацией, чтобы понять как такие вещи делать на практике).

Дополнительные источники

Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking, by Foster Provost (тут можно скачать) - возможно, лучший обзор всех базовых принципов применения машинного обучения, в виде книги. Отличо дополнит книгу Datasmart, в этом плане. В курсе Воронцова "Введение в машинное обучение" (ниже) также раскрывается большинство тем из этой книги. Я её читал отрывками, как дополнение к этому курсу..

Машинное обучение, Флах - мне показалось хорошим изложением всех методов и их деталей, удобным как дополнение/расширение материалов он-лайн курсов. Как самостоятельное учебное пособие наверное книга будет суховатой.

Отмечу, все книги, написанные на английском, я изначально читал в оригинале. Не могу ручаться за качество перевода. И настоятельно рекомендую попробовать их осилить в оригинале, т.к. это даст необходимый уровень знаний языка, для чтение документации к программным библиотекам, которые придется использовать для использования данных методов. Подобная документация на русский вообще не переводится. Подобный базовый уровень получить легче, чем кажется.

Курсы

Необходимый минимум

"Введение в машинное обучение" от Воронцова - покрывает все базовые методы машинного обучения, и необходимые базовые концепции. Знания и умения применять все представленные методы будет достаточно для выполнения львиной части бизнес-задач, связанных с машинным обучением. Другие курсы начального уровня по машинному обучению можно не смотреть, если вы полностью освоите данный курс. Но после прохождения данного курса явно возникнет потребность отточить навыки Python, Pandas, scikit-learn.

Важно понимать в каких рамках можно доверять прогнозам, полученным разными моделями.Важно понимать в каких рамках можно доверять прогнозам, полученным разными моделями.

Помимо знакомства с теорией методов - необходимо будет научиться применять их на практике, с помощью Python. Для этого можно использовать курсы из специализации Applied DS with Python (эффективными мне кажутся курсы 1 и 3. По темам курсов 2, 4 мне попадались источники лучше)

Альтернативные курсы

Возможно, курс Воронцова потребует сразу слишком много базовых или дополнительных знаний (умения работать с jupyter, pandas). В этом случае, возможно, проще будет сначала пройти следующую комбинацию курсов. Также, в чём-то специализация от Яндекса будет подробнее.

https://stepik.org/course/4852/syllabus

Специализация от Яндекс Машинное обучение и анализ данных (Если записываться на отдельные курсы и в последней форме при записи выбрать вариант "только аудит" то все занятия можно просмотреть бесплатно). В 3 курсе специализации,на первом этапе, можно осваивать только 1 неделю, о кластеризации. Остальные темы сложнее, и могут не пригодиться в первое время; можно просмотреть наискосок. Весь 4 курс, по началу погружения в специалиность, рекомендую просмотреть, чтобы было общее представление, но не обязательно досконально разбираться.. Эти вещи легко забываются, и не всем встречаются на пратике.

Отработка базовых навыков

Kaggle полезен сразу несколькии вещами: можно посмотреть разные реальные (и не очень) задачи, решаемые с помощью машинного обучения, и изучить пути решения, которые применяют другие спецалисты (и на этом сайте соревнуются в своих навыках в т.ч. топовые специалисты мировго уровня). У них также есть хорошие бесплатные мини-курсы по разным темам, в рамках которых, в том числе, можно отработать навыки на тестовых задачах.

Обязательно следует ознакомиться с документацией

scikit-learn - официальное руководство пользователя по самой популярной и классической библиотеке методов машинного обучения отлично демонстрирует как с её помощью решать разные задачи. По ней также можно изучать разные методы, т.к. их самая суть в ней неплохо изложена.

pandas, официальная документация - данная библиотека будет вашим основным рабочим инструментов, и документация к ней очень хорошо написана. Функционала в ней намного больше, чем даётся в вводных курсах. Поэтому, имеет смысл ознакомиться с ней по документации.

Python и python standard library - необходимо уметь пользоваться официальной онлайн документацией для нахождения нужных библиотек. функций и методов, необходимых при решении задач. Например, уже на самых ранних этапах вы вероятно встретитись с библиотеками collections и itertools

Следующий шаг - полировка и углубление знаний

В машинном обучении половина успеха заключается в правильной подготовке данных для алгоритом и правильном формулировании решаемой задачи (целевой функции). Также важно научиться проходить все шаги построения моделей машинного обучения в наиболее оптимальной последовательности. Все данные темы отлично раскрыты в курсе, записанными русскими ребятами, но на английском языке: https://www.coursera.org/learn/competitive-data-science. Не стоит обращать внимание на kaggle - приведенные методы актуальны для реальных задач. Пройдя этот курс вы сможете понять комикс ниже

В статьях сообщества ODS (см.выше) дано множество ссылок на дополнительные источники. Рекомендую с ними ознакомиться. Также, через сайт сообщества можно найти видеозаписи многих семинаров, в которых также иногда рассматриваются очень полезные и фундаментальные темы. Например, мне были полезны все выстпления от основателя сообщества, Алексея Натенкина (прогнозирование временных рядов, еще пример)

Разные смежные концепции, которые необходимо знать

Нужно четко понимать разницу между корреляцией и причино-следственной связью. Не понимая этого - нельзя работать дата-сайентистом.

С большой долей вероятности, если вы будете делать какой-нибудь сравнительный анализ различных групп (рекламных компаний, поведения людей и т.п.) вам придется столкнуться с парадоксом Симпсона (отличное видео). Важно отточить его понимание, т.к. от его последствий необходимо защищася, и даже зная о нём, я не всегда осозновал что встречаюсь с ним в практике.

Также, с точки зрения постановки целей - поведение людей часто оказывается искажено, о чём рассказывает Goodhart's law. Знание данного эффекта может подсказать направления анализа разных явлений.

Другие полезные книги/ материалы

Куча англоязычных статей по использованию разных библиотеке, в основном очень начального уровня, регулярно публикуется на сайте https://towardsdatascience.com; до 3 статей в месяц можно читать бесплатно.

Statistics Done Wrong .The woefully complete guide byAlex Reinhart - отличная иллюстрация того как не стоит применять математические методы проверки гипотез. Автор рассказывает как даже профессиональные учёные всё время ошибаются в их использовании.

Python Machine Learning, by Sebastian Raschka - хороший набор разных кусков кода, которые могут помочь на начальном этапе. Также у этого автора хорошие статьи по разным темам.

Как находить другие хорошие книги и курсы, отбирать лучшие и наиболее подходящие - писал в предыдущих статьях.

Необходимые технические знания

Git необходимо выучить чтобы работать над каким-либо кодом совместном с другими людьми. Замечательно простая и бесплатня книжка на английском - Ry's Git tutorial. Также много книг доступно бесплатно на официальном сайте git. Отличное визуальное объяснение разных концепций: http://ndpsoftware.com/git-cheatsheet.html

https://www.practicaldatascience.org/ - хороший набор материалов по разным библиотекам и дополнительным инструментам. Фактически, даётся исчерпывающий перечень тем, которые придётся освоить для работы в дата саенс, с вводными материалами по всем темам (секцию Cloud точо стоит читать наискосок, т.к. тут с большой вероятностью придется работать с подобными технологиями других вендоров, которые имеют отличия).


Что я упустил?

Список выше является намеренно максимально кратким. Но, возможно, по каким-то важным темам я не предложил вообще материал, а по каким-то вы знаете курсы/книги, которые, на ваш взгляд, или лучше указанных, или их отлично дополняют - пожалуйста, пишите в комментариях. Как-нибудь изучу эти варианты и обновлю статью.

Готов ответить на индивидуальные вопросы / стать ментором

Посчитав, что мой опыт самообучения и быстрый рост доказывают эффективность отобранных мной подходов, книг и курсов, я решил заняться менторством.

Если у вас есть индивидуальные вопросы, на которые не отвечают мои статьи -пишите на почту self.development.mentor в gmail.com, Олег

Некоторые поняли, что им лучше уйти в другую сферу (программирование, биг дата), некоторым смог скорректировать учебный/карьерный план под индивидуальные потребности, некоторым я посоветовал тех, кто им сможет лучше помочь, а кого-то спас (?) от неэффективной траты времени на тупикове проекты.

И если мои статьи для вас полезны - на будущие статьи меня также можно мотивировать материально, под этой статьей должна быть кнопка "задонатить" для этих целей.

Подробнее..

Как айтишнику издать свою книгу. Часть 2 Самиздат сколько стоит свобода

13.06.2021 16:20:24 | Автор: admin

Если у вас появился набор материалов, мыслей и идей, которыми вы хотели бы благовоспитанно поделиться с окружающими и не забивать себе голову версткойсайта, подписчиками или продвижением ссылок, пожалуй, книга все еще остается хорошим примером их упорядоченного и законченного оформления.

Сегодня поговоримоб основных этапах размещения в сети, работе площадок самиздата, денежных и временных затраты насоздание электронной и печатной книги своим ходом без традиционных издательств.

Для тех, кто хочет узнать, что сейчас творится в книжном делепрошу во вторую из серии статей о выпуске книги.

Первая часть о выборе между традиционнымиздательствоми площадками самиздата, плюсах/минусах и личном опыте в посте: Как айтишнику издать свою книгу.Часть 1: куда податься.

Подробнее о книге, выпуск которой послужил источником данного материала, в посте.

А теперь к делу.

Основной набор действий посозданию книги примерно одинаков, что в классических издательствах, что на площадках самиздата или в ином аналогичном свободном плаванье.

Краткое флоу, как сделать книгу в самиздате (на примереRidero, выбранном по описанным в предыдущей статье плюсам/минусам):

О каждом шаге в деталях:

Загрузка

Ресурсозатратностьзависит от выбранной площадки. НаРидероможно загрузить свою книгу как файл(DOC, DOCX, TXT, RTF и ODT; в т.ч. с иллюстрациями, до 40Mb), импортировать изGoоgleDocsили даже получить тексты по ссылке изBlogger, LiveJournal,Стихи.ру,Проза.руи ряда других онлайн-ресурсов. Для любителей экстримаможно набирать онлайн в ихсобственном редакторе. На практике проблем с импортом .docxне возникло.

Литрес: Самиздат поддерживает загрузку файлов DOCX и FB2, до 70Mb. Выдвигает при этом жесткие требования к оформлению файлов: структура, переносы и символы концов абзацев, настройки форматирования в Microsoft Word,...многостраничная инструкция прилагается. Просто так скормить имевшийся .docx-файл книги не удалось.

Если планируется печатная версия, альтернативный онлайн-самиздатамвариантобратиться в типографии. Многие из них предоставляют базовые услуги по верстке, оформлению обложек, корректуре. На входе от вас здесь также ожидают наследие форматов MS Word.

Редактура

Призвана сделать слог гармоничнее, текст без речевых ошибок, стилистику автора усилить, предложения переформулироватьв целом, предполагает более серьезные вмешательства, чем правки запятых и орфографии. Пунктуация и прочие школьные правила выправляются позже корректором. Услуги же редактора гораздо дороже,варьируютсяот жанров и предполагают его экспертизу в данной литературной области. Поскольку мне было важносохранить свой авторский стиль, и были небезосновательные опасения станет хужеданный этап мною был опущен. В противном случае, при ценахРидеров 3 800 5000 руб. за 1 авторский лист (40 000 знаков с пробелами), редактура моей книги обошлась бы мне в 38 000 50 000 руб.

Корректура

Субъективно, единственныйнеисключаемыйшаг перед любым обнародованием текста: что с заделом на печатную версию, что для выпуска только электронной книги. Подразумевает проверку на орфографию, пунктуацию, грамматику и опечатки. И хотя я сама при написании не пренебрегала исправлениями от GoogleDocs, уповала на 5-ку по русскому с набором прочно усвоенных правил, а также несколько раз внимательно читала текст постфактумна каждой странице нашлось, что поправить, а то и не раз. Об этом догадываются и площадки самиздата, а поскольку вычитка все еще делается не нейронными сетями, а реальными людьмиудовольствие недешевое. Цена за 1 авторский листварьируется от 990руб.вЛитРес: Самиздате до1300руб. вРидеро. В типографиях или фрилансе можно поискать дешевле, держа в голове поправку на качество.

Мне корректура книги объемом 10а.л. (немного выше среднего в своем жанре нон-фикшена) обошлась на тот момент в 11 000руб. дорожепечати небольшого тиража в 35 экз.

ВРидероправки предлагают внести либо на их сайте в онлайн-редакторе текста загруженной книги, но в нем вы не увидитеdiff, либо, если хотите отсмотреть правки,могут сделать в .docx. Затем в режиме рецензирования через MS Word или GoogleDocsможно принять/отклонить предложенные изменения.

Соответственно, загружать на сервис придется заново. Увлекаться оформлением книги докорректурыне стоитверстать текстовый блок и заполнять данные мне пришлось сначала.

Вычитка заняла 11 дней. Общий срок вРидеробыл заявлен до 16 дней.

Сложные тексты рекомендуют вычитывать хотя бы 2 раза. То есть время-деньги повторить.

Отступление: RIP ё

Корректура убрала все старательно расставленные мною буквы ё, заменив их на е. Изсоображений поддержки меньшинств, незамедлительно обеспокоившисьеЁсудьбой у саппорта, выяснила, чтосогласносовременным нормам употребления писать ё следует:

  • когда нужно предупредить неверное прочтение (узнаём -> узнаем,совершённый ->совершенный);

  • для указания произношения малоизвестных слов;

  • в учебниках по русскому языку, букварях и ряде спец. литературы.

В остальных случаях рекомендуется писать е.

Дизайн обложки

Можно сделать самому за бесплатно из готовых шаблонов площадок самиздата, можно загрузить свою картинку на переднюю сторону, можно заказать отрисовку всей обложки у художника.

Первый вариант с шаблонами отпадал ввиду своей невзрачности. Продающая обложкаполовина успеха. Да и в голове давносозрел образ желаемой картинки. Здесь начались сложности. Если вы хотите (а я хотела) оформить дизайн и задней частито есть разместить на ней что-то вместо текста аннотации от сервисанайти художника и подружить его результат с площадкой самиздата выглядело проблематично.

Во-первых, художник должен уметь рисовать обложки книг и разбираться в типографии. Форматах, размерах, цветах. Тот же корешок книги должен быть высчитан с учетом числа листов, плотности бумаги, типа крепления.

Во-вторых, сервис не позволяет загрузить заднюю часть обложки самому.

Помучившись с поиском на фрилансе художника, разбирающегося в книгах, владеющего требуемой мне стилистикой или хотя бы нормальным вкусомсдалась в пользу завышенных ценсамиздатнойплощадки.

Цены от 2900 руб. за оформить вариант с имеющейсяу автора картинкой до 13 900 руб. за детализированную отрисовку уникальной картинки с 4+ персонажами. Мне обошлось в 9 550руб., за несложный сюжет по жесткому ТЗ, включая корректорскую вычитку текстов обложки. Но понравилось.

ТЗ лицевой части, картинки для оборотной стороны и результатТЗ лицевой части, картинки для оборотной стороны и результат

Отрисовали с момента взятия в работу за 6 дней с учетом пары возвратов на доработки. Однако с даты самого заказа, включающего и вычитку текстов обложки, прошел месяц. На сайте автору задник посмотреть нельзя, прикрепляли они сами, видна только магическая надпись не печатать. Трогать которую было нельзя, потому что это гвоздь в полу от люстрысоседей.В общем, в этой части было очень сыро.

Верстка

Как верстальщикфронтендерверстала сама в онлайн редактореRidero. Есть готовые довольно сбалансированные стили: наборы шрифтов и размеров. В основном время уходит на их выбор, корректную разбивку структуры, применение стилейзаголовкови удаление лишних отступов. А ещеборьбу с несовершенствамимира.

Например, их онлайн редактор услужливо и автоматически добавлял пробелы после каждой точки.Соответственно, упомянутые в текста места работы с названиями продуктов видаЯндекс.Формы,безапелляционно разбавлялись пробелом. Пришлось руками заменять точки на Юникод-спецсимвол, который выглядит как точка, но той самой точкой дляавтоформатане является.

В копилку магии онлайн редактораRidero(а может и корректуры) пропали пустые скобки у методаtoString().

Скачивание электронной книги

Если до текущего момента был шанс попользоваться площадкой бесплатно, то при попытке получить сверстанную книгу, ждал грамотно подготовленный сюрприз. Скачивание ссохранением верстки в PDF 250руб. за раз, то же для MOBI и FB2. Либо 700 руб. за все. Поправил опечаткуплати еще раз. Либо оформляй подписку 1000-1500 руб./мес. забезлимит. Бесплатно доступен EPUB, но им (и самостоятельными конвертациями в FB2 и MOBI) можно обойтись, если версия с версткой вам не важна.

Опять же автоматизации хромала: из-засобственной обложки и волшебныхкостылейсервиса в PDF последней страницей скачивался служебный задник с той самой загадочной надписью не печатать.

Печать тиража

Стоимость экземпляра зависит от количества в тираже, большедешевле каждый, от числа страниц и параметров печати. На площадках самиздата все красивокалькуляторы, настройки типа обложки, формата. В обычных типографиях возможностей (форматов, типов тиснений, ламинирования и прочих вариаций) гораздо больше. Меня вполне устраивали предлагаемые вRideroмягкая обложка с матовойламинациейи черно-белый текстовый блок с креплением клеем. Пробный тираж в 30 экз. обошелся в 8 334 руб. Шитый блокдороже, твердая обложкаеще дороже. К слову, по запросу в поддержкуRideroбыли готовы декорировать обложку тиснением или выборочным лаком, что на сайте явно не предлагается, но и порядок цен становился уже другим.

И в целом, несмотря на удобный интерфейс онлайн-самиздата и массу услуг, автоматизации в этой сфере еще есть куда растимногое приходилось решать руками через поддержку иemail-переписками. Плюс, что время ответа и решения любого вопроса было от моментального до 1 дня.

За наличие мата обязательным при печати на задник добавлялся шильдик о нецензурной брани, которыйсогласно правилам маркировки обложек должен занимать не менее 5% ее площади.

От заказа услуги до коробки с тиражом в руках прошло 19 дней. Непосредственно исполнение без доставки заявлено в 5 рабочих дней.

Качество приятное, но не идентичноес последующими тиражами несколько расходилось по цветопередаче и, казалось, по плотности бумаги.

Размещение в онлайн-магазинах

Жирный плюс площадок самиздатавозможность одной кнопкой отправить свою книгу вЛитРес,Ozon, Amazon,AliExpress,Bookmateили другие партнерские магазины.Не нужно разбираться с тонкостями выкладки на каждый сервис. На Amazon, например, нужно конвертировать книгу их инструментами в спец. формат.

О минусах: отсутствии детальной настройки под каждую платформу и непрозрачной статистике, писала ранее.

К плюсам:
+ агрегация прибыли в одном месте. На каждом сервисе есть минимальная сумма вывода в 1000-3000 руб., которую вы можете и не достичь при скромных продажах. Накопить на вывод вRidero, где суммируются доходы от всех площадок, проще.
+ уплата налогов.

Т.к. по закону в РФдоходы от профессиональной писательской деятельности подлежат налогообложению, приразмещениив магазинах самому или через сервисы самиздата важно обращать внимание, являются ли они налоговым агентом. Например,Rideroявлялся, уЛитРес: Самиздата налоги автор выплачивает самостоятельно. Есть возможность оформить налоговый вычет в 20% засоздание произведений литературы.

В ряде магазинов (Ozon,AliExpress,MyShop) поддерживается печать по требованиют.е. можно продавать свою книгу и в бумаге. Площадка самиздата распечатает ее только при оформлении покупки.

Можно установить отдельные цены для электронной и печатных версий. Итоговая цена рассчитывается автоматически исходя из желаемого и явно выставляемого роялти.

Раскатку до магазинов любой правки/опечатки в описании книги черезRideroпридется ждать пару месяцев или платить для ускорения.

Сетевые книжные и офлайн

Для простого автора самиздата здесь выглядит всебесперспективноили разорительно. Книжные не стремятсясотрудничать с подобными писателями.Rideroпредлагает включить вашу книгу в списки, предоставляемые магазинам. Заинтересует закажут. Попробовала, включила. Результат: ожидаемая тишина.

За 90 000 руб. можно заказать размещение на 1 мес. книги в 10 московских магазинах, лицевой выкладкой на полке. За 145 000 руб. есть возможность выбрать размещение в других городах и уже на 2 мес. А за 310 000 руб. книга может полежать 2мес., выложенной на кубе в тематическом отделе нескольких магазинов (не в каждом из сети).

Можно даже заказать выкладку брошюр с фрагментом книги в аэропорты. Всего 115 000 125 руб. за 1 мес. В зависимости от зала и числаэкземпляров.

Денежные и временные затраты на выпуск книгиДенежные и временные затраты на выпуск книги

Дополнительные мероприятия

Перевод книги на английский

Айтишнымкнигам не так просто захватить мир, будучи написанными на русском.

На площадкеRideroсейчас стоимость перевода начинается от 1690 руб./стр. Страницей при этом обычно считается 1800 знаков с пробелами. Для моей книги выходило тогда порядка 370 000 руб.

Стремясь получить перевод по более адекватной для себя цене, попросила помощи одного знакомого Бюро. Несмотря на сильную лояльность по ценам на тот момент в 400 руб./стр., меня сразу просветили, что лучше книгу или сразу переводить носителем языка читателя либо вычитывать перевод профессиональным редактором, желательно также носителем. Хороший редактор, предупредили, стоил бы 43$/час, около 2х дней работы. Получалось процентов на 35% дешевлеRidero, но все равно, прилично. На фрилансе от 4$/час, держа в голове качество.

Запись аудиоверсии

В самиздате можно заказать за деньги(Ridero), наЛитРесеесть отдельный проект по записиЛитРес: Чтец.Про мой опыт подробнее в последующейЧасти 4. Запись аудиоверсии книги.

Выставки

Следуя желаниям автора из самиздата быть замеченным иобрестипопулярность,Rideroпредлагает участие на ежегодной Московской Международной Книжной ярмарке,выставкеNon/fictionи прочих.

На практике с точки зрения привлечения читателей и продаж смысла участия мало. За пакет в 19 000 руб. на ММКЯ, предполагавший печать 10 экземпляров, выкладку книги на стенде и их продажу, реализовалось 2 штуки и никакого дополнительного внимания к книге неощутилось. Можно выступить на ярмарке с презентацией своей книги, но и порядок цены будет уже другой. На фото с итогами людей на отдельных презентациях мало, опять же чувствуется смещение точки монетизации в сторону денег с авторов, а не читателей.

Депубликация

Самостоятельно убрать книгу из магазинов в том жеRideroнельзя: никаких элементов по ее удалению в интерфейсе не предусмотрено. Все делается опять же запросом через поддержку.

Обещанный срок снятия: в течение недели после запроса к магазинам. Фактический (неприятный сюрприз): несколько часов. Делая заявку с расчётом, что книга еще попродается несколько дней, а то и неделю, неожиданная погрешность в лучшую сторону оказалась не на руку :)

Дополнительные мероприятияДополнительные мероприятия

Итого, получить в самиздате тираж в 30 экз. с приятной вёрсткой, своей обложкой и продаваться онлайн обошлось в (без дополнительных услуг и рекламы) 2 месяца и 28 900 руб.

Но... хотелось попасть и в сетевые книжные офлайн-магазины. Продолжение про работу с традиционными издательствамив следующей части.

Далее:

Часть 3. Издательства: как попасть на полки книжных магазинов. Шансы на интерес к вам, опасные договоры и процесс выпуска книги.

Часть 4. Запись аудиоверсии книги.

Часть 5. Сколько получают авторы.


Подробнее про книгурезультатсамиздата.

Текущая версия результат работы сиздательством(Эксмо/Бомбора) и их дизайн.

Подробнее..

5 книг Стругацких

24.02.2021 00:19:22 | Автор: admin

Сложно выбрать какую-то дату, к которой бы можно приурочить этот текст. То ли август, когда родился Аркадий Натанович, то ли апрель, когда родился Борис Натанович. А уж подстраиваться под даты публикаций дело совсем неблагодарное: даже в наиболее провластный период своего творчества отношения с властью и её цензурой у братьев плохо складывались. Публикую тут в феврале, потому что ... почему бы и нет.

Да, я ноунейм из интернета, очень начинающий редактор, просто делюсь своим мнением. И вот спонтанно, под настроение, решил порассуждать о самом, пожалуй, влиятельном писательском дуэте нашей фантастики.

Первой моей книгой Стругацких была "Пикник на обочине". Тогда я прочитал и почти ничего не понял. Да, Зона, да Рэд страдает, но крутой, да, сталкеры, да, Стервятник... Перечитав в сознательном возрасте, с удивлением осознал, что книжка посложнее, чем кажется. Как я теперь считаю, это история про то, что мы не понимаем. Вся эта Зона непонятно как возникла и непонятно кому нужна. Непонятно, почему именно жившие в ней в определённые годы не могут уехать, не создав проблем для новых соседей. Уж тем более неясно, почему Зон больше одной, когда с этой непонятно, как жить. Использовать её не представляется возможным. В других Зонах худо-бедно научились добывать артефакты промышленным способом, с помощью техники или продуманной системы "проник вовремя, собрал, смотался". Однако ни что такое артефакты, ни зачем они, ни чем опасны никто сказать не может. Да и почему они "артефакты", если так называют произведения рук человеческих?.. И среди всего этого непонятного поразительно понятны становятся люди: их мотивы, их страхи, их сомнения, их стремления. Возможно, это всё метафора на жизнь. Но если так, то научимся ли создавать "артефакты" или обойдёмся без них?..

Румата был всего лишь исследователем, но не смог удержаться и сначала пытался всех спасти, а потом всем мстилРумата был всего лишь исследователем, но не смог удержаться и сначала пытался всех спасти, а потом всем мстил

Вероятно, "Трудно быть богом" вообще не стоило экранизировать. Это очень жуткая вещь о том, что даже если человек очень умён, ответственен, морален, очень быстро может превратиться в злодея. Потому что скорость падения, вероятно, выше скорости подъёма. Другой вопрос, морален ли Антон, или его отправили, потому что больше было некого... Читать, надо сказать, было больно, но интересно.

Потом была "Улитка на склоне". Тут надо честно признать, что я её до сих пор не понимаю. Вернее даже не придумал понимания, которое меня устраивает. Филолог Перец работает в "Управлении лесом", офигевает от его бессмысленности, пока не проводит ночь со случайной женщиной и не становится директором этой странной структуры. Вторая часть произведения мало связана с первой. Кандид исследователь "Леса" пропадает в этом самом Лесу после падения самолёта, пытается сохранить способность мыслить, пока не осознаёт, что жители местных деревень прошлое Леса, деревни надо "Одержать", то есть превратить в Лес, а его будущее хозяйки Леса, жестокие и красивые жрицы партеногенеза, способные и к репродукции без мужчин, и вообще развившиеся донельзя. Могу только предположить, что это исследование отношений рационального и иррационального в человеке, а ещё вообще критика, как ни странно, коммунизма вот, дескать, новые люди, а лучше-то никому не стало...

Объединю в одну "книжку" сразу три: "Понедельник начинается в субботу" и "Сказку о Тройке" в двух её вариациях. Первая часть добрая сатира на советские НИИ. Работают там гении и волшебники, но временами их невозможно понять. Большинство там продуктивные и талантливые труженики. Звучит не весело, но при чтении я улыбался, а временам посмеивался. Есть и острые по тем временам штуки. Бездельник и болтун Выбегалло проводит эксперимент по выведению "идеального человека". Получается огромный великан, который всё ел и ел, потому что у него росли потребности. В итоге он схлопнулся. А вторая, напротив, жесткая сатира на бюрократию: там она ужасно идеальна. Невозможно ничего решить и ничего добиться от начальства, потому что оно всеми способами уклоняется от принятия решений и занимается абсолютно неважной чепухой. Только хитростью героям удаётся победить и бежать. Но это в "цензурной" версии. Во втором варианте произведения сатира ещё сильнее, но результат похуже, им просто ничего не удалось, как в "Замке" Кафки.

"Гадкие лебеди", пожалуй, сильнее других произведений братьев Стругацких меня напугали. Это повесть о том, какие некие люди будущего "мокрецы" с помощью не вполне ясных методов убедили всех детей некого города уйти с ними от родителей. Мокрецов все считали больными, они постоянно скрывали лица под капюшонами. Кстати, главный герой популярный писатель Виктор Банев в меру неглупый и в меру умелый перманентно разлагается, пока не сталкивается с мокрецами. Тогда он осознаёт, насколько ничего не понимает, но хотя бы осознаёт примерный масштаб своего непонимания. Предположу, что тема интеллигента в среднем нормального, морального, трудолюбивого даже но ничего не понимающего и способного только измерять уровень своего непонимания вообще важная для Аркадия и Бориса Стругацких.

"То он в бронзе, а то он в мраморе""То он в бронзе, а то он в мраморе"

Пару месяцев как закончил "Град обреченный". Герои произведения ходят по кругу, но у них ничего не получается: мусорщик не может убрать мусор, а советник господина президента помогает строить диктатуру, которую ненавидит (диктатура, кстати, тоже не удаётся). Авторы, пожалуй, поднимают вопросы нравственности и морали. Местный фермер дядя Юра считает, что моральны только те, кто работает руками, а те, кто сами не могут прокормиться, вообще так себе люди. А Изя Кацман, еврей, балагур, оптимист и очень начитанный человек, полагает, что моральны те, кто "строит храм" то есть принадлежит к небольшому количеству тех, кто улучшает жизнь человечества хотя бы на капельку. Главный герой Андрей Воронин деятельный, ищущий правду романтик и идеалист наверное, должен быть близок мне, но, к счастью, я его не понимаю. Он выпал из всех знакомых и известных мне систем. Когда он понял, что зашёл в тупик, он застрелился. Всё это оказалось частью круга, и он снова начнёт сначала, но теперь, быть может, что-то понял.

Вместо заключения... Вполне возможно, что я не дорос до большинства (или всех) книг братьев Стругацких. Я же не смог дочитать "Бессильных мира сего" стало слишком горько. Но тем не менее, те, что я как-то понял, вероятно, входят в несуществующий список книг под заглавием "Спасибо, я такой благодаря вам. Конечно, вы не виноваты в моих недостатках, но вы часть меня". Надеюсь, название не слишком длинное. Как и сам текст. Спасибо, что дочитали! Надеюсь, время люденов ещё не пришло...

Подробнее..

Книги, которые мы заслужили. Vol 1

16.04.2021 12:14:51 | Автор: admin

Пятничный привет тебе, Хабр!

Если есть возможность в выходные отдыхать, а не работать это очень круто. А если получается отдыхать с пользой это круто вдвойне. Как? например, читая классные книги.
Мы, издательство ITSumma Press,постоянно ищем интересные и полезные иностранные книги, которые еще не переведены на русский язык. Я, например, частенько слушаю аудиоверсии не-технических книг, которые помогают разобраться в сложных темах без специального образования. И обзоры самых интересных находок время от времени я буду представлять здесь. Если какая-то книга многим покажется занимательной, мы поставим её в очередь на перевод!

Ну, а пока первый выпуск "ITS книгобзор". Сегодня расскажу вам, почему прямохождение стало причиной появления выдающейся женской груди и от том, как понять, роботы это поставщики прав и свобод или их потребители. Поехали!

Название: Unbound: How Eight Technologies Made Us Human and Brought Our World to the Brink

Автор: Richard L. Currier

Год издания: 2017

Доктор наук в области социокультурной антропологии, профессор в Беркли, Карриер последовательно и в деталях рассказывает о наиболее значимых, с его точки зрения, технологиях, которые кардинально повлияли на развитие человечества. Автор доступно показывает траекторию изобретений и анализирует последствия их появления для экономики, политики и этики. Сегодня расскажу вам самое запоминающееся о первых двух технологиях, а остальное и в деталях вы узнаете, если прочтёте оригинал.

Итак, палка. Она, родимая, была первой технологией человека. Для выкапывания корешков и сражения с врагами. Она же послужила тому, что мы стали прямоходящими. Хотя после выхода книги выдвигалась и другая теория. Кстати, по гипотезе Карриера, именно женщины начали использовать палку как инструмент.

Карриер довольно подробно останавливается на развитии сексуальных и семейных отношений. Например, вследствие прямохождения женские половые органы оказались скрыты от глаз и у самок человека молочные железы стали ярко-выраженными не только во время вскармливания потомства, но на протяжении всей половозрелой жизни. Автор рассказывает также, как мы пришли от полиамории к моногамии и почему секс перестал отвечать лишь репродуктивным задачам.

Огонь удостоился отдельной главы. Из-за него мы потеряли волосяной покров по всему телу, развили новую функцию у самого большого нашего органа (хотя мы все знаем, что размер не главное) и оптимизировали пищеварительный тракт.

Автор, конечно же, останавливается и на печатном станке, и на часах, и на автомобилях. И приводит удивительные истории о том, как изобретение отдельного индивидуума может развернуть историю планеты на 180 градусов.

Отличная книга: научные теории и доказательства излагаются так легко и понятно, что даже дедушка на пенсии поймет, о чем речь. После прочтения\прослушивания у вас будет чёткое понимание, как мы спустились с деревьев и полетели в космос, по пути превратившись в любвеобильных невротиков и трудоголиков.

Актуальной книга будет всегда. Особенно, как мне кажется, для родителей. Прочитайте и узнаете, что отвечать на многочисленные детские Почему?

Название: Robot Rights

Автор: David Gunkelm

Год издания: 2018

Автор детально разбирает современные популярные подходы к вопросу прав роботов. Основной корпус книги посвящен четырем комбинациям пары могут иметь права должны иметь права:
1) могут, но не должны,
2) могут и должны,
3) не могут, но должны,
4) не могут и не должны.

Важно понимать, что до сих пор нет единого мнения о том, что\кто такие роботы. На это в огромной степени повлияли следующие факторы:

  • sci-fi кинематограф и литература с многочисленными терминаторами, единым разумом и тп.

  • сверхбыстрое развитие науки и технологий, которые с каждым годом подкидывают нам новые версии электронных созданий.

  • многообразие функций и задач новых девайсов: от тостера для поджаривания хлеба до электронной собаки для эмоционального восстановления. Автор напоминает, что главное отличает tools от machines. Если первые заменяют предыдущие версии инструментов и выполняют грязную, тяжелую, унизительную работу (вспомнилось, что в английском это называется 3D works dangerous, dirty, demeaning), то machines заменяют самого человека. И не только на рабочем месте, но и в социуме норовят его полностью заместить, а то и поработить.

Во-вторых, остаются разногласия по поводу самой природы прав и их значения относительно роботов. Ганкел приводит отсылки ко множеству научных работ, где роботы рассматриваются не только в качестве потребителей (consumer) прав и свобод, но и в качестве поставщиков (producer).

Однако, хотя автор и не выделял это в отдельную проблему, все же главным затруднением в вопросе прав роботов видится то, что человек предрасположен наделять вещи человеческими качествами. В список significant others уже входят не только роботы-компаньоны, но даже современные пылесосы. Татьяна Черниговская как-то рассказала, как ее подруга постоянно норовила включить в комнате свет, чтобы пылесосу было светло убираться. Появился даже принцип when in doubt, treat as a human.

Казалось бы, проблема не стоит нашего внимания, ведь нужно лишь:

  • четко разъяснять потребителям, что перед ними кусок дорогого пластика и проводов;

  • подчеркивать целевую детерминацию роботов они созданы для того чтобы копать\вычислять\грузить денно и нощно;

  • корректно выбирать названия для новых изобретений.

И вуаля, мы сумеем предотвратить эмоциональную привязку к роботам. Глядишь, мы перестанем извиняться перед своим автомобилем за колдобину на дороге или ласковым голосом упрашивать телефон удержать заряд в сорокоградусный мороз.

Но не все так просто. Автор приводит занятные примеры, когда даже эмоционально подкованные и просвещенные военные отказывались от машин-саперов, не желая видеть, как последние страдают. Люди продолжают относиться к машинам как к живым существам. Хотя, вспоминая знаменитый Chinese Room Argument, нам пора бы уже усвоить: даже если кажется, что тостеру больно, когда мы, например, резко дергаем его за шнур, это еще не означает, что тостеру действительно больно. Вообще, дихотомия being vs. appearing проходит красной нитью через всю книгу.

Книга заканчивается тем, что, возможно, нам стоит защищать права роботов даже не столько ради самих роботов (как в случае с животными, например), а ради самих людей:

  • люди относятся к роботам так же, как они относятся к людям. И даже аристотелевский катарсис не работает: если человек выпустит гнев на робота, не факт что этот человек станет ангелом в общении с живыми людьми.

  • несмотря на то, что взрослые люди понимают, что робот это механизм в обличье homo sapiens, они все равно должны к ним относиться как к людям. А все потому, что дети берут со взрослых пример и, не видя разницу между роботом и человеком, будут относится к людям так, как их родители\взрослые относились к роботам.

Еще больше новостей про интересные книги, книжную индустрию и разной полезной информации в нашем новом телеграм-канале ITSumma Press Книжная Среда. Наши редакторы делятся прочитанным. Обсуждать тоже можно в сопутствующем чате. Присоединяйтесь!

Подробнее..

Firefly культовый сериал продолжается в книгах

03.05.2021 20:08:12 | Автор: admin

Привет, Хабр!

"Светлячок" это сериал снятый в жанре космического вестерна. Сериал состоит только из одного сезона, в котором всего 14 серий.

Сериал повествует о команде корабля класса "Светлячок", которая зарабатывает себе на жизнь мелкими преступлениями, перевозя на своем корабле различные грузы. Действие разворачивается в далекой планетарной системе, куда переселились люди несколько сотен лет назад. Недавно отгремела страшная война. В этой войне участвовал капитан корабля Малькольм Рейнольдс. Корабль получил название "Серенити" по названию долины, где произошли последние бои и где сторона капитана потерпела полное поражение.

На протяжении 14-ти эпизодов команда корабля попадает в самые различные ситуации. Ограбление поезда и медицинского центра, бегство от представителей власти и драки с бандитами... Не буду вдаваться в подробности, дабы избежать спойлеров. После закрытия сериала, в качестве его продолжения, было решено снять полнометражную ленту под названием "Миссия Серенити".

События книг происходят между событиями сериала и событиями полнометражного фильма. Книги являются официальным продолжением сериала. Консультантом для авторов выступает сам создатель сериала Джосс Уидон.

Лично мне книги очень понравились. В каждой из них сохраняется атмосфера сериала. Читая, как будто смотришь новый эпизод. Прежде чем начать читать книги я бы рекомендовал посмотреть хотя бы несколько первых эпизодов. Надеюсь, что авторы не остановятся на достигнутом и продолжат писать новые книги.

Ниже дано краткое описание каждой из книг.

Чертов герой

Капитан Малькольм Рейнольдс заключает очередную сделку. На этот раз команде нужно перевезти очень взрывоопасный груз, но внезапно капитан куда-то исчезает. Верные друзья ведут поиски своего капитана. Как оказалось, капитана настигло прошлое. Во времена войны все совершали ошибки и некоторые жестоко поплатились за них. Теперь настала очередь Малькольма Рейнольдса.

Великолепная девятка

Член славной команды "Серенити", Джейн Кобб получает сигнал о помощи от одной своей подруги. Команда, находящаяся как всегда без гроша в кармане и в поисках работы, соглашается помочь. Экипаж отправляется на богом забытую, пустынную планетку где им предстоит встретиться со старым врагом и его приспешниками.

Машина иллюзий

Никто не хотел связываться с этим грузом! Но жадность Кобба как всегда взяла вверх над разумом. В тайне протащив некий аппарат на борт корабля, Джейн ставит под удар весь экипаж. Члены команды начинают видеть очень реалистичные сны. И все бы ничего, но приятные грезы постепенно превращаются в кошмар.

Поколения

Эта часть в данный момент не переведена на русский язык.

Капитан выигрывает старую карту. Как оказалось, она ведет к одному из Ковчегов древнему кораблю, который когда-то привез людей в нынешнюю планетарную систему. Команда отправляется исследовать этот корабль.

Firefly. Полная иллюстрированная энциклопедия

Это не продолжение сериала, а самый настоящий справочник по вселенной "Светлячка". Внутри можно найти сотни иллюстраций, статьи про персонажей, включая их биографические данные, а также подробнейшие описания планетарной системы, кораблей, оружия и тому подобного.


Дата-центр ITSOFT размещение и аренда серверов и стоек в двух дата-центрах в Москве. За последние годы UPTIME 100%. Размещение GPU-ферм и ASIC-майнеров, аренда GPU-серверов, лицензии связи, SSL-сертификаты, администрирование серверов и поддержка сайтов.

Подробнее..

Снупп Догг и Голодные игры кто спасает книжную индустрию в период пандемии

09.05.2021 10:20:54 | Автор: admin
image

Когда прошлой весной по всей Америке закрылись книжные магазины, глава издательства Chronicle Books Тирелл Махони готовилась, что вот-вот наступит полная катастрофа: доходы компании стремительно падали. А спустя несколько месяцев выяснилось, что от разорения компанию спас не кто иной, как рэпер Снупп Догг со своей поваренной книгой From Crook to Cook, изданной еще два года назад. В 2020 году продажи книги подскочили в два раза до 205 000 экземпляров. Не новинки, а именно такие книги внезапно взяли на себя роль драйвера прибыли и в итоге дали книжной индустрии шанс выжить.


Несмотря на, казалось бы, непреодолимые препятствия, вставшие в прошлом году между читателями и книжными магазинами (включая локдаун, отмену встреч и мероприятий, перенос дат публикаций и т.д.), люди продолжали покупать книги. Походы в кино, спорт, театр всё исчезло, и чтение вдруг оказалось идеальным развлечением для человека в изоляции.
Но повезло далеко не всей индустрии. Пандемия изменила сам механизм поиска книг: читатели стали иначе искать и выбирать литературу. В выигрыше оказались книги популярных и уже известных авторов, в то время как новым именам, наоборот, пришлось очень нелегко. По признанию Махони, из двухсот с лишним новых изданий, выпущенных в 2020 году, многие так и не нашли своего читателя и, вероятно, уже никогда не найдут. По большей части, это книги начинающих или не широко известных авторов.
image

Вопрос теперь в том, насколько фундаментальными оказались эти изменения и останутся ли они с нами навсегда? Процесс покупки стал принципиально другим: поскольку теперь читатели приобретали книги в основном через интернет, выросла доля продаж Amazon и таких розничных сетей, как Target и Walmart. Конечно, миграция потребителей в онлайн шла и до этого, но то, как она ускорилась в период пандемии, может оказать на читательскую культуру глубокое влияние. В отличие от случайных открытий, которые покупатель делает находясь среди книжных полок офлайн-магазина, в интернете люди ищут литературу целенаправленно: по автору, по теме, ограничивая количество выбора. Часто они видят то, что подсовывает поисковая система или алгоритм, или же ориентируются на те позиции, которые продвигает сам магазин.
Отсюда и ситуация, в которой продавцы фокусируются на известных авторах, а покупатели на популярных изданиях. Самой продаваемой художественной книгой на Amazon в прошлом году стал роман Делии Оуэнс Там, где раки поют, вышедший еще в 2018 г. Также в топе оказались произведения Сьюзен Коллинз (автора Голодных игр) и Джеффа Кинни (Дневник Слабака). В целом, по данным NPD BookScan, девять из десяти бестселлеров книги уже хорошо знакомых читателям авторов. И, с другой стороны, около 98% книг, вышедших в 2020 г., продались тиражом менее 5000 экземпляров.
В онлайн-торговле мы продаем очень предсказуемые товары. Разумеется, в этом нет ничего плохого, но в конечном итоге именно книжные магазины были тем местом, которое помогало раскрываться новым талантам, Джеймс Даунт, сеть Barnes&Nobles.

Как оказалось, офлайн-магазины это критически важная часть литературной экосистемы, которая очень пострадала в период локдауна. Согласно данным Бюро переписи населения США, их продажи упали на 30%, а, как признается руководитель Ассоциации книжной торговли США Эллисон Хилл, большинство магазинов в прошлом году денег не заработали. Поэтому издатели теперь стали беспокоиться о долгосрочных перспективах существования книжных магазинов. Так, в качестве меры поддержки издательство Penguin Random House начнет предоставлять независимым книжным магазинам дополнительный месяц отсрочки по платежам.

В целом же, за пандемийный год рынок книготорговли показал небывалый за последние 10 лет рост: доходы издателей США выросли на 10% до $8,6 млрд.

  • Огромным спросом стал пользоваться нон-фикшн: книги о политике, расе и расизме, литература по домашнему хозяйству и приготовлению еды. Детский нон-фикшн вырос и вовсе на 23%.
  • Взрыв популярности пережила платформа Audible принадлежащий Amazon сервис дистрибуции аудиокниг: количество прослушиваний выросло на 500 миллионов часов (20%-ый рост).
  • Количество книг, которые пользователи сервиса Goodreads отметили как завершенные (прочитанные) в период с апреля по декабрь 2020 г. увеличилось на 40% по сравнению с аналогичным периодом годом ранее.
  • За первый квартал 2021 г. продажи печатной литературы достигли максимума с 2004 г.


Многие в индустрии задаются вопросом: может ли пандемия стать фактором постоянного бурного роста, как раньше произошло с феноменом книг о Гарри Поттере, которые привлекли многомиллионную читательскую аудиторию. А кто-то, напротив, ожидает скорого и неизбежного спада по мере того, как уставшие от локдауна люди вернутся на концерты, пляжи, спортивные площадки и в театры
image
Прошедший год для индустрии стал годом переоценки и переосмысления методов работы с талантами и читателями. Одним из новых форматов работы с аудиторией стал переход в онлайн встреч с авторами: традиционные мероприятия, выступления и автограф-сессии были перенесены из конференц-центров в Zoom. И это, в свою очередь, это уничтожило значительную часть дохода книжных магазинов. По словам совладелицы аризонской сети книжных магазинов Гейл Шенкс, если после офлайн-встреч автора с читателями продажи книги достигали 1000 экземпляров, то онлайн-формат приносит 150 продаж как максимум, а обычно и вообще около десятка. Альтернативой стали сделки с издателями, которые платили книжному магазину за организацию zoom-сессий с авторами, но и в этом случае речь шла о суммах в 200 500 долларов, что аналогично доходу от 20 50 книг. Да и сами онлайн-встречи, по мере того как пандемия продолжалась, становились все менее и менее эффективными сказывалась усталость от Zoom. Конечно, определенный всплеск продаж в период локдауна обеспечили онлайн-заказы, однако в независимых книжных он не был революционно высоким, да и сами офлайн-магазины не были готовы к перестройке бизнеса под интернет-торговлю. В конечном итоге их выручка все равно существенно снизилась.

Сдвиг продаж книг в онлайн привел к падению продаж новинок. Если 10 лет назад на них приходилась половина от объема проданных изданий, то в 2020 году лишь треть.
Среди 50 самых продаваемых книг на Amazon только 17 изданы в 2020 г., из которых десять изданий мемуары и публицистика: биографии Обамы, Трампа, Черчилля, Мэтью Макконахи, поваренные книги и т.д. Среди старых книг, чью популярность у читателей новинкам не удалось обойти, уже упомянутый роман Делии Оуэнс (2018), триллер Безмолвный пациент (2019) Алекса Михаэлидиса, экранизированный роман Селесты Энг И повсюду тлеют пожары (2017) и т.д., а также биографии знаменитостей, развивающая и детская литература, изданная в 1990-2010-ых гг.
Президент HarperCollins Брайан Мюррей считает, что в пандемию люди решили прочитать то, что давно хотели, но откладывали. Из-за этого целый ряд ожидаемых новинок, обещавших стать прорывными бестселлерами, так и не смог найти массового читателя, как это случилось с романами Enter the Aardvark Джессики Энтони, Under the Rainbow Селии Ласки и August Каллана Винка. Еще один пример роман Хилари Лейхтер Temporary, номинированный на множество литературных премий и, по отзывам критиков, одна из лучших книг года. Отмена пресс-туров и читательских конференций привела к тому, что в итоге Temporary продалась скромным тиражом в несколько тысяч. Впрочем, автор довольна и этим: На самом деле мне сильно повезло, что люди вообще нашли эту книгу.

Даже сейчас ситуация с продажами книг далека от стабильности. Согласно недавнему исследованию, вопреки широкому распространению цифровых изданий, бумажные книги по-прежнему опережают по объему продаж электронные. Так, в США в 2020 г. печатные книги приобрели 45% населения, в то время как электронные всего лишь 23%. Еще более высокий разрыв в европейских странах. К примеру, в Германии 58% респондентов покупали бумажные книги, а электронные лишь 10,4%.




Облачные серверы от Маклауд быстрые и безопасные.

Зарегистрируйтесь по ссылке выше или кликнув на баннер и получите 10% скидку на первый месяц аренды сервера любой конфигурации!

Подробнее..

Интервью c соучредителем компании Advantech, Кей Си Лю

18.03.2021 10:09:11 | Автор: admin
Интервью c соучредителем компании Advantech, Кей Си ЛюИнтервью c соучредителем компании Advantech, Кей Си Лю

Кей Си Лю президент и соучредитель компании Advantech, мирового лидера в области промышленного интернета вещей с оборотом почти 2 миллиарда долларов. После карьеры в Hewlett-Packard сперва на должности инженера-исследователя, а затем инженера по продажам, Кей Си вместе с двумя коллегами из HP основал Advantech в 1983 году. Как лидер в области инновационных продуктов и решений для встраиваемых систем и автоматизации, он с тех пор является бессменным президентом компании. Благодаря его руководству с 2013 года Advantech ежегодно получает звание одного из 10 лучших мировых брендов Тайваня по версии консалтинговой компании Interbrand.

Вопросы, обсуждаемые в интервью:

  • Что вдохновило вас и ваших компаньонов на создание Advantech?

  • Сегодня Advantech известен наряду с такими гигантами, как Asus, Trend Micro, Acer и GIANT. Что, на ваш взгляд, обеспечило успех?

  • Когда вы впервые осознали потенциал Интернета вещей?

  • Миссия Advantech - Создание разумной планеты. Что это значит для вас?

  • Можете ли вы описать, что для вас означает совместное творчество и какую роль в этом играет фонд экосистемы AIoT?

  • Чем вы больше всего гордитесь и что бы вы сделали иначе?

Кен Фостер: Итак, я много лет был личным поклонником Advantech и вашего инновационного лидерства. Если мы перенесемся на 38 лет назад, до основания компании - что вдохновило вас и ваших соучредителей создать Advantech?

Кей Си Лю: В 1983 году мы с двумя коллегами прогуливались по объектам подразделения Hewlett Packard Instrument Group на Тайване. В то время нашей повседневной работой было автоматическое тестирование с помощью компьютеров и приборов HP, подключенных для прохождения тестов через центральный интерфейсный код GPIB, тогда он назывался HPIB. Тогда уже восемь лет существовала потребность в системе автоматического тестирования, особенно у клиентов HP. Итак, по этой простой причине мы решили создать Advantech - чтобы удовлетворить эту потребность.

Кен Фостер: Какими были ваши первые продукты и как они развивались?

Кей Си Лю: Вначале мы были системным интегратором решений для автоматического тестирования, а через несколько лет мы создали первый стандартный продукт интерфейсную карту GPIB для IBM PC. Этот продукт продавался очень хорошо, поэтому постепенно Advantech превратилась в производственную компанию.

Кен Фостер: Таким образом, в 1983 году Тайвань все еще был большей частью известен своим оффшорным производством, и мало кто на Западе слышал про местные бренды. Сегодня Advantech известен наряду с такими гигантами, как Asus, Trend Micro, Acer и GIANT. Что, на ваш взгляд, обеспечило этот успех?

Кей Си Лю: Насколько я помню, мы никогда особо не продвигали свой бренд. Мы создали Advantech, просто предоставляя услуги и продукты, мы улучшали общение с целевыми клиентами: начиная на Тайване, мы доросли до ведения бизнеса в других странах и открыли офисы в ключевых регионах. И так - до сегодняшнего дня, мы собираемся и дальше продолжать в том же духе.

Кен Фостер: Вам есть чем гордиться с точки зрения узнаваемости бренда. Насколько мне известно, вы лично следуете концепциям из книг по стратегическому менеджменту, в частности Построенные навечно, От хорошего к великому и Стратегия голубого океана. Как вы применяете принципы из этих книг для масштабирования Advantech?

Кей Си Лю: От хорошего к великому ключевая книга. В компании мы штудировали эту книгу много раз. Если вы придете в офис Advantech, вы увидите картинку в холле три круга из книги От хорошего к великому. Это наш корпоративный символ на протяжении многих лет. Я говорю о трех кругах из книги От хорошего к великому, это тот самый эффект маховика. Я ссылаюсь на принцип маховика и на все четыре этапа во многих ознакомительных выступлениях для сотрудников и на каждом информационном совещании компании. Я отношусь к книге От хорошего к великому как к руководству для нашей повседневной работы и стараюсь, чтобы все сотрудники и даже партнеры понимали этот принцип, потому что именно так работает Advantech. Я был верным сторонником этого принципа из книги От хорошего к великому уже около 20 лет.

Кен Фостер: На самом деле, в то время, когда Джим Коллинз писал эту книгу, я работал в Phillip Morris. Возможно, вы обратили внимание, что в книге есть упоминание этой компании. Я помню, как в то время брали интервью у отдельных представителей нашей руководящей команды и согласен с тем, что это основополагающая книга, действительно посвященная стратегии и целям.

Итак, вы были одним из первых лидеров в области удаленной телеметрии. Насколько я помню, Advantech выпустил свой первый продукт для удаленного сбора данных под названием Atom в 1992 году. Когда же вы впервые осознали потенциал того, что мы сейчас называем интернетом вещей?

Кей Си Лю: В начале пути нашей отраслью были сбор данных и автоматизация на основе ПК. В то время самым простым способом автоматизации на основе ПК было внедрение простых в установке модулей на объекте и подключение их к ПК, обычно через интерфейс RS-485. Но в 2010 году к нам пришел термин интернет вещей, и мы осознали, что это наше будущее. Мы не сами его придумали, но чувствовали, что это будущее: по тому, как звучит это слово и по тенденциям в его использовании.

Кен Фостер: Миссия Advantech, как вы ее описываете, создание разумной планеты. Что это значит для вас?

Кей Си Лю: Этот слоган мы узнали от IBM в ходе консультационного проекта. Это означает, что миссия Advantech быть основным в мире поставщиком решений, предлагающим простые в использовании и экономичные строительные блоки для интеграторов решений, чтобы дачёть им возможность реализовывать свои проекты интеллектуальных решений повсюду. Этому лозунгу мы следуем уже много лет.

Кен Фостер: Он определенно предполагает глобальный масштаб деятельности Advantech, включающий не только основной регион АТЭС, но также Европу и США, и, вероятно, хорошо сочетается с вашим глобальным брендом. В ходе беседы вы уже изложили видение того, что мы называем AIoT, сочетая термины AI (искусственный интеллект) и IoT (интернет вещей). Хотя я подозреваю, что вы в равной степени под этим понятием имеете в виду и Advantech IoT, представляя Advantech важнейшую роль мировой экосистемы. Но что для вас означает экосистема и как вы развиваете свою компанию на основе этой концепции?

Кей Си Лю: AIoT, несомненно, является большой тенденцией будущего. Однако до его зрелой стадии еще несколько лет. Поэтому ключевая задача сегодня для нас создание экосистемы. В Advantech основные строители экосистемы это интеграторы решений, ориентированные на конкретные предметные области. Мы считаем, что через несколько лет мы сможем помочь многим таким интеграторам решений вырасти и добиться успеха, присоединившись к отрасли AIoT. Однако сегодня мы должны инвестировать в рост экосистемы. Это большая и трудная работа, но сейчас это основноя задача Advantech. Мы не можем сделать это в одиночку, поэтому мы рады пригласить Momenta стать нашим партнером, чтобы обеспечивать рост экосистемы вместе.

Кен Фостер: И компания Momenta очень гордится тем, что сотрудничает с вами, особенно с фондом AIoT Ecosystem, о котором мы объявили вместе с вами на прошлой неделе, целевым фондом венчурного капитала в размере 50 миллионов долларов, ориентированным на начинающих бизнес-новаторов AIoT в Северной Америке и Европе. Это часть вашей стратегии творческого сотрудничества. Можете ли вы описать, что для вас значит творческое сотрудничество и какую роль в этом играет этот фонд?

Кей Си Лю: Как я уже упоминал, мы хотим расширить возможности наших ключевых партнеров по экосистеме AIoT, включая многих интеграторов решений, ориентированных на различные предметные области, а также поставщиков аппаратных и программных компонентов. Мы считаем, что Momenta это профессиональная компания c четкой специализацией, которая может помочь нам расширить экосистему совместного создания AIoT, особенно в Европе и США. Творческое сотрудничество означает, что мы хотим вывести отношения с экосистемой на один шаг дальше, чем просто делать бизнес с определенным финансовым участием в каком-нибудь совместном предприятии. Таким образом, инвестиционный фонд вместе с Momenta проложит путь для создания этой экосистемы.

Кен Фостер: И мы полностью согласны. Мы видим большое количество инноваций, которые многие могут назвать революционными, эти инновации возникают в компаниях на ранних этапах развития, ориентированных на энергетику, производство, интеллектуальные пространства, цепочки поставок и другие ключевые сектора. И мы не видим достаточного внимания со стороны традиционных инвесторов, потому что наши компании, в основном, инфраструктурные, и они работают в отрасли с табуированными словами промышленная инфраструктура для многих традиционных венчурных капиталистов.

Мы же, напротив, как показали наши предыдущие беседы, разделяем совместную заинтересованность в том, чтобы эти новаторы вышли на рынок. Учитывая наш собственный опыт в инвестировании и ускорении их работы, а также опыт Advantech в предоставлении ключевых технологических компонентов, аппаратного и программного обеспечения, я считаю, что мы можем ускорить наш совместный рост, особенно в этих ключевых секторах. Так что я очень рад быть частью этого вместе с вами.

По всем параметрам вы добились личного и профессионального успеха. Итак, чем вы больше всего гордитесь, и есть ли что-нибудь, что вы могли бы сделать по-другому на уже пройденном пути?

Кей Си Лю: Компания Advantech с самого начала выбрала нишевый рынок. Я помню, как мечтал сделать Advantech очень большой компанией, но сегодняшний результат стал для меня неожиданностью. Хотя мы просто каждый раз применяем одну и ту же методологию, чтобы охватить больше сфер деятельности. Теперь, по прошествии многих лет, эти направления деятельности можно представить как большую бизнес-модель AIoT. Это то, чем я горжусь. Мне повезло занять эту нишу. Мы начали перспективный бизнес, следовали трендам, а затем подключили множество направлений деятельности к бизнесу AIoT. Я ни о чем не жалею. Мне повезло, что мы пошли по этому пути.

Кен Фостер: Вы остались верны своим первоначальным принципам, выбранным при основании компании, и добились хорошего устойчивого развития на этом пути, все это просто замечательно. Это забавно: ссылаться на то, что McKinsey назвала бы бизнес-возможностью со стоимостью в триллион долларов, как на нишевый бизнес!

Кей Си Лю: Да. Автор книги От хорошего к великому также говорит, что это способ вести настоящий долгосрочный бизнес и добиться долгосрочного успеха.

Кен Фостер: Думаю, это хорошо описывает Advantech с точки зрения долгосрочных целей, верно? От вашей изначальной цели лабораторных приборов того времени до того, что стало промышленным интернетом вещей. Мы испытываем такую же любовь и уважение к этому подходу, поэтому я могу полностью согласиться с вами в его ценности.

Я знаю, что вы заядлый читатель и, как вы уже сказали, делитесь книгами со своим менеджментом и проводите собрания книжных клубов во многих своих филиалах. Помимо трех основополагающих книг, о которых вы упомянули ранее, какие люди, книги или другие ресурсы вас вдохновляют?

Кей Си Лю: Недавно меня вдохновила еще одна книга, Бесконечная игра, написанная Саймоном Синеком в 2019 году. В этой книге он сравнивает конечные и бесконечные игры. Сейчас мы штудируем эту книгу на семинаре с нашими топ-менеджерами и членами совета директоров. Я бы хотел, чтобы Advantech в будущем стал игроком в бесконечные игры. Это означает, что мы не стремимся выиграть игру у наших конкурентов, а просто продолжаем игру, расширяя ее границы. И я также считаю, что проект совместного с Momenta инвестиционного фонда экосистемы AIoT станет хорошим шагом вперед.

Конференция Advantech 24-25 марта и 7-9 апреля 2021г.

Приглашаем присоединиться к глобальной конференции Advantech, которая пройдет с 7 по 9 апреля. Вместе с нашими партнерами мы расскажем о решениях для промышленного Интернета вещей. Будут представлены следующие темы:

Дата

Время

Тема

Март 24, 2021

12:00 - 13:35 (МСК)

Leverage Real AIoT Business Solutions using WISE-PaaS

Март 25, 2021

12:00 - 13:30 (МСК)

Co-Creating AIoT Success

Апр. 7, 2021

12:00 - 13:30 (МСК)

Transformative Industrial IoT

Апр. 7, 2021

16:00 - 17:30 (МСК)

Industrial AI Empowers IoT Deployment

Апр. 8, 2021

12:00 - 13:30 (МСК)

Smart Factory Digitalization & Efficiency

Апр. 8, 2021

16:00 - 17:30 (МСК)

Sustainable Energy and Environment Operation & Maintenance

Апр. 9, 2021

12:00 - 13:30 (МСК)

Smart Machine Maintenance & Prediction

Апр. 9, 2021

16:00 - 17:30 (МСК)

Intelligent City Transportation & Mobility

Подробнее..

Категории

Последние комментарии

  • Имя: Макс
    24.08.2022 | 11:28
    Я разраб в IT компании, работаю на арбитражную команду. Мы работаем с приламы и сайтами, при работе замечаются постоянные баны и лаги. Пацаны посоветовали сервис по анализу исходного кода,https://app Подробнее..
  • Имя: 9055410337
    20.08.2022 | 17:41
    поможем пишите в телеграм Подробнее..
  • Имя: sabbat
    17.08.2022 | 20:42
    Охренеть.. это просто шикарная статья, феноменально круто. Большое спасибо за разбор! Надеюсь как-нибудь с тобой связаться для обсуждений чего-либо) Подробнее..
  • Имя: Мария
    09.08.2022 | 14:44
    Добрый день. Если обладаете такой информацией, то подскажите, пожалуйста, где можно найти много-много материала по Yggdrasil и его уязвимостях для написания диплома? Благодарю. Подробнее..
© 2006-2024, personeltest.ru