Преобразование

Вкусная экология преобразование пластика в ванилин

16.06.2021 10:13:29 |

Автор: admin

У современного мира много современных проблем, которых не существовало триста и даже сто лет назад из-за отсутствия нынешнего уровня технологического прогресса. Как правило, большая часть проблем уходит в сторону экологии. А когда разговоры заходят о загрязнении окружающей среды, то одним из лидеров в этом аспекте является вездесущий пластик. Этот универсальный материал можно найти и в производстве сложнейших аппаратов, и на кухне. Полезность пластмассы никто не может оспорить, а поиски замены пока не увенчались успехом, ибо пластик легок в производстве и стоит дешево, в отличие от предлагаемых более экологичных вариантов. Поcему исследований, нацеленных на решение проблемы пластиковых отходов, достаточно много, и каждое из них предлагает свой уникальный подход. На Хабре уже была новость об этом исследовании, но мы, как обычно, рассмотрим его подробнее. Ученые из Эдинбургского университета (Великобритания) предложили использовать бактерию E. coli (кишечная палочка) для преобразования пластиковых отходов в ванилин. Какую роль исполняет бактерия, какие процессы лежат в основе столь необычного преобразования, и можно ли употреблять в пищу полученный таким путем ванилин? Ответы на эти вопросы мы найдем в докладе ученых. Поехали.

Основа исследования

Важность и полезность пластика сложно преуменьшить. Он используется во многих отраслях производства, не говоря уже о его распространенности в быту. Попросите кого-то показать три предмета из пластика, лежащие в квартире, и эта задача будет выполнена моментально. Для примера, я сижу за столом с пластиковыми деталями, на нем стоит лампа с пластиковым корпусом, мышка с пластиковым корпусом, ноутбук с пластиковыми клавишами и т.д. В общем, картина яснее некуда.

Однако проблема пластиковых отходов является на данный момент одной из самых серьезных в аспекте экологии. К тому же существует и экономический подтекст (который куда важнее экологии для многих предпринимателей и производств) из-за того, что 95% пластиковых изделий теряют свою материальную стоимость уже после первого использования, мировая экономика теряет примерно 110 миллиардов долларов в год.

Неудивительно, что исследования, нацеленные на решение проблемы с пластиковыми отходами, столь многочисленны. Среди них в последнее время все чаще встречаются труды, основанные на микробиологии, биокатализе, направленной эволюции, синтетической биологии и неферментативном катализе. В частности, ученые достигли хороших результатов в области ферментативному разложению ПЭТ (полиэтилентерефталат, (C₁₀H₈O₄)_n). Одними из самых многообещающих ферментами стали варианты ПЭТазы из бактерии Ideonella sakaiensis и кутиназы (фермент, катализирующий гидролиз кутина) из компоста ветвей и листьев (LCC от leaf and branch compost cutinase). Отличие в том, что ПЭТаза и ее модифицированные варианты работают при температуре окружающей среды (3037 C), высвобождая бис- и моно-(2-гидроксиэтил) терефталат. Фермент из LCC является термостабильным (72 C).

Помимо очевидного плюса в виде ускоренного разложения пластикового мусора, вышеописанные методы также имеют свое применение и в повторном производстве. К примеру, в ходе разложения ПЭТ методом LCC образуется ТА (thioacrylate, т.е. тиоакрилат), который можно использовать в качестве сырья для производства ПЭТ второго поколения и в качестве строительного блока для синтеза металлоорганических каркасов.

Учитывая эти изыскания, ученые предложили свой метод, результатом которого должно стать преобразование полученного в ходе LCC разложения ТА в ванилин посредством ферментации (1b). Ванилин (в обычных условиях) получают из экстракта стручков ванили. Это широко используют в пищевой промышленности, в косметике, и даже в фармакологии. По данным на 2018 год глобальное потребление ванилина составляет порядка 37000 тонн в год. По прогнозам эта цифра возрастет до 59000 тон к 2025 году.

Спрос на ванилин, как мы видим, очень велик, но он не соответствует мощностям его производства естественным путем (из ванили). Посему проводилось немало исследований, нацеленных на создание искусственного (синтетического) ванилина. Самым широко используемым на данный момент считается производство ванилина из биомассы лигнина (вещество, характеризующее одеревеневшие стенки растительных клеток). Также существуют методы ферментации ванилина из феруловой кислоты, глюкозы, глицерина, L-тирозина, ксилозы, куркумина, эвгенола и изоэвгенола, когда используются микробные и грибковые организмы-носители (1c).

Изображение 1

Авторы исследования заявляют, что о преобразовании ТА в ванилиновую кислоту (VA от vanillic acid, C₈H₈O₄) известно, но на практике никто еще не пытался это реализовать. В своем труде они предложили объединить этот метод с LCC разложением ПЭТ для получения ванилина непосредственно из бытовых пластиковых отходов при температуре окружающей среды и в водных условиях.

Результаты исследования

Дабы получить желаемый результат, ученым в первую очередь необходимо было создать новый ферментативный путь для превращения ТА (тиоакрилат) в ванилин. В качестве организма-носителя был выбран штамм E. coli MG1655 RARE, так как данная бактерия способна восстанавливать альдегиды до соответствующего спирта. Ранее этот штамм уже использовался для получения ванилина, но из глюкозы.

Предположительно ТА может превращаться в ванилин с помощью ферментативного пути, включающего (2a):

терефталат-1,2-диоксигеназа (TPADO);
дегидрогеназа дигидрокси-3,5-циклогексадиен-1,4-дикарбоновой кислоты (DCDDH);
редуктаза карбоновой кислоты (CAR);
катехол-O-метилтрансфераза (COMT).

Изображение 2

Ученые отмечают, что CAR и O-MT принимают PC (протокатеховая кислота, C₇H₆O₄), дигидроксибензальдегид (DHBAl) и ванилиновую кислоту (VA) в качестве субстратов, так что ферментативный путь может протекать через два возможных промежуточных продукта (VA или DHBAl) с образованием ванилина.

Ферменты данного ферментативного пути были собраны в две плазмиды*, названные pVan1 и pVan2.

Плазмиды* молекулы НДК, отделенные от хромосом и способные к самостоятельной репликации.

pVan1 кодирует TPADO (гетеротример, содержащий субъединицы TphA1, TphA2 и TphB2) и DCDDH от бактерии Comamonas sp., которые вместе катализируют превращение TA в PC с использованием кислорода из воздуха в качестве окислителя. Оба фермента экспрессируются в E. coli.

pVan2 кодирует редуктазу карбоновой кислоты из бактерии Nocardia iowensis (NiCAR) и одноточечный мутант растворимой формы катехол-O-метилтрансферазы (S-COMT Y200L) из бактерии Rattus norvegicus (2b). Этот мутант был выбран из-за его высокой стереоселективности в отношении метилирования в мета-положении PC и DHBAl. NiCAR был выбран для стадии восстановления.

Кроме того, клетки были котрансформированы третьей плазмидой, кодирующей фосфопантетеинилтрансферазу (pSfp) из бактерии Bacillus subtilis, которая необходима для посттрансляционной модификации NiCAR.

В процессе создания работающего пути ферментации были проведены тесты. Так, варианты, в которых экспрессировалась только pVan1 либо отсутствовал ТА-субстрат ванилина в результате не было обнаружено. Зато в опытах, где клетки экспрессировали все три плазмиды с добавленным ТА (5 мМ) было образование ванилина (5 мкМ, конверсия < 1%; 2c). При этом промежуточные соединения PC, DHBA1 и ванилиновая кислота также обнаруживаются при концентрациях 18 мкМ, 10 мкМ и 2 мкМ соответственно.

Однако таких результатов недостаточно, потому процесс обходимо было оптимизировать. Анализ сред для экспрессии белка показал, что лучшим вариантом питательной среды* является М9 с примесью казаминовых кислот (M9-CA).

Питательная среда* субстрат для культивирования микроорганизмов или культур клеток высших организмов. М9 среда минимальная (минимально необходимая) питательная среда, используемая для бактериальных культур.

Изображение 3

Ресуспендирование (повторное суспендирование*) целых клеток в среде M9 оказалось более эффективным, чем добавление ТА к экспрессирующим культурам во время фазы экспоненциального роста, что дало 4-кратное увеличение титров ванилина (77 11 мкМ; 3a).

Суспендирование* образование суспензии, т.е. частиц твердого вещества, распределенных в жидкой среде во взвешенном состоянии.

Добавление в питательную среду микроэлементов привело к увеличению титров PC в 1.5 раза (3c). При этом добавление бензилового спирта (BnOH) без каких-либо микроэлементов повышало уровень титров PC в два раза.

Далее было проведено исследование влияния условий биотрансформации целых клеток на превращение ТА в ванилин и промежуточных продуктов ферментативного пути.

Поскольку TPADO является O₂-зависимым, увеличение свободного пространства реакции должно повысит конверсию TA в PC. Это было подтверждено увеличением титров ванилина (от 5 3 мкМ до 327 15 мкМ), когда отношение свободного пространства к реакционному объему было увеличено с 1:5 до 1:99.

Дополнительное улучшение преобразования TA в ванилин было достигнуто путем увеличения проницаемости клеточных мембран E. coli для ТА. Для этого к буферу биотрансформации было добавлено 1% N-BuOH, что приводило к трехкратному увеличению преобразования TA в ванилин (3b).

Важную роль для этого процесса играл и уровень pH. Если он нейтрален, то диффузия TA через клеточную мембрану не происходит. Анализ показал, что pH 5.5 является идеальным вариантом для достижения баланса максимальной диффузии ТА в клетку и минимального индуцированного кислотой стресса для клетки.

Еще более важным аспектом была температура (3e). Снижение температуры реакции с 30 C до 22 C дало 5-кратное увеличение выхода ванилина (577 22 мкМ по сравнению с 117 40 мкМ при 30 C). Дальнейшее снижение температуры (до 16 C) более не давало каких-либо положительных эффектов.

Ученые предположили, что применение методики ISPR* может увеличить выход ванилина за счет снижения его токсичности для E. coli и за счет увеличения потока к ванилину наиболее гидрофобной молекуле в этом пути.

Удаление продукта на месте* (ISPR от in situ product removal) это быстрое удаление продукта из продуцирующей клетки, предотвращающее его последующее вмешательство в клеточные компоненты или компоненты среды.

Из трех исследованных вариантов реализации ISPR (слои органических растворителей; захват продукта биосовместимыми мицеллами или -циклодекстрином; улавливание продукта посредством обратимого нуклеофильного присоединения к альдегидной части DHBAl и ванилина) был выбран второй вариант. Если точнее, то были использованы биосовместимые мицеллы TPGS-750-M, полученные из олеилового спирта (OA) и витамина E. Этот вариант давал максимальный выход ванилина при минимальных уровнях промежуточного DHBAl. При использовании OA из 1 мМ ТА удалось получить 744 мкМ 100 мкМ ванилина. Исследование динамики реакции показало, что максимальный результат достигается спустя не менее 16 часов (3f).

Результатом вышеописанных анализов и исследований стала оптимизированная процедура преобразования TA в ванилин. Основные аспекты оптимизации: клетки E. coli штамма RARE_pVanX ресуспендировали в M9-глюкозе с добавлением L-Met и nBuOH; уровень pH был 5.5; инкубация с TA в течение 24 часов при комнатной температуре; применение олеилового спирта.

Изображение 4

Методика была готова, оставалось лишь проверить ее на практике. Для практического опыта был выбран термостабильный фермент LCC WCCG15 (далее LCC) в качестве биокатализатора, чтобы способствовать гидролизу ПЭТ в ТА. В отличие от ПЭТазы из Ideonella sakaiensis, LCC высвобождает ТА напрямую и не требует дополнительного фермента для гидролиза моно-2-гидроксиэтилтерефталата для высвобождения ТА.

ПЭТ (в данном случае использованные пластиковые бутылки) обрабатывали полуочищенным LCC при 72 C (4а). Реакционную смесь охлаждали до комнатной температуры и добавляли свежеприготовленную E. coli RARE_pVanX и концентрат буфера для биотрансформации. Спустя 24 часа проводился анализ реакции.

Ванилин был обнаружен еще до оптимизации (68 мкМ; 4b). В контрольных группах, где не было либо ПЭТ, либо клеток, экспрессирующих ферменты, ванилина не было. В случае без LLC ванилин был, но в очень малом количестве, что предположительно связано с фоновым гидролизом ПЭТ в реакционном буфере LCC (pH 10) в отсутствие LCC. Добавление олеилового спирта не привело к значительному увеличению титров ванилина, что предположительно связано с более низкими концентрациями ТА в результате разложения ПЭТ (300400 мкМ).

Для более детального ознакомления с нюансами исследования рекомендую заглянуть в доклад ученых и дополнительные материалы к нему.

Эпилог

В данном труде ученые решили описать крайне необычный, но весьма эффективный метод борьбы с пластиковыми отходами преобразование в ванилин. Для реализации этого процесса использовалась бактерия E. coli. Сама же реакция является достаточно простой, так как в ней используется цельноклеточный катализатор, полученный из возобновляемого сырья. Сама же реакция протекает в условиях окружающей среды (комнатная температура и pH 5.5-7), в водной среде и не требует дополнительных реагентов или кофакторов. Кроме того, реакция не производит никаких опасных побочных продуктов.

В ходе практических опытов удалось достичь выхода ванилина в 785 мкМ (119 мг/л), т.е. конверсия составила 79%. Столь впечатляющие результаты были получены не сразу, а спустя множество попыток, нацеленных на оптимизацию процесса.

Полученный ванилин, по словам ученых, вполне безопасен для человека и может использоваться в пищевой промышленности, как и его естественный эквивалент. Однако для пущей уверенности они намерены провести ряд дополнительных тестов, подтверждающих это.

К сожалению, многие предприятия готовы задуматься об экологии только в том случае, если использование экологически небезопасного сырья или технологии грозит им экономическими потерями. Конечно, это цинично и меркантильно с их стороны, но их опасения в случае полного перехода на экологически чистое производство вполне осязаемы. Ведь никто не говорит, что это сделают все одновременно, в том числе и их конкуренты. Тем более подавляющее большинство людей, к сожалению, предпочтут продукт дешевый и неэкологичный, нежели дорогой, но безопасный для окружающей среды. Не все, конечно, но все же большинство.

Посему разработки подобного плана удовлетворяют обе стороны тех, кто готов отдать все за экологию, и тех, кто в первую очередь думает о прибыли. Пока не придумано идеального универсального метода решения экологической проблемы, который подойдет всем, нам придется использовать такие вот компромиссные варианты. Хорошо это или плохо, сказать пока сложно, однако это лучше, чем ничего.

Благодарю за внимание, оставайтесь любопытствующими и хорошей всем рабочей недели, ребята. :)

Немного рекламы

Спасибо, что остаётесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99, уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps от $19 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

Dell R730xd в 2 раза дешевле в дата-центре Maincubes Tier IV в Амстердаме? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?

Подробнее..

Категории: Научно-популярное , Экология , Блог компании ua-hosting.company , Биотехнологии , Химия , Пластик , Преобразование , Ферменты , Пластмассы , Переработка мусора , Кишечная палочка , Ваниль , Ванилин , Пэт

Язык кибернетики. Ищем то, что однозначно

10.05.2021 12:10:00 |

Автор: admin

Язык это механизм, который позволяет конструировать все возрастающую сложность из отдельно взятых преобразований. Статья является продолжением идей, которые в свое время высказали кибернетики В. Турчин и Р. Эшби.

Сначала о более фундаментальном. О вещи или явлении как об ограничении разнообразия [1, c 187]

Это ограничение (рис. - консольный вывод программы) таково, что при переходах состояний с учетом операторов оно явно больше, чем без них. В примере: множество состояний {22, 12, 21, 11}, множество операторов {55, 54, 45, 44}. Из состояния 22 следуют состояния 12, 22, 11, 21. Из состояния 12 следуют состояния 22, 11, 12. Из состояния 21 следуют состояния 22, 21. Из состояния 11 следуют состояния 11, 21, 12. Если же известны операторы, неопределенность только в одном месте. Из состояния 11 при операторе 44 следуют как состояние 21, так и состояние 12.

Однозначность, как меру ограничения разнообразия, можно оценить: сумма всех возможных однозначных переходов без учета неизвестного состояния NaN отнесем к всем случившимся переходам. Тогда с учетом знания об операторах коэффициент однозначности примет значение: k=13/(13+1). Если же операторы не учитывать, то k=4/(4+3+2+3). В первом случае коэффициент почти равен 1, что характеризует это преобразование как высоко предсказуемое.

А как оценить предполагаемый выигрыш в битах? Если допустить, что первоначально были неизвестны переходы между состояниями, то из каждого состояния могли бы следовать все четыре состояния. Тогда энтропия была бы равна -log(4/(4+4+4+4)). Для преобразования выше без учета операторов и без NaN уже меньше -log(4/(4+3+2+3)), а с учетом операторов -log(13/(13+1)). Если же первоначально все, включая операторы, рассматривать как состояния, то энтропия значительна -log(8/64). Можно сказать, что последовательность исследования, выраженная в битах, будет: -log(1/8), -log(1/4), -log(1/3), -log(13/14).

Код программы, который сам ищет такое преобразование, понижая неопределенность с -log(1/8) до -log(13/14), в статье не приводится.

Описана только общая логика и она такова, что

Рассматривается множество элементов {55, 54, 45, 44, 22, 12, 21, 11}.
Выдвигаются гипотезы. Берется множество операторов и множество состояний. Записываются переходы между состояниями. Например, ими могут быть: множество операторов {54, 44, 22, 21}, множество состояний {55, 45, 11}. Или как на рисунке: множество операторов {55, 54, 45, 44}, множество состояний {22, 12, 21, 11}.
Цель максимизировать коэффициент однозначности.

В реальном мире все сложней. Мы не знаем заранее какие состояния, и какие операторы рассматривать. Наш внутренний учитель в этом случае то, что сопротивляется энтропии, сопротивляется неопределенности потока данных, обнаруживая преобразования, имеющие предсказательную силу.

Как правило, физические законы имеют коэффициент однозначности единицу. Но выявлять и запоминать только такое значит лишать себя возможности действовать в мире, где эта неопределенность все же присутствует и ее нельзя свести к нулю. Нужен разумный компромисс между 100% предсказуемостью и возможностью действовать, пусть и с ошибками.

Сделав это фундаментальное допущение, посмотрим на мир с точки зрения его имитации. Речь идет о компьютерных играх. Интересны они тем, что число степеней свободы несоизмеримо в них меньше. И тем интересны, что непонятно первоначально как поступать, чтобы добиться цели. Да и сама цель часто не ясна. Что же составляет их сюжетную линию, мозг как всей игры, так и отдельных персонажей? Конечные автоматы [2]. По ссылке на рисунке состояния отмечены кружками, а операторы подписаны стрелками. Это тоже преобразование. Причем с коэффициентом однозначности единица.

Итак, как мы должны поступать, если конечная цель-состояние не известна, а операторы определены? Ответ: Q-learning. Представим комнату, разбитую на множество состояний-квадратов. Где-то находится клад. Сначала мы просто передвигаемся случайно или по принципу иди туда, где меньше всего был [3]. Рано или поздно мы получим вознаграждение в виде найденного клада. В этом случае пометим целевое состояние некоторым положительным числом. В следующий раз при очередных блужданиях по комнате и находясь уже рядом с целью, отметим состояние, ведущее к цели с учетом дисконтирования. Обычно множитель берется немного меньше единицы. Но для наглядности пусть будет вычитание единицы. Так постепенно информация о цели будет распространяться на соседние и все более удаленные состояния. Можно это представить так, что вначале имеем ровную поверхность, а после многочисленного прохождения представляющей точкой по комнате, она создаст в памяти топографическую карту. И на этой карте самой высокой точкой будет сама цель. И правило, по которому оптимально нужно перемещаться к цели двигаться в сторону возрастания числа, то есть выбирать то соседнее состояние, где оно максимально (в сторону градиента).

Допустим, у нас есть преобразование-комната, такая что состояниями ее будут {54, 61, 62, 63}, а возможными операторами {37, 38, 39}.

Пусть представляющая точка перемещается случайно в смысле выбора операторов. Если клад является состоянием 63, то информация об этом в таблице Q-learning будет постепенно распространяться на соседние состояния. Пусть наградой за клад будет число пять. Тогда с учетом дисконтирования соседние с ней состояния будут отмечены как четыре. Таковым здесь только состояние 61, из которого цель непосредственно достижима. Состояние же 62 можно получить из состояния 54.

Если состояние 54 является открытой дверью (начальным состоянием) комнаты, то оптимальный маршрут к кладу, например, может быть таким: 62=39(54) 61=37(62) 63=37(61)

Есть ли возможность разные преобразования соединить? Да. Наш язык этим и занимается. Есть языки, в которых синтаксис предложения строится за счет окончаний. Есть те, где эта роль отводится предлогам. Но это не принципиально. Существенно другое.

Базовые случаи соединения преобразований:

Преобразование А изменяет состояния преобразования В. Это возможно, если состояния преобразования А являются операторами преобразования В.
Значение переменной (то есть имя преобразования А) является значением представляющей точки этого преобразования А. И оно подставляется в качестве состояния (или оператора) в вышестоящее по иерархии преобразование С.

Что характеризует родительный падеж? Отношение принадлежности. Для примера выше: клад комнаты. Иначе говоря, одним из состояний комнаты является клад. Что соответствует второму типу соединения. В свою очередь клад может быть описан как преобразование. А комната как состояние дома. Вот что пишет Турчин [4]:

Что это значит? Что если раз за разом переходы преобразования (с учетом заданного коэффициента однозначности) именно таковы, то выносится решение (для примера выше): комната. В противном случае ее нельзя считать таковой. Далее эта информация поднимается на более высокую ступень иерархии преобразований.

Классификаторами-преобразователями могут быть что угодно. Например, ими могут быть: классификатор края изображения, классификатор движения. С обычных позиций они фильтры для стоящий выше преобразований.

Эволюция и мышление суть схожи. Разница лишь скорости обработки информации. Цитируем Турчина [4]

Доказав свою полезность для животного, классификаторы первого уровня прочно входят в число его средств борьбы за существование. Тогда начинается следующая серия проб и ошибок: небольшое число классификаторов первого уровня (точнее, их выходных подсистем) связывается между собой в один пробный классификатор второго уровня, пока не получится полезное соединение. Затем оказывается полезным размножение этого соединения. Можно предположить, что на втором уровне иерархии поскольку это касается органов зрения появляются такие понятия, как граница между светом и тенью, средняя освещенность пятна, движение границы между светом и тенью и т. п. Таким же путем возникают и следующие уровни иерархии.

Вернемся к игре. Пусть имеется поток данных. Пусть он будет таким: {15, 32, 53, 41, 36, 44}, {14, 32, 36, 41}, {15, 31, 53, 34, 44} Что можно сказать? Практически ничего. Вот с таким вот хаосом встречается и ребенок, рождаясь на свет. И только потом он начинает видеть предметы. Сначала вблизи, маму. Потом уже все знать о друге, что в соседнем подъезде. Самое сложное это подобрать множество операторов и множество состояний таких, что они дадут преобразование, однозначность которого не ниже заданного.

Пусть первая гипотеза такова, что множество операторов {41, 44, 45} и множество состояний {11, 12, 14, 15}. Записываем переходы. Если однозначность низкая, то гипотеза не верна. Допускаем далее, что операторами будут {11, 12, 14, 15}, а состояниями {41, 44, 45}. Если результат тоже отрицательный, то ищем иные варианты. Пусть приходим к заключению, что операторы {31, 32}, а состояния {11, 12, 14. 15}.

Мысленно усложним. Пусть состояние 11 это преобразование, переходы которого таковы: 45=35(45) 45=35(44) 41=35(41) 44=36(45) 41=36(44) 44=36(41) 45=34(45) 44=34(44) 41=34(41). В этом случае вместо состояния 11 будем наблюдать сменяющиеся состояния {45, 44, 41}. Причем будем иметь аномалию неоднозначности преобразования в переходе из состояния 12 при операторе 32: 45|44|41=32(12). Действуем далее по принципу: где неоднозначность, там и пища (в смысле удовольствия от новизны), если из нее можно получить информацию. В том смысле, что получено преобразование с высокой предсказуемостью и логарифм от коэффициента однозначности стремится, с учетом заданной погрешности, к нулю. Поскольку преобразование 11 теперь однозначно, можно уже подставить его в вышестоящее преобразование.

Если оценить полученную информацию как разницу энтропий всей игры, то получим приблизительно: -log(1/22) - 0. Когда все переходы будут выявлены, то энтропия игры будет иметь значение ноль, а коэффициент однозначности каждого преобразования будет равен единице. Кроме того, будет известно, как соединены преобразования между собой.

Немного очеловечим рассуждения. Пусть преобразование 11 это ключ. А преобразование выше по иерархии лабиринт. Пусть также в лабиринте есть еще одна аномалия неоднозначности дверь. Причем состояния преобразования ключ являются операторами преобразования дверь.

Итак, смысл всего:

Выдвигаем гипотезы, то есть берем множество операторов и множество состояний. Проверяем на однозначность.
Если преобразование удовлетворяет требуемой точности, то прогоняем ее на Q-learning, составляя топологическую карту цели. Это можно делать даже параллельно.
Способы соединения преобразований, задающие структуру предложения это синтаксис языка. Где базовыми случаями, если не считать именительный падеж, являются винительный и родительный.

Конкретно нашей игры, последовательно решаем проблемы: не размеченный поток данных, обнаружение преобразования ключ и преобразования дверь, после этого лабиринт тоже можно считать преобразованием с заданной точностью, ключ отрывает дверь, представляющая точка из лабиринта через открытую дверь перемещается в комнату. Там она находит клад. Далее информация распространяется обратно. Чтобы найти клад комнаты, нужно предварительно открыть дверь. Дверь открывается ключом. Дверь и ключ в лабиринте. Немного упростим сказанное: ключ лабиринта, дверь лабиринта, ключ открывает дверь, открытая дверь лабиринта открытая дверь комнаты, клад комнаты. Ниже сами преобразования и их соединения на примере игры поиска клада

Всегда ли направление исследования должно идти от низших ступеней иерархии к высшим? Нет, конечно. Если имеем неопределенность 45|44|41=32(12), то можно, не описывая 11 как преобразование в однозначных переходах, сделать гомоморфную замену: 11=g11(45|44|41). То есть сказать: если 45, то только 11; если 44, то только 11; если 41, то только 11. Аналогично для двери: 12=g12(52|53|54). Такой подход не позволит, разумеется, однозначно предсказать состояния преобразований ключ и дверь. Но имеет то преимущество, что выразит преобразование лабиринт сразу как однозначное. Задача же определения состояний 11 и 12, как однозначных преобразований, откладывается на потом. Когда количество элементов входящего разнообразия велико, это может быть очень ценно, поскольку немедленно дает возможность ориентироваться хотя бы в части поступающего разнообразия.

Допустим, все преобразования найдены и выявлены их типы соединения. Допустим также, что текущими состояниями являются: состояние 15 лабиринта, состояние 41 ключа, состояние 52 двери.

Тогда маршрут к кладу может быть таким:

Двигаемся в лабиринте от состояния 15 к состоянию 11, то есть к ключу: 12=31(15) 11=32(12)
Меняем состояние ключа, так чтобы состояние преобразования 12 (дверь) стало 54 (открыта): 44=36(41) 44=34(44) 45=35(44) 45=35(45); при этом сама дверь перейдет от состояния 52 к 54: 52=41(52) 53=44(52) 54=44(53) 54=45(54).
В лабиринте из состояния 11 переходим к состоянию 12 (к двери): 12=31(11)
Поскольку преобразование 12 (дверь) находится в состоянии открыта, то есть в состоянии 54, то представляющая точка может двигаться из лабиринта в комнату. И уже в комнате от состояния 54 к состоянию 63 (клад).
Замечание. Вопросы синхронизации между преобразованиями здесь не оговаривались.

Немного еще гуманитарных свидетельств. Первая колонка из воспоминаний слепоглухонемой [5]. Вторая из наблюдений за внучкой одноклассницы. Третья опыт обучения языку жестов обезьян [6]. Комментарии. Постоянно идет специализация понятий-преобразований (стакан / вода). Что можно считать глаголом? Смену состояний, как смену кадров в кинопленке, ведущую к цели. Аня рукой бабушки гладит кошку Аня управляет рукой бабушки, бабушка гладит кошку. Рука одноклассницы выступает в роли как управляющего, так и управляемого преобразования. Иначе говоря, рука бабушки как преобразование находится в творительном падеже.

Для тех существ, которые только начинают осваивать язык, характерно: выявление преобразования с учетом коэффициента однозначности, получение состояния в нем, включение преобразований в иерархию, обнаружение зависимости преобразований.

Литература

Эшби Р. Введение в кибернетику М.: Прогресс, 1968
Корчаг А. Конечные автоматы и глубокое обучение в несколько строк URL
Булыгина А. В. Способы нахождения цели. Роль случайности URL
Турчин В.Ф. Феномен науки. Кибернетический подход к эволюции. URL
Келлер Х. История моей жизни URL
Смирнова А. Зорина З. О чем рассказали говорящие обезьяны: Способны ли высшие животные оперировать символами? URL

P.S. Пишите bvv2311@mail.ru

Подробнее..

Категории: Алгоритмы , Энтропия , Язык , Состояние , Однозначность , Преобразование

Перевод Наглядно о том, почему трансформеры работают настолько хорошо

20.06.2021 18:15:44 |

Автор: admin

Трансформеры за последние несколько лет штурмом захватили мир NLP, а сегодня они с успехом применяются в выходящих за рамки NLP приложениях. Они обладают такими возможностями благодаря модулю внимания, который схватывает отношения между всеми словами последовательностей. Но самый важный вопрос как именно трансформеры делают это? Попытаемся ответить и понять, почему трансформеры способны выполнять такие вычисления. Итак, цель статьи, чуть сокращённым переводом которой мы делимся к старту курса о машинном и глубоком обучении, разобраться не только с тем, как что-то работает, но и почему работает так. Чтобы понять, что движет трансформерами, мы должны сосредоточиться на модуле внимания. Начнём с входных данных и посмотрим, как они обрабатываются.

Как входная последовательность попадает в модуль внимания

Модуль внимания присутствует в каждом энкодере внутри стека каждого энкодера, а также внутри стека каждого декодера. Сначала внимательно посмотрим на энкодер.

Модуль внимания в энкодере

Для примера предположим, что мы работаем над задачей перевода с английского на испанский, где исходная последовательность слов The ball is blue, а целевая последовательность La bola es azul.

Исходная последовательность сначала проходит через слой векторного представления и позиционного кодирования, генерирующего векторы векторного представления для каждого слова последовательности. Векторное представление передаётся в энкодер, где вначале попадает в модуль внимания.

Внутри модуля внимания последовательность векторного представления проходит через три линейных слоя, создающих три отдельные матрицы запроса (Query), ключа (Key) и значения (Value). Именно эти три матрицы используются для вычисления оценки внимания [прим. перев. оценка определяет, сколько внимания нужно уделить другим частям входного предложения, когда мы кодируем слово в определённой позиции]. Важно помнить, что каждая "строка" этих матриц соответствует одному слову исходной последовательности.

Поток исходной последовательности

Каждая входная строка это слово из последовательности

Чтобы понять, что происходит с модулем внимания, мы начнём с отдельных слов исходной последовательности, проследив их путь через трансформер. Если конкретнее, мы хотим сосредоточиться на происходящем внутри модуля внимания. Это поможет нам чётко увидеть, как каждое слово в исходной и целевой последовательностях взаимодействует с другими словами этих последовательностей.

Пока вы разбираетесь с этим объяснением, сосредоточьтесь на том, какие операции выполняются с каждым словом и как каждый вектор отображается на исходное входное слово. Не нужно думать о множестве других деталей, таких как формы матриц, особенности арифметических вычислений, множественное внимание и так далее, если эти детали не относятся напрямую к тому, куда направляется каждое слово. Итак, чтобы упростить объяснение и визуализацию, давайте проигнорируем размерность векторного представления и будем отслеживать только строки для каждого слова.

Расположение каждого слова в исходной последовательности

Каждое слово проходит серию обучаемых преобразований (трансформаций)

Каждая такая строка была сгенерирована из соответствующего исходного слова посредством серии трансформаций векторного представления, позиционного кодирования и линейного слоя. Все эти трансформации возможно обучить; это означает, что используемые в этих операциях веса не определены заранее, а изучаются моделью таким образом, чтобы они давали желаемые выходные прогнозы.

Линейные веса и веса векторного представления обучены

Ключевой вопрос заключается в том, как трансформер определяет, какой набор весов даст ему наилучшие результаты? Держите этот момент в памяти мы вернёмся к нему немного позже.

Оценка внимания это скалярное произведение матрицы ключа и матрицы запроса слов

Модуль внимания выполняет несколько шагов, но здесь мы сосредоточимся только на линейном слое и на оценке внимания.

Многоголовое внимание

Расчёт оценки внимания

Как видно из формулы, первый шаг в рамках модуля внимания умножение матрицы, то есть скалярное произведение между матрицей Query (Q) и транспонированием матрицы ключа Key (K). Посмотрите, что происходит с каждым словом. Итог промежуточная матрица (назовём её факторной матрицей [матрицей множителей]), где каждая ячейка это результат матричного умножения двух слов.

Скалярное произведение матрицы запроса и матрицы ключа

Например, каждый столбец в четвёртой строке соответствует скалярному произведению между четвёртым словом запроса и каждым ключевым словом.

Скалярное произведение между матрицами запроса и ключа

Оценка внимания скалярное произведение между запросом-ключом и значением слов

Следующим шагом является матричное умножение между этой промежуточной матрицей множителей и матрицей значений (V), чтобы получить оценку внимания, который выводится модулем внимания. Здесь мы можем видеть, что четвёртая строка соответствует четвёртой матрице слов запроса, умноженной на все остальные ключевые слова и значения.

Скалярное произведение между матрицами ключа запроса и значения

Получается вектор оценки внимания (Z), который выводится модулем внимания. Выходной результат можно представить следующим образом: для каждого слова это закодированное значение каждого слова из матрицы Значение, взвешенное матрицей множителей. Матрица множителей представляет собой точечное произведение значения запроса для данного конкретного слова и значения ключа для всех слов.

Оценка внимания это взвешенная сумма значения слов

Какова роль слов запроса, ключа и значения?

Слово запроса это слово, для которого мы рассчитываем внимание. В свою очередь слово ключа и значения это слово, на которое мы обращаем внимание, то есть определяем, насколько это слово соответствует слову запроса.

Оценка внимания для слова blue обращает внимание на каждое слово

Например, для предложения The ball is blue строка для слова blue будет содержать оценку внимания для слова blue с каждым вторым словом. Здесь blue это слово запроса, а другие слова ключ/значение. Выполняются и другие операции, такие как деление и softmax, но мы можем проигнорировать их в этой статье. Они просто изменяют числовые значения в матрицах, но не влияют на положение каждой строки слов в ней. Они также не предполагают никаких взаимодействий между словами.

Скалярное произведение сообщает нам о сходстве слов

Итак, мы увидели, что оценка внимания отражает некоторое взаимодействие между определённым словом и каждым другим словом в предложении путём скалярного произведения с последующим их сложением. Но как матрица умножения помогает трансформеру определять релевантность между двумя словами?

Чтобы понять это, вспомните, что строки запроса, ключа и значения на самом деле являются векторами с размерностью векторного представления. Давайте посмотрим, как умножаются матрицы между этими векторами.

Каждая ячейка представляет собой скалярное произведение двух векторов слов

Для получения скалярного произведения двух векторов мы умножаем пары чисел, а затем суммируем их.

Если два парных числа (например, a и d выше) оба положительны или оба отрицательны, произведение положительно. Произведение увеличит итоговую сумму.
Если одно число положительное, а другое отрицательное, произведение будет отрицательным. Произведение уменьшит итоговую сумму.
Если произведение положительное, то, чем больше два числа, тем больше их вклад в окончательную сумму.

Это означает, что, если знаки соответствующих чисел в двух векторах выровнены, итоговая сумма будет больше.

Как трансформер изучает релевантность между словами?

Скалярное произведение также применимо к оценке внимания. Если векторы для двух слов более выровнены, оценка внимания будет выше. Итак, какого поведения мы хотим от трансформера? Мы хотим, чтобы оценка внимания была высокой для двух релевантных друг другу слов в предложении. И мы хотим, чтобы оценка двух слов, не связанных друг с другом, была низкой.

Например, в предложении The black cat drank the milk слово milk очень релевантно к drank, возможно, немного менее релевантно для cat, и нерелевантно к black. Мы хотим, чтобы milk и drink давали высокую оценку внимания, чтобы milk и cat давали немного более низкую оценку, а для milk и black незначительную. Мы хотим, чтобы модель научилась воспроизводить этот результат. Чтобы достичь воспроизводимости, векторы слов milk и drank должны быть выровнены. Векторы milk и cat несколько разойдутся. А для milk и black они будут совершенно разными.

Давайте вернёмся к вопросу, который мы откладывали: как трансформер определяет, какой набор весов даст ему наилучшие результаты? Векторы слов генерируются на основе векторного представления слов и весов линейных слоёв. Следовательно, трансформер может изучить эти векторные представления, линейные веса и так далее, чтобы создать векторы слов, как требуется выше.

Другими словами, он будет изучать эти векторные представления и веса таким образом, что если два слова в предложении релевантны друг другу, то их векторы слов будут выровнены, следовательно, получат более высокe. оценку внимания. Для слов, которые не имеют отношения друг к другу, их векторы не будут выровнены и оценка внимания будет ниже.

Следовательно, векторные представления слов milk и drank будут очень согласованными и обеспечат высокую оценку внимания. Они будут несколько отличаться для milk и cat, производить немного более низкую оценку и будут совершенно разными в случае milk и black: оценка внимания будет низкой вот лежащий в основе модуля внимания принцип.

Итак, как же работает трансформер?

Скалярное произведение между запросом и ключом вычисляет релевантность между каждой парой слов. Эта релевантность затем используется как множитель для вычисления взвешенной суммы всех значений слов. Эта взвешенная сумма выводится как оценка внимания. Трансформер изучает векторные представления и т. д. таким образом, что релевантные друг другу слова были более согласованы.

В этом кроется одна из причин введения трёх линейных слоёв и создания трёх версий входной последовательности: для запроса, ключа и значения. Такой подход даёт модулю внимания ещё несколько параметров, которые он может изучить, чтобы подстроить процесс создания векторов слов.

Самовнимание энкодера в трансформере

Внимание используется в трансформере в трёх местах:

Самовнимание в энкодере исходная последовательность обращает внимание на себя.
Самовнимание в декодере целевая последовательность обращает внимание на себя.
Энкодер-декодер-внимание в декодере целевая последовательность обращает внимание на исходную последовательность.

Внимание в Трансформере

В самовнимании энкодера мы вычисляем релевантность каждого слова в исходном предложении каждому другому слову в исходном предложении. Это происходит во всех энкодерах стека.

Декодер самовнимания в трансформере

Большая часть того, что мы только что видели в энкодере самовнимания, применима и к вниманию в декодере, но с некоторыми существенными отличиями.

Внимание в декодере

В декодере самовнимания мы вычисляем релевантность каждого слова в целевом предложении каждому другому слову в целевом предложении.

Самовнимание декодера

Энкодер-декодер модуля внимания в трансформере

В энкодере-декодере запрос получается из целевого предложения, а ключ/значение из исходного предложения. Таким образом, он вычисляет релевантность каждого слова в целевом предложении каждому слову в исходном предложении.

Энкодер-декодер Внимания

Заключение

Надеюсь, статья дала вам хорошее представление об элегантности архитектуры трансформера. Прочтите также другие статьи о трансформере из моей серии, чтобы лучше представлять, почему сегодня трансформер это предпочтительная архитектура многих приложений глубокого обучения.

Здесь мы видим, что за сложными идеями скрываются простые решения. Более того, есть ощутимая вероятность того, что вскоре понимание внутренних механизмов глубокого обучения станет второй грамотностью, как сегодня второй грамотностью стало знание ПК в целом и если вы хотите углубиться в область глубокого и машинного обучения, получить полное представление о современном ИИ, вы можете присмотреться к нашему курсу Machine Learning иDeep Learning, партнёром которого является компания NVIDIA.

Узнайте, как прокачаться и в других специальностях или освоить их с нуля:

Другие профессии и курсы

ПРОФЕССИИ

КУРС

Подробнее..

Категории: Математика , Искусственный интеллект , Блог компании skillfactory , Natural language processing , Nlp , Матрицы , Занимательные задачки , Слова , Ии , Skillfactory , Трансформеры , Векторы , Преобразование , Векторное представление

	Русский
	English

Преобразование

Вкусная экология преобразование пластика в ванилин

Основа исследования

Результаты исследования

Эпилог

Немного рекламы

Язык кибернетики. Ищем то, что однозначно

Перевод Наглядно о том, почему трансформеры работают настолько хорошо

Как входная последовательность попадает в модуль внимания

Каждая входная строка это слово из последовательности

Каждое слово проходит серию обучаемых преобразований (трансформаций)

Оценка внимания это скалярное произведение матрицы ключа и матрицы запроса слов

Оценка внимания скалярное произведение между запросом-ключом и значением слов

Какова роль слов запроса, ключа и значения?

Скалярное произведение сообщает нам о сходстве слов

Как трансформер изучает релевантность между словами?

Итак, как же работает трансформер?

Самовнимание энкодера в трансформере

Декодер самовнимания в трансформере

Энкодер-декодер модуля внимания в трансформере

Заключение

Категории

Последние комментарии