Перевод Символьная математика, наконец, начинает поддаваться нейросетям

Переведя на язык машин часть сложных математических уравнений, исследователи создали систему с искусственным интеллектом, надеясь, что она даст ответы на ещё более сложные вопросы

Переводя задачи символьной математики в древовидные структуры, мы, наконец, можем заставить нейросети решать абстрактные задачи

Более 70 лет назад исследователи на переднем крае изучения искусственного интеллекта (ИИ) придумали нейросети революционный способ представить работу мозга человека. В мозге человека сети, состоящие из миллиардов связанных между собой нейронов, осмысливают приходящие с органов чувств данные, что позволяет нам учиться на опыте. Искусственные нейросети тоже умеют фильтровать через взаимосвязанные слои данные в огромных количествах, и, пользуясь самостоятельно выученными правилами, делать предсказания и распознавать закономерности.

Сегодня люди считают нейросети некоей панацеей из области ИИ, способной решать любые технические задачи, которые можно переформулировать в виде задач на распознавание закономерностей. Они умеют делать [почти] естественно звучащие переводы с языка на язык. Приложения для работы с фотографиями используют их для распознавания и разделения по категориям лиц, встречающихся на снимках. Программы на основе нейросетей обыграли лучших игроков мира в разные настольные игры, включая шахматы и го.

Однако в одной области нейросети традиционно отставали: в решении сложных задач символьной математики. Это, например, типичные задачи из курсов дифференциального и интегрального исчисления. Проблемы возникают по причине устройства самой математики, требующей точных решений задач. Нейросети тем временем обычно полагаются на вероятности. Они учатся распознавать закономерности какой из вариантов перевода на испанский лучше звучит, или как выглядит ваше лицо на фото и способны создавать новые.

Ситуация изменилась в конце прошлого года, когда Гийом Лампл [Guillaume Lample] и Франсуа Шартон [Franois Charton], пара специалистов по информатике из парижской исследовательской группы ИИ в Facebook, раскрыли первый удачный подход к решению задач символьной математики при помощи нейросетей. В их метод не входят обработка гор цифр или числовые аппроксимации. Вместо этого они сыграли на сильных сторонах нейросетей, переформулировав математические задачи в терминах задач, уже почти решённых: переводов с языка на язык.

В институте мы оба изучали математику и статистику, сказал Шартон, изучающий применение ИИ в математике. Изначально мы говорили на языке математики.

В итоге программа Лампла и Шартона может выдавать точные решения сложных интегралов и дифференциальных уравнений включая и такие, на которых спотыкаются популярные математические программы со встроенными правилами решения задач.

Франсуа Шартон (слева) и Гийом Лампл, специалисты по информатике из парижской исследовательской группы ИИ в Facebook

Новая программа эксплуатирует одно из основных достижений нейросетей: способность самостоятельно формулировать правила работы. В итоге, правила и исключения не хранятся отдельно, сказал Джей Маклиланд, психолог из Стэнфордского университета, использующий нейросети для моделирования процесса изучения математики людьми. На практике это означает, что программа не спотыкается на самых сложных интегралах. В теории такой подход может вывести нетрадиционные правила, которые помогут человеку или машине разобраться с нерешёнными на сегодня задачами. Это могут быть такие математические задачи, как открытие новых доказательств или понимание природы самих нейросетей.

Конечно, пока такого мы не видим. Но команда явно утвердительно ответила на вопрос возрастом в несколько десятков лет может ли ИИ заниматься символьной математикой? Модели у них общепризнанные. Алгоритмы общепризнанные. Они хитрым образом формулируют задачи, сказал Войцех Заремба, сооснователь группы исследования ИИ OpenAI.

Им удалось создать нейросети, способные решать задачи, выходившие за рамки возможностей машин, следовавших правилам, сказал Маклиланд. И это очень здорово.

Обучаем компьютер математическому языку

Компьютеры всегда хорошо справлялись с обработкой чисел. Системы компьютерной алгебры комбинируют десятки и сотни чётко определённых алгоритмов, жёстко прописанных в коде. Обычно они строго следуют правилам, направленным на выполнение конкретных операций, и не приемлют исключений. Для многих символьных задач они выдают численные решения с точностью, достаточной для инженерных и физических целей.

Нейросети так не работают. В них не записаны чёткие правила. Они обучаются на больших наборах данных чем больше, тем лучше и используют статистику, чтобы делать очень хорошее приближение. В процессе они обучаются тому, что даёт наилучший результат. Особенно хороши программы перевода текстов: они переводят не пословно, а сразу целыми фразами в контексте всего текста. Исследователи из Facebook решили, что это может стать не препятствием, а преимуществом при решении задач символьной математики. Такой подход даёт программе некую свободу в решении.

Такая свобода особенно полезна для определённых задач открытого типа, например, интегрирования. У математиков есть старая поговорка: взятие производных действие механическое, а интегралов творческое. Чтобы найти производную функции, нужно следовать хорошо описанным действиям. Но при поиске интеграла часто требуется что-то ещё, что-то более близкое к интуиции, чем к вычислениям.

Группа из Facebook подозревала, что эту интуицию можно аппроксимировать при помощи распознавания образов. Интегрирование одна из наиболее похожих на распознавание закономерностей задач в математике, сказал Шартон. Так что хотя нейросеть может и не понимать, что делают функции, или что означают переменные, она вырабатывает определённый инстинкт. Нейросеть начинает чувствовать, что может сработать, даже не понимая, почему.

К примеру, математик, которому предложат проинтегрировать выражение типа yy(y²+1)^1/2, он интуитивно предположит, что первообразная функция выражение, которое нужно продифференцировать, чтобы получить заданное содержит что-то вроде квадратного корня из y²+1.

Чтобы дать нейросети возможность работать с символами, как это делают математики, Шартон и Лампл начали с перевода математических выражений в более удобную форму. В итоге они представили их в виде деревьев в формате, похожем на разбор членов предложения в виде диаграммы. Математические операторы сложение, вычитание, умножение, деление стали узлами дерева, как и возведение в степень или тригонометрические функции. Аргументы (переменные и числа) стали его листьями. Древовидная структура, за некоторыми редкими исключениями, отражает то, как операции располагаются внутри длинных выражений.

Изучая большую функцию, мы можем видеть, что она состоит из более мелких, и интуитивно представляем, каким может быть решение, сказал Лампл. Мы думаем, что модель пытается находить в символах подсказки по поводу решения. Он сказал, что этот процесс сравним с тем, как люди берут интегралы и вообще решают математические задачи сводя их к узнаваемым подзадачам, которые они уже решали ранее.

Переписав уравнения в виде ветвящихся наборов взаимосвязей, исследователи создали нейросети, способные работать с символьной математикой. Математические операторы сложение, вычитание, умножение, деление становятся узлами дерева, а аргументы (переменные и числа) листьями. Такой подход позволяет нейросети вырабатывать что-то вроде математической интуиции.

Разработав такую архитектуру, исследователи использовали базу элементарных функций, чтобы сгенерировать несколько обучающих наборов данных, в сумме содержащих порядка 200 млн уравнений и их решений, представленных в виде деревьев. Затем они скормили эти данные нейросети, чтобы она обучилась тому, как выглядят решения этих задач.

После обучения настала пора посмотреть, на что способна нейросеть. Учёные испытали её на 5000 уравнений, уже без готовых ответов (ни одно из них, правда, нельзя было отнести к нерешаемым). Нейросеть отлично справилась с задачей, и нашла правильные решения для большинства из них. Особенно хорошо ей удавалось интегрирование, она решила почти 100% из таких испытательных задач, но немного хуже справилась с обычным дифференцированием.

На выдачу правильного решения почти всех задач у программы обычно уходило не более 1 секунды. На задачах по интегрированию она обогнала по скорости и точности популярные программы для решения задач, Mathematica и Matlab. Команда из Facebook сообщила, что нейросеть даже выдавала решения таких задач, которые были не под силу коммерческим программам.

Что в чёрном ящике

Несмотря на все эти результаты, математик Роджер Гермундсон, возглавляющий отдел исследования и разработки компании Wolfram, производителя пакета Mathematica, не согласен с таким прямым сравнением. Исследователи из Facebook сравнили свой метод только с небольшим количеством функций пакета Mathematica integrate для интегралов и DSolve для дифференциальных уравнений. Однако у пользователей Mathematica есть доступ к сотням других инструментов.

Гермундсон также отметил, что, несмотря на огромный размер набора обучающих данных, в него входили только уравнения с одной переменной, и основанные на элементарных функциях. Это тонкий срез всех возможных выражений, сказал он. Нейросеть не проверяли на более запутанных функциях, которые часто используются в физике и финансах, типа функции ошибок или функции Бесселя (группа из Facebook ответила, что это будет возможно в будущих версиях нейросети, после небольших модификаций).

А Фредерик Гибу, математик из Калифорнийского университета в Санта-Барбаре, изучавший методы использования нейросети для решения дифференциальных уравнений в частных производных, не был убеждён в непогрешимости нейросети, созданной группой из Facebook. Нужно быть уверенным, что система сработает во всех случаях, а не только на нескольких избранных задачах, сказал он, а здесь такой уверенности нет. Другие критики отмечали, что нейросеть группы из Facebook не понимает математику, а просто делает очень хорошие догадки.

И всё же они соглашаются с тем, что новый подход будет полезным. Гермундсон и Гибу считают, что нейросети заслужат себе место в ряду программ для решения уравнений следующего поколения просто ряд будет очень длинным. Думаю, что они станут одним из множества инструментов, сказал Гермундсон.

Кроме решения конкретной задачи из символьной математики, работа группы из Facebook служит вдохновляющим доказательством работоспособности принципа и его возможностей. Математиков в целом очень впечатлит, если эти технологии позволят им решить задачи, недоступные до этого людям, сказал Андерс Хансен, математик из Кембриджского университета.

Ещё одно вероятное направление использования нейросетей, которое стоит изучить разработка автоматических генераторов теорем. Математики всё чаще ищут способы использовать ИИ для генерации новых теорем и доказательств, хотя лучшие из них пока ещё не демонстрируют прогресса, сказал Лампл. Пока мы изучаем этот вопрос.

Шартон описывает, по меньшей мере, два способа, которыми их подход может помочь развить генераторы теорем. Во-первых, нейросеть может служить чем-то вроде ассистента математика, помогая разбираться с существующими задачами посредством поиска закономерностей в известных теоремах. Во-вторых, машина могла бы выдавать список потенциально доказуемых результатов, которые математики могли пропустить. Мы считаем, что если она с интегрированием справляется, то и с доказательствами должна справиться, сказал он.

Приложение, помогающее в поиске доказательств, может стать отличным подспорьем, и даже выйти за пределы того, что описывала команда из Facebook. Один из распространённых способов опровергнуть теорему найти контрпример, показывающий, что она неверна. Когда-нибудь нейросети окажутся идеально подходящим для этой задачи инструментом: они будут искать неожиданные способы вставлять палки в колёса.

Ещё одна нерешённая задача, в решении которой такой подход может помочь, связана с наиболее неприятным аспектом нейросетей: никто не понимает, как они работают. С одной стороны в нейросеть входят обучающие данные, а с другой выходят предсказания, но что происходит в середине конкретный процесс, позволяющий нейросети выдавать такие хорошие догадки остаётся критически важным открытым вопросом.

Символьная математика, с другой стороны, определённо менее загадочная вещь. Мы знаем, как работает математика, сказал Шартон. Используя определённые математические проблемы в качестве проверки того, где машины справляются, а где нет, мы можем разобраться в том, как работают нейросети.

Вскоре они с Ламплом планируют начать подавать своим сетям на вход математические выражения и отслеживать, как их программа реагирует на небольшие изменения в этих выражениях. Разметка того, как изменения во входных данных изменяют выходные, может помочь раскрыть процесс работы нейросети.

Заремба считает, что такое понимание потенциально может помочь нам научить нейросети рассуждать, и реально понимать вопросы, на которые они ищут ответы. В математике достаточно легко изменить данные и посмотреть, насколько хорошо справляется нейросеть, когда выражение меняется. Мы можем научиться рассуждать, а не просто получать ответ, сказал он. И тогда у нас появятся огромные возможности.

Трансформеры за последние несколько лет штурмом захватили мир NLP, а сегодня они с успехом применяются в выходящих за рамки NLP приложениях. Они обладают такими возможностями благодаря модулю внимания, который схватывает отношения между всеми словами последовательностей. Но са

Пример расчётного доказательства в Lean

Математики давно используют компьютеры в своей работе как инструменты для сложных вычислений и выполнения рутинных операций перебора. Например, в 1976 году методом компьютерного перебора была доказана

Зарабатывать продажей лекарств, которые заведомо не работают, не только аморально, но и не особо легко. Люди всё-таки обычно не хотят покупать препараты, неэффективность которых была доказана. А вот если вы сумели выдавить заветное p < 0.05 в пользу того, что акупунктура та

В этой статье мы рассмотрим, что такое классификатор, поговорим о мультиклассовой классификации с помощью нейронных сетей. Затем, ознакомившись с контекстом перейдем к основному топику поста к Log-Sum-Exp Trick. Напишем формулы и разберемся, как этот трюк помогает избежать переполнения чисел с плавающей то

В дополнение к открытым спутниковым данным, некоторые из которых перечислены в статье Общедоступные данные дистанционного зондирования Земли: как получить и использовать, существует и множество производных продуктов например, рельеф. Притом можно найти открытый рельеф разного пространственного разрешения, равно как и множество коммерческих, и появляется задача выбрать лучший продукт из доступных.

Призма Вельда-Бланделла

На рубеже четвертого и третьего тысячелетия до нашей эры на Земле возникли две первые цивилизации. В долине Нила после объединения верхнего и нижнего Египта образовалось

Очень много людей с самым разным бэкграундом, и не всегда даже техническим, в последнее время пытаются перейти в data science. И такой ажиотажный интерес - проблема для всех, кто рассматривает переквалификацию в эту сферу. Потому что рынок труда может оказаться наводнён соискателям без опыта.

С точки зрения потенциального работодателя: вы скорее возьмёте выпускника технического вуза, или человека за 40, без профильного опыта

Задача распознавания семантического следования (textual entailment), или импликации (natural language inference), в текстах на естественном языке состоит в определении того, может ли часть текста (посылка, антецедент) подразумеваться или противоречить (или не противоречить) другому фрагменту текст

Технология распознавания эмоций в речи может может найти применение в огромном количестве задач. В частности, это позволит автоматизировать процесс мониторинга качества обслуживания клиентов call-центров.

Определение эмоций человека по его речи уже относительно насыщенн

Мне давно нравятся Байесовские сети доверия

Представьте ситуацию: вам нужно воспользоваться оплаченным (как вы думаете) сервисом и вдруг оказывается, что он отключен за неуплату. Такая неприятность портит впечатление от бренда, снижая поток прибыли, а внезапно отключенный клиент может не вернуться к сервису. К старту ку

В этой подборке исследуем StoreKit 2, распознаем лица и позы на Android, улучшаем производительность React-приложений, учим сквирклморфизм и многое другое!

Этот дайджест доступен в виде еженедельной

Но ученые научились определять, где система дает сбой.

MS TECH | GETTY, UNSPLASH

В далекое прошлое ушли уютные форумы, где люди-модераторы заставляли участников следовать правилам и

Для начала хотелось бы упомянуть, что это далеко не первое исследование подобного рода. Начиная с 1960-х готов по настоящее время было разработанно множество программных комплексов и методик, позволяющие решать задачи идентификационного (кем именно была выполнена рукопись, представленная на исследование) и диагностического характера (дифференциации рукописей на мужское и женское, вычисление предполагаемого возраста исполнителя руко

Оракул технологического мира Gartner регулярно и охотно делится с обществом своими наблюдениями относительно текущих трендов. Эксперты компании составили подборку из 10 трендов в сфере данных и аналитики, которые стоит учитывать ИТ-лидерам в 2021 году от искусственного интеллекта до малых д

Впрошлой статьебыла попытка показать весь процесс обучения, отбора и тестирования моделей на торговой паре EUR/USD. В Google Colab работала схема:обучаем модели->тестируем->рисуем на графике. Попытка оказалась неудачной. Стремление не тащить в Colab тонну кода, а максимально все упростить привело к очень низкому качеству обучения. Сигналы выглядели неубедительно и кучковались

В конце прошлого года, Booking.com запустил соревнование по построению рекомендательного алгорима для путешественников. Задача наилучшим образом предсказать следующий город для пользователя, основывываясь на предыдущих посещенных городах.

Рекомендации городов в booking.com, картинка

Недавно нам понадобилось чистить звук на рекламном ролике: во время записи шумел кулер. Обычно, в таких ситуациях дергается звукорежиссер, который долго и мучительно вычищает звуковую дорожку руками.

Но мы решили пойти новым путем и прогнали звуковую дорожку через

Компания Dragon Tree Labs объединяет индивидуальных разработчиков и команды робототехников для общей цели создать робота-аватара, который стал бы продолжением человека, который им управляет, расширил бы возможности телеприсутствия и дистанционного физического взаимодействия с объектами реального мира.

Это совпадает с целями международного конкурса

Как я говорил во вступлении к первой части, я frontend-разработчик, и мой родной язык - JavaScript, реализовывать нашу нейросеть в рамках данной статьи мы будем именно на нем. Для начала несколько слов о структуре. За исключением различных вычисляемых свойств и методов, объект нейросети будет содержать в себе массив слоев layers, каждый слой будет содержать массив нейронов neurons, а кажды

В предыдущей части статьи мы написали реализацию простейшей нейросети в виде JS класса. Теперь давайте попробуем дать ей настоящее задание. Сценарий будет следующим: пользователь будет рисовать в определенном блоке веб-страницы смайл, а наша нейросеть попробует определить грустный он или веселый. Давайте приступим.

Так как мы реализуем наше небольшое приложение в виде веб-страницы, а

Переведя на язык машин часть сложных математических уравнений, исследователи создали систему с искусственным интеллектом, надеясь, что она даст ответы на ещё более сложные вопросы

0. Предисловие

Математика представляет собой универсальный, мощный и элегантный раздел знания. По-сути её предмет и значение невозможно разделить с наиболее фундаментальными разделами философии логикой, онтологией и теорией познания. Именно поэтому она касается прямо или косвенно всех аспектов любого прикладного или теоретического знания.

К сожалению, так сложилось, что многим (и мне) она, порой кажется, слишком сло

Переведя на язык машин часть сложных математических уравнений, исследователи создали систему с искусственным интеллектом, надеясь, что она даст ответы на ещё более сложные вопросы

Актуальность

Конечные автоматы (finite state machines, fsm) штука полезная. Особенно они могут быть востребованы в средах, где в принципе нет развитой многозадачности (например, в Octave, который является в значительной степени бесплатным аналогом Matlab) или в программах для микроконтроллеров, где не используется по каким-то причинам RTOS. До недавнего времени у меня не получалось лаконично описать коне

Лекции по курсу Управление Техническими Системами читает Козлов Олег Степанович на кафедре Ядерные реакторы и энергетические установки факультета Энергомашиностроения МГТУ им. Н.Э. Баумана. За что ему огромная благодарность!

Данные лекции готовятся к публикации в виде книги, а поскольку здесь есть специалисты по ТАУ, студенты и просто интересующиеся предметом, то любая критика приветствуется. В предыдущих сериях:

Колебательное звено является наиболее интересным случаем из всех типовых звеньев, во-первых,за счет сильной похожести по своим динамическим свойствам на более сложные реальные САУ (САР), во-вторых, близкой идентичности переходных процессов в звене к аналогичным в реальных САР, и, в-третьих, существенной зависимости динамических свойств от величины параметра звена.

Выведем формулу колебательного звена на примере электрическог

Предыдущая часть Апереодическое звено первого порядка.

3.4 Апереодическое звено второго порядка

Апереодическое звено выведем на уже известном примере. Мы разбирали вывод уравнений динамики демпфера в этой лекции. Но повторенье - мать ученья. Сначала будет много жесткой математики, а в конце наглядные модели.

У нас есть модел

За основу задания динамических свойств систем может быть принята любая из форм представления операторов: дифференциальные уравнения (ДУ), передаточные функции (ПФ), временные характеристики (ВХ) или частотные характеристики (ЧХ), однако для конкретных задач целесообразно выбирать наиболее рациональную форму [1].
Возможные преобразования форм представления моделей вход-выход показаны на Рисунок 1. Сплошные линии орграфа показыва

Активность использования термина "transistor" c 1800 года и до наших дней

Для принятия правильных решений в различ

Отслеживание событий на стороне сервера и Conversion API были доступны на Facebook в течение нескольких лет. Но, начиная с 2021 года, FB стал активнее это продвигать. Если у вас есть свой менеджер в Facebook, помогающий с вашей учетной записью, он, скорее всего, позвонит вам и порекомендует настроить

Как известно, у YouTube отсутствует фича захвата RTSP потока. Возможно, это сделано не случайно, а исходя из голой прагматики, чтобы люди не повесили на YouTube статическое видеонаблюдение за своими подъездами и не утилизировали его каналы, которые, как оказалось в пандемию,

В первой неделе апреля Facebook объявил о том, что инструмент Facebook Analytics будет недоступен после 30 июня 2021 года.

Новость особо не афишировалась. При входе в Facebook Analytics появилась плашка с информацией о грядущем отключении инструмента.

А также со

В субботу 3 апреля в публичный доступ попала огромная база данных пользователей соцсети Facebook. На одном из киберкриминальных форумов появились записи о 533 миллионах пользователей из 106 стран, среди них чуть меньше 10 миллионов учеток из России.

В ответ на запрос СМИ в Facebook под

Лоббирование своих интересов, уничтожение перспективных стартапов, огромные комиссионные сборы и полный контроль интернет-трафика. Все чаще подобные обвинения выдвигаются сторону крупных IT-компаний или Big Tech. Недовольство пользователей порой перерастает в фобию перед

В марте 2020 года началась пандемия, поэтому у меня появилось множество свободного времени. Им нужно было распорядиться с умом, и я решил получить сертификат OSWE. Сдав 8 августа экзамен, я взял пару недель отдыха, а затем в середине сентября сказал сам себе: Знаешь что?

	Русский
	English

Перевод Символьная математика, наконец, начинает поддаваться нейросетям

Обучаем компьютер математическому языку

Что в чёрном ящике

Сейчас читают

Математика

Перевод Наглядно о том, почему трансформеры работают настолько хорошо

Компьютерное доказательство теории конденсированной математики первый шаг к великому объединению

Перевод Plt0.05, и откуда оно (иногда) берётся

Log-Sum-Exp Trick как свойства функций делают работу классификаторов реальной

Оцениваем открытые и коммерческие цифровые модели рельефа

Тайна списка шумерских царей. Часть 1. Машина времени

Машинное обучение

Стоит ли смотреть в сторону Data science?

Перевод Учимся понимать таблицы на меньшем объеме данных

Распознавание эмоций в записях телефонных разговоров

БСД, или как легко объяснить финансистам их же задачи в терминах машинного обучения

Перевод Оптимизация платежей в Dropbox при помощи машинного обучения

Log-Sum-Exp Trick как свойства функций делают работу классификаторов реальной

Искусственный интеллект

Перевод Наглядно о том, почему трансформеры работают настолько хорошо

Дайджест интересных материалов для мобильного разработчика 398 (14 20 июня)

Перевод Оптимизация платежей в Dropbox при помощи машинного обучения

Перевод ИИ все еще не умеет модерировать хейт-спич

О том как мы научили машину определять пол человека по его почерку

Перевод ТОП-10 трендов в сфере данных и аналитики 2021. Версия Gartner

Нейросети

Нейросети и трейдинг. Часть 3 прогнозируем биток на 1 час вперед

Рекомендуем город для путешествия при помощи нейросетей с вниманием

Как мы спасали видео одной вебкам-модели нейросетями

В полуфинале конкурса 10M ANA Avatar XPRIZE единственной командой из Восточной Европы стала Dragon Tree Labs

Нейросеть с нуля своими руками. Часть 2. Реализация

Нейросеть с нуля своими руками. Часть 3. Sad Or Happy?

Символьная математика