Как исследователи учат алгоритмы определять запах

Вероника Елкина

Исследователи Google обучают нейронные сети угадывать, как будет пахнуть молекула по ее химической структуре. Первая модель уже показала успешный результат.

Как исследователи учат алгоритмы определять запах

Вероника Елкина

У Google есть собственный парфюм — его разработала одна из исследовательских команд компании. Аромат создавался под руководством опытных французских парфюмеров и представляет собой запах с нотками ванили, жасмина, дыни и земляники. «Получилось не так уж плохо», — говорит Алекс Вильтшко, который держит флакон этого парфюма у себя на кухне.

Но Google пока не собирается рекламировать получившийся аромат, но в целом активно интересуется самим понятием запаха. В прошлый четверг исследователи из Google Brain опубликовали научную работу о том, как они научили ряд алгоритмов машинного обучения определять запах молекул по их структуре. Принесет ли это такую же пользу, как составление карт? Возможно, нет. Но для исследований в области запахов работа Google может помочь найти ответы на серьезные и старые вопросы.

Наука об обонянии сильно отстает по сравнению со многими другими. Например, человечество поняло природу света еще несколько веков назад. В 17 веке Исаак Ньютон использовал призмы, чтобы расщепить белый свет на знакомые нам цвета радуги. Дальнейшие исследования показали, что мы воспринимаем разные цвета, потому что это волны разной длины. Стоит взглянуть на палитру цветов и все становится понятно. Но для запахов нет такой палитры.

Если волны разной длины это базовые компоненты света, то запахи состоят из молекул. Когда молекулы попадают в нос, они взаимодействуют с рецепторами, которые подают сигнал в маленькую область мозга под названием обонятельная луковица. И тогда мы думаем: «М-м-м, это же попкорн!». Ученые могут изучить длину волны и определить, каким будет цвет, но с молекулами и запахом такое сделать невозможно.

Подписывайтесь на канал Rusbase в «Яндекс.Дзен», чтобы ничего не пропустить

Вообще доказано, что крайне сложно определить запах молекулы по ее химической структуре. Стоит убрать один атом или одну связь, как «запах розы превратится в запах тухлых яиц», утверждает Вильтшко, руководитель этого исследовательского проекта Google.

Уже было несколько попыток научить алгоритмы определять шаблоны, благодаря которым одна молекула может пахнуть чесноком, а другая жасмином. Еще в 2015 году исследователи создали проект DREAM Olfaction Prediction Challenge. В его рамках они собрали описания запахов от сотен людей и проверяли, смогут ли различные алгоритмы, использующие машинное обучение, предугадать запах молекулы.

Некоторые команды подключили ИИ к полученным данным и смогли дать успешные прогнозы. Но команда Вильтшко выбрала иной подход — она использовала графовые нейронные сети или GNN. Большинству алгоритмов на основе машинного обучения нужно, чтобы информация подавалась в виде прямоугольной расчетной сетки. Но не все данные можно вместить в этот формат. GNN способны обрабатывать графы, например, сеть друзей в социальных сетях или собрание академических цитат из журналов. С помощью графов можно предсказать, кого вы следующим добавите в друзья в соцсети. А в случае с запахами, то GNN могут изучить структуру каждой молекулы и определить, что в одной из них, например, атом углерода находится на пять атомов дальше от атома азота.

Команда Google использовала сет данных о примерно 5000 молекул, полученных от опытных парфюмеров, которые дали описание запаха каждой молекулы (например, «древесный», «жасминовый» или «сладкий»). Исследователи обучили нейросеть на двух третьих этих данных, а затем проверили, сможет ли она предсказать аромат оставшихся молекул. И нейросеть смогла.

Первая версия GNN сработала так же хорошо, как модели других групп. Но Вильтшко считает, что если ее доработать, то можно добиться даже лучшего результата. «Думаю, мы сделали шаг вперед в науке», — говорит он.

Как и любой инструмент, использующий машинное обучение, GNN ограничена качеством данных. Однако Алексей Кулаков, исследователь лаборатории Cold Spring Harbor, считает, что проект сам по себе ценен, потому что принес тысячи новых молекул в существующие дата-сети, используемые для обучения алгоритмов. Кулаков отметил, что неясно, сможем ли мы узнать что-то новое про обоняние человека с помощью цифровой модели, потому что нейросеть работает не так, как организм человека.

Наше восприятие запаха отличается от того, как его понимает искусственный интеллект. Две молекулы могут пахнуть по-разному, но даже опытный нос может распознать их запах, как «древесный» или «земляной».

Вильтшко признает слабость GNN в одной важной детали — хиральных парах, где могут использоваться одинаковые атомы и связи, но расположенные как зеркальные отражения друг друга. Разница в положении может вызвать совершенно разные запахи — например, тмина и мяты. Наш нос распознает их как разные запахи, а GNN примет за один. «Мы знаем, что наших дата-сетах есть хиральные пары и мы понимаем, что алгоритмы не могут их корректно распознать», — говорит Вильтшко. Следующим шагом для исследователей будет поиск решения этой проблемы.

А еще в исследовании ничего не говорится о смесях и комбинациях запахов, которые значительно влияют на наше восприятие молекул. Однако то, что ученые поняли, какие качества определяют запах молекулы, это уже важное открытие для сферы изучения обоняния. А значит со временем, возможно, исследователи смогут составить палитру и для запахов.

Источник.

Источник: rb.ru

Добавить комментарий