Возможно, те кто постарше, еще помнят price.ru. Вот и я еще
помню те времена, когда Яндекс Маркета не было вообще. И даже был
период, когда я пытался делать аналог price.ru для американского
заказчика, и при этом amazon.com был у нас всего-лишь одним из
многих сайтов - источников сведений о товарах (книгах, CD-ROM и
т.п.), при том не самым крупным, и еще был живой yahoo... В общем,
с тех пор многое изменилось.
Потом появился Яндекс Маркет, сильно вырос Амазон, и скажу прямо
- много лет я использовал их как основной инструмент для поиска
нужных мне товаров. А теперь вот подумываю, не уйти ли куда-то, на
e-katalog скажем (шутка, там свои проблемы)? Или найти другое
решение, получше?
Почему, спросите вы? Ну, в первую очередь потому, что поиск.
Поиск категорически перестал меня устраивать.
Попробуем описать для начала, с какими проблемами я сталкивался
при поиске. Яндекс Маркет тут будет как пример, но многое из
описанного касается и других похожих сайтов (Амазон - первый же кто
приходит на ум, и там все почти так же плохо).
Как выглядит поиск здорового человека? Ну, как-то вот так
наверное :)
Если что, это реальный скришнот с мобильного приложения Маркета,
сделанный с год назад. Сочетание страницы про IPhone и фото
циркулярки от DeWalt сделало тогда мой день. Ну ок, это был баг,
его исправили, так что забудем про это и вернемся к реальному
поиску и его результатам.
Я буду использовать в качестве примеров поиск инструмента, как
ту область, которая мне близка и понятна. В области компьютерного
железа, да и пожалуй, в любой другой области, где есть технически
сложные товары, мы будем видеть плюс-минус тоже самое.
Начнем с того, какие на мой взгляд, бывают
интернет-магазины?
-
Узко специализированные. В нашем случае это например магазин
Рубанков, инструменты и прочие
товары для столярки. Его отличает от прочих то, что там знают о
существовании компаний-производителей японского ручного инструмента
Silky, или известнейшей канадской инструментальной компании
Veritas. И продукция этих производителей не просто есть на сайте,
но и, как правило, в наличии. Специализация не значит, что тут вы
найдете все - скажем, инструмент элитного уровня от производителя
Bridge City вы вообще в РФ скорее всего не купите. Но тем не менее,
тут есть многое.
-
Просто специализированные. Это например Все Инструменты. Тут вы тоже
сможете найти товары от той же Silky - но в наличии только одна
пилка (из обширного ассортимента в десятки моделей).
-
Не специализированные. Ну это просто Яндекс Маркет, и
большинство тех, кто продает на нем. Магазины из двух предыдущих
пунктов тут тоже представлены, но структура каталога - от Маркета.
Так вот, в нашем конкретном случае Маркет вообще не знает о
существовании таких производителей, как Silky или Veritas, и даже
если товар (скажем пилу) вы сможете найти - то не через каталог и
выбор производителя. А поиск по Veritas приведет вас в лучшем
случае к швейным машинкам.
В чем состоят проблемы неспециализированных магазинов при поиске
товаров любого относительно узкого сегмента? Ну, наверное проблем
тут больше одной, опишу их как я вижу.
Во-первых, это отсутствие специалистов именно в узком сегменте,
которые бы детально разбирались в товаре. При этом слово "узкий" не
следует понимать буквально, потому что узкий сегмент инструмента, к
примеру, это на самом деле широчайший ассортимент, которые растет и
меняется каждый год. И который производят как известные солидные
фирмы, так и мелкие (в основном китайские) фирмочки. Результат -
неполные и неточные описания товаров.
Во-вторых, типовая, уже скорее техническая проблема - это
отсутствие уникального идентификатора у товара. Очень часто один
товар продается в разных комплектациях. Компьютер в памятью 8 или
16 гигабайт из коробки, инструмент в картонной коробке или кейсе, с
теми или иными дополнительными приспособлениями либо расходкой. При
этом в сущности, это одна и та же модель - но стоимость
дополнительной расходки, кейсов, памяти и пр. вполне может
составлять значительную часть цены. Эта проблема приводит к
дублированию позиций в поиске, и затрудняет выбор лучшего
предложения.
Ну и наверное третья - небольшая глубина и ширина каталога в
специализированных разделах. Скажем, при том что в Яндекс Маркете
есть 14 (sic!) типов ручных рубанков - там все равно нет например
грунтубелей. Ну т.е. даже если у продавца такой появится - в поиске
он все равно будет валяться в общей куче (то, что в Яндекс Маркете
при этом в основном вообще одна китайская дешевка - это отдельная
история, тут я бы винил скорее покупателей, что лучше берут - то и
в продаже).
Таким образом, мы имеем, с одной стороны, объяснимый недостаток
специалистов, которые разбирались бы в товаре, его пользовательской
ценности, комплектации, отличиях моделей друг от друга, а с другой
- кучу этих самых моделей, которые отличаются непойми чем.
На выходе получается тоже довольно странно. Вот например это -
фрагмент моих закладок:
Что мы тут видим? Яндекс Маркет знает, что был вот такой товар,
Bosch Biturbo GKT 18V-52 GC бла-бла-бла (в конце концов, я же
как-то его в закладки поместил, правда?). И он раньше продавался, а
теперь (в этом магазине) не продается. Но он был, и Маркет знает
про него достаточно, чтобы его найти. В теории... а попробуем найти
реально?
Я не буду приводить вам полный скриншот результатов поиска, они
длинные.
Что мы тут видим? Мы видим, что именно этого товара в списке
результатов нет. А есть куча других, которые сюда попали не иначе,
как по недоразумению. Ну то есть, с одной стороны - в списке куча
пил, в названии которых встречается 18V или 18В. С другой - вот на
третьей позиции пилка от Bosch на 12 вольт. С третьей - есть пилы
сетевые. Есть Bosch PRO и Bosch DIY (несовместимые друг с другом).
Есть вообще другие производители. Но самое смешное то, что в
длиннющем списке есть лишь одна сетевая погружная пила, которая
реально является аналогом искомого товара - на восьмом месте в
списке. Ну т.е. на 99% результаты поиска - мусор.
Если вы вдруг не заметили: оно ищет по 18V. А по слову the в
английском тексте они не пробовали искать? Нашли бы намного больше
:) Где же ваш ИИ, в конце концов?
Решение?
Главный вопрос - что с этим можно сделать? Если бы директором
был я (с), то я бы пошел по пути, который давно опробован (скажем,
в картах), и пусть не идеально, но работает. Пусть у вас (а в
данном случае у вас - это ни у кого) нет специалистов, которые
глубоко разбирались бы в товарах, зато у вас есть сообщество. И это
сообщество как раз разбирается - ну хотя бы настолько, насколько
ему это нужно. Следует сделать так, чтобы каталог товаров был
устроен наподобие wiki. И дать возможность пользователям самим
расширять и исправлять характеристики товаров.
Сейчас некоторые карточки товаров уже отличаются от других. Вот
конкретно эта - предложение магазина itUnite:
Вероятно, эти карточки заполняет продавец, а Маркет тут является
платформой, позволяющей магазинам публиковать предложения. И все бы
неплохо - кто публикует, тот и отвечает за качество описания.
Но...
Если посмотреть внимательно, то ровно эта же пила есть и сама по
себе, в виде обычной карточки. Т.е. эта часть товаров просто не
занесены в каталог как следует, и поэтому они дублируют друг друга
(а если предложений много - то это может быть и три карточки, и
больше).
Одна из вещей, которые сообщество могло бы сделать - это как раз
убрать это дублирование, т.е. отметить в каталоге, что вот эти
карточки - это комплектации или предложения одного и того же
товара. Вторая - это занести в каталог такие малоизвестные :)
фирмы, как канадская Veritas, или Lee Nielsen, научить софт
различать японские пилы катаба и дозуки, и учитывать многие другие
тонкости. По сути - пополнять и исправлять каталог на постоянной
основе.
Вернемся еще раз к нашей Bosch Biturbo GKT 18V-52 GC. Почему
сегодня результаты поиска нерелевантны? Потому что они очевидно не
учитывают один из признаков этой пилы - она погружная.
Т.е. мы можем нажать на рукоятку, и погрузить диск в материал. Все
пилки с префиксом GKS этого не умеют, так что аналогом не являются.
С другой стороны, есть ли у найденных товаров что-то общее? Да,
есть - у некоторых. Буковка G в обозначении пилы показывает, что
пила умеет работать по направляющей шине. Т.е. GKT 18V-52 GC умеет,
и GKS 18V-57 G тоже. И как ни странно, но умеет и GKS 12V-26 - хотя
в обозначении этого признака в виде буковки тут G нет. Что-то из
атрибутов можно было бы извлечь, применяя методы типа машинного
обучения, NLP и т.п. Но проще всего - доверить это сообществу.
Дав конечному пользователю возможность редактировать
атрибуты, можно было бы позволять ему добавить к некоторым
из этих товаров аттрибут "погружная", или атрибут "работа по шине".
Что характерно - если попробуете сейчас эти свойства найти в
описании, то вы их не найдете. На самом деле все еще чуть сложнее,
потому что есть разные типы шин, и лишь некоторые из них
совместимы, так что работа по шине - это на самом деле тип
поддерживаемой шины, от которого мы приходим к моделям самих шин, и
уже к их атрибутам).
Ну и добавив атрибуты, нужно сделать возможным потом по ним
искать, естественно. Понятно, что дать редактировать описания и
заголовки тоже было бы неплохо. Тогда не было бы таких карточек
товаров, как вот эта:
Проблема тут в том, что это не плитка. На ней нельзя
готовить, ее даже нельзя поставить так, чтобы нагреваемая
поверхность была горизонтальна. При этом в отзывах (год назад) это
уже было явно написано. И что вы думаете, хоть кто-то озаботился
тем, чтобы поправить заголовок? Только сообщество, на мой взгляд в
состоянии такое привести в нормальный вид.
Что еще можно и нужно улучшить?
Стоит заметить, что редактировать сообществу нужно позволять не
только атрибуты, но и метаданные о них (тип данных, по сути),
потому что сегодня органы управления поиском - это отдельная боль.
Скажем, как выглядит чекбокс курильщика? А вот он:
В чем тут проблема? В том, что выбор между аккумуляторным и
сетевым инструментом не сводится к "покажите мне только
аккумуляторные". На самом деле - это выбор из трех
вариантов, только аккумуляторные, только сетевые,
и мне все равно. Самое смешное, что зайдя в какой-нибудь
соседний раздел вы имено такой набор из двух чекбоксов (или трех
радио) и увидите. А почему тут иначе? А фиг его знает. Кто-то
когда-то так решил - и все.
И это я еще на начал вспоминать о том, то бывают инструменты,
умеющие работать как от сети, так и от аккумулятора. Скажем, из
того что сразу пришло в голову - пылесос DeWALT DCV582.
Замечу так же, что если в основу разметки атрибутов положить
что-то типа RDF, и некоторые атрибуты сделать URI, то можно было бы
легко делать связи между товарами, скажем, принтером, и его
расходниками, лобзиком и пилками для него, ну и так далее. Причем
связи типизированные, не просто "см. также", а именно для этого
инструмента подходят вот такие аккумуляторы.
В общем-то, такое решение это совсем не новость, его можно
посмотреть, взглянув скажем на JIRA (я тут говорю не только про
связи между страницами, но и про набор полей, и их вид). Ну то
есть, в природе существуют продукты (правда, сделанные совсем для
других целей), которые позволяют настраивать UI под себя, в
зависимости от того, что именно мы показываем, и весьма гибко.
Выводы
Для начала, хочу отметить, что все что выше описано, не является
проблемами, специфичными именно для Яндекс Маркета. Скажем, поиск
Амазона в аналогичных ситуациях ведет себя ничуть не лучше, и
знание Амазона о производителях тоже оставляет желать. Что с
упомянутым e-katalog? Ну тут ситуация чуть другая, судя по всему (я
вижу лишь то, что я вижу снаружи) тут за сайтом стоит именно и
только пополняемый каким-то способом каталог моделей, поэтому части
проблем либо нет, либо они иного сорта. Реально он меня больше
устраивает в ряде специфических ситуаций, когда нужно найти не
"что-то вроде вот этого", а "конкретно вот это, и если можно -
подешевле". Но ассортимент, а в итоге объем и глубина каталога тут
явно меньше, поэтому шансы найти что-то редкое вообще стремятся к
нулю.
Понятно, что у меня нет готового решения. Это лишь предложения,
основное из которых - отдать часть работы по поддержке каталога
товаров сообществу, раз уж все равно поддержка того же Яндекс
Маркета/Амазона с этой работой явно не справляется. Прекрасно
представляю все сложности реализации такой идеи на готовом
продукте. Но мне кажется, этот путь - чуть ли не единственно
возможный путь реального наполнения интернет-каталога знаниями о
реальных товарах.