Обновить

Комментарии 12

Хорошая статья. Спасибо.

Weighted Ranker приводит ранее полученные оценки к единому диапазону значений с помощью нормализации и вычисляет итоговую оценку как взвешенную сумму.

Мы использовали свой аналог, о котором я писал. WR слишком уж простой масштабатор.

Спасибо за отзыв!

Спасибо, содержательно. А что скажете про typesense? не вошёл в список, я им частенько пользуюсь. нравится скорость и приличный api, гибридный поиск, простота развертывания, единственное, более 256 где-то ближайших не отдаёт, но обычно более 30-50 и не нужно.

Typesense мы не использовали, поэтому из практического опыта не расскажу. Судя по документации, там отсутствует поддержка мультивекторных эмбеддингов, разреженных векторов, индексов с квантованием, дисковых и GPU-индексов. Но надо будет подробнее посмотреть. Спасибо за рекомендацию.

Вижу уже которую статью про векторный поиск, и исключительно из интереса хочется задать вопрос, а почему все обходят стороной TiDb, что с ней не так?

Спасибо за вопрос!

Приведенный перечень решений не претендует на полноту. Возможных инструментов много, и тестировать их все трудоемко. Мы фокусировались на том, с чем так или иначе приходилось работать, и что часто встречалось в открытых бенчмарках.

В TiDB векторный поиск появился сравнительно недавно, и на фоне других альтернатив пока не так заметен.

вообще, как видится мне, TiDb очень интересное многоцелевое решение, о котором практически никто не пишет, было бы интересно увидеть какой-то более глубокий его анализ, или примеры внедрения

Спасибо за обзор. OpenSearch еще очень не хватает. Это единственная БД с векторным и полнотекстовым поиском, которая доступна в managmed варианте из AWS и Яндекс.Облака.

Спасибо за отзыв!

Запустил opensearchproject/opensearch:3.3.2 при тех же условиях эксперимента. Для датасета deep-image-96-angular получаются следующие метрики.

Загрузка и индексация: total_time: 50.6 мин, avg_cpu: 1548%, avg_mem: 22.8 GB.

Поиск: RPS: 660, mean_response_time: 11.6 мс, p95_response_time: 14.8 мс, avg_cpu: 2676%, avg_mem: 28.6 GB.

Спасибо!

Отличный обзор, спасибо! Хотелось бы увидеть также результаты тестирования ManticoreSearch.

Спасибо за отзыв и за расширение круга обсуждаемых решений. К сожалению, сейчас в vector-db-benchmark нет поддержки ManticoreSearch. Возьму на заметку для возможного продолжения.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
saby.ru
Дата регистрации
Дата основания
Численность
5 001–10 000 человек
Местоположение
Россия