Комментарии 12
Спасибо, содержательно. А что скажете про typesense? не вошёл в список, я им частенько пользуюсь. нравится скорость и приличный api, гибридный поиск, простота развертывания, единственное, более 256 где-то ближайших не отдаёт, но обычно более 30-50 и не нужно.
Вижу уже которую статью про векторный поиск, и исключительно из интереса хочется задать вопрос, а почему все обходят стороной TiDb, что с ней не так?
Спасибо за вопрос!
Приведенный перечень решений не претендует на полноту. Возможных инструментов много, и тестировать их все трудоемко. Мы фокусировались на том, с чем так или иначе приходилось работать, и что часто встречалось в открытых бенчмарках.
В TiDB векторный поиск появился сравнительно недавно, и на фоне других альтернатив пока не так заметен.
Спасибо за обзор. OpenSearch еще очень не хватает. Это единственная БД с векторным и полнотекстовым поиском, которая доступна в managmed варианте из AWS и Яндекс.Облака.
Спасибо за отзыв!
Запустил opensearchproject/opensearch:3.3.2 при тех же условиях эксперимента. Для датасета deep-image-96-angular получаются следующие метрики.
Загрузка и индексация: total_time: 50.6 мин, avg_cpu: 1548%, avg_mem: 22.8 GB.
Поиск: RPS: 660, mean_response_time: 11.6 мс, p95_response_time: 14.8 мс, avg_cpu: 2676%, avg_mem: 28.6 GB.
Отличный обзор, спасибо! Хотелось бы увидеть также результаты тестирования ManticoreSearch.
Спасибо за отзыв и за расширение круга обсуждаемых решений. К сожалению, сейчас в vector-db-benchmark нет поддержки ManticoreSearch. Возьму на заметку для возможного продолжения.
Векторный поиск: как выбрать систему и не пожалеть