Обновить

Как нейросетям перестать бояться и полюбить «синтетику»

Время на прочтение8 мин
Охват и читатели579
Всего голосов 7: ↑7 и ↓0+8
Комментарии2

Комментарии 2

Так, в погоне за данными, LLM начнёт генерировать новые знания
и таким образом заменит науку.

На мой взгляд синтетические данные - это что-либо полученное соединением каких либо отдельных частей. Например, мы можем взять некоторые списки имён, фамилий, возрастов, названий городов и написать программу для генерации биографий. А затем обучить сеть на множестве таких текстов извлечению из неструктурированного текста нужные сущности и выдачу их в структурированной форме, например в виде JSON файла. Наверное есть множество задач, где такие синтетические данные будут работать даже лучше, чем тексты созданные людьми вручную.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
cloud.beeline.ru
Дата регистрации
Дата основания
Численность
501–1 000 человек
Местоположение
Россия