• Что бы вступить в ряды "Принятый кодер" Вам нужно:
    Написать 10 полезных сообщений или тем и Получить 10 симпатий.
    Для того кто не хочет терять время,может пожертвовать средства для поддержки сервеса, и вступить в ряды VIP на месяц, дополнительная информация в лс.

  • Пользаватели которые будут спамить, уходят в бан без предупреждения. Спам сообщения определяется администрацией и модератором.

  • Гость, Что бы Вы хотели увидеть на нашем Форуме? Изложить свои идеи и пожелания по улучшению форума Вы можете поделиться с нами здесь. ----> Перейдите сюда
  • Все пользователи не прошедшие проверку электронной почты будут заблокированы. Все вопросы с разблокировкой обращайтесь по адресу электронной почте : info@guardianelinks.com . Не пришло сообщение о проверке или о сбросе также сообщите нам.

Exploring RAG: Hypothetical Document Embeddings (HyDE)

Lomanu4 Оффлайн

Lomanu4

Команда форума
Администратор
Регистрация
1 Мар 2015
Сообщения
16,018
Баллы
155
Introduction


Hypothetical Document Embeddings (HyDE) is a Retrieval-Augmented Generation (RAG) technique used in Large Language Models (LLMs). This blog explains why HyDE was developed and how it improves the RAG process.

Why HyDE?


While RAG works well in most cases, it has a significant limitation: it heavily depends on the vector database to return relevant data chunks based on the user’s query. If the query contains very few or no relevant keywords, the vector database may fail to retrieve the correct data. As a result, the LLM is left without the necessary context, which can lead to hallucinations where the model generates incorrect or misleading information. To address this issue, HyDE was introduced.

How Does HyDE Help?


In HyDE, the data storage process remains the same: domain-specific data is stored in a vector database. However, instead of using the user’s query directly to fetch relevant data from the database, HyDE introduces an additional step.

  1. The user’s query is first sent to the LLM, which generates a hypothetical response based on its prior knowledge.
  2. Further, the hallucinated response, along with the original query, is used to perform a search in the vector database.
  3. This process significantly improves the chances of retrieving relevant data, as the generated response may contain additional context or alternative phrasing that helps the vector database identify the correct chunk of information.


Пожалуйста Авторизируйтесь или Зарегистрируйтесь для просмотра скрытого текста.



By incorporating this approach, HyDE enhances the RAG process, reducing the likelihood of hallucinations and improving the accuracy of information retrieval.

Final Words


Thank you for reading the blog. If you want to know about RAG, please check the following video. Let me know if you have any questions.


Пожалуйста Авторизируйтесь или Зарегистрируйтесь для просмотра скрытого текста.

 
Вверх Снизу