RAG_Evaluation_Task

A short program that performs a basic RAG evaluation

Retrieval-Augmented Generation (RAG) Evaluation

This model generation model. Accurate retrieval is critical for generating contextually relevant responses.

Types of RAG Evaluation

Retrieval Evaluation:
- Focuses on evaluating the relevance of retrieved documents.
- Metrics: Precision@k, Recall@k, Mean Reciprocal Rank (MRR), etc.
Generation Evaluation:
- Measures the quality of generated text based on retrieved documents.
- Metrics: BLEU, ROUGE, BERTScore, etc.
End-to-End Evaluation:
- Directly evaluates the RAG system's output for correctness and relevance.
- Metrics: Human evaluation or task-specific benchmarks.

Chosen Evaluation for my model here: Retrieval Evaluation

The evaluation here focuses on retrieval because the quality of retrieved documents is foundational to the RAG framework's success. Precision@1 and MRR are used as metrics for this evaluation.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
README.md		README.md
rag_evaluation.py		rag_evaluation.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RAG_Evaluation_Task

Retrieval-Augmented Generation (RAG) Evaluation

Types of RAG Evaluation

Chosen Evaluation for my model here: Retrieval Evaluation

About

Releases

Packages

Languages

SadaDC91/RAG_Evaluation_Task

Folders and files

Latest commit

History

Repository files navigation

RAG_Evaluation_Task

Retrieval-Augmented Generation (RAG) Evaluation

Types of RAG Evaluation

Chosen Evaluation for my model here: Retrieval Evaluation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages