An Empirical Evaluation of Retrieval, Reranking, and Similarity for a Q&A-Based Retrieval Augmented Generation System

Elkıran, Harun; Rasheed, Jawad

doi:10.1109/ACCESS.2026.3664852

An Empirical Evaluation of Retrieval, Reranking, and Similarity for a Q&A-Based Retrieval Augmented Generation System

dc.authorscopusid	59149323900
dc.authorscopusid	57791962400
dc.contributor.author	Elkıran, Harun
dc.contributor.author	Rasheed, Jawad
dc.contributor.author	Rasheed, Jawad
dc.contributor.department-temp
dc.date.accessioned	2026-03-18T11:08:40Z
dc.date.issued	2026
dc.department	Lisansüstü Eğitim Enstitüsü
dc.department	Mühendislik ve Doğa Bilimleri Fakültesi
dc.description.abstract	Retrieval-Augmented Generation (RAG) has emerged as a fundamental paradigm for improving Large Language Models (LLMs) by incorporating external knowledge retrieval. RAG primarily aims to address the hallucination problem in LLMs that rely on extensive knowledge bases. A RAG system depends critically on design choices, including indexing strategies, retrieval methods, similarity metrics, and reranking models. The selection of configuration makes a RAG effective. Although the RAG system has received sufficient attention, there is very limited work on understanding the relative contributions of these components, and their statistical significance remains insufficiently understood. In this study, we conduct a comprehensive empirical evaluation of a modular RAG pipeline by systematically varying index structures, retrievers, rerankers, and similarity metrics. We evaluated performance using standard retrieval metrics such as Recall, Mean Reciprocal Rank, Normalized Discounted Cumulative Gain, and Coverage; generationoriented quality metrics such as Correctness, Faithfulness, and Relevance; latency; and cost. Statistical robustness is ensured through ANOVA, effect size estimation, and multivariate regression analysis. Based on our results, the retriever and similarity metric choices dominate system performance, yielding statistically significant improvements with p-values less than 10−9 for retriever effects on R@1 and Coverage. At the same time, index selection exhibits a negligible impact across most metrics. Reranking primarily affects reranked metrics and downstream correctness, with MiniLM consistently outperforming BGE.
dc.identifier.citation	Elkiran, H., & Rasheed, J. (2026). An Empirical Evaluation of Retrieval, Reranking, and Similarity for a Q&A-Based Retrieval Augmented Generation System. IEEE Access, 14, 26053-26066.
dc.identifier.doi	10.1109/ACCESS.2026.3664852
dc.identifier.endpage	26066
dc.identifier.issn	2169-3536
dc.identifier.orcid	0000-0002-5834-6210
dc.identifier.orcid	0000-0003-3761-1641
dc.identifier.scopus	2-s2.0-105030591844
dc.identifier.startpage	26053
dc.identifier.uri	https://doi.org/10.1109/ACCESS.2026.3664852
dc.identifier.uri	https://hdl.handle.net/20.500.12436/9274
dc.identifier.volume	14
dc.indekslendigikaynak	Scopus
dc.language.iso	en
dc.publisher	Institute of Electrical and Electronics Engineers Inc.
dc.relation.ispartof	IEEE Access
dc.relation.publicationcategory	Makale - Uluslararası Hakemli Dergi - Öğrenci
dc.relation.publicationcategory	Makale - Uluslararası Hakemli Dergi - Kurum Öğretim Elemanı
dc.rights	info:eu-repo/semantics/openAccess
dc.subject	Retrieval-augmented generation
dc.subject	Information retrieval
dc.subject	Retrieval
dc.subject	Reranking
dc.subject	Similarity/distance metrics
dc.title	An Empirical Evaluation of Retrieval, Reranking, and Similarity for a Q&A-Based Retrieval Augmented Generation System
dc.type	Article
dspace.entity.type	Publication
relation.isAuthorOfPublication	f9b9b46c-d923-42d3-b413-dd851c2e913a
relation.isAuthorOfPublication.latestForDiscovery	f9b9b46c-d923-42d3-b413-dd851c2e913a

Dosyalar

Orijinal paket

Listeleniyor 1 - 1 / 1

İsim:: An_Empirical_Evaluation_of_Retrieval_Reranking_and_Similarity_for_a_QampA-Based_Retrieval_Augmented_Generation_System.pdf
Boyut:: 2.2 MB
Biçim:: Adobe Portable Document Format
Açıklama:: Article file

İndir

Lisans paketi

Listeleniyor 1 - 1 / 1

İsim:: license.txt
Boyut:: 1.17 KB
Biçim:: Item-specific license agreed upon to submission
Açıklama:

İndir

Koleksiyon

Bilgisayar Mühendisliği Bölümü Koleksiyonu
LEE Doktora Programı Makale Koleksiyonu
Scopus İndeksli Yayınlar Koleksiyonu