Validity assessment of a computational system in the identification of duplicate studies
Evaluación de la validez de un sistema computacional en la identificación de estudios duplicados
Avaliação de validade de um sistema computacional na identificação de estudos duplicados
Fernanda Martins Dias Escaldelai; Leandro Escaldelai; Denise Pimentel Bergamaschi
Abstract
Objective: To evaluate the performance of the Systematic Review Support web-based system for the identification of duplicate records compared with similar software tools.
Methods: A methodological study was conducted assessing the automated process of de-duplication performed by the Systematic Review Support web-based system (version 1.0) versus the EndNote X9® and Rayyan® systems, adopting hand-checking as the benchmark reference for comparisons. A set of studies on three topics related to cystic fibrosis retrieved from the Pubmed, Embase and Web of Science electronic databases was used for testing purposes. The sensitivity, specificity, accuracy and area under the ROC curve of the software systems were compared to the benchmark values for performance evaluation.
Results: The database searches retrieved 1332 studies, of which 273 (20.5%) were true duplicates. The Systematic Review Support tool identified a larger proportion of true duplicates than the other systems tested. The sensitivity, specificity and accuracy of the Systematic Review Support tool exceeded 98%.
Conclusion and implications for practice: The Systematic Review Support system provided a high level of sensitivity, specificity and accuracy in identifying duplicate studies, optimizing time and effort by reviewers in the health field.
Keywords
Resumen
Palabras clave
Resumo
Objetivo: Avaliar o desempenho do sistema web “Apoio à Revisão Sistemática” quanto à identificação de referências bibliográficas duplicadas, em comparação a outros programas.
Métodos: Trata-se de uma pesquisa metodológica que avalia o processo automático de identificação de duplicatas do sistema “Apoio à Revisão Sistemática” (versão 1.0), em comparação ao EndNote X9® e Rayyan® , considerando checagem manual como referência. Foi utilizado um conjunto de estudos relacionados a três temas sobre fibrose cística recuperados das bases de dados Pubmed, Embase e Web of Science. Para avaliação de desempenho, utilizaram-se a sensibilidade, especificidade, acurácia e área sob a curva ROC para cada software, em comparação à referência.
Resultados: As buscas nas bases de dados resultaram em 1332 estudos, sendo 273 (20,5%) verdadeiros duplicados. Em comparação aos dados de referência, o programa “Apoio à Revisão Sistemática” identificou maior proporção de duplicatas verdadeiras do que os demais. Os valores de sensibilidade, especificidade e acurácia do sistema “Apoio à Revisão Sistemática” apresentaram-se acima de 98%.
Conclusão e implicações para a prática: O sistema “Apoio à Revisão Sistemática” possui alta sensibilidade, especificidade e acurácia para identificação de estudos duplicados, otimizando o tempo e o trabalho dos revisores da área da saúde.
Palavras-chave
Referências
1 Munn Z, Peters MDJ, Stern C, Tufanaru C, McArthur A, Aromataris E. Systematic review or scoping review? Guidance for authors when choosing between a systematic or scoping review approach. BMC Med Res Methodol. 2018;18(1):143.
2 Egger M, Smith GD, Altman DG. Systematic reviews in health care: meta-analysis in context. London: BMJ Publishing Group; 2001.
3 Lefebvre C, Glanville J, Briscoe S, Littlewood A, Marshall C, Metzendorf MI et al. 4.S1 Technical Supplement to Chapter 4: Searching for and selecting studies [Internet]. 2020 [citado 4 maio 2022]. Disponível em:
4 Kohl C, McIntosh EJ, Unger S, Haddaway NR, Kecke S, Schiemann J et al. Online tools supporting the conduct and reporting of systematic reviews and systematic maps: a case study on CADIMA and review of existing tools. Environ Evid. 2018;7(1):8.
5 Clark J, Glasziou P, Del Mar C, Bannach-Brown A, Stehlik P, Scott AM. A full systematic review was completed in 2 weeks using automation tools: a case study. J Clin Epidemiol. 2020;121:81-90.
6 Qi X, Yang M, Ren W, Jia J, Wang J, Han G et al. Find duplicates among the PubMed, EMBASE, and Cochrane library databases in systematic review. PLoS One. 2013;8(8):e71838.
7 Revisão Sistemática. Systematic review support [Apoio à revisão sistemática] [Internet]. 2022 [citado 4 maio 2022]. Disponível em: www.revisaosistematica.com.br
8 Rathbone J, Carter M, Hoffmann T, Glasziou P. Better duplicate detection for systematic reviewers: evaluation of Systematic Review Assistant-Deduplication Module. Syst Rev. 2015 jan 14;4(1):6.
9 Reuters T. EndNote X9: quick reference guide [Internet]. 2022 [citado 4 maio 2022]. Disponível em:
10 Lorenzetti DL, Ghali WA. Reference management software for systematic reviews and meta-analyses: an exploration of usage and usability. BMC Med Res Methodol. 2013;13(1):141.
11 Ouzzani M, Hammady H, Fedorowicz Z, Elmagarmid A. Rayyan-a web and mobile app for systematic reviews. Syst Rev. 2016;5(1):210.
12 McKeown S, Mir ZM. Considerations for conducting systematic reviews: evaluating the performance of different methods for de-duplicating references. Syst Rev. 2021;10(1):38.
13 Egan ME, Greene DM, Voynow JA. Fibrose cística. In: Kliegman RM, Stanton BF, St Geme II JW, Schor NF, Behrman RE, editores. Nelson: tratado de pediatria. 20ª ed. Rio de janeiro: Elsevier; 2018. p. 2098-112. (vol. 2).
14 Medronho RA, Bloch KV, Luiz RR, Werneck GL. Epidemiologia. 2ª ed. São Paulo: Atheneu; 2009.
15 MedCalc [Internet]. 2022 [citado 4 maio 2022]. Disponível em:
16 Rayyan [Internet]. 2022 [citado 4 maio 2022]. Disponível em:
17 Jiang Y, Lin C, Meng W, Yu C, Cohen AM, Smalheiser NR. Rule-based deduplication of article records from bibliographic databases. Database. 2014 jan;2014:bat086.
18 Kwon Y, Lemieux M, McTavish J, Wathen N. Identifying and removing duplicate records from systematic review searches. J Med Libr Assoc. 2015 out;103(4):184-8.
Submetido em:
04/05/2022
Aceito em:
05/09/2022