Ein molekularer Barcode und ein Web

Nachricht

HeimHeim / Nachricht / Ein molekularer Barcode und ein Web

Nov 10, 2023

Ein molekularer Barcode und ein Web

Band Kommunikationsbiologie

Kommunikationsbiologie Band 5, Artikelnummer: 1411 (2022) Diesen Artikel zitieren

1834 Zugriffe

1 Zitate

18 Altmetrisch

Details zu den Metriken

Traditionell wurde die Reisegeschichte von Patienten herangezogen, um importierte von autochthonen Malariafällen zu unterscheiden, doch die ruhenden Leberstadien von Plasmodium vivax erschweren diesen Ansatz. Molekulare Tools bieten eine alternative Methode zur Identifizierung und Kartierung importierter Fälle. Mithilfe maschineller Lernansätze unter Einbeziehung hierarchischer Fixierungsindizes und Entscheidungsbaumanalysen, die auf 799 P. vivax-Genomen aus 21 Ländern angewendet wurden, identifizierten wir 33-SNP-, 50-SNP- und 55-SNP-Barcodes (GEO33, GEO50 und GEO55) mit hoher Vorhersagekapazität das Ursprungsland der Infektion. Der Matthews-Korrelationskoeffizient (MCC) für einen bestehenden, häufig verwendeten 38-SNP-Barcode (BR38) überstieg in 62 % der Länder 0,80. Die GEO-Panels übertrafen BR38 mit mittleren MCCs > 0,80 in 90 % der Länder bei GEO33 und 95 % bei GEO50 und GEO55. Zur Unterstützung der Datenanalyse wurde ein online zugängliches, wahrscheinlichkeitsbasiertes Klassifikations-Framework eingerichtet (vivaxGEN-geo). Die SNP-Auswahl- und Klassifizierungsmethoden können problemlos für andere Anwendungsfälle geändert werden, um Malariakontrollprogramme zu unterstützen.

Die letzten drei Weltmalariaberichte haben einen besorgniserregenden Anstieg der Malariafälle und außerhalb Afrikas südlich der Sahara einen zunehmenden Anteil der Malaria aufgrund von Plasmodium vivax aufgedeckt, was die konzertierten Bemühungen zur Reduzierung der Übertragung im letzten Jahrzehnt zunichte macht1. Diese Trends unterstreichen den dringenden Bedarf an neuen Überwachungsinstrumenten und die Notwendigkeit einer größeren Aufmerksamkeit für Nicht-Falciparum-Plasmodium-Arten. Eine besondere Herausforderung für die Malariabekämpfung sind hochmobile menschliche Populationen, die zum Import von Plasmodium-Isolaten von einem Land in ein anderes (importierte Fälle) führen, was lokale Kontrollbemühungen behindern und das Risiko von Ausbrüchen und der Ausbreitung von Resistenzen gegen Malariamedikamente erhöhen kann. Um dieser Herausforderung entgegenzuwirken, besteht ein dringender Bedarf an der Entwicklung von Instrumenten, die dabei helfen können, festzustellen, wo Patienten ihre Infektion erworben haben.

Die Unterscheidung zwischen lokaler und importierter Infektion ist für P. vivax besonders schwierig, da der Parasit in der Lage ist, ruhende Leberstadien (Hypnozoiten) zu bilden, die sich Wochen bis Monate nach der Erstinfektion reaktivieren können, und da er in der Lage ist, hochpersistente Milzschäden zu verursachen und Infektionen im zirkulierenden Blutstadium mit geringer Dichte, die sich der Routinediagnose entziehen können2,3,4. Das Wiederauftreten von P. vivax in mehreren Regionen, in denen es einst fast ausgerottet war, unterstreicht die Bedeutung einer sorgfältigen Überwachung5,6. In Gebieten mit geringer Endemie steigt der relative Anteil der importierten Fälle im Allgemeinen mit sinkender Inzidenz, was die Bedeutung von Überwachungsinstrumenten unterstreicht, die insbesondere in diesen Regionen importierte P. vivax-Fälle identifizieren können5. Traditionell wurden importierte Fälle mithilfe von Informationen zur Reisegeschichte des Patienten identifiziert und kartiert, aber die anhaltenden Infektionen im Milz- und Blutstadium sowie späte Rückfälle schränken die Genauigkeit dieses Ansatzes für P. vivax ein. Molekulare Tools zur Identifizierung und Kartierung importierter P. vivax-Fälle bieten eine attraktive Ergänzung zu herkömmlichen epidemiologischen Tools.

Die Amplikon-basierte Sequenzierung hat sich zu einem bevorzugten Ansatz für die gezielte Genotypisierung von Malariaparasiten entwickelt7,8. Mit hochparallelen Sequenzierungsplattformen wie der neuesten Generation von Illumina-Sequenzierern kann die amplikonbasierte Sequenzierung mit mittlerem bis hohem Durchsatz und hoher Genauigkeit und Empfindlichkeit angewendet werden. Diese Plattformen sind flexibel und ermöglichen eine iterative Verbesserung der Single Nucleotide Polymorphism (SNP)-Barcodes, die einen kostengünstigen Genotypisierungsansatz bieten können, der für die bevölkerungsbasierte molekulare Überwachung geeignet ist.

In früheren Studien wurden Mitochondrien- und Apikoplastenmarker verwendet, um importierte von lokalen P. vivax-Isolaten zu unterscheiden, aber die Auflösung dieser Organellengenome ist eingeschränkt9,10,11. Im Jahr 2015 wurde eine Gruppe von 42 SNPs, allgemein als Broad-Barcode bezeichnet, identifiziert, um den Fingerabdruck von Parasiten und die geografische Zuordnung zu erleichtern12. Der 42-SNP-Broad-Barcode wurde aus Genomdaten von 13 Isolaten aus 7 Ländern abgeleitet und in mehreren Studien unter Verwendung gezielter Genotypisierungstests angewendet12,13,14. Eine neuere Studie identifizierte einen weiteren P. vivax-SNP-Barcode anhand von Daten von 433 Isolaten aus 17 Ländern15. Dieser Barcode sollte auch sowohl den Fingerabdruck als auch die geografische Zuordnung erleichtern, es sind jedoch keine experimentellen Tests für diesen Barcode verfügbar und er bleibt nur ein In-silico-Tool15. Darüber hinaus stützten sich alle bisherigen geografischen Barcode-Studien zu Malaria auf visuelle Methoden wie die Hauptkomponentenanalyse, um das Herkunftsland zu bewerten. Obwohl dieser Ansatz einen gewissen Nutzen hat, ist er mäßig subjektiv und geht nicht auf die Bedürfnisse von translationalen Endnutzern wie den National Malaria Control Programs (NMCPs) ein, die möglicherweise nicht über die genetischen Epidemiologie- oder Bioinformatikkenntnisse verfügen, die zum Erstellen und Interpretieren dieser Diagramme erforderlich sind.

Die Hauptziele unserer Studie bestanden darin, einen Rahmen zur Identifizierung molekularer P. vivax-Marker zur Identifizierung und Charakterisierung importierter P. vivax-Fälle durch Klassifizierung des Herkunftslandes zu schaffen und eine frei zugängliche Online-Informatikplattform für Endbenutzer zur Datenanalyse zu entwickeln mithilfe der Marker generiert. Unser Ziel ist es, dass diese neuen molekularen und Informatik-Tools die Generierung von Beweisen unterstützen, die sowohl von Forschern als auch von NMCPs genutzt werden können, um strategische Entscheidungen darüber zu treffen, wo und wie Maßnahmen zur Malariabekämpfung eingesetzt werden sollen. Unsere molekularen Werkzeuge sind in erster Linie auf Überwachungsrahmen zugeschnitten, die Sequenzierungsplattformen wie Illumina oder MinION (Oxford Nanopore Technologies) verwenden, die die parallele Genotypisierung von Dutzenden von Markern ermöglichen. Unsere Informatiktools sollen es Benutzern mit geringen oder keinen genetischen oder bioinformatischen Kenntnissen ermöglichen, Barcode-Genotypisierungsdaten, die in ihrem Land oder in regionalen Referenzlabors generiert wurden, unabhängig zu analysieren und zu interpretieren. Die Informatiktools sind daher darauf ausgelegt, reale Malariaproben, einschließlich polyklonaler Infektionen, und Proben mit unvollständigen Daten aufgrund von Genotypisierungsfehlern zu verarbeiten.

Der primäre Datensatz (Datensatz 1), der mithilfe der Simulationen fehlender Daten zur Minimierung von Genotypfehlern abgeleitet wurde (ergänzende Abbildung 1), umfasste 229.317 hochwertige informative SNPs und 826 hochwertige Proben. Der mittlere Prozentsatz heterozygoter Anrufe in jeder Stichprobe lag zwischen 0,02 % und 0,08 %. Einzelheiten zu den geografischen Standorten der Proben in Datensatz 1 sind in der Ergänzungstabelle 1 dargestellt. Unter Verwendung von Zuordnungen auf Länderebene, die aus der genomweiten Datenklassifizierung mit dem Wahrscheinlichkeitsklassifikator abgeleitet wurden, stellten 27 Isolate Länderklassifizierungen dar, die sich vom Präsentationsland unterscheiden potenziell importierte Fälle (Ergänzungstabelle 1). Nach Ausschluss dieser Fälle sowie der Länder, die nur durch eine einzige Stichprobe repräsentiert wurden, gab es insgesamt 799 Isolate aus 21 Ländern, die Datensatz 2 bildeten (Ergänzungstabelle 1). Die Nachbarzusammenführungsanalyse ergab eine deutliche geografische Häufung der meisten Länder (ergänzende Abbildung 2). Zu den Ausnahmen gehörten die Isolate aus Afghanistan, Iran, Indien und Sri Lanka, die offenbar einen einzigen Cluster bildeten; Eine weitere Analyse dieser geografischen Region mit größeren Stichprobensätzen ist eindeutig erforderlich, um Unterschiede zwischen den Ländern aufzulösen. Obwohl sich mehrere Isolate in Grenzregionen, darunter Vietnam im Verhältnis zu Kambodscha und Thailand im Verhältnis zu Myanmar, zwischen den Ländern überschnitten, konnten die meisten Isolate in diesen Ländern anhand nationaler Grenzen unterschieden werden.

Der Auswahlprozess des SNP-Panels ist in Abb. 1 zusammengefasst. Als der HFST-Selektor mit einem FST-Schwellenwert von 0,90 (HFST-0,90) angewendet wurde, wurde ein Satz von 33 neuen Kandidaten-SNPs (hier als GEO33 bezeichnet) für die geografische Zuordnung identifiziert ( Ergänzungstabelle 2). Bei der Erhöhung des FST-Schwellenwerts auf 0,95 (HFST-0,95) identifizierte das HFST-Modell 50 SNPs (hier als GEO50 bezeichnet) (Ergänzungstabelle 3). Unter alleiniger Verwendung des DT-Selektors wurden 55 SNPs (hier als GEO55 bezeichnet) (Ergänzungstabelle 4) identifiziert. Wie in der ergänzenden Abbildung 3 und der ergänzenden Tabelle 5 dargestellt, gibt es keine Markerüberlappung zwischen dem 38-SNP Broad-Panel (im Folgenden als BR38 bezeichnet) und den drei neuen SNP-Panels, es sind jedoch unterschiedliche Grade an SNP-Überlappung zwischen den drei neuen vorhanden Paneele. In allen drei Panels sind drei SNPs vorhanden; eine Variante bei PvP01_09_v1: 1884013 im IMC1b-Gen (PVP01_0942600), die eine E141D-Aminosäureveränderung verursacht, eine Variante bei PvP01_10_v1:480601 im MDR1-Gen (PVP01_1010900), die eine L845F-Aminosäureveränderung verursacht, und eine Variante bei PvP01_14_ v1:1229487 in PVP01_1428700, das eine Veränderung der Aminosäure S1136I verursacht. Weitere 6 SNPs überlappten zwischen den GEO33- und GEO50-Panels und 13 SNPs überlappten zwischen den GEO50- und GEO55-Panels. Unter den SNPs, die sich zwischen zwei Panels überlappen, ist eine Variante bei PvP01_14_v1:1270401 im PPPK-DHPS-Gen (PVP01_1429500) am bemerkenswertesten, die eine A553G-Aminosäureveränderung verursacht, die mit Sulfadoxinresistenz in Verbindung gebracht wurde16.

Sechsecke spiegeln Datensätze wider, Rechtecke spiegeln Prozesse wider, Dreiecke spiegeln SNP-Sätze wider, Ovale spiegeln Ergebnisse wider und die Raute spiegelt die webbasierte Klassifikatoranwendung wider. Der BR38 Broad-Barcode spiegelt 38 auswertbare SNPs der 42 Broad SNPs wider. Der GEO33-Satz spiegelt die Hochleistungs-SNPs wider, die aus dem HFST-Ansatz mit einem FST-Schwellenwert von 0,9 abgeleitet wurden. Der GEO50-Satz spiegelt die Hochleistungs-SNPs des HFST-Ansatzes mit einem FST-Schwellenwert von 0,95 wider. Der GEO55-Satz spiegelt die durch den Entscheidungsbaum-Ansatz ausgewählten SNPs wider.

Die Klassifizierungsleistung von BR38, GEO33, GEO50, GEO55 und Kombinationen von BR38 mit den drei neuen GEO-Panels (d. h. GEO33 + BR38, GEO50 + BR38 und GEO55 + BR38) wurde durch zehnfache Kreuzvalidierung mit BALK analysiert Klassifikator für die Proben in Datensatz 3. Die Ergebnisse der Auswertungen in Datensatz 3 sind in Abb. 2 dargestellt (Quellendaten in den Zusatzdaten 1), und die mittleren MCCs, die die Konsensergebnisse der Kreuzvalidierung widerspiegeln, sind in Tabelle 1 zusammengefasst Der BR38-Barcode wies den niedrigsten gepoolten (landesweiten) mittleren MCC auf (mittlerer MCC = 0,84), gefolgt von GEO33 (mittlerer MCC = 0,94) sowie GEO50 und GEO55 (beide mittlerer MCC = 1,00). Die gepoolten mittleren MCCs für die kombinierten GEO- und BR38-Panels lagen alle über 1,00, lieferten jedoch nur geringfügige Verbesserungen für GEO50 und GEO55. Der Prozentsatz der Länder mit mittleren MCCs von mehr als 0,8 betrug 62 % (13/21) bei BR38, 90 % (19/21) bei GEO33 und GEO33 + BR38 und 95 % (20/21) bei GEO50, GEO55, GEO50 + BR38 und GEO55 + BR38. Die Länder mit der niedrigsten Vorhersageleistung waren Vietnam und Kambodscha. Vietnam wies bei allen SNP-Panels mittlere MCCs < 0,8 auf. Kambodscha wies mittlere MCCs < 0,8 bei BR38, GEO33 und GEO33 + BR38 auf. Sechs Länder (Philippinen, Myanmar, Malaysia, Thailand, Papua-Neuguinea und Bangladesch) wiesen mittlere MCCs < 0,8 mit BR38 auf, lagen jedoch in allen GEO-Kombinationen über 0,8.

Die Boxplots stellen die MCC-Ergebnisse aus 500 Wiederholungen mit stratifizierter 10-facher Kreuzvalidierung für jeden SNP-Satz dar. Auf der Y-Achse werden Länderbezeichnungen angezeigt. Median und Min. spiegeln die jeweiligen zusammenfassenden Statistiken für die gepoolten MCC-Werte aller Länder wider. Jeder Balken zeigt den Median, den Interquartilbereich sowie den minimalen und maximalen MCC für das jeweilige Land und Modell. Das BR38-Panel wies im Allgemeinen die niedrigsten MCC-Werte auf (d. h. die niedrigste Vorhersagegenauigkeit). Unter den neu ausgewählten Panels erzielte GEO55 im Allgemeinen die höchsten MCC-Werte, gefolgt von GEO50 und dann GEO33. Die Hinzufügung des BR38-Panels zu den GEO-Panels führte im Allgemeinen nur zu einer geringfügigen, wenn überhaupt, Erhöhung des mittleren MCC. Die Analysen basierten auf n = 799 biologisch unabhängigen Proben.

Um die Leistung des Barcodes BR38, GEO33, GEO50, GEO55 und Kombinationen von BR38 mit den drei neuen GEO-Panels (d. h. GEO33 + BR38, GEO50 + BR38 und GEO55 + BR38) mit unterschiedlichen Graden an Genotypfehlern zu vergleichen, haben wir 10 % simuliert. , 20 % und 30 % fehlende Datenanteile in jedem Land unter Verwendung von Datensatz 3 und führte 10-fache Kreuzvalidierungen unter Verwendung des BALK-Klassifikators durch. Die simulierten Genotypisierungsfehler hatten den größten Einfluss auf den GEO33-Barcode (Abb. 3 und zugehörige Quelldaten in Ergänzungsdaten 2, Ergänzungstabelle 6). Der gepoolte (landesweite) mittlere MCC für GEO33 sank von 0,96 ohne fehlende Daten auf 0,89, 0,81 und 0,73 mit jeweils 10 %, 20 % und 30 % fehlenden Daten. Die Auswirkung fehlender Daten auf das kombinierte GEO33 + BR38-Panel war geringer, wobei die gepoolten mittleren MCCs von 1,00 ohne fehlende Daten auf 0,98, 0,96 und 0,94 sanken, wobei jeweils 10 %, 20 % und 30 % Daten fehlten. In allen anderen Panels sank der gepoolte mittlere MCC zwischen den Simulationen um ≥0,1, ohne (0 %) gegenüber 30 % fehlenden Genotypaufrufen: von 0,87 auf 0,77 bei BR38, 0,96 auf 0,85 bei GEO50, 0,98 auf 0,89 bei GEO55 und 1,00 bis 0,98 bei GEO50 + BR38 und GEO55 + BR38.

MCC-Scores, die aus 250 Wiederholungen mit n = 25 biologisch unabhängigen Proben pro Land generiert wurden, ohne (0 %) fehlende Daten (a) und die Simulation fehlender Daten (Genotyp-Fehler) von 10 % (b), 20 % (c) und 30 % ( D); Median und Min. spiegeln die jeweiligen zusammenfassenden Statistiken für die gepoolten MCC-Werte aller Länder wider. Jeder Balken zeigt den Median, den Interquartilbereich sowie den minimalen und maximalen MCC für das jeweilige Land und Modell. Bei fehlenden Daten zeigten die kombinierten BR38- und GEO-Panels (d. h. BR38 + GEO33, BR38 + GEO50 und BR38 + GEO55) bessere Ergebnisse als die einzelnen Panels bei der Beibehaltung der Vorhersageleistung, was wahrscheinlich auf die moderate Redundanz zwischen einigen SNPs zurückzuführen ist.

Nach dem Ausschluss minderwertiger und mutmaßlich importierter Proben standen insgesamt 142 Proben (unabhängiger Validierungsdatensatz), die nicht im Training enthalten waren (d. h. nicht im Datensatz 1, 2 oder 3), zur unabhängigen Bewertung der Leistung des Kandidaten zur Verfügung SNP-Panels mit den trainierten Klassifikatoren. Der unabhängige Validierungsdatensatz umfasste Proben aus jedem der sieben Länder, die im Trainingsdatensatz (Datensatz 2) vertreten waren. Die geografischen Clustermuster des unabhängigen Validierungsdatensatzes im Verhältnis zum Trainingsdatensatz sind in den Nachbarbäumen in der ergänzenden Abbildung 3 dargestellt. Die Vorhersageleistung der Stichproben im unabhängigen Validierungsdatensatz bei den SNP-Panels mit den trainierten Klassifikatoren ist in dargestellt Tabelle 2. Das BR38-Panel wies mit einem gepoolten (landesweiten) mittleren MCC von 0,44 die niedrigste Vorhersagegenauigkeit auf. Das GEO33-Panel wies im Allgemeinen auch eine geringe Vorhersagegenauigkeit auf (gepoolter Median MCC = 0,64), diese war jedoch im kombinierten GEO33 + BR38-Panel verbessert (gepoolter Median MCC = 0,81). Die GEO50-, GEO55-, GEO50 + BR38- und GEO55 + BR38-Panels zeigten alle eine allgemein hohe Vorhersagegenauigkeit mit gepoolten mittleren MCCs von über 0,80 (Bereich 0,83–0,89). Abbildung 4 zeigt Heatmaps für jedes der SNP-Panels, die den Anteil korrekter Rückrufe für jedes Herkunftsland veranschaulichen (Quellendaten finden Sie in den Zusatzdaten 3). Die Heatmaps zeigen, dass in allen SNP-Panels falsche Klassifizierungen im Allgemeinen Vorhersagen für Nachbarländer widerspiegelten und somit die regionale geografische Kartierungsgenauigkeit erhalten blieb.

Jedes Diagramm stellt die Vorhersageleistung des jeweiligen SNP-Panels (Panels a–g) im unabhängigen Validierungsdatensatz (n = 142 biologisch unabhängige Proben) dar, visualisiert als Heatmap, die die Korrelation zwischen Herkunftsland und Vorhersage zeigt. Jede Zelle ist farblich gekennzeichnet, um den Anteil der Proben aus dem jeweiligen Herkunftsland widerzuspiegeln, die korrekt dem entsprechenden Vorhersageland zugeordnet wurden. Farbkodierung skaliert von Hellblau (geringer Anteil) bis Dunkelblau (hoher Anteil). Es werden nur Länder angezeigt, die von mindestens einem der SNP-Panels vorhergesagt wurden, und Vorhersageländer, die nicht im unabhängigen Validierungssatz (d. h. nicht auf der Ursprungsachse) vertreten waren, sind rot gekennzeichnet. Wenn das Herkunftsland der Proben nicht direkt mit dem Land der Vorhersage übereinstimmte, wurden sie im Allgemeinen auf Nachbarländer abgebildet (d. h. immer noch innerhalb der korrekten regionalen Geographie). Das BR38-Panel zeigte eine geringere Vorhersagegenauigkeit als das GEO und die kombinierten GEO + BR38-Panels. In den SNP-Panels kam es zu den meisten falschen Vorhersagen zwischen Kambodscha, Vietnam und Thailand.

Das Hauptziel der Studie bestand darin, molekulare Werkzeuge zu entwickeln, die für bevölkerungsbasierte Überwachungsrahmen geeignet sind und zur Identifizierung und Kartierung importierter P. vivax-Infektionen verwendet werden können. Es wurden drei neue SNP-Panels (GEO-Barcodes) mit hoher Länderklassifizierungsleistung identifiziert, die in der Lage waren, importierte P. vivax-Infektionen in einer Reihe endemischer Szenarien zu unterscheiden. Das sparsamste Panel, GEO33, zeigte eine hohe Länderklassifizierung, wenn keine Daten fehlten, und kann kostengünstig an die 38 bi-allelischen, testbaren Broad-Barcode-SNPs (BR38) angehängt werden, um die Vorhersagekapazität in Proben mit moderaten Konzentrationen zu verbessern fehlende Daten. Der kombinierte GEO33 + BR38-Barcode generierte in den meisten Endemiegebieten eine zuverlässige Länderklassifizierung, selbst wenn der Anteil fehlender Daten auf 30 % stieg. Die Vorhersagekapazität des GEO33 + BR38-Barcodes zwischen Kambodscha und Vietnam war jedoch mäßig, was wahrscheinlich auf den häufigen menschlichen und damit verbundenen P. vivax-Genfluss über die Grenze zwischen diesen beiden Ländern zurückzuführen ist. Die GEO50- und GEO55-Panels erzielten in diesen Bereichen eine bessere Auflösung als das GEO33 + BR38-Panel, und mit zusätzlichen Markern, die für eine Analyse der Identität nach Abstammung geeignet sind, könnte eine noch bessere Charakterisierung der Parasitenübertragung über Grenzen mit hohem Genfluss möglich sein17. In einigen geografischen Regionen, in denen nationale Grenzen den Genfluss von Parasiten kaum oder gar nicht behindern, können selbst genomweite Daten keine Auflösung von Infektionen zwischen benachbarten Ländern ermöglichen: In diesen Regionen ist die Klassifizierung des Infektionsursprungs auf Länderebene möglicherweise nur von begrenztem Nutzen. Die Verwendung genetischer Daten zum Nachweis, dass die Parasiten von verschiedenen Seiten der Grenze eine einzige homogene Population bilden, kann jedoch hilfreich sein, um die Argumente für länderübergreifende gemeinsame Bemühungen zur Bekämpfung der Vivax-Malaria zu stärken. Darüber hinaus können die in dieser Studie beschriebenen Tools angepasst werden, um andere Populationsgrenzen zu charakterisieren, die für NMCPs von Bedeutung sein könnten. Da die Dichte der verfügbaren genomischen Daten zu P. vivax zunimmt, ist es möglicherweise auch möglich, genetisch definierte Infektionsgrenzen mit höherer Auflösung für Klassifizierungszwecke zu verwenden.

Die Anwendung und breitere Validierung der neuen GEO-Barcodes ist im Gange, wobei Illumina-Amplikon-basierte Sequenzierungstests bereits vom Malariaprogramm des Wellcome Sanger Institute für die 38-Broad-Barcode-SNPs13 und von Mitarbeitern des Instituts für Tropenmedizin in Antwerpen für GEO etabliert wurden -3318. Weitere Arbeiten sind erforderlich, um Rahmenbedingungen für die Implementierung der Parasiten-Genotypisierung in die täglichen Aktivitäten von NMCPs zu schaffen: Erkenntnisse können aus dem GenRe-Mekong-Framework gewonnen werden, das die Parasiten-Genotypisierung erfolgreich in NMCP-Aktivitäten in mehreren Ländern im Großraum implementiert hat Mekong-Subregion zum Zweck der Verfolgung der Resistenz gegen Malariamedikamente bei P. falciparum7. Das GenRe-Mekong-Framework konzentriert sich derzeit auf die Durchführung von Genotypisierungen mithilfe der Illumina-Plattform in zentralisierten Labors (z. B. nationalen Referenzlabors) mit ausgeprägter molekularbiologischer Expertise und Ausrüstung. Allerdings können in dieser Studie beschriebene Assays für die geografischen Barcodes problemlos für andere Genotypisierungsplattformen entwickelt werden, beispielsweise für die hochportablen minION-Sequenzer (Oxford Nanopore Technologies), die theoretisch in Umgebungen mit minimaler molekularer Laborausrüstung implementiert werden können.

Die Analyse und Interpretation „realer“ Genotypisierungsdaten stellt erhebliche Herausforderungen bei minderwertigen Proben dar, wie sie beispielsweise an getrockneten Blutflecken gesammelt wurden. In Erwartung dieser Anforderungen haben wir ein wahrscheinlichkeitsbasiertes Klassifikationsgerüst entwickelt, das in der Lage ist, sowohl mit polyklonalen Infektionen als auch mit fehlenden Daten umzugehen. Dieses Framework wurde in die Online-Plattform vivaxGEN-geo (http://geo.vivaxgen.org) integriert, sodass Benutzer ihre Daten analysieren und interpretieren können, ohne komplexe Bioinformatikkenntnisse zu benötigen und die subjektive visuelle Inspektion benachbarter Bäume oder Bäume zu vermeiden Hauptkomponentendiagramme. Während die in vivaxGEN-geo implementierten Informatikwerkzeuge auf P. vivax zugeschnitten sind, kann ein ähnlicher Ansatz auf andere Arten angewendet werden. Um eine breitere Anwendung zu ermöglichen, ist der Quellcode öffentlich verfügbar.

Die Varianten in den GEO-SNP-Panels befinden sich in Genen, die eine Reihe von Funktionen repräsentieren, von denen einige im Laufe der Zeit instabil sein können, wie beispielsweise die Varianten in mit Arzneimittelresistenz assoziierten Genen. Diese Varianten können im Zuge der Populationsentwicklung leicht durch neue Varianten ersetzt werden. Die Geschwindigkeit, mit der sich Allelfrequenzen in einer Population ändern, hängt von verschiedenen Faktoren ab, darunter der Populationsgröße, dem Ausmaß des Genflusses und der Selektionsdynamik.

Obwohl unser Datensatz eines der derzeit geografisch vielfältigsten Panels von P. vivax-Isolaten darstellt und alle wichtigen vivax-endemischen Regionen darstellt, wird die Vorhersagekapazität der abgeleiteten Tools wahrscheinlich durch die geografische Darstellung des Referenzpanels eingeschränkt . Der Klassifikator kann keine Vorhersage einem Land zuweisen, das nicht im genetischen Referenzpanel vertreten ist, und Länder mit einem kleinen oder nicht repräsentativen Referenzprobensatz verfügen möglicherweise über eine begrenzte Klassifizierungsgenauigkeit. Die begrenzte Vertretung aus Gebieten wie dem indischen Subkontinent ist eine wichtige Lücke, die geschlossen werden muss. Das Referenzpanel verfügt jedoch über eine gute Darstellung von Isolaten aus Regionen mit Bedeutung für die öffentliche Gesundheit, einschließlich des Epizentrums von Chloroquin-resistentem P. vivax in Papua, Indonesien, Westthailand und Myanmar, wo eine hohe Häufigkeit von P. vivax-Infektionen mit Mefloquin-Resistenz assoziiert ist Es wurde über MDR1-Kopienzahlvarianten (PVP01_1010900) berichtet, und über Äthiopien, das das größte Reservoir von P. vivax in Afrika aufweist und wo Infektionen, die in Duffy-negative menschliche rote Blutkörperchen eindringen können, gemeldet wurden19,20,21,22,23 ,24. Die starke Vertretung dieser Gebiete im genetischen Referenzgremium stellt sicher, dass NMCPs genau erkennen können, wann Infektionen aus diesen Regionen importiert wurden, und entsprechende Fallmanagementreaktionen einleiten können. Es ist auch wichtig anzuerkennen, dass das auf Wahrscheinlichkeiten basierende Klassifikator-Framework für eine Neubewertung der aktuellen Herstellersätze geeignet ist, sobald neue Genomdaten verfügbar werden, was die iterative Entwicklung verfeinerter SNP-Panels erleichtert. Da das Referenzpanel mit zunehmender Datenmenge, die an den Barcode-SNPs generiert wird, wächst, verbessert sich die Genauigkeit der wahrscheinlichkeitsbasierten Klassifizierungen.

Das auf Wahrscheinlichkeit basierende Klassifikator-Framework wurde entwickelt, um die Zuordnung geografischer Vorhersagen zu polyklonalen Infektionen zu ermöglichen, die zwei oder mehr Klone tragen, wie sie in Regionen mit hoher Endemizität üblich sind. Diese Infektionen werden bei der Analyse der Populationsgene häufig nicht berücksichtigt. Es sollte jedoch berücksichtigt werden, dass der Klassifikator nicht versucht, einzelne Klone in Phasen einzuteilen, sondern dass die Infektion als Gesamtheit analysiert wird, was zu einer einzigen Vorhersage des wahrscheinlichsten Ursprungs führt. Dennoch ist es wichtig zu beachten, dass die vom Rahmenwerk ausgewählten GEO-Panels konstruktionsbedingt eine geringe Diversität innerhalb des Landes aufweisen sollten (wobei die Diversität eher zwischen den Ländern besteht). Polyklonale Infektionen, die aus einem einzelnen Land stammen, sollten daher eine geringe Häufigkeit heterozygoter Positionen an den ausgewählten GEO-Barcodes aufweisen. In Fällen, in denen eine Kombination von Klonen aus verschiedenen Ländern innerhalb einer einzelnen Infektion vorhanden ist und viele Heterozygotenpositionen ergeben, ist die Fähigkeit des Klassifikators zur Erkennung des Herkunftslandes eingeschränkt und es wird dementsprechend ein geringes Vertrauen in die Vorhersage zugewiesen. Zukünftige Entwicklungen, die GEO-Marker mit hochauflösenden Fingerabdruckmarkern wie Mikrohaplotypen kombinieren, könnten es ermöglichen, polyklonale Infektionen in Phasen einzuteilen und anschließend auf ihren geografischen Ursprung zu analysieren.

Neben neuen geografischen Markierungen werden zukünftige Iterationen des SNP-Barcodes entwickelt, um andere Anwendungsfälle abzudecken. Dazu gehören Marker für arzneimittelresistenten P. vivax sowie Marker zur Charakterisierung wiederkehrender Infektionen, die die Interpretation klinischer Studien, epidemiologischer Kohorten und der Parasitenüberwachung unterstützen (siehe Beschreibung des Mikrohaplotyps in 8). Während der geografische Ursprung einer P. vivax-Infektion einige Einblicke in die wahrscheinliche Rückfallhäufigkeit eines Parasiten geben kann, werden die Risiken und die Häufigkeit wiederkehrender Infektionen durch eine Reihe von Faktoren beeinflusst, darunter Übertragungsintensität, Hypnozoitenbelastung und Wirtsimmunität, die die Korrelation zwischen Parasiten verfälschen Genotyp und individuelles Rückfallrisiko4,25.

Im Jahr 2017 wurden bis zu 100 % aller bestätigten Malariafälle in 17 Malaria-endemischen Ländern im asiatisch-pazifischen Raum, im Nahen Osten und in Amerika, wo P. vivax-Infektionen vorherrschen, als importierte Infektionen gemeldet1. In diesen Ländern können nationale Malariakontrollprogramme die aus unseren molekularen Instrumenten gewonnenen Informationen nutzen, um die Wirksamkeit laufender Maßnahmen zur Reduzierung der lokalen Übertragung zu bewerten. Eine der wichtigsten Anforderungen der Weltgesundheitsorganisation für die Zertifizierung der Malaria-Eliminierung ist der Nachweis, dass alle in mindestens drei aufeinanderfolgenden Jahren im Land festgestellten Malariafälle importiert wurden. Unser Genotypisierungsansatz hat das Potenzial, importierte Infektionen zu identifizieren und so Unklarheiten bei der Eliminierungszertifizierung zu reduzieren. Zu diesem Zweck müssen Länder, die kurz vor der Eliminierung stehen, Archivproben für künftige molekulare Vergleiche mit mutmaßlich importierten Fällen aufbewahren.

Die vorgestellten molekularen geografischen Klassifizierungstools für P. vivax sollen Benutzern in Malaria-Endemieländern den Vergleich lokaler Genotypisierungsdaten mit global verfügbaren Datensätzen ermöglichen. Die Amplikon-basierte Sequenzierung geografischer Barcodes wird mit anderen Überwachungsmarkern in Zentrallabors in endemischen Partnerländern des Asia Pacific Malaria Elimination Network (www.apmen.org) kombiniert. Die von diesen Zentren generierten Daten werden Forscher, nationale Malariakontrollprogramme und andere wichtige Interessengruppen über die Inzidenz, Epidemiologie und wichtige Reservoirs importierter Malaria informieren und so dazu beitragen, Ressourcen gezielt dort einzusetzen, wo sie am meisten benötigt werden.

Das Projekt zielte darauf ab, zwei Hauptergebnisse zu generieren: ein neues Framework zur Identifizierung geografischer Barcodes von P. vivax (d. h. Markierungsauswahl) und eine offene Online-Informatikplattform für Endbenutzer zur Analyse der mithilfe des Barcodes generierten Daten. Ein Flussdiagramm, das die Schritte zur Identifizierung geografischer P. vivax-Barcodes umreißt, ist in Abb. 1 dargestellt. Der Prozess umfasste drei Schlüsselschritte: 1) Datenvorbereitung, um einen Datensatz mit der optimalen Balance von Probenanzahl und SNPs und ohne Fehlstellen zu erstellen Daten (d. h. kein Genotyp schlägt fehl), 2) SNP-Auswahl unter Verwendung von Entscheidungsbaum- und HFST-Ansätzen, um Kandidaten-SNP-Panels zu erhalten, die für den in dieser Studie entwickelten Klassifikator (ein Bi-Allele-Likelihood-, BALK-Klassifikator) geeignet sind, und 3) vergleichende Bewertung der Kandidaten-SNP-Panels, Bewertung der Auswirkungen fehlender Daten (d. h. Genotypfehler) und Bewertung der Vorhersagegenauigkeit anhand eines unabhängigen Datensatzes. Anschließend wurde eine offene Online-Informatikplattform entwickelt und mit BALK-Klassifikatoren ausgestattet, die anhand der SNP-Kandidatengremien trainiert wurden. Eine ausführlichere Beschreibung der Methoden finden Sie in den Ergänzenden Methoden.

Die Studie verwendete genomische Daten zu P. vivax, die aus dem Malaria Genomic Epidemiology (MalariaGEN) P. vivax Genome Variation Project Release 4 (Pv4) stammen und kürzlich als offener Datensatz veröffentlicht wurden26. Der offene Pv4-Datensatz umfasst Genome aus 26 Ländern. Zum Zeitpunkt der Durchführung unserer Analyse (dh vor der Open-Access-Veröffentlichung von Pv4) stand für unsere Studie ein Datensatz mit 1873 (von den 1895 in der Veröffentlichung beschriebenen Proben) Proben zur Verfügung. Für die Analyse in dieser Studie wurde der Datensatz in zwei Teile geteilt, einen Trainingsdatensatz und einen Validierungsdatensatz. Der Validierungssatz bestand aus Isolaten aus sieben Ländern (Brasilien, Kambodscha, Kolumbien, Äthiopien, Peru, Thailand und Vietnam), die aus einer von GlaxoSmithKline (GSK)26 ​​durchgeführten klinischen Studie stammten. Alle verbleibenden Isolate wurden in den Trainingsdatensatz aufgenommen, der eine Darstellung aller Länder im Validierungssatz umfasste. Die GSK-Proben wurden aus praktischen Gründen für die unabhängige Validierung ausgewählt, da die Proben aus dieser Studie später als die anderen Studien sequenziert wurden und die Daten daher später verfügbar gemacht wurden.

Ein Überblick über die Datenvorbereitungsschritte ist in Abschnitt a) des in Abb. 1 dargestellten Flussdiagramms dargestellt. Kurz gesagt wurde der Trainingsdatensatz gefiltert, um wiederkehrende Infektionen und Proben aus Ländern auszuschließen, die durch weniger als 4 unabhängige P. vivax-Genome vertreten sind, was zu … ein erster Datensatz mit 1.348 Proben aus 21 Ländern (Ergänzungstabelle 1, Ergänzungsabbildung 4). Mit diesem ersten Datensatz haben wir aus den ersten 2.671.112 Varianten, die im MalariaGEN Pv4-Projekt26 entdeckt wurden, einen Satz von 662.641 hochwertigen bi-allelischen SNPs mit einem VQSLOD-Score > 0, einer Mindesttiefe von 1 und einer minimalen Minor Allele Count (MAC) von 2 abgeleitet um Datensatz 0 zu erstellen. Die Beschränkung auf bi-allelische SNPs ist ein Standardansatz in der Malaria-Populationsgenomik, um nachgelagerte Berechnungen zu vereinfachen und stellt keine Einschränkungen für die Analyse polyklonaler Infektionen dar, die immer noch durch die Kombination von Allelvarianten in der jeweiligen Gruppe nachweisbar sind SNPs (siehe27,28,29). Einzelne Genotypaufrufe wurden als Heterozygoten definiert, basierend auf einem willkürlichen Schwellenwert eines Minor-Allel-Verhältnisses > 0,1 und mindestens 2 Reads für jedes Allel; Alle anderen Genotypaufrufe wurden als homozygot für das Hauptallel definiert. Datensatz 0 wurde weiter gefiltert, um nicht unabhängige Proben auszuschließen, die willkürlich als Isolatpaare mit einem genetischen Abstand von weniger als 0,001 definiert wurden, was zu 1.227 Proben mit 662.641 SNPs führte, die als Datensatz 1 bezeichnet wurden. Datensatz 1 wurde dann einer iterativen Datenqualitätsfilterung unterzogen, um die Daten abzuleiten beste repräsentative Anzahl von Proben und informativen SNPs ohne fehlende Genotypen durch iteratives Entfernen von Proben mit höheren fehlenden Genotypen und Berechnen der Anzahl informativer SNPs (definiert als SNPs mit MAC > = 2) aus den verbleibenden Proben. Basierend auf der Darstellung des Ergebnisses dieser Datenqualitätsfilterung (ergänzende Abbildung 1) identifizierten wir 826 Proben und 229.317 SNPs, die in Datensatz 2 aufgenommen werden sollten. Die Isolate in Datensatz 2 wurden zunächst anhand der verfügbaren Metadaten einem Land zugeordnet wurde weiter ausgewertet unter Verwendung von 1) Vorhersage auf Länderebene unter Verwendung des BALK-Klassifikators für alle 229.317 SNPs und 2) manueller Bestätigung durch Konstruktion eines nachbarschaftlichen Baums basierend auf der genetischen Distanz. Isolate, deren Länderzuordnung vom Vorhersageergebnis abweicht und die sich nicht im selben Ländercluster befanden, der manuell anhand des Nachbarbaums beobachtet wurde, wurden als mutmaßlich importierte Infektionen betrachtet und aus dem Datensatz entfernt, um Datensatz 3 zu erstellen, der 799 Proben und 229.317 SNPs umfasst. Zur vergleichenden Bewertung der SNP-Kandidaten-Panels wurde ein neuer Datensatz (Datensatz 4) erstellt, der die Proben in Datensatz 3 umfasste, jedoch nur die SNPs, die durch den aufeinanderfolgenden SNP-Auswahlprozess ausgewählt wurden (wir bezeichnen diese SNP-Panels als GEO-Barcodes) und 38 prüfbare SNPs aus einem häufig verwendeten 42-SNP P. vivax-Barcode, der vom Broad Institute12 entwickelt wurde. Das SNP-Panel, das die 38 auswertbaren Barcode-SNPs des Broad Institute umfasst, wird als BR38 bezeichnet. Das BR38-SNP-Panel wurde sowohl einzeln als auch in Kombination mit den neu ausgewählten GEO-SNP-Panels zur Auswertung in die Studie integriert, da es in mehreren Ländern implementiert wurde.

Ein ähnlicher Filterprozess wurde auf den Validierungssatz angewendet. Alle wiederkehrenden Infektionen wurden entfernt und die SNP-Positionen wurden gefiltert, um nur die 229.317 im Trainingsdatensatz 4 definierten SNPs einzuschließen. Alle verbleibenden nicht unabhängigen Proben wurden dann unter Verwendung des gleichen Schwellenwerts der genetischen Distanz von 0,001 entfernt, wobei ein ähnliches Verfahren wie das beschriebene angewendet wurde für das Trainingsset. Die Zuordnung auf Länderebene wurde unter Verwendung desselben trainierten BALK-Klassifikators wie im Trainingssatz bewertet, und durch Kombination mit Datensatz 3 wurde ein nachbarschaftlicher Verknüpfungsbaum zur manuellen Bestätigung erstellt. Nach den verschiedenen Filtern verblieb ein Satz von 142 Proben im Validierungssatz. Ergänzende Abbildung 2 zeigt den Neighbor-Joining-Baum von Datensatz 3 in Kombination mit den 142 Validierungsproben bei den 229.317 SNPs. Zur Erstellung des unabhängigen Validierungsdatensatzes wurde eine weitere SNP-Filterung durchgeführt, um nur das BR38-Panel und neu ausgewählte GEO-SNPs einzubeziehen. Ausführlichere Informationen zu den Datenvorbereitungsmethoden finden Sie in den Ergänzenden Methoden.

Unsere Studie erforderte die Entwicklung flexibler Methoden zur Klassifizierung von P. vivax-Infektionen/genetischen Daten nach Ländern. Zu diesem Zweck benötigten wir einen Klassifikator mit den folgenden Eigenschaften: 1) in der Lage, bestehende SNP-Panels zu bewerten, 2) für neue SNP-Ergänzungen zugänglich, um neue Länder oder genetische Veränderungen im Laufe der Zeit zu berücksichtigen, 3) in der Lage, Dateneingaben zu klassifizieren, die Genotypfehler enthalten, und bi-allelische heterozygote Genotypaufrufe, die aus polyklonalen Infektionen resultieren, und 4) in der Lage, Konfidenzwerte für die Vorhersage bereitzustellen. Wir haben festgestellt, dass der Naive-Bayes-Klassifikator nach Anwendung mehrerer Modifikationen die Eigenschaften aufweist, die den oben genannten Anforderungen gerecht werden. Wir haben einen BALK-Klassifikator (Bi-Allele Likelihood) von Bernoulli Naive Bayes mit Modifikation abgeleitet, indem wir die Wahrscheinlichkeitsgleichung seiner Klassifizierungsregel von der Bernoulli-Wahrscheinlichkeitsverteilung durch eine binomiale N = 2-Verteilung ersetzt haben, um die heterozygoten Anrufe zu verarbeiten, und die A-priori-Wahrscheinlichkeit auf a gesetzt haben Gleichmäßige Verteilung, sodass der Klassifikator nur von der Wahrscheinlichkeit der SNP-Daten abhängt. Die BALK-Klassifizierungsregel ist in Gleichung 1 dargestellt.

Dabei ist X der SNP-Datensatz einer Probe, C eine Gruppe (oder ein Land), xi die Anzahl alternativer Allele an Position i und pi die Häufigkeit des alternativen Allels an Position i von Land C, gezählt als diploide Proben . Eine ausführlichere Beschreibung der Entwicklung des BALK-Klassifikators ist unter „Ergänzende Methoden“ verfügbar.

Unser Ziel bestand darin, die sparsamsten SNP-Panels für die Klassifizierung auf Länderebene zu identifizieren und dabei weniger als 60 SNPs in diesen Panels anzustreben. Dieser Schwellenwert für die neuen SNP-Panels basierte auf mehreren Überlegungen. In Übereinstimmung mit den Multiplexing-Funktionen der Illumina-Plattform und unter Berücksichtigung der Kosten für Primer, Bibliotheksvorbereitung und Sequenzierung sowie der praktischen Herausforderungen bei der Vorbereitung von PCR-Pools über eine große Anzahl von Primern haben wir insgesamt maximal 100 SNPs identifiziert (im gesamten neuen SNP). Panels und zuvor beschriebener breiter Barcode (z. B. BR38) als möglicher Schwellenwert für einen geografischen Barcode für P. vivax.

Eine Übersicht über die Auswahlschritte für Kandidaten-SNPs ist in Abschnitt b) des in Abb. 1 dargestellten Flussdiagramms dargestellt. Optimale SNPs für die Länderklassifizierung wurden mithilfe der folgenden Ansätze ausgewählt: DecisionTree, HFST-0,90 und HFST-0,95 (HFST mit einem Fst-Schwellenwert von 0,9 bzw. 0,95), die in den ergänzenden Methoden detailliert beschrieben werden. Kurz gesagt, für den DecisionTree (DT)-Ansatz wurde Datensatz 3 einer DT-Implementierung der Python-Sklearn-Bibliothek unterzogen. Der von DT ausgewählte SNP-Satz wurde dann mit dem BALK-Klassifikator im Trainingssatz unter Verwendung von MCC-Werten (Matthew Correlation Coefficient) auf Länderebene sowie gepoolten (länderübergreifenden) Median- und Mindest-MCC-Werten neu bewertet. Der MCC liefert ein Maß für die Qualität der Klassifizierungen und reicht von -1 (völlige Unstimmigkeit) bis 1 (perfekte Vorhersage)30. Für den HFST-Ansatz (Hierarchical FST) wurde als bifurkierender Baumleitfaden ein nachbarschaftlicher Populationsbaum auf der Grundlage der genetischen Nettodistanzmatrix der durchschnittlichen Population von Nei erstellt und dann in der Mitte neu verwurzelt (ergänzende Abbildung 5). Der HFST-Ansatz beinhaltete das Durchqueren des gegabelten Führungsbaums und die zufällige Auswahl der SNPs mit einem FST über einem bestimmten Schwellenwert zwischen den beiden Populationen, die durch die beiden Knoten des Zweigs dargestellt werden. Wenn während der Durchquerung des Leitbaums keiner der SNPs über dem Schwellenwert lag, wurde die DT-Methode verwendet, um zusätzliche SNPs zur Trennung der beiden Knoten des Zweigs zu erhalten. Wie beim DT-Ansatz wurden MCC-Werte auf Länderebene sowie gepoolte (länderübergreifende) mittlere und minimale MCC-Werte für jeden ausgewählten SNP-Satz mithilfe des BALK-Klassifikators berechnet, der anhand der ausgewählten SNPs mit Datensatz 3 trainiert wurde.

Für jeden Ansatz wurde Datensatz 3 sowohl für das Training als auch für den Test verwendet und in 500 Wiederholungen eingestellt, um 500 SNP-Sätze zu erhalten. Die 25 besten SNP-Sätze aus den 500 SNP-Sätzen, geordnet nach dem Durchschnitt ihrer minimalen MCC- und mittleren MCC-Werte gegenüber den MCC-Werten auf Länderebene, wurden gesammelt und den 500 Wiederholungen einer geschichteten 10-fachen Kreuzvalidierung unterzogen, um dies zu vermeiden Überanpassung jedes SNP-Satzes durch Neuordnung auf der Grundlage ihrer durchschnittlichen minimalen MCC- und Median-MCC-Werte, um den besten SNP-Satz für jeden Ansatz abzuleiten.

Ein Überblick über die Schritte der vergleichenden Bewertung der SNP-Panels ist in Abschnitt c) des in Abb. 1 dargestellten Flussdiagramms dargestellt. Um das breite SNP-Panel mit den drei neuen Kandidaten-SNP-Panels zu vergleichen, die von DT identifiziert wurden, HFST-0,90, und HFST-0,95-Ansatz wurde für jedes SNP-Panel unter Verwendung von Datensatz 3 eine geschichtete 10-fache Kreuzvalidierung mit 500 Wiederholungen durchgeführt.

Um die Dauerhaftigkeit der Vorhersageleistung der Kandidaten-SNP-Panels mit unterschiedlichen Graden fehlender Daten (analog zu Genotypisierungsfehlern) zu bewerten, wurden außerdem Simulationen durchgeführt, nachdem Genotypdaten zufällig entfernt wurden. Der BALK-Klassifikator wurde anhand aller Proben gegen die Kandidaten-SNP-Panels trainiert. Für jedes Land wurden 25 Proben nach dem Zufallsprinzip entnommen und ersetzt, und Genotypaufrufe wurden in Anteilen von 10 %, 20 % und 30 % aus den SNP-Sätzen entfernt. Die Zufallsstichproben wurden dann dem trainierten Klassifikator unterzogen. Dieser Prozess wurde in 250 Wiederholungen durchgeführt und der MCC-Score der Vorhersage für jedes Land wurde angegeben.

Um die Leistung der SNP-Kandidatenpanels mit neuen Stichprobensätzen zu bewerten (im Gegensatz zur Verwendung der Neustichprobentechnik der Kreuzvalidierungsstrategie), wurden die trainierten BALK-Klassifizierer mit dem unabhängigen Validierungsdatensatz und den für jedes Land gemeldeten MCC-Scores ausgeführt.

Um für Endbenutzer zugängliche Informatiktools bereitzustellen, wurde eine Online-Plattform mit Datenklassifizierungstools zur Bestimmung des wahrscheinlichsten Herkunftslandes einer Probe mithilfe genetischer Daten aus verschiedenen Barcodes erstellt. Der vorhandene Quellcode, der für eine mikrosatellitenbasierte P. vivax-Datenaustausch- und Analyseplattform31 entwickelt wurde, wurde geändert, um eine neue webbasierte Plattform (vivaxGEN-geo) zu erstellen, um am geografischen Barcode generierte SNP-Daten zu sammeln. Dieser Ansatz wurde aufgrund der Möglichkeit gewählt, i) manuelle SNP-Sets zu integrieren, die in Zukunft schrittweise Verbesserungen des Barcodes ermöglichen, ii) Barcodes mit unvollständigen Daten aufgrund von Genotypisierungsfehlern auszuwerten und iii) heterozygote Genotypaufrufe auszuwerten, die polyklonale Infektionen widerspiegeln. Für optimale Genauigkeit wurde der auf der Online-Plattform bereitgestellte BALK-Klassifikator mit 941 Proben trainiert, bestehend aus Datensatz 2 (N = 799) und dem unabhängigen Validierungsdatensatz (N = 142). Das Klassifizierungstool meldet die drei höchsten Wahrscheinlichkeiten für das Herkunftsland und die damit verbundenen Wahrscheinlichkeiten. Das Klassifizierungstool meldet die drei höchsten Wahrscheinlichkeiten für das Herkunftsland und die damit verbundenen Wahrscheinlichkeiten. Die Wahrscheinlichkeiten wurden mithilfe der isotonischen Methode berechnet, wie sie in CalibratedClassfierCV der Sklearn-Bibliothek implementiert ist, mit geschichteter vierfacher Kreuzvalidierung für den Kalibrierungsdatensatz. Die Webplattform kann die Eingabedaten in zeichenfolgenbasierter Barcode-Darstellung, spaltenbasierten, tabulatorgetrennten Textdateien und VCF-Dateien empfangen.

Alle Proben wurden mit schriftlicher Einverständniserklärung der Patienten oder ihrer Erziehungsberechtigten entnommen, wie im Datenhinweis 4 des Malaria Genomic Epidemiology (MalariaGEN) P. vivax Genome Variation Project, Version 4, beschrieben26.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Die Studie verwendete Genomdaten aus dem MalariaGEN P. vivax Genome Variation Project Release 4 (Pv4)26. Dateien im VCF- und Zarr-Format, die die in der Studie verwendeten Genotypaufrufe enthalten, sind im Open Access auf der MalariaGEN-Datenressourcenseite unter https://www.malariagen.net/resource/3026 verfügbar.

Alle benutzerdefinierten, unternehmensinternen Skripte zur Datenfilterung, -analyse und -visualisierung sind unter https://github.com/vivaxgen/geo verfügbar. Der VivaxGEN-geo-Webdienst ist unter http://geo.vivaxgen.org/ zugänglich. Zusätzlich zu den neuen geografischen SNP-Panels, die in dieser Studie beschrieben werden, bietet vivaxGEN-geo die Klassifizierung anderer SNP-Panels, einschließlich eines veröffentlichten vietnamesischen Barcodes (VN40)18.

WER. Welt-Malaria-Bericht 2016. Weltgesundheitsorganisation; Genf 2016. (2016).

Tripura, R. et al. Anhaltende Infektionen mit Plasmodium falciparum und Plasmodium vivax in einer westlichen kambodschanischen Bevölkerung: Auswirkungen auf Präventions-, Behandlungs- und Eliminierungsstrategien. Malar. J. 15, 181 (2016).

Artikel Google Scholar

Kho, S. et al. Verborgene Biomasse intakter Malariaparasiten in der menschlichen Milz. N. engl. J. Med. 384, 2067–2069 (2021).

Artikel Google Scholar

White, NJ & Imwong, M. Rückfall. Adv. Parasit. 80, 113–150 (2012).

Artikel Google Scholar

Auburn, S., Cheng, Q., Marfurt, J. & Price, RN Die sich verändernde Epidemiologie von Plasmodium vivax: Erkenntnisse aus konventionellen und neuartigen Überwachungsinstrumenten. PLoS Med. 18, e1003560 (2021).

Artikel Google Scholar

Sattabongkot, J., Tsuboi, T., Zollner, GE, Sirichaisinthop, J. & Cui, L. Plasmodium vivax-Übertragung: Chancen auf Kontrolle. Trends Parasitol. 20, 192–198 (2004).

Artikel Google Scholar

Jacob, CG et al. Genetische Überwachung in der Subregion Greater Mekong und Südasien zur Unterstützung der Malariakontrolle und -eliminierung. eLife 10, https://doi.org/10.7554/eLife.62997 (2021).

Noviyanti, R. et al. Implementierung der Parasiten-Genotypisierung in nationale Überwachungsrahmen: Rückmeldungen von Kontrollprogrammen und Forschern im asiatisch-pazifischen Raum. Malar. J. 19, 271 (2020).

Artikel Google Scholar

Diez Benavente, E. et al. Genomische Variation bei Plasmodium vivax Malaria zeigt Regionen unter Selektionsdruck. PloS one 12, e0177134 (2017).

Artikel Google Scholar

Iwagami, M. et al. Geografische Herkunft von Plasmodium vivax in der Republik Korea: Haplotyp-Netzwerkanalyse basierend auf dem mitochondrialen Genom des Parasiten. Malar. J. 9, 184 (2010).

Artikel Google Scholar

Rodrigues, PT et al. Verwendung mitochondrialer Genomsequenzen zur Verfolgung des Ursprungs importierter Plasmodium vivax-Infektionen, die in den Vereinigten Staaten diagnostiziert wurden. Bin. J. Tropical Med. Hyg. 90, 1102–1108 (2014).

Artikel Google Scholar

Baniecki, ML et al. Entwicklung eines Einzelnukleotid-Polymorphismus-Barcodes zur Genotypisierung von Plasmodium vivax-Infektionen. PLoS vernachlässigte tropische Dis. 9, e0003539 (2015).

Artikel Google Scholar

Ba, H. et al. Die Multi-Locus-Genotypisierung zeigt die nachgewiesene Endemizität einer geografisch unterschiedlichen Plasmodium vivax-Population in Mauretanien, Westafrika. PLoS vernachlässigte tropische Dis. 14, e0008945 (2020).

Artikel CAS Google Scholar

Dewasurendra, RL et al. Verwendung eines genetischen Barcodes von Plasmodium vivax zur genomischen Überwachung und Parasitenverfolgung in Sri Lanka. Malar. J. 19, 342 (2020).

Artikel CAS Google Scholar

Diez Benavente, E. et al. Ein molekularer Barcode zur Information über den geografischen Ursprung und die Übertragungsdynamik von Plasmodium vivax Malaria. PLoS Genet. 16, e1008576 (2020).

Artikel Google Scholar

Price, RN, Auburn, S., Marfurt, J. & Cheng, Q. Phänotypische und genotypische Charakterisierung von arzneimittelresistentem Plasmodium vivax. Trends Parasitol. 28, 522–529 (2012).

Artikel CAS Google Scholar

Taylor, AR et al. Quantifizierung der Konnektivität zwischen lokalen Plasmodium falciparum-Malariaparasitenpopulationen mithilfe der Identität durch Abstammung. PLoS Genet. 13, e1007065 (2017).

Artikel Google Scholar

Kattenberg, JH et al. Neuartiger hochmultiplexierter zielgerichteter AmpliSeq-Assay für Anwendungsfälle der genetischen Überwachung von Plasmodium vivax auf mehreren geografischen Ebenen. Vorderzellinfektion. Microbiol 12, 953187 (2022).

Artikel CAS Google Scholar

Auburn, S. et al. Die Genomanalyse zeigt einen gemeinsamen Bruchpunkt bei der Amplifikation des Plasmodium vivax Multidrug Resistance 1-Locus in Thailand. J. Infizieren. Dis., https://doi.org/10.1093/infdis/jiw323 (2016).

Auburn, S. et al. Genomanalyse von Plasmodium vivax in Südäthiopien zeigt selektiven Druck in mehreren Parasitenmechanismen. J. Infizieren. Dis. 220, 1738–1749 (2019).

Artikel CAS Google Scholar

Menard, D. et al. Klinische Malaria von Plasmodium vivax wird häufig bei Duffy-negativen madagassischen Menschen beobachtet. Proz. Natl Acad. Wissenschaft. USA 107, 5967–5971 (2010).

Artikel CAS Google Scholar

Zimmerman, PA Plasmodium vivax-Infektion bei Duffy-negativen Menschen in Afrika. Bin. J. Tropical Med. Hyg. 97, 636–638 (2017).

Artikel Google Scholar

Price, RN et al. Globale Ausbreitung von Chloroquin-resistentem Plasmodium vivax – Antwort der Autoren. Die Lanzette. Infizieren. Dis. 15, 630–631 (2015).

Google Scholar

Ratcliff, A. et al. Therapeutische Reaktion von multiresistenten Plasmodium falciparum und P. vivax auf Chloroquin und Sulfadoxin-Pyrimethamin im Süden Papuas, Indonesien. Trans. R. Soc. Tropisches Mittelmeer. Hyg. 101, 351–359 (2007).

Artikel CAS Google Scholar

Commons, RJ, Simpson, JA, Watson, J., White, NJ & Price, RN Schätzung des Anteils der durch Rückfälle verursachten Plasmodium vivax-Rezidive: Eine systematische Überprüfung und Metaanalyse. Bin. J. Tropical Med. Hyg. 103, 1094–1099 (2020).

Artikel CAS Google Scholar

MalariaGen et al. Ein offener Datensatz der Genomvariation von Plasmodium vivax in 1.895 weltweiten Proben. Willkommen, Open Res. 7, 136 (2022).

Artikel Google Scholar

Pearson, RD et al. Genomanalyse der lokalen Variation und der jüngsten Entwicklung bei Plasmodium vivax. Nat. Genet. 48, 959–964 (2016).

Artikel CAS Google Scholar

Auburn, S. et al. Charakterisierung der Diversität von Plasmodium falciparum innerhalb des Wirts mithilfe von Sequenzdaten der nächsten Generation. PloS one 7, e32891 (2012).

Artikel CAS Google Scholar

Manske, M. et al. Analyse der Plasmodium falciparum-Diversität bei natürlichen Infektionen durch Tiefensequenzierung. Natur 487, 375–379 (2012).

Artikel CAS Google Scholar

Jurman, G., Riccadonna, S. & Furlanello, C. Ein Vergleich der MCC- und CEN-Fehlermaße bei der Mehrklassenvorhersage. PloS one 7, e41882 (2012).

Artikel CAS Google Scholar

Referenzen herunterladen

Wir möchten den Patienten danken, die ihre Proben zur Studie beigetragen haben, sowie den Gesundheitsmitarbeitern und Außendienstteams, die bei der Probensammlung mitgeholfen haben. Wir danken auch den Mitarbeitern der Probenlogistik-, Sequenzierungs- und Informatikeinrichtungen des Wellcome Sanger Institute für ihre Beiträge. Zum Zweck des offenen Zugangs hat der Autor eine öffentliche CC BY-Urheberrechtslizenz auf alle vom Autor akzeptierten Manuskriptversionen angewendet, die sich aus dieser Einreichung ergeben. Diese Forschung wurde teilweise vom Wellcome Trust finanziert (Senior Fellowship in Clinical Science, verliehen an RNP, 200909). Die Forschung wurde teilweise auch vom australischen Ministerium für auswärtige Angelegenheiten und Handel (TDCRRI 72904), dem Australian National Health and Medical Research Council (NHMRC) (APP2001083 an SA vergeben) und der Bill and Melinda Gates Foundation (OPP1164105) finanziert. HT wurde durch ein Charles Darwin University International PhD Scholarship (CDIPS) unterstützt. Die Patientenprobenentnahme und Metadatenerfassung wurde vom Asia-Pacific Malaria Elimination Network (108-07), dem malaysischen Gesundheitsministerium (BP00500420) und dem NHMRC (1037304 und 1045156; Stipendien an NMA [1042072 und 1135820], BEB [ 1088738] und MJG [1074795]). MJG wurde auch durch ein „Hot North“ Earth Career Fellowship (1131932) unterstützt. MUF wird durch ein Senior Researcher-Stipendium des Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), Brasilien, unterstützt. Die gesamte Genomsequenzierungskomponente der Studie wurde durch Zuschüsse des Medical Research Council und des britischen Ministeriums für internationale Entwicklung (M006212) und des Wellcome Trust (204911) an DPK sowie durch einen Wellcome Trust-Zuschuss (206194/Z/17/Z) unterstützt ) an DPK und JCR vergeben. Diese Arbeit wurde vom Australian Centre for Research Excellence on Malaria Elimination (ACREME) unterstützt und vom NHMRC finanziert (APP 1134989).

Abteilung für globale und tropische Gesundheit, Menzies School of Health Research und Charles Darwin University, Darwin, NT, Australien

Hidayat Trimarsanto, Jutta Marfurt, Zuleima Pava, Matthew J. Grigg, Bridget Barber, Nicholas M. Anstey, Benedikt Ley, Kamala Thriemer, Ric N. Price und Sarah Auburn

Eijkman-Institut für Molekularbiologie, Jakarta, Indonesien

Hidayat Trimarsanto, Edwin Sutanto, Rintis Noviyanti und Leily Trianty

Wellcome Sanger Institute, Wellcome Genome Campus, Cambridge, Großbritannien

Robert Amato, Richard D. Pearson, Julian C. Rayner, Eleanor Drury, Sonia Gonzales, Victoria Simpson, Olive Miotto, Alistair Miles und Dominic P. Kwiatkowski

Exeins Health Initiative, Jakarta, Indonesien

Edwin Sutanto

Internationales Trainings- und medizinisches Forschungszentrum (CIDEIM), Cali, Kolumbien

Diego F. Echeverry

Abteilung für Mikrobiologie, Universidad del Valle, Cali, Kolumbien

Diego F. Echeverry

Icesi-Universität, Cali, Kolumbien

Diego F. Echeverry

Malaria-Gruppe, Universität von Antioquia, Medellin, Kolumbien

Tatiana M. Lopera-Mesa, Lidia M. Montenegro, Alberto Tobón-Castaño und Iván D. Vélez

Klinische Forschungseinheit der Infectious Diseases Society Sabah-Menzies School of Health Research, Kota Kinabalu, Sabah, Malaysia

Matthew J. Grigg, Bridget Barber und Timothy William

Klinisches Forschungszentrum, Queen Elizabeth Hospital, Sabah, Malaysia

Timothy William

Hochschule für Naturwissenschaften, Universität Addis Abeba, Addis Abeba, Äthiopien

Sisay Getachew & Beyene Petros

Armauer Hansen Forschungsinstitut

Sisay Getachew & Abraham Aseffa

Äthiopisches Institut für öffentliche Gesundheit, Addis Abeba, Äthiopien

Ashenafi Assefa

Mahidol-Oxford Tropical Medicine Research Unit, Mahidol University, Bangkok, Thailand

Awab G. Rahim, Cindy S. Chu, Olivo Miotto, Nicholas J. White, Ric N. Price und Sarah Auburn

Medizinische Fakultät Nangarhar, Universität Nangarhar, Ministerium für Hochschulbildung, Jalalabad, Afghanistan

Awab G. Rahim

Klinische Forschungseinheit der Universität Oxford, Krankenhaus für Tropenkrankheiten, Ho-Chi-Minh-Stadt, Vietnam

Nguyen H. Chau & Tran T. Hien

Abteilung für Infektionskrankheiten, Internationales Zentrum für Durchfallkrankheitsforschung, Dhaka, Bangladesch

Mohammad S. Alam und Wasif A. Khan

Königliches Zentrum für Krankheitskontrolle, Gesundheitsministerium, Gesundheitsministerium, Thimphu, Bhutan

Sonam Wangchuck

Forschungszentrum für Infektions- und Tropenkrankheiten, Medizinische Universität Hormozgan, Bandar Abbas, Provinz Hormozgan, Iran

Yaghoob Hamidi

Medizinische Fakultät, Universität Khartum, Khartum, Sudan

Ishag Adam

Schlüssellabor der Nationalen Gesundheitskommission für die Kontrolle und Prävention parasitärer Krankheiten, Schlüssellabor der Provinz Jiangsu für Parasiten- und Vektorkontrolltechnologie, Jiangsu-Institut für parasitäre Krankheiten, Wuxi, China

Yaobao Liu & Qi Gao

School of Public Health, Medizinische Universität Nanjing, Nanjing, China

Yaobao Liu

Shoklo Malaria Research Unit, Fakultät für Tropenmedizin, Mahidol University, Mae Sot, Thailand

Kanlaya Sriprawat, Cindy S. Chu und Francois Nosten

Abteilung für Parasitologie, Institut für Biomedizinische Wissenschaften, Universität Sao Paulo, Sao Paulo, Brasilien

Marcelo U. Ferreira

Globale Gesundheit und Tropenmedizin, Institut für Hygiene und Tropenmedizin, NOVA-Universität Lissabon, Lissabon, Portugal

Marcelo U. Ferreira

Papua-Neuguinea-Institut für medizinische Forschung, Madang, Papua-Neuguinea

Moses Laman

Deakin University, Victoria, Australien

Alyssa Barry

Abteilung für Bevölkerungsgesundheit und Immunität, Walter and Eliza Hall Institute of Medical Research, Victoria, Australien

Alyssa Barry und Ivo Mueller

Abteilung für Medizinische Biologie, Universität Melbourne, Victoria, Australien

Alyssa Barry

Abteilung für Parasiten und Insektenvektoren, Institut Pasteur, Paris, Frankreich

Ivo Mueller

Tropenmedizin-Stiftung, Manaus, Brasilien

Marcus VG Lacerda

Oswaldo Cruz Foundation, Manguinhos, Rio de Janeiro, Brasilien

Marcus VG Lacerda

Peruanische Universität Cayetano Heredia, Lima, Peru

Alejandro Llanos-Cuentas

Mahidol-Universität, Bangkok, Thailand

Srivicha Krudsood

Forschungsinstitut für medizinische Wissenschaften der Streitkräfte, Bangkok, Thailand

Chanthap Lon

Universität Gondar, Gondar, Äthiopien

Rezika Mohammed

Jimma University, Jimma, Äthiopien

Daniel Yilma

Forschungszentrum für Tropenmedizin, Porto Velho, Brasilien

Dhélio B. Pereira

Forschungsinstitut für Tropenmedizin, Manila, Philippinen

Glaube EJ Hawthorn

Umphang Krankenhaus, Tak, Thailand

Chayadol Namaik-larp

Klinisches Forschungszentrum, Cali, Kolumbien

Maria F. Villegas

GlaxoSmithKline, Brentford, Großbritannien

Justin A. Green & Gavin Koh

Cambridge Institute for Medical Research, School of Clinical Medicine, University of Cambridge, Cambridge, Großbritannien

Julian C. Rayner

Zentrum für Tropenmedizin und globale Gesundheit, Nuffield Department of Medicine, Universität Oxford, Oxford, Großbritannien

Nicholas J. White, Francois Nosten, Ric N. Price und Sarah Auburn

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

SA, HT, RA, RDP und RNP konzipierten und gestalteten die Studie und verfassten den ersten Entwurf des Manuskripts. SA, HT, RA, RDP und ES führten eine Datenanalyse durch. RN, LT, JM, ZP, DEF, TML-M., LMM, AT-C., MJG, BB, TW, NMA, SG, BP, A.Aseffa, A.Assefa, AGR, NHC, TTT, MSA, WAK, BL, KT, SW, YH, IA, YL, QG, KS, MUF, ML, AB, IM, MVGL, AL-C., SK, CL, RM, DY, DBP, FEJE, CSC, IDV, CN -L., MFV, JAG, GK, NJW und FN steuerten wichtige feldbasierte Malaria-Sammlungen und Metadaten bei. DPK, JCR, RA, RDP, ED, SG, VS, OM und AM trugen zur Sequenzierung, Datenproduktion und Informatikunterstützung bei.

Korrespondenz mit Sarah Auburn.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Communications Biology dankt Alfred Amambua-Ngwa und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Hauptredakteur: Luke R. Grinham. Peer-Reviewer-Berichte sind verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Trimarsanto, H., Amato, R., Pearson, RD et al. Ein molekularer Barcode und ein webbasiertes Datenanalysetool zur Identifizierung importierter Plasmodium vivax-Malaria. Commun Biol 5, 1411 (2022). https://doi.org/10.1038/s42003-022-04352-2

Zitat herunterladen

Eingegangen: 01. Dezember 2021

Angenommen: 08. Dezember 2022

Veröffentlicht: 23. Dezember 2022

DOI: https://doi.org/10.1038/s42003-022-04352-2

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.