Ein molekularer Atlas enthüllt das Tri

Blog

HeimHeim / Blog / Ein molekularer Atlas enthüllt das Tri

Nov 11, 2023

Ein molekularer Atlas enthüllt das Tri

Band Nature Communications

Nature Communications Band 14, Artikelnummer: 837 (2023) Diesen Artikel zitieren

3973 Zugriffe

253 Altmetrisch

Details zu den Metriken

Der Prozess der natürlichen Seidenproduktion in der Hauptampullendrüse (Ma) der Spinne verleiht Schleppleinenseide außergewöhnliche mechanische Eigenschaften und das Potenzial für biomimetische Anwendungen. Die genauen genetischen Rollen der Ma-Drüse während dieses Prozesses sind jedoch noch unbekannt. Hier führten wir einen systematischen molekularen Atlas der Produktion von Schleppleinenseide durch eine hochwertige Genomassemblierung für die Goldkugelspinne Trichonephila clavata und einen Multiomics-Ansatz zur Definition der dreiteiligen Architektur der Ma-Drüse durch: Schwanz, Sack und Gang. Wir haben eine hierarchische Biosynthese von Spidroinen, organischen Säuren, Lipiden und Chitin in der unterteilten Ma-Drüse entdeckt, die für den Aufbau feiner Seide zuständig ist. Die geordnete Sekretion von Spidroinen wurde durch die synergetische Regulierung epigenetischer und ceRNA-Signaturen für genomgruppenverteilte Spidroin-Gene erreicht. Einzelzelluläre und räumliche RNA-Profilierung identifizierte zehn Zelltypen mit aufgeteilter funktioneller Teilung, die die dreiteilige Organisation der Ma-Drüse bestimmen. Konvergenzanalysen und genetische Manipulation bestätigten weiter, dass diese dreiteilige Architektur der Seidendrüse bei allen Arthropoda analog und untrennbar mit der Seidenbildung verbunden war. Insgesamt liefert unsere Studie mehrdimensionale Daten, die das Wissen über die Erzeugung von Spinnen-Schleppleinenseide erheblich erweitern und letztendlich der Innovation bei von Spinnen inspirierten Fasern zugute kommen.

Spinnen (Ordnung Araneae) sind häufig vorkommende Raubtiere von Arthropoden, darunter mehr als fünfzigtausend Arten1,2. Alle Spinnen produzieren Seide, natürliche Hochleistungs-Proteinfasern, die für das Überleben und die Fortpflanzung der Spinnen von entscheidender Bedeutung sind3,4. Die Seidenproduktion ist ein faszinierendes Spinnenmerkmal von besonderem wirtschaftlichen Interesse, vor allem aufgrund der außergewöhnlichen Eigenschaften dieser Fasern, einschließlich hoher Zugfestigkeit und Zähigkeit, geringer Dichte, selbstangetriebener Rotationsbetätigung und Biokompatibilität5,6,7. Zahlreiche Forscher haben versucht, natürliche Spidroin-Produktions- und Spinnprozesse (die Hauptproteine ​​der Spinnenseide) nachzuahmen, um biomimetische Materialien mit spinnenseidenähnlichen Eigenschaften herzustellen8,9,10,11; Ein Großteil unseres aktuellen Verständnisses der Spinnenseidenbildung basiert jedoch auf physikalischen und materiellen Studien, die nur ein teilweises Bild ihrer Natur liefern12,13. Daher wird die Aufklärung der molekularbiologischen Mechanismen, die am natürlichen Seidenproduktionssystem beteiligt sind, wertvoll sein, um ein tiefgreifendes Verständnis der Spinnenseide zu erlangen14,15,16,17.

Obwohl Radnetzspinnen über mehrere seidenproduzierende Drüsen verfügen, wird die große Ampullendrüse (Ma) aufgrund ihrer relativ großen Größe und insbesondere der beeindruckenden Eigenschaften ihres Produkts, der Schleppleinenseide, oft als Modellsystem in der Seidenproduktionsforschung verwendet18. Dementsprechend betrafen die meisten Versuche, von der Seide inspirierte Schleppleinenfasern zu erneuern, im Allgemeinen die Seidenproteine ​​und die Mikroumgebung, die von der Ma-Drüse produziert werden11,12,19. Die Ma-Drüse kann in drei makroskopische Segmente unterteilt werden: den Schwanz, den Beutel und den Gang, die durch Gradienten von pH-Werten, Ionenkonzentrationen und Scherkräften gekennzeichnet sind20,21,22. Flüssiges Seidenprotein wird in sehr hoher Konzentration im Schwanz und Beutel synthetisiert und gespeichert und über den Duktus in unlösliche Ballaststoffe umgewandelt23,24.

In diesem Zusammenhang wurden rekombinante Hauptampullenspidroine (MaSps) konstruiert, um spezifische physikalische Eigenschaften von Seide zu erreichen, einschließlich Festigkeit, Dehnbarkeit und Klebrigkeit25,26,27. Spinnenseide-konstituierende Elemente (SpiCEs), bei denen es sich um Nicht-Spidroin-Proteine ​​handelt, wurden verwendet, um die Zugfestigkeit bei Verbundseidenfilmen zu erhöhen28,29. Darüber hinaus ermöglichte ein Mikrofluidikgerät, das die natürlichen Ionen- und pH-Bedingungen genau simulieren sollte, das direkte Ziehen von Fasern aus dem Auslass und das anschließende Aufwickeln an der Luft, wie beim natürlichen Spinnen30,31,32. Es wird deutlich, dass die detaillierten Mechanismen, die der Produktion von Schleppleinenseide zugrunde liegen, einschließlich der zellulären Architektur und molekularen Funktion der Ma-Drüse sowie der Biozusammensetzung und Bildung von Schleppleinenseide, für fortschrittliche Faserinnovationen von grundlegender Bedeutung sind11,33.

Um Licht auf diese Mechanismen zu werfen, präsentieren wir hier ein hochwertiges Referenzgenom im Chromosomenmaßstab für die goldene Radnetzspinne Trichonephila clavata, die einen farbenfrohen Körper aufweist und ein großes und beeindruckendes Radnetz aufbaut (Abb. 1a). Durch multiomische Analyse der Ma-Drüse und der Schleppleinenseide konnten wir die Ursprünge der Schleppleinenseidenkomponenten aus den Ma-Drüsensegmenten (Schwanz, Beutel und Ductus) zurückverfolgen, die epigenetischen und posttranskriptomischen regulatorischen Merkmale von Spidroin-Genen aufklären und ein einzelnes Konstrukt erstellen -Zellräumliche Architektur der dreiteiligen Ma-Drüse, die die ersten detaillierten zytologischen Definitionen der Spinnen-Ma-Drüse liefert, die ausschließlich auf segmentspezifischer, zelltypspezifischer, raumspezifischer und Schleppseiden-bezogener Genexpressionsklassifizierung basiert. Diese Ergebnisse ermöglichten es uns, einen umfassenden molekularen Atlas der natürlichen Seidenproduktion innerhalb der dreiteiligen Ma-Drüse zu erstellen und so den Entstehungsmechanismus von Schleppleinenseide aufzuklären. Die Daten wurden weiter erweitert, um die konvergente Entwicklung der Seidenproduktion bei der Seidenraupe Bombyx mori aufzudecken, einer Modellart aus einer anderen Arthropodengruppe, und zeigten die gemeinsamen molekularen Eigenschaften der Seidendrüsen der Spinne und der Seidenraupe. Unsere Multiomics-Datensätze sind in SpiderDB (https://spider.bioinfotoolkits.net) zugänglich und werden für zukünftige Untersuchungen der evolutionären Ursprünge von Seidenproduktionsstrategien und der Schaffung biomimetischer Spinnenseide wertvoll sein.

ein Foto von T. clavata, das ein erwachsenes Weibchen und ein erwachsenes Männchen auf dem goldenen Radnetz (oben) und den weiblichen und männlichen Karyotyp (unten) zeigt. SCS, Geschlechtschromosomensystem. b Kreisdiagramm, das die Genomlandschaft der 13 Pseudochromosomen (Chr1–13 auf einer Mb-Skala) darstellt. c Achtundzwanzig T. clavata-Spidroin-Gene, verankert auf Chromosomen. d Spidroin-Gengruppen einer anderen Radnetzspinne, T. antipodiana. Die veröffentlichten Genomdaten von T. antipodiana35 wurden analysiert, um die Standortinformationen von Spidroin-Genen zu ermitteln. e Spidroin-Genkatalog von sechs Radnetzspinnenarten. f Expressionsclusterung von Seidendrüsen (große und kleine Ampullendrüsen (Ma und Mi), Flagelliform- (Fl), Tubuliform- (Tu), Aggregat- (Ag) und Aciniform- und Birnendrüsen (Ac und Py) sowie Giftdrüsen. Die rosa Linie zeigt die engste Beziehung zwischen den Ma- und Mi-Drüsen. g Morphologie der Seidendrüsen von T. clavata. Ähnliche Ergebnisse wurden in drei unabhängigen Experimenten erzielt und in den Quelldaten zusammengefasst. h Expressionsmuster von 28 Spidroin-Genen in verschiedenen Arten von Seidendrüsen. Quelldaten werden als Quelldatendatei bereitgestellt.

Um die Produktion von Schleppleinenseide bei T. clavata zu untersuchen, versuchten wir, ein qualitativ hochwertiges Genom dieser Art zusammenzustellen. Daher führten wir zunächst eine zytogenetische Analyse von T. clavata durch, die in der Stadt Dali, Provinz Yunnan, China, in der Wildnis gefangen wurde, und fanden ein Chromosomenkomplement von 2n = 26 bei Frauen und 2n = 24 bei Männern, bestehend aus elf Paaren autosomaler Elemente und ungepaarte Geschlechtschromosomen (X1X1X2X2 bei Frauen und X1X2 bei Männern) (Abb. 1a). Anschließend wurde DNA aus erwachsenem T. clavata verwendet, um Long-Read- (Oxford Nanopore Technologies (ONT)), Short-Read- (Illumina) und Hi-C-Daten (Supplementary Data 1) zu generieren. Insgesamt wurden 349,95 GB Nanopore-Lesevorgänge, 199,55 GB Illumina-Lesevorgänge und ca. 438,41 GB Hi-C-Rohdaten generiert. Unser sequenzieller Assemblierungsansatz (ergänzende Abbildung 1c) führte zu einem 2,63-GB-Genom mit einem Gerüst-N50 von 202,09 MB und einem Benchmarking Universal Single-Copy Ortholog (BUSCO)-Genomvollständigkeitswert von 93,70 % (Tabelle 1; ergänzende Daten 3). Schließlich wurde das Genom in 13 Pseudochromosomen zusammengesetzt. Die geschlechtsspezifische Pool-Seq-Analyse von Spinnen ergab, dass Chr12 und Chr13 Geschlechtschromosomen waren (Abb. 1b; ergänzende Abb. 2). Basierend auf der MAKER2-Pipeline34 (ergänzende Abbildung 1e) haben wir 37.607 Protein-kodierende Genmodelle mit Anmerkungen versehen und repetitive Elemente mit einer Gesamtlänge von 1,42 Gb vorhergesagt, was 53,94 % des Genoms ausmacht.

Um T. clavata-Spidroin-Gene zu identifizieren, durchsuchten wir die annotierten Genmodelle nach Sequenzen, die 443 veröffentlichten Spidroinen ähneln (Ergänzungsdaten 6) und führten eine phylogenetische Analyse der mutmaßlichen Spidroin-Sequenzen zur Klassifizierung durch (Ergänzungsabbildung 12a). Basierend auf der Erkenntnis, dass ein typisches Spidroin-Gen aus einer langen Wiederholungsdomäne besteht, die zwischen den nichtrepetitiven N/C-terminalen Domänen liegt16, wurden hauptsächlich 128 nichtrepetitive Treffer identifiziert. Diese Kandidaten wurden unter Verwendung von Daten zur Transkript-Isoform-Sequenzierung (Iso-seq) und Transkriptom-Sequenzierung (RNA-seq) in voller Länge weiter validiert und rekonstruiert. Wir identifizierten somit 28 Spidroin-Gene, von denen 26 in voller Länge waren (ergänzende Abbildung 11a), darunter 9 MaSps, 5 kleinere Ampullen-Spidroine (MiSps), 2 flagelliforme Spidroine (FlSps), 1 tubuliformes Spidroin (TuSp) und 2 aggregierte Spidroine (AgSp), 1 aciniformes Spidroin (AcSp), 1 pyriformes Spidroin (PySp) und 5 weitere Spidroine. Dieser vollständige Satz von Spidroin-Genen befand sich auf neun der 13 T. clavata-Chromosomen. Interessanterweise stellten wir fest, dass die Gene MaSp1a–c & MaSp2e, MaSp2a–d und MiSp-a–e in drei unabhängigen Gruppen auf den Chromosomen 4, 7 bzw. 6 verteilt waren (Abb. 1c). Insbesondere anhand der Genomdaten einer anderen kugelwebenden Spinnenart, Trichonephila antipodiana, identifizierten wir homologe Gruppenverteilungen von Spidroin-Genen auf T. antipodiana-Chromosomen (Abb. 1d), was auf die Zuverlässigkeit der Gruppierungsergebnisse unserer Studie hinweist. Als wir den Spidroin-Genkatalog von T. clavata und denen von fünf anderen Radnetzspinnenarten mit Genomdaten verglichen28,29,36,37, stellten wir fest, dass T. clavata und Trichonephila clavipes die größte Anzahl an Spidroin-Genen besaßen (28 Gene). bei beiden Arten; Abb. 1e).

Um die Expression von Spidroin-Genen in verschiedenen Drüsen weiter zu untersuchen, wurden alle morphologisch unterschiedlichen Drüsen (große und kleine ampulläre Drüsen (Ma und Mi), flagelliforme Drüsen (Fl), tubuliforme Drüsen (Tu) und Aggregatdrüsen (Ag)) sauber und isoliert getrennt von erwachsenen weiblichen T. clavata-Spinnen präpariert, mit Ausnahme der aziniformen und birnenförmigen Drüsen, die aufgrund ihrer proximalen anatomischen Lage nicht sauber getrennt werden konnten und daher als kombinierte Probe (aciniforme und birnenförmige Drüse (Ac & Py)) behandelt wurden. Nach der RNA-Sequenzierung dieser Seidendrüsen führten wir eine Expressionsclusteranalyse der transkriptomischen Daten durch und stellten fest, dass die Ma- und Mi-Drüsen sowohl hinsichtlich der morphologischen Struktur (Abb. 1g) als auch der Genexpression (Abb. 1f, h) die engste Beziehung aufwiesen. Wir stellten fest, dass die Expressionsprofile der Spidroin-Gene weitgehend mit ihren mutmaßlichen Rollen in den entsprechenden morphologisch unterschiedlichen Seidendrüsen übereinstimmten; Beispielsweise wurde die MaSp-Expression in der Ma-Drüse gefunden (Abb. 1h). Einige Spidroin-Transkripte wie MiSps und TuSp wurden jedoch in mehreren Seidendrüsen exprimiert (Abb. 1h). Nicht klassifizierte Spidroin-Gene, wie z. B. Sp-GP-reiche, schienen keine drüsenspezifische Expression zu zeigen (Abb. 1h).

Zusammenfassend ermöglichte uns das chromosomale Genom von T. clavata, detaillierte Struktur- und Standortinformationen für alle Spidroin-Gene dieser Art zu erhalten. Wir fanden auch einen relativ vielfältigen Satz von Spidroin-Genen und eine gruppierte Verteilung von MaSps und MiSps in T. clavata.

Um die detaillierten molekularen Eigenschaften der Ma-Drüsen-vermittelten Sekretion von Schleppleinenseide weiter zu bewerten, führten wir integrierte Analysen der Transkriptome der drei Ma-Drüsensegmente von T. clavata sowie des Proteoms und Metaboloms von Schleppleinenseide von T. clavata durch (Abb. 2a). . Die Natriumdodecylsulfat-Polyacrylamid-Gelelektrophorese (SDS-PAGE)-Analyse von Schleppleinenseide zeigte hauptsächlich eine dicke Bande über 240 kDa, was auf eine relativ geringe Vielfalt an Gesamtproteinen schließen lässt (Abb. 2b). Die anschließende Flüssigchromatographie-Massenspektrometrie (LC-MS)-Analyse identifizierte 28 Proteine, darunter zehn Spidroine (neun MaSps und ein MiSp) und 18 Nicht-Spidroin-Proteine ​​(eine Glucosedehydrogenase (GDH), ein Mucin-19, ein Giftprotein und 15 SpiCEs). aus Schleppleinenseide (SpiCE-DS)) (Abb. 2b; Ergänzende Daten 10). Unter diesen Proteinen fanden wir heraus, dass die Kernproteinkomponenten der Schleppleinenseide in der Reihenfolge der Prozentsätze der intensitätsbasierten absoluten Quantifizierung (iBAQ) MaSp1c (37,7 %), MaSp1b (12,2 %), SpiCE-DS1 (11,9 %) waren, auch als bezeichnet SpiCE-NMa1 in einer früheren Studie28), MaSp1a (10,4 %) und MaSp-like (7,2 %), die etwa 80 % der gesamten Proteinhäufigkeit in Schleppleinenseide ausmachen (Abb. 2b). Diese Ergebnisse zeigten potenzielle Proteinkomponenten, die in hohem Maße mit der hervorragenden Festigkeit und Zähigkeit der Schleppleinenseide korrelieren könnten.

a Schematische Darstellung der Segmentierung der Ma-Drüse. b Natriumdodecylsulfat-Polyacrylamid-Gelelektrophorese (SDS-PAGE) (links) und LC-MS-Analyse (rechts) von Dragline-Seidenprotein. iBAQ, intensitätsbasierte absolute Quantifizierung. Ähnliche Ergebnisse wurden in drei unabhängigen Experimenten erzielt und in den Quelldaten zusammengefasst. c Klassifizierung der identifizierten Metaboliten in der Schleppleinenseide. d LC-MS-Analysen der Metaboliten. e LC-MS-Analysen des Goldextrakts aus Schleppleinenseide von T. clavata. Das goldene Pigment wurde mit 80 % Methanol extrahiert. Die extrahierten Ionenchromatogramme (EICs) zeigten einen Peak bei m/z 206 [M + H]+ für Xanthurensäure. f Pearson-Korrelation verschiedener Ma-Drüsensegmente (Schwanz, Sack und Gang). g Expressions-Clustering von Schwanz, Beutel und Ductus. Die transkriptomischen Daten wurden gemäß der hierarchischen Clustering-Methode (HC) geclustert. h Kombinierte Analyse des Transkriptoms und Proteoms, die das Expressionsprofil der Dragline-Seidengene im Schwanz, Sack und Ductus zeigt. i Kurzer Überblick über den Biosyntheseweg von Xanthurensäure (Tryptophan-Metabolismus) in der Ma-Drüse von T. clavata. Die Genexpressionsniveaus, die dem Tryptophanstoffwechsel zugeordnet sind, werden in drei Segmenten der Ma-Drüse angezeigt. Die an diesem Signalweg beteiligten Enzyme sind rot markiert, und die Gene, die die Enzyme kodieren, werden daneben angezeigt. j Gene Ontology (GO)-Anreicherungsanalyse von segmentspezifischen Genen der Ma-Drüse, die die biologischen Funktionen von Schwanz, Beutel und Ductus anzeigen. Für jedes Segment der Ma-Drüse werden die 12 signifikant angereicherten GO-Begriffe angezeigt. Als Kriterium für das Screening signifikant angereicherter GO-Begriffe wurde ein P-Wert <0,05 festgelegt. Quelldaten werden als Quelldatendatei bereitgestellt.

Um die Zusammensetzung der Schleppleinenseide von T. clavata zu bewerten, haben wir anschließend die Zusammensetzung ihrer Metaboliten bewertet und insgesamt 180 Komponenten identifiziert (Ergänzungsdaten 12). Unter den Metaboliten wurden 109 in zehn Kategorien eingeteilt: 34 organische Säuren, 22 organoheterozyklische Verbindungen, 16 Lipide, 13 Benzoloide, 5 organische Stickstoffe, 8 organische Sauerstoffe, 5 Nukleoside, 3 Organooxygene, 2 Phenylpropanoide und Polyketide und 1 Alkaloid (Abb. 2c; Ergänzende Daten 13). Wir stellten fest, dass Xanthurensäure (XA, ein gelbes Pigment38) das am häufigsten vorkommende Pigment war (Abb. 2d), während andere gelbe Pigmente (wie Carotinoide und Flavonoide39, 40) in unserer Analyse nicht nachgewiesen wurden, was darauf hindeutet, dass XA das Hauptpigment ist verleiht der Schleppleinenseide von T. clavata ihre goldene Färbung. Das Vorhandensein von XA wurde weiter durch LC-MS-Analyse bestätigt (Abb. 2e), was einem aktuellen Bericht entspricht41.

Um den Ursprung der Seidenkomponenten der Schleppleine aus der dreiteiligen Ma-Drüse zu untersuchen, konzentrierten wir uns auf die transkriptomischen Merkmale von Schwanz, Beutel und Ductus. Wir stellten fest, dass die Genexpressionsprofile von Schwanz und Sack stärker miteinander korrelierten als mit denen des Ductus (Abb. 2f, g; ergänzende Abb. 13c), was darauf hindeutet, dass Schwanz und Sack ähnliche molekulare Funktionen haben. Darüber hinaus enthüllten kombinierte transkriptomische und proteomische Analysen die Expressionsmuster der 28 Schleppleinen-Seidenprotein-Transkripte im Schwanz, Beutel und Ductus (Abb. 2h; Ergänzende Daten 10). Bemerkenswerterweise wurden MaSp1a–c und MaSp2e (MaSp-Gruppe1) im Schwanz und im Sac stark koexprimiert, und MaSp2a–d (MaSp-Gruppe2) wurden nur im Sac stark koexprimiert, während keine dieser Proteingruppen im Sac stark koexprimiert wurde Dies weist darauf hin, dass der Schwanz und der Sack die wichtigsten Seidensekretionssegmente sind.

Anschließend verwendeten wir die dreiteiligen Ma-Drüsen-Datensätze, um die Quelle des Metaboliten XA zu ermitteln. Wir fanden heraus, dass die Gene, die für Schlüsselenzyme kodieren, die am XA-Biosyntheseweg (Tryptophan-Metabolismus) beteiligt sind, in allen drei Ma-Drüsensegmenten aktiviert waren (Abb. 2i); Insbesondere ein Kynurenin-Aminotransferase-Gen (KAT, Tc09G169510), das die primären Enzyme kodiert, die die Transaminierung von 3-Hydroxy-L-Kynurenin (3-HK) zu XA katalysieren, zeigte dieses Muster. Diese Ergebnisse legen nahe, dass XA vom Schwanz, Sack und Gang abgesondert wird.

Um die spezifischen biologischen Funktionen von Schwanz, Beutel und Ductus im Zusammenhang mit der Produktion von Schleppleinenseide zu charakterisieren, haben wir als Nächstes Begriffe der Gene Ontology (GO) zugewiesen, um die Funktionen von Ma-Drüsensegment-spezifischen Genen zu klassifizieren (Supplementary Data 14). Wir fanden heraus, dass die GO-Terme, die im Schwanz (im Vergleich zum Ductus und Sac) deutlich angereichert waren, hauptsächlich mit der Synthese organischer Säuren (der größten Gruppe im Seidenmetabolom) und denen im Sac (im Vergleich zum Ductus und Sac) zusammenhängen Schwanz) standen hauptsächlich mit der Synthese von Lipiden (der drittgrößten Gruppe im Seidenmetabolom) in Zusammenhang, und diejenigen im Ductus (relativ zu Sack und Schwanz) standen im Zusammenhang mit dem Ionenaustausch (Ca2+ und H+) und der Chitinsynthese (Abb . 2j). Somit wurde eine segmentale Aufteilung der biologischen Funktionen aufgedeckt.

Zusammenfassend zeigen unsere Ergebnisse einen dreiteiligen Erzeugungsprozess von Schleppleinenseide in der Ma-Drüse. Somit haben wir eine genetische Beziehung zwischen den Seidenbestandteilen der Schleppleine und den Schwanz-, Sack- und Gangdrüsen hergestellt.

Basierend auf den Ma-Drüsen-RNA-seq-Daten stellten wir fest, dass die Gesamtfragmente pro Kilobase Transkript pro Million kartierter Lesevorgänge (FPKM) der Dragline-Seiden-Gene 47,49 % bzw. 34,33 % der FPKM-Werte von Tail und Sac ausmachten ; Im Ductus machten diese Gene jedoch nur 0,76 % der FPKM-Werte aus (Supplementary Data 11), was darauf hindeutet, dass die Transkription der Schleppleinen-Seidengene in den ersten beiden Segmenten unglaublich effizient war. Insbesondere wurden die MaSps innerhalb der beiden Gruppen in den spezifischen Segmenten der Ma-Drüse stark koexprimiert (Abb. 2h). Diese Ergebnisse zeigten ein segmentspezifisches Expressionsmuster von Schleppleinen-Seidengenen.

Um den Transkriptionsregulationsmodus dieser Gene besser zu verstehen, untersuchten wir zunächst die genomweite Chromatinzugänglichkeit (CA) im Schwanz, Beutel und Ductus mithilfe des Assays für Transposase-zugängliches Chromatin mit Sequenzierung (ATAC-seq). Insgesamt wurden 702.037 (Tail), 767.517 (Sac) und 653.361 (Duct) signifikante ATAC-Peaks (RPKM > 2) in den 2-kb-Regionen stromaufwärts und stromabwärts der Gene identifiziert, und 10.501.151 (Tail), 11.356.55 (Sac ) und 9.778.368 (Duct) signifikante ATAC-Peaks (RPKM > 2) wurden auf der Ebene des gesamten Genoms identifiziert. Die Tail-Diagramme (mittleres RPKM: 1,78) und Sac (mittleres RPKM: 2,04) zeigten Gene mit besser zugänglichem Chromatin als die Duct-Diagramme (mittleres RPKM: 1,59) (Abb. 3a). Anschließend analysierten wir den genomweiten DNA-Methylierungsgrad im Schwanz, Beutel und Ductus. Wir fanden die höchsten Grade an DNA-Methylierung im CG-Kontext (Beta-Wert: 0,12 im Tail, 0,13 im Sac und 0,10 im Duct) und nur eine geringe Menge im CHH (Beta-Wert: 0,04 im Tail, 0,05 im Sac und). 0,03 im Duct) und CHG (Beta-Wert: 0,04 im Tail, 0,05 im Sac und 0,04 im Duct) (Abb. 3b). Insgesamt gab es keinen signifikanten Unterschied im Methylierungsgrad zwischen Schwanz, Beutel und Ductus. Zusammengenommen deuten unsere Ergebnisse auf eine potenzielle regulatorische Rolle von CA anstelle der DNA-Methylierung bei der Transkription von Schleppleinen-Seidengenen hin.

ein Metagen-Diagramm der ATAC-seq-Signale und eine Heatmap der ATAC-seq-Lesedichten im Schwanz, Beutel und Ductus. Die Zugänglichkeit des Chromatins wurde durch den mittleren RPKM-Wert (oben) und den blauen Bereich (unten) angezeigt. b Metagendiagramm der DNA-Methylierungsniveaus in CG/CHG/CHH-Kontexten im Schwanz, Beutel und Ductus. (c, d) Screenshots der Methylierungs- und ATAC-seq-Spuren der Gene MaSp1b (c) und MaSp2b (d) in Tail, Sac und Duct. Die potenziellen TF-Motive (E-Wert <1e−10) im angegebenen Peak-Set (2 kb vor dem TSS) werden rechts aufgelistet und nach Position sortiert. Sternchen stellen das gemeinsame TF-Motiv innerhalb der entsprechenden MaSp-Gruppe dar. e Venn-Netzwerk von TF-Motiven zwischen MaSp-Gruppe1 und MaSp-Gruppe2. f Expressionsniveaus von miRNAs und lncRNAs im Schwanz, Sack und Ductus. Die Daten werden als Mittelwert ± SD (n = 3 für jedes Ma-Segment) dargestellt. Boxplots zeigen Minimum bis Maximum (Whisker), 25–75 % (Box) und Median (Band innen) für alle Datenpunkte. g ceRNA-Netzwerk der Dragline-Seiden-Gene.

Als nächstes zeigte die Visualisierung der ATAC-seq- und Methylierungsdatensätze der beiden MaSp-Gruppen in einem Genombrowser einen umgekehrten Trend der Spitzensignale (Abb. 3c, d; ergänzende Abb. 16). Wir analysierten potenzielle TF-Motive unter den ATAC-seq-Peaksätzen in den 2-kb-Regionen stromaufwärts der Transkriptionsstartstellen (TSSs). Wir identifizierten neun Schwanz- und Sac-spezifische TF-Motive für MaSp1b (in MaSp-Gruppe 1) und 13 Sac-spezifische TF-Motive für MaSp2b (in MaSp-Gruppe 2) (Supplementary Data 15; Supplementary Abb. 17a, b). Interessanterweise stellten wir fest, dass die TF-Motive, die den TSSs am nächsten liegen, wie MYB- und Homöobox-Motive für MaSp-Gruppe 1 und zwei C2H2-Motive für MaSp-Gruppe 2, innerhalb jeder MaSp-Gruppe gemeinsam waren (Abb. 3c, d). Das Venn-Netzwerk von TF-Motiven zwischen MaSp-Gruppe1 und MaSp-Gruppe2 zeigte jedoch wenig Gemeinsamkeiten zwischen Schwanz, Beutel und Ductus (Abb. 3e). Daher kamen wir zu dem Schluss, dass es innerhalb jeder MaSp-Gruppe ein gemeinsames Regulierungsmuster gab, zwischen den beiden MaSp-Gruppen jedoch ein differenziertes Regulierungsmuster.

Um den Einfluss konkurrierender endogener RNAs (ceRNAs: ein durch miRNA und lncRNA42 implementiertes posttranskriptionelles Regulierungssystem) zu untersuchen, die der Regulierung von Schleppleinen-Seidengenen entsprechen, führten wir eine gesamte transkriptomische Analyse der dreiteiligen Ma-Drüse durch und identifizierten eine Gesamtzahl von 527 miRNAs (179 im Schwanz, 167 im Sac, 181 im Ductus) und 10.110 lncRNAs (240 im Tail, 982 im Sac und 4808 im Ductus) (Abb. 3f). Aus diesen Daten konstruierten wir mithilfe der Algorithmen miRanda43 und RNAhybrid44 ein potenzielles lncRNA-miRNA-mRNA-Interaktionspaar, um die potenzielle Bindungsstelle zwischen miRNA und lncRNA/mRNA zu identifizieren, und visualisierten dann die Interaktionsnetzwerke mithilfe der Cytoscape-Software45. Wie in Abb. 3g gezeigt, bestand das ceRNA-Netzwerk der Dragline-Seidengene aus 28 lncRNAs, 21 miRNAs und 13 mRNAs. Bemerkenswerterweise stellten wir fest, dass die ceRNA-Netzwerke von MaSp1a–c und MaSp2e (MaSp-Gruppe 1) eng geclustert waren, ebenso wie die von MaSp2a–d (MaSp-Gruppe 2); Drei lncRNAs (LXLOC_047988, LXLOC_047990 und LXLOC_051464) im MaSp-Gruppe-1-Netzwerk wurden in der Ma-Drüse stark exprimiert (ergänzende Abbildung 18); Eine lncRNA (LXLOC_070389) und vier miRNAs (novel_mir42, Novel_mir46, Novel_mir166 und miR-285_3) im MaSp-Gruppe-2-Netzwerk wurden in der Ma-Drüse stark exprimiert (ergänzende Abbildung 18); Darüber hinaus waren die ceRNA-Netzwerke der beiden MaSp-Gruppen unabhängig voneinander (Abb. 3g; ergänzende Abb. 18). Diese Ergebnisse zeigten außerdem potenzielle posttranskriptionelle Netzwerke und das differenzierte koregulatorische Muster der Gene in den beiden MaSp-Gruppen in der Ma-Drüse.

Zusammenfassend konnten wir eine Fülle epigenetischer und ceRNA-Signaturen beobachten, die mit der effizienten und segmentspezifischen Transkription von Schleppleinen-Seidengenen verbunden sind. Unsere Daten deuten auf die Existenz unterschiedlicher Regulationsstrategien in den drei Segmenten der Ma-Drüse hin, die der Erzielung der hierarchischen Genexpression der MaSps dienen.

Um die zytologischen Grundlagen im Zusammenhang mit der hierarchischen Organisation der Ma-Drüse weiter zu untersuchen, haben wir Einzelzell- und räumliche Muster der Genexpression in der gesamten Ma-Drüse von T. clavata generiert. Nach der Qualitätskontrolle wurden insgesamt 9349 hochwertige Einzelzellen (SCs) erhalten, die dann durch UMAP-Clustering (Uniform Manifold Approximation and Projection) in zehn Cluster aufgeteilt wurden (Abb. 4a). Basierend auf der GO-Analyse von Cluster-spezifischen Markergenen in Kombination mit den Expressionsprofilen der Segment-spezifischen Gene in jedem Cluster (Ergänzende Abbildung 21 und Ergänzende Anmerkung „Zelltyp-Annotation“) haben wir die Feinannotationen von zehn SC-Clustern durchgeführt , nämlich Cluster 1: Ma-Drüsen-Ursprungszelle (MaGO), Cluster 2: MaSp-Gruppen-Synthesezelle (MG1S), Cluster 3: Chitin-Synthesezelle (CS), Cluster 4: Unbekannte Zelle, Cluster 5: Ampullenlumen-Skelettzelle ( ALS), Cluster 6: Ionentransportzelle (IT), Cluster 7: Lipidsynthesezelle (LS), Cluster 8: pH-Anpassungszelle (PA), Cluster 9: MaSp-Gruppe 2-Synthesezelle I (MG2S I) und Cluster 10: MaSp-Gruppe 2-Synthesezelle II (MG2S II) und grenzte ihre Quellen vom Schwanz (Cluster 1 und 2), Sac (Cluster 1, 2, 5, 7, 9, 10) und Duct (Cluster 1, 3, 4, 6, 8) (Abb. 4a).

eine UMAP-Analyse (Uniform Manifold Approximation and Projection) der Zelltypen in der Ma-Drüse und deren Gruppierung in zehn Zellcluster. Die Zahlen in weiß gefüllten Kreisen geben Zellcluster an. Die allgegenwärtigen Cluster sind in der gelben Serie dargestellt, die Sac-Cluster in der grünen Serie und die Ductus-Cluster in der blauen Serie. b Pseudozeit-Trajektorie aller 9349 Ma-Drüsenzellen. Jeder Punkt bezeichnet eine einzelne Zelle, die durch den Cluster farblich gekennzeichnet ist, wie in (a). Die Zahlen in den schwarz ausgefüllten Kreisen geben die Zweigstellen an. Die schwarzen Pfeile zeigen den Beginn der Flugbahn an. c Hämatoxylin- und Eosin-Färbung von Ma-Drüsenabschnitten und unvoreingenommene Clusterung räumlicher transkriptomischer (ST) Flecken. Gepunktete Linien zeigen den Umriss der Ma-Drüse. Ähnliche Ergebnisse wurden in drei unabhängigen Experimenten erzielt und in den Quelldaten zusammengefasst. d UMAP- und ST-Funktionsdiagramme der Expression von Genen in der MaSp-Gruppe. e Heatmap, die die Expression von Ma-Drüsensegment-spezifischen Genen in jedem Zelltyp und jedem ST-Cluster zusammen mit den entsprechenden GO-Termen zeigt. Quelldaten werden als Quelldatendatei bereitgestellt.

Um zu erkennen, wie sich Schwanz, Beutel und Gang innerhalb der Ma-Drüse entwickeln, haben wir alle einzelnen Zellen nach Pseudozeit geordnet und eine Entwicklungsbahn erstellt. Dies führte zu einem Kontinuum von Zellen mit drei unterschiedlichen Verzweigungspunkten. Wir fanden heraus, dass sich ein Satz von Zellen aus Cluster 1 (allgegenwärtiger SC-Cluster) zu Beginn der Pseudozeitperiode zusammensetzte und sich allmählich in vier Endpunkte aufteilte, die zwei Segmente (Sac und Ductus) der Ma-Drüse darstellen, wobei die Cluster bei angeordnet waren verschiedene Verzweigungsstellen (Abb. 4b). Wir haben die Entwicklungsverläufe von Schwanz, Beutel und Ductus separat weiter untersucht. Wie erwartet wurden die meisten Zellen aus Cluster 1 zu Beginn der Pseudozeitperiode zusammengesetzt, während dies bei den Sac-Zellen (Cluster 2, 5, 7, 9 und 10) und den Ductus-Zellen (Cluster 3, 4, 6, 8) der Fall war in verschiedene Zweige gruppiert (Abb. 4b; ergänzende Abb. 23). Diese Ergebnisse identifizierten SC-Cluster 1 als die Ursprungszelle der Ma-Drüse und lieferten Einblicke in die Differenzierungsverläufe von Ma-Drüsenzellen während Zellzustandsübergängen.

Als nächstes untersuchten wir die räumliche Organisation der Zellpopulationen in den Ma-Drüsenabschnitten. Dieser Datensatz enthielt Genexpressionsinformationen aus einer Ressource, die an 579 räumlichen Transkriptompunkten (ST) in Ma-Drüsenabschnitten generiert wurde (Abb. 4c). Nach der Analyse der Transkriptionssignaturen von ST-Spots identifizierten wir sieben Spot-Cluster (einen im Schwanz, vier im Sack und zwei im Ductus). Als erste Demonstration der einzelzellulären und räumlichen Genexpressionsmuster in der Ma-Drüse haben wir die Expression der Gene MaSp-Group1 und MaSp-Group2 in UMAP- und ST-Merkmalsdiagrammen visualisiert, um Seidenprotein-sekretierende Zellen in unseren erfassten Zellen besser zu lokalisieren Zellpopulationen. Interessanterweise fanden wir heraus, dass die MaSp-Group1-Gene in den Tail- und Sac-Clustern (SC-Cluster 1, 2, 5, 7, 9 und 10 und ST-Cluster „a–f“) prominent exprimiert wurden, während die MaSp-Group2-Gene wurden überwiegend in den Sac-Clustern (SC-Cluster 9–10 und ST-Cluster „d“) exprimiert (Abb. 4d; ergänzende Abb. 22a). Somit zeigten die Gene sowohl gemäß den scRNA-seq- als auch den ST-Ergebnissen zelluläre und räumliche Cluster-spezifische Muster, die mit den Ergebnissen der Expressions- und Regulationsanalysen übereinstimmten (Abb. 2h, 3c, d, g).

Um die identifizierten SC- und ST-Cluster im Zusammenhang mit der molekularen Funktion der Ma-Drüse zu charakterisieren, haben wir 35 der in den Segmenttranskriptomen identifizierten segmentspezifischen Gene ausgewählt, um Expressionsanalysen basierend auf den scRNA-seq- und ST-Datensätzen durchzuführen. Wir fanden heraus, dass SC-Cluster 2 und ST-Cluster „a“ Hauptgruppen mit den Funktionen des Stoffwechselprozesses organischer Säuren und der Oxidoreduktaseaktivität waren; SC-Cluster 7 und ST-Cluster „e“ waren Hauptgruppen mit den Funktionen des Lipidstoffwechselprozesses und der Transferaseaktivität; SC-Cluster 6 und ST-Cluster „f“ waren Hauptgruppen mit der Funktion der Calciumionenbindung; SC-Cluster 3/8 und ST-Cluster „c/g“ waren Hauptgruppen mit der Funktion eines protonentransportierenden ATPase-Komplexes vom V-Typ; und SC-Cluster 3 und ST-Cluster „f“ waren Hauptsätze mit der Funktion der Chitinbindung (Abb. 4e; ergänzende Abb. 25, 26).

Zusammenfassend lässt sich sagen, dass die detaillierte anatomische und molekulare Beschreibung der Ma-Drüse einen einzelnen Zelltyp im Schwanz und mehrere Zelltypen im Sack und Gang offenbarte, was die Entwicklungs- und Funktionsdifferenzierung der Ma-Drüse im Dreifachabschnitt hervorhebt.

Um unsere Untersuchung auf einen etablierten Modellorganismus auszudehnen, der auch spezielle Drüsen zum Spinnen von Seide entwickelt hat, haben wir die Seidenraupe Bombyx mori ausgewählt, die eine andere phylogenetische Position als Spinnen im Stamm Arthropoda einnimmt46. Durch anatomische Beobachtungen stellten wir eine morphologische Konvergenz der Seidenspinndrüse zwischen der Ma-Drüse (Schwanz, Sack und Gang) von T. clavata und der Seidendrüse von B. mori (hintere Seidendrüse (PSG), mittlere Seidendrüse (MSG) fest ) und vordere Seidendrüse (ASG)), was auf eine Eins-zu-eins-Entsprechung der dreiteiligen Architektur hinweist (Abb. 5a, b). Wir fanden auch eine ähnliche Anzahl von Seidendrüsenzelltypen zwischen T. clavata und B. mori47, jedoch differenzierte Anmerkungen mit Ausnahme des Chitin-bezogenen Prozesses im Ductus/ASG (Abb. 5b; ergänzende Abb. 29). Unsere früheren Studien deckten Defekte beim Seidenspinnen durch Seidenraupen auf, die durch einen strukturellen Mangel an PSG und ASG48,49 verursacht wurden. Das genetische Manipulationssystem für Spinnen ist jedoch noch nicht etabliert. Um zu untersuchen, ob das verbleibende Segment der Seidenraupen-Seidendrüse für die ordnungsgemäße Seidenproduktion erforderlich ist, verwendeten wir die durch den Ser1-Promotor gesteuerte transgene Überexpression (OE) eines Schmetterlingszytotoxins (Pierisin-1A, P1A50), um eine MSG-defiziente Seidenraupe (P1A-1A) zu erzeugen. OE) (Abb. 5c). Wir fanden heraus, dass das MSG des P1A-OE-Stamms erfolgreich verkürzt wurde und dass diese Seidenraupen keinen Kokon spinnen konnten (Abb. 5c), was mit den Phänotypen von PSG- und ASG-defizienten Seidenraupen 48, 49 übereinstimmt. Unsere Ergebnisse zeigten außerdem, dass die dreiteilige Architektur der Seidendrüse für das Seidenspinnen unerlässlich ist.

a Morphologie der T. clavata Ma-Drüse, der Schleppleinenseide, der B. mori-Seidendrüse und der Kokonseide. Einschübe zeigen Querschnitte von Seidenfäden. Ähnliche Ergebnisse wurden in drei unabhängigen Experimenten erzielt und in den Quelldaten zusammengefasst. b Schematische Darstellung der morphologischen Konvergenz der Ma-Drüse von T. clavata mit angedeutetem Schwanz, Beutel und Ductus (oben) und der Seidendrüse von B. mori mit angedeutetem PSG, MSG und ASG (unten). c Konstruktion des transgenen piggyBac-Vektors (oben) und der Seidendrüsen-Phänotypen der P1A-OE- und Wildtyp-Stämme (WT) in Seidenraupen (unten). Ser1-P, Ser1-Promotor. 3 × P3-P, 3 × P3-Promotor. SV40-T, SV40-Terminator. L5D7 repräsentiert den 7. Tag des fünften Stadiums. Die Pfeile zeigen den Seidenproduktionsprozess an und ein rotes Kreuz zeigt an, dass der Prozess blockiert war. d Sequenzalignment der orthologen Hsp20-Proteine ​​(Tc04G175120 und BMSK0007630) bei Spinnen und Seidenraupen. Die rote Linie zeigt den Bearbeitungsbereich an. Der Pfeil zeigt die Verteilung der identifizierten Allele um die Schnittstelle der sgRNA. Die 16 besten Sequenzen mit einem hohen Prozentsatz wurden ausgestellt. e Kokongewicht, Puppengewicht und Kokonschichtratenleistung des CRISPR/Cas9-basierten Hsp20-Knockout-Seidenraupenstamms. Die Daten wurden als Mittelwert ± SD (n = 3) dargestellt. Statistische Vergleiche wurden mithilfe des zweiseitigen Student-t-Tests durchgeführt. ns bedeutet nicht signifikant. **P-Wert <0,01. Der Pfeil zeigt den Seidenherstellungsprozess an. Die rote Linie, die mit einem Kreuzbalken endet, zeigt an, dass der Prozess unterdrückt wurde. f Molekulare funktionelle Konvergenz der Ma-Drüse von T. clavata und der Seidendrüse von B. mori gemäß GO-Term-Analyse. Als Kriterium für das Screening signifikant angereicherter GO-Begriffe wurde ein P-Wert < 0,05 festgelegt. g Orthologe Genexpressionskonvergenz zwischen der Ma-Drüse von T. clavata und der Seidendrüse von B. mori. h, i Komponentenkonvergenz von Protein (h) und Metabolit (i) zwischen Seiden, die von T. clavata und B. mori produziert werden. Die Metaboliten mit einem Gesamtintensitätsprozentsatz von über 90 % wurden analysiert. Die Hauptmetaboliten in T. clavata-Dragline-Seide und B. mori-Kokonseide sind rot markiert. Quelldaten werden als Quelldatendatei bereitgestellt.

Um die Konvergenz zwischen diesen beiden Arten weiter zu untersuchen, führten wir ein Blastp-Alignment des gesamten Genoms durch und identifizierten 9593 und 7355 orthologe Gene in T. clavata bzw. B. mori. Aus diesen zugewiesenen Genorthologpaaren haben wir das Hsp20-Paar (Tc04G175120 und BMSK0007630) aufgrund der hohen Sequenzidentität von 87, 1% zwischen T. clavata und B. mori ausgewählt (Abb. 5d); Darüber hinaus wurde Hsp20 in den Seidendrüsen von T. clavata und B. mori exprimiert und diente gleichzeitig als Markergen des SC-Clusters 5 der Ma-Drüse von T. clavata (Supplementary Data 17), das ein kleines Hitzeschockprotein kodiert das als Protein-Chaperon fungiert, um andere Proteine ​​vor Fehlfaltung und Aggregation zu schützen51. Als nächstes führten wir ein CRISPR/Cas9-basiertes Knockout (KO) von Hsp20 in Seidenraupen durch und identifizierten erfolgreich Indels (96,46 %) an der Zielstelle der Hsp20-sgRNA (Abb. 5d). Interessanterweise stellten wir fest, dass die Seidenproduktion (Kokongewicht und Kokonschichtrate) des Hsp20-KO-Stammes deutlich geringer war als die des Wildtyps (Abb. 5e). Aus diesen Ergebnissen schlossen wir, dass das orthologe Hsp20 sowohl bei der untersuchten Spinne als auch bei der Seidenraupe eine positive Rolle bei der Seidenproduktion spielte.

Um die molekularen Signaturen des Seidenspinnens weiter zu untersuchen und Hinweise auf eine konvergente Evolution bei Spinne und Seidenraupe zu finden, führten wir als nächstes vergleichende transkriptomische, proteomische und metabolomische Analysen der dreiteiligen Seidendrüsen und Seiden von T. clavata und B. mori durch. Zwischen jeder entsprechenden Seidendrüsenregion von T. clavata und B. mori wurden gemeinsame GO-Begriffe identifiziert. Wir fanden heraus, dass drei GO-Terme (Kalziumionenbindung, Chitinbindung und Signaltransduktion) häufig im Ductus und ASG angereichert waren und dass ein GO-Term (Fettsäurestoffwechselprozess) häufig im Sac und MSG angereichert war (Abb. 5f). . Diese gemeinsamen GO-Begriffe waren seidendrüsenspezifisch und wurden in anderen Gewebetypen (Hämozyten und Eierstöcke) nicht identifiziert (ergänzende Abbildung 30). Als nächstes führten wir mithilfe einer maßgeschneiderten Pipeline ein einzigartiges Genscreening für jedes Seidendrüsensegment durch (ergänzende Abbildung 28a). Wir fanden heraus, dass 42, 6 und 2 Paare orthologer Gene im Ductus und ASG, Sac und MSG bzw. Tail und PSG coexprimiert wurden (Abb. 5g; Supplementary Data 20). Interessanterweise fanden wir heraus, dass sieben orthologe Genpaare, die an der V-Typ-ATPase-Familie beteiligt sind und Schlüsselfaktoren kodieren, die an der Regulierung der Seidenfibrillogenese beteiligt sind, sowohl im Ductus als auch im ASG signifikant hochreguliert waren (Abb. 5g). Unsere Ergebnisse zeigten eine höhere Konsistenz zwischen Ductus und ASG in den molekularen Funktionen als zwischen Sac und MSG oder Tail und PSG.

Anschließend untersuchten wir, ob die Komponenten von Spinnen- und Seidenraupenseide Konvergenz zeigten, indem wir Venn-Analysen der Seidenproteome und -metabolome beider Arten durchführten (ergänzende Abbildung 28b). Wir fanden heraus, dass Mucin-19 und GDH die einzigen beiden Proteine ​​waren, die sowohl in der Schleppleinenseide von T. clavata als auch in der Kokonseide von B. mori existierten, und was noch interessanter ist, dass diese Proteine ​​hauptsächlich von Tail/PSG und Sac/MSG synthetisiert und sezerniert wurden (Abb. 5h). Wir haben auch sechs häufige Metaboliten in diesen beiden Seiden identifiziert: Cholin, N-Methyl-α-aminoisobuttersäure, DL-Äpfelsäure, D(-)-Threose, 4-Oxoprolin und L-Threonsäure (Abb. 5i). Unter diesen Metaboliten ist es erwähnenswert, dass Cholin, ein Bestandteil von Phospholipiden in Zellmembranen53, und DL-Äpfelsäure, die als Konservierungsmittel oder pH-Regler54 wirkt, beide Hauptmetaboliten von Schleppseide und Kokonseide waren (Abb. 5i). . Wir vermuteten daher, dass die Seidensekretion von Drüsenzellen in das Lumen mit der Freisetzung von Cholin aus der Zellmembran einhergeht und dass DL-Äpfelsäure in natürlicher Seide Anti-Fäulnis- und Antibakterieneigenschaften verleiht.

Zusammenfassend lässt sich sagen, dass die gemeinsamen molekularen Eigenschaften der dreiteiligen Seidendrüsen einer Spinne und einer Seidenraupe auf eine konvergente Entwicklung bei ähnlichen Fällen im Zusammenhang mit der Seidenspinnerei hindeuteten und umfassende Einblicke in die Funktion der Seidendrüsen und die Seidenbiosynthese lieferten.

Hier berichten wir über die erste Referenzgenomassemblierung von T. clavata im Chromosomenmaßstab. Dieses hochwertige Genom ermöglichte in Kombination mit Multiomics-Analysen die Aufklärung von Seidenbiosyntheseprozessen in der dreiteiligen Ma-Drüse. Unsere Ergebnisse führten uns zu der Hypothese, dass der Schwanz die primäre Funktion bei der MaSps-Sekretion übernimmt, während der Beutel, der als Speicherort fungiert, ein breites Spektrum an Proteinen (MaSps und Nicht-Spidroin-Proteine) sezerniert und der Ductus eine begrenzte Rolle bei der Proteinsekretion spielt aber eine entscheidende Rolle beim Strukturübergang von Proteinen20,21,24.

Wir schlagen ein molekulares Modell vor, das den Mechanismus, der der Biosynthese von Schleppleinenseide in der Ma-Drüse von T. clavata zugrunde liegt, umfassend beschreibt (Abb. 6): (i) Der Schwanz, bestehend aus zwei allgegenwärtigen Zelltypen, ist der Hauptort der Sekretion organischer Säuren und 13 Schleppseidenproteine, die die innere Schicht der Schleppseide bilden. Das Vorhandensein organischer Säuren kann die Proteinlöslichkeit in Wasser beeinflussen, indem es die Konformationszustände verändert55. Im Schwanz sind diese 13 Schleppleinen-Seidengene stark aktiviert, wobei die Transkripte, die für Proteine ​​der MaSp-Gruppe 1 kodieren, die dominierenden Komponenten sind. Eine relativ hohe CA in diesem Segment könnte zusammen mit der mCG-Methylierung zu dieser reichlichen Genexpression beitragen. (ii) Der Beutel, der aus zwei allgegenwärtigen und vier einzigartigen Zelltypen besteht, ist der Hauptort der Sekretion von Lipiden und 28 Schleppseidenproteinen, die die mittlere Schicht der Schleppseide bilden. Die Lipide fungieren als eine Hülle, die sich um die Seide des Schleppseils legt und deren Wassergehalt reguliert55. Diese 28 Dragline-Seiden-Gene sind auch im Beutel stark aktiviert, wobei MaSp-Group1, MaSp-Group2, MaSp-like, SpiCE-DS1, SpiCE-DS2, SpiCE-DS4 und SpiCE-DS13 die dominierenden Komponenten sind. Eine relativ hohe CA- und mCG-Methylierung könnte ebenfalls zu der in diesem Segment beobachteten hohen Genexpression beitragen. (iii) Der Gang, bestehend aus einem allgegenwärtigen und vier einzigartigen Zelltypen, ist der Hauptort der Sekretion von Chitin, kutikulären Proteinen, Ionen (Ca2+ und H+) und 13 Schleppleinenproteinen. Chitin und kutikuläre Proteine ​​bilden die kutikuläre Intima, wo Scherkräfte erzeugt werden21,56. Die Ionen sind für einen mehrdimensionalen Flusszustand verantwortlich, einschließlich Ionenaustausch, Bildung eines pH-Gradienten und Dehydrierung11,20, und die 13 Schleppseidenproteine ​​bilden die äußere Schicht der Schleppseide. Die Transkription von Schleppleinen-Seidengenen ist im Ductus weniger aktiv als im Schwanz und Sack, und nur 0,76 % der Transkripte stammen von diesen Genen. Eine relativ niedrige CA in diesem Segment könnte zusammen mit der mCG-Methylierung zu dieser Abnahme der Expression beitragen. Insgesamt definieren unsere Ergebnisse nicht nur die proteomischen und metabolischen Komponenten der Schleppleinenseide, sondern verfolgen auch deren Ursprung in der dreiteiligen Ma-Drüse. Die Anzahl der Zelltypen im Schwanz, Sack und Gang korreliert positiv mit der Vielfalt ihrer Funktionen.

Orangefarbene ausgefüllte Kreise stellen die Gene mit einem FPKM > 10.000 dar, und orangefarbene Hohlkreise stellen die Gene mit einem FPKM < 10.000, CA-Chromatinzugänglichkeit und Me-Methylierung dar. Zur Erstellung des Bildes wurde Adobe Illustrator 2020 verwendet.

Unsere Ergebnisse liefern genomische Hinweise auf die hierarchisch geordnete Biosynthese von Spidroinen. Wir haben dokumentiert, dass die Gene MaSp1a–c & MaSp2e, MaSp2a–d und MiSp-a–e in drei verschiedene Gruppen verteilt sind. Darüber hinaus haben wir gezeigt, dass die MaSps innerhalb jeder dieser Gruppen konzertierte SC- und ST-Expressionsprofile in der dreiteiligen Ma-Drüse aufwiesen. Wir identifizierten auch die gruppenspezifischen gemeinsamen TF-Motive auf epigenetischer Ebene und konstruierten gruppenspezifische lncRNA-miRNA-mRNA-Netzwerke auf ceRNA-Ebene. Solche Ergebnisse enthüllten neue strukturelle, expressionelle und regulatorische Eigenschaften von Spidroin-Genen, über die in anderen Spinnengenomen nicht berichtet wurde. Es wird angenommen, dass Spidroine einen wichtigen Einfluss auf die mechanischen Eigenschaften von Schleppleinenseide haben16,57,58. Da die Gruppenverteilungen von Spidroin-Genen bereits in den hochwertigen Spinnengenomen von T. antipodiana35 und Latrodectus elegans59 mit katalogisierten Spidroin-Proteinen identifiziert wurden, schließen unsere Daten eine wichtige Informationslücke hinsichtlich der Anordnung von Spidroin-Genen auf ganzen Chromosomen und liefern einen allgemeinen Überblick Einstiegspunkt für die mechanische Differenzierung von Seide und die weitere Untersuchung der Evolution des Spinnengenoms.

Zusätzlich zu den oben genannten genomischen Erkenntnissen liefern unsere Ergebnisse zelluläre Hinweise auf die dreiteilige Organisation und funktionelle Aufteilung der Ma-Drüse. Während frühere Studien gezeigt haben, dass es zwei oder drei Zelltypen gibt, die Spidroine in der Ma-Drüse von Radnetzspinnen absondern21,60, war die Anzahl der Zelltypen in der Ma-Drüse Gegenstand von Debatten. Die unterschiedlichen Ergebnisse zu diesen Zelltypen deuten darauf hin, dass sie zwischen den Arten variieren können, spiegeln aber wahrscheinlich auch technologische Schwierigkeiten bei der Erfassung intakter Zellen nach der Probenvorbereitung für zelluläre und morphologische Studien wider20,21,61. Unsere Studie liefert gut verifizierte scRNA-seq- und ST-Daten, die auf die Existenz von zehn Zelltypen in der gesamten Ma-Drüse hinweisen und so zur Beantwortung dieser umstrittenen Frage beitragen. Die faszinierende räumliche Einzelzellarchitektur der Drüse weist außerdem auf den Differenzierungsverlauf von Ma-Drüsenzellen während Zellzustandsübergängen hin, was darauf hindeutet, dass der Beutel und der Ductus durch Zelldifferenzierung vom frühen Zelltyp im Schwanz abgeleitet sind.

Unsere genomischen, proteomischen und metabolomischen Analysen enthüllen außerdem Details über die Seidenbildung in seidenproduzierenden Drüsen. Physikalische und Materialstudien haben gezeigt, dass flüssige Seidenspinnlösung durch die kombinierte Wirkung von pH- und Ionengradienten sowie Dehnungs- und Scherkräften bei ihrer Wanderung durch die Seidendrüse in unlösliche Fasern umgewandelt wird3,62. Unsere Arbeit liefert biologische Beweise für diese Rolle der Seidendrüse und zeigt darüber hinaus eine hohe Konvergenz mehrerer molekularer Funktionen im Ductus der Spinnen-Ma-Drüse und im ASG der Seidenraupe, einschließlich Calciumionenbindung, Chitinbindung, Signaltransduktion und V-Typ-H+-Transport ATPase-Ausdruck. Solche Überlappungen waren Seidendrüsen-spezifisch und wurden in anderen Gewebetypen (Hämozyten und Eierstöcke) nicht identifiziert (ergänzende Abbildung 30). Darüber hinaus identifizierten wir konvergente Seidenkomponenten in Spinnen- und Seidenraupenseide, darunter zwei Proteine ​​(Mucin-19 und GDH) und zwei Hauptmetaboliten (Cholin und DL-Äpfelsäure). Diese analogen Aspekte wiesen auf kritische Prozesse und Komponenten hin, die für die Seidenbildung wesentlich sind, die zum Verständnis der Entwicklung der Seidenspinnerei beitragen und als Referenzen für die Optimierung von künstlichen Spinnvorrichtungen auf Kanalbasis und das Design von Seidenproteinlösungen beim künstlichen Spinnen verwendet werden können.

Zusammenfassend veranschaulicht unsere aktuelle Arbeit umfassend die biologischen Grundlagen der Schleppseidenbildung bei einer Kugelwebspinne. Unseres Wissens ist diese Studie die erste, die den biologischen Mechanismus der Seidenspinnen bei Spinnen so detailliert aufdeckt. Wir glauben, dass das hier vorgestellte Referenzgenom der Goldspinne im Chromosomenmaßstab und der molekulare Atlas der dreiteiligen Ma-Drüse das Verständnis des Spinnenseidenspinnprozesses bei Spinnen erleichtern und darüber hinaus als leistungsstarke Plattform dienen werden Evolutionsstudien seidenspinnender Organismen. Noch wichtiger ist, dass die signifikanten molekularen Eigenschaften, die unsere Ergebnisse und die generierten Datensätze aufdecken, letztendlich den Weg für die Herstellung optimierter synthetischer Seiden durch genetische und biomimetische Manipulationen ebnen sollten.

T. clavata-Spinnen wurden in der Stadt Dali, Provinz Yunnan, China, in freier Wildbahn gefangen. Die gefangenen erwachsenen weiblichen T. clavata-Spinnen wurden in Innenräumen bei 25 °C kultiviert und ihre Eier wurden am dritten Tag nach dem Laichen zur DNA-Karyotypisierung entnommen. Ungefähr 20 Eier wurden mit einer Pinzette zerdrückt, drei Stunden lang mit 1,5 ml 0,05 % Colchicin gemischt, mit 0,075 mol/L KCl-Lösung immobilisiert (20 Min.) und in einer Methanol:Essigsäure-Lösung (3:1) fixiert (30 Min.). . Die Zellsuspension wurde auf vorgekühlte Glasobjektträger getropft, flammengetrocknet, mit 5 %iger Giemsa-Lösung gefärbt (50 Minuten), mit fließendem Wasser gespült und an der Luft getrocknet. Chromosomenkaryotypen wurden mit einem Olympus-Mikroskop mit 40-facher Vergrößerung beobachtet.

Um den Gensatz von T. clavata umfassender zu erfassen, wurden die folgenden 18 frischen Gewebe (Supplementary Data 1) in PBS-Lösung präpariert: weiblicher Körper (TcF), männlicher Körper (TcM), Hämolymphe (Hem), Pedipalps (Ped), Beine (Leg), Epidermis (Epi), Fettkörper (Fat), Eierstock (Ova), Giftdrüse (Ven), ganze große Ampullendrüse (Ma), Schwanz der Ma-Drüse (Tail), Beutel der Ma-Drüse ( Sac), Gang der Ma-Drüse (Duct), kleine Ampullendrüse (Mi), tubuliforme Drüse (Tu), Flagelliforme-Drüse (Fl), Aggregatdrüse (Ag) sowie aziniforme und pyriforme Drüsen (Ac & Py); und für jede Probe wurden drei unabhängige biologische Replikate durchgeführt. Anschließend wurde die Gesamt-RNA mit TRIzol-Reagenz extrahiert und auf der DNBSEQ-Plattform sequenziert.

Um die Qualität der Spidroin-Genannotation zu verbessern, führten wir auch eine Transkriptomsequenzierung in voller Länge durch. Sieben Seidendrüsengewebe (Ma-, Mi-, Tu-, Fl-, Ag-, Ac- und Py-Drüsen) wurden gemischt, um Bibliotheken für die Isoform-Sequenzierung (Iso-seq) auf der PacBio-Plattform zu erstellen. Um den Fragment-Bias zu reduzieren, haben wir zwei Bibliotheken erstellt: eine im Bereich von 0–10 kb und die andere im Bereich von 5–10 kb.

Für die De-novo-Assemblierung des T. clavata-Genoms (ergänzende Abbildung 1c) wurden Nanopore-Long-Reads zunächst mit Canu v2.263 mit den Standardparametern korrigiert, SMARTdenovo (https://github.com/ruanjue/smartdenovo) jedoch anschließend zur Produktion der primären Contigs eingesetzt. Anschließend wurden drei Runden der Contig-Korrektur mit Racon v1.5.064 durchgeführt. Um die Genauigkeit der Baugruppe zu verbessern, wurde Pilon v1.2465 für das Contig-Polieren basierend auf Illumina-Kurzablesungen verwendet. Die gepaarten Hi-C-Short-Reads wurden hauptsächlich mit Hic-pro v2.1066 getrimmt, und die optimierten Reads wurden mit Juicer v1.6.267 unter Verwendung von 3D-DNA v18041968 für die Pseudochromosomenkonstruktion und dem Tool Juicebox v1.967 dem Draft-Contig zugeordnet manuelle Korrekturen.

Eine benutzerdefinierte T. clavata-Wiederholungsdatenbank wurde de novo mithilfe von RepeatModeler v269 und LTR_FINDER v1.0670 identifiziert. Anschließend wurden die erhaltenen Wiederholungssequenzen in RepeatMasker v4.0571 importiert, um nach transponierbaren Elementen (TEs) im Genom zu suchen. Tandem Repeats Finder v4.0972 wurde verwendet, um Tandemwiederholungen zu finden.

Die Vorhersage der Genstruktur basierte auf Homologiedaten und De-novo-Vorhersage. Die Datendateien umfassten RNA-seq-Daten (RNA-seq von 17 Geweben), Iso-seq-Daten und Proteinsequenzen eng verwandter Arten (vier Arten: A. ventricosus, A. bruennichi, T. antipodiana und T. clavipes). . Für die De-novo-Genvorhersage wurde die Software AUGUSTUS v3.2.373 (http://bioinf.uni-greifswald.de/) verwendet. Evidenzbasierte Genanmerkungen wurden in der MAKER234-Pipeline mit den Standardparametern erstellt. Anschließend haben wir die MAKER- und De-novo-Ergebnisse basierend auf den folgenden Screening-Kriterien integriert: Der Anteil der Wiederholungssequenzen betrug weniger als 50 %, die Proteinsequenzlänge war größer als 50 aa, der FPKM-Wert war in mindestens zehn Proben größer als 0,1 und die Sequenz wurde durch Iso-seq-Nachweise (Identität > 95 %) oder eine entsprechende Sequenz von mindestens einer eng verwandten Art (E-Wert > 1e−5, Identität > 50 %) gestützt.

Insgesamt 443 redundante Spidroin-Sequenzen (Supplementary Data 6) wurden aus der NCBI-Proteindatenbank (https://www.ncbi.nlm.nih.gov/protein) heruntergeladen. Alle Proteinsequenzen von T. clavata wurden verwendet, um diese Spidroine durch Blastp auszurichten (E-Wert < 1e−10), und es wurden hauptsächlich 128 nicht repetitive Treffer identifiziert. Um Spidroine noch zuverlässiger zu identifizieren, überprüften wir noch einmal, ob jede Sequenz typische Wiederholungen und N- oder C-Termini enthielt, und schließlich wurden die letzten 28 mutmaßlichen Spidroine identifiziert.

Kurz gesagt: (1) 79 vollständige Spidroin-Sequenzen, 48 N-terminale Sequenzen und 22 C-terminale Sequenzen (Supplementary Data 7) wurden dem T. clavata-Genom zugeordnet, um die GFF-Track-Dateien mit dem genBlast v13874-Tool zu generieren; (2) Die BAM-Dateien sowohl der Seidendrüsen-Iso-seq-Daten als auch der Seidendrüsen-RNA-seq-Daten wurden als Expressionsdatenspuren extrahiert; (3) die GFF3-Dateien der 28 Spidroins wurden als eine Spur extrahiert; (4) Die Trackdateien aus den vorherigen drei Schritten wurden in IGV v2.9.475 importiert und die Integrität jedes Spidroins wurde manuell überprüft; und (5) die DNA-Sequenz des unvollständigen Spidroins in den entsprechenden Genomregionen wurde gekürzt und dann basierend auf der Frameshift-Übersetzung und -Vorhersage mit dem Online-Tool AUGUSTUS v3.2.373 (http://Augustus.gobics.de/) repariert.

Aminosäuregehalt und Motive wurden mithilfe eines Perl-Skripts quantifiziert. Zu den Motiven gehörten (GA)n, (A)n, GGX, XQQ und GPGXX. Die O-Glykosylierung wurde mit dem Tool NetOGlyc v4.076 vorhergesagt.

Die Schleppleinenseide der Spinne T. clavata und die Kokonseide der Seidenraupe B. mori wurden mit einer Schere geschnitten (Ergänzungsdaten 1). Zunächst wurden Seidenproben (n = 3, 20 mg jeder Probe) in 500 μl 9 M LiSCN gelöst und der Überstand nach Zentrifugation (10.000 × g, 10 min) gesammelt. Die Proteinkonzentrationen wurden mit dem Bradford-Protein-Assay (Beyotime, China) gemessen. Anschließend wurden die Proben in einer 8 M Harnstofflösung 10-fach verdünnt, mit 5 × SDS-PAGE-Puffer gemischt und unter Verwendung eines NuPAGE 4–12 % Bis-Tris-Proteingels (Thermo Fisher Scientific, USA) aufgetrennt. Anschließend wurden die Proben 20 h bei 37 °C mit Trypsin (1/50 μg Protein) verdaut. Die verdauten Proben wurden lyophilisiert und in 0,1 % Ameisensäure (FA) resuspendiert und dann mittels LC-MS/MS auf einer Q Exactive HF-X-Säule (Thermo Fisher Scientific, USA) gemessen. Der Gradient wurde auf 5–95 % Acetonitril in 0,1 % Ameisensäure eingestellt. Die Flussrate und die Analysezeit betrugen 600 nL/min bzw. 70 min. Die Instrumentenparameter waren wie folgt: Vollständiger MS-Scan im Bereich von m/z 350 bis 1500 mit einer Auflösung von 60.000 (bei m/z 200); der Zielwert der automatischen Verstärkungsregelung (AGC) betrug 3 × 106 und die maximale Ioneninjektionszeit betrug 20 ms; Die 40 Vorläufer mit der höchsten Häufigkeit im gesamten Scan wurden ausgewählt und durch Kollisionsdissoziation mit höherer Energie (HCD) fragmentiert und in MS/MS analysiert, wobei die Auflösung 15.000 (bei m/z 200) und der AGC-Zielwert 1 betrug × 105, die maximale Ioneninjektionszeit betrug 45 ms, eine normalisierte Kollisionsenergie wurde auf 27 % eingestellt, ein Intensitätsschwellenwert betrug 2,2 × 104 und der dynamische Ausschlussparameter betrug 20 s. Die resultierenden MS-Rohdaten wurden mit MaxQuant v1.3.0.577 analysiert. Die MaxQuant-Suchen wurden anhand der SpiderDB-Datenbank (https://spider.bioinfotoolkits.net) durchgeführt, die 37.607 Proteinsequenzen enthielt. Die Suchparameter waren wie folgt: Methioninoxidation und N-terminale Acetylierung wurden als variable Modifikationen festgelegt, und Carbamidomethylcystein wurde als feste Modifikation festgelegt; die minimale Peptidlänge wurde auf sieben Aminosäuren festgelegt und es waren maximal zwei Fehlspaltungen erlaubt; Sowohl Peptid- als auch Proteinidentifikationen wurden mit einer Falscherkennungsrate von 1 % gefiltert; Das identifizierte Protein erforderte mindestens ein einzigartiges Peptid und alle üblichen Rückwärtstreffer und Verunreinigungen wurden entfernt. Basierend auf der Summe der Peakintensitäten wurde der Algorithmus zur intensitätsbasierten absoluten Quantifizierung (iBAQ) in MaxQuant verwendet, um die Proteinhäufigkeiten zu berechnen.

Für die Metabolitenextraktion wurden zerkleinerte Proben aus Schleppleinenseide und Kokonseide (n = 6, 20 mg jeder Probe) verwendet (Ergänzungsdaten 1). Jede Seidenprobe wurde in ein Röhrchen gegeben, in 500 μl 80 % Methanol homogenisiert, 10 Minuten auf Eis gehalten und 20 Minuten bei 4 °C und 15.000 × g zentrifugiert. Der Überstand (250 µL pro Probe) wurde für LC-MS/MS-Experimente gesammelt und auf eine Hypesil-Goldsäule (C18, 100 × 2,1 mm, 1,9 µm) unter Verwendung eines 17-minütigen linearen Gradienten mit einer Flussrate von 0,2 ml/min injiziert. Die Eluenten für den Modus mit positiver Polarität waren Eluent A (0,1 % FA in Wasser) und Eluent B (Methanol). Die Eluenten für den negativen Polaritätsmodus waren Eluent A (5 mM Ammoniumacetat, pH 9,0) und Eluent B (Methanol). Der Lösungsmittelgradient wurde wie folgt eingestellt: 2 % B, 1,5 min; 2–100 % B, 3 Min.; 100 % B, 10 Min.; 100–2 % B, 10,1 Min.; 2 % B, 12 Min. Das Q Exactive HF-Massenspektrometer (Thermo Fisher Scientific, USA) wurde im positiven/negativen Polaritätsmodus mit einer Sprühspannung von 3,5 kV, einer Kapillartemperatur von 320 °C, einer Hüllgasströmungsrate von 35 psi und einer Hilfsgasströmungsrate von 10 betrieben L/min, S-Linsen-RF-Pegel von 60, Zusatzgasheizungstemperatur von 350 °C. Der vollständige Scan reichte von m/z 350 bis 1500 mit einer Auflösung von 60.000 (bei m/z 200). Der AGC-Zielwert betrug 3 × 106 und die maximale Ioneninjektionszeit betrug 20 ms. Die 40 Vorläufer mit der höchsten Häufigkeit im gesamten Scan wurden ausgewählt und durch HCD fragmentiert und in MS/MS analysiert, wobei die Auflösung 45.000 (bei m/z 200) für 10 Plex betrug, der AGC-Zielwert 5 × 104 betrug. Die maximale Ioneninjektionszeit betrug 86 ms, eine normalisierte Kollisionsenergie wurde auf 32 % eingestellt, ein Intensitätsschwellenwert betrug 1,2 × 105 und der dynamische Ausschlussparameter betrug 20 s. Metabolitenidentitäten und -mengen wurden durch die Softwareanalyse Compound Discoverer 3.1 (CD 3.1) bestätigt, einschließlich des Abgleichs mit der mzCloud (https://www.mzcloud.org/), mzVault (mzCloud Offline für mzVault 2.3_2020A.db) und der Massenliste (Endogenous Metabolite-Animal-POS/NEG-20191029) Datenbanken (Abrufdatum: 15.06.2020). Darüber hinaus sind die Datenbanken KEGG78 (https://www.kegg.jp/), HMDB79 (https://hmdb.ca/metabolites) und LIPIDMaps80 (http://www.lipidmaps.org/) (Abrufdatum: 7 /17/2020) wurden für die Annotation von Metaboliten verwendet.

Der abgetrennte Schwanz, Beutel und Gang der Ma-Drüse wurden einer WGBS unterzogen. Zuerst wurde genomische DNA extrahiert und durch Ultraschallbehandlung mit einem Bioruptor (Diagenode, Belgien) auf eine mittlere Größe von 250 bp fragmentiert, gefolgt von der Zugabe einer „A“-Base an die 3'-terminalen Enden der DNA-Fragmente und deren Ligation methylierte Adapter an beiden Enden von DNA-Fragmenten. Das EZ DNA Methylation-Gold Kit (ZYMO) wurde für die Bisulfit-Umwandlung ligierter DNA verwendet. Die Produkte wurden mit einem QIAquick Gel Extraction Kit (Qiagen, USA) gereinigt und durch PCR amplifiziert. Schließlich wurden die Bibliotheken auf der Illumina HiSeq 2500-Plattform sequenziert.

Saubere Lesevorgänge wurden mithilfe der BSMAP 2.90-Software (https://code.google.com/archive/p/bsmap/) mit den Parametern (-v 8 -z 33 -p 4 -n 0 -w 20) dem Referenzgenom zugeordnet -s 16 -f 10 -L 100) nach dem Entfernen der Adapter und Lesevorgängen mit geringer Qualität (N > 10 % und Q < 20). Die Methylierungsgrade wurden durch Bestimmung der entsprechenden Beta-Werte geschätzt: Beta = M/(M + U), wobei M und U methylierte bzw. unmethylierte Signalwerte darstellen. Die BED-Datei mit Methylierungsdaten wurde mithilfe der Befehlszeile „bedGraphToBigWig“ in das BigWig-Format konvertiert und in IGV75 visualisiert.

Der abgetrennte Schwanz, Beutel und Gang der Ma-Drüse wurden einer ATAC-Sequenzierung unterzogen. Die Proben wurden einzeln in flüssigem Stickstoff gemahlen und 10 Minuten lang bei 4 °C in eine vorgekühlte Zelllysatlösung überführt. Nach der Zentrifugation (500 × g, 4 °C und 10 min) wurde der Überstand entfernt und die Zellpellets zurückbehalten. Die Pellets wurden mit vorgekühlter Pufferlösung gewaschen und zentrifugiert (500 × g, 4 °C und 10 min), um Zellkerne zu sammeln. Die Zellkernlösung wurde mit Tn5-Transposase gemischt und 30 Minuten bei 37 °C inkubiert, gefolgt von der DNA-Fragmentsammlung, PCR-Amplifikation und Sequenzierung auf der Illumina PE150-Plattform.

Saubere Lesevorgänge wurden mithilfe der Bowtie281-Software dem Genom zugeordnet, die Daten wurden vom.sam-Format in das.bam-Format konvertiert und die Lesevorgänge wurden mithilfe von SAMtools v0.1.1982 mit den Parametern (view -b -f 2 -q 30) gefiltert. Die Peaks der für Chromatin zugänglichen Regionen wurden in jeder Probe separat mit MACS283 (–shift −100–extsize 200–nomodel -B -q 0,05) identifiziert. Der Befehl „intersect“ von BEDTools v2.26.084 wurde verwendet, um gemeinsame Peaks zwischen Replikatproben zu identifizieren. Heatmaps wurden mit der Funktion „plotHeatmap“ von deepTools v3.5.185 generiert. Signifikant angereicherte Motive wurden mit dem HOMER86-Tool identifiziert.

Die Gesamt-RNA wurde mit TRIzol-Reagenz aus dem Schwanz, dem Beutel und dem Ductus der Ma-Drüse extrahiert, gefolgt von der Konstruktion der lncRNA- und miRNA-Bibliothek, wie unten beschrieben.

Gesamt-RNA-Proben wurden mit DNase I inkubiert, um DNA-Fragmente zu verdauen, und mit RNase H, um rRNA zu entfernen. Nach der RNA-Reinigung wurde cDNA mit einer am 3'-Ende hinzugefügten „A“-Base synthetisiert und eine Adapterligation durchgeführt, gefolgt von einem UDG-Verdau des zweiten Strangs und einer PCR-Amplifikation. Die erstellte Bibliothek wurde auf der DNBSEQ-Plattform sequenziert. Die sauberen Lesevorgänge wurden mit HISAT287 (–phred64–sensitive–no-discordant–no-mixed -I 1 -X 1000) auf das Referenzgenom abgebildet und die Transkripte wurden mit StringTie88 (-f 0,3 -j 3 -c 5 -) zusammengestellt. g 100 -s 10000 -p 8) und mit bekannten mRNAs unter Verwendung des CuffCompare (-p 12)-Programms von Cufflinks89 verglichen. Anschließend wurden die Methoden Cooperative Data Classification (CPC), txCdsPredict und Coding Noncoding Index (CNCI) verwendet, um mRNAs und lncRNAs zu unterscheiden. Cis- und trans-Methoden wurden verwendet, um die Ziel-mRNAs von lncRNAs zu bewerten. Cis-lncRNAs wurden als solche lncRNAs definiert, die sich 10 kb stromaufwärts oder 20 kb stromabwärts der Ziel-mRNA befinden. Die Bindungsenergie (BE) der lncRNAs und mRNAs wurde mit RNAplex90 analysiert, und wenn die BE < –30 war, wurde die lncRNA als trans-lncRNA betrachtet.

Die Gesamt-RNA wurde mittels PAGE-Elektrophorese gereinigt und isoliert und dann aus dem Gel herausgeschnitten, um 18–30 nt RNA-Fragmente zu erhalten. Das 3'-Ende jedes kleinen RNA-Fragments wurde an einen 5-adenylierten und 3-blockierten Adapter ligiert und ein mit eindeutigen molekularen Identifikatoren (UMI) markierter Primer wurde zur Hybridisierung mit dem 3'-Adapter hinzugefügt. Anschließend wurde der 5'-Adapter mit dem 5'-Ende des UMI-Etiketts hybridisiert. Der cDNA-Strang wurde mit UMI-markierten Primern synthetisiert und zur Amplifikation des Produkts wurde eine hochempfindliche Polymerase verwendet. Wir haben Bowtie281 (-q -L 16–phred64 -p 6) verwendet, um die sauberen Lesevorgänge mit dem Referenzgenom und der Rfam-Small-RNA-Datenbank91 abzugleichen (unter Verwendung von cmsearch mit den Parametern–cpu 6–noali). Um miRNAs zu identifizieren, die mit der miRBase92-Datenbank (https://www.mirbase.org/) und dem miRDeep293-Tool annotiert und vorhergesagt wurden, wurden Ziele zwischen miRNAs und lncRNAs/mRNAs mithilfe von miRanda43 (-en −20 -strict) und RNAhybrid44 vorhergesagt (-b 100 -c -f 2,8 -m 100000 -v 3 -u 3 -e −20 -p 1).

Frisch präparierte Ma-Drüsen von drei unabhängigen Spinnen wurden mit Kulturmedium gewaschen und in kleine Stücke geschnitten, und Gewebestücke wurden 45 Minuten lang in einem Inkubator mit konstanter Temperatur verdaut. Nach der Verdauung wurde das Medium durch ein 40-μm-Zellsieb filtriert und mindestens dreimal durch 5-minütige Zentrifugation bei 300 × g und 4 °C gewaschen. Schließlich wurden Zellsuspensionen mit einer Aktivität von mehr als 85 % und einer Agglomerationsrate von weniger als 5 % für den Bibliotheksaufbau und die Sequenzierung verwendet. Die Bibliothek wurde gemäß den Anweisungen des Herstellers (10 × Genomics) auf der 10 × Chromium Single Cell 3'-Plattform aufgebaut.

Die Rohdaten wurden in die Cellranger v4.0.0-Pipeline importiert, um die Expressionsmatrizen jeder Zelle und jedes Gens zu erhalten. Um minderwertige Zellen zu entfernen, wurden Zellzahlen und Gen-UMI-Zählungen im Bereich des Medians ± 2-fach der medianen absoluten Abweichung (MAD) für die weitere Analyse beibehalten. Zusätzlich wurden Dubletts (≥2 Zellen in einem Öltropfen) mit DoubletFinder v2.0.394 entfernt. Insgesamt 9349 hochwertige Zellen wurden zur Analyse der Clusterbildung und Expression basierend auf dem Paket Seurat v4.0.695 verwendet. Die Entwicklungsverläufe aller Zellcluster wurden mit dem Paket Monocle v2.22.096 vorhergesagt.

Frische Ma-Drüsen wurden mit Isopentan in flüssigem Stickstoff eingefroren, mit OCT eingebettet und in einem luftdichten Behälter bei –80 °C gelagert. Eingebettetes gefrorenes Gewebe wurde geschnitten und Schnitte mit akzeptabler RNA-Qualität (RIN > 7,0) wurden für weitere Experimente verwendet. Anschließend wurden die Schnitte auf Visium Spatial-Objektträger gelegt, mit Methanol fixiert, mit Hämatoxylin und Eosin angefärbt und mit einem BX53-Mikroskop (Olympus, Japan) beobachtet. Die polyadenylierte mRNA wurde mit den für Spots verwendeten Primern eingefangen. Anschließend wurde RT-Master-Mix-Reverse-Transkriptionsreagenz zu den permeierten Gewebeschnitten gegeben und die Zweitstrang-cDNA-Synthese wurde auf dem Objektträger durch Zugabe des Second-Strang-Mix durchgeführt. Die erhaltene cDNA wurde aus jeder Einfangzone denaturiert und zur Amplifikation, Bibliothekskonstruktion und Sequenzierung auf der Illumina NovaSeq600-Plattform in das entsprechende Röhrchen übertragen.

Nach dem Entfernen von Adaptern und Lesevorgängen mit geringer Qualität (N > 3, Q < 5 und Basisverhältnis ≥ 20 %) wurden die Spaceranger v1.3.1 mkref- und count-Programme für die Datenvorverarbeitung verwendet. Anschließend wurde das Spot-Clustering mit dem Paket Seurat v4.0.695 analysiert.

Um das Auftreten einer konvergenten Evolution zwischen der Seidenraupen-Seidendrüse und der Spinnen-Ma-Drüse zu bewerten, haben wir fünf Aspekte verglichen (weitere Einzelheiten siehe Ergänzende Anmerkung): (1) die morphologische Struktur der Seidendrüsen; (2) die Mikrostrukturen von Schleppleinenseide und Kokonseide, beobachtet unter einem SU3500-Rasterelektronenmikroskop (REM) (Hitachi, Japan) mit einer Beschleunigungsspannung von 5 kV; (3) die Expressionskonvergenz von Seidendrüsengenen, (4) die homologen Proteinkomponenten von Schleppleinenseide und Kokonseide; und (5) die Metabolitenkomponenten von Schleppseide und Kokonseide. Die orthologen Gene, die Seidenraupe und Spinne gemeinsam haben, wurden mit dem Blastp97-Programm identifiziert (E-Wert <1e−5).

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Alle Hochdurchsatz-Sequenzierungs-Rohdaten in diesem Projekt wurden im Genome Sequence Archive (GSA) des National Genomics Data Center (NGDC, https://ngdc.cncb.ac.cn/) hinterlegt und sind über die BioProject-ID PRJCA014503 verfügbar. Die Massenspektrometrie-Proteomikdaten wurden über das iProX-Partner-Repository98 mit der Datensatzkennung PXD038734 beim ProteomeXchange Consortium (http://proteomecentral.proteomexchange.org/cgi/GetDataset) hinterlegt. Die Metabolomics-Daten wurden beim NGDC hinterlegt (https://ngdc.cncb.ac.cn/omix/release/OMIX002862, https://ngdc.cncb.ac.cn/omix/release/OMIX002863). Die Einzelzellen- und räumlichen Metriken wurden in FigShare hinterlegt (https://figshare.com/articles/dataset/Single_cell_matrices_zip/20399475, https://figshare.com/articles/datasset/Spatial_Transcriptomics_zip/20399580). Die Ergebnisse der Genomassemblierung, Genannotation und Multiomics-Analyse von Trichonephila clavata sind auch auf SpiderDB (https://spider.bioinfotoolkits.net) verfügbar. Für die Abbildungen werden Quelldaten bereitgestellt. 1, 2, 4, 5. Quelldaten werden diesem Dokument beigefügt.

Benutzerdefinierte Skripte und Workflows für die Datenanalyse sind bei FigShare verfügbar (https://figshare.com/articles/dataset/SpiderGenomeAnanlysis_code_zip/20399652, https://figshare.com/articles/dataset/SpiderGenomeAnanlysis_code1_zip/20399706).

Naturhistorisches Museum Bern. Weltspinnenkatalog. Version 23.5. http://wsc.nmbe.ch (abgerufen am 17. Juli 2022).

Pennisi, E. Entwirrende Spinnenbiologie. Wissenschaft 358, 288–291 (2017).

Artikel ADS CAS PubMed Google Scholar

Vollrath, F. & Knight, DP Flüssigkristallines Spinnen von Spinnenseide. Natur 410, 541–548 (2001).

Artikel ADS CAS PubMed Google Scholar

Garrison, NL et al. Spinnenphylogenomik: Den Spinnenbaum des Lebens entwirren. PeerJ 4, e1719 (2016).

Artikel PubMed PubMed Central Google Scholar

Roberts, AD et al. Synthetische Biologie für Fasern, Klebstoffe und aktive Tarnmaterialien im Schutz- und Luft- und Raumfahrtbereich. Frau Komm. 9, 486–504 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Whittall, DR, Baker, KV, Breitling, R. & Takano, E. Wirtssysteme für die Produktion rekombinanter Spinnenseide. Trends Biotechnologie. 39, 560–573 (2021).

Artikel CAS PubMed Google Scholar

Liu, D. et al. Spinnen-Schleppleinenseide als durch Feuchtigkeit angetriebener Torsionsaktuator. Wissenschaft. Adv. 5, eaau9183 (2019).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Rising, A. & Johansson, J. Auf dem Weg zum Spinnen künstlicher Spinnenseide. Nat. Chem. Biol. 11, 309–315 (2015).

Artikel CAS PubMed Google Scholar

Vollrath, F. & Porter, D. Seiden als antike Modelle für moderne Polymere. Polymer 50, 5623–5632 (2009).

Artikel CAS Google Scholar

Vollrath, F., Porter, D. & Holland, C. Aus Spinnenseide lassen sich noch viele weitere Lehren ziehen. Soft Matter 7, 9595–9600 (2011).

Artikel ADS CAS Google Scholar

Malay, AD, Craig, HC, Chen, J., Octaviani, NA & Numata, K. Komplexität der Spinnenschleppleinenseide. Biomakromoleküle 23, 1827–1840 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Li, J. et al. Von Spinnenseide inspirierte Kunstfasern. Adv. Wissenschaft. 9, e2103965 (2022).

Artikel MathSciNet Google Scholar

Blamires, SJ, Blackledge, TA & Tso, IM Variation der physikalisch-chemischen Eigenschaften in Spinnenseide: Ökologie, Evolution und synthetische Produktion. Annu. Rev. Entomol. 62, 443–460 (2017).

Artikel CAS PubMed Google Scholar

Lewis, RV Spinnenseide: alte Ideen für neue Biomaterialien. Chem. Rev. 106, 3762–3774 (2006).

Artikel CAS PubMed Google Scholar

Garb, JE, Sharma, PP & Ayoub, NA Aktuelle Fortschritte und Aussichten für die Weiterentwicklung der Spinnentiergenomik. Curr. Meinung. Insektenwissenschaft. 25, 51–57 (2018).

Artikel PubMed Google Scholar

Gatesy, J., Hayashi, C., Motriuk, D., Woods, J. & Lewis, R. Extreme Diversität, Erhaltung und Konvergenz von Spinnenseidenfibroinsequenzen. Wissenschaft 291, 2603–2605 (2001).

Artikel ADS CAS PubMed Google Scholar

Chaw, RC, Correa-Garhwal, SM, Clarke, TH, Ayoub, NA & Hayashi, CY Proteomischer Beweis für Komponenten der Spinnenseidensynthese aus Drüsen und Fasern der schwarzen Witwe. J. Proteome Res. 14, 4223–4231 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Vollrath, F. & Selden, P. Die Rolle des Verhaltens bei der Entwicklung von Spinnen, Seiden und Netzen. Annu. Rev. Ecol. Entwicklung S. 38, 819–846 (2007).

Artikel Google Scholar

Ramezaniaghdam, M., Nahdi, ND & Reski, R. Rekombinante Spinnenseide: Versprechen und Engpässe. Vorderseite. Bioeng. Biotechnologie. 10, 835637 (2022).

Artikel PubMed PubMed Central Google Scholar

Andersson, M. et al. Carboanhydrase erzeugt CO2 und H+, die über gegensätzliche Effekte auf die terminalen Domänen die Spinnenseidenbildung vorantreiben. PLoS Biol. 12, e1001921 (2014).

Artikel PubMed PubMed Central Google Scholar

Andersson, M., Holm, L., Ridderstrale, Y., Johansson, J. & Rising, A. Morphologie und Zusammensetzung der großen Ampullendrüse und der Schleppleinenseide der Spinne. Biomakromoleküle 14, 2945–2952 (2013).

Artikel CAS PubMed Google Scholar

Knight, DP & Vollrath, F. Veränderungen in der Elementzusammensetzung entlang des Spinnkanals einer Nephila-Spinne. Naturwissenschaften 88, 179–182 (2001).

Artikel ADS CAS PubMed Google Scholar

Andersson, M., Johansson, J. & Rising, A. Seidenspinnen bei Seidenraupen und Spinnen. Int. J. Mol. Wissenschaft. 17, 1290 (2016).

Artikel PubMed PubMed Central Google Scholar

Foo, CWP et al. Rolle von pH-Wert und Ladung beim Aufbau von Seidenproteinen bei Insekten und Spinnen. Appl. Physik. A-Mater. 82, 223–233 (2006).

Artikel ADS CAS Google Scholar

Teule, F. et al. Mit chimären Seidenraupen-/Spinnenseide-Genen transformierte Seidenraupen spinnen zusammengesetzte Seidenfasern mit verbesserten mechanischen Eigenschaften. Proz. Natl Acad. Wissenschaft. USA. 109, 923–928 (2012).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Xu, J. et al. Massenproduktion von Spinnenseide durch gezielten Genaustausch bei Bombyx mori. Proz. Natl Acad. Wissenschaft. USA. 115, 8757–8762 (2018).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Zhang, XL et al. CRISPR/Cas9 initiierte transgene Seidenraupen als natürlichen Spinner von Spinnenseide. Biomakromoleküle 20, 2252–2264 (2019).

Artikel CAS PubMed Google Scholar

Kono, N. et al. Die Mehrkomponentennatur liegt den außergewöhnlichen mechanischen Eigenschaften der Spinnen-Schleppleinenseide zugrunde. Proz. Natl Acad. Wissenschaft. USA 118, e2107065118 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Kono, N. et al. Das Genom der Spinne Araneus ventricosus klärt den Spidroin-Genkatalog auf. Wissenschaft. Rep. 9, 8380 (2019).

Artikel ADS PubMed PubMed Central Google Scholar

Luo, J. et al. Robuste Seidenfasern, die mithilfe eines biomimetischen Mikrofluidik-Chips an der Luft hergestellt werden. Int. J. Biol. Makromol. 66, 319–324 (2014).

Artikel CAS PubMed Google Scholar

Luken, A. et al. Biokompatible Seidenfasern im Mikrometerbereich, hergestellt durch mikrofluidisches Nassspinnen. Adv. Gesundheitc. Mater. 10, e2100898 (2021).

Artikel PubMed Google Scholar

Kinahan, ME et al. Abstimmbare Seide: Verwendung von Mikrofluidik zur Herstellung von Seidenfasern mit kontrollierbaren Eigenschaften. Biomakromoleküle 12, 1504–1511 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Ramezaniaghdam, M., Nahdi, ND & Reski, R. Rekombinante Spinnenseide: Versprechen und Engpässe. Vorderseite. Bioeng. Biotechnologie. 10, 835637 (2022).

Artikel PubMed PubMed Central Google Scholar

Holt, C. & Yandell, M. MAKER2: eine Annotationspipeline und ein Genomdatenbank-Verwaltungstool für Genomprojekte der zweiten Generation. BMC Bioinforma. 12, 491 (2011).

Artikel Google Scholar

Fan, Z. et al. Ein Genom auf Chromosomenebene der Spinne Trichonephila antipodiana enthüllt die genetische Grundlage ihrer Polyphagie und Hinweise auf ein uraltes Duplikationsereignis des gesamten Genoms. Gigascience 10, giab016 (2021).

Artikel PubMed PubMed Central Google Scholar

Babb, PL et al. Das Genom von Nephila clavipes verdeutlicht die Vielfalt der Spinnenseidengene und ihre komplexe Expression. Nat. Genet. 49, 895–903 (2017).

Artikel CAS PubMed Google Scholar

Kono, N. et al. Darwins Rindenspinne teilt ein Spidroin-Repertoire mit Caerostris extrusa, erreicht aber durch Genexpression eine außergewöhnliche Seidenfestigkeit. Öffnen Sie Biol. 11, 210242 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Li, J., Beerntsen, BT & James, AA Oxidation von 3-Hydroxykynurenin zur Produktion von Xanthommatin für die Augenpigmentierung: ein wichtiger Nebenweg des Tryptophan-Katabolismus während der Puppenentwicklung bei der Gelbfiebermücke Aedes aegypti. Insektenbiochemie. Molec 29, 329–338 (1999).

Artikel CAS Google Scholar

Sakudoh, T. et al. Die Carotinoid-Seidenfärbung wird durch ein Carotinoid-bindendes Protein gesteuert, ein Produkt des Gelbblut-Gens. Proz. Natl Acad. Wissenschaft. USA. 104, 8941–8946 (2007).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Daimon, T. et al. Der Green b-Locus der Seidenraupe kodiert für eine Quercetin-5-O-Glucosyltransferase, die grüne Kokons mit UV-abschirmenden Eigenschaften produziert. Proz. Natl Acad. Wissenschaft. USA. 107, 11471–11476 (2010).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Fujiwara, M. et al. Xanthurensäure ist das Hauptpigment der Goldbaggerseide von Trichonephila clavata. Biomoleküle 11, 563 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Salmena, L., Poliseno, L., Tay, Y., Kats, L. & Pandolfi, PP Eine ceRNA-Hypothese: der Rosetta-Stein einer verborgenen RNA-Sprache? Zelle 146, 353–358.

Artikel CAS PubMed PubMed Central Google Scholar

Kuhn, DE et al. Experimentelle Validierung von miRNA-Targets. Methoden 44, 47–54 (2008).

Artikel CAS PubMed PubMed Central Google Scholar

Kruger, J. & Rehmsmeier, M. RNAhybrid: microRNA-Zielvorhersage einfach, schnell und flexibel. Nukleinsäuren Res. 34, W451–W454 (2006).

Artikel PubMed PubMed Central Google Scholar

Shannon, P. et al. Cytoscape: eine Softwareumgebung für integrierte Modelle biomolekularer Interaktionsnetzwerke. Genomres. 13, 2498–2504 (2003).

Artikel CAS PubMed PubMed Central Google Scholar

Xia, QY, Li, S. & Feng, QL Fortschritte in Seidenraupenstudien werden durch die Genomsequenzierung von Bombyx mori beschleunigt. Annu. Rev. Entomol. 59, 513–536 (2014).

Artikel CAS PubMed Google Scholar

Ma, Y. et al. Ein transkriptomischer Einzelzellatlas charakterisiert das seidenproduzierende Organ der Seidenraupe. Nat. Komm. 13, 3316 (2022).

Artikel ADS PubMed PubMed Central Google Scholar

Hu, W., Chen, Y., Lin, Y. & Xia, Q. Entwicklungs- und transkriptomische Merkmale charakterisieren Defekte des Seidendrüsenwachstums und der Seidenproduktion bei Mutanten nackter Seidenraupenpuppen. Insektenbiochemie. Molec. 111, 103175 (2019).

Artikel CAS Google Scholar

Ma, SY et al. Gezielte Aktivierung von BmCyclinE in Bombyx mori mithilfe von Designer-TAL-Effektoren. Insektenwissenschaft. 26, 1055–1058 (2019).

Artikel PubMed Google Scholar

Otsuki, R. et al. Biotechnologisch hergestellte Seidenraupen mit durch Schmetterlingszytotoxin modifizierten Seidendrüsen produzieren Sericin-Kokons mit einem Nutzen für ein neues Biomaterial. Proz. Natl Acad. Wissenschaft. USA. 114, 6740–6745 (2017).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Buchberger, A., Bukau, B. & Sommer, T. Proteinqualitätskontrolle im Zytosol und im endoplasmatischen Retikulum: Waffenbrüder. Mol. Zelle 40, 238–252 (2010).

Artikel CAS PubMed Google Scholar

Wang, X. et al. Die Faserbildung und die mechanischen Eigenschaften von Bombyx mori-Seide werden durch ATPase vom Vakuolentyp reguliert. ACS Biomater. Wissenschaft. Ing. 7, 5532–5540 (2021).

Artikel CAS PubMed Google Scholar

Tayebati, SK, Marucci, G., Santinelli, C., Buccioni, M. & Amenta, F. Cholinhaltige Phospholipide: Struktur-Aktivitäts-Beziehungen versus therapeutische Anwendungen. Curr. Med. Chem. 22, 4328–4340 (2015).

Artikel CAS PubMed Google Scholar

Lee, B. et al. dl-Äpfelsäure als Bestandteil von Alpha-Hydroxysäuren: Wirkung auf 2,4-Dinitrochlorbenzol-induzierte Entzündungen bei atopischer Dermatitis-ähnlichen Hautläsionen in vitro und in vivo. Immunopharm. Immunot. 41, 614–621 (2019).

Artikel Google Scholar

Hardy, JG, Romer, LM & Scheibel, TR Polymermaterialien auf Basis von Seidenproteinen. Polymer 49, 4309–4327 (2008).

Artikel CAS Google Scholar

Wang, X. et al. Chitin und Kutikulaproteine ​​bilden die Kutikulaschicht im Spinngang der Seidenraupe. Acta Biomater. 145, 260–271 (2022).

Artikel CAS PubMed Google Scholar

Vollrath, F. Biologie der Spinnenseide. Int. J. Biol. Makromol. 24, 81–88 (1999).

Artikel CAS PubMed Google Scholar

Hayashi, CY & Lewis, RV Molekulare Architektur und Evolution eines modularen Spinnenseidenprotein-Gens. Wissenschaft 287, 1477–1479 (2000).

Artikel ADS CAS PubMed Google Scholar

Wang, Z. et al. Die Genomassemblierung der Schwarzen Witwe Latrodectus elegans auf Chromosomenebene beleuchtet die Zusammensetzung und Entwicklung von Gift- und Seidenproteinen. Gigascience 11, giac049 (2022).

Artikel PubMed PubMed Central Google Scholar

Dicko, C., Vollrath, F. & Kenney, JM Die Rückfaltung des Spinnenseidenproteins wird durch eine Änderung des pH-Werts gesteuert. Biomacromolecules 5, 704–710 (2004).

Artikel CAS PubMed Google Scholar

Bell, AL & Peakall, DB Veränderungen der Feinstruktur während der Seidenproteinproduktion in der Ampullendrüse der Spinne Araneus sericatus. J. Cell Biol. 42, 284–295 (1969).

Artikel CAS PubMed PubMed Central Google Scholar

Jin, HJ & Kaplan, DL Mechanismus der Seidenverarbeitung bei Insekten und Spinnen. Natur 424, 1057–1061 (2003).

Artikel ADS CAS PubMed Google Scholar

Koren, S. et al. Canu: Skalierbare und genaue Long-Read-Assemblierung durch adaptive K-Mer-Gewichtung und Wiederholungstrennung. Genomres. 27, 722–736 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Vaser, R., Sovic, I., Nagarajan, N. & Sikic, M. Schnelle und genaue De-novo-Genomassemblierung aus langen, unkorrigierten Lesevorgängen. Genomres. 27, 737–746 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Walker, BJ et al. Pilon: ein integriertes Tool zur umfassenden Erkennung mikrobieller Varianten und zur Verbesserung der Genomassemblierung. PLoS One 9, e112963 (2014).

Artikel ADS PubMed PubMed Central Google Scholar

Servant, N. et al. HiC-Pro: eine optimierte und flexible Pipeline für die Hi-C-Datenverarbeitung. Genombiol. 16, 259 (2015).

Artikel PubMed PubMed Central Google Scholar

Durand, NC et al. Juicebox bietet ein Visualisierungssystem für Hi-C-Kontaktkarten mit unbegrenztem Zoom. Zellsystem 3, 99–101 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Dudchenko, O. et al. Die De-novo-Assemblierung des Aedes aegypti-Genoms unter Verwendung von Hi-C ergibt Gerüste mit Chromosomenlänge. Wissenschaft 356, 92–95 (2017).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Flynn, JM et al. RepeatModeler2 für die automatisierte genomische Entdeckung transponierbarer Elementfamilien. Proz. Natl Acad. Wissenschaft. USA. 117, 9451–9457 (2020).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Xu, Z. & Wang, H. LTR_FINDER: ein effizientes Werkzeug zur Vorhersage von LTR-Retrotransposons voller Länge. Nukleinsäuren Res. 35, W265–W268 (2007).

Artikel PubMed PubMed Central Google Scholar

Chen, N. in Verwendung von RepeatMasker zur Identifizierung repetitiver Elemente in Genomsequenzen. Einheit 4 10 Ch. 4, (Curr. Protoc. Bioinformatics, 2004).

Benson, G. Tandem Repeats Finder: ein Programm zur Analyse von DNA-Sequenzen. Nukleinsäuren Res. 27, 573–580 (1999).

Artikel CAS PubMed PubMed Central Google Scholar

Stanke, M. et al. AUGUSTUS: Ab-initio-Vorhersage alternativer Transkripte. Nukleinsäuren Res. 34, W435–W439 (2006).

Artikel CAS PubMed PubMed Central Google Scholar

Sie, R. et al. genBlastG: Verwendung von BLAST-Suchen zur Erstellung homologer Genmodelle. Bioinformatik 27, 2141–2143 (2011).

Artikel CAS PubMed Google Scholar

Thorvaldsdottir, H., Robinson, JT & Mesirov, JP Integrative Genomics Viewer (IGV): Hochleistungsvisualisierung und -exploration von Genomdaten. Knapp. Bioinform. 14, 178–192 (2013).

Artikel CAS PubMed Google Scholar

Steentoft, C. et al. Präzise Kartierung des menschlichen O-GalNAc-Glykoproteoms durch SimpleCell-Technologie. EMBO J. 32, 1478–1488 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Cox, J. & Mann, M. MaxQuant ermöglicht hohe Peptididentifizierungsraten, individuelle Massengenauigkeiten im ppb-Bereich und proteomweite Proteinquantifizierung. Nat. Biotechnologie. 26, 1367–1372 (2008).

Artikel CAS PubMed Google Scholar

Kanehisa, M., Furumichi, M., Tanabe, M., Sato, Y. & Morishima, K. KEGG: neue Perspektiven auf Genome, Signalwege, Krankheiten und Medikamente. Nukleinsäuren Res. 45, D353–D361 (2017).

Artikel CAS PubMed Google Scholar

Wishart, DS et al. HMDB 4.0: die menschliche Metabolomdatenbank für 2018. Nucleic Acids Res. 46, D608–D617 (2018).

Artikel CAS PubMed Google Scholar

Fahy, E., Sud, M., Cotter, D. & Subramaniam, S. LIPID MAPS Online-Tools für die Lipidforschung. Nukleinsäuren Res. 35, W606–W612 (2007).

Artikel PubMed PubMed Central Google Scholar

Langmead, B. & Salzberg, SL Schnelle Lücken-Lese-Ausrichtung mit Bowtie 2. Nat. Methoden 9, 357–359 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Li, H. et al. Das Sequence Alignment/Map-Format und SAMtools. Bioinformatik 25, 2078–2079 (2009).

Artikel PubMed PubMed Central Google Scholar

Zhang, Y. et al. Modellbasierte Analyse von ChIP-Seq (MACS). Genombiol. 9, R137 (2008).

Artikel PubMed PubMed Central Google Scholar

Quinlan, AR & Hall, IM BEDTools: eine flexible Suite von Dienstprogrammen zum Vergleich genomischer Merkmale. Bioinformatik 26, 841–842 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Ramirez, F., Dundar, F., Diehl, S., Gruning, BA & Manke, T. deepTools: eine flexible Plattform zur Untersuchung von Deep-Sequencing-Daten. Nukleinsäuren Res. 42, W187–W191 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Tu, JC et al. Homer bindet ein neues prolinreiches Motiv und verknüpft metabotrope Glutamatrezeptoren der Gruppe 1 mit IP3-Rezeptoren. Neuron 21, 717–726 (1998).

Artikel CAS PubMed Google Scholar

Kim, D., Paggi, JM, Park, C., Bennett, C. & Salzberg, SL Graphbasierte Genomausrichtung und Genotypisierung mit HISAT2 und HISAT-Genotyp. Nat. Biotechnologie. 37, 907–915 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Pertea, M. et al. StringTie ermöglicht eine verbesserte Rekonstruktion eines Transkriptoms aus RNA-seq-Reads. Nat. Biotechnologie. 33, 290–295 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Trapnell, C. et al. Differenzielle Gen- und Transkriptexpressionsanalyse von RNA-seq-Experimenten mit TopHat und Cufflinks. Nat. Protokoll. 7, 562–578 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Tafer, H. & Hofacker, IL RNAplex: ein schnelles Werkzeug für die Suche nach RNA-RNA-Interaktionen. Bioinformatik 24, 2657–2663 (2008).

Artikel CAS PubMed Google Scholar

Kalvari, I. et al. Rfam 14: erweiterte Abdeckung metagenomischer, viraler und microRNA-Familien. Nukleinsäuren Res. 49, D192–D200 (2021).

Artikel CAS PubMed Google Scholar

Kozomara, A., Birgaoanu, M. & Griffiths-Jones, S. miRBase: Von microRNA-Sequenzen zur Funktion. Nukleinsäuren Res. 47, D155–D162 (2019).

Artikel CAS PubMed Google Scholar

Friedlander, MR, Mackowiak, SD, Li, N., Chen, W. & Rajewsky, N. miRDeep2 identifiziert genau bekannte und Hunderte neuer microRNA-Gene in sieben Tiergruppen. Nukleinsäuren Res. 40, 37–52 (2012).

Artikel PubMed Google Scholar

McGinnis, CS, Murrow, LM & Gartner, ZJ DoubletFinder: Dubletterkennung in Einzelzell-RNA-Sequenzierungsdaten unter Verwendung künstlicher nächster Nachbarn. Zellsystem 8, 329–337.e4 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Satija, R., Farrell, JA, Gennert, D., Schier, AF & Regev, A. Räumliche Rekonstruktion von Einzelzell-Genexpressionsdaten. Nat. Biotechnologie. 33, 495–502 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Qiu, X. et al. Die umgekehrte Grapheneinbettung löst komplexe Einzelzellentrajektorien auf. Nat. Methoden 14, 979–982 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Mount, DW Mit dem grundlegenden lokalen Ausrichtungssuchwerkzeug (BLAST). CSH-Protokoll. 2007, pdb top17 (2007).

PubMed Google Scholar

Chen, T. et al. iProX im Jahr 2021: Verbindung des Proteomik-Datenaustauschs mit Big Data. Nukleinsäuren Res. 50, D1522–D1527 (2022).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Wir danken Daojun Cheng von der Southwest University und Yi Zou von der Southwest University für die kritische Lektüre des Manuskripts. Wir danken Yazhou Li von der Sichuan Agricultural University für ihre Hilfe bei der Karyotypisierung. Wir danken außerdem den Unternehmen BGI, Novogene, Frasergen, OE Biotech und Berry Genomics für die Bereitstellung der Multiomics-Sequenzierung. Diese Arbeit wurde von der National Natural Science Foundation of China [U21A20248], der National Natural Science Foundation of China [32000340] und den Fundamental Research Funds for the Central Universities [XDJK2019TJ003] unterstützt.

Diese Autoren haben gleichermaßen beigetragen: Wenbo Hu, Anqiang Jia.

Staatliches Schlüssellabor für Seidenraupengenombiologie, Biowissenschaftliches Forschungszentrum, Südwestuniversität, Chongqing, 400715, China

Wenbo Hu, Anqiang Jia, Sanyuan Ma, Guoqing Zhang, Zhaoyuan Wei, Fang Lu, Yongjiang Luo, Jiahe Sun, Tianfang Yang, TingTing Xia, Qinhui Li, Ting Yao, Jiangyu Zheng, Zijie Jiang, Zehui Xu, Qingyou Xia und Yi Wang

School of Life Sciences, Southwest University, Chongqing, 400715, China

Zhisheng Zhang

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

WH, AJ, QX und YW konzipierten das Projekt. YW betreute das Projekt. WH, AJ, ZZ, JS, TY, TX, QL, TY, JZ und YW sammelten Proben für die Multiomics-Sequenzierung. AJ entwarf und implementierte die Genomassemblierungspipeline und führte eine Datenanalyse durch. WH und AJ haben das Manuskript verfasst. FL, YL, ZJ und ZX generierten die Daten und bauten die Datenbank auf. WH und SM führten die Experimente durch. YW hat das Manuskript mit Beiträgen aller Autoren fertiggestellt. Alle Autoren haben das endgültige Manuskript gelesen und genehmigt.

Korrespondenz mit Qingyou Xia oder Yi Wang.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Nature Communications dankt Nadia Ayoub, Shuqiang Li und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Peer-Reviewer-Berichte sind verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Hu, W., Jia, A., Ma, S. et al. Ein molekularer Atlas enthüllt den dreiteiligen Spinnmechanismus der Spinnen-Schleppleinenseide. Nat Commun 14, 837 (2023). https://doi.org/10.1038/s41467-023-36545-6

Zitat herunterladen

Eingegangen: 19. Juli 2022

Angenommen: 07. Februar 2023

Veröffentlicht: 15. Februar 2023

DOI: https://doi.org/10.1038/s41467-023-36545-6

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.